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SEQ ID NO. 1301: SA60466 FROM THE 2603V/R GBS STRAIN 

CTCCTGCCCCTGCAATGGCAGTTAGACCCATAGGTTTATTTTTATATTTTAATGCCTGCATAAGATGAAGGATATTAATAATTCCT 

GAGCAGGCATAAGGGTGTCCGTAAGCTAATGTCCCTCCAAAAATATTGAATTTTTCTCTCTCTTCAGGATAATAATGATTAAATAG 

AGCATCAATCGCTGCAAATGGTTCATTCCATTCAATTGCATCATAATCCGATATTTTAGTATGAGTTTCTGTTAATAGTTTTTCCG 

TAGCCGTGTGAACCAATTCTGGACTAAGCTTGGGATCTCCTGCTACTTCTACAATGTGAACAATCCGGAATTCTGTTTTCTGACTC 

TGAAGCGTTAGAAATGCAGCAGCATCGTGCATTA^CAAACATTTCCAATAGTGAGC^UVAGGTGAATTTTCCATCAAT 

TTTTTGAAAAAATGTTtCTTTTaGTTTTCTAACGCCTTGATCTCGCATCCCTTCCATTGGTAAGATTACyTCTTCTAAATAGCCAC 

CTTGTTTAGCTGTTAAGGCGCGTTTATGGCTCAAGAATGCCAATTTATCTAACATTTCTCTTCTAAAaCCATATTTTTGACAGACT 

CTCTGGGCCCCTTCTAACATTACAGTTTCAGCATAAGAGTCAGGAGAAAACTGAGCAACTGTATATTCTCCGTTACGATTATCTTC 

TTTAGCATAACGTCTCATAGGTTGAAGAGAACTACTTTCAATCCCCCCAACAAGAACTTTTTCATTAATACCGGTACTGATTTTTA 

GATAACCAAAAAACAAGGCAGAACTTGATGAAGCACACTGCATATCAATCGTTTGTACTGGAATATAGGATTCATAATCAGAAAAA 

AGAGTCATCAAACGACCAATATTGCCCCCAGTACCAACTGTGTTCCCACAAATAATACTATCAATGTTAGATTCTGATTCTATTTT 

TTTTATTTGATTTAAAAGGTGTGCTCCTAAAAGTTCTGGACGGTAAGTTTAAATTGCTT 

SEQ ID NO. 1302: SAG0466 FROM THE M732 GBS TYPE III STRAIN 

TCGGTATAAAAGGGAAGCAATTTAAACATTACCGTCCAGAACTTTTAGGAGCACACCTCTTAAATCAAATAAAAAAAATAGAATCA 
GAATCTAATATTGATAGTATTATTTGTGGGAACACAGTTGGTACTGGGGGCAATATTGGTCGTTTGATGACTCTTTTTTCTGATTA 
TGAATCCTATATTCCAGTACAAACGATTGATATGCAGTGTGCTTCATCAAGTTCTGCCTTGTTTTTTGGTTATCTAAAAATCAGTG 
CCGGTATTAATGAAAAAGTTCTTGTTGGGGGGATTGAAAGTAGTTCTCTTCAACCTATGAGACGTTACGCTAAAGAAGATAATCGT 
AACGGAGAATATACCGTTGCTCAGTTTTCTCCTGACTCTTATGCTGAAACTGTAATGTTAGAAGGGGCACAAAGAGTCTGTCAAAA 
ATATGGTTTTAGAAGAGAAATGTTAGATAAATTGGCATTCTTGAGCCATAAACGCGCCTTAACAGCTAAACAAGGTGGCTATTTAG 
AAGAGGTAATCTTACCAATGGAAGGGATGCGAGATCAAGGCGTTAGAAAACTAAAAGAAGCATTTTTTCAAAAATTACCAAGATTG 
ATGGAAAATTCACCTTTGCTCACTATTGGAAATGTTTGTTTAATGCACGATGCTGCTGCATTTCTAACGCTTCAGAGTCAGAAAAC 
AGAATTCCGGATTGTTCACATTGTAGAAGTAGCAGGAGATCCCAAGCTTAGTCCAGAATTGGTTCACACGGCTACGGAAAAACTAT 
TAACAGAAACTCATACTAAAATATCGGATTATGATGCAATTGAATGGAATGAACCATTTGCAGCGATTGATGCTTTATTTAATCAT 
TATTATCCTGAAGAGAGAGAAAAATTCAATATTTTTGGAGGGGCATTAGCTTACGGACACCCTTATGCCTGCTCAGGAATTA 

SEQ ID NO. 1303: SAG0466 FROM THE 090 GBS TYPE la STRAIN 

TTGTGGGAACACAGTTGGTACTGGGGGCAATATTGGTCGTTTGATGACTCTTTTTTCTGATTATGAATCCTATATTCCAGTACAAA 
CGATTGATATGCAGTGTGCTTCATCAAGTTCTGCCTTGTTTTTTGGTTATCTAAAAATCAGTGCCGGTATTAATGAAAAAGTTCTT 
GTTGGGGGGATTGAAAGTAGTTCTCTTCAACCTATGAGACGTTACGCTAAAGAAGATAATCGTAACGGAGAATATACCGTTGCTCA 
GTTTTCTCCTGACTCTTAkGCTGAAACTGTAATGtTAGAAGGGGCACAAAGAGTCTGTCAAAAATATGGTTTtAGAAGAGAAATGT 
TAGATAAATTGGCATTCTTGAGCCATAAACGCGCCTTAACAGCTAAACAAGGTGGCTATTTAGAAGAGGTAATCTTACCAATGGAA 
GGGATGCGAGATCAAGGCGTTAGAAAACTAAAAGAAGCATTTTTTCAAAAATTACCAAGATTGATGGrAAATTCACCTTTGCTCAC 
TATTGGAAATGTTTGTTTAATGCACGATGCTGCTGCATTTCTwACGCTTCAGAGTCAGAAAACAGAATTCCGGATTGTTCACATTG 
TAGAAGTAGCAGGAGATCCCAAGCTTAGTCCAGAATTGGTTCACACGGCTACGGAAAAACTATTAACAGAAACTCATACTAAAATA 
TCGGATTATGATGCAATTGAATGGAATGAACCATTTGCAGCGATTGATGCTTTATTTAATCATTATTATCCTGAAGAGAGAGAAAA 
ATTCAATATTTTTGGAGGGGCATTAGCTTACGGACACCCTTATGCCTGCTCAGG 

SEQ ID NO. 1304: SAG0466 FROM THE COHl GBS TYPE la STRAIN 

ATCGGTATAAAAGGGAAGCAATTTAAAATTACCGTCCAGAACTTTTAGGAGCACACCTCTTAAATCAAATAAAAAAAATAGAATCA 
GAATCTAATATTGATAGTATTATTTGTGGGAACACAGTTGGTACTGGGGGCAATATTGGTCGTTTGATGACTCTTTTTTCTGATTA 
TGAATCCTATATTCCAGTACAAACGATTGATATGCAGTGTGCTTCATCAAGTTCTGCCTTGTTTTTTGGGTATCTAAAAA 

SEQ ID NO. 1305 : SAG0466 FROM THE COB GBS NONTYPEABLE STRAIN (REVERSE COMPLEMENT) 

TTTTCAAAAATTACCAAGATTGATGGAAAATTCACCTTTGCTCACTATTGGAAATGTTTGTTTAATGCACGATGCTGCTGCATTTC 
TAACGCTTCAGAGTCAGAAAACAGAATTCCGGATTGTTCACATTGTAGAAGTAGCAGGAQATCCCAAGCTTAGTCCAGAATTGGTT 
CACACGGCTACGGAAAAACTATTAACAGAAACTCATACTAAAATATCGGATTATGATGC^TTGAATGGAATGAACCATTTGCAGC 
GATTGATGCTTTATTTAATCATTATTATCCTGAAGAGAGAGAAAAATTCAATATTTTTGGAGGGGCATTAGCTTACGGACACCCTT 
AATGCCTGCTCAGGAATTATTAATATCC 

SEQ ID NO. 1306: sag0466 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

GGTATAAAAGGGAAGCAATTTAAACATTACCGTCCAGAACTTTTAGGAGCACACCTCTTAAATCAAATAAAAAAAATAT71A.CCAGA 
ATCTAACATTGATAGTATTATTTGTGGGAACACAGTTGGTACTGGGGGCAATATTGGTCGTTTGATGACTCTTTTTTCTGATTATG 
AATCCTATATTC 

SEQ ID NO. 1307: SAG0466 FROM THE 1169NT1 GBS TYPE V STRAIN REVERSE COMPLEMENT 

CAAGATTGATGGAAAATTCACCTTTGCTCACTATTGGAAATGTTTGTTTAATGCACGATGCTGCTGCATTTCTAACGCTTCAGAGT 
CAGAAAACAGAATTCCGGATTGTTCACATTGTAGAAGTAGCAGGAGATCCCAAGCTTAGTCCAGAATTGGTTCACACGGCTACGGA 
AAAACTATTAACAGAAACTCATACTAAAATATCGGATTATGATGCAATTGAATGGAATGAACCATTTGCAGCGATTGATGCTTTAT 
TTAATCATTATTATCCTGAAGAGAGAGAAAAATTCAATATTTTTGGAGGGGCATTAGCTTACGGACACCCTTATGCCTGCTCAGGA 
ATTATTAATATCCTTCATCTTATGCAGGCATTAAAATATAAAAATAAACCTATGGGCCTAACTGCCATTGCAGGGGCA 

SEQ ID NO. 1308: SAG0466 FROM THE 18RS21 GBS TYPE II STRAIN 
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CCTTAACAGTTAAACAAGGTGGCTATTTAGAAGAGGTAATCTTACCAATGGAAGGGATGCGAGATCAAGGCGTTAGAAAACTAAAA 
GAAACATTTTTTCAAAAATTACCAAGATTGATGGAAAATTCACCTTTGCTCACTATTGGAAATGTTTGTTTAATGCACGATGCTGC 
TGCATTTCTAACGCTTCAGAGTCAGAAAACAGAATTCCGGATTGTTCACATTGTAGAAGTAGCAGGAGATCCCAAGCTTAGTCCAG 
AATTGGTTCACACGGCTACGGAAAAACTATTAACAGAAACTCATACTAAAATATCGGATTATGATGCAATTGAATGGAATGAACCA 
TTTGCAGCGATTGATGCTCTATTTAATCATTATTATCCTGAAGAGAGAGAAAAATTCAATATTTTTGGAGGGACATTAGCTTACGG 
ACACCCTTATGCCTGCTCAGGAATTATTAATATCCTTCATCTTATGCAGGCATTAAAATATAAAAATAAACCTATGGGTCTAACTG 
CCATTGCAGGGGCAG 

SEQ ZD NO. 1309: SAG0466 FROM THE 18RS21 GBS TYPE II STRAIN 

TCGGTATAAAAGGGAAGCAATTTAAACATTACCGTCCAGAACTTTTAGGAGCACACCTTTTAAATCAAATAAAAAAAATAGAATCA 

GAATCTAACATTGATAGTATTATTTGTGGGAACACAGTTGGTACTGGGGGCAATATTGGTCGTTTGATGACTCTTTTTTCTGATTA 

TGAATCCTATATTCCAGTACAAACGATTGATATGCAGTGTGCTTCATCAAGTTCTGCCTTGTTTTTTGGTTATCTAAAAATCAGTA 

CCGGTATTAATGAAAAAGTTCTTGTTGGGGGGATTGAAAGTAGTTCTCTTCAACCTATGAGACGTTATGCTAAAGAAGATAATCGT ' 

AACGGAGAATATACAGTTGCTCAGTTTTCTCCTGACTCTTATGCTGAAACTGTAATGTTAGAAGGGGCCCAGAGAGTCTGTCAAAA 

ATATGGTTTTAGAAGAGAAATGTTAGATAAATTGGCATTCTTGAGCCATAAACGCGCCTTAACAGCTAAACA 

SEQ ID NO. 1310: SAG0466 FROM THE H36b GBS TYPE lb STRAIN 

TTTGGGCTACGAACACCTATCGGTATAAAAGGGAAGCAATTTAAACATTACCGTCCAGAACTTTTAGGAGCACACCTTTTAAATCA 
AATAAAAAAAATAGAATCAGAATCTAACATTGATAGTATTATTTGTGGGAACACAGTTGGTACTGGGGGCAATATTGGTCGTTTGA 
TGACTCTTTTTTCTGATTATGAATCCTATATTCCAGTACAAACGATTGATATGCAGTGTGCTTCATCAAGTTCTGCCTTGTTTTTT 
GGTTATCTAAAAATCAGTACCGGTATTAATGAAAAAGTTCTTGTTGGGGGGATTGAAAGTAGTTCTCTTCAACCTATGAGACGTTA 
TGCTAAAGAAGATAATCGTAACGGAGAATATACAGTTGCTCAGTTTTCTCCTGACTCTTATGCTGAAACTGTAATGTTAGAAGGGG 
CCC 

SEQ ID NO. 1311: SAG0466 FROM THE H36b GBS TYPE lb STRAIN (REVERSE COMPLEMENT) 

GAAAATTCACCTTTGCTCACTATTGGAAATGTTTGTTTAATGCACGATGCTGCTGCATTTCTAACGCTTCAGAGTCAGAAAACAGA 
ATTCCGGATTGTTCACATTGTAGAAGTAGCAGGAGATCCCAAGCTTAGTCCAGAATTGGTTCACACGGCTACGGAAAAACTATTAA 
CAGAAACTCATACTAAAATATCGGATTATGATGCAATTGAATGGAATGAACCATTTGCAGCGATTGATGCTCTATTTAATCATTAT 
TATCCTGAAGAGAGAGAAAAATTCAATATTTTTGGAGGGACATTAGCTTACGGACACCCTTATGCCTGCTCAGGAATTATTAATAT 
CCTTCATCTTATGCAGGCATTAAAATATAAAAATAAACCTATGGGTCTAACTGCCATTGCAGGGGCAGGA 

SEQ ID NO. 1312: SAG0466 FROM THE M781 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

CCTTTGCTCACTATTGGAAATGTTTGTTTAATGCACGATGCTGCTGCATTTCTAACGCTTCAGAGTCAGAAAACAGAATTCCGGAT 
TGTTCACATTGTAGAAGTAGCAGGAGATCCCAAGCTTAGTCCAGAATTGGTTCACACGGCTACGGAAAAACTATTAACAGAAACTC 
ATACTAAAATATCGGATTATGATGCAATTGAATGGAATGAACCATTTGCAGCGATTGATGCTTTATTTAATCATTATTATCCTGAA 
GAGAGAGAAAAATTCAATATTTTTGGAGGGGCATTAGCTTACGGACACCCTTATGCCTGCTCAGGAATTATTAATATCCTTCATCT 
TATGCAGGCATTAAAATATAAAAATAAACCTATGGGTTCTAACTGC 

SEQ ID NO. 1313: SAG0466 FROM THE M781 GBS TYPE III STRAIN 

GCAATTTAAACATTACCGTCCAGAACTTTTAGGAGCACACCTCTTAAATCAAATAAAAAAAATAGAATCAGAATCTAATATTGATA 
GTATTATTTGTGGGAACACAGTTGGTACTGGGGGCAATATTGGTCGTTTGATGACTCTTTTTTCTGATTATGAATCCTATATTCCA 
GTACAAACGATTGATATGCAGTGTGCTTCATCAAGTTCTGCCTTGTTTTTTGGTTATCTAAAAATCAGTGCCGGTATTAATGAAAA 
AGTTCTTGTTGGGGGGATTGAAAGTAGTTCTCTTCAACCTATGAGACGTTACGCTAAAGAAGATAATCGTAACGGAGAATATACCG 
TTGCTCAGTTTTCTCCTGACTCTTATGCTGAAACTGTAATGTTAGA 

SEQ ID NO 1314: SAG0466 FROM THE A909 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

CCTTTGCTCACTATTGGAAATGTTTGTTTAATGCACGATGCTGCTGCATTTCTAACGCTTCAGAGTCAGAAAACAGAATTCCGGAT 

TGTTCACATTGTAGAAGTAGCAGGAGATCCCAAGCTTAGTCCAGAATTGGTTCACACiSGCTACGGAAAAACTATTAACAGAAACT 

ATACTAAAATATCGGATTATGATGCAATTGAATGGAATGAACCATTTGCAGCGATTGATGCTCTATTTAATCATTATTATCCTGAA 

GAGAGAGAAAAATTCAATATTTTTGGAGGGACATTAGCTTACGGACACCCTTATGCCTGCTCAGGAATTATTAATATCCTTCATCT 

TATGCAGGCATTAAAATATAAAAATAAACCTATGGGTCTAACTGCCATTGCAGGGGC 

SEQ ID NO. 1315: SAG0466 FROM THE JM9130013 GBS TYPE VIII STRAIN REVERSE COMPLEMENT 

GCTCACTATTGGAAATGTTTGTTTAATGCACGATGCTGCTGCATTTCTAACGCTTCAGAGTCAGAAAACAGAATTCCGGATTGTTC 
ACATTGTAGAAGTAGCAGGAGATCCC^AGCTTAGTCCAGAATTGGTTCACACGGCTACGGAAAAACTATTAACAGAAACTCATACT 
AAAATATCGGATTATGATGCAATTGAATGGAATGAACCATTTGCAGCGATTGATGCTCTATTTAATCATTATTATCCTGAAGAGAG 
AGAAAAATTCAATATTTTTGGAGGGGCATTAGCTTACGGACACCCTTATGCCTGCTCAGGAATTATTAATATCCTTCATCTTATGC 
AGGCATTAAAATATAAAAATAAACCTATGGGTCTAACTGCCATTGCAGGGGCAGGA 

SEQ ID NO. 1316: SAG0466 FROM THE JM9130013 GBS TYPE VIII STRAIN 

TTTGGGCTACGAACACCTATCGGTATAAAAGGGAAGCAATTTAAACATTACCGTCCAGAACTTTTAGGAGCACACCTTTTAAATCA 
AATAAAAAAAATAGAATCAGAATCTAACATTGATAGTATTATTTGTGGGAACACAGTTGGTACTGGGGGCAATATTGGTCGTTTGA 
TGACTCTTTTTTCTGATTATGAATCCTATATTCCAGTACAAACGATTGATATGCAGTGTGCTTCATCAAGTTCTGCCTTGTTTTTT 
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GGTTATCTAAAAATCAGTACCGGTATTAATGAAAAAGTTCTTGTTGGGGGGATTGAAAGTAGTTCTCTTCAACCTATGAGACGTTA 
TGCTAAAGAAGATAATCGTAACGGAGAATATA 

SEQ ±D NO. 1401: SAG0471 FROM THE 18RS21 GBS TYPE II STRAIN 

TTAAATTTGGTATCTTGACGCTTGAGGGAGAAGTACAAGAAAAATGGGCAATTGAGACCAATACTTTAGAAAACGGAAGACATATC 
GTTTCTGATATCGTTGAATCTCTCAAACATCGTTTGAGCCTCTATGGATTAACAAAAGATGACTTTCTCGGTATCGGTATGGGTTC 
TCCAGGAGCTGTTGATAGAACTAGTAAAACAGTAACAGGTGCTTTTAATCTAAATTGGGCTGATACTCAAGAAGTAGGTTCAGTTA 
TTGAAAAAGAAGTTGGAATTCCATTTTTTATTGATAACGATGCTAATGTTGCAGCACTTGGTGAACGCTGGGTAGGTGCTGGTGCC 
AATAATCCCGACGTTGTTTTCGTAACCCTCGGAACAGGAGTAGGTGGAGGTGTTATCGCAGATGGTAACCTCATCCATGGTGTTGC 
AGGAGCAGGTGGAGAAATTGGGCATATGATTGTTGATCCAGAAAATGGATTTACGTGCACATGTGGTAACAAAGGCTGCCTTGAGA 
CAGTTGCATCAGCGACAGGTGTTGTTAGAGTAGCACGTCAACTCGCAGAACAATATGAGGGTTCGTCTGCCATTAAAGCAGCGATT 
GACACCGGTGATACTGTTACT^AGTAAAGATATTTTTATAGCAGCAGAAGATGGGGATAAATTTGCTAATTCTGTTGTTGAACGTGT 
ATCACGTTACCTTGGACTGGCAGCAGCTAATATTTCAAATATTTTAAACCCTGATTCTGTGGTTATTGGTGGCGGTGTCTCAGCAG 
CAGGTGAATTTTTACGTAGTCGCGTTGAGAAATACTTTGTCACATTTGCTTTCCCACAAGTTAAAAAGTCAACTAAAATTAAGAT 

SEQ ID NO. 1402: SAG0471 FROM THE 090 GBS TYPE la STRAIN 

CGTTTCTGATATCGTTGAATCTCTCAAACATCGTTTGAGCCTCTATGGATTAACAAAAGATGACTTTCTCGGTATCGGTATGGGTT 
CTCCAGGAGCTGTTGATAGAACTAGTAAAACAGTAACAGGTGCTTTTAATCTAAATTGGGCTGATACTCAAGAAGTAGGTTCGGTT 
ATTGT^AAAAGAAGTTGGAATTCCATTTTTTATTGATAACGATGCTAATGTTGCAGCACTTGGTGAACGCTGGGTAGGTGCTGGTGC 
CAATAATCCCGATGTTGTTTTCGTAACCCTCGGAACAGGAGTAGGTGGAGGTGTTATCGCAGATGGTAACCTCATCCATGGTGTTG 
CAGGAGCAGGTGGAGAAATTGGGCATATGATTGTTGATCCAGAKAATGGATTTACGTGCACATGTGGTAACAAAGGCTGTCTTGAG 
ACAGTTGCATCAGCGACAGGTGTTGTTAGAGTAGCACGTCAACTCGCAGAACAATATGAAGGTTCGTCTGCCATTAAAGCAGCGAT 
TGACAACGGTGATACTGTTACAAGTAAAGATATTTTTATAGCAGCAGAAGATGGGGATAAATTTGCTAATTCTGTTGTTGAACGTG 
TATCACGTTACCTTGGACTGGCAGCAGCTAATATTTCAAATATTTTAAACCCTGATTCTGTGGTTATTGGTGGCGGTGTCTCAGCA 
GCAGGTGAATTTTTACGTAGTCGCGTTGAGAAATACTTTGTCACATTTG 

SEQ ID NO. 1403: SAG0471 FROM THE COH1 GBS TYPE la STRAIN 

ACAAGAAAAATGGGCAATTGAGACCAATACTTTAGAAAACGGAAGACATATCGTTTCTGATATCGTTGAATCTCTCAAACATCGTT 
TGAGCCTCTATGGATTAACAAAAGATGACTTTCTCGGTATCGGTATGGGTTCTCCAGGAGCTGTTGATAGAACTAGTAAAACAGTA 
ACAGGTGCTTTTAATCTAAATTGGGCTGATACTCAAGA 

SEQ ID NO. 1404: SAG0471 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

TTGGTATCTTGACGCTTGAGGAGAAGTACAAGAAAT^ATGGGCAATTGAGACCAATACTTTAGAAAACGGAAGACATATCGTTTCTG 
ATATCGTTGAATCTCTCAAACATCGTTTGAGCCTCTATGGATTAACAAAAGATGACTTTCTCGGTATCGGTATGGGGTCTCCAGGA 
GCTGTTGATAGAACTAGTAAAAC 

SEQ ID NO. 1405: SAG0471 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

CACCAGCTAATATTTCAAATATTTTAAACCCTGATTCTGTGGTTATTGGTGGCGGTGTCTCAGCAGCAGGTGAATTTTTACGTAGT 
CGCGTTGAGAAATACTTTGTCACATTTGCTTTCCCACAAGTTAAAAAGTCAACTA 

SEQ ID NO. 1406: SAG0471 FROM THE 2603V/R GBS TYPE V STRAIN 

GGGCAATTGAGACCAATACTTTAGAAAACGGAAGACATATCGTTTCTGATATCGTTGAATCTCTCAAACATCGTTTGAGCCTCTAT 
GGATTAACAAAAGATGACTTTCTCGGTATCGGTATGGGTTCTCCAGGAGCTG 

SEQ ID NO. 1407: SAG0471 FROM THE H36b GBS TYPE lb STRAIN 

GGCAATTGAGACCAATACTTTAGAAAACGGAAGACATATCGTTTCTGATATCGTTGAATCTCTCAAACATCGTTTGAGCCTCTATG 
GATTAACAAT^AGATGACTTTCTCGGTATCGGTATGGGTTCTCCAGGAGCTGTTGATAGAACTAGTAAAACAGTAAC^VGGTGCTTTT 
AATCTAAATTGGGCTGATACTCAAGAAGTAGGTTC^GTTATTGAAAAAGAAGTTGGAATTCCATTTTTTATTGATAACGATGCTAA 
TGTTGCAGCACTTGGTGAACGCTGGGTAGGTGCTGGTGCCAATAATCCCGACGTTGTTTTCGTAACC 

SEQ ID NO. 1408: SAG0471 FROM THE H36 GBS TYPE lb STRAIN (REVERSE COMPLEMENT) 

GAGACAGTTGCATCAGCGACAGGTGTTGTTAGAGTAGCACGTCAACTCGCAGAACAATATGAGGGTTCGTCTGCCATTAAAGCAGC 
GATTGACAACGGTGATACTGTTACAAGTAAAGATATTTTTATAGCAGCAGAAGATGGGGATAAATTTGCTAATTCTGTTGTTGAAC 
GTGTATCACGTTACCTTGGACTGGCAGCAGCTAATATTTCAAATATTTTAAACCCTGATTCTGTGGTTATTGGTGGCGGTGTCTCA 
GCAGCAGGTGAATTTTTACGTAGTCGCGTTGAGT^AATACTTTGTCACATTTGCTTTCCCACA 

SEQ ID NO. 1409: SAG0471 FROM THE M732 GBS TYPE III STRAIN 

ACAAGAAAAATGGGCAATTGAGACCATACTTAGAAAACGGAAGACATATCGTTTCTGATATCGTTGAATCTCTCAAACATCGTTTG 
AGCCTCTATGGATTAACAAAAGATGACTTTCTCGGTATCGGTATGGGTTCTCCAGGAGCTGTTGATAGAACTAGTAAAACAGTAAC 
AGGTGCTTTTAATCTAAATTGGGCTGATACTCAAGAAGTAGGTTCGGTTATTGAAAAAGAAGTTGGAATTCCATTTTTTATTGATA 
ACGATGCTAATGTTGCAGCACTTGGTGAACGCTGGGTAGGTGCTGGTGCCAATAATCCCGATGTTGTTTTCGTAACCCTCGGAACA 
GGAGTAGGTGGAGGTGTTATCGCAGATGGTAACCTCATCCATGGTGTTGCAAGAGCAGGTGGAGAAATTGGGCATATGATT 

SEQ ID NO. 1410: SAG0471 FROM THE M732 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 
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CAGCAGCAGGTGAATTTTTACGTAGTCGCGTTGAGAAATACTTTGTCACATTTGCTTTCCCACAAGTTAAAAAGTCAACTAAAATT 
AAGATTGCTGAACTAGGTAATGAT 

SEQ ID NO. 1411: SAG0471 FROM THE M781 GBS TYPE XII STRAIN 

AGAAGTACAAGAAAATGGGC^ATTGAGACCATACTTAGAAAACGGAAGACATATCGTTTCTGATATCGTTGAATCTCTCAAACATC 
GTTTGAGCCTCTATGGATTAACAAAAGATGACTTTCTCGGTATCGGTATGGGTTCTCCAGGAGCTGTTGATAGAACTAGTAAAACA 
GTAACAGGTGCTTTTAATCTAAATTGGGCTGATACTCAAGAAGTAGGTTCGGTTATTGAAAAAGAAGTTGGAATTCCATTTTTTAT 
TGATAACGATGCTAATGTTGCAGCACTTGGTGAACGCTGGGTAGGTGCTGGTGCCAATAATCCCGATGTTGTTTTCGTAACCCTCG 

GAACAGGAGTA 

SEQ ID NO. 1412: SAG0471 FROM THE M781 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

GATACTGTTACAAGTAAAGATATTTTTATAGCAGCAGAAGATGGGGATAAATTTGCTAATTCTGTTGTTGAACGTGTATCACGTTA 
CCTTGGACTGGCAGCAGCTAATATTTCAAATATTTTAAACCCTGATTCTGTGGTTATTGGTGGCGGTGTCTCAGCAGCAGGTGAAT 
TTTTACGTAGTCGCGTTGAGAAATACTTTGTCACATTTGCTTTCCCACAAGTTAAAAA 

SEQ ID NO. 1413: SAG0471 FROM THE 090 GBS TYPE la STRAIN 

AAATTTGGTATCTTGACGCTTGAGGGAGAAGTACAAGAAAAATGGGCATTGAGACCATACTTAGAAAACGGAAGACATATCGTTTC 
TGATATCGTTGAATCTCTCAAACATCGTTTGAGCCTCTATGGATTAACAAAAGATGACTTTCTCGGTATCGGTATGGGTTCTCCAG 
GAGCTGTTGATAGAACTAGTAAAACAGTAACAGGTGCTTTTAATCTAAATTGGGCTGATACTCAAGAAGTAGGTTCAGTTATTGAA 
AAAGAAGTTGGAATTCCATTTTTTATTGATAACGATGCTAATGTTGCAGCACTTGGTGAACGCTGGGTAGGTGCTGGTGCCAATAA 
TCCCGACGTTGTTTTCGTAACCCTCGGAACAGGAGTAGGTGGAGG 

SEQ ID NO. 1414: SAG0471 FROM THE 090 GBS TYPE la STRAIN (REVERSE COMPLEMENT ) 

GTGATACTGTTACAAGTAAAGATATTTTTATAGCAGCAGAAGATGGGGATAAATTTGCTAATTCTGTTGTTGAACGTGTATCACGT 
TACCTTGGACTGGCAGCAGCTAATATTTCAAATATTTTAAACCCTGATTCTGTGGTTATTGGTGGCGGTGTCTCAGCAGCAGGTGA 
ATTTTTACGTAGTCGCGTTGAGAAATACTTTATCACATTTGCTTTCCCACAAGTTAAAAAGTCAACTAAAATTAAGATTG 

SEQ ID NO. 1415: SAG0471 FROM THE JM9130013 GBS TYPE VIII STRAIN (REVERSE COMPLEMENT) 

GTTATCGCAGATGGTAACCTCATCCATGGTGTTGCAGGAGCAGGTGGAGAAATTGGGCATATGATTGTTGATCCAGAAAATGGATT 
TACGTGCACATGTGGTAACAAAGGCTGCCTTGAGACAGTTGCATCAGCGACAGGTGTTGTTAGAGTAGCACGTCAACTCGCAGAAC 
AATATGAGGGTTCGTCTGCCATTAAA&CAGCGATTGACCACGGTGATACTGTTACAAGTAAAGATATTTTTATAGCAGCAGAAGAT 
GGGGATAAATTTGCTAATTCTGTTGTTGAACGTGTATCACGTTACCTTGGACTGGCAGCAGCTAATATTTCAAATATTTTAAACCC 
TGATTCTGTGGTTATTGGTGGCGGTGTCTCAGCAGCAGGTGAATTTTTACGTAGTCGCGTTGAGAAATACTTTGTCACATTTGCTT 

TCCCACAAGTTAAAAAGTCAACTAA 

SEQ ID NO. 1416: SAG0471 FROM THE OM9130013 GBS TYPE VIII STRAIN (REVERSE COMPLEMENT) 

TGGTATCTTGACGCTTGAGGGAGAAGTACAAGAAAAATGGGCAATTGAGACCATACTTAGAAAACGGAAGACATATCGTTTCTGAT 
ATCGTTGAATCTCTCAAACATCGTTTGAGCCTCTATGGATTAACAAAAGATGACTTTCTCGGTATCGGTATGGGTTCTCCAGGAGC 
TGTTGATAGAACTAGTAAAACAGTCACAGGTGCTTTTAATCTAAATTGGGCTGATACTCAAGAAGTAGGTTCAGTTATTGAAAAAG 

AAGCTGGAATTCCATTTTTTATTG 

SEQ ID NO. 1417: SAG0471 FROM THE 2603V/R TYPE V GBS STRAIN (REVERSE COMPLEMENT) 

AGCAGCTAATATTTCAAATATTTTAAACCCTGATTCTGTGGTTATTGGTGGCGGTGTCTCAGCAGCAGGTGAATTTTTACGTAGTC 

GCGTTGAGAAATACTTTGTCACATTTGTTTTCCCACAAGGT 

SEQ ID NO. 1501: SAG0492 FROM THE 1169NT1 GBS NONTYPEABLE STRAIN 

TGACTTGGATATTCATCAAGGAGAAGTGGTGGTTATTATTGGCCCTTCTGGCTCTGGTAAGTCAACATTTTTAAGAACAATGAATC 
TCTTGGAAGTACCAACAAAGGGAACAGTGACTTTTGAAGGAATTGATATAACAGACAAAAAAAATGATATTTTTAAAATGCGCGAA 
AAAATGGGCATGGTTTTTCAACAGTTCAATCTATTTCCCAATATGACTGTACTAGAAAATATTACTTTATCACCTATTAAGACAAA 
GGGACTTTCTAAGCTTGATGCTCAGACAAAAGCATACGAGCTACTTGAAAAAGTTGGACTCAAAGAGAAGGCTAATGCTTATCCAG 
CTAGCTTATCTGGAGGACAACAACAACGGATTGCTATTGCAAGAGGTCTTGCAATGAATCCTGATGTCCTTCTTTTTGATGAACCT 
ACTTCAGCTCTTGATCCTGAAATGGTAGGTGAAGTCTTGACTGTTATGCAAGATTTAGCTAAATCTGGTATGACGATGGTTATTGT 
CACTCATGAAATGGGTTTTGCACGTGAAGTAGCGGATCGTGTCATTTTTATGGATGCAGGCATTATTGTGAGCAAGGGACCCCTAA 

GGAAGTAT 

SEQ ID NO. 1502: SAG0492 FROM THE 18RS21 GBS TYPE II STRAIN 

TTGGGAAAAATGAGGTTTTAAAAGGCATTGACTTGGATATTCATCAAGGAGAAGTAGTGGTTATTATTGGCCCTTCTGGCTCTGGT 
AAGTCAACATTTTTAAGAACAATGAATCTCTTGGAAGTACCAACAAAGGGAACAGTGACTTTTGAAGGGATTGATATAACAGACAA 
AAAGAATGATATTTTTAAAATGCGCGAAAAAATGGGCATGGTTTTTCAACAGTTCAATCTATTTCCCAATATGACTGTACTAGAAA 
ATATTACTTTATCACCTATTAAGACAAAGGGGCTTTCTAATCTTGATGCTCAGACAAAAGCATATGAGCTACTTGAAAAAGTTGGA 
CTCAAAGAGAAGGCTAATACTTATCCAGCTAGCTTATCTGGAGGACAACAACAACGAATTGCTATTGCAAGAGGTCTTGCAATGAA 
TCCTCATGTCCTTCTTTTTGATGAACCTACTTCAGCTCTTGATCCTGAAATGGTAGGTGAAGTCTTGACTGTTATGCAAGATTTAG 
CTAAATCTGGTATGACGATGGTTATTGTCACTCATGAAATGGGTTTTGCACGTGAAGTAGCGGATCGTGTCATTTTTATGGACGCA 
GAAATTAT 
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SEQ ID HO. 1503: SA60492 FROM THE 2603V/R 6BS TYPE V STRAIN (REVERSE COMPLEMENT) 

AAAAATGAGGTTTTAAAAGGCATTGACTTGGATATTCATCAAGGAGAAGTAGTGGTTATTATTGGCCCTTCTGGCTCTGGTAAGTC 
AACATTTTTAAGAACAATGAATCTCTTGGAAGTACCAACAAAGGGAACAGTGACTTTTGAAGGGATTGATATAACAGACAAAAAGA 
ATGATATTTTTAAAATGCGCGAAAAAATGGGCATGGTTTTTCAACAGTTCAATCTATTTCCCAATATGACTGTACTAGAAAATATT 
ACTTTATCACCTATTAAGACAAAGGGGCTTTCTAATCTTGATGCTCAGAC^AAAGCATATGAGCTACTTGAAAAAGTTGGACTCAA 
AGAGAAGGCTAATACTTATCCAGCTAGCTTATCTGGAGGACAACAACAACGAATTGCTATTGCAAGAGGTCTTGCAATGAATCCTG 
ATGTCCTTCTTTTTGATGAACCTACTTCAGCTCTTGATCCTGAAATGGTAGGTGAAGTCTTGACTGTTATGCAAGATTTAGCTAAA 
TCTGGTATGACGATGGTTATTGTCACTCATGAAATGGGTTTTGCACGTGAAGTAGCGGATCGTGTCATTTTTATGGATGCAGGAAT 
TATTGTTGAGCAAGGGGCCC 

SEQ ID NO. 1504: SA60492 FROM THE M781 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

GAGGTTTTAAAAGGCATTGACTTGGATATTCATCAAGGAGAAGTGGTGGTTATTATTGGCCCTTCTGGCTCTGGTAAGTCAACATT 
TTTAAGAACAATGAATCTCTTGGAAGTACCAACAAAGGGAACAGTGACTTTTGAAGGGATTGATATAACAGACAAAAAGAATGATA 
TTTTTAAAATGCGCGAAAAAATGGGCATGGTTTTTCAACAGTTCAATCTATTTCCCAATATGACTGTACTAGAAAATATTACTTTA 
TCACCTATTAAGACAAAGGGACTTTCTAAGCTTGATGCTCAGACAAAAGCATACGAGCTACTTGAAAAAGTTGGACTCAAAGAGAA 
GGCTAATGCTTATCCAGCAAGCTTATCTGGAGGACAACAACAACGGATTGCTATTGCAAGAGGTCTTGCAATGAATCCTGATGTCC 
TTCTTTTTGATGAACCTACTTCAGCTCTTGATCCTGAAATGGTAGGTGAAGTCTTGACTGTTATGCAAGATTTAGCTAAATCTGGT 
ATGACGATGGTTATTGTCACTCATGAAATGGGTTTTGCACGTGAAGTAGCGGATCGTGTCATTTTTATGGATGCAGGGATTATTGT 
TGAGCAAGGGACCCCTAAGAAAGTAT 

SEQ ID NO. 1505: SAG0492 FROM THE 090 GBS TYPE la STRAIN 

TGGTGGTTATTATTGGCCCTTCTGGCTCTGGTAAGTCAACATTTTTAAGAACAATGAATCTCTTGGAAGTACCAACAAAGGGAACA 
GTGACTTTTGAAGGGATTGATATAACAGACAAAAAGAATGATATTTTTAAAATGCGCGAAAAAATGGGCATGGTTTTTCAACAGTT 
CAATCTATTTCCCAATATGACTGTACTAGAAAATATTACTTTATCACCTATTAAGACAAAGGGACTTTCTAAGCTTGATGCTCAGA 
CAAAAGCATACGAGCTACTTGAAAAAGTTGGACTCAAAGAGAAGGCTAATGCTTATCCAGCTAGCTTATCTGGAGGGCAACAACAA 
CGAATTGCTATTGCAAGAGGTCTTGCAATGAATCCTGATGTCCTTCTTTTTGATGAACCTACTTCAGCTCTTGATCCTGAAATGGT 
AGGTGAAGTCTTGACTGTTATGCAAGATTTAGCTAAATCTGGTATGACGATGGTTATTGTCACTCATGAAATGGGTTTTGCACGTG 
AAGTAGCGGATCGTGTCATTTTTATGGATGCAGGCATTATTGTTgAsCAAGGGACCCCTAAGGAAGTA 

SEQ ID NO. 1506: SAG0492 FROM THE A909 GBS TYPE la STRAIN 

CAATACAAGGACTTCATAAAAGTTTTGGGAAAAATGAGGTTTTAAAAGGCATTGACTTGGATATTCATCAAGGAGAAGTAGTGGTT 
ATTATTGGCCCTTCTGGCTCTGGTAAGTCAACATTTTTAAGAACAATGAATCTCTTGGAAGTACCAACAAAGGGAACAGTGACTTT 
TGAAGGGATTGATATAACAGACAAAAAGAATGATATTTTTAAAATGCGCGAAAAAATGGGCATGGTTTTTCAACAGTTCAATCTAT 
TTCCCAATATGACTGTACTAGAAAATATTACTTTATCACCTATTAAGACAAAGGGGCTTTCTAAGCTTGATGCTCAGACAAAAGCA 
TATGAGCTACTTGAAAAAGTTGGACTCAAAGAGAAGGCTAATACTTATCCAGCTAGCTTATCTGGAGGACAACAACAACGAATTGC 
TATTGCAAGAGGTCTTGCAATGAATCCTGATGTCCTTCTTTTTGATGAACCTACTTCAGCTCTTGATCCTGAAATGGTAGGTGAAG 
TCTTGACTGTTATGCAAGATTTAGCTAAATCTGGTATGACGATGGTTATTGTCACTCATGAAATGGGTTTTGCACGTGAAGTAGCG 
GATCGTGTCATTTTTATGGATGCAGGAATTATTGTgAGCAAGGGGCCCCTAAGGAAGTATTTGAGCAGACAAAAGAAATCCGCACA 
AGAGATTTCTT 

SEQ ID NO. 1507: SAGO 4 92 FROM THE CJB110 GBS NONTYPEABLE STRAIN (REVERSE COMPLEMENT) 

GACTTGGATATTCATCAAGGAGAAGTGGTGGTTATTATTGGCCCTTCTGGCTCTGGTAAGTCAACATTTTTAAGAACAATGAATCT 
CTTGGAAGTACCAACAAAGGGAACAGTGACTTTTGAAGGGATTGATATAACAGACAAAAAGAATGATATTTTTAAAATGCGCGAAA 
AAATGGGCATGGTTTTTCAACAGTTCAATCTATTTCCCAATATGACTGTACTAGAAAATATTACTTTATCACCTATTAAGACAAAG 
GGACTTTCTAAGCTTGATGCTCAGACAAAAGCATACGAGCTACTTGAAAAAGTTGGACTCAAAGAGAAGGCTAATGCTTATCCAGC 
TAGCTTATCTGGAGGACAACAACAACGAATTGCTATTGCAAGAGGTCTTGCAATGAATCCTGATGTCCTTCTTTTTGATGAACCTA 
CTTCAGCTCTTGATCCTGAAATGGTAGGTGAAGTCTTGACTGTTATGCAAGATTTAGCTAAATCTGGTATGACGATGGTTATTGTC 
ACTCATGAAATGGGTTTTGCACGTGAAGTAGCGGATCGTGTCTTTTTATGGATGCGGGAATTATTGTGAGCAAGGGACC 

SEQ ID NO. 1508: SAG0492 FROM THE H36b GBS TYPE lb STRAIN 

ATGAGGTTTTAAAAGGCATTGACTTGGATATTCATCAAGGAGAAGTAGTGGTTATTATTGGCCCTTCTGGCTCTGGTAAGTCAACA 
TTTTTAAGAACAATGAATCTCTTGGAAGTACCAACAAAGGGAACAGTGACTTTTGAAGGGATTGATATAACAGACAAAAAGAATGA 
TATTTTTAAAATGCGCGAAAAAATGGGCATGGTTTTTCAACAGTTCAATCTATTTCCCAATATGACTGTACTAGAAAATATTACTT 
TATCACCTATTAAGACAAAGGGGCTTTCTAAGCTTGATGCTCAGACAAAAGCATATGAGCTACTTGAAAAAGTTGGACTCAAAGAG 
AAGGCTAATACTTATCCAGCTAGCTTATCTGGAGGACAACAACAACGAATTGCTATTGCAAGAGGTCTTGCAATGAATCCTGATGT 
CCTTCTTTTTGATGAACCTACTTCAGCTCTTGATCCTGAAATGGTAGGTGAAGTCTTGACTGTTATGCAAGATTTAGCTAAATCTG 
GTATGACGATGGTTATTGTCACTCATGAAATGGGTTTTGCACGTGAAGTAGCGGATCGTGTCATTTTTATGGATGCASGAATTATT 
GTTGAGCAAGGGGCCCCTAAGGAAGTAT 

SEQ ID NO. 1509: SAG0492 FROM THE JM9130013 GBS TYPE VIII STRAIN (REVERSE COMPLEMENT) 

GGTTTTAAAAGGCATTGACTTGGATATTCATCAAGGAGAAGTAGTGGTTATTATTGGCCCTTCTGGCTCTGGTAAGTCAACATTTT 
TAAGAACAATGAATCTCTTGGAAGTACCAACAAAGGGAACAGTGACTTTTGAAGGGATTGATATAACAGACAAAAAGAATGATATT 
TTTAAAATGCGCGAAAAAATGGGCATGGTTTTTCAACAGTTCAATCTATTTCCCAATATGACTGTACTAGAAAATATTACTTTATC 
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ACCTATTAAGACAAAGGGGCTTTCTAAGCTTGATGCTCAGACAAAAGCATATGAGCTACTTGAAAAAGTTGGACTCAAAGAGAAGG 
CTAATACTTATCCAGCTAGCTTATCTGGAGGACAACAACAACGAATTGCTATTGCAAGAGGTCTTGCAATGAATCCTGATGTCCTT 
CTTTTTGATGAACCTACTTCAGCTCTTGATCCTGAAATGGTAGGTGAAGTCTTGACTGTTATGCAAGATTTAGCTAAATCTGGTAT 
GACGATGGTTATTGTCACTCATGAAATGGGTTTTGCACGTGAAGTAGCGGATCGTGTCATTTTTATGGATGCAGGAATTATTGTTG 
AGCAAGGGGCCCCTAAGGAAGTATTTAGCAAAACAAAAGAAAT 

SEQ ID NO. 1510: SAG0492 FROM THE M732 GBS TYPE III STRAIN 

GGTGGTTATTATTGGCCCTTCTGGCTCTGGTAAGTCAACATTTTTAAGAACAATGAATCTCTTGGAAGTACCAACAAAGGGAACAG 
TGACTTTTGAAGGGATTGATATAACAGACAAAAAGAATGATATTTTTAAAATGCGCGAAAAAATGGGCATGGTTTTTCAACAGTTC 
AATCTATTTCCCAATATGACTGTACTAGAAAATATTACTTTATCACCTATTAAGACAAAGGGACTTTCTAAGCTTGATGCTCAGAC 
AAAAGCATACGAGCTACTTGAAAAAGTTGGACTCAAAGAGAAGGCTAATGCTTATCCAGCAAGCTTATCTGG 

SEQ ID NO. 1511: SAG0492 FROM THE COH1 GBS TYPE la STRAIN 

ATTGACTTGGATATTCATCAAGGAGAAGTGGTGGTTATTATTGGCCCTTCTGGCTCTGGTAAGTCAACATTTTTAAGAACAATGAA 
TCTCTTGGAAGTACCAACAAAGGGAACAGTGACTTTTGAAGGGATTGATATAACAGACAAAAAGAATGATATTTTTAAAATGCGCG 
AAAAAATGGGCATGGTTTTTCAACAGTTCAATCTATTTCCCAATATGACTGTACTAGAAAATATTACTTTATCACCTATTAAGACA 
AAGGGACTTTCTAAGCTTGATGCTCAGACAAAAGCATACGAGCTACTTGAAAAAGTTGGACTCAAAGAGAAGGCTAATGCTTATCC 
AGCAAGCTTATCTGG 

SEQ ID NO. 1601: SAG0767 FROM THE M781 GBS TYPE III STRAIN 

TGGTCGCTCTGTCGGAACGTGAAGTATCTGTACTGTCTGCAGAAAGCGTCATGCGTGCTATTAATTATGATAAATTTTTTGTTAAA 
ACTTATTTTATCACGCAAGTAGGTCAATTTATTAAAACACAAGAATTTGATGAAATGCCATCTTCAGATGAAAAGTTAATGACAAA 
CCAAACTGTTGATTTAGACAAAATGGTTCGTCCAAGTGATATCTATGATGATAATGCAATTGTTTTCCCCGTTTTACATGGACCAA 
TGGGGGAAGATGGTTCTATCCAAGGATTTTTAGAAGTTTTAAGGATGCCTTATGTTGGGACTAATATTCTATCTTCAAGCGTGGCT 
ATGGATAAAATTACAACAAAACAAGTCCTTGCAACAGTAGGTGTACCTCAGGTTGCATATCAAACTTATTTTGAGGGTGATGATTT 
GGAACATGCGATTAAACTCTCTTTAGAAACTTTAAGTTTCCCAATTTTTGTAAAACCGGCTAATATGGGGTCATCAGTAGGTATTT 
CAAAAGCGACAGATGAATCCTCACTTCGCTCTGCAATTGACTTAGGTCTCAAGTATGATAGCCGTATTTTGATTGAACAAGGCGTG 
ACAGCTCGTGAAATTGAAGTAGGTATTTTAGGCAATAATGATGTTAAGACAACTTTTCCTGGCGAAGTTGTTAAAGACGTCGATTT 
CTATGACTATGACGCCAAATATATTGATAATAAAATTACTATGGATATTCCAGCTAAAGTTGATGAAGCAACTATGGAAGCAATGC 
GTCAATATGCAAGTAAAGCTTTTAAAGCAATCGGGGCTTGTGGTTTATCACGCTGTGATTTCTTTTTGACGAAAGATGGACAAATC 
TTCTTAAACGAACTGAATACAATGCCCGGTTTTACTCAGTGGTCAATGTATCCTCTGCTTTGGGAAAATATGGGGCTAACTTATAG 
TGATTTGATTG 

SEQ ID NO. 1602: SAG0767 FROM THE 090 GBS TYPE la STRAIN 

AAACCGGGCATTGTATTCAGTTCGTTTAAGAAGACTTGT CC ATCTTTCGTCAAAAAGAAAT CACAGCGTGATAAACCACAAGC CCC 
GATTGCTTTAAAAGCTTTACTTGCATATTGACGCATTGCTTCCATAGTTGCTTCATCAACTTTAGCTGGAATATCCATAGTAATTT 
TATTATCAATATATTTGGCGTCATAGTCATAGAAATCGACGTCTTTAACGACTTCGCCAGGAAAAGTTGTCTTAACATCATTATTG 
CCTAAAATACCTACTTCAATTTCACGAGCTGTC^CGCCTTGT^ 

AGAGCGAAGTGAGGATTCA.TCTGTCGCTTTTGAAATACCTACTGATGACCCCATATTAGCCGGTTTTAC^AAAATTGGGAAACTTA 
AAGTTTCTAAAGAGAGTTTAATCGCT^TGTTCCAAATCATCACCCTCAAAATAAGTTTGATATGCAACCTGAGGTACACCTACTGTT 
GCAAGGACTTGTTTTGTTGTAATTTTATCCATAGCCACGCTTGAAGATAGAATATTAGTCCCAACATAAGGCATCCTTAAAACTTC 
TAAAAATCCTTGGATAGAACCATCTTCCCCCATTGGTCCATGTAAAACGGGGAAAACAATTGCATTATCATCATAGATATCACTTG 
GACGT^ACCATTTTGTCTAAATCAACAGTTTGGTTTGTCATTAACTTTTCATCTGAAGATGGCATTTCATCAAATTCTTGTGTTTTA 
ATAAATTGACCTACTTGCGTG 

SEQ ID NO. 1603: SAG0767 FROM THE COHl TYPE la STRAIN 

TCGCTCTGCGGAACGTGAAGTATCTGTACTGTCTGCAGAAAGCGTCATGCGTGCTATTAATTATGATAAATTTTTTGTTAAAACTT 
ATTTTATCACGCAAGTAGGTCAATTTATTAAAACACAAGAATTTGATGAAATGCCATCTTCAGATGAAAAGTTAATGACAAACCAA 
ACTGTTGATTTAGACAAAATGGTTCGTCCAAGTGATATCTATGATGATAATGCAATTGTTTTCCCCGTTTTACATGGACCAATGGG 
GGAAGATGGTTCTATCCAAGGATTTTTAGAAGTTTTAAGGATGCCTTATGTTGGGACTAATATTCTATCTTCAAGCGTGGCTAT 

SEQ ID NO. 1604: SAG0767 FROM THE CJB110 GBS NONTYPEABLE STRAIN (REVERSE COMPLEMENT) 

CGTCGATTTCTATGACTATGACGCCAAATATATTGATAATAAAATTACTATGGATATTCCAGCTAAAGTTGATGAAGCAACTATGG 
AAGCAATGCGTCAATATGCAAGTAAAGCTTTTAAAGCAATCGGGGCTTGTGGTTTATCACGCTGTGATTTCTTTTTGACGAAAGAT 
GGACAAATCTTCTTAAACGAACTGAATACAATGCCC 

SEQ ID NO. 1605: SAG0767 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

AACGTGAAGTATCTGTACTGCTCTGCAGAAAAGCGTCATGCGTGCTATTAATTATGATAAATTTTTTGTTAAAACTTATTTTATCA 
CGCAAGTAGGTCAATTTATTAAAACACAAGAATTTGATGAAATGCCATCTTCAGATGAAAA 

SEQ ID NO. 1606: SAG0767 FROM THE 1169NT1 GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

CTAATATGGGGTCATCAGTAGGTATTTCAAAAGCGACAGATGAATCCTCACTTCGCTCTGCAATTGACTTAGCTCTCAAGTATGAT 
AGCCGTATTTTGATTGAACAAGGCGTGACAGCTCGTGA71ATTGAAGTAGGTATTTTAGGCAATAATGATGTTAAGACAACTTTTCC 
TGGCGAAGTCGTTAAAGACGTCGATTTCTATGACTATGACGCCAAATATATTGATAATAAAATTACTATGGATATTCCAGCTAAAG 
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TTGATGAAGCAACTATGGAAGCAATGCGTCAATATGCAAGTAAAGCTTTTAAAGCAATCGGGGCTTGTGGTTTATCACGCTGTGAT 
TTCTTTTTGACGAAAGATGGACAAATCTTCTTAAACGAACTG7\ATACAATGCCCGGTTTTACTCAGTGGTCAATGTATCCTCTGCT 
TTGGGAAAAT 

SEQ ID NO. 1607: SA60767 FROM THE 18RS21 GBS TYPE II STRAIN (REVERSE COMPLEMENT) 

TTGACTTAGCTCTCAAGTATGATAGCCGTATTTTGATTGAACAAGGCGTGACAGCTCGTGAAATTGAAGTAGGTATTTTAGGCAAT 
AATGATGTTAAGACAACTTTTCCTGGCGAAGTCGTTAAAGACGTCGATTTCTATGACTATGACGCCAAATATATTGATAATAAAAT 
TACTATGGATATTCCAGCTT^AAGTTGATGAAGGAACTATGGAAGCAATGCGTCA 

CTTGTGGTTTATCACGCTGTGATTTCTTTTTGACGAAAGATGGACAAATCTTCTTAAACGAACTGAATACAATGCCCGGTTTTACT 
CAGTGGTCAATGTATCCCCTGCTTTGGGAAAAGTATGGGGCTAACCTT 

SEQ ID NO. 1608: SAG0767 FROM THE 18RS21 GBS TYPE II STRAIN 

ATCTGTACTGTCTGCAGAAAAGCGTCATGCGTGCTATTAATTATGATAAATTTTTTGTTAAAACTTATTTTATCACGCAAGTAGGT 
CAATTTATTAAAACACAAGAATTTGATGAAATGCCATCTTCAGATGAAAAGTTAATGACAAACCAAACTGTTGATTTAGACAAAAT 
GGTTCGTCCAAGTGATATCTATGATGATAATGCAATTGTTTTCCCCGTTTTACATGGACCAATGGGGGAAGATGGTTCTATCCAAG 
GATTTTTAGAAGTTTTAAGGATGCCTTATGTTGGGACTAATATTCTATCTTCAA 

SEQ ID NO. 1609: SAG0767 FROM THE 2603V/R GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

GGCTATGGATAAAATTACAACAAAACAAGTCCTTGC^VACAGTAGGTGTACCTCAGGTTGCATATCAAACTTATTTTGAGGGTGATG 
ATTTGGAACATGCGATTAAACTCTCTTTAGAAACTTTAAGTTTCCCAATTTTTGTAAAACCGGCTAATATGGGGTCATCAGTAGGT 
ATTTCAAAAGCGACAGATGAATCCTCACTTCGCTCTGCAATTGACTTAGCTCTCAAGTATGATAGCCGTATTTTGATTGAACAAGG 
CGTGACAGCTCGTGAAATTGAAGTAGGTATTTTAGGCAATAATGATGTTAAGACAACTTTTCCTGGCGAAGTCGTTAAAGACGTCG 
ATTTCTATGACTATGACGCCAAATATATTGATAATAAAATTACTATGGATATTCCAGCTAAAGTTGATGAAGCAACTATGGAAGCA 
ATGCGTCAATATGCAAGTAAAGCTTTTAAAGCAATCGGGGCTTGTGGTTTATCACGCTGTGATTTCTTTTTGACGAAAGAATGGAC 
AAATCTTCTTAAACGAACTGAAATAC 

SEQ ID NO. 1610: SAG0767 FROM THE 2603V/R GBS TYPE V STRAIN 

TCTGTACTGTCTGCAGAAAGCGTCATGCGTGCTATTAATTATGATAAATTTTTTGTTAAAACTTATTTTATCACGCAAGTAGGTCA 
ATTTATTAAAACACAAGAATTTGATGAAATGCCATCTTCAGATGAAAAGTTAATGACAAACCAAACTGTTGATTTAGACAAAATGG 
TTCGTCCAAGTGATAT CTATGATGATAAT 

SEQ ID NO. 1611: SAG0767 FROM THE H36b GBS TYPE lb STRAIN (REVERSE COMPLEMENT) 

AAAACCGGCTAATATGGGGTCATCAGTAGGTATTTCAAAAGCGACAGATGAATCCTCACTTCGCTCTGCAATTGACTTAGCTCTCA 
AGTATGATAGCCGTATTTTGATTGAACAAGGCGTGACAGCTCGTGAAATTGAAGTAGGTATTTTAGGCAATAATGATGTTAAGACA 
ACTTTTCCTGGCGAAGTCGTTAAAGACGTCGATTTCTATGACTATGACGCCAAATATATTGATAATAAAATTACTATGGATATTCC 
AGCTAAAGTTGATGAAGCAACTATGGAAGCAATGCGTCAATATGCAAGTAAAGCTTTTAAAGCAATCGGGGCTTGTGGTTTATCAC 
GCTGTGATTTCTTTTTGACGAAAGATGGACAAATCTTCTTAAACGAACTGAATACAATGCCCGGTTTTACTCAGTGGTCAATGTAT 
CCCCTGCTTTGGGAAAATATGGGGCTAACTTATAG 

SEQ ID NO. 1612: SAGO 7 67 FROM THE H36b TYPE lb STRAIN 

CGTGAAGTATCTGTACTGTCTGCAGAAAGCGTCATGCGTGCTATTAATTATGATAAATTTTTTGTTAAAACTTATTTTATCACGCA 
AGTAGGTCAATTTATTAAAACACAAGAATTTGATGAAATGCCATCTTCAGATGAAAAGTTAATGACAAACCAAACTGTTGATTTAG 
ACAAAATGGTTCGTCCAAGTGATATCTATGATGATAATGCAATTGTTTTCCCCGTTTTACATGGACCAATGGGGGAAGATGGTTCT 
ATCCAAGGATTTTTAGAAGTTTTAAGGATGCCTTATGTTGGGACTAATATTCTATCTTCAAGCGTGGCTATGGATAAAATTACAAC 
AAAACAAGTCCTTGCAACAGTAG 

SEQ ID NO. 1613: SAG0767 FROM THE M732 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

ATGCGATTAAACTCTCTTTAGAACCTTTAAGTTTCCCAATTTTTGTAAACCCGGCTAATATGGGGTCATCAGTAGGTATTTCAAAA 
GCGACAGATGAATCCTCACTTCGCTCTGCAATTGACTTAGCTCTCAAGTATGATAGCCGTATTTTGATTGAACAAGGCGTGACAGC 
TCGTGAAATTGAAGTAGGTATTTTAGGCAATAATGATGTTAAGACAACTTTTCCTGGCGAAGTTGTTAAAGACGTCGATTTCTATG 
ACTATGACGCCAAATATATTGATAATAAAATTACTATGGATATTCCAGCTAAAGTTGATGAAGCAACTATGGAAGCAATGCGTCAA 
TATGCAAGTAAAGCTTTTAAAGCAATCGGGGCTTGTGGTTTATCACGCTGTGATTTCTTTTTGACGAAAGATGGACAAATCTTCTT 
AAACGAACTGAATACAATGCCCGGTTTTACTCAGTGGTCAATGTATCCTCTGCTTTGGGAAAATATGGGGCTAACTT 

SEQ ID NO. 1614: SAG0767 FROM THE M732 GBS TYPE III STRAIN 

GTCATGCCGTGCTATTAATTATGATAAATTTTTTGTTAAAACTTATTTTATCACGCAAGTAGGTCAATTTATTAAAACACAAGAAT 
TTGATGAAATGCCATCTTCAGATGAAAAGTTAATGACAAACCAAACTGTTGATTTAGACAAAATGGTTCGTCCAAGTGATATCTAT 
GATGATAATGCAATTGTTTTCCCCGTTTTACATGGACCAATGGGGGAAGATGGTTCTATCCAAGGATTTTTAGAAGTTTTAAGGAT 
GCCTTATGTTGGGACTAATATTCTATCTTCAAGCGTGGCTATGGATAAAATTACAACAAAACAAGTCCTTGCAACAGTAGGTGTAC 
CTCAGG 

SEQ ID NO. 1615: SAG0767 FROM THE A909 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

TTTTGAGGGTGATGATTTGGAACATGCGATTAAACTCTCTTTAGAAACTTTAAGTTTCCCAATTTTTGTAAAACCGGCTAATATGG 
GGTCATCAGTAGGTATTTCAAAAGCGACAGATGAATCCTCACTTCGCTCTGCAATTGACTTAGCTCTCAAGTATGATAGCCGTATT 
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TTGATTGAACAAGGCGTGACAGCTCGTGAAATTGAAGTAGGTATTTTAGGCAATAATGATGTTAAGACAACTTTTCCTGGCGAAGT 
CGTTAAAGACGTCGATTTCTATGACTATGACGCCAAATATATTGATAATAAAATTACTATGGATATTCCAGCTAAAGTTGATGAAG 
CAACTATGGAAGCAATGCGTCAATATGCAAGTAAAGCTTTTAAAGCAATCGGGGCTTGTGGTTTATCACGCTGTGATTTCTTTTTG 
ACGAAAGATGGACAAATCTTCTTAAACGAACTGAATACAATGCCCGGTTTTACTCAGTGGTCAATGTATCCCCTGCTTTGGGAAAA 
TATGGGGCTAACTTATAGTGA 

SEQ ID NO. 1616: SAG0767 FROM THE A909 GBS TYPE la STRAIN 

TGGTCGCTCTGCGGAACGTGAAGTATCTGTACTGTCTGCAGAAAGCGTCATGCGTGCTATTAATTATGATAAATTTTTTGTTAAAA 
CTTATTTTATCACGCAAGTAGGTCAATTTATTAAAACACAAGAATTTGATGAAATGCCATCTTCAGATGAAAAGTTAATGACAAAC 
CAAACTGTTGATTTAGACAAAATGGTTCGTCCAAGTGATATCTATGATGATAATGCAATTGTTTTCCCCGTTTTACATGGACCAAT 
GGGGGAAGATGGTTCTATCCAAGGATTTTTAGAAGTTTTAAGGATGCCTTATGTTGGGACTAATATTCTATCTTCAAGCGTGGCTA 
TGGATAAAATTACAACAAAACAAGTCCTTGCAACAGTAGG 

SEQ ID NO. 1617: SAG0767 FROM THE JM9130013 GBS TYPE VIII STRAIN (REVERSE COMPLEMENT) 

AAGCAGGGGATACATTGACCACTGAGTAAAACCGGGCATTGTATTCAGTTCGTTTAAGAAGATCTGTCCATCTTTCGTCAAAAAGA 
AATCACAGCGTGATAAACCACAAGCCCCGATTGCTTTAAAAGCTTTACTTGCATATTGACGCATTGCTTCCATAGATGCTTCATCA 
ACTTTAGCTGGAATATCCATAGCAATTTTATTATCAATATATTTGGCG 

SEQ ID NO. 1701: SAG1086 FROM THE1169NT1 GBS NONTYPEABLE STRAIN 

TTTAAAGGTTGATTCCTTTTTGACTCATCAGGTAGATTTTGAGTTAATGCAGGAAATAGGTAAAGTTTTTGCTGATAAATATAAAG 
AAGCCGGCATTACGAAGGTTGTTACGATTGAAGCATCTGGAATTGCGCCAGCAGTGTACGCAGCTCAAGCATTGGGCGTACCAATG 
ATATTTGCTAAAAAGGCTAAGAACATTACTATGACTGAAGGTATCTTAACTGCTGAAGTGTATTCTTTTACAAAGCAAGWTACGAG 
TCAAGTTTCTATTGTGAGTCGCTTTTTATCTAACGATGATACTGTACTCATCATTGATGACTTTTTAGCAAACGGTCAAGCGGCTA 
AAGGATTACTTGAAATTATTGGTCAAGCTGGAGCTAAGGTTGCTGGTATCGGAATCGTTATTGAAAAATCTTTCCAAGATGGGCGT 
GATTTGTTAGAAAAAACAGGTGTTCCAGT 

SEQ ID NO. 1702: SAG0767 FROM THE 18RS21 GBS TYPE II STRAIN 

TTTAGGTGAGAACATTTTAAAGGTTGATTCTTTTTTGACTCATCAGGTAGATTTTGAGTTAATGCAGGAAATAGGTAAAGTTTTTG 
CTGATAAATATAAAGAAGCCGGCATTACGAAGGTTGTTACGATTGAAGCATCTGGAATTGCACCAGCAGTGTACGCAGCTCAAGCA 
TTGGGCGkACCAATGATATTTGCTAAAAAAGCTAAGAACATTACTATGACTGAAGGTATCTTAACTGCTGAAGTGTATTCTTTTAC 
AAAGCAAGTTACGAGTCAAGTTTCTATTGTGAGTCGCTTTTTATCTAACGATGATACTGTACTCATCATTGATGACTTTTTAGCAA 
ACGGTCAAGCGGCTAAAGGATTACTTGAAATTATTGGTCAAGCTGGAGCTAAGGTTGCTGGTATCGGAATCGTTATTGAAAAATCT 
TTCCAAGATGGGCGTGATTTGTTAGAAAAAACA 

SEQ ID NO. 1703: SAG0767 FROM THE H36bl GBS TYPE lb STRAIN 

AAGAACGTATTCTTAAAGATGGTGATGTTTTAGGTGAGAACATTTTAAAAGTTGATTCTTTTTTGACTCATCAGGTAGATTTTGAG 
TTAATGCAGGAAATAGGTAAAGTTTTTGCTGATAAATATAAAGAAGCCGGCATTACGAAGGTTGTTACAATTGAAGCATCTGGAAT 
TGCGCCAGCAGTGTACGCAGCTCAAGCATTGGGCGTACCAATGATATTTGCTAAAAAAGCTAAGAACATTACTATGACTGAAGGTA 
TCTTAACTGCTGAAGTGTATTCTTTTACAAAGCAAGTTACGAGTCAAGTTTCTATTGTGAGTCGCTTTTTATCTAACGATGATACT 
GTACTCATCATTGATGACTTTTTAGC^AACGGTCAAGCGGCTAAAGGATTACTTGAAATTATTGGTCAAGCTGGAGCTAAGGTTGC 
TGGTATCGGAATCYTTATTGAAAAATCTTTCCAAGATGGGCGTGATT 

SEQ ID NO. 1704: SAG0767 FROM THE M732 GBS TYPE III STRAIN 

ATTCTTTTTTGACTATCAGGTAAATTTTGAGTTAATGCAGGAAATAGGTAAAGTTTTTGCTGATAAATATAAAGAAGCCGGCATTA 
CGAAGGTTGTTACAATTGAAGCATCTGGAATTGCGCCAGCAGTGTACGCAGCTCAAGCATTGGGCGTACCAATGATATTTGCTAAA 
AAAGCTAAGAACATTACTATGACTGAAGGTATCTTAACTGCTGAAGTGTATTCTTTTACAAAGCAAGTTACGAGTCAAGTTTCTAT 
TGTGAGTCGCTTTTTATCTAACGATGATACTGTACTCATCATTGATGACTTTTTAGCAAACGGTCAAGCGGCTAAAGGATTACTTG 
AAATTATTGGTCAAGCTGAAGCTAAGGTTGCTGGTATCGGAATCGTTATTGAAAAATCTTTCCAAGATGGGCGTGATTTGTTAGAA 
AAAACAGGTGTTCCGGTTACTTCTCTTGCTCGT 

SEQ ID NO. 1705: SAG0767 FROM THE M781 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

GAACGTATTCTTAAAGATGGTGATGTTTTAGGTGAGAACATTTTAA7VAGTTGATTCTTTTTTGACTCATCAGGTAAATTTTGAGTT 
AATGCAGGAAATAGGTAAAGTTTTTGCTGATAAATATAAAGAAGCCGGCATTACGAAGGTTGTTACAATTGAAGCATCTGGAATTG 
CGCCAGCAGTGTACGCAGCTCAAGCATTGGGCGTACCAATGATATTTGCTAAAAAAGCTAAGAACATTACTATGACTGAAGGTATR 
TTAACTGCTGAAGTGTATTCTTTTACAAAGCAAGTTACGAGTCAAGTTTCTATTGTGAGTCGCTTTTTATCTAACGATGATACTGT 
ACTCATCATTGATGACTTTTTAACAAACGGTCAAGC 

SEQ ID NO. 1706: SAGO 7 67 FROM THE 090 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

ACATTTTAAAGGTTGATTCTTTTTTGACTCATCAGGTAGATTTTGAGTTAATGCAGGAAATAGGTAAAGTTTTTGCTGATAAATAT 
AAAGAAGCCGGCATTACGAAGGTTGTTACGATTGAAGCATCTGGAATTGCACCAGCAGTGTACGCAGCTCAAGCATTGGGCGTACC 
AATGATATTTGCTAAAAAAGCTAAGAACATTACTATGACTGAAGGTATCTTAACTGCTGAAGTGTATTCTTTTACAAAGCAAGTTA 
CGAGTCAAGTTTCTATTGTGAGTCGCTTTTTATCTAACGATGATACTGTACTCATCATTGATGACTTTTTAGCAAACMGTCYAGCG 
GCTAAAGGATTACTTGAAATTATTGGTCAAGCTGGAGCTAAGGTTGCTGGTATCGGAATCGTTATTGAAAAATCTTTCCAAGATGG 
GCGTGATTTGTTAGAAAA 
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SEQ ID NO. 1707: SAG0767 FROM THE A909 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

ACGTATTCTTAAAGATGGTGATGTTTTAGGTGAGAACATTTTAAAAGTTGATTCTTTTTTGACTCATCAGGTAGATTTTGAGTTAA 
TGCAGGTU^TAGGTAAAGTTTTTGCTGATAAATATAAAGAAGCCGGCATTACGAAGGTTGTTACAATTGAAGCATCTGGAATTGCG 
CCAGCAGTGTACGCAGCTCAAGCATTGGGCGTACCAATGATATTTGCTAAAAAAGCTAAGAACATTACTATGACTGAAGGTATCTT 
AACTGCTGAAGTGTATTCTTTTACAAAGCAAGTTACGAGTCAAGTTTCTATTGTGAGTCGCTTTTTATCTAACGATGATACTGTAC 
TCATCATTGATGACTTTTTAGCAAACGGKCAAGCGGSTARAGGATTACTTGAAATTATTGGTCAAGCTGGAGCTA 

SEQ XD NO. 1708: SAG0767 FROM THE COHl GBS TYPE Xa STRAIN 

TTTAA7VAGTTGATTCTTTTTTGACTCATCAGGTAAATTTTGAGTTAATGCAGGAAATAGGTAAAGTTTTTGCTGATAAATATAAAG 
AAGCCGGCATTACGAAGGTTGTTACAATTGAAGCATCTGGAATTGCGCCAGCAGTGTACGCAGCTCAAGCATTGGGCGTACCAATG 
ATATTTGCTAAAAAAGCTAAGAACATTACTATGACTGAAGGTATCTTAACTGCTGAAGTGTATTCTTTTACAAAGCAAGTTACGAG 
TCAAGTTTCTATTGTGAGTCGCTTTTTATCTAACGATGATACTGTACTCATCATTGATGACTTTTTAGCAAACGGTCAAGCGGCTA 
AAGGAXTACTTGAAATTATTGGTCAAGCTGAAGCTAAGGTTGCTGGTATCGGAATCGTTATTGAAAAATCTTTCCAAGATGGGCGT 
GATTTGTTAGAAAAAACAGGTGTTCCGGTTAC 

SEQ ID NO. 1709: SAGO 7 67 FROM THE CJB110 GBS NONTYPEABLE STRAIN (REVERSE COMPLEMENT) 

GCTGATAZ^ATATAAAGAAGCCGGCATTACGAAGGTTGTTACAATTGAAGCATCTGGAATTGCGCCAGCAGTGTACGCAGCTCAAGC 
ATTGGGCGTACCAATGATATTTGCTAAAAAAGCTAAGAACATTACTATGACTGAAGGTATCTTAACTGCTGAAGTGTATTCTTTTA 
CAAAGCAAGTTACGAGTCAAGTTTCTATTGTGAGTCGCTTTTTATCTAACGATGATACTGTACTCATCATTGATGACTTTTTAGCA 
AACGGTCAAGCGGCTAAAGGATTACTTGAAATTTATTGGTCAAGCTGGAGCTAAGGTTGCTGGTATCGGAATCGTTATTGAAAAAT 
CTTTCCAAGATGGGCGTGATTTGTTAGAAAAAACAGGTGTTCCAGT 

SEQ ID NO. 1710: SAG0767 FROM THE 2603 V/R GBS TYPE V STRAIN 

AACGTATTCTTAAAGATGGTGATGTTTTAGGTGAGAACATTTTAAAAGTTGATTCTTTTTTGACTCATCAGGTAGATTTTGAGTTA 
ATGCAGGAAATAGGTAAAGTTTTTGCTGATAAATATAAAGAAGCCGGCATTACGAAGGTTGTTACAATTGAAGCATCTGGAATTGC 
GCCAGCAGTGTACGCAGCTCAAGCATTGGGCGTACCAATGATATTTGCTAAAAAAGCTAAGAACATTACTATGACTGAAGGTATCT 
TAACTGCTGAAGTGTATTCTTTTACAAAGCAAGTTACGAGTCAAGTTTCTATTGTGAGTCGCTTTTTATCTAACGATGATACTGTA 
CTCATCATTGATGACTTTTTAGCAAACGGTCAAGCGGCTAAAGGATTACTTGAAATTATTGGTCAAGCTGGAGCTAAGGTTGCTGG 
TATCGGAATCGTTATTGAAAAATCTTTCCAAGATGGGCGTGATTTGTTAGAAAAAACAGGTGTTCCAG 

SEQ XD NO. 1711: SAG0767 FROM THE JM9130013 GBS TYPE VIII STRAIN (REVERSE COMPLEMENT) 

ACGAAGGTTGTTACAATTGAAGCATCTGGAATTGCGCCAGCAGTGTACGCAGCTCAAGCATTGGGCGTACCAATGATATTTGCTAA 
AAAAGCTAAGAACATTACTATGACTGAAGGTATCTTAACTGCTGAAGTGTATTCTTTTACAAAGCAAGTTACGAGTCAAGTTTCTA 
TTGTGAGTCGCTTTTTATCTAACGATGATACTGTACTCATCATTGATGACTTTTTAGCAAACGGTCAAGCGGCTAAAGGATTACTT 
GAAATTATTGGTCAAGCTGGAGCTAAGGTTGCTGGTATCGGA 

SEQ ID NO. 1801: SAG1600 FROM THE H36b GBS TYPE lb STRAIN (REVERSE COMPLEMENT) 

AATCTTCATTGGAGATCAGGCTAGAGCTCCGTATGGTCCTAGACCTGCTCAACAGATTAGAGAGTTTACCTGGCAGATGGTTAATT 
TCTTATTGACTAAAAATGTTAAGATGATTGTTATAGCTTGTAATACAGCAACTGCAGTTGCCTGGCAAGAAATTAAAGAAAAACTA 
GACGTGCCTGTTTTAGGCGTTATTTTACCAGGAGCTAGCGCAGCTATCAAATCAACTAATTCAGGGAAAGTTGGTATTATAGGTAC 
TCCCATGACTGTTAAATCAGATGCTTATCGTCAAAAAATTCAAGCTTTGTCTCCAAATACTGCTGTGGTATCCCTTGCTTGTCCGA 
AATTTGTTCCAATTGTGGAATCAAATCAGATGTCTTCTAGTTTAGCCAAAAAGGTGGTTTATGAAACGTTGTCCCCATTAGTTGGT 
AAATTAGATACTTTAATTTTAGGTTGCACGCATTATCCCTTATTACGTCCCATCATTCAAAATGTTATGGGGGCTGAGGTTAAATT 
AATTGATAGTGGCGCAGAAACCGTTCGTGATATTTCTGTTTTATTGAACTATTTTGAGATAAACCATAATTGGCAAAATAAACACG 
GTGGTCATCACTTTTACACAACCGCCAGCCCAA 

SEQ ID NO. 1802: SAG1600 FROM THE M732 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

AAATGTTCCGTCAACTTCCAGAAGAGGAAGTAATCTTCATTGGAGATCAGGCTAGAGCTCCGTATGGTCCTAGACCTGCTCAACAG 
ATTAGAGAGTTTACCTGGCAGATGGTTAACTTCTTATTGACTAAA7VATGTTAAGATGATTGTTATAGCTTGTAATACAGCAACTGC 
AGTTGCCTGGCAAGAAATTAAAGAAAAACTAGACATCCCTGTTTTAGGCGTTATTTTACCAGGAGCTAGCGCAGCTATCAAATCAA 
CTAATTTAGGGAAAGTTGGTATTATAGGTACTCCCATGACTGTTAAATCAGATGCTTATCGTCAAAAAATTCAAGCTTTGTCTCCA 
AATACTGCTGTGGTATCCCTTGCTTGTCCGAAATTTGTTCCAATTGTGGAATCAAATCAGATGTCTTCTAGTTTAGCCAAAAAGGT 
GGTTTATGAAACGTTGTCCCCATTAGTTGGTAAATTAGATACTTTAATTTTAGGTTGCACGCATTATCCCCTATTACGTCCCATCA 
TTCAAAATGTTATGGGGGCTGAGGTTAAATTAATTGATAGTGGCGCAGAAACCGTTCGTGATATTTCTGTTTTATTGAACTATTTT 
GAGATAAACCATAATTGGCAAAATAAACACGGTGGTCATCACTTTTACACAACCGCCAGCCCAAAAGGTTTTAAAGAAA 

SEQ ID NO. 1803: SAG1600 FROM THE 090 GBS TYPE la STRAIN 

AATCTTCATTGGAGACCAGGCTAGAGCTCCGTATGGTCCTAGACCTGCTCAACAGATTAGAGAGTtACCTGGCAGATGGTTAATTT 
CTTATTGACTAAAAATGTTAAGATGATTGTTATAGCTTGTAATACAGCAACTGCAGTTGCCTGGCAAGAAATTAAAGAAAAACTAG 
ACATACCTGTTTTAGGCGTTATTTTACCAGGAGCTAGCGCAGCTATCAAATCAACTAATTCAGGGAAAGTTGGTATTATAGGTACT 
CCCATGACTGTTAAATCAGATGCTTATCGTCAAAAAATTCAAGCTTTGTCTCCAAATACTGCTGTGGTATCCCTTGCTTGTCCGAA 
ATTTGTTCCAATTGTGGAATCAAATCAGATGTCTTCTAGTTTAGCCAAAAAGGTGGTTTATGAAACGCTGTCCCCATTAGTTGGTA 
AATTAGATACTTTAATTTTAGGTTGCACGCATTATCCCTTATTACGTCCCATCATTCAAAATGTTATGGGGGCTGAGGTTAAATTA 
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ATTGATAGTGGCGCAGAAACCGTTCGTGATATTTCTGTTTTATTGAACTATTTTGAGATaAmCCATaATTGGsmAAATAAACACGG 
TGGTCATCACTTTTACACAACCGsCAGCCCAAAAGGTTTTTAAGGAAATTGCAGAACAATGGCTTAATCAAGAAATAAAT 

SEQ ID NO. 1804: SA61600 FROM THE A909 GBS TYPE la STRAIN 

GCGGTTGTGTAAAAGTGATGACCACCGTGTTTATTTTGCCAATTATGGTTTATCTCAAAATAGTTCAATAAAACAGAAATATCACG 
AACGGTTTCTGCGCCACTATCAATTAATTTAACCTCAGCCCCCATAACATTTTGAATGATGGGACGTAATAGGGGATAATGCGTGC 
AACCTAAAATTAAAGTATCTAATTTACCAACTAATGGGGACAACGTTTCATAAACCACCTTTTTGGCTAAACTAGAAGACATCTGA 
TTTGATTCCACAATTGGAACAAATTTCGGACAAGCAAGGGATACCACAGCAGTATTTGGAGACAAAGCTTGAATTTTTTGACGATA 
AGCATCTGATTTAACAGTCATGGGAGTACCTATAATACCAACTTTCCCTAAATTAGTTGATTTGATAGCTGCGCTAGCTCCTGGTA 
AAATAACGCCTAAAACAGGGATGTCTAGTTTTTCTTTAATTTCTTGCCAGGCAACTGCAGTTGCTGTATTACAAGCTATAACAATC 
ATCTTAACATTTTTAGTCAATAAGAAGTTAACCATCTGCCAGGTAAACTCTCTAATCTGTTGAGCAGGTCTAGGACCATACGGAGC 
TCTAGCCTGATCTCCAATGAAGATTACTTCCTCTTCTGGAAGTTGACGGAACATTTCCTTAACAACCGTTAAACCACCT 

SEQ ID NO. 1805: SAG1600 FROM THE COH1 GBS TYPE la STRAIN 

TTCCGTCAACTTCCAAAATATGAAGTAATCTTCATTGGAGATCAGGCTAGAGCTCCGTATGGTCCTAGACCTGCTCAACAGATTAG 
AGAGTTTACCTGGCAGATGGTTAACTTCTTATTGACTAAAAATGTTAAGATGATTGTTATAGCTTGTAATACAGCAACTGCAGTTG 
CCTGGCAAGAAATTAAAGAAAAACTAGACATCCCTGTTTTAGGCGTTATTTTACCAGGAGCTAGCGCAGCTATCAAATCAACTAAT 
TTAGGGAAAGTTGGTATTATAGGTACTCCCATGACTGTTAAATCAGATGCTTATCGTCAAAAAATTCAAGCTTTGTCTCCAAATAC 
TGCTGTGGTATCCCTTGCTTGTCCGAAAT 

SEQ ID NO. 1806: SAG1600 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

GTAATCTTCATTGGAGATCAGGCTAGAGCTCCGTATGGTCCTAGACCTGCTCAACAGATTAGAGAGTTTACCTGGCAGATGGTTAA 
TTTCTTATTGACTAAAAATGTTAAGATGATTGTTATAGCTTGTAATACAGCAACTGCAGTTGCCTGGCAAGAAATTAAAGAAAAAC 
TAGACATAC 

SEQ ID NO. 1807: SAG1600 FROM THE 1169NT1 GBS TYPE V STRAIN 

CTTTTGGGCTGGCGGTTGTGTAAAATTGATGACCACCGTGTTTATTTTGCCAATTATGGTTTATCTCAAAATAGTTCAATAAAACA 
GAAATATCACGAACGGTTTCTGCGCCACTATCAATTAATTTAACCTCAGCCCCCATAACATTTTGAATAATGGGACGTAATAGGGG 
ATAATGCGTGCAACCTAAAATTAAAGTATCTAATTTACCAACTAATGGGGACAATGTTTCATAAACCACCTTTTTGGCTAAACTAG 
AAGACATCTGATTTGATTCCACAATTGGAACAAATTTCGGACAAGCAAGGGATACCACAGCAGTATTTGGAGACAAAGCTTGAATT 
TTTTGACGATAAGCATCTGATTTAACAGTCATGGGAGTACCTATAA 

SEQ ID NO. 1808: SAG1600 FROM THE 1169NT1 GBS TYPE V STRAIN 

GTAATCTTCATTGGGGATCAGGCTAGAGCTCCGTATGGTCCTAGACCTGCTCAACAGATTAGAGAGTTTACCTGGCAGATGGTTAA 
TTTCTTATTGACTAAAAATGTTAAGATGATTGTTATAGCTTGTAATACAGCAACTGCAGTT 

SEQ ID NO. 1809: SAG1600 FROM THE 18RS21 GBS TYPE II STRAIN 

GAAATGTTCCGTCAACTTCCAGAAGAGGAAGTAATCTTCATTGGAGATCAGGCTAGAGCTCCGTATGGTCCTAGACCTGCTCAACA 
GATTAGAGAGTTTACCTGGCAGATGGTTAACTTCTTATTGACTAAAAATGTTAAGATGATTGTTATAGCTTGTAATACAGCAACTG 
CAGTTGCCTGGCAAGAAATTAAAGAAAAACTAGACATCCCTGTTTTAGGCGTTATTTTACCAGGAGCTAGCGCAGCTATCAAATCA 
ACTAATTTAGGGAT^AGTTGGTATTATAGGTACTCCCATGACTGTTAAATCAGATGCTTATCGTCAAAAAATTCAAGC 

SEQ ID NO. 1810: SAG1600 FROM THE 18RS21 TYPE II STRAIN 

ATTTCTTTAAAACCTTTTGGGCTGGCGGTTGTGTAATATTGATGACCACCGTGTTTATTTTGCCAATTATGGTTTATCTCAAAATA 
GTTCAATAAAACAGAAATATCACGAACGGTTTCTGCGCCACTATCAATTAATTTAACCTCAGCCCCCATAACATTTTGAATGATGG 
GACGTAATATGGGATAATGCGTGCAACCTAAAATTAAAGTA 

SEQ ID NO. 1811: SAG1600 FROM THE 2603 V/R GBS TYPE V STRAIN 

ATTTCTTTAAAACCTTTTGGGCTGGCGGTTGTGTAATAAGTGATGACCACCGTGTTTATTTTGCCAATTATGGTTTATCTCAAAAT 
AGTTCAATAAAACAGAAATATCACGAACGGTTTCTGCGCCACTATCAATTAATTTAACCTCAGCCCCCATAACATTTTGAATGATG 
GGACGTAATAGGGGATAATGCGTGCAACCTAAAATTAAAGTATCTAATTTACCAACTAATGGGGACAACGTTTCATAAACCACCTT 
TTTGGCTAAACTAGAAGACATCTGATTTGATTCCACAATTGGAACAA 

SEQ ID NO. 1812: SAG1600 FROM THE M781 GBS TYPE III STRAIN 

GGCGGTTGTGTAAAAGTGATGACCACCGTGTTTATTTTGCCAATTATGGTTTATCTCAAAATAGTTCAATAAAACAGAAATATCAC 
GAACGGTTTCTGCGCCACTATCAATTAATTTAACCTCAGCCCCCATAACATTTTGAATGATGGGACGTAATAGGGGATAATGCGTG 
CAACCTAAAATTAAAGTATCTAATTTACCAACTAATGGGGACAACGTTTCATAAACCACCTTTTTGGCTAAACTAGAAGA 

SEQ ID NO. 1813: SAG1600 FROM THE M 781 GBS TYPE III STRAIN 

AATCTTCATTGGAGATCAGGCTAGAGCTCCGTATGGTCCTAGACCTGCTCAACAGATTAGAGAGTTTACCTGGCAGATGGTTAACT 
TCTTATTGACTAAAAATGTTAAGATGATTGTTATAGCTTGTAATACAGCAACTGC 

SEQ ID NO. 1814: SAG1600 FROM THE JM9130013 GS TYPE VIII STRAIN 
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TGGGCTGGCGGTTGTGTAAAAGTGATGACCACCGTGTTTATTTTGCCAATTATGGTTTATCTCAAAATAGTTCAATAAAACAGAAA 
TATCACGAACGGTTTCTGCGCCACTATCAATTAATTTAACCTCAGCCCCCATAACATTTTGAATGATGGGACGTAATAAGGGATAA 
TGCGTGCAACCTAAAATTAAAGTATCTAATTTACCAACTAATGGGGACAACGTTTCATAAACCACCTTTTTGGCTAAACTAGAAGA 
CATCTGATTTGATTCCACAATTGGAACAAATTTCGGACAAGCAAGGGATACCACAGCAGTATTTGGAGACAAAGCTTGAATTTTTT 
GACGATAAGCATCTGATTTAACAGTCATGGGAGTACCTATAATACCAACTTTCCCTGAA 

SEQ ID NO. 1901: SAG1680 FROM THE 2603 V/R GBS TYPE V STRAIN 

ATCCCTAGACCATTATAAGCATGTTTCACTCCATTTTGTCTAACAAATCGTAACAATGCTGTTTCTTTAGGCTTGTAAACCAAGTC 
GACAACTACTAAATTCGGTGTTAAAATTTCTGGATCGTTAATTAAACTATAATTATCTAATGGCCTCATTCCTAAACTAGTAGCAT 
CAATATAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTGTCTTATTTTCTAGATAATCAACGACTACCTTTATTTGAAACTGT 
TTTTTAATTTTATCTGATAAGTCAATGACCTTATCGTAATTTGAGCTGTTACGATTAAATAATCTAATTTCCGCAACTCCCTCCAT 
AGCTGCTTGAACTGCAACTGCTTTACCTGAACCACCAATACCAGCTATTGTAATTATTTTATTTTTAGCACTGAAACCTTGAGCTG 
CTAAAGCTTTAAAACAACCAATGCCATCTGTCATATGGCCTACTAAACGTCCGGTTCCACCTTGATTAACGATAGTATTTACAGCA 
CCCACTAATTTAGCTTGAGGAGATAAATCATCTAGCAAAGGGATAACACTCTGTTT7\AATGGCATTGAAACATTAACACCACGAAT 
ACCCAATGCCCTGACACCTCGAACAGCTTCTGTTAATTTACCCTCTTCTACTTCAAATGTCAGATAGGCATAATTCATGTTTTTTT 
CTTGAAAAGAGGTATTCCACATTAACGGGGATAGAGAGTGGCGTGCAGG 

SEQ ID NO. 1902: SA61680 FROM THE H36b GBS TYPE lb STRAIN 

GTTATTAATTGAAATGCTTCTGCTCCTTGATAAATCAGCATCCCTAGACCATTATAAGCATGTTTCACTCCATTTTGTCTAACAAA 
TCGTAACAATGCTGTTtCTTTAGGCTTGTAAACCAAGTCGACAACTACTAAATTCGGTGTTAAAATTTCTGGATCGTTAATTAAAC 
TATAATTATCTAATGGCCTCATTCCTAAACTAGTAGCATCAATATAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTGTCTTA 
TTTTCTAGATAATCAACGACTACCTTTATTTGAAACTGTTTTTTAATTTTATCTGATAAGTCAATGACCTTATCGTAATTTGAGCT 
GTTACGATTAAATAATCTAATTTCCGCAACTCCCTCCATAGCTGCTTGAACTGCAACTGCTTTACCTGAACCACCAATACCAGCTA 
TTGTAATTATTTTATTTTTAGCACTGAAACCTTGAGCTGCTAAAGCTTTAAAACAACCAATGCCATCTGTCATATGGCCTACTAAA 
CGTCCGGTTCCACCTTGATTAACGATAGTATTTAGAGCACCCACTAATTTAGCTTGAGGAGATAAATCATCTAGCAAAGGGATAAC 
ACTCTGTTTAAATGGCATTGAAACATTAACACCACGAATACCCAATGCCCTGACACCTCGAACAGCTTCTGTTAATTTACCCTCTT 
CTACTTCAAATGTCAGATAGGCATAATTCATGTTTTTTTCTTGAAAAGAGGTATTCCACATTAACGGGGATAGAGAGTGGCGTGCA 
GGA 

SEQ ID NO. 1903: SAG1680 FROM THE M732 GBS TYPE III STRAIN 

CTGGTCTAATTGCCAATCCTGCACGCCACTCTCTATCCCCGTTAATGTGGAATACCTCTTTTCAAGAAAAAAACATGAATTATGCC 
TATCTGACATTTGAAGTAGAAGAGGGTAAATTAACAGAAGCTGTTCGAGGTGTCAGGGCATTGAGTATTCGTGGTGTTAATGTTTC 
AATGCCATTTAAACAGAGTGTTATCCCTTTGCTAGATGATTTATCTCCTCAAGCTAAATTAGTGGGTGCTGTAAATACTATCGTTA 
ATCAAGGTGGAACCGGACGTTTAGTAGGCCATATGACAGATGGCATTGGTTGTTTTAAAGCTTTAGCAGCTCAAGGTTTCAGTGCT 
AAAAATAAAATAATTACAATAGCTGGTATTGGTGGTTCAGGTAAAGCAGTTGCAGTTCAAGCAGCTATGGAGGGAGTTGCGGAAAT 
TAGATTATTTAATCGTAACAGCTCAAATTACGATAAGGTCATTGACTTATCAGATAAAATTAAAAAACAGTTTCAAATAAAGGTAG 
TCGTTGATTATCTAGAAAATAAGACAGCATTTAAAGACGCTATTAGAACTAGTCATTTTTATATTGATGCTACTAGTTTAGGAATG 
AGGCCATTAGATAATTATAGTTTAATTAACGATCCAGATATTTTAACACCGAATTTAGTAGTTGTCGACTT 

SEQ ID NO. 1904: SAG1680 FROM THE M781 GBS TYPE III STRAIN 

AAATCAGCATCCCTAGACATTATAAGCATGTTTCACTCCATTTTGTCTAACAAATCGTAACAATGCTGTTTCTTTAGGCTTGTAAA 
CCAAGTCGACAACTACTAAATTCGGTGTTAAAATTTCTGGATCGTTAATTAAACTATAATTATCTAATGGCCTCATTCCTAAACTA 
GTAGCATCAATATAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTGTCTTATTTTCTAGATAATCAACGACTACCTTTATTTG 
AAACTGTTTTTTAATTTTATCTGATAAGTCAATGACCTTATCGTAATTTGAGCTGTTACGATTAAATAATCTAATTTCCGCAACTC 
CCTCCATAGCTGCTTGAACTGCAACTGCTTTACCTGAACCACCAATACCAGCTATTGTAATTATTTTATTTTTAGCACTGAAACCT 
TGAGCTGCTAAAGCTTTAAAACAACCAATGCCATCTGTCATATGGCCTACTAAACGTCCGGTTCCACCTTGATTAACGATAGTATT 
TACAGCACCCACTAATTTAGCTTGAGGAGATAAATCATCTAGCAAAGGGATAACACTCTGTTTAAATGGCATTGAAACATTAACAC 
CACGAATACTCAATGCCCTGACACCTCGAACAGCTTCTGTTAATTTACCCTCTTCTACTTCAAATGTCAGATAGGCATAATTCATG 
TTTTTTTCTTGAAAAGAGGTATTCCACATTAACGGGGATAGAGAGTGGCGTGCA 

SEQ ID NO. 1905: SAG1680 FROM THE 090 GBS TYPE la STRAIN 

GTTCGAGGTGTCAGGGCATTGGGTATTCGTGGTGTTAATGTTTCAATGCCATTTAAACAGAGTGTTATCCCtTTGCTArATGATTT 
ATCTCCTCAAGCTAAATTAGTGGGTGCTGTAAATACTATCGTTAATCAAGGTGGAACCGsACGTTTAGTAGGCCATATGACAGATG 
GCATTGGTTGTTTTAAAGCTTTAGCAGCTCAAGGTTTCAGTGCTAAAAATAAAATAGTTACAATAGCTGGTATTGGTGGTTCAGGT 
AAAGCAGTTGCAGTTCAAGCAGCTATGGAGGGAGTTGCGGAAATTAGATTATTTAATCGTAATAGCTCAAATTACGATAAGGTCAT 
TGACTTATCAGATAAAATTAAAAAACAGTTTCAAATAAAGGTAGTCGTTGATTATCTAGAAAATAAGACAGCATTTAAAGACGCTA 
TTAGAACTAGTCATTTTTATATTGATGCTACTAGTTTAGGAATGArGCCATTAGATAATTATAGTTTAATTAACGATCCAGAAATT 
TTAACACCCAATTTAGTAGTTGTCGACTTGGTTTACAAGCCTAAAGAAACAGCATTGTTACGATTTGTTAGACA7VAATGGAGTGAA 
ACATGCTtATAATGGTCTAGGGATGCTGATTTATCAAGGAGCAGA 

SEQ ID NO. 1906: SAG1680 FROM THE A909 GBS TYPE la STRAIN 

CCCTAGACCATTATAATCATGTTTCACTCCATTTTGTCTAACAAATCGTAACAATGCTGTTTCTTTAGGCTTGTAAACCAAGTCGA 
CAACTACTAAATTCGGTGTTAAAATTTCTGGATCGTTAATTAAACTATAATTATCTAATGGCCTCATTCCTAAACTAGTAGCATCA 
ATATAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTGTCTTATTTTCTAGATAATCAACGACTACCTTTATTTGAAACTGTTT 
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TTTAATTTTATCTGATAAGTCAATGACCTTATCGTAATTTGAGCTGTTACGATTAAATAATCTAATTTCCGCAACTCCCTCCATAG 
CTGCTTGAACTGCAACTGCTTTACCTGAACCACCAATACCAGCTATTGTAATTATTTTATTTTTAGCACTGAAACCTTGAGCTGCT 
AAAGCTTTAAAACAACCAATGCCATCTGTCATATGGCCTACTAAACGTCCGGTTCCACCTTGATTAACGATAGTATTTACAGCACC 
CACTAATTTAGCTTGAGGAGATAAATCATCTAGCAAAGGGATAACACTCTGTTTAAATGGCATTGAAACATTAACACCACGAATAC 
CCAATGCCCTGACACCTCGAACAGCTTCTGTTAATTTACCCTCTTCTACTTCAAATGTCAGATAGGCATAATTCATGTTTTTTTCT 
TGAAAAGAGGTATTCCACATTAACGGGGATAG 

SEQ ZD NO. 1907: SAG1680 FROM THE COHl GBS TYPE Xa STRAIN 

TGCACGCCACTCTCTATCCCCGTTAATGTGGAATACCTCTTTTAAGAAAAAAACATGAATTATGCCTATCTGACATTTGAAGTAGA 
AGAGGGTAAATTAACAGAAGCTGTTCGAGGTGTCAGGGCATTGAGTATTCGTGGTGTTAATGTTTCAATGCCATTTAAACAGAGTG 
TTATCCCTTTGCTAGATGATTTATCTCCTCAAGCTAAATTAGTGGGTGCTGTAAATACT 

SEQ ID NO. 1908: SAG1680 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

ATTCGTTATTAATTGAAATGCTTCTGCTCCTTGATAAATCAGCATCCCTAGACCATTATAAGCATGTTTCACTCCATTTTGTCTAA 
CAAATCGTAACAATGCTGTTTCTTTAGGCTTGTAAACCAAGTCGACAACTACTAAATTGGGTGTTAAAATTTCTGGATCGTTAATT 
AAACTATAATTATCTAATGGCCTCATTCCTAAACTAGTAGCATCAATATAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTGT 
CTTATTTTCTAGATAATCAACGACTACCTTTATTTGAAACTGTTTTTTAATTTTATCTGATAAGTCAATGACCTTATCGTAATTTG 
AGCTATTACGATTAAATAATCTAATTTCCGCAACTCCCTCCAT/^ACTGCTTGAACTGCAACTGCTTTACCTGAACCACCAATACCA 
GCTATTGTAACTATTTT 

SEQ ID NO. 1909: SAG1680 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

ACTCTCTATCCCCGTTAATGTGGAATACCTCTTTTCAAGAAAAAAACATGAATTATGCCTATCTGACATTTGAAGTAGAAGAGGGT 
AAATTAACAGAAGCTGTTCGAGGTGTCAGGGCATTGGGTATTCGTGGTGTTAATGTTTCAATGCCATTTAAACAGAGTGTTATCCC 
TTTGCTAGATGATTTATCTCCTCAAGCTAAATTAGTGGGTGCTGTAAATACTATCGTTAATCAAGGTGGAACCGGACGTTTAGTAG 
GCCATATGACAGATGGCATTGGTTGTTTTAAAGCTTTAGCAGCTCAAGGTTTCAGTGCTAAAAATAAAATAGTTACAATAGCTGGT 
ATTGGTG 

SEQ ID NO. 1910: SAG1680 FROM THE 1169NT1 GBS TYPE V STRAIN 

ATTCGTTATTAATTGAAATGCTTCTGCTCCTTGATAAATCAGCATCCCTAGACCATTATAAGCATGTTTCACTCCATTTTGTCTAA 
CAAATCGTAACAATGCTGTTTCTTTAGGCTTGTAAACCAAGTCGACAACTACTAAATTCGGTGTTAAAATTTCTGGATCGTTAATT 
AAACTATAATTATCTAATGGCCTCATTCCTAAACTAGTAGCATCAATATAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTGT 
CTTATTTTCTAGATAATCAACGACTACCTTTATTTGAAACTGTTTTTTAATTTTATCTGATAAGTCAATGACCTTATCGTAATTTG 
AGCTGTTACGAT 

SEQ ID NO. 1911: SAG1680 FROM THE 1169NT1 GBS TYPE V STRAIN 

ACTTCTCTATTCCCCGTT7\ATGTGGAATACCTCTTTTCAAGAAAAAAACATGAATTATGCCTATCTGACATTTGAAGTAG7^AGAGG 
GTAAATTAACAGAAGCTGTTCGAGGTGTCAGGGCATTGGGTATTCGTGGTGTTAATGTTTCAATGCCATTTAAACAGAGTGTTATC 
CCTTTGCTAGATGATTTATCTCCTCAAGCTAAATTAGTGGGTGCTGTAAATACTATCGTTAATCAAGGTGGAACC 

SEQ ID NO. 1912: SAG1680 FROM THE 18RS21 GBS TYPE II STRAIN 

TCGTTATTAATTGAAATGCTTCTGCTCCTTGATAAATCATCATCCCTAGACCATTATAAGCATGTTTCACTCCATTTTGTCTAACA 
AATCGTAACAATGCTGTTTCTTTAGGCTTGTAAACCAAGTCGACAACTACTAAATTCGGTGTTAAAATTTCTGGATCGTTAATTAA 
ACTATAATTATCTAATGGCCTCATTCCTAAACTAGTAGCATCAATATAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTGTCT 
TATTTTCTAGATAATCAACGACTACCTTTATTTGAAACTGTTTTTTAATTTTATCTGATAAGTCAATGACCTTATCGTAATTTGAG 
CTGTTACGATTAAAT AATCTAAT TTCCGCAAC 

SEQ ID NO. 1913: SAG1680 FROM THE 18RS21 GBS TYPE II STRAIN 

ATGCCTATCTGACATTTGAAGTAGAAGAGGGTAAATTAACAGAAGCTGTTCGAGGTGTCAGGGCATTGGGTATTCGTGGTGTTAAT 
GTTTCAATGCCATTTAAACAGAGTGTTATCCCTTTGCTAGATGATTTATCTCCTCAAGCTAAATTAGTGGGTGCTGTAAATACTAT 
CGTTAATCAAGGTGGAACCGGACGTTTAGTAGGCCATATGACAGATGGCATTGGTTGTTTTAAAGCTTTAGCAGCTCAAGGTTTCA 
GTGCTAAAAATAAAATAATTACAATAGCTGGTATTGGTGGTTCAGGTAAAGCAGTTGCAGTTCAAGCAGCTATGGAGGGAGTTGCG 
G 

SEQ ID NO. 1914: SAG1680 FROM THE JM9130013 GBS TYPE VIII STRAIN 

CCCTAGACCATTATAAGTCATGTTTCACTCCATTTTGTCTAACAAATCGTAACAATGCTGTTTCTTTAGGCTTGTAAACCAAGTCG 
ACAACTACTAAATTGGGTGTTAAAATTTCTGGATCGTTAATTAAACTATAATTATCTAATGGCCTCATTCCTAAACTAGTAGCATC 
AATATAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTGTCTTATTTTCTAGATAATCAACGACTACCTTTATTTGAAACTGTT 
TTTTAATTTTATCTGATAAGTCAATGACCTTATCGTAATTTGAGCTATTACGATTAAATAATCTAATTTCCGCAACTCCCTCCATA 
GCTGCTTGAACTGCAACTGCTTTACCTGAACCACCAATACCAGCTATTGTAACTATTTTATTTTTAGCACTGAAACCTTGAGCTGC 
TAAAGCTTTAAAACAACCAATGCCATCTGTCAT 

SEQ ID NO. 2001: SAG1723 FROM THE COHl GBS TYPE la STRAIN 

ATCGATTCGATATTGTAGTGGCTAACGAAGAAGAAGGCGGCCAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATGCCAGGTGAT 
GTCATCAAATATAAAAATGACACCTTAACTATTAACAATAAAAAAACAGAAGAACCTTACCTCAAGGAATATACTAAATTATTTAA 
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AAAGGATAAATTACAGGAAAAATATTCGTATAACCCACTTTTCCAAGACCTAGCACAAAGCTCTACCGCTTTCACCACTGACAGCA 

ATGGCAGCAGCGAATTTACTACTGTCGTGCCTAAAGGCCACTACTATCTTGTTGGTGATGACCGAATTGTCTCTAAAGATAGTCGT 
GCCGTCGGTTCCTTCAAAA 

SEQ ID NO. 2002: SAG1680 PROM THE CJB110 6BS NONTYPEABLE STRAIN (REVERSE COMPLEMENT) 

TAAAGTTGACGGACACTCCATGGATCCAACTTTAGCTGACAAGGAACAGCTAGTAGTTCTCAAACAAACAAAT^TCAATCGATTCG 
ATATTGTAGTGGCTAACGAAGAAGAAGGCGGCCAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATGCCAGGTGATGTCATCAAA 
TATAAAAATGACACCTTAACTATTAACAATAAAAAAAC^GAAGAACCTTACCTCAAGGAATATACTAAATTATTTAAAAAGGATAA 
ATTACAGGAAAAATATTCGTATAACCCACTTTTCCAAGACCTAGCACAAAGCTCTACCGCTTTCACTACTGACAGCAATGGCAGCA 
GCGAATTTACTACTGTCGTGCCTAAAGGCCACTATTATCTTGTTGGTGATGACCGAATTGTCTCTAAAGATAGTCGTGCCGTCGGT 
CCCTTCAAAAAATCAACAATTGTGGGAG 

SEQ ID NO. 2003: SAG1680 FROM THE 18RS21 GBS TYPE II STRAIN 

TTGACGGACACTCCATGGATCCAACTTTAGCTGACAAGGAACAGCTAGTAGTTCTCAAACAAACAAAAATCAATCGATTCGATATT 

GTAGTGGCTAACGAAGAAGAAGGCGGCCAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATGCCAGGTGATGTCATCAAATATAA 

AAATGACACCTTAACTATTAACAATAAAAAAACAGAAGAACCTTACCTCAAGGAATATACTAAATTATTTAAAAAGGATAAATTAC 

AGGAAAAATATTCGTATAACCCACTTTTCCAAGACCTAGCACAAAGCTCTACCGCTTTCACCACTGACAGCAATGGCAGCAGCGAA 

TTTACTACTGTCGTGCCTAAAGGCCACTACTATCTTGTTGGTGATGACCGAATTGTCTCTAAAGATAGTCGTGCCGTCGGTCCCTT 
CAAAAAATCAACGATTGTGGGAGAGGT 

SEQ ID NO. 2004: SAG1680 FROM THE 2603 V/R GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

AAGTTGACGGACACTCCATGGATCCAACTTTAGCTGACAAGGAACAGCTAGTAGTTCTCAAACAAACAAAAATCAATCGATTCGAT 
ATTGTAGTGGCTAACGAAGAAGAAGGCGGCCAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATGCCAGGTGATGTCATCAAATA 
TAAAAATGACACCTTAACTATTAACAATAAAAAAACAGAAGAACCTTACCTCAAGGAATATACTAAATTATTTAAAAAGGATAAAT 
TACAGGAAAAATATTCGTATAACCCACTTTTCCAAGACCTAGCACAAAGCTCTACCGCTTTCACCACTGACAGCAATGGCAGCAGC 
GAATTTACTACTGTCGTGCCTAAAGGCCACTACTATCTTGTTGGTGATGACCGAATTGTCTCTAAAGATAGTCGTGCCGTCGGT 

SEQ ID NO. 2005: SAG1680 FROM THE M732 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

TTGACGGACACTCCATGGATCCAACTTTAGCTGACAAGGAACAGCTAGTAGTTCTCAAACAAACAAAATAATCGATTCGATATTGT 
AGTGGCTAACGAAGAAGAAGGCGGCCAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATGCCAGGTGATGTCATCAAATATAAAA 
ATGACACCTTAACTATTAACAATAAAAAAACAGAAGAACCTTACCTCAAGGAATATACTAAATTATTTAAAAAGGATAAATTACAG 
GAAAAATATTCGTATAACCCACTTTTCCAAGACCTAGCACAAAGCTCTACCGCTTTCACCACTGACAGCAATGGCAGCAGCGAATT 
TACTACTGTCGTGCCTAAAGGCCACTACTATCTTGTTGGTGATGACCGA 

SEQ ID NO. 2006: SAG1680 FROM THE M781 GBS TYPE III STRAIN 

TTGACGGACACTCCATGGATCCAACTTTAGCTGACAAGGAACAGCTAGTAGTTCTCAAACAAACAAAAATCAATCGATTCGATATT 

GTAGTGGCTAACGAAGAAGAAGGCGGCCAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATGCCAGGTGATGTCATCAAATATAA 

AAATGACACCTTAACTATTAACAATAAAAAAA(^GAAGAACCTTACCTCAAGGAATATACTAAATTATTTTAAAAAGGATAAATT^ 

CAGGAAAAATATTCGTATAACCCACTTTTCCAAGACCTAGCACAAAGCTCTACCGCTTTCACCACTGACAGCAATGGCAGCAGCGA 
ATTTACT 

SEQ ID NO. 2007: SAG1680 FROM THE 1169NT1 GBS TYPE V STRAIN (REVERSE COMP LEME NT) 

TTGGTAAAGTTGACGGACACTCCATGGATCCAACTTTAGCTGACAAGGAACAGCTAGTAGTTCTCAAACAAACAAAAATCAATCGA 

TTCGATATTGTAGTGGCTAACGAAGAAGAAGGCGGCCAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATGCCAGGTGATGTCAT 

CAAATATAAAAATGACACCTTAACTATTAACAATAAAAAAACAGAAGAACCTTACCTCAAGGAATATACTAAATTATTTAAAAAGG 

ATAAATTACAGGAAAAATATTCGTATAACCCACTTTTCCAAGACCTAGCACAAAGCTCTACCGCTTTCACTACTGACAGCAATGGC 

AGCAGCGAATTTACCACTGTCGTGCCTAAAGGCCACTACTATCTTGTTGGTGATGACCGAATTGTCTCTAAAGATAGTCGTGCCGT 
CGGCCCCTTCAAAAAATCAACG 




SEQ ID NO. 2009: SAG1680 FROM THE 090 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

TAAAGTTGACGGACACTCCATGGATCCAACTTTAGCTGACAAGGAACAGCTAGTAGTTCTCAAACAAACAAAAATCAATCGATTCG 
ATATTGTAGTGGCTAACGAAGAAGAAGGCGGCCAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATGCCAGGTGATGTCATCAAA 
TATAAAAATGACACCTTAACTATT AACAATAAAAAAACAGAAGAACCTT ACCTCAAGGAATATACTAAATTATTT AAAAAGG ? TAA 
ATTACAGGAAAAATATTCGTATAACCCACTTTTCCAAGACCTAGCACAAAGCTCTACCGCTTTCACTACTGACAGCAATGGCAGCA 
GCGAATTTACTACTGTCGTGCCTAAAGGCCACTATTATCTTGTTGGTGATGACCGAATTGTCTCTAAAGATAGTCGTGCCGTCGGT 

SEQ ID NO. 2010: SAG1680 FROM THE A909 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 
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AAAGTTGACGGACACTCCATGGATCCAACTTTAGCTGACAAGGAACAGCTAGTAGTTCTCAAACAAACAAAAATCAATCGATTCGA 
TATTGTAGTGGCTAACGAAGAAGAAGGCGGCCAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATGCCAGGTGATGTCATCAAAT 
ATAAAAATGACACCTTAACTATTAACAATAAAAAAACAGAAGAACCTTACCTC7\AGGAATATACTAAATTATTTAAAAAGGATAAA 
TTACAGGAAAAATATTCGTATAACCCACTTTTCCAAGACCTAGCACAAAGCTCTACCGCTTTCACCACTGACAGCAATGGCAGCAG 
CGAATTTACTACTGTCGTGCCTAAAGGCCACTACTATCTTGTTGGTGATGACCGAATTGTCTCTAAAGATAGTCGTGCCGTCGGTC 
CCTTCAAAAAATCAACG 

SEQ ID NO. 2101: SAG0079 FROM THE 2603V/R GBS TYPE V STRAIN 

AATCTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAGGTACTCAAGCAGCTAAGATCGTTGAAGAATTTGGTGTTGCTCACATCTC 
AACAGGGGATATGTTCCGCGCCGCAATGGCTAATCAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGG 
TTCCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGCAGAAAAAGGTTTTTTACTTGATGGATAT 
CCACGTACTATTGAACAAGCACACGCCTTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGT 
GGATCCATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGAAACTTTCCACAAAGTGTTCAACCCAC 
CAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTAATATTGCT 
CAAGGAGAACCTATTCTTGAACACTATCGTAAGCTTGGTCTTGTTACAGATATTGAAGGTAATCAAGAAATAACAGAAGTTTTTGC 
AGATGTTGAAAAAGCGTTG 

SEQ ID NO. 2102: SAG0079 FROM THE 090 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

AATCTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAGGTACTCAAGCAGCTAAGATCGTTGAAGAATTTGGTGTTGCTCACATCTC 
AACAGGGGATATGTTCCGCGCCGCAATGGCTAATCAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGG 
TTCCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGCAGAAAAAGGTTTTTTACTTGATGGATAT 
CCACGTACTATTGAACAAGCACACGCCTTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGT 
GGATCCATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGAAACTTTCCACAAAGTGTTCAACCCAC 
CAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTAATATTGCT 
CAAGGAGAACCTATTCTTGAACACTATCGTAAGCTTGGTCTTGTTACAGATATTGAAGGTAATCAAGAAATAACAGAAGTTTTTGC 
AGATGTTGAAAAAGCGTTGCTAGAACTCAAA 

SEQ ID NO. 2103: SAG0079 FROM THE 1169NT1 GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

TGGTAAAGGGACTCAAGCAGCTAAGATTGTTGAAGAATTTGGTGTTGCGCACATCTCAACAGGGGATATGTTCCGCGCCGCAATGG 
CTAATCAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGGTTCCTGATCAAGTAACAAACGGGATTGTA 
AAAGAGCGCTTAGCTGAGGATGATATCGCAGAAAAAGGTTTTTTACTTGATGGGTATCCACGTACTATTGAACAAGCACACGCCTT 
AGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTGGATCCATCATGTCTTATAGAGCGTTTGA 
GTGGTCGTATTATCAATCGTAAAACTGGTGAAACTTTCCACAAAGTGTTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTAT 
CAACGTGAAGATGATAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTCATATTGCTCAAGGAGAACCTATTCTTGAACACTATAG 
TAAGCTTGGCCTTGTTACAGATATTGAAGGTAATCAAGAAATAA 

SEQ ID NO. 2104: SAG0079 FROM THE 18RS21 GBS TYPE II STRAIN (REVERSE COMPLEMENT) 

AATCTTTTAACCACGGGTTCGCCTGGTGCTGGTAAAGGTACTCAAGCAGCTAAGATCGTTGAAGAATTTGGTGTTGCTCACATCTC 
AACAGGGGATATGTTCCGCGCCGCAATGGCTAATCAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGG 
TTCCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGCAGAAAAAGGTTTTTTACTTGATGGATAT 
CCACGTACTATTGAACAAGCACACGCCTTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGT 
GGATCCATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGAAACTTTCCACAAAGTGTTCAACCCAC 
CAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTAATATTGCT 
CAAGGAGAACCTATTCTTGAACACTATCGTAAGCTTGGTCTTGTTACAGATATTGAAGGTAATCAAGAAATAACAGAAGTTTTTGC 
AGATGTTGAAAAAGCGTTGCTAGAA 

SEQ ID NO. 2105: SAG0079 FROM THE 2603V/R GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

AATCTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAGGTACTCAAGCAGCTAAGATCGTTGAAGAATTTGGTGTTGCTCACATCTC 
AACAGGGGATATGTTCCGCGCCGCAATGGCTAATCAAACCGAAATGGGACGTTTAGCT7VAAAGTTATATTGATAAAGGTGAATTGG 
TTCCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGCAGAAAAAGGTTTTTTACTTGATGGATAT 
CCACGTACTATTGAACAAGCACACGCCTTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGT 
GGATCCATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGAAACTTTCCACAAAGTGTTCAACCCAC 
CAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTAATATTGCT 
CAAGGAGAACCTATTCTTGAACACTATCGTAAGCTTGGTCTTGTTACAGATATTGAAGGTAATCAAGAAATAACAGAAGTTTTTGC 
AGATGTTGAAAAAGCGTTG 

SEQ ID NO. 2106: SAG0079 FROM THE A909 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

AATCTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAGGTACTCAAGCAGCTAAGATCGTTGAAGAATTTGGTGTTGCTCACATCTC 
AACAGGGGATATGTTCCGCGCCGCAATGGCTAATCAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGG 
TTCCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGCAGAAAAAGGTTTTTTACTTGATGGATAT 
CCACGTACTATTGAACAAGCACACGCCTTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGT 
GGATCCATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGAAACTTTCCACAAAGTGTTCAACCCAC 
CAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTAATATTGCT 
CAAGGAGAATCTATTCTTGAACACTATCGAAAGCTTGGTCTTGTTACAGATATTGAAGGTAA 
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SEQ ID NO. 2107: SAGOO 7 9 FROM THE CJB110 GBS NONTYPEABLE STRAIN (REVERSE COMPLEMENT) 

AATCTTTTAACCACGGGTTTGCTTGGTGCTGGTAAAGGTACTCAAGCAGCTAAGATCGTTGAAGAATTTGGTGTTGCTCACATCTC 
AACAGGGGATATGTTCCGCGCCGCAATGGCTAATCAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGG 
TTCCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGCAGAAAAAGGTTTTTTACTTGATGGATAT 
CCACGTACTATTGAACAAGCACACGCCTTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGT 
GGATCCATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGAAACTTTCCACAAAGTGTTCAACCCAC 
CAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTAATATTGCT 
CAAGGAGAACCTATTCTTGAACACTATAG 

SEQ ID NO. 2108: SAG0079 FROM THE COHl GBS TYPE IXX STRAIN (REVERSE COMPLEMENT) 

ATCTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAGGTACTCAAGCAGCTAAGATTGTTGAAGAATTTGGTGTTGCTCACATCTCA 
ACAGGGGATATGTTCCGCGCCGCAATGGCTAATCAAACCCAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGGT 
TCCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGCAGAAAAAGGTTTTTTACTTGATGGATATC 
CACGTACTATTGAGCAAGCACACGCCTTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTG 
GATCCAACATGCCTTATAGAGCGTTTGAGTGGCCGTATTATCAATCGTAAAACTGGTGAAACTTTCCACAAAGTGTTCAACCCACC 
AGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTAATATTGCTC 
AAGGAGAACCTATTCTTGAACACTATCGTAAGCTTGGTCTTGTTACAGATATTGAAGGTAATCAAGAAATAACAGAAGTTTTTGCA 
GATGTTGAAAAAGCGTTGCTAG 

SEQ ID NO. 2109: SAG0079 FROM THE H36b GBS TRYP lb STRAIN (REVERSE COMPLEMENT) 

(^GGGGATATGTTCCGCGCCGCAATGGCTAATCAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGGTT 
CCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGCAGAAAAAGGTTTTTTACTTGATGGATATCC 
ACGTACTATTGAACAAGCACACGCCTTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTGG 
ATCCATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGAAACTTTCCACAAAGTGTTCAACCCACCA 
GTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTAATATTGCTCA 
AGGAGAATCTATTCTTGAACACTATCGTAAGCTT'GGTCTTGTTACAGATATTGAAGGTAATCAAGAAATAACAGAAGTTTTTGCAG 
ATGTTGAAAAAGCGTTGCT 

SEQ ID NO. 2110: SAG0079 FROM THE JM9130013 GBS TYPE VIII STRAIN (REVERSE COMPLEMENT) 

AATCTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAGGTACTCAAGCAGCTAAGATCGTTGAAGAATTTGGTGTTGCTCACATCTC 
AACAGGGGATATGTTCCGCGCCGCAATGGCTAATCAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGG 
TTCCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGCAGAAAAAGGTTTTTTACTTGATGGATAT 
CCACGTACTATTGAACAAGC^CACGCCTTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGT 
GGATCCATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGAAACTTTCCACAAAGTGTTCAACCCAC 
CAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCTGAAACTGTTAAACGTCGCTTGGACGTTAATATTGCT 
CAAGGAGAACCTATTCTTGAACACTATAAAAAGCTTGGTCTTGTTACAGATATTGAAGGTAATCA 

SEQ ID NO. 2111: SAG0079 FROM THE M732 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

CTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAGGTACTCAAGCAGCTAAGATTGTTGAAGAATTTGGTGTTGCTCACATCTCAAC 
AGGGGATATGTTCCGCGCCGCAATGGCTAATCAAACCCAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGGTTC 
CTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGCAGAAAAAGGTTTTTTACTTGATGGATATCCA 
CGTACTATTGAGCAAGCACACGCCTTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTGGA 
TCCAACATGCCTTATAGAGCGTTTGAGTGGCCGTATTATCAATCGTAAAACTGGTGAAACTTTCCACAAAGTGTTCAACCCACCAG 
TAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTAATATTGCTCAA 
GGAGAACCTATTCTTGAACACTATCGTAAGCTTGGTCTTGTTACAGATATTGAAGGTAATCAAGAAATAACAGAAGTTTTTGCAGA 
TGTTGAAAAAGCGTTGCTAGAACTCAAA 

SEQ ID NO. 2112: SAGO 07 9 FROM THE M781 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

AATCTTTTAATTACGGGTTTGCCTGGTGCTGGTT^AAGGTACTCAAGCAGCTAAGATTGTTGAAGAATTTGGTGTTGCTCACATCTC 
AACAGGGGATATGTTCCGCGCCGCAATGGCTAATCAAACCCAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGG 
TTCCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGCAGAAAAAGGTTTTTTACTTGATGGATAT 
CCACGTACTATTGAGCAAGCACACGCCTTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGT 
GGATCCAACATGCCTTATAGAGCGTTTGAGTGGCCGTATTATCAATCGTAAAACTGGTGAAACTTTCCACAAAGTGTTCAACCCAC 
CAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTAATATTGCT 
CAA 

>SEQ ID NO 2150:090 frame: 1 

NLLIMGLPGAGKGTQAAKIVEEEX^AHISTGDMFRAAMANQTEMGRLAKSYIDKGELVPD 
EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPSCL 
IERLSGRIINRKTGETFHBCVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGEPILEH 
YRKLGLVTDIEGNQEITEVFADVEKALLELK 

>SEQ ID NO 2151:114_1169NT frame: 2 
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GKGTQAAKIVEEFGVAHISTGDMFRAAMANQTEMGRLAKSYIDKGELVPDQVTNGIVKER 
LAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPSCLIERLSGRIIN 
RKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVHIAQGEPILEHYSKLGLVTDI 
EGNQEI 

>SEQ ID NO 2152: 114_18RS21 frame: 1 

NLLTTGSPGAGKGTQAAKIVEEFGVAHISTGDMFRAAMANQTEMGRLAKSYIDKGELVPD 
EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPSCL 
IERLSGRI INRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGEPILEH 
YRKLGLVT DIE GNQE I TE V FAD VEKALLE 

>SEQ ID NO 2153: 114_2603 frame: 1 

NLLIMGLPGAGKGTQAAKIVEEFGVAHISTGDMFRAAMANQTEMGRLAKSYIDKGELVPD 
EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPSCL 
IERLSGRI INRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVN I AQGE PI LEH 
YRKLGLVT D IEGNQE ITEVFADVEKAL 

>SEQ ID NO 2154: 114_A909 frame: 1 

NLLIMGLPGAGKGTQAAKIVEEFGVAHISTGDMFRAAMANQTEMGRLAKSYIDKGELVPD 
EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPSCL 
IERLSGRI INRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGES I LEH 
YRKLGLVT D I EG 

>SEQ ID NO 2155:114_A909 frame: 1 

NLLIMGLPGAGKGTQAAKIVEEFGVAHISTGDMFRAAMANQTEMGRLAKSYIDKGELVPD 
EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPSCL 
IERLSGRI INRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGESILEH 
YRKLGLVT DIEG 

>SEQ ID NO 2156: 114_CJB110 frame: 1 

NLLTTGLLGAGKGTQAAKIVEEFGVAHISTGDMFRAAMANQTEMGRLAKSYIDKGELVPD 
EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPSCL 
IERLSGRIINRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGEPILEH 
Y 

>SEQ ID NO 2157: 114_COHl frame: 3 

LLIMGLPGAGKGTQAAKIVEEFGVAHISTGDMFRAAMANQTQMGRLAKSYIDKGELVPDE 
VTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPTCLI 
ERLSGRIINRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGEPILEHY 
RKLGLVTDIEGNQEITEVFADVEKALL 

>SEQ ID NO 2158: 114_H36B frame: 3 

GDMFRAAMANQTEMGRLAKSYIDKGELVPDEVTNGIVKERLAEDDIAEKGFLLDGYPRTI 
EQAHALDATLEELGLRLDGVINIKVDPSCLIERLSGRIINRKTGETFHKVFNPPVDYKEE 
DYYQREDDKPETVKRRLDVNIAQGESILEHYRKLGLVTDIEGNQEITEVFADVEKAL 

>SEQ ID NO 2159: U4_JM9130013 frame: 1 

NLLIMGLPGAGKGTQAAKIVEEFGVAHISTGDMFRAAMANQTEMGRLAKSYIDKGELVPD 
EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPSCL 
IERLSGRI INRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGEPILEH 
YKKLGLVTDIEGN 

>SEQ ID NO 2160:114_M732 frame: 1 

LLIMGLPGAGKGTQAAKIVEEFGVAHISTGDMFRAAMANQTQMGRLAKSYIDKGELVPDE 
VTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPTCLI 
ERLSGRIINRICTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGEPILEHY 
RKLGLVT D I EGNQE I TE VFADVEKALLELK 

>SEQ ID NO 2161: 114_M781 frame: 1 

N LL ITGLPGAGKGTQAAKI VEE FGVAH I STGDMFRAAMANQTQMGRLAKS YI DKGELVP D 
EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPTCL 
IERLSGRIINRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQ 

SEQ ID NO. 2201: SAG0093 FROM THE 090 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 
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AAGCCTAACAGTCAACAATCATCATCTCAAAAGTTGAGGAATGAGGATATAAAAAAGATATCCTCTCAAAAAAGAAATAAGAAATT 
ACAATTACCAGCTGTATCATCAAAAGATTGGAACTTGATTTTGGTCAATCGTGACCATAAACATGAAGAATTAAGTCCAGATGTGG 
TTCCTGTTGAAAATATTTATTTGGATAAACGTATTACGAAGCAAGCTACTCAGTTTTTAGAGGCTGCTAGAGCAATTGATTCACGA 
GAACATTTAATTTCGGGTTATCGTAGTGTTGCCTATCAGGAGAAGTTGTTCAATTCTTATGTTACTCAAGAGATGACTAGTAACCC 
TAATTTGACGAGGGGACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTGCAGGTGCTAGTGAACACCAGACTGGATTAGCGA 
TGGATATGAGTACTGTAGATTCTTTGAATGAGAGCGATCCTAGAGTAGTCAGTCAGTTGT^AAAAGATAGCTCCACAATATGGTTTT 
GTCTTACGGTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCTATGTTGGGGTAGAGTCTGC 
AAAATATATGGCCAAACATCATTTAACATTAGAAGAATACATAACTTTATTAAAGGAGAATAACCAA 

SEQ ID NO. 2202: SAG0093 FROM THE 1169NT1 GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

AAGCCTAACAGTCAACAATC^TCACCTCAAAAGTTGAGGAATGAGG 

ACGATTACCAGCTGTATCATCAAAAGATTGGAACTTGATTTTGGTCAATCGTGACCATAAACATGAAGAATTAAGTCCAGATGTGG 
TGCCTGTTGAAAATATTTATTTGGATAAACGTATTACGAAGCAAGCTACTCAGTTTTTAGAGGCTGCTAGAGCAATTGATTCACGA 
GAACATTTAATTTCGGGTTATCGTAGTGTTGCCTATCAGGAGAAGTTGTTCAATTCTTATGTTACTCAAGAGATGACTAGTAACCC 
TAATTTGACGAGGGGACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTGCAGGTGCTAGTGAACACCAGACTGGATTAGCGA 
TGGATATGAGTACTGTAGATTCTTTGAATGAGAGCGATCCTAGAGTAGTCAGTCAGTTGAAAAAGATAGCTCCACAATATGGTTTT 
GTCTTACGGTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCTATGTTGGGGTAGAGTCTGC 
AAAATATATGGCCGAACATCGTTTAACATTAGAAGAATACATAACTTTATTAAAGGAGAATAACCAA 

SEQ ID NO. 2203: SAG0093 FROM THE 18RS21 GBS TYPE II STRAIN 

AAGCCTAACAGTCAACAATCATCATCTCAAAAGTTGAGGAATGAGGATATAAAAAAGATATCCTCTCAAAAAAGAAATAAGAAATT 
ACAATTACCAGCTGTATCATCAAAAGATTGGAACTTGATTTTGGTCAATCGTGACCATAAACATGAAGAATTAAGTCCAGATGTGG 
TTCCTGTTGAAAATATTTATTTGGATAAACGTATTACGAAGCAAGCTACTCAGTTTTTAGAGGCTGCTAGAGCAATTGATTCACGA 
GAACATTTAATTTCGGGTTATCGTAGTGTTGCCTATCAGGAGAAGTTGTTCAATTCTTATGTTACTCAAGAGATGACTAGTAACCC 
TAATTTGACGAGGGGACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTGCAGGTGCTAGTGAACACCAGACTGGATTAGCGA 
TGGATATGAGTACTGTAGATTCTTTGAATGAGAGCGATCCTAGAGTAGTCAGTCAGTTGAAAAAGATAGCTCCACAATATGGTTTT 
GTCTTACGGTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCTATGTTGGGGTAGAGTCTGC 
AAAATATATGGCCAAACATCATTTAACATTAGAAGAATACATAACTTTATTAAAGGAGAATAACCAA 

SEQ ID NO. 2204: SAG0093 FROM THE 2603V/R GBS TYPE V STRAIN 

ACAGTCAACAATC^TCATCTCAAAAGTTGAGGAATGAGGATATAAAAAAGATA 

CCAGCTGTATCATCAAAAGATTGGAACTTGATTTTGGTCAATCGTGACCATAAACATGAAGAATTAAGTCCAGATGTGGTTCCTGT 
TGAAAATATTTATTTGGATAAACGTATTACGAAGCAAGCTACTCAGTTTTTAGAGGCTGCTAGAGCAATTGATTCACGAGAACATT 
TAATTTCGGGTTATCGTAGTGTTGCCTATCAGGAGAAGTTGTTCAATTCTTATGTTACTCAAGAGATGACTAGTAACCCTAATTTG 
ACGAGGGGACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTGCAGGTGCTAGTGAACACCAGACTGGATTAGCGATGGATAT 
GAGTACTGTAGATTCTTTGAATGAGAGCGATCCTAGAGTAGTCAGTCAGTTGAAAAAGATAGCTCCACAATATGGTTTTGTCTTAC 
GGTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCTATGTTGGGGTAGAGTCTGCAAAATAT 
ATGGCCAAACATCATTTAACATTAGAAGAATACATAACTTTATTAAAGGAGAATAACCAAAACCCAGCTTTCTTGTACAA 

SEQ ID NO. 2205: SAG0093 FROM THE A909 GBS TYPE la STRAIN 

AAGCCTAACAGTCAACAATCATCATCTCAAAAGTTGAGGAATGAGGATATAAAAAAGACATCCTCTCAAAAAAGAAATAAGAAATT 
ACGATTACCAGCTGTATCATCAAAAGATTGGAACTTGATTTTGGTCAATCGTGACCATAAACATGAAGAATTAAGTCCAGATGTGG 
TGCCTGTTGAAAATATTTATTTGGATAAACGTATTACGAAGCAAGCTACTCAGTTTTTAGAGGCTGCTAGAGCAATTGATTCACGA 
GAACATTTAATTTCGGGTTATCGTAGTGTTGCCTATCAGGAGAAGTTGTTCAATTCTTATGTTACTCAAGAAATGACTAGTAACCC 
TAATTTGACGAAGGAACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTGCAGGTGCTAGTGAACACCAGACTGGATTAGCGA 
TGGATATGAGTACTGTAGATTCTTTGAATGAGAGCGATCCTAGAGTAGTCAGTCAGTTGAAAAAGATAGCTCCACAATATGGTTTT 
GTCTTACGGTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCTATGTTGGGGTAGAGTCTGC 
AAAATATATGGCCAAACATCATTTAACATTAGAAGAATACATAACTTTATTAAAGGAGAATAACCAA 

SEQ ID NO. 2206: SAG0093 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

AAGCCTAACAGTCAACAATCATCATCTCAAAAGTTGAGGAATGAGGATATAAAAAAGATATCCTCTCAAAAAAGAAATAAGAAATT 
TACAATTACCAGCTGTATCATCAAAAGATTGGAACTTGATTTTGGTCAATCGTGACCATAAACATGAAGAATTAAGTCCAGATGTG 
GTTCCTGTTGAAAATATTTATTTGGATAAACGTATTACGAAGCAAGCTACTCAGTTTTTAGAGGCTGCTAGAGCAATTGATTCACG 
AGAACATTTAATTTCGGGTTATCGTAGTGTTGCCTATCAGGAGAAGTTGTTCAATTCTTATGTTACTCAAGAGATGACTAGTAACC 
CTAATTTGACGAGGGGACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTGCAGGTGCTAGTGAACACCAGACTGGATTAGCG 
ATGGATATGAGTACTGTAGATTCTTTGAATGAGAGCGATCCTAGAGTAGTCAGTCAGTTGAAAAAGATAGCTCCACAATATGGTTT 
TGTCTTACGGTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCTATGTTGGGGTAGAGTCTG 
CAAAATATATGGCCAAACATCATTTAACATTAGAAGAATACATAACTTTATTAAAGGAGAATAACCAA 

SEQ ID NO. 2207: SAG0093 FROM THE COHl GBS TYPE III STRAIN 
CCTAACAGTCAACAATCATCATCTCAAAAGTTGAGGAATGAGGATATAAAAAAGAC 

GATTACCAGCTGTATCATCAAAAGATTGGAACTTGATTTTGGTCAATCGTGACCATAAACATGAAGAATTAAGTCCAGATGTGGTG 
CCTGTTGAAAATATTTATTTGGATAAACGTATTACGAAGCAAGCTACTCAGTTTTTAGAGGCTGCTAGAGCAATTGATTCACGAGA 
ACATTTAATTTCGGGTTATCGTAGTGTTGCCTATCAGGAGAAGTTGTTCAATTCTTATGTTACTCAAGAGATGACTAGTAACCCTA 
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ATTTGACGAGGGGACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTGCAGGTGCTAGTGAACACCAGACTGGATTAGCGATG 
GATATGAGTACTGTAGATTCTTTGAATGAGAGCGATCCTAGAGTAGTCAGTCAGTTGAAAAAGATAGCTCCACAATATGGTTTTGT 
CTTACGGTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCTATGTTGGGGTAGAGTCTGCAA 
AATATATGGTCAAACATCATTTAACATTAGAAGAATACATAACTTTATTAAAGGAGAATAACCAAAACCCAGCTTTCTTGTACAA 

SEQ ID NO. 2208: SAG0093 FROM THE H36b GBS TYPE lb STRAIN 

AAGCCTAACAGTCAACAATCATCATCTCAAAAGTTGAGGAATGAGGATATAAAAAAGACATCCTCTCAT^AAAAGAAATAAGAAATT 
ACGATTACCAGCTGTATCATCAAAAGATTGGAACTTGATTTTGGTCAATCGTGACCATAAACATGAAGAATTAAGTCCAGATGTGG 
TGCCTGTTGAAAATATTTATTTGGATAAACGTATTACGAAGCAAGCTACTCAGTTTTTAGAGGCTGCTAGAGCAATTGATTCACGA 
GAACATTTAATTTCGGGTTATCGTAGTGTTGCCTATCAGGAGAAGTTGTTCAATTCTTATGTTACTCAwGAAATGACTAGTAACCC 
TAATTTGACGAAGGAACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTGCAGGTGCTAGTGAACACCAGACTGGATTAGCGA 
TGGATATGAGTACTGTAGATTCTTTGAATGAGAGCGATCCTAGAGTAGTCAGTCAGTTGAAAAAGATAGCTCCACAATATGGTTTT 
GTCTTACGGTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCTATGTTGGGGTAGAGTCTGC 
AAAATATATGGCCAAACATCATTTAACATTAGAAGAATACATAACTTTATTAAAGGAGAATAACCAA 

SEQ ID NO. 2209: SAG0093 FROM THE JM9130013 GBS TYPE VIII STRAIN 

AAGCCTAACAGTCAACAATCATCATCTCAAAAGTTGAGGAATGAGGATATAAAAAAGATATCCTCTCAAAAAAGAAATAAGAAATT 
ACAATTACCAGCTGTATCATCAAAAGATTGGAACTTGATTTTGGTCAATCGTGACCATAAACATGAAGAATTAAGTCCAGATGTGG 
TTCCTGTTGAAAATATTTATTTGGATAAACGTATTACGAAGCAAGCTACTCAGTTTTTAGAGGCTGCTAGAGCAATTGATTCACGA 
GAACATTTAATTTCGGGTTATCGTAGTGTTGCCTATCAGGAGAAGTTGTTCAATTCTTATGTTACTCAAGAGATGACTAGTAACCC 
TAATTTGACGAGGGGACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTGCAGGTGCTAGTGAACACCAGACTGGATTAGCGA 
TGGATATGAGTACTGTAGATTCTTTGAATGAGAGCGATCCTAGAGTAGTCAGTCAGTTGAAAAAGATAGCTCCACAATATGGTTTT 
GTCTTACGGTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCTATGTTGGGGTAGAGTCTGC 
AAAATATATGGCCAAACATCATTTAACATTAGAAGAATACATAACTTTATTAAAGGAGAATAACCAA 

SEQ ID NO. 2210: SAG0093 FROM THE M732 GBS TYPE III STRAIN 

AGCCTAACAGTCAACAATCATCATCTCAAAAGTTGAGGAATGAGGATATAAAAAAGACATCCTCTCAAAAAAGAAATAAGAAATTA 
CGATTACCAGCTGTATCATCAAAAGATTGGAACTTGATTTTGGTCAATCGTGACCATAAACATGAAGAATTAAGTCCAGATGTGGT 
GCCTGTTGAAAATATTTATTTGGATAAACGTATTACGAAGCAAGCTACTCAGTTTTTAGAGGCTGCTAGAGCAATTGATTCACGAG 
AACATTTAATTTCGGGTTATCGTAGTGTTGCCTATCAGGAGAAGTTGTTCAATTCTTATGTTACTCAAGAGATGACTAGTAACCCT 
AATTTGACGAGGGGACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTGCAGGTGCTAGTGAACACCAGACTGGATTAGCGAT 
GGATATGAGTACTGTAGATTCTTTGAATGAGAGCGATCCTAGAGTAGTCAGTCAGTTGAAAAAGATAGCTCCACAATATGGTTTTG 
TCTTACGGTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCTATGTTGGGGTAGAGTCTGCA 
AAATATATGGTCAAACATCATTTAACATTAGAAGAATACATAACTTTATTAAAGGAGAATAACCAAAACCCAGCTTTCTT 

SEQ ID NO. 2211: SAG0093 FROM THE M781 GBS TYPE III STRAIN 

AAGCCTAACAGTCAACAATCATCATCTCAAAAGTTGAGGAATGAGGAT AT AAAAAAGACATCCT CT CAAAAAAGAAATAAGAAATT 
ACGATTACCAGCTGTATCATCAAAAGATTGGAACTTGATTTTGGTCAATCGTGACCATAAACATGAAGAATTAAGTCCAGATGTGG 
TGCCTGTTGAAAATATTTATTTGGATAAACGTATTACGAAGCAAGCTACTCAGTTTTTAGAGGCTGCTAGAGCAATTGATTCACGA 
GAACATTTAATTTCGGGTTATCGTAGTGTTGCCTATCAGGAGAAGTTGTTCAATTCTTATGTTACTCAAGAGATGACTAGTAACCC 
TAATTTGACGAGGGGACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTGCAGGTGCTAGTGAACACCAGACTGGATTAGCGA 
TGGATATGAGTACTGTAGATTCTTTGAATGAGAGCGATCCTAGAGTAGTCAGTCAGTTGAAAAAGATAGCTCCACAATATGGTTTT 
GTCTTACGGTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCTATGTTGGGGTAGAGTCTGC 
AAAATATATGGTCAAACATCATTTAACATTAGAAGAATACATAACTTTATTAAAGGAGAATAACCAA 

>SEQ ID NO 2250: 18_090 frame: 1 

KPNSQQSSSQKLRNEDIKKISSQKRNKKLQLPAVSSKDWNLILVNRDHKHEELSPDWPV 
ENIYLDKRITKQATQFLEAARAIDSREHLISGYRSVAYQEKLFNSYVTQEMTSNPNLTRG 
QAEKLVKTYSQPAGASEHQTGLAMDMSTVDSLNESDPRWSQLKKIAPQYGFVLRFPDGK 
TAETGVGYEDWHYRYVGVESAKYMAKHHLTLEEYITLLKENNQ 

>SEQ ID NO 2251: 18_1169NT frame: 1 

KPNSQQS S PQKLRNEDI KKI S SQKRNKKLRLPAVS SKDWNLILVNRDHKHEELS PDWPV 
ENIYLDKRITKQATQFLEAARAIDSREHLISGYRSVAYQEKLFNSYVTQEMTSNPNLTRG 
QAEKLVKTYSQPAGASEHQTGLAMDMSTVDSLNESDPRVVSQLKKIAPQYGFVLRFPDGK 
TAETGVGYEDWHYRYVGVESAKYMAEHRLTLEEYITLLKENNQ 

>SEQ ID NO 2252: 18_18RS21 frame: 1 

KPNSQQSSSQKLRNEDIKKISSQKRNKKLQLPAVSSKDWNLILVNRDHKHEELSPDWPV 
ENIYLDKRITKQATQFLEAARAIDSREHLISGYRSVAYQEKLFNSYVTQEMTSNPNLTRG 
QAEKLVKTYSQPAGASEHQTGLAMDMSTVDSLNESDPRWSQLKKIAPQYGFVLRFPDGK 
TAETGVG YE DWHYRYVGVE S AKYMAKHHLTLEE Y IT LLKENNQ 

>SEQ ID NO 2253: 18_2603 frame: 3 
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SQQSSSQKLRNEDIKKISSQKRNKKLQLPAVSSKDWNLILVNRDHKHEELSPDVVPVENI 
YLDKRITKQATQFLEAARAIDSREHLISGYRSVAYQEKLFNSYVTQEMTSNPNLTRGQAE 
KLVKTYSQPAGASEHQTGLAMDMSTVDSLNESDPRWSQLKKIAPQYGFVLRFPDGKTAE 
TGVGYEDWHYRYVGVESAKYMAKHHLTLEEYITLLKENNQNPAFLY 

>SEQ ID NO 2254: 18_A909 frame: 1 

KPNSQQSSSQKLRNEDIKKTSSQBCRNBCKLRLPAVSSKDWNLILVNRDHKHEELSPDWPV 
ENIYLDKRITKQATQFLEAARAIDSREHLISGYRSVAYQEKLFNSYVTQEMTSNPNLTKE 
QAEKLVKTYSQPAGASEHQTGLAMDMSTVDSLNESDPRWSQLKKIAPQYGFVLRFPDGK 
TAETGVG YE DWHYRYVGVE S AKYMAKHHLTLEE Y IT LLKENNQ 

>SEQ ID NO 2255:18_CJB110 frame: 1 

KPNSQQSSSQKLRNEDIKKISSQKRNKKFTITSCIIKRLELDFGQS 

>SEQ ID NO 2256:18_COHl frame: 1 

PNSQQS S SQKLRNE DIKKT S SQKRN 

>SEQ ID NO 2257: 18_H36B frame: 1 

KPNSQQSSSQKLRNEDIKKTSSQKRNKKLRLPAVSSKDWNLILVNRDHKHEELSPDWPV 
ENIYLDKRITKQATQFLEAARAIDSREHLISGYRSVAYQEKLFNSYVTXEMTSNPNLTKE 
QAEKLVKTYSQPAGASEHQTGLAMDMSTVDSLNESDPRWSQLKKIAPQYGFVLRFPDGK 
T AETGVG YE DWHYRYVGVE SAKYMAKHHIiTLEEYITLLKENNQ 

>SEQ ID NO 2258: 18_JM9130013 frame: 1 

KPNSQQSSSQKLRNEDIKKISSQKRNKKLQLPAVSSKDWNLILVNRDHKHEELSPDVVPV 
ENIYLDKRITKQATQFLEAARAIDSREHLISGYRSVAYQEKLFNSYVTQEMTSNPNLTRG 
QAEKLVKTYSQPAGASEHQTGLAMDMSTVDSLNESDPRWSQLKKIAPQYGFVLRFPDGK 
TAETGVG YE DWHYRYVGVE S AKYMAKHHLTLEE YITLLKENNQ 

>SEQ ID NO 2259:18_M732 frame: 3 

PNSQQSSSQKLRNEDIKKTSSQKRNKKLRLPAVSSKDWNLILVNRDHKHEELSPDWPVE 
NIYLDKRITKQATQFLEAARAIDSREHLISGYRSVAYQEKLFNSYVTQEMTSNPNLTRGQ 
AEKLVKTYSQPAGASEHQTGLAMDMSTVDSLNESDPRWSQLKKIAPQYGFVLRFPDGKT 
AETGVGYE DWHYRYVGVE S AKYMVKHHLTLEE YIT LLKENNQN PAF 



>SEQ ID NO 2260: 18_M781 frame: 1 

KPNSQQSSSQKLRNEDIKKTSSQKRNKKLRLPAVSSKDWNLILVNRDHKHEELSPDWPV 
ENI YLDKRITKQATQFLEAARAI DSREHLI SGYRS VAYQEKLFNSYVTQEMTSNPNLTRG 
QAEKLVKTYSQPAGASEHQTGLAMDMSTVDSLNESDPRWSQLEOCIAPQYGFVLRFPDGK 
TAETGVGYEDWHYRYVGVESAKYMVKHHLTLEEYITLLKENNQ 

SEQ ID NO. 2301: SAG0163 FROM THE 090 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

GGCAGTAGAAGTAAATGCTCAAGATATTTATATCATTCCCAAAGGTGATTGTTATGAACTCTATATGCGTATTGATGATGAAAGGC 
GGTTTATTGATGTTTTTGAGTTTAATAGGATGGCTAGTCTTATTAGTCACTTTAAATTTGTGGCAGGCATGAACGTTGGAGAAAAA 
AGACGAAGTCAATTAGGTTCTTGTGACTATGAACTGTCAGAGGGT^AGACTGGTTTCATTACGACTATCGAGTGTGGGAGATTATCG 
TGGTCAAGAATCTTTAGTTATTCGTATTTTGTATTCAGGTCATCAGGACTTAAAATATTGGTTTGATAATATAAAGCAAATGAAGG 
AAGTACTGGGTACAAGAGGGCTATATCTTTTTTCCGGCCCTGTGGGGAGTGGTAAAACAACTCTCATGTATCAATTAGCTTCAGAA 
GTATTTAAAAATAAGCAAATTATCACGATTGAAGATCCGGTAGAAATCAAGAATGACAAGATGTTACAACTCCAATTGAATGAGGA 
TATTGGAATGACTTATGATGCTTTAATCAAACTGTCTTTACGGCATCGTCCAGATATTTTAATTATCGGAGAGATTAGAGATCAAG 
CGACGGCCCGTGCTGTTATTCGTGCAAGTTTAACGGGAGTGATGGTTTTTTCTACTATTCATGCTAAAAGTATTTCCGGAGTCTAT 
GATAGGCTTATAGAATTAGGGGTTAACTATCAAGAGTTAGAAAATAGTCTAAAATTAATAGCATATCAACGTTTAATTGGAGGAGG 
AAGCCTAATTGACTTTGAGACAGGTAACJTTAAAAAACACTCATCAGACAAGTGGAATAGACT^AGTGGATATCTTGGCTGAAGAAG 
GACATATCAGTAAGAAACAGGCACAAGTCGAAAAAATTATCCCTCAAGAAACAACGGAAAGTAGTCCAACTTTT 

SEQ ID NO. 2302: SAG0163 FROM THE 1169NT1 GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

GGTGATTGTTATGAAACCTCTACTATTGCGTATTTGATGATGAAAGGCGGTTTATTGATGTTTTTGAGTTTAATAGGATGGCTAGT 
CTTATTAGTCACTTTAAATTTGTGGCAGGCATGAACGTTGGAGAAAAAAGACGAAGTCAATTAGGTTCTTGTGACTATGAACTGTC 
AGAGGGAAGACTGGTTTCATTACGACTATCGAGTGTGGGAGATTATCGTGGTCAAGAATCTTTAGTTATTCGTATTTTGTATTCAG 
GTCATCAGGACTTAAAATATTGGTTTGATAATATAAAGCAAATGAAGGAAGTACTGGGTACAAGAGGGCTATATCTTTTTTCCGGC 
CCTGTGGGGAGTGGTAAAACAACTCTCATGTATCAATTAGCTTCAGAAGTATTTAAAAATAAGCAAATTATCACGATTGAAGATCC 
GGTAGAAATCAAGAATGACAAGATGTTACAACTCCAATTGAATGAGGATATTGGAATGACTTATGATGCTTTAATCAAACTGTCTT 
TACGGCATCGTCCAGATATTTTAATTATCGGAGAGATTAGAGATCAAGCGACGGCTCGTGCTGTTATTCGTGCAAGTTTAACGGGA 
GTGATGGTTTTTTCTACTATTCATGCTAAAAGTATTCCCGGAGTCTATGATAGGCTTATAGAATTAGGGGTTAACTATCAAGAGTT 
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AGAAAATAGTCTAAAATTAATAGCATATCAACGTTTAATTGGAGGAGGAAGCCTAATTGACTTTGAGACAAGTAACTTTAAAAAAC 
ACTCATCAGACAAGTGGAATAGACAAGTGGATATCTTGGCTGAAGAAGGATATATCAGTAAGAAACAGGCACAAGTCGAAAAAATT 
ATCCCTCAAGAAACAACGGAAAGTAGTCCAACTTTT 

SBQ ID NO. 2303: SA60163 FROM THE 18RS21 GBS TYPE II STRAIN (REVERSE COMPLEMENT) 

GTTCAATCATTAGCAAAGCAAGTCATTCATCAGGCAGTAGAAGTAAATGCTCAAGATATTTATATCATTCCCAAAGGTGATTGTTA 
TGAACTCTATATGCGTATTGATGATGAAAGGCGGTTTATTGATGTTTTTGAGTTTAATAGGATGGCTAGTCTTATTAGTCACTTTA 
AATTTGTGGCAGGCATGAACGTTGGAGAAAAAAGACGAAGTCAATTAGGTTCTTGTGACTATGAACTGTCAGAGGGAAGACTGGTT 
TCATTACGACTATCGAGTGTGGGAGATTATCGTGGTCAAGAATCTTTAGTTATTCGTATTTTGTATTCAGGTCATCAGGACTTAAA 
ATATTGGTTTGATAATATAAAGCAAATGAAGGAAGTACTGGGTATAAGAGGGCTATATCTTTTTTCCGGCCCTGTGGGGAGTGGTA 
AAACAACTCTCATGTATCAATTAGCTTCAGAAGTATTTAAAAATAAGCAAATTATCACGATTGAAGATCCGGTAGAAATCAAGAAT 
GACAAGATGTTACAACTCCAATTGAATGAGGATATTGGAATGACTTATGATGCTTTAATCAAACTGTCTTTACGGCATCGTCCAGA 
TATTTTAATTATCGGAGAGATTAGAGATCAAGCGACGGCCCGTGCTGTTATTCGTGCAAGTTTAACGGGAGTGATGGTTTTTTCTA 
CTATTCATGCTAAAAGTATTCCCGGAGTCTATGATAGGCTTATAGAATTAGGGGTTAACTATCAAGAGTTAGAAAATAGTCTAAAA 
TTAATAGCATATCAACGTTTAATTGGAGGAGGAAGCCTAATTGACTTTGAGACAGGTAATTTTAAAAAACACTCATCAGACAAGTG 
GAATAGACAAGTGGATATCTTGGCTGAAGAAGGACATATCAGTAAGAAACAGGCACAAGTCGAAAAAATTATCCCTCAAGAAACAA 
CGGAAAGTAGTCCAACTTTT 

SEQ ID NO. 2304: SAG0163 FROM THE 2603 V/R GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

GATATTTATATCATTCCCAAAGGTGATTGTTATGAACTCTATATGCGTATTGATGATGAAAGGCGGTTTATTGATGTTTTTGAGTT 
TAATAGGATGGCTAGTCTTATTAGTCACTTTAAATTTGTGGCAGGCATGAACGTTGGAGAAAAAAGACGAAGTCAATTAGGTTCTT 
GTGACTATGAACTGTCAGAGGGAAGACTGGTTTCATTACGACTATCGAGTGTGGGAGATTATCGTGGTCAAGAATCTTTAGTTATT 
CGTATTTTGTATTCAGGTCATCAGGACTTAAAATATTGGTTTGATAATATAAAGCAAATGAAGGAAGTACTGGGTATAAGAGGGCT 
ATATCTTTTTTCCGGCCCTGTGGGGAGTGGTAAAACAACTCTCATGTATCAATTAGCTTCAGAAGTATTTAAAAATAAGCAAATTA 
TCACGATTGAAGATCCGGTAGAAATCAAGAATGACAAGATGTTACAACTCCAATTGAATGAGGATATTGGAATGACTTATGATGCT 
TTAATCAAACTGTCTTTACGGCATCGTCCAGATATTTTAATTATCGGAGAGATTAGAGATCAAGCGACGGCCCGTGCTGTTATTCG 
TGCAAGTTTAACGGGAGTGATGGTTTTTTCTACTATTCATGCTAAAAGTATTCCCGGAGTCTATGATAGGCTTATAGAATTAGGGG 
TTAACTATCAAGAGTTAGAAAATAGTCTAAAATTAATAGCATATCAACGTTTAATTGGAGGAGGAAGCCTAATTGACTTTGAGACA 
GGTAATTTTAAAAAACACTCATCAGACAAGTGGAATAGACAAGTGGATATCTTGGCTGAAGAAGGACATATCAGTAAGAAACAGGC 
ACAAGTGCGAAAAAATTATCCCTCAAGAAACAACGGAAAGTAGTCCAACTTTT 

SEQ ID tfO. 2305: SAG0163 FROM THE A909 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

GTTCAATCATTAGCAAAGCAAGTCATTCATCAGGCAGTAGAAGTAAATGCTCAAGATATTTATATCATTCCCAAAGGTGATTGTTA 
TGAACTCTATATGCGTATTGATGATGAAAGGCGGTTTATTGATGTTTTTGAGTTTAATAGGATGGCTAGTCTTATTAGTCACTTTA 
AATTTGTGGCAGGCATGAACGTTGGAGAAAAAAGACGAAGTCAATTAGGTTCTTGTGACTATGAACTGTCAGAGGGAAGACTGGTT 
TCATTACGACTATCGAGTGTGGGAGATTATCGTGGTCAAGAATCTTTAGTTATTCGTATTTTGTATTCAGGTCATCAGGACTTAAA 
ATATTGGTTTGATAATATAAAGCAAATGAAGGAAGTACTGGGTATAAGAGGGCTATATCTTTTTTCCGGCCCTGTGGGGAGTGGTA 
AAACAACTCTCATGTATCAATTAGCTTCAGAAGTATTTAAAAATAAGCAAATTATCACGATTGAAGATCCGGTAGAAATCAAGAAT 
GACAAGATGTTACAACTCCAATTGAATGAGGATATTGGAATGACTTATGATGCTTTAATCAAACTGTCTTTACGGCATCGTCCAGA 
TATTTTAATTATCGGAGAGATTAGAGATCAAGCGACGGCCCGTGCTGTTATTCGTGCAAGTTTAACGGGAGTGATGGTTTTTTCTA 
CTATTCATGCTAAAAGTATTCCCGGAGTCTATGATAGGCTTATAGAATTAGGGGTTAACTATCAAGAGTTAGAAAATAGTCTAAAA 
TTAATAGCATATCAACGTTTAATTGGAGGAGGAAGCCTAATTGACTTTGAGACAGGTAATTTTAAAAAACACTCATCAGACAAGTG 
GAATAGACAAGTGGATATCTTGGCTGAAGAAGGACATATCAGTAAGAAACAGGCACAAGTCGAAAAAATTATCCCTCAAGAAACAA 
CGGAAAGTAGTCCAACTTTT 

SEQ ID NO. 2306: SAG0163 FROM THE CJB110 GBS NONTYPEABLE STRAIN (REVERSE COMPLEMENT) 

GTTCAATCATTAGCAAAGCAAGTCATTCATCAGGCAGTAGAAGTAAATGCTCAAGATATTTATATCATTCCCAAAGGTGATTGTTA 
TGAACTCTATATGCGTATTGATGATGAAAGGCGGTTTATTGATGTTTTTGAGTTTAATAGGATGGCTAGTCTTATTAGTCACTTTA 
AATTTGTGGCAGGCATGAACGTTGGAGAAAAAAGACGAAGTCAATTAGGTTCTTGTGACTATGAACTGTCAGAGGGAAGACTGGTT 
TCATTACGACTATCGAGTGTGGGAGATTATCGTGGTCAAGAATCTTTAGTTATTCGTATTTTGTATTCAGGTCATCAGGACTTAAA 
ATATTGGTTTGATAATATAAAGCAAATGAAGGAAGTACTGGGTACAAGAGGGCTATATCTTTTTTCCGGCCCTGTGGGGAGTGGTA 
AAACAACTCTC^TGTATCAATTAGCTTCAGAAGTATTTAAAAATAAGCAAATTATCACGATTGAAGATCCGGTAGAAATCAAGAAT 
GACAAGATGTTACAACTCCAATTGAATGAGGATATTGGAATGACTTATGATGCTTTAATCAAACTGTCTTTACGGCATCGTCCAGA 
TATTTTAATTATCGGAGAGATTAGAGATCAAGCGACGGCCCGTGCTGTTATTCGTGCAAGTTTAACGGGAGTGATGGTTTTTTCTA 
CTATTCATGCTAAAAGTATTTCCGGAGTCTATGATAGGCTTATAGAATTAGGGGTTAACTATCAAGAGTTAGAAAATAGTCTAAAA 
TTAATAGCATATCAACGTTTAATTGGAGGAGGAAGCCTAATTGACTTTGAGACAGGTAACTTTAAAAAACACTCATCAGACAAGTG 
GAATAGACAAGTGGATATCTTGGCTGAAGAAGGACATATCAGTAAGAAACAGGCACAAGTCGAAAAAATTATCCCTCAAGAAACAA 
CGGAAAGTAGTCCAACTTTT 

SEQ ID NO. 2307: SAG0X63 FROM THE COH1 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

AGGTGATTGTTATGAAATTCTATATGCGTATTGATGATGAAAGGCGGTTTATTGATGTTTTTGAGTTTAATAGGATGGCTAGTCTT 
ATTAGTCACTTTAAATTTGTGGCAGGCATGAACGTTGGAGAAAAAAGACGAAGTCAATTAGGTTCTTGTGACTATGAACTGTCAGA 
GGGAAGACTGGTTTCATTACGACTATCAAGTGTGGGAGATTATCGTGGTCAAGAATCTTTAGTTATTCGTACTTTGTATTCAGGTC 
ATCAGGACTTAAAATATTGGTTTGATAATATAAAGTAAATGAAGGAAGTACTGTGTGCAAGAGGGCTATATCTTTTTTCCGGCCCT 
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GTGGGGAGTGGTAAAACAACTCTCATGTATCAATTAGCTTCAGAAGTATTTAAAAATAAGCAAATTATCACGATTGAAGATCCGGT 
AGAAATCAAGAATGACAAGATGTTACAACTCCAATTGAATGAGGATATTGGAATGACTTATGATGCTTTAATCAAACTGTCTTTAC 
GGCATCGTCCAGATATTTTAATTATCGGAGAGATTAGAGATCAAGCGACGGCCCGTGCTGTTATTCGTGCAAGTTTAACGGGAGTA 
ATGGTTTTTTCTACTATTCATGCTAAAAGTATTCCCGGAGTCTATGATAGGCTTATAGAATTAGGG6TTAACTATCAAGAGTTAGA 
AAATAGTCTAAAATTAATAGCATATCAACGTTTAATTGGAGGAGGAAGCCTAATTGACTTTGAGACAAGTAACTTTAAAAAACACT 
CATCAGACAAGTGGAATAGACAAGTGGATATCTTGGCTGAAGAAGGACATATCAGTAAGAAACAGGCACAAGTCGAAAAAATTATC 
CCTCAAGAAACAACGGAAAGTAGTCCAACTTTT 

SEQ ID NO. 2308: SAGO 163 FROM THE B36b GBS TYPE lb STRAIN (REVERSE COMPLEMENT) 

TCATTAGCAAAGCAAGTCATTCATCAGGCAGTAGAAGTAAATGCTCAAGATATTTATATCATTCCCAAAGGTGATTGTTATGAACT 
CTATATGCGTATTGATGATGAAAGGCGGTTTATTGATGTTTTTGAGTTTAATAGGATGGCTAGTCTTATTAGTCACTTTAAATTTG 
TGGCAGGCATGAACGTTGGAGAAAAAAGACGAAGTCAATTAGGTTCTTGTGACTATGAACTGTCAGAGGGAAGACTGGTTTCATTA 
CGACTATCGAGTGTGGGAGATTATCGTGGTCAAGAATCTTTAGTTATTCGTATTTTGTATTCAGGTCATCAGGACTTAAAATATTG 
GTTTGATAATATAAAGCAAATGAAGGAAGTACTGGGTATAAGAGGGCTATATCTTTTTTCCGGCCCTGTGGGGAGTGGTAAAACAA 
CTCTCATGTATCAATTAGCTTCAGAAGTATTTAAAAATAAGCAAATTATCACGATTGAAGATCCGGTAGAAATCAAGAATGACAAG 
ATGTTACAACTCCAATTGAATGAGGATATTGGAATGACTTATGATGCTTTAATCAAACTGTCTTTACGGCATCGTCCAGATATTTT 
AATTATCGGAGAGAAATAGAGATCAAGCGACGGCCCGTGCTGTTATTCGTGCAAGTTTAACGGGAGTGATGTTTTTTTCTACTATT 
CATGCTAAAAGTATTCCCGGAGTCTATGATAGGCTTATAGAATTAGGGGTTAACTATCAAGAGTTAGAAAATAGTCTAAAATTAAT 
AGCATATCAACGTTTAATTGGAGGAGGAAGCCTAATTGACTTTGAGACAGGTAATTTTAAAAAACACTCATCAGACAAGTGGAATA 
GACAAGTGGATATCTTGGCTGAAGAAGGACATATCAGTAAGAAACAGGCACAAGTCGAAAAAATTATCCCTCAAGAAACAACGGAA 
AGTAGTCCAACTTTT 

SEQ XD NO. 2309: SAG0163 FROM THE JM9130013 GBS TYPE VIII STRAIN (REVERSE COMPLEMENT) 

GTTCAATCATTAGCAAAGCAAGTCATTCATCAGGCAGTAGAAGTAAATGCTCAAGATATTTATATCATTCCCAAAGGTGATTGTTA 
TGAACTCTATATGCGTATTGATGATGAAAGGCGGTTTATTGATGTTTTTGAGTTTAATAGGATGGCTAGTCTTATTAGTCACTTTA 
AATTTGTGGCAGGCATGAACGTTGGAGAAAAAAGACGAAGTCAATTAGGTTCTTGTGACTATGAACTGTCAGAGGGAAGACTGGTT 
TCATTACGACTATCGAGTGTGGGAGATTATCGTGGTCAAGAATCTTTAGTTATTCGTATTTTGTATTCAGGTCATCAGGACTTAAA 
ATATTGGTTTGATAATATAAAGCAAATGAAGGAAGTACTGGGTATAAGAGGGCTATATCTTTTTTCCGGCCCTGTGGGGAGTGGTA 
AAACAACT CT CAT GT AT C AAT T AGCT T C AGAAGT AT T T AAAAAT AAGCAAATT AT CACG AT T GAAGAT CCG GT AG AAAT CAAG AAT 
GACAAGATGTTACAACTCCAATTGAATGAGGATATTGGAATGACTTATGATGCTTTAATCAAACTGTCTTTACGGCATCGTCCAGA 
TATTTTAATTATCGGAGAGATTAGAGATCAAGCGACGGCCCGTGCTGTTATTCGTGCAAGTTTAACGGGAGTGATGGTTTTTTCTA 
CTATTCATGCTAAAAGTATTCCCGGAGTCTATGATAGGCTTATAGAATTAGGGGTTAACTATCAAGAGTTAGAAAATAGTCTAAAA 
TTAATAGCATATCAACGTTTAATTGGAGGAGGAAGCCTAATTGACTTTGAGACAGGTAATTTTAAAAAACACTCATCAGACAAGTG 
GAATAGACAAGTGGATATCTTGGCTGAAGAAGGACATATC^GTAAGAAACAGGCAC^^GTCGAAAAAATTATCCCTCAAGAAACAA 
CGGAAAGTAGTCCAACTTTT 

SEQ ID NO. 2310: SAGO 163 FROM THE M732 GBS TYPE IXX STRAIN (REVERSE COMPLEMENT) 

TGACTTGTTATGAAACTCTATATGCGTATTTGATGATGAAAAGGCGGTTTATTGATGTTTTTGAGTTTAATAGGATGGCTAGTCTT 
ATTAGTCACTTTAAATTTGTGGCAGGCATGAACGTTGGAGAAAAAAGACGAAGTCAATTAGGTTCTTGTGACTATGAACTGTCAGA 
GGGAAGACTGGTTTCATTACGACTATCAAGTGTGGGAGATTATCGTGGTCAAGAATCTTTAGTTATTCGTACTTTGTATTCAGGTC 
ATCAGGACTTAAAATATTGGTTTGATAATATAAAGTAAATGAAGGAAGTACTGTGTGCAAGAGGGCTATATCTTTTTTCCGGCCCT 
GTGGGGAGTGGTAAAACAACTCTCATGTATCAATTAGCTTCAGAAGTATTTAAAAATAAGCAAATTATCACGATTGAAGATCCGGT 
AGAAATCAAGAATGACAAGATGTTACAACTCCAATTGAATGAGGATATTGGAATGACTTATGATGCTTTAATCAAACTGTCTTTAC 
GGCATCGTCCAGATATTTTAATTATCGGAGAGATTAGAGATCAAGCGACGGCCCGTGCTGTTATTCGTGCAAGTTTAACGGGAGTA 
ATGGTTTTTTCTACTATTCATGCTAAAAGTATTCCCGGAGTCTATGATAGGCTTATAGAATTAGGGGTTAACTATCAAGAGTTAGA 
AAATAGTCTAAAATTAATAGCATATCAACGTTTAATTGGAGGAGGAAGCCTAATTGACTTTGAGACAAGTAACTTTAAAAAACACT 
CATCAGACAAGTGGAATAGACAAGTGGATATCTTGGCTGAAGAAGGACATATCAGTAAGAAACAGGCACAAGTCGAAAAAATTATC 
CCTCAAGAAACAACGGAAAGTAGTCCAACTTTT 

SEQ XD NO. 2311: SAG0163 FROM THE M781 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

CAGTAGAAGTAAATGCTCAAGATATTTATATCATTCCCAAAGGTGATTGTTATGAATTCTATATGCGTATTGATGATGAAAGGCGG 
TTTATTGATGTTTTTGAGTTTAATAGGATGGCTAGTCTTATTAGTCACTTTAAATTTGTGGCAGGCATGAACGTTGGAGAAAAAAG 
ACGAAGTCAATTAGGTTCTTGTGACTATGAACTGTCAGAGGGAAGACTGGTTTCATTACGACTATCAAGTGTGGGAGATTATCGTG 
GTCAAGAATCTTTAGTTATTCGTACTTTGTATTCAGGTCATCAGGACTTAAAATATTGGTTTGATAATATAAAGCAAATGAAGGAA 
GTACTGTGTGCAAGAGGGCTATATCTTTTTTCCGGCCCTGTGGGGAGTGGTAAAACAACTCTCATGTATC/^ATTAGCTTCAGAAGT 
ATTTAAAAATAAGCAAATTATCACGATTGAAGATCCGGTAGAAATCAAGAATGACAAGATGTTACAACTCCAATTGAATGAGGATA 
TTGGAATGACTTATGATGCTTTAATCAAACTGTCTTTACGGCATCGTCCAGATATTTTAATTATCGGAGAGATTAGAGATCAAGCG 
ACGGCCCGTGCTGTTATTCGTGCAAGTTTAACGGGAGTAATGGTTTTTTCTACTATTCATGCTAAAAGTATTCCCGGAGTCTATGA 
TAGGCTTATAGAATTAGGGGTTAACTATCAAGAGTTAGAAAATAGTCTAAAATTAATAGCATATCAACGTTTAATTGGAGGAGGAA 
GCCTAATTGACTTTGAGACAAGTAACTTTAAAAAACACTCATCAGACAAGTGGAATAGACAAGTGGATATCTTGGCTGAAGA^.GGA 
CATATCAGTAAGAAACAGGCACAAGTCGAAAAAATTATCCCTCAAGAAACAACGGAAAGTAGTCCAACTTTT 

>SEQ ID NO 2350:63_090 frame: 2 

AVEVNAQDI YI I PKGDC YELYMRI DDERRFI DVFE FNRMAS LI S HFKFVAGMNVGEKRRS 
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QLGSCDYELSEGRLVSLRLSSVGDYRGQESLVIRILYSGHQDLKYWFDNIKQMKEVLGTR 
GLYLFSGPVGSGKTTLMYQLASEVFKNKQIITIEDPVEIKNDKMLQLQLNEDIGMTYDAL 
IKLSLRHRPDILIIGEIRDQATARAVIRASLTGVMVFSTIHAKSISGVYDRLIELGVNYQ 
ELENSLKLIAYQRLIGGGSLIDFETGNFKKHSSDKWNRQVDILAEEGHISKKQAQVEKII 
PQETTESSPTF 

>SEQ ID NO 2351:63_1169NT frame: 3 

. LL . NLYYCVFDDERRFIDVFEFNRMASLISHFKFVAGMNVGEKRRSQLGSCDYELSEGR 
LVSLRLSSVGDYRGQESLVIRILYSGHQDLKYWFDNIKQMKEVLGTRGLYLFSGPVGSGK 
TTLMYQLASEVFKNKQIITIEDPVEIKNDKMLQLQLNEDIGMTYDALIKLSLRHRPDILI 
IGEIRDQATARAVIRASLTGVMVFSTIHAKSIPGVYDRLIELGVNYQELENSLKLIAYQR 
LIGGGSLI DFETSN FKKHS S DKWNRQVDILAEEGYI S KKQAQVEKI I PQETTES SPT F 

>SEQ ID NO 2352:63_18RS21 frame: 1 

VQSLAKQVIHQAVEVNAQDIYIIPKGDCYELYMRIDDERRFIDVFEFNRMASLISHFKFV 
AGMNVGEKRRSQLGSCDYELSEGRLVSLRLSSVGDYRGQESLVIRILYSGHQDLKYWFDN 
IKQMKEVLGIRGLYLFSGPVGSGKTTLMYQLASEVFKNKQIITIEDPVEIKNDKMLQLQL 
NEDIGMTYDALIKLSLRHRPDILIIGEIRDQATARAVIRASLTGVMVFSTIHAKSIPGVY 
DRLIELGVNYQELENSLKLIAYQRLIGGGSLIDFETGNFKKHSSDKWNRQVDILAEEGHI 
S KKQAQVEKI I PQETTESSPTF 

>SEQ ID NO 2353: 63_2603 frame: 1 

DIYIIPKGDCYELYMRIDDERRFIDVFEFNRMASLISHFKFVAGMNVGEKRRSQLGSCDY 
ELSEGRLVSLRLSSVGDYRGQESLVIRILYSGHQDLKYWFDNIKQMKEVLGIRGLYLFSG 
PVGSGKTTLMYQLASEVFKNKQIITIEDPVEIKNDKMLQLQLNEDIGMTYDALIKLSLRH 
RPDILIIGEIRDQATARAVIRASLTGVMVFSTIHAKSIPGVYDRLIELGVNYQELENSLK 
LIAYQRLIGGGSLIDFETGNFKKHSSDKWNRQVDILAEEGHISKKQAQVRKNYPSRNNGK 
. SNF 

>SEQ ID NO 2354:63_A909 frame: 1 

VQSLAKQVIHQAVEVNAQDIYIIPKGDCYELYMRIDDERRFIDVFEFNRMASLISHFKFV 
AGMNVGEKRRSQLGSCDYELSEGRLVSLRLSSVGDYRGQESLVIRILYSGHQDLKYWFDN 
IKQMKEVLGIRGLYLFSGPVGSGKTTLMYQLASEVFKNKQIITIEDPVEIKNDKMLQLQL 
NEDIGMTYDALIKLSLRHRPDILIIGEIRDQATARAVIRASLTGVMVFSTIHAKSIPGVY 
DRLIELGVNYQELENSLKLIAYQRLIGGGSLIDFETGNFKKHSSDKWNRQVDILAEEGHI 
S KKQAQVEKI I PQETTE SSPTF 

>SEQ ID NO 2355 : 63_CJB110 frame: 1 

VQSLAKQVIHQAVEVNAQDIYIIPKGDCYELYMRIDDERRFI DVFEFNRMASLISHFKFV 
AGMNVGEKRRSQLGSCDYELSEGRLVSLRLSSVGDYRGQESLVIRILYSGHQDLKYWFDN 
IKQMKEVLGTRGLYLFSGPVGSGKTTLMYQLASEVFKNKQIITIEDPVEIKNDKMLQLQL 
NEDIGMTYDALIKLSLRHRPDILIIGEIRDQATARAVIRASLTGVMVFSTIHAKSISGVY 
DRLIELGVNYQELENSLKLIAYQRLIGGGSLIDFETGNFKKHSSDKWNRQVDILAEEGHI 
S KKQAQVEKI I PQETTE SSPTF 

>SEQ ID NO 2356:63_CJB110 frame: 1 

VQSLAKQVIHQAVEVNAQDIYIIPKGDCYELYMRIDDERRFI DVFEFNRMASLISHFKFV 
AGMNVGEKRRSQLGSCDYELSEGRLVSLRLSSVGDYRGQESLVIRILYSGHQDLKYWFDN 
IKQMKEVLGTRGLYLFSGPVGSGKTTLMYQLASEVFKNKQIITIEDPVEIKNDKMLQLQL 
NEDIGMTYDALIKLSLRHRPDILIIGEIRDQATARAVIRASLTGVMVFSTIHAKSISGVY 
DRLIELGVNYQELENSLKLIAYQRLIGGGSLIDFETGNFKKHSSDKWNRQVDILAEEGHI 
S KKQAQVEKI I PQETTES S PTF 

>SEQ ID NO 2357: 63JH36B frame: 1 

SLAKQVIHQAVEVNAQDIYIIPKGDCYELYMRIDDERRFI DVFEFNRMASLISHFKFVAG 
MNVGEKRRSQLGSCDYELSEGRLVSLRLSSVGDYRGQESLVIRILYSGHQDLKYWFDNIK 
QMKEVLGIRGLYLFSGPVGSGKTTLMYQLASEVFKNKQIITIEDPVEIKNDKMLQLQLNE 
DIGMTYDALIKLSLRHRPDILIIGEK 

>SEQ ID NO 2358 : 63_JM9130013 frame: 1 

VQSLAKQVIHQAVEVNAQDI YII PKGDCYELYMRI DDERRFIDVFEFNRMASLI SHFKFV 
AGMNVGEKRRSQLGSCDYELSEGRLVSLRLSSVGDYRGQESLVIRILYSGHQDLKYWFDN 
IKQMKEVLGIRGLYLFSGPVGSGKTTLMYQLASEVFKNKQIITIEDPVEIKNDKMLQLQL 
NEDIGMTYDALIKLSLRHRPDILIIGEIRDQATARAVIRASLTGVMVFSTIHAKSIPGVY 
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DRLIELGVNYQELENSLKLIAYQRLIGGGSLIDFETGNFKKHSSDKWNRQVDILAEEGHI 
SKKQAQVEKIIPQETTESSPTF 

>SEQ ID NO 2359:63_M732 frame: 3 

TCYETLYAYLMMKRRFIDVFEFNRMASLISHFKFVAGMNVGEKRRSQLGSCDYELSEGRL 
VSLRLSSVGDYRGQESLVIRTLYSGHQDLKYWFDNIK . MKE VLC ARGLYLFS G PVG SGKT 
TLOTQLASEVFKNKQIITIEDPVEIKNDKMLQLQLNEDIGMTYDALIKLSLRHRPDILII 
GEIRDQATARAVIRASLTGVMVFSTIHAKSIPGVYDRLIELGVNYQELENSLKLIAYQRL 
IGGGSLIDFET SN FKKHS SDKWNRQVDILAEEGH I SKKQAQVEKI I PQETTES S PTF 

>SEQ ID NO 2360:63_M781 frame: 3 

VEVNAQDI YI I PKGDCYE FYMRI DDERRFI DV FE FNRMASLISHFKFVAGMNVGEKRRS Q 
LGSCDYELSEGRLVSLRLSSVGDYRGQESLVIRTLYSGHQDLKYWFDNIKQMKEVLCARG 
LYLFSGPVGSGKTTLMYQLASEVFKNKQIITIEDPVEIKNDKMLQLQLNEDIGMTYDALI 
KLSLRHRPDILIIGEIRDQATARAVIRASLTGVMVFSTIHAKSIPGVYDRLIELGVNYQE 
LENSLKLIAYQRLIGGGSLIDFETSNFKKHSSDKWNRQVDILAEEGHISKKQAQVEKIIP 
QETTESSPTF 

>SEQ ID NO 2361:63_COHl frame: 3 

VIVMKFYMRIDDERRFIDVFEFNRMASLISHFKFVAGMNVGEKRRSQLGSCDYELSEGRL 
VSLRLSSVGDYRGQESLVIRTLYSGHQDLKYWFDNIK 

SEQ ID NO. 2401: SAG0290 PROM THE 1169NT1 GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCTACAGATTCTGACACGGCACCATTTACTTATCAAAAAGACGGGAA 
ATTCAAAGGTTATGATGTTGATGTTGTCAAAGCTGTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGACAGTTCCTTTTGATA 
CTATTTCAACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGATTTTTCATACAATAAAGAAAGAGCAGAAAAATATCTC 
TTCTCAGACCCTATATCCCGTTCAAATTATGCCGTAGTAGGGAAGAAGGGGAGCCATTACAAATCATTAAGTGACCTCTCTGGAAA 
AT C AAC AG AAGTTTT AT CTGGCGTT AACT ATGC AC AGGTT CT AGAAAATTGGAAT AAAAAT C AT CCTAAT AAAAAACC AAT AAAAA 
TCAAATATGTTTCTGGGACAACTGGTGTTACTAGCAGATTAAAAAATATTGAGAGTGGGAAAATTGACTTTATCCTATATGATGCC 
ATTTCATCTGACTATATTGTAAAAGATCAATCATTAAACTTAAGCGTTTCTCCTTTGAAAGGTAAAATTGGTAATAATAAGGATGG 
ATTAGAATACCTCCTTTTACCAAAAGATAAAAAAGGTAAAACTCTACAGAAATTTATAAATAAGCGTATTAAAGTTTTGAAAGAAG 
ATGGTACTTTGGCACGTTTAAGTAAACAATATTTCGGTGGAGATTACGTTTCAAACATTGATAAA 

SEQ ID NO. 2402: SAG0290 FROM THE 18RS21 GBS TYPE II STRAIN (REVERSE COMPLEMENT) 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCTACAGATTCTGACACGGCACCATTTACTTATRAAAAAGACGGGAA 
ATTCAAAGGTTATGATGTTGATGTTGTCAAAGCTGTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGACAGTTCCTTTTGATA 
CTATTTCAACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGATTTTTCATACAATAAAGAAAGAGCAGAAAAATATCTC 
TTCTCAGATCCTATATCCCGTTCAAATTATGCCGTAGTAGGGAAGAAGGGGAGCCATTACAAATCATTAAGTGACCTCTCTGGAAA 
ATCAACCGAAGTTTTATCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGAATAAAAATCATCCTAATAAAAAACCAATAAAAA 
TCAAATATGTTTCTGGGACAACTGGTGTTACTAGCAGATTAAAAAATATTGAGAGTGGGAAAATTGACTTTATCCTATATGATGCC 
ATTTCATCCGACTATATTGTAAAAGACCAATCATTAAACTTAAGCGTTTCTCCTTTGAAAGGTAAAATTGGTAATAATAAGGATGG 
ACTAGAATACCTCCTTTTACCAAAAGATAAAAAAGGTAAAACTCTACAGAAATTTATAAATAAGCGTATTAAAGTTTTGAAAGAAA 
ATGGTACTTTGGCACGTTTAAGTAAACAATATTTCGGTGGAGATTACGTTTCAAACATTGATAAA 

SEQ ID NO. 2403: SAG0290 FROM THE 2603 V/R GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

ATTCAAAGGTTATGATGTTGATGTTGTCAAAGCTGTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGACAGTTCCTTTTGATA 
CTATTTCAACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGATTTTTCATACAATAAAGAAAGAGCAGAAAAATATCTC 
TTCTCAGATCCTATATCCCGTTCAAATTATGCCGTAGTAGGGAAGAAGGGGAGCCATTACAAATCATTAAGTGACCTCTCTGGAAA 
ATCAACCGAAGTTTTATCTGGCGTT71ACTATGCACAGGTTCTAGAAAATTGGAATAAAAATCATCCTAATAAAAAACCAATAAAAA 
TCAAATATGTTTCTGGGACAACTGGTGTTACTAGCAGATTAAAAAATATTGAGAGTGGGAAAATTGACTTTATCCTATATGATGCC 
ATTTCATCCGACTATATTGTAAAAGACCAATCATTAAACTTAAGCGTTTCTCCTTTGAAAGGTAAAATTGGTAATAATAAGGATGG 
ACTAGAATACCTCCTTTTACCAAAAGATAAAAAAG 

SEQ XD NO. 2404: SAG0290 FROM THE 090 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCTACAGATTCTGACACGGCACCATTTACTTATCAAAAAGACGGGAA 
ATTCAAAGGTTATGATGTTGATGTTGTCAAAGCTGTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGACAGTTCCTTTTGATA 
CTATTTCAACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGATTTTTCATACAATAAAGAAAGAGCAGAAAAATATCTC 
TTCTCAGATCCTATATCCCGTTCAAATTATGCCGTAGTAGGGAAGAAGGGGAGCCATTACAAATCATTAAGTGACCTCTCTGGAAA 
ATCAACCGAAGTTTTATCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGAATAAAAATCATCCTAATAAAAAACCAATAAAAA 
TC7VAATATGTTTCTGGGACAACTGGTGTTACTAGCAGATTAAAAAATATTGAGAGTGGGAAAATTGACTTTATCCTATATGATGCC 
ATTTC^TCCGACTATATTGTAAAAGACCAATCATTA/VACTTAAGCGTTTCTCCTTTGAAAGGTAAAATTGGTAATAATAAGGATGG 
ACTAGAATACCTCCTTTTACCAAAAGATAAAAAAGGTAAAACTCTACAGAAATTTATAAATAAGCGTATTAAAGTTTTGAAAGAAA 
ATGGTACTTTGGCACGTTTAAGTAAACAATATTTCGGTGGAGATTACGTTTCAAACATTGATAAA 
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SEQ ID NO, 2405: SA60290 FROM THE A909 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCTACAGATTCTGACACGGCACCATTTACTTATCAAAAAGACGGGAA 
ATTCAAAGGTTATGATGTTGATGTTGTCAAAGCTGTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGACAGTTCCTTTTGATA 

ctatttcaacaggtattgatgcagggaaatttgatttatcagctaatgatttttcatacaataaagaaagagcagaaaaatAtctc 
ttctcagatcctatatcccgttcaaattatgccgtagtagggaagaaggggagcc^ttac^aatcattaagtgacctctctggaaa 

ATCAACCGAAGTTTTATCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGAATAAAAATCATNNTAATAAAAAACCANTAAAAA 
TNAAATATGTTTCTGGGACAACTGGTGTTACTAGCAGATTAAAAAATATTGAGAGTGGGAAAATTGACTTTATCCTATATGATGCC 
ATTTCATCCGACTATATTGTAAAAGACCAATCATTAAACTTAAGCGTTTCTCCTTTGAA^GGTAAAATTGGTAATAATAAGGATGG 
ACTAGAATACCTCCTTTTACCAAAAGATAAAAAAGGTAAAACTCTACAGAAATTTATAAATAAGCGT 

SEQ XD NO. 2406: SAG0290 FROM THE CJB110 GBS NONTYPEABLE STRAIN (REVERSE COMPLEMENT) 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCTACAGATTCTGACACGGCACCATTTACTTATCAAAAAGACGGGAA 
ATTCAAAGGTTATGATGTTGATGTTGTCAAAGCTGTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGACAGTTCCTTTTGATA 
CTATTTCAACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGATTTTTCATACAATAAAGAAAGAGCAGAAAAATATCTC 
TTCTCAGATCCTATATCCCGTTCAAATTATGCCGTAGTAGGGAAGAAGGGGAGCCATTACAAATCATTAAGTGACCTCTCTGGAAA 
ATCAACCGAAGTTTTATCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGAATAAAAATCATCCTAATAAAAAACCAATAAAAA 
TCAAATATGTTTCTGGGACAACTGGTGTTACTAGCAGATTAAAAAATATTGAGAGTGGGAAAATTGACTTTATCCTATATGATGCC 
ATTTCATCCGACTATATTGTAAAAGACCAATCATTAAACTTAAGCGTTTCTCCTTTGAAAGGTAAAATTGGTAATAATAAGGATGG 
ACTAGAATACCTCCTTTTACCAAAAGATAAAAAAGGTAAAACTCTACAGAAATTTATAAATAAGCGTATTAAAGTTTTGAAAGAAA 
ATGGTACTTTGGCACGTTTAAGTAAACAATATTTCGGTGGAGATTACGTTTCAAACATTGATAAA 

SEQ ID NO. 2407: SAG0290 FROM THE COHl GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCTACAGATTCTGACACGGCACCATTTACTTATCAAAAAGACGGGAA 
ATTCAAAGGTTATGACGTTGATGTTGTCAAAGCTGTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGACAGTTCCTTTTGATA 
CTATTTCAACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGATTTTTCATATAATAAAGAAAGAGCAGAAAAATATCTC 
TTCTCAGATCCTATATCCCGTTCAAATTATGCCGTAGTAGGGAAGAAGGGGAGCCATTACAAATCATTAAGTGACCTCTCTGGAAA 
ATCAACAGAAGTTTTATCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGAATAAAAATCATCCTAATAAAAAACCAATAAAAA 
TCAAATATGTTTCTGGGACAACTGGTGTTACTAGCAGATTAAAAAATATTGAGAGTGGAAAAATTGACTTTATCCTATATGATGCC 
ATTTCATCTGACTATATTGTAAAAGATCAATCATTAAACTTAAGCGTTTCTCCTTTGAAAGGTAAAATTGGTAATAATAAGGATGG 
ATTAGAATACCTCCTTTTACCAAAAGATAAAAAAGGTAAAACTCTACAGAAATTTATAAATAAGCGTATTAAAGTTTTGAAAGAAG 
ATGGTACTTTGGCACGTTTAAGTAAACAATATTTCGGTGGAGATTACGTTTCAAACATTGATAAA 

SEQ ID NO. 2408: SAG0290 FROM THE H36b GBS TYPE lb STRAIN 
(REVERSE COMPLEMENT) 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCTACAGATTCTGACACGGCACCATTTACTTATCAAAAAGACGGGAA 
ATTCAAAGGTTATGATGTTGATGTTGTCAAAGCTGTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGACAGTTCCTTTTGATA 
CTATTTCAACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGATTTTTCATACAATAAAGAAAGAGCAGAAAAATATCTC 
TTCTCAGATCCTATATCCCGTTCAAATTATGCCGTAGTAGGGAAGAAGGGGAGCCATTACAAATCATTAAGTGACCTCTCTGGAAA 
ATCAACCGAAGTTTTATCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGAATAAAAATCATCCTAATAAAAAACCAATAAAAA 
TCAAATATGTTTCTGGGACAACTGGTGTTACTAGCAGATTAAAAAATATTGAGAGTGGGAAAATTGACTTTATCCTATATGATGCC 
ATTTCATCCGACTATATTGTAAAAGACCAATCATTAAACTTAAGCGTTTCTCCTTTGAAAGGTAAAATTGGTAATAATAAGGATGG 
ACTAGAATACCTCCTTTTACCAAAAGATAAAAAAGGTAA7\ACTCTACAGAAATTTATAAATAAGCGTATTAAAGTTTTGAAAGAAA 
ATGGTACTTTGGCACGTTTAAGT7^AACAATATTTCGGTGGAGATTACGTTTCAAACATTGATAAA 

SEQ ID NO. 2409: SAG0290 FROM THE JM9130013 GBS STRAIN VIII (REVERSE COMPLEMENT) 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCTACAGATTCTGACACGGCACCATTTACTTATCAAAAAGACGGGAA 
ATTCAAAGGTTATGATGTTGATGTTGTCAAAGCTGTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGACAGTTCCTTTTGATA 
CTATTTCAACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGATTTTTCATACAATAAAGAAAGAGCAGAAAAATATCTC 
TTCTCAGATCCTATATCCCGTTCAAATTATGCCGTAGTAGGGAAGAAGGGGAGCCATTACAAATCATTAAGTGACCTCTCTGGAAA 
ATCAACCGAAGTTTTATCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGAATAAAAATCATCCTAATAAAAAACCAATAAAAA 
TCAAATATGTTTCTGGGACAACTGGTGTTACTAGCAGATTAAAAAATATTGAGAGTGGGAAAATTGACTTTATCCTATATGATGCC 
ATTTCATCCGACTATATTGTAAAAGACCAATCATTAAACTTAAGCGTTTCTCCTTTGAAAGGTAAAATTGGTAATAATAAGGATGG 
ACTAGAATACCTCCTTTTACCAAAAGATAAAAAAGGTAAAACTCTACAGAAATTTATAAATAAGCGTAATAAAGTTTTGAAAGAAA 
ATGGTA 

SEQ ID NO. 2410: SAG0290 FROM THE M732 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCTACAGATTCTGACACGGCACCATTTACTTATCAAAAAGACGGGAA 
ATTCAAAGGTTATGACGTTGATGTTGTCAAAGCTGTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGACAGTTCCTTTTGATA 
CTATTTCAACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGATTTTTCATATAATAAAGAAAGAGCAGAAAAATATCTC 
TTCTCAGATCCTATATCCCGTTCAAATTATGCCGTAGTAGGGAAGAAGGGGAGCCATTACAAATCATTAAGTGACCTCTCTGGAAA 
ATCAACAGAAGTTTTATCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGAATAAAAATCATCCT7UVTAAAAAACCAATAAAAA 
TCAAATATGTTTCTGGGACAACTGGTGTTACTAGCAGATTAAAAAATATTGAGAGTGGAAAAATTGACTTTATCCTATATGATGCC 
ATTTCATCTGACTATATTGTAAAAGATCAATCATTAAACTTAAGCGTTTCTCCTTTGAAAGGTAAAATTGGTAATAATAAGGATGG 
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ATTAGAATACCTCCTTTTACCAAAAGATAAAAAAGGTAAAACTCTACAGAAATTTATAAATAAGCGTATTAAAGTTTTGAAAGAAG 
ATGGTACTTTGGCACGTTTAAGTAAACAATATTTCGGTGGAGATTACGTTTCAAACATTGATAAA 

SEQ ID NO. 2411: SAG0290 FROM THE M781 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCTACAGATTCTGACACGGCACCATTTACTTATCAAAAAGACGGGAA 
ATTCAAAGGTTATGACGTTGATGTTGTCAAAGCTGTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGACAGTTCCTTTTGATA 
CTATTTCAACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGATTTTTCATATAATAAAGAAAGAGCAGAAAAATATCTC 
TTCTCAGATCCTATATCCCGTTCAAATTATGCCGTAGTAGGGAAGAAGGGGAGCCATTACAAATCATTAAGTGACCTCTCTGGAAA 
ATCAACAGAAGTTTTATCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGAATAAAAATCATCCTAATAAAAAACCAATAAAAA 
TCAAATATGTTTCTGGGACAACTGGTGTTACTAGCAGATTAAAAAATATTGAGAGTGGAAAAATTGACTTTATCCTATATGATGCC 
ATTTCATCTGACTATATTGTAAAAGATCAATCATTAAACTTAAGCGTTTCTCCTTTGAAAGGTAAAATTGGTAATAATAAGGATGG 
ATTAGAATACCTCCTTTTACCAAAAGATAAAAAAGGTAAAACTCTACAGAAATTTATAAATAAGCGTATTAAAGTTTTGAAAGAAG 
ATGGTACTTTGGCACGTTTAAGTAAACAATATTTCGGTGGAGATTACGTTTCAAACATTGATAAA 

>SEQ ID NO 2450: 8_1169NT frame: 1 

VS VQASEKVELKVATDS DTAPFTYQKDGKFKGYDVDWKAVFKGSKYKVT FKTVPFDTI S 
TGIDAGKFDLSANDFSYNKERAEKYLFSDPISRSNYAVVGKKGSHYKSLSDLSGKSTEVL 
SGVNYAQVLENWNBCNHPNKKPIKIKYVSGTTGVTSRLKNIESGKIDFILYDAISSDYIVK 
DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKKGKTLQKFINKRIKVLKEDGTIARLSKQY 
FGGDYVSNIDK 

>SEQ ID NO 2451: 8_18RS21 frame: 1 

VSVQASEKVELKVATDS DTAPFT YXKDGKFKGYDVDWKAVFKGSKYKVT FKTVP FDT I S 
TGIDAGKFDLSANDFSYNKERAEKYLFSDPISRSNYAWGKKGSHYKSLSDLSGKSTEVL 
SGVNYAQVLENWNKNHPNKKPIKIKYVSGTTGVTSRLKNIESGKIDFILYDAISSDYIVK 
DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKKGKTLQKFINKRIKVLKENGTLARLSKQY 
FGGDYVSNIDK 

>SEQ ID NO 2452 :8 — 2603 frame: 2 

FKGYDVDVVKAVFKGSKYKVTFKTVPFDTISTGIDAGKFDLSANDFSYNKERAEKYLFSD 
PISRSNYAWGKKGSHYKSLSDLSGKSTEVLSGVNYAQVLENWNKNHPNKKPIKIKYVSG 
TTGVTSRLKNIESGKIDFILYDAISSDYIVKDQSLNLSVSPLKGKIGNNKDGLEYLLLPK 
DKK 

>SEQ ID NO 2453:8_090 frame: 1 

VSVQASEKVELKVATDSDTAPFTYQKDGKFKGYDVDVVKAVFKGSKYKVT FKTVPFDTI S 
TGIDAGKFDLSANDFSYNKERAEKYLFSDPISRSNYAWGKKGSHYKSLSDLSGKSTEVL 
SGVNYAQVLENWNKNHPNKKPIKIKYVSGTTGVTSRLKNIESGKIDFILYDAISSDYIVK 
DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKKGKTLQKFINKRIKVLKENGTLARLSKQY 
FGGDYVSNIDK 

>SEQ ID NO 2454:8_A909 frame: 1 

VSVQASEKVELKVATDSDTAPFTYQKDGKFKGYDVDWKAVFKGSKYKVT FKTVP FDT IS 
TGIDAGKFDLSANDFSYNKERAEKYLFSDPISRSNYAWGKKGSHYKSLSDLSGKSTEVL 
SGWYAQVLENWNKNHXNKKPXKXKYVSGTTGVTSRLKNIESGKIDFILYDAISSDYIVK 
DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKKGKTLQKFINKR 

>SEQ ID NO 2455: 8_CJB110 frame: 1 

VSVQASEKVELKVATDS DTAPFTYQKDGKFKGYDVDWKAVFKGSKYKVT FKTVPFDTI S 
TGIDAGKFDLSANDFSYNKERAEKYLFSDPISRSNYAWGKKGSHYKSLSDLSGKSTEVL 
SGVNYAQVLENWNKNHPNJCKPIKIKYVSGTTGVTSRLKNIESGKIDFILYDAISSDYIVK 
DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKKGKTLQKFINKRIKVLKENGTLARLSKQY 
FGGDYVSNIDK 

>SEQ ID NO 2456: 8_COHl frame: 1 

VSVQASEKVELKVATDS DT APFTYQKDGKFKGYDVDWKAVFKGSKYKVT FKTVPFDTI S 
TGIDAGKFDLSANDFSYNKERAEKYLFSDPISRSNYAWGKKGSHYKSLSDLSGKSTEVL 
SGVNYAQVLENWNKNHPNKKPIKIKYVSGTTGVTSRLKNIESGKIDFILYDAISSDYIVK 
DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKKGKTLQKFINKRIKVLKEDGTLARLSKQY 
FGGDYVSNIDK 

>SEQ ID NO 2457:8_B36B frame: 1 

VSVQASEKVELKVATDSDTAPFTYQKDGKFKGYDVDWKAVFKGSKYKVTFKTVPFDTIS 
TGIDAGKFDLSANDFSYNKERAEKYLFSDPISRSNYAWGKKGSHYKSLSDLSGKSTEVL 
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SGVNYAQVLENWNKNHPNKKPIKIKYVSGTTGVTSRLKNIESGKIDFILYDAISSDYIVK 
DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKKGKTLQKFINKRIKVLKENGTLARLSKQY 
FGGDYVSNIDK 

>SEQ ID NO 2458:8_JM9130013 frame: 1 

VSVQASEKVELKVATDSDTAPFTYQKDGKFKGYDVDWBCAVFKGSKYKVTFKTVPFDTIS 
TGIDAGKFDLSANDFSYNKERAEKYLFSDPISRSNYAWGKKGSHYKSLSDLSGKSTEVL 
SGVNYAQVLENWNKNHPNKKPIKIKYVSGTTGVTSRLKNIESGKIDFILYDAISSDYIVK 
DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKKGKTLQKFINBCRNKVLKENG 

>SEQ ID NO 2459:8_M732 frame: 1 

VSVQASEKVELKVATDSDTAPFTYQKDGKFKGYDVDWKAVFKGSKYKVTFKTVPFDTIS 
TGIDAGKFDLSANDFSYNKERAEKYLFSDPISRSNYAWGKKGSHYKSLSDIJjSGKSTEVL 
SGVNYAQVLENWNKNHPNKKPIKIKYVSGTTGVTSRLKNIESGKIDFILYDAISSDYIVK 
DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKKGKTLQKFINKRIKVLKEDGTLARLSKQY 
FGGDYVSNIDK 

>SEQ ID NO 2460:8_M781 frame: 1 

VSVQASEKVELKVATDSDTAPFTYQKDGKFKGYDVDWKAVFKGSKYKVTFKTVPFDTIS 
TGIDAGKFDLSANDFSYNKERAEKYLFSDPISRSNYAWGKKGSHYKSLSDLSGKSTEVL 
SGVNYAQVLENWNKNHPNKKPIKIKYVSGTTGVTSRLKNIESGKIDFILYDAISSDYIVK 
DQSLNLSVS PLKGKIGNNKDGLEYLLLPKDKKGKTLQKFINKRIKVLKEDGTLARLSKQY 
FGGDYVSNIDK 

SEQ ID NO. 2501: SAG0368 FROM THE 090 GBS TYPE la STRAIN 

TATAATTTTTCGACTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCTAGCTAAATCAAAAAGTCATGCTATTGAAGAAACAAA 
GCCGTTTTCAATACTATTAATGGGGGTGGACACAGGTTCAGAGCATCGAAAATCTAAGTGGTCAGGAAATAGCGATTCTATGATCT 
TAGTCACTATAAATCCTAAAACTAATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATTAAATTGAGTGGTCCCAAAAAT 
AATGGACAGACTGGAGTAGAAGCAAAGCTAAATGCAGCCTATGCTTCTGGTGGTGCGGAAATGGCATTGATGACTGTTCAAGACTT 
ATTAGATATTAATGTTGATTACTTTATGCAAATTAATATGCAAGGATTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGTAA 
CT AAT AAAT TTGACTTT CC AAT AT CAATT GCTGCCAAT GAACC AG AGT AC AAGGCT GTTGTTGAACCAGGGACAC AT AAAAT AAAT 
GGAGAACAAGCACTTGTTTATTCTCGTATGCGCTATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAAT 
TCAAAAAGTCCTTAAAAAAATATTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTT^ 

CTAATATTGAGATATCATCAAAAACGATTCCTAATTTGTTAGCTTATAAAGATTCATTGGAACATATTAAATCTTATCAGTTGAAG 
GGTGAAGACGCTACTTTATCAGATGGTGGCTCTTATCAAATTTTAACTAAGAAACATCTACTTGCAGTTCAAAATAGAATTAAGAA 
AGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCTATATGAAGATTACTATGGTACTACTGCTAGTAATGATT 
CTTCTACTTATTCATCAACACAAGAGAATAATTATAATACAACACCTTATTCAGAAGCACCACCAAGTTACAGTGGTAATACTACT 
TATAGTTCTGAGACTAATCAAACAACTCATCAAAATTACTATAATAGTAGCACTCCTGCTAGTAACTATAGCAGTAACACTAACAC 
AGGTCAGGCTGATTCAAGTGGAAGTGTCAATAATCATAACGGGGCTGCAACGCCTAATCCA 

SEQ ID NO. 2502: SAG0368 FROM THE 1169NT1 GBS TYPE V STRAIN 

TATAATTTTTCGACTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCTAGCTAAATCAAAAAGTCATGCTATTGAAGAAACAAA 
GCCGTTTTCAATACTATTAATGGGGGTGGACACAGGTTCAGAGCATCGAAAATCTAAGTTGGTCAGGAAATAGCGATTCTATGATC 
TTAGTCACTATAAATCCTAAAACTAATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATTAAATTGAGTGGTCCCAAAAA 
TAATGGACAGACTGGCGTAGAAGCAAAGCTAAATGCAGCCTATGCTTCTGGTGGTGCGGAAATGGCATTGATGACTGTTCAAGACT 
TATTAGATATTAATGTTGATTACTTTATGCAAATTAATATGCAAGGATTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGTA 
ACTAATAAATTTGACTTTCCAATATCAATTGCTGCCAATGAACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAATAAA 
TGGAGAACAAGCACTTGTTTATTCTCGTATGCGCTATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAA 
TTCAAAAAGTCCTTAAAAAAATATTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTCCGCAGTAAGTAATAACATGCAA 
ACTAATATTGAGATATCATCAAAAACGATTCCTAATTTGTTAGCTTATAAAGATTCATTGGAACATATTAAATCTTATCAGTTGAA 
AGGTGAAGACGCTACTTTATCAGATGGTGGCTCTTATCAAATTTTAACTAAGAAACATCTACTTGCAGTTCAAAATAGAATTAAGA 
AAGAACTAGATAAAAAGCGTAGTAAAACTCTGT^AGACAAGCGCGATTCTATATGAAGATTACTATGGTACTACTGCTAGTAATGAT 
TCTTCTACTTATTCATCAACACAAGAGAATAATTATAATACAACACCTTATTCAGAAGCACCACCAAGTTACAGTGGTAATACTAC 
TTATAGTTCTGAGACTAATCAAACAACTCATCAAAGTTACTATAATAGTAGCACTCCTGCTAATAACTATAGCAGTAACACTAACA 
CAGGTCAGGCTGATTCAAGTGGAAGTGTCAATAATCATAATGGGGCTGCAACGCCTAATCCA 

SEQ ID NO. 2503 SAG0368 FROM THE 18RS21 GBS TYPE II STRAIN 

TATAATTTTTCGACTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCTAGCTAAATCAAAAAGTCATGCTATTGAAGAAACAAA 
GCCGTTTTCAATACTATTAATGGGGGTGGACACAGGTTCAGAGCATCGAAAATCT/^AGTGGTCAGGAAATAGCGATTCTATGATCT 
TAGTCACTATAAATCCTAAAACTAATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATTAAATTGAGTGGTCCCAAAAAT 
AATGGACAGACTGGAGTAGAAGCAAAGCTAAATGCAGCCTATGCTTCTGGTGGTGCGGAAATGGCATTGATGACTGTTCAAGACTT 
ATTAGATATTAATGTTGATTACTTTATGCAAATTAATATGCAAGGATTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGTAA 
CTAATAAATTTGACTTTCCAATATCAATTGCTGCCAATGAACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAATAAAT 
GGAGAACAAGCACTTGTTTATTCTCGTATGCGCTATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAAT 
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TCAAAAAGTCCTTAAAAAAATATTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTCCGCAGTAAGTAATAACATGCAAA 
CTAATATTGAGATATCATCA?\AAACGATTCCTAATTTGTTAGCTTATAAAGATTCATTGGAACATATTAAATCTTATCAGTTGAAG 
GGTGAAGACGCTACTTTATCAGATGGTGGCTCTTATCAAATTTTAACTAAGAAACATCTACTTGCAGTTCAAAATAGAATTAAGAA 
AGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCTATATGAAGATTACTATGGTACTACTGCTAGTAATGATT 
CTTCTACTTATTCATCAACACAAGAGAATAATTATAATACAACACCTTATTCAGAAGCACCACCAAGTTACAGTGGTAATACTACT 
TATAGTTCTGAGACTAATCAAACAACTCATCAAAATTACTATAATAGTAGCACTCCTGCTAGTAACTATAGCAGTAACACTAACAC 
AGGTCAGGCTGATTCAAGTGGAAGTGTCAATAATCATAACGGGGCTGCAACGCCTAATCCA 

SEQ ID NO. 2504: SAG0368 FROM THE 2603 V/R GBS TYPE V STRAIN 

TATAATTTTTCGACTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCTAGCTAAATCAAAAAGTCATGCTATTGAAGAAACAAA 
GCCGTTTTCAATACTATTAATGGGGGTGGACACAGGTTCAGAGCATCGAAAATCTAAGTGGTCAGGAAATAGCGATTCTATGATCT 
TAGTCACTATAAATCCTAAAACTAATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATTAAATTGAGTGGTCCCAAAAAT 
AATGGACAGACTGGAGTAGAAGCAAAGCTAAATGCAGCCTATGCTTCTGGTGGTGCGGAAATGGCATTGATGACTGTTCAAGACTT 
ATTAGATATTAATGTTGATTACTTTATGCAAATTAATATGCAAGGATTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGTAA 
CTAATAAATTTGACTTTCCAATATCAATTGCTGCC7UVTGAACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAATAAAT 
GGAGAACAAGCACTTGTTTATTCTCGTATGCGCTATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAAT 
TCAAAAAGTCCTTAAAAAAATATTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTCCGCAGTAAGTAATAACATGCT^AA 
CTAATATTGAGATATCATCAAAAACGATTCCTAATTTGTTAGCTTATAAAGATTCATTGGAACATATTAAATCTTATCAGTTGAAG 
GGTGAAGACGCTACTTTATCAGATGGTGGCTCTTATCAAATTTTAACTAAGAAACATCTACTTGCAGTTCAAAATAGAATTAAGAA 
AGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCTATATGAAGATTACTATGGTACTACTGCTAGTAATGATT 
CTTCTACTTATTCATCAACACAAGAGAATAATTATAATACAACACCTTATTCAGAAGCACCACCAAGTTACAGTGGTAATACTACT 
TATAGTTCTGAGACTAATCAAACAACTCATCAAAATTACTATAATAGTAGCACTCCTGCTAGTAACTATAGCAGTAACACTAACAC 
AGGTCAGGCTGATTCAAGTGGAAGTGTCAATAATCATAACGGGGCTGCAACGCCTAATCCA 

SEQ ID NO. 2505: SAG0368 FROM THE A909 GBS TYPE la STRAIN 

TATAATTTTTCGACTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCTAGCTAAATCAAAAAGTCATGCTATTGAAGAAACAAA 
GCCGTTTTCAATACTATTAATGGGGGTGGACACAGGTTCAGAGCATCGAAAATCTAAGTGGTCAGGAAATAGCGATTCTATGATCT 
TAGTCACTATAAATCCTAAAACTAATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATTAAATTGAGTGGTCCC^AAAAT 
AATGGACAGACTGGAGTAGAAGCAAAGCTAAATGCAGCCTATGCTTCTGGTGGTGCGGAAATGGCATTGATGACTGTTCAAGACTT 
ATTAGATATTAATGTTGATTACTTTATGCAAATTAATATGCAAGGATTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGTAA 
CTAATiy^ATTTGACTTTCCAATATCAATTGCTGCCAATGAACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAATAAAT 
GGAGAACAAGCACTTGTTTATTCTCGTATGCGCTATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAAT 
TCAAAAAGTCCTTAAAAAAATATTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTCCGCAGTAAGTAATAACATG<^^ 
CTAATATTGAGATATCATCAAAAACGATTCCTAATTTGTTAGCTTATAAAGATTCATTGGAACATATTTVAATCTTATCAGTTGAAG 
GGTGAAGACGCTACTTTATCAGATGGTGGCTCTTATCAAATTTTAACTAAGAAACATCTACTTGCAGTTCAAAATAGAATTAAGAA' 
AGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCTATATGAAGATTACTATGGTACTACTGCTAGTAATGATT 
CTTCTACTTATTCATCAACACAAGAGAATAATTATAATACAACACCTTATTCAGAAGCACCACCAAGTTACAGTGGTAATACTACT 
TATAGTTCTGAGACTAATCAAACAACTCATCAAAATTACTATAATAGTAGCACTCCTGCTAGTAACTATAGCAGTAACACTAACAC 
AGGTCAGGCTGATTCAAGTGGAAGTGTCAATAATCATAACGGGGCTGCAACGCCTAATCCA 

SEQ ID NO. 2506: SAG0368 FROM THE CJB110 GBS NONTYPEABLE STRAIN (REVERSE COMPLEMENT) 

TATAATTTTTCGACTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCTAGCTAAATCAAAAAGTCATGCTATTGAAGAAACAAA 
GCCGTTTTCAATACTATTAATGGGGGTGGACACAGGTTCAGAGCATCGAAAATCTAAGTGGTCAGGAAATAGCGATTCTATGATCT 
TAGTCACTATAAATCCTAAAACTAATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATTAAATTGAGTGGTCCCAAAAAT 
AATGGACAGACTGGAGTAGAAGCAAAGCTAAATGCAGCCTATGCTTCTGGTGGTGCGGAAATGGCATTGATGACTGTTCAAGACTT 
ATTAGATATTAATGTTGATTACTTTATGCAAATTAATATGCAAGGATTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGTAA 
CTAATAAATTTGACTTTCCAATATCAATTGCTGCCAATGAACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAATAAAT 
GGAGAACAAGCACTTGTTTATTCTCGTATGCGCTATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAAT 
TCAAAAAGTCCTTAAAAAAATATTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTCCGCAGTAAGTAATAACATGCAAA 
CTAATATTGAGATATCATCAAAAACGATTCCTAATTTGTTAGCTTATAAAGATTCATTGGAACATATTAAATCTTATCAGTTGAAG 
GGTGAAGACGCTACTTTATCAGATGGTGGCTCTTATCAAATTTTAACTAAGAAACATCTACTTGCAGTTCAAAATAGAATTAAGAA 
AGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCTATATGAAGATTACTATGGTACTACTGCTAGTAATGATT 
CTTCTACTTATTCATCAACACAAGAGAATAATTATAATACAACACCTTATTCAGAAGCACCACCAAGTTACAGTGGTAATACTACT 
TATTAGTTCTGAGACTAATCAAACAACTCATCAAAATTACTATAATAGTAGCACTCCTGCTAGTAACTATAGCAGTAACACTAACA 
CAGGTCAGGCTGATTCAAGTGGAAGTGTCAATAATCATAACGGGGCTGCAACGCCTAATCCA 

SEQ ID NO. 2507: SAG0368 FROM THE COH1 GBS TYPE III STRAIN (REVERSE COMPLEMENT ) 

GATTTTAAGCTAGATAAATCAAAAAGTCATGCTATTGAAGAAACAAAGCCGTTTTCAATACTATTAATGGGTGTGGACACAGGTTC 
AGAGCATCGAAAATCTAAGTGGTCAGGAAATAGCGATTCTATGATCTTAGTCACTATAAATCCTAAAACTAATAAAACAACGATGA 
CAAGCTTAGAACGTGACGTATTGATTAAATTGAGTGGTCCCAAAAATAATGGACAGACTGGCGTAGAAGCAAAGCTAAATGCAGCC 
TATGCTTCTGGTGGTGCGGAAATGGCATTGATGACTGTTCAAGACTTATTAGATATTAATGTTGATTACTTTATGCAAATTAATAT 
GCAAGGATTAGTTGATTTGGTCAATGCTGTTGGTGGTATAACAGTAACTAATAAATTTGACTTTCCAATATCAATTGCTGCCAATG 
AACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAATAAATGGAGAACAAGCACTTGTTTATTCTCGTATGCGCTATGAT 
GATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAATTCAAAAAGTCCTTAAAAAAATATTGGCGTTAAATAGTAT 
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TAGTTCATACAAAAAAATTCTTTCCGCAGTAAGTAATAACATGCAAACTAATATTGAGATATCATCAAAAACGATTCCTAATTTGT 
TAGCTTATAAAGATTCATTGGAACATATTAAATCTTATCAGTTGAAGGGTGAAGACGCTACTCTATCAGATGGTGGCTCTTATCAA 
ATTTTAACTAAGAAACATCTACTTGCAGTTCAAAATAGAATTAAGAAAGAGCTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAG 
CGCGATTCTATATGAAGATTACTATGGTACTACTGCTAGTAATGATTCTTCTACTTATTCATCAACACAAGAGAATTATTATTATA 
CAACACCCTTATTCAGAAGCACCACCAAGTTACAGTGGTAATACTACTTATAGTTCTGAGACTAATCAAACAACTCATCAAAGTTA 
CTATAATAGTAGCACTCCTGCTAGTAACTATAGCAGTAACACTAACACAGGTCAGGCTGATTCAAGTGGAAGTGTTAATAATTATA 
ACGGGGCTGCAACGCCTAATCCAAACACAGGAACGCAACCAGTACCAGGTCAAACTAATCCA 

SEQ ID NO. 2508: SAG0368 FROM THE H36b GBS TYPE lb STRAIN 

TATAATTTTTCGACTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCTAGCTAAATCAAAAAGTCATGCTATTGAAGAAACAAA 
GCCGTTTTCAATACTATTAATGGGGGTGGACACAGGTTCAGAGCATCGAAAATCTAAGTGGTCAGGAAATAGCGATTCTATGATCT 
TAGTCACTATAAATCCTAAAACTAATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATTAAATTGAGTGGTCCCAAAAAT 
AATGGACAGACTGGAGTAGAAGCAAAGCTAAATGCAGCCTATGCTTCTGGTGGTGCGGAAATGGCATTGATGACTGTTCAAGACTT 
ATTAGATATTAATGTTGATTACTTTATGCAAATTAATATGCAAGGATTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGTAA 
CTAATAAATTTGACTTTCCAATATCAATTGCTGCCAATGAACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAATAAAT 
GGAGAACAAGCACTTGTTTATTCTCGTATGCGCTATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAAT 
TCAAAAAGTCCTTAAAAAAATATTGGCGTTAAATAGTA 

SEQ ID NO. 2509: SAG0368 FROM THE 

TTAGTTCATACAAAAAAATTCTTTCCGCAGTAAGTAATAACATGCAAACTAATATTGAGATATCATCAAAAACGATTCCTAATTTG 
TTAGCTTATAAAGATTCATTGGAACATATTAAATCTTATCAGTTGAAGGGTGAAGACGCTACTTTATCAGATGGTGGCTCTTATCA 
AATTTTAACTAAGAAACATCTACTTGCAGTTCAAAATAGAATTAAGAAAGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAA 
GCGCGATTCTATATGAAGATTACTATGGTACTACTGCTAGTAATGATTCTTCTACTTATTCATCAACACAAGAGAATAATTATAAT 
ACAACACCTTATTCAGAAGCACCACCAAGTTACAGTGGTAATACTACTTATAGTTCTGAGACTAATCAAACAACTCATCAAAATTA 
CTATAATAGTAGCACTCCTGCTAGTAACTATAGCAGTAACACTAACACAGGTCAGGCTGATTCAAGTGGAAGTGTCAATAATCATA 
ACGGGGCTGCAACGCCTAATCCA 

SEQ ID NO. 2510: SAG0368 FROM THE JM9130013 GBS TYPE VIII STRAIN {REVERSE COMPLEMENT ) 

TATAATTTTTCGACTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCTAGCTAAATCAAAAAGTCATGCTATTGAAGAAACAAA 
GCCGTTTTCAATACTATTAATGGGGGTGGACACAGGTTCAGAGCATCGAAAATCTAAGTGGTCAGGAAATAGCGATTCTATGATCT 
TAGTCACTATAAATCCTAAAACTAATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATTAAATTGAGTGGTCCCAAAAAT 
AATGGACAGACTGGAGTAGAAGCAAAGCTAAATGCAGCCTATGCTTCTGGTGGTGCGGAAATGGCATTGATGACTGTTCAAGACTT 
ATTAGATATTAATGTTGATTACTTTATGCAAATTAATATGCAAGGATTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGTAA 
CTAATAAATTTGACTTTCCAATATCAATTGCTGCCAATGAACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAATAAAT 
GGAGAACAAgCACTTGTTTATTCTCGTATGCGCTATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAAT 
TCAATU^GTCCTTAAAAAAATATTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTCCGCAGTAAGTAATAACATGCAAA 
CTAATATTGAGATATCATCAAAAACGATTCCTAATTTGTTAGCTTATAAAGATTCATTGGAACATATTAAATCTTATCAGTTGAAG 
GGTGAAGACGCTACTTTATCAGATGGTGGCTCTTATCAAATTTTAACTAAGAAACATCTACTTGCAGTTCAAAATAGAATTAAGAA 
AGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCTATATGAAGATTACTATGGTACTACTGCTAGTAATGATT 
CTTCTACTTATTCATCAACACAAGAGAATAATTATAATACAACACCTTATTCAGAAGCACCACCAAGTTACAGTGGTAATACTACT 
TATAGTTCTGAGACTAATCAAACAACTCATCAAAATTACTATAATAGTAGCACTCCTGCTAGTAACTATAGCAGTAACACTAACAC 
AGGTCAGGCTGATTCAAGTGGAAGTGTCAATAATCATAACGGGGCTGCAACGCCTAATCCA 

SEQ ID NO. 2511: SAG0368 FROM THE M781 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

TTCAATACTATTAATGGGTGTGGACACAGGTTCAGAGCATCGAAAATCTAAGTGGTCAGGAAATAGCGATTCTATGATCTTAGTCA 
CTATAAATCCTAAAACTAATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATTAAATTGAGTGGTCCCAAAAATAATGGA 
CAGACTGGCGTAGAAGCAAAGCTAAATGCAGCCTATGCTTCTGGTGGTGCGGAAATGGCATTGATGACTGTTCAAGACTTATTAGA 
TATTAATGTTGATTACTTTATGCAAATTAATATGCAAGGATTAGTTGATTTGGTCAATGCTGTTGGTGGTATAACAGTAACTAATA 
AATTTGACTTTCCAATATCAATTGCTGCOVATGAACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAATAAATGGAGAA 
CAAGCACTTGTTTATTCTCGTATGCGCTATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAATTCAAAA 
AGTCCTTAAAAAAATATTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTCCGCAGTAAGTAATAACATGCAAACTAATA 
TTGAGATATCATCAAAAACGATTCCTAATTTGTTAGCTTATAAAGATTCATTGGAACATATTAAATCTTATCAGTTGAAGGGTGAA 
GACGCTACTCTATCAGATGGTGGCTCTTATCAAATTTTAACTAAGAAACATCTACTTGCAGTTCAAAATAGAATTAAGAAAGAGCT 
GGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCTATATGAAGATTACTATGGTACTACTGCTAGTAATGATTCTTCTA 
CTTATTCATCAACACAAGAGAATAATTATAATACAACACCTTATTCAGAAGCACCACCAAGTTACAGTGGTAATACTACTTATAGT 
TCTGAGACTAATCAAACAACTCATCAAAGTTACTATAATAGTAGCACTCCTGCTAGTAACTATAGCAGTAACACTAACACAGGTCA 
GGCTGATTCAAGTGGAAGTGTTAATAATTATAACGGGGCTGCAACGCCTAATCCAAACACAGGAACGCAACCAGTACCAGGTCAAA 
CTAATCCA 

>SEQ ID NO 2550: 54J090 frame: 1 

YNFSTNELSKTETCDFKLAKSKSHAIEETKPFSILLMGVDTGSEHRKSKWSGNSDSMILVT 
IN PKTNKTTMT S LERDVLIKLS GPKNNGQTG VEAKLN AAYAS GGAEMALMT VQDLLD IN V 
D Y FMQINMQGLVDLVNAVGGITVTNKFD FP I S I AANE PE YKAWE PGTHKINGEQALVYS 
RMRYDDPEGDYGRQKRQREVIQKVLKKILALNSISSYKKILSAVSNNMQTNIEISSKTIP 
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NLLAYKDSLEHIKSYQLKGEDATLSDGGSYQILTKKHLLAVQNRIKKELDKKRSKTLKTS 
AILYEDYYGTTASNDSSTYSSTQENNYNTTPYSEAPPSYSGNTTYSSETNQTTHQNYYNS 
STPASNYSSNTNTGQADSSGSVNNHNGAATPNP 

>SEQ ID NO 2551:54_1169NT frame: 1 

YNFSTNELSKTFKDFKLAKSKSHAIEETKPFSILLMGVDTGSEHRKSKLVRK . RFYDLSH 
YKS.N. . NNDDKLRT . RID . IEWSQK . WTDWRRSKAKCSLCFWWCGNGIDDCSRLIRY . C 

. LLYAN . YARIS . FSQCCWWYNSN . . I . LSNINCCQ . TRVQGCC . TRDT . NKWRTSTCLF 
SYAL. . SRGRLWASKKTT . SNSKSP. KNIGVK. Y. FIQKNSFRSK. . HAN . Y . DIIKNDS 

. FVSL . RFIGTY . ILSVER . RRYFIRWWLLSNFN . ETSTCSSK . N . ERTR . KA. . NSEDK 
RDS I . RLLWYYC . . . FFYLFINTRE • L . YNTLFRSTTKLQW . YYL . F. D . SNNSSKLL . . 

.HSC. .L.Q.H.HRSG.FKWKCQ.S.WGCNA.S 

>SEQ ID HO 2552:54_18RS21 frame: 1 

YNFSTNELSBCTFKDFKLAKSKSHAIEETKPFSILLMGVDTGSEHRKSKWSGNSDSMILVT 
INPKTNBCTTMTSLERDVLIKLSGPKNNGQTGVEAKLNAAYASGGAEMALMTVQDLLDINV 
DYFMQINMQGLVDLWAVGGITVTNKFDFPISIAANEPEYKAVVEPGTHKINGEQALVYS 
RMRYDDPEGDYGRQKRQREVIQKVLKKILALNSISSYKKILSAVSNNMQTNIEISSKTIP 
NLLAYKDSLEHIKSYQLKGEDATLSDGGSYQILTKKHLLAVQNRIKKELDKKRSKTLKTS 
AILYEDYYGTTASNDSSTYSSTQENNYNTTPYSEAPPSYSGNTTYSSETNQTTHQNYYNS 
STPASNYSSNTNTGQADSSGSVNNHNGAATPNP 

>SEQ ID NO 2553:54_2603 frame: 1 

YNFSTNELSKTFKDFKLAKSKSHAIEETKPFSILLMGVDTGSEHRKSKWSGNSDSMILVT 
INPKTNKTTMTSLERDVLIKLSGPKNNGQTGVEAKLNAAYASGGAEMALMTVQDLLDINV 
DYFMQINMQGLVDLVNAVGGITVTNKFDFPISIAANEPEYKAWEPGTHKINGEQALVYS 
RMRYDDPEGDYGRQKRQRE VIQKVLKKI LALNS I S S YKKILSAVSNNMQTN IE I S SKTI P 
NLLAYKDSLEHIKSYQLKGEDATLSDGGSYQILTKKHLLAVQNRIKKELDKKRSKTLKTS 
AI LYE DYYGTT ASN D S STY S S TQENNYNTT P YS EAP PS YS GNTT YS S ETNQTTHQN Y YNS 
STPASNYSSNTNTGQADSSGSVNNHNGAATPNP 

>SEQ ID NO 2554: 54_A909 frame: 1 

YNFSTNELSKTFKDFKLAKSKSHAIEETKPFSILLMGVDTGSEHRKSKWSGNSDSMILVT 
INPKTNKTTMTSLERDVLIKLSGPKNNGQTGVEAKLNAAYASGGAEMALMTVQDLLDINV 
DYFMQINMQGLVDLVNAVGGITVTNKFDFPISIAANEPEYKAWEPGTHKINGEQALVYS 
RMRYDDPEGDYGRQKRQREVIQKVLKK I LALNS I SS YKKILSAVSNNMQTN IE I SSKT IP 
NLLAYKDSLEHIKSYQLKGEDATLSDGGSYQILTKKHLLAVQNRIKKELDKKRSKTLKTS 
AILYEDYYGTTASNDSSTYSSTQENNYNTTPYSEAPPSYSGNTTYSSETNQTTHQNYYNS 
STPASNYSSNTNTGQADSSGSVNNHNGAATPNP 

>SEQ ID NO 2555:54_CJB110 frame: 1 

YNFSTNELSKTFKDFKLAKSKSHAIEETKPFSILLMGVDTGSEHRKSKWSGNSDSMILVT 
INPKTNKTTMTSLERDVLIKLSGPKNNGQTGVEAKLNAAYASGGAEMALMTVQDLLDINV 
DYFMQINMQGLVDLVNAVGGITVTNKFDFPISIAANEPEYKAWEPGTHKINGEQALVYS 
RMRYDDPEGDYGRQKRQREV I QKVLKKI LALNS IS S YKKILSAVSNNMQTN I EIS SKTI P 
NLLAYKDSLEHIKSYQLKGEDATLSDGGSYQILTKKHLLAVQNRIKKELDKKRSKTLKTS 
AILYEDYYGTTASNDSSTYSSTQENNYNTTPYSEAPPSYSGNTTY . F . D . SNNSSKLL . . 

>SEQ ID NO 2556:54_COHl frame: 1 

DFKLDKSKSHAIEETKPFSILLMGVDTGSEHRKSKWSGNSDSMILVTINPKTNKTTMTSL 
ERDVLIKLSGPKNNGQTGVEAKLNAAYASGGAEMALMTVQDLLDINVDYFMQINMQGLVD 
LVNAVGGITVTNKFDFPISIAANEPEYKAWEPGTHKINGEQALVYSRMRYDDPEGDYGR 
QKRQREVIQKVLKKILALNSISSYKKILSAVSNNMQTNIEISSKTIPNLLAYKDSLEHIK 
SYQLKGEDATLSDGGSYQILTKKHLLAVQNRIKKELDKKRSKTLKTSAILYEDYYGTTAS 
NDSSTYSSTQENYYYTTPLFRSTTKLQW . YYL . F . D . SNNSSKLL . . .HSC. .L.Q.H.H 
RSG . FKWKC . . L. RGCNA . SKHRNATSTRSN . S 

>SEQ ID NO 2557:54_H36B frame: 1 

YNFSTNELSKTFKDFKLAKSKSHAIEETKPFSILLMGVDTGSEHRKSKWSGNSDSMILVT 
INPKTNKTTMTSLERDVLIKLSGPKNNGQTGVEAKLNAAYASGGAEMALMTVQDLLDINV 
DYFMQINMQGLVDLVNAVGGITVTNKFDFPISIAANEPEYKAWEPGTHKINGEQALVYS 
RMRYDDPEGDYGRQKRQREVIQKVLKKILALNSISSYKKILSAVSNNMQTNIEISSKTIP 
NLLAYKDSLEHIKSYQLKGEDATLSDGGSYQILTKKHLLAVQNRIKKELDKKRSKTLKTS 
AILYEDYYGTTASNDSSTYSSTQENNYNTTPYSEAPPSYSGNTTYSSETNQTTHQNYYNS 
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STPASNYSSNTNTGQADSSGSVNNHNGAATPNP 
>SEQ ID NO 2558:54_JM9130013 frame: 1 

YNFSTNELSKTFKDFKLAKSKSHAIEETKPFSILLMGVDTGSEHRKSKWSGNSDSMILVT 
INPKTNKTTMTSLERDVIjIKLSGPKNNGQTGVEAICLNAAYASGGAEMALMTVQDLLDINV 
DYFMQINMQGLVDLVNAVGGITVTNKFDFPISIAANEPEYKAWEPGTHKINGEQALVYS 
RMRYDDPEGDYGRQKRQREVIQKVLKKILALNSISSYKKILSAVSNNMQTNIEISSKTIP 
NLLAYKDSLEHIKSYQLKGEDATLSDGGSYQILTKKHLLAVQNRIKKELDKKRSKTLKTS 
AILYEDYYGTTASNDSSTYSSTQENNYNTTPYSEAPPSYSGNTTYSSETNQTTHQNYYNS 
STPASNYSSNTNTGQADSSGSVNNHNGAATPNP 

>SEQ ID NO 2559:54_M781 frame: 2 

SILLMGVDTGSEHRKSKWSGNSDSMILVTINPKTNKTTMTSLERDVLIKLSGPKNNGQTG 
VEAKLNAAYASGGAEMALMTVQDLLDINVDYFMQINMQGLVDLVNAVGGITVTNKFDFPI 
SIAANEPEYKAWEPGTHKINGEQALVYSRMRYDDPEGDYGRQKRQREVIQKVLKKILAL 
NSISSYKKILSAVSNNMQTNIEISSKTIPNLLAYKDSLEHIKSYQLKGEDATLSDGGSYQ 
ILTKKHLLAVQNRIKKELDKKRSKTLKTSAILYEDYYGTTASNDSSTYSSTQENNYNTTP 
YSEAPPSYSGNTTYSSETNQTTHQSYYNSSTPASNYSSNTNTGQADSSGSVNNYNGAATP 
NPNTGTQPVPGQTNP 

SEQ ID NO. 2601: SAG0503 FROM THE 090 GBS TYPE la STRAIN 
(REVERSE COMPLEMENT) 

GGGCACAAGTTTGTACAAAAAAGCAGGCTCTATTTTTTCCTTGATCATTCCAAAATCAAATCCTAAATTAACAAAAAAAGACTTCC 
TAACAAAGAAAGTTATCCCACTTAACTATGTTGCTCTTGGAGATTCTCTGACCGAAGGTGTGGGCGATACAACCTCTCAAGGTGGT 
TTTGTCCCACTGCTATCAGAATCACTCCATAATCGATACTCTTACCAAGTGACTTCTGTTAATTATGGTGTGTCTGGGAATACTAG 
TCAACAAATTTTAAAACGTATGACGACAGATCCTCAAATCGAAAAAGATTTAGAGAAAGCTGATTTATTGACGCTAACTGTTGGTG 
GTAATGATGTCTTGGCTGTTATTCGTAAAGAGCTCAGTCATTTATCACTAAATTCCTTTGAGAAACCAGCAGAAGCATATAAGGAA 
CGTTTGAAAGAAATACTTGCAAAAGCAAGACAAGATAATCCTAAATTGCCTATTTATGTTTTAGGCATTTATAATCCTTTTTACCT 
AAACTTTCCACAATTAACTAAAATGCAAACCGTTATTGATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTCAGAAAATG 
TTTATTTTGTCCCAATTAATGACCGCCTTTATAAGGGAATAAATGGTAAAGAGGGTATTACAGAGTCATCAAATAGTCAGGCAAGT 
ATCACTAATGATGCTCTCTTTACTGGAGACCATTTTCATCCCAATAATATTGGCTATCAAATCATGTCTAACGCCGTTATGGAGAA 
AATAAATGAAACAAGAAAAAACTGGCCGAACCCAGCTTTCTTGTACAAAG 

SEQ ID NO. 2602: SAG0503 FROM THE H36b GBS TYPE lb STRAIN 
(REVERSE COMPLEMENT) 

TTTGTACAAAAAAGCAGGCTCTATTTTTTCCTTGATCATTCCAAAATCAAATCCTAAATTAACAAAAAAAGACTTCCTAACAAAGA 
AAGTTATCCCACTTAACTATGTTGCTCTTGGAGATTCTCTGACCGAAGGTGTGGGCGATACAACCTCTCAAGGTGGTTTTGTTCCA 
CTGCTATCAGAATCACTCCATAATCGATACTCTTACCAAGTGACTTCTGTTAATTATGGTGTGTCTGGGAATACTAGTCAACAAAT 
TTTAAAACGTATGACGACAGATCCTCAAATCGAAAAAGATTTAGAGAAAGCTGATTTATTGACGCTAACTGTTGGTGGTAATGATG 
TCTTGGCTGTTATTCGTAAAGAGCTCAGTCATTTATCACTAAATTCCTTTGAGAAACCAGCAGAAGCATATAAGGAACGTTTGAAA 
GAAATCCTTGCAAAAGCAAGACAAGATAATCCTAAATTGCCTATTTATGTTTTAGGCATTTATAATCCTTTTTACCTAAACTTTCC 
ACAATTAACTAAAATGCAAACCGTTATTGATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTCAGAAAATGTTTATTTTG 
TCCCAATTAATGACCGCCTTTATAAGGGAATAAATGGTAAAGAGGGTATTATAGAGTCATCAAATAGTCAGGCAAGTATCACTAAT 
GATGCTCTCTTTACTGGAGACCATTTTCATCCCAATAATATTGGCTATCAAATCATGTCTAACGCCGTTATGGAGAAAATAAATGA 
AACAAGAAAAAACTGGCCGAACCCAGCTTTCTTGTACAAAGTGGTCC 

SEQ ID NO. 2603: SAGO 503 FROM THE 18RS21 GBS TYPE II STRAIN (REVERSE COMPLEMENT) 

GTTTGTACAAAAAAGCAGGCTCTATTTTTTCCTTGATCATTCCAAAATCAAATCCTAAATTAACAAAAAAAGACTTCCTAACAAAG 
AAAGTTATCCCACTTAACTATGTTGCTCTTGGAGATTCTCTGACCGAAGGTGTGGGCGATACAACCTCTCAAGGTGGTTTTGTTCC 
ACTGCTATCAGAATCACTCCATAATCGATACTCTTACCAAGTGACTTCTGTTAATTATGGTGTGTCTGGGAATACTAGTCAACAAA 
TTTTAAAACGTATGACGACAGATCCTCAAATCGAAAAAGATTTAGAGAAAGCTGATTTATTGACGCTAACTGTTGGTGGTAATGAT 
GTCTTGGCTGTTATTCGTAAAGAGCTCAGTCATTTATCACTAAATTCCTTTGAGAAACCAGCAGAAGCATATAAGGAACGTTTGAA 
AGAAATCCTTGCAAAAGCAAGACAAGATAATCCTAAATTGCCTATTTATGTTTTAGGCATTTATAATCCTTTTTACCTAAACTTTC 
CACAATTAACTAAAATGCAAACCGTTATTGATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTCAGAAAATGTTTATTTT 
GTCCCAATTAATGACCGCCTTTATAAGGGAATAAATGGTAAAGAGGGTATTACAGAGTCATCAAATAGTCAGGCAAGTATCACTAA 
TGATGCTCTCTTTACTGGAGACCATTTTCATCCCAATAATATTGGCTATCAAATCATGTCTAACGCCGTTATGGAGAAAATAAATG 
AAACAAGAAAAAACTGGCCGAACCCAGCTTT CTTGT ACAA 

SEQ ID NO. 2604: SAG0503 FROM THE COH1 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

GGACAAGTTTGTACAAAAAAGCAGGCTCTATTTTTTCCTTGATCATTCCAAAATCAAATCCTAAATTAACAAAAAAAGACTTCCTA 

ACAAAGAAAGTTATCCCACTTAACTATGTTGCTCTTGGAGATTCTCTGACCGAAGGTGTGGGGGATACAACCTCTCAAGGTGGTTT 

TGTCCCACTGCTATCAGAATCACTCCATAATCGATACTCTTACCAAGTGACTTCTGTTAATTATGGTGTGTCTGGGAATACTAGTC 

AACAAATTTTAAAACGTATGACGACAGATCCTCAAATCGAAAAAGATTTAGAGAAAGCTGATTTATTGACGCTAACTGTTGGTGGT 

AATGATGTCTTGGCTGTTATTCGTAAAGAGCTCAGTCATTTATCACTAAATTCCTTTGAGAAACCAGCAGAAGCATATAAGGAACG 
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TTTGAAAGAAATTCTTGCAAAAGCAAGACAAGATAATCCTAAATTGCCTATTTATGTTTTAGGCATTTATAATCCTTTTTACCTAA 
ACTTTCCACAATTAACTAAAATGCAAACCGTTATTGATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTCAGAAAATGTT 
TATTTTGTCCCAATTAATGACCGCCTTTATAAGGGAATAAATGGTAAAGAGGGTATTACAGAGTCATCAAATAGTCAGGCAAGTAT 
CACTAATGATGCTCTCTTTACTGGAGACCATTTTCATCCCAATAATATTGGCTATCAAATCATGTCTAACGCCGTTATGGAGAAAA 
TAAATGAAACAAGAAAAAACTGGCCGAACCCAGCTTTCTTGTACAAA 

SEQ ID NO. 2605: SA60503 FROM THE CJB110 GBS NONTYPEABLE STRAIN (REVERSE COMPLEMENT) 

GTTTGTACAAAAAAGCAGGCTCTATTTTTTCCTTGATCATTCCAAAATCAAATCCTAAATTAACAAAAAAAGACT 

AAAGTTATCCCACTTAACTATGTTGCTCTTGGAGATTCTCTGACCGAAGGTGTGGGCGATACAACCTCTCAAGGTGGTTTTGTCCC 

ACTGCTATCAGAATCACTCCATAATCGATACTCTTACCAAGTGACTTCTGTTAATTATGGTGTGTCTGGGAATACTAGTCAACAAA 

TTTTAAAACGTATGACGACAGATCCTCAAATCGAAAAAGATTTAGAGAAAGCTGATTTATTGACGCTAACTGTTGGTGGTAATGAT 

GTCTTGGCTGTTATTCGTAAAGAGCTCAGTCATTTATCACTAAATTCCTTTGAGAAACCAGCAGAAGCATATAAGGAACGTTTGAA 

AGAAATACTTGCAAAAGCAAGACAAGATAATCCTAAATTGCCTATTTATGTTTTAGGCATTTATAATCCTTTTTACCTAAACTTTC 

CACAATTAACTAAAATGCAAACCGTTATTGATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTCAGAAAATGTTTATTTT 

GTCCCAATTAATGACCGCCTTTATAAGGGAATAAATGGTAAAGAGGGTATTACAGAGTCATCAAATAGTCAGGCAAGTATCACTAA 

TGATGCTCTCTTTACTGGAGACCATTTTCATCCCAATAATATTGGCTATCAAATCATGTCTAACGCCGTTATGGAGAAAATAAATG 

AAACAAGAAAAAACTGGCCGAACCCAGCTTTCTTGTACAA 

SEQ ID NO. 2606: SAG0503 FROM THE 1169NT1 GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

GTTTGTACAAAAAAGCAGGCTCTATTTTTTCCTTGATCATTCCAAAATCAAATCCTAAATTAACAAAAAAAGACTTCCTAACAAAG 
AAAGTTATCCCACTTAACTATGTTGCTCTTGGAGATTCTCTGACCGAAGGTGTGGGGGATACAACCTCTCAAGGTGGTTTTGTCCC 
ACTGCTATCAGAATCACTCCATAATCGATACTCTTACCAAGTGACTTCTGTTAATTATGGTGTGTCTGGGAATACTAGTCAACAAA 
TTTTAAAACGTATGACGACAGATCCTCAAATCGAAAAAGATTTAGAGAAAGCTGATTTATTGACGCTAACTGTTGGTGGTAATGAT 
GTCTTGGCTGTTATTCGTAAAGAGCTCAGTCATTTATCACTAAATTCCTTTGAGAAACCAGCAGAAGCATATAAGGAACGTTTGAA 
AGAAATTCTTGCAAAAGCAAGACAAGATAATCCTAAATTGCCTATTTATGTTTTAGGCATTTATAATCCTTTTTACCTAAACTTTC 
CACAATTAACTAAAATGCAAACCGTTATTGATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTCAGATU^ATGTTTATTTT 
GTCCCAATTAATGACCGCCTTTATAAGGGAATAAATGGTAAAGAGGGTATTACAGAGTCATCAAATAGTCAGGCAAGTATCACTAA 
TGATGCTCTCTTTACTGGAGACCATTTTCATCCCAATAATATTGGCTATCAAATCATGTCTAACGCCGTTATGGAGAAAATAAATG 
AAACAAGAAAAAACTGGCCGAACCCAGCTTTCTTGTACAAA 

SEQ ID NO. 2607 : SAG0503 FROM THE JM9130013 GBS TYPE VIII STRAIN 
(REVERSE COMPLEMENT) 

GTTTGTACAAAAAAGCAGGCTCTATTTTTTCCTTGATCATTCCAAAATCAAATCCTAAATTAACAAAAAAAGACTTCCTAACAAAG 
AAAGTTATCCCACTTAACTATGTTGCTCTTGGAGATTCTCTGACCGAAGGTGTGGGCGATACAACCTCTCAAGGTGGTTTTGTTCC 
ACTGCTATCAGAATCACTCCATAATCGATACTCTTACCAAGTGACTTCTGTTAATTATGGTGTGTCTGGGAATACTAGTCAACAAA 
TTTTAAAACGTATGACGACAGATCCTCAAATCGAAAAAGATTTAGAGAAAGCTGATTTATTGACGCTAACTGTTGGTGGTAATGAT 
GTCTTGGCTGTTATTCGTAAAGAGCTCAGTCATTTATCACTAAATTCCTTTGAGAAACCAGCAGAAGCATATAAGGAACGTTTGAA 
AGAAATCCTTGCAAAAGCAAGACAAGATAATCCTAAATTGCCTATTTATGTTTTAGGCATTTATAATCCTTTTTACCTAAACTTTC 
CACAATTAACTAAAATGCAAACCGTTATTGATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTCAGAAAATGTTTATTTT 
GTCCCAATTAATGACCGqCTTTATAAGGGAATAAATGGTAAAGAGGGTATTACAGAGTCATCAAATAGTCAGGCAAGTATCACTAA 
TGATGCTCTCTTTACTGGAGACCATTTTCATCCCAATAATATTGGCTATCAAATCATGTCTAACGCCGTTATGGAGAAAATAAATG 
AAACAAGAAAAAACTGGCCGAACCCAGCTTTCTTGTACAAA 

SEQ ID NO. 2608: SAG0503 FROM THE 2603 V/R GBS TYPE V STRAIN 
(REVERSE COMPLEMENT) 

AGTTTGTACAAAAAAGCAGGCTCTATTTTTTCCTTGATCATTCCAAAATCAAATCCTAAATTAACAAAAAAAGACTTCCTAACAAA 
GAAAGTTATCCCACTTAACTATGTTGCTCTTGGAGATTCTCTGACCGAAGGTGTGGGCGATACAACCTCTCAAGGTGGTTTTGTTC 
CACTGCTATCAGAATCACTCCATAATCGATACTCTTACCAAGTGACTTCTGTTAATTATGGTGTGTCTGGGAATACTAGTCAACAA 
ATTTTAAAACGTATGACGACAGATCCTCAAATCGAAAAAGATTTAGAGAAAGCTGATTTATTGACGCTAACTGTTGGTGGTAATGA 
TGTCTTGGCTGTTATTCGTAAAGAGCTCAGTCATTTATCACTAAATTCCTTTGAGAAACCAGCAGAAGCATATAAGGAACGTTTGA 
AAGAAATCCTTGCAAAAGCAAGACAAGATAATCCTAAATTGCCTATTTATGTTTTAGGCATTTATAATCCTTTTTACCTAAACTTT 
CCACAATTAACTAAAATGCAAACCGTTATTGATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTCAGAAAATGTTTATTT 
TGTCCCAATTAATGACCGCCTTTATAAGGGAATAAATGGTAAAGAGGGTATTACAGAGTCATCAAATAGTCAGGCAAGTATCACTA 
ATGATGCTCTCTTTACTGGAGACCATTTTCATCCCAATAATATTGGCTATCAAATCATGTCTAACGCCGTTATGGAGAAAATAAAT 
GAAACAAGAAAAAACTGGCCGAACCCAGCTTTCTTGTACAAAGTGG 

SEQ ID NO. 2609: SAG0503 FROM THE M781 GBS TYPE III STRAIN 
(REVERSE COMPLEMENT) 

GGACAAGTTTGTACAAAAAAGCAGGCTCTA^TTTTTCCTTGATCATTCCAAAATCAAATCCTAAATTAACAAAAAAAGACTTCCTA 
ACAAAGAAAGTTATCCCACTTAACTATGTTGCTCTTGGAGATTCTCTGACCGAAGGTGTGGGGGATACAACCTCTCAAGGTGGTTT 
TGTCCCACTGCTATCAGAATCACTCCATAATCGATACTCTTACCAAGTGACTTCTGTTAATTATGGTGTGTCTGGGAATACTAGTC 
AACAAATTTTAAAACGTATGACGACAGATCCTCA7VATCGAAAAAGATTTAGAGAAAGCTGATTTATTGACGCTAACTGTTGGTGGT 
AATGATGTCTTGGCTGTTATTCGTAAAGAGCTC^GTCATTTATC^CTAAATTCCTTTGAGAAACCAGCAGAAGCATATAAGGAACG 
TTTGAAAGAAATTCTTGCAAAAGCAAGACAAGATAATCCTAAATTGCCTATTTATGTTTTA<3GCATTTATAATCCTTTTTACCTAA 
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ACTTTCCACAATTAACTAAAATGCAAACCGTTATTGATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTCAGAAAATGTT 
TATTTTGTCCCAATTAATGACCGCCTTTATAAGGGAATAAATGGTAAAGAGGGTATTACAGAGTCATCAAATAGTCAGGCAAGTAT 
CACTAATGATGCTCTCTTTACTGGAGACCATTTTCATCCCAATAATATTGGCTATCAAATCATGTCTAACGCCGTTATGGAGAAAA 
TAAATGAAACAAGAAAAAACTGGCCGAACCCAGCTTTCTTGTACAAA 

>SEQ ID NO 2650:103_090 frame: 2 

IFSLIIPKSNPKLTKKDFLTKKVIPLNYVALGDSLTEGVGDTTSQGGFVP 

LLSESLHNRYSYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDLEKADLLTLTVGGNDVLA 

VIRKELSHLSLNSFEKPAEAYKERLKEILAKARQDNPKLPIYVLGIYNPFYLNFPQLTKM 

QTVIDNWNKATKEWDASENVYFVPINDRLYKGINGKEGITESSNSQASITNDALFTGDH 

FHPNNIGYQIMSNAVMEKINETRKNWP 

>SEQ ID NO 2651:103_H36B frame: 2 

IFSLIIPKSNPKLTKKDFLTKKVIPLNYVALGDSLTEGVGDTTSQGGFVPLLS 

ESLHNRYSYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDLEKADLLTLTVGGNDVLAVIR 

BCELSHLSLNSFEKPAEAYKERLKEILAKARQDNPKLPIYVLGIYNPFYLNFPQLTKMQTV 

IDNWNKATKEWDASENVYFVPINDRLYKGINGKEGIIESSNSQASITNDALFTGDHFHP 

NNIGYQIMSNAVMEKINETRKNWP 

>SEQ ID NO 2652:103_18RS21 frame: 3 

IFSLIIPKSNPKLTKKDFLTKKVIPLNYVALGDSLTEGVGDTTSQGGFVPLLS 

ESLHNRYSYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDLEKADLLTLTVGGNDVLAVIR 

KELSHLSLNSFEKPAEAYKERLKEILAKARQDNPBCLPIYVLGIYNPFYLNFPQLTKMQTV 

IDNWNKATKEWDASENVYFVPINDRLYKGINGKEGITESSNSQASITNDALFTGDHFHP 

NNIGYQIMSNAVMEKINETRKNWP 

>SEQ ID NO 2653:103_COH1 frame: 3 

IFSLIIPKSNPKLTKKDFLTKKVIPLNYVALGDSLTEGVGDTTSQGGFVPL 

LSESLHNRYSYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDLEKADLLTLTVGGNDVLAV 

IRKELSHLSLNSFEKPAEAYKERI1KEII1AKARQDNPKLPIYVLGIYNPFYLNFPQLTKMQ 

TVIDNWNKATKEWDASENVYFVPINDRLYKGINGKEGITESSNSQASITNDALFTGDHF 

HPNNIGYQIMSNAVMEKINETRKNWP 

>SEQ ID NO 2654:103jCJB110 frame: 3 

IFSLIIPKSNPKLTKKDFLTKKVIPLNYVALGDSLTEGVGDTTSQGGFVPLLS 

ESLHNRYSYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDLEKADLLTLTVGGNDVLAVIR 

KELSHLSLNSFEKPAEAYKERLKEILAKARQDNPKLPIYVLGIYNPFYLNFPQLTKMQTV 

IDNWNKATKEWDASENVYFVPINDRLYKGINGKEGITESSNSQASITNDALFTGDHFHP 

NNIGYQIMSNAVMEKINETRKNWP 

>SEQ ID NO 2655: 103 JL169NT frame: 3 

IFSLIIPKSNPKLTKKDFLTKKVIPLNYVALGDSLTEGVGDTTSQGGFVPLLS 

ESLHNRYSYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDLEKADLLTLTVGGNDVLAVIR 

KELSHLSLNSFEKPAEAYKERLKEILAKARQDNPKLPIYVLGIYNPFYLNFPQLTKMQTV 

IDNWNKATKEWDASENVYFVPINDRLYKGINGKEGITESSNSQASITNDALFTGDHFHP 

NNIGYQIMSNAVMEKINETRKNWP 

>SEQ ID NO 2656:103_OM9130013 frame: 3 

IFSLIIPKSNPKLTKKDFLTKKVIPLNYVALGDSLTEGVGDTTSQGGFVPLLS 

ESLHNRYSYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDLEECADLLTLTVGGNDVLAVIR 

KELSHLSLNSFEKPAEAYKERLKEILAKARQDNPKLPIYVLGIYNPFYLNFPQLTKMQTV 

IDNWNKATKEWDASENVYFVPINDRLYKGINGKEGITESSNSQASITNDALFTGDHFHP 

NNIGYQIMSNAVMEKINETRKNWP 

>SEQ ID NO 2657:103_2603 frame: 1 

IFSLIIPKSNPKLTKKDFLTKKVIPLNYVALGDSLTEGVGDTTSQGGFVPLL 

SESLHNRYSYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDLEKADLLTLTVGGNDVLAVI 

RKELSHLSLNSFEKPAEAYKERLKEILAKARQDNPKLPIYVLGIYNPFYLNFPQLTKMQT 

VIDNWNKATKEWDASENVYFVPINDRLYKGINGKEGITESSNSQASITNDALFTGDHFH 

PNNIGYQIMSNAVMEKINETRKNWP 

>SEQ ID NO 2658:103_M781 frame: 3 

IFSLIIPKSNPKLTKKDFLTKKVIPLNYVALGDSLTEGVGDTTSQGGFVPL 
LSESLHNRYSYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDLEKADLLTLTVGGNDVLAV 
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IRKELSHLSLNSFEKPAEAYKERLKEILAKARQDNPKIiPIYVLGIYNPFYLNFPQLTKMQ 
TVIDNWNKATKEWDASENVYFVPINDRLYKGINGKEGITESSNSQASITNDALFTGDHF 
HPNNIGYQIMSNAVMEKINETRKNWP 

SEQ ID NO. 2701: SA61473 FROM THE 1169NT1 GBS TYPE V STRAIN 
(REVERSE COMPLEMENT) 

GATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAAAGATCAGATGAACTAGACCAGTCTAG 
TACTGGTTCTTCTTCTGAAAATGAATCGAGTTCATCAAGTGAACCAGAAACAAATCCGTCAACTAATCCACCTACAACAGAACCAT 
CGCAACCCTCACCTAGTGAAGAGAACAAGCCTGATGGTAGAACGAAGACAGAAATTGGCAATAATAAGGATATTTCTAGTGGAACA 
AAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATCATCATC 
TTCAAAAGCAAGTGATGGGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2702: SAG1473 FROM THE 18RS21 GBS TYPE II STRAIN 

GATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAAAGATCAGATGAACTAGACCAGTCTAG 
TACTGGTTCTTCTTCTGAAAATGAATCGAGTTCATCAAGTGAACCAGAAACAAATCCGTCAACTAATCCACCTACAACAGAACCAT 
CGCAACCCTCACCTAGTGAAGAGAACAAGCCTGATGGTAGAACGAAGACAGAAATTGGCAATAATAAGGATATTTCTAGTGGAACA 
AAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATCATCATC 
TTCAAAAGCAAATGATGGGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2703: SAG1473 FROM THE 2603 V/R GBS TYPE V STRAIN 

GATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAAAGATCAGATGAACTAGACCAGTCTAG 
TACTGGTTCTTCTTCTGAA/^ATGAATCGAGTTCATCAAGTGAACCAGAAACAAATCCGTCAACTAATCCACCTACAACAGAACCAT 
CGCAACCCTCACCTAGTGAAGAGAACAAGCCTGATGGTAGAACGAAGACAGAAATTGGCAATAATAAGGATATTTCTAGTGGAACA 
AAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATCATCATC 
TTCAAAAGCAAATGATGGGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2704: SAG1473 FROM THE 090 GBS TYPE la STRAIN 

GACCAGTCTAGTACTGGTTCTTCTTCTGAAAATGAATCGAGTTCATCAAGTGAACCAGAAACAAATCCGTCAACTAATCCACCTAC 
AACAGAACCATCGCAACCCTCACCTAGTGAAGAGAACAAGCCTGATGGTAGAACGAAGACAGAAATTGGCAATAATAAGGATATTT 
CTAGTGGAACAAAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGGATCGCGAT 
GAATCATCATCTTCAAAAGCAAATGAtGGGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2705: SAG1473 FROM THE A909 GBS TYPE la STRAIN 

GATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAAAGATTAGATGAACTAGACCAGTCTAG 
TACTGGTTCTTCTTCTGAAAATGAATCGAGTTCATCAAGTGAACCAGAAACAAATCCCTCAACTAATCCACCTACAACAGAACCAT 
CGCAACCCTCACCTAGTGAAGAGAACAAGCCTGATGGTAGCACGAAGACAGAAATTGGCAATAATAAGGATATTTCTAGTGGAACA 
AAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATCATCATC 
TTCAAAAGCAAATGATGAGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2706: SAG1473 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

GATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAAAGATCAGATGAACTAGACCAGTCTAG 
TACTGGTTCTTCTTCTGAAAATGAATCGAGTTCATCAAGTGAACCAGAAACAAATCCGTCAACTAATCCACCTACAACAGAACCAT 
CGCAACCCTCACCTAGTGAAGAGAACAAGCCTGATGGTAGAACGAAGACAGAAATTGGCAATAATAAGGATATTTCTAGTGGAACA 
AAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATCATCATC 
TTCAAAAGCAAATGATGGGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2707: SAG1473 FROM THE COH1 GBS TYPE III STRAIN 
(REVERSE COMPLEMENT) 

GATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAAAGATCAGATGAACTAGACCAGTCTAG 
TACTGGTTCTTCTTCTGAAAATGAATCAAGTTCATCAAGTGAACCAGAAACAAATCCCTCAACTAATCCACCTACAACAGAACCAT 
CGCAACCCTCACCTAGTGAAGAGAACAAGCCTGATGGGAGCACGAAGACAGAAATTGGCAATAATAAGGATATTTCTAGTGGAACA 
AAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGGAACGCGATGAATCATCATC 
TTCAAAAGCAAATGATGAGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2708: SAG1473 FROM THE H36b GBS TYPE lb STRAIN 

GATACAAGTGAT7VAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAAAGATTAGATGAACTAGACCAGTCTAG 
T ACTGGTTCTTCTT CTGAAAATGAATCGAGTTCATCAAGTGAACCAGAAACAAAT CCCT C AACTAATCCACCT ACAACAGAACCAT 
CGCAACCCTCACCTAGTGAAGAGAACAAGCCTGATGGTAGCACGAAGACAGAAATTGGCAATAATAAGGATATTTCTAGTGGAACA 
AAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAArAAGTGGATCGCGATGAATCATCATC 
TTCAAAAGCAAATGATGAGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2709: SAG1473 FROM THE JM910013 GBS TYPE VIII STRAIN 

GATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAAAGATTAGATGAACTAGACCAGTCTAG 
TACTGGTTCTTCTTCTGAAAATGAATCGAGTTCATCAAGTGAACCAGAAACAAATCCCTCAACTAATCCACCTACAACAGAACCAT 



121 



WO 2004/018646 



PCT7US2003/026827 



SEQUENCE LISTING 



CGCAACCCTCACCTAGTGAAGAGAACAAGCCTGATGGTAGCACGAAGACAGAAATTGGCAATAATAAGGATATTTCTAGTGGAACA 
AAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATCATCATC 
TTCAAAAGCAAATGATGAGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ XD NO. 27X0: SAG1473 FROM THE M732 GBS TYPE III STRAIN 

GATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAAAGATCAGATGAACTAGACCAGTCTAG 
TACTGGTTCTTCTTCTGAAAATGAATCAAGTTCATCAAGTGAACCAGAAAC^AATCCCTCAACTAATCCACCTACAACAGAACCAT 
CGCAACCCTCACCTAGTGAAGAGAACAAGCCTGATGGGAGCACGAAGACAGAAATTGGCAAT7\ATAAGGATATTTCTAGTGGAACA 
AAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGGAACGCGATGAATCATCATC 
TTCAAAAGCAAATGATGAGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2711: SAG1473 PROM THE M781 GBS TYPE III STRAIN 

GATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAAAGATCAGATGAACTAGACCAGTCTAG 
TACTGGTTCTTCTTCTGAAAATGAATCAAGTTCATCAAGTGAACCAGAAACAAATCCCTCAACTAATCCACCTACAACAGAACCAT 
CGCAACCCTCACCTAGTGAAGAGAACAAGCCTGATGGGAGCACGAAGACAGAAATTGGCAATAATAAGGATATTTCTAGTGGAACA 
AAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATCATCATC 
TTCAAAAGCAAATGATGAGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

>SEQ ID NO 2750:4_1169NT frame: 1 

DTSDKNTDTSVVTTTLSEEKRSDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 
SPSEENKPDGRTKTEIGNNKDISSGTKVLISEDSIKNFSKASSDQEEVDRDESSSSKASD 
GKKGHSKPKKE 

>SEQ ID NO 2751:4_18RS21 frame: 1 

DTSDKNTDTSWTTTLSEEKRSDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 
S PSEENKPDGRTKTE IGNNKDI SSGTKVLI SEDS IKNFSKAS S DQEE VDRDES S S SKAN D 
GKKGHSKPKKE 

>SEQ ID NO 2752:4_2603 frame: 1 

DTSDKNTDTSVVTTTLSEEKRSDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 
SPSEENKPDGRTKTEIGNNKDI SSGTKVLI SEDS IKNFSKASSDQEEVDRDESSSSKAND 
GKKGHSKPKKE 

>SEQ ID NO 2753:4_090 frame: 1 

DQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQPSPSEENKPDGRTKTEIGNNKDISSG 
TKVLISEDSIKNFSKASSDQEEVDRDESSSSKANDGKKGHSKPKKE 

>SEQ ID NO 2754:4_A909 frame: 1 

DTSDKNTDTSVVTTTLSEEKRLDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 
SPSEENKPDGSTKTEIGNNKDISSGTKVLISEDSIKNFSKASSDQEEVDRDESSSSKAND 
EKKGHSKPKKE 

>SEQ ID NO 2755:4_CJB110 frame: 1 

DTSDKNTDTSVVTTTLSEEKRSDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 
SPSEENKPDGRTKTEIGNNKDISSGTKVLISEDSIKNFSKASSDQEEVDRDESSSSKAND 
GKKGHSKPKKE 

>SEQ ID NO 2756:4_C0H1 frame: 1 

DTSDKNTDTSWTTTLSEEKRSDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 
SPSEENKPDGSTKTEIGNNKDISSGTKVLISEDSIKNFSKASSDQEEVERDESSSSKAND 
EKKGHSKPKKE 

>SEQ ID NO 2757:4_H36B frame: 1 

DTSDKNTDTSWTTTLSEEKRLDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 
SPSEENKPDGSTKTEIGNNKDISSGTKVLI SEDS IKNFSKASSDQEXVDRDESSS SKAN D 
EKKGHSKPKKE 

>SEQ ID NO 2758:4_JM9130013 frame: 1 

DTSDKNTDTSVVTTTLSEEKRLDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 
SPSEENKPDGSTKTEIGNNKDISSGTKVLI SEDS IKNFSKASSDQEEVDRDESSSSKAND 
EKKGHSKPKKE 

>SEQ ID NO 2759:4_M732 frame: 1 

DTSDKNTDTSWTTTLSEEKRSDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 
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SPSEENKPDGSTKTEIGNNKDISSGTKVLISEDSIKNFSKASSDQEEVERDESSSSKAND 
EKKGHSKPKKE 

>SEQ XD NO 2760:4_M781 frame: 1 

DTSDKNTDTSWTTTLSEEKRS DELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 
SPSEENKPDGSTKTEIGNNKDISSGTKVLISEDSIKNFSKASSDQEEVDRDESSSSKAND 
EKKGHSKPKKE 

SEQ ID NO. 2801: SAG1552 FROM THE 1169NT1 GBS TYPE V STRAIN 
(REVERSE COMPLEMENT) 

TTTGTTGTTAAAGGTGATACTGTACTTCACAAGCCCACCAATAAACCTTTTGTTGTTAAAGGAGTAGACGTTGAGTCTTCCTTAGC 
AGGTTATCATCACAACGATTTTCCTATTACTCAAAAAACGTATCGTGAGTGGTTCCATTTAATTTCCAACATGGGGGCAAATACTG 
TAAGAGTCAAAGTACCGATGAATGTTGCATTTTACGATGCTTTATATCACCACAACAAAGCATCAAAGAGGCCACTGTATTTGTTG 
CAAGGAATACGTATAGATTCTTATCGCAATAATGCTTCTATAACAGCTTTTAATGATAATTATAGGGGGTATTTAAAACGAGAAGC 
AAAAGGCGTTGTGGATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGATTTTGGTAGCCGTCATTATCATTATGATCTTAGTC 
CTTGGGTACTTGGTTATGTCGTAGGGGATGATTGGAATAGTGGTACTGTCGCTTATACTAATCATCAAGAGAAAAAAACGCAATAT 
AAAGGACGTTATTTTAAAACTTCTGCGGCAGCTAATCCATTTGAGGTCATGCTAGCTCAAGTTATGGATGAATTGACACATTATGA 
GACAGCTAAATATGGTTGGCAACATTTGATTAGTTTTTCAAACTCACCAACAACAGACCCTTTTCGTTATCGAAAACCATTTGAGG 
CACAGGCTCCTAAATACGTACAACTAAATGTAGAAAATATTCAAGCTAATTCGAATGTTAAAGCAGGTATTTTTGCAGCATATAAA 
GCTATTGATTTCCATCCTCGATACAAGGATTATCTATTATTTGATAAAGAGAATATCAGTAAAGAAGATAGACAAAAGATTAAAGA 
ACTTTCTTTGTCACAGGGATACGTTAAACTGCTAAATGCTTATCACAAAATCCCTGTTCTAGTCACGGGTTATGGCTATTCGACAG 
CGAGAGGTATTGCCCAAAAAGAAATTGATAAACGTCCTCTGCCGATTAATGAAAAAGAACAAGGTCAGCGTTTACTAGAAGATTAT 
GAATCTTTTATATCATCCGGTAGTTTTGGAGCGACTATCAATGCATGGCAAGACGATTGGAATGCAAGGGCGTGGAATACATCCTT 
CGCCACAAATAAACATAGTCAATTCCTATGGGGGGATGCACAAGTATTTAATCAAGGTTATGGTTTATTAGGCTTTAAAAACGCAA 
AACATCATTATCAAGTTGATGGTAAAAGAGGCAAAGGAGAGTGGAAACATCCTCTG 

SEQ ID NO. 2802: SAG1552 FROM THE 

ATGACTAGTGCAACAGGAGATGACTTATATGCTAGCAGTGATGAAAGCTATCTCTACCTTGCGATTAAAACAAAACCTGAAAAACT 
AAAAGAAAAACGAT T ATT ACCAAT AGATAT T ACAC C AAAAT CTGGTAGT AG AAAAATGAAT GGT AGT AAGGTCACAT T T T CT AAAT 
CTAGTGACTTTGTATTGTCTATTGATCCAAATGGCAAGTCTGAATTATTTGTCCAAGAGCGCTATAATGCCTTAAAAGCGAACTAT 
CTT CGAC AGCTTAACGGT AAAGAT TT TT AT GCT TT CC C AC CAAAG AAGAAC AGT AGT AATTTT G AGC AG AT CAAT AT GGTAT TGAG 
AAATACAAAGATTGTTGAAGACATGGAAAAAGTAAAAGCAACAGAGAGGTTCTTACCAACTCATCCTACTGGTCTTCTCAAAACAG 
GAACAATTGATAGGCACCAAAAAACATTTGATTCACAAACAGATATTTCGTTTGGAAAGGACTTTATAGAGGTCAGAATTCCGTGG 
CAGTTGTTGAATTTTTCTGATCCATCATCTCAAAAAATTCACGATGATTACTTTAAACATTATGGTGTGAAGGAGTTAGAAATTGA 
GAGCATTGCTTTAGGATTAGGTGCTAATAGCA/^AGAAAACACACTGATAAAGATGGCAGATTATCGTTTGAAAAATTGGGAGAGAC 
CCGATACCAAAACCTTTTTAAAAGACTCCTATTATAGTATTTAAGAAAGAA 

SEQ ID NO. 2803: SAG1552 FROM THE 18RS21 GBS TYPE II STRAIN 

AAGGGCTTATTAAAAGAAAATACAAGAACTAACTTTGTTGTTAAAGGTGATACTGTACTTCACAAGCCCACCAATAAACCTTTTGT 

TGTTAAAGGAGTAGACGTTGAGTCTTCCTTAGCGGGTTATCATCACAACGATTTTCCTATTACTCAAAAAACGTATCGTGAATGGT 

TCCATTTAATTTCCAACATGGGGGCAAATACTGTAAGAGTCAAGGTACCGATGAATGTTGCATTTTACGATGCCTTATATCACCAC 

AACAAAGCATCAAAGAGGCCACTGTATTTGTTGC^AGGAATACGTATAGATTCTTATCGCAATAATGCTTCTATAACAGCTTTTAA 

TGATAATTATAGGGGGTATTTAAAACGAGAAGCAAAAGGCGTTGTGGATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGATT 

TGGGTAGCCGTCATTATCATTATGATCTTAGTCCTTGGGTACTTGGTTATGTCGTAGGGGATGATTGGAATAGTGGTACTGTCGCT 

TATACTAATCATCAAGAGAAAAAAACGCAATATAAAGGACGTTATTTTAAAACTTCTGTGGCAGCTAATCCATTTGAGGTCATGCT 

AGCTCAAGTAATGGATGAATTGACACATTATGAGACAGCTAAATATGGTTGGCAACATTTGATTAGTTTTTCAAACTCACCAACAA 

CAGACCCTTTTCATTATCGAAAACCATTTGAGGCACAGGCTCCTAAATACGTACAACTAAATGTAGAAAATATTCAAGCTAATTCA 

AATGTTAAAGCAGGTATGTTTGCAGCATATAAAGCTATTGATTTCCATCCTCGATACAAGGATTATCTATTATTTGATAAAGAGAA 

TATCAGTAAAGAAGATAGACAAAAGATTAAAGAACTTTCTTTGTCACAGGGATACGTTAAACTGCTAAATGCTTATCACAAAATCC 

CTGTTCTAGTCACGGGTTATGGCTATTCGACAGCGAGAGGTATTGCCCAAAAAGAAATTGATAAACGTCCTCTGCCGATTAATGAA 

AAAGAACAAGGTCAGCGTTTACTAGAAGATTATGAATCTTTTATATCATCCGGTAGTTTTGGAGCGACTATCAATGCATGGCAAGA 

CGATTGGAATGCAAGGGCGTGGAATACATCTTTCGCCACAAATAAACATAGTCAATTCCTATGGGGGGATGCACAAGTATTTAATC 

AAGGTTATGGTTTATTAGGCTTTAAAAACGCAAAACATCATTATCAAGTTGATGGTAAAAGAGGCAAAGGAGAGTGGAAACATCCT 

CTGATGACTAGTGCAACAGGAGATGACTTATATGCTAGCAGTGATGAAAGCTATCTCTACCTTGCGATTAAAACAAAACCTGAAAA 

ACTAAAAGAAAAACGATTATTACCAATAGATATTACACCAAAATCTGGTAGTAGAAAAATGAATGGTAGTAAGGTCACATTTTCTA 

AATCTAGTGACTTTGTATTGTCTATTGATCCT^AATGGCAAGTCTGAATTATTTGTCCAAGAGCGCTATAATGCCTTAAAAGCGAAC 

TATCTTCGACAGCTTAACGGTAAAGATTTTTATGCTTTCCCACCAAAGAAGAACAGTAGTAATTTTGAGCAGATAAATATGGTATT 

GAGAAATACAAAGATTGTTGAAGACATGGAA7\AAGTAAAAGCAACAGAGAGGTTCTTACCAACTCATCCTACTGGTCTTCTCAAAA 

CAGGAACAACTGATAGGCACCAAAAAACATTTGATTCACAAACAGATATTTCGTTTGGAAAGGACTTTATAGAGGTCAGAATTCCG 

TGGCAGTTGTTGAATTTTTCTGATCCATCATCTCAAAAAATTCACGATGATTACTTTAAACATTATGGTGTGAAGGAGTTAGAAAT 

TGAGAGCATTGCTTTAGGATTAGGTGCTAATAGCAAAGAAAACACACTGATAAAGATGGCAGATTATCGTTTGAAAAATTGGGAGA 

GACCCGATACCAAAACCTTTTTAAAAGACTCCTATTATGTATTAAGAAAGAA 

SEQ ID NO. 2804: SAG1552 FROM THE 2603 V/R GBS TYPE V STRAIN 
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(REVERSE COMPLEMENT) 

TATTAAAAGAAAATACAAGAACTAACTTTGTTGTTAAAGGTGATACTGTACTTCACAAGCCCACCAATAAACCTTTTGTTGTTAAA 
GGAGTAGACGTTGAGTCTTCCTTAGCGGGTTATCATCACAACGATTTTCCTATTACTCAAAAAACGTATCGTGAATGGTTCCATTT 
AATTTCCAACATGGGGGCAAATACTGTAAGAGTCAAGGTACCGATGAATGTTGCATTTTACGATGCCTTATATCACCACAACAAAG 
CATCAAAGAGGCCACTGTATTTGTTGCAAGGAATACGTATAGATTCTTATCGCAATAATGCTTCTATAACAGCTTTTAATGATAAT 
TATAGGGGGTATTTAAAACGAGAAGCAAAAGGCGTTGTGGATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGATTTGGGTAG 
CCGTCATTATCATTATGATCTTAGTCCTTGGGTACTTGGTTATGTCGTAGGGGATGATTGGAATAGTGGTACTGTCGCTTATACTA 
ATCATCAAGAGAAAAAAACGCAATATAAAGGACGTTATTTTAAAACTTCTGTGGCAGCTAATCCATTTGAGGTCATGCTAGCTCAA 
GTAATGGATGAATTGACACATTATGAGACAGCTAAATATGGTTGGCAACATTTGATTAGTTTTTCAAACTCACCAACAACAGACCC 
TTTTCATTATCGAAAACCATTTGAGGCACAGGCTCCTAAATACGTACAACTAAATGTAGAAAATATTCAAGCTAATTCAAATGTTA 
AAGCAGGTATGTTTGCAGCATATAAAGCTATTGATTTCCATCCTCGATACAAGGATTATCTATTATTTGATAAAGAGAATATCAGT 
AAAGAAGATAGACAAAAGATTAAAGAACTTTCTTTGTCACAGGGATACGTTAAACTGCTAAATGCTTATCACAAAATCCCTGTTCT 
AGTCACGGGTTATGGCTATTCGACAGCGAGAGGTATTGCCCAAAAAGAAATTGATAAACGTCCTCTGCCGATTAATGAAAAAGAAC 
AAGGTCAGCGTTTACTAGAAGATTATGAATCTTTTATATCATCCGGTAGTTTTGGAGCGACTATCAATGCATGGCAAGACGATTGG 
AATGCAAGGGCGTGGAATACATCTTTCGCCACAAATAAACATAGTCAATTCCTATGGGGGGATGCACAAGTATTTAATCAAGGTTA 
TGGTTTATTAGGCTTTAAAAACGCAAAACATCATTATCAAGTTGATGGTAAAAGAGGCAAAGGAGAGTGGAAACATCCTCTGATGA 
CTAGTGCAACAGGAGATGACTTATATGCTAGCAGTGATGAAAGCTATCTCTACCTTGCGATTAAAACAAAACCTGAAAAACTAAAA 
GAAA^CGATTATTACCAATAGATATTACACCAAAATCTGGTAGTAGAAAAATGAATGGTAGTAAGGTCACATTTTCTAAATCTAG 
TGACTTTGTATTGTCTATTGATCCAAATGGCAAGTCTGAATTATTTGTCCAAGAGCGCTATAATGCCTTAAAAGCGAACTATCTTC 
GACAGCTTAACGGTAAAGATTTTTATGCTTTCCCACCAAAGAAGAACAGTAGTAATTTTGAGCAGATAAATATGGTATTGAGAAAT 
ACAAAGATTGTTGAAGACATGGAAAAAGTAAAAGCAACAGAGAGGTTCTTACCAACTCATCCTACTGGTCTTCTCAAAACAGGAAC 
AACTGATAGGCACCAAAAAACATTTGATTCACAAACAGATATTTCGTTTGGAAAGGACTTTATAGAGGTCAGAATTCCGTGGCAGT 
TGTTGAATTTTTCTGATCCATCATCTCAAAAAATTCACGATGATTACTTTAAACATTATGGTGTGAAGGAGTTAGAAATTGAGAGC 
ATTGCTTTAGGATTAGGTGCTAATAGCAAAGAAAACACACTGATAAAGATGGCAGATTATCGTTTGAAAAATTGGGAGAGACCCGA 
TACCAAAACCTTTTTAAAAGACTCCTATTATAGTATTAAGAAAGAATGGTCTAAAGAAAGAGAGAGAACATATGGTCCA 

SEQ ID NO. 2805: SAG1552 FROM THE A909 GBS TYPE la STRAIN 
(REVERSE COMPLEMENT) 

AAGGGCTTATTAAAAGAAAATACAAGAACTAACTTTGTTGTTAAAGGTGATACTGTACTTCACAAGCCCACCAATAAACCTTTTGT 

TGTTAAAGGAGTAGACGTTGAGTCTTCCTTAGCGGGTTATCATCACAACGATTTTCCTATTACTCAAAAAACGTATCGTGAATGGT 

TCCATTTAATTTCCAACATGGGGGCAAATACTGTAAGAGTCAAGGTACCGATGAATGTTGCATTTTACGATGCCTTATATCACCAC 

AACAAAGCATCAAAGAGGCCACTGTATTTGTTGCAAGGAATACGTATAGATTCTTATCGCAATAATGCTTCTATAACAGCTTTTAA 

TGATAATTATAGGGGGTATTTAAAACGAGAAGCAAAAGGCGTTGTGGATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGATT 

TGGGTAGCCGTCATTATCATTATGATCTTAGTCCTTGGGTACTTGGTTATGTCGTAGGGGATGATTGGAATAGTGGTACTGTCGCT 

TATACTAATCATCAAGAGAAAAAAACGCAATATAAAGGACGTTATTTTAAAACTTCTGTGGCAGCTAATCCATTTGAGGTCATGCT 

AGCTCAAGTAATGGATGAATTGACACATTATGAGACAGCTAAATATGGTTGGCAACATTTGATTAGTTTTTCAAACTCACCAACAA 

CAGACCCTTTTCATTATCGAAAACCATTTGAGGCACAGGCTCCTAAATACGTACAACTAAATGTAGAAAATATTCAAGCTAATTCA 

AATGTTAAAGCAGGTATGTTTGCAGCATATAAAGCTATTGATTTCCATCCTCGATACAAGGATTATCTATTATTTGATAAAGAGAA 

TATCAGTAAAGAAGATAGACAAAAGATTAAAGAACTTTCTTTGTCACAGGGATACGTTAAACTGCTAAATGCTTATCACAAAATCC 

CTGTTCTAGTCACGGGTTATGGCTATTCGACAGCGAGAGGTATTGCCCAAAAAGAAATTGATAAACGTCCTCTGCCGATTAATGAA 

AAAGAACAAGGTCAGCGTTTACTAGAAGATTATGAATCTTTTATATCATCCGGTAGTTTTGGAGCGACTATCAATGCATGGCAAGA 

CGATTGGAATGCAAGGGCGTGGAATACATCTTTCGCCACAAATAAACATAGTCAATTCCTATGGGGGGATGCACAAGTATTTAATC 

AAGGTTATGGTTTATTAGGCTTTAAAAACGCAAAACAT(^TTATO^GTTGATGGTAAAAGAGGCAAAGGAGAGTGGAAACATCCT 

CTGATGACTAGTGCAACAGGAGATGACTTATATGCTAGCAGTGATGAAAGCTATCTCTACCTTGCGATTAAAACAAAACCTGAAAA 

ACTAAAAGAAAAACGATTATTACCAATAGATATTACACCAAAATCTGGTAGTAGAAAAATGAATGGTAGTAAGGTCACATTTTCTA 

AATCTAGTGACTTTGTATTGTCTATTGATCCAAATGGCAAGTCTGAATTATTTGTCCAAGAGCGCTATAATGCCTTAAAAGCGAAC 

TATCTTCGACAGCTTAACGGTAAAGATTTTTATGCTTTCCCACCAAAGAAGAACAGTAGTAATTTTGAGCAGATAAATATGGTATT 

GAGAA^TACAAAGATTGTTGAAGACATGGAAAAAGTAAAAGCAACAGAGAGGTTCTTACCAACTCATCCTACTGGTCTTCTCAAAA 

CAGGAACAACTGATAGGCACCAAAAAACATTTGATTCACAAACAGATATTTCGTTTGGAAAGGACTTTATAGAGGTCAGAATTCCG 

TGGCAGTTGTTGAATTTTTCTGATCCATCATCTCAAAGAATTCACGATGATTACTTTAAACATTATGGTGTGAAGGAGTTAGAAAA 

TTGAGAGCCATTGCTTTAGGATTAGGTGCTAATAGCAAAGAAAACACACTGATAAAGATGGCAGATTATCGTTTGAAAAATTGGGA 

GAGACCCGATACCAAAACCTTTTTAAAAGA 

SEQ ID NO. 2806: SAG1552 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

TATTACTTTGATGGTAGTTTGTATTTACCAAAGGGCTTATTAAAAGAAAATACAAGAACTAACTTTGTTGTTAAAGGTGATACTGT 
ACTT CACAAGCCCACCAATAAACCTTTTGTTGTTAAAGGAGT AGACGTTGAGT CTTCCTT AGCGGGTTATCATCACAACGATTTT C 
CTATTACTCAAAAAACGTATCGTGAATGGTTCCATTTAATTTCCAACATGGGGGCAAATACTGTAAGAGTCAAGGTACCGATGAAT 
GTTGCATTTTACGATGCCTTATATCACCACAACAAAGCATCAAAGAGGCCACTGTATTTGTTGCAAGGAATACGTATAGATTCTTA 
TCGCAATAATGCTTCTATAACAGCTTTTAATGATAATTATAGGGGGTATTTAAAACGAGAAGCAAAAGGCGTTGTGGATATTCTCC 
ATGGGCGTAAGCAAGTATGGAATACAGATTTTGGTAGCCGTCATTATCATTATGATCTTAGTCCTTGGGTACTTGGTTATGTCGTA 
GGGGATGATTGGAATAGTGGTACTGTCGCTTATACTAATCATCAAGAGAAAAAAACGCAATATAAAGGACGTTATTTTAAAACTTC 
TGTGGCAGCTAATCCATTTGAGGTCATGCTAGCTCAAGTAATGGATGAATTGACACATTATGAGACAGCTAAATATGGTTGGCAAC 
ATTTGATTAGTTTTTCAAACTCACCAACAACAGACCCTTTTCATTATCGAA7VACCATTTGAGGCACAGGCTCCTAAATACGTACAA 
CTAAATGTAGAAAATATTCAAGCTAATTCAAATGTTAAAGCAGGTATGTTTGCAGCATATAAAGCTATTGATTTCCATCCTCGATA 
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CAAGGATTATCTATTATTTGATAAAGAGAATATCAGTAAAGAAGATAGACAAAAGATTAAAGAACTTTCTTTGTCACAGGGATACG 
TTAAACTGCTAAATGCTTATCACAAAATCCCTGTTCTAGTCACGGGTTATGGCTATTCGACAGCGAGAGGTATTGCCCAAAAAGAA 
ATTGATAAACGTCCTCTGCCGATTAATGAA7VAAGAACAAGGTCAGCGTTTACTAGAAGATTATGAATCTTTTATATCATCCGGTAG 
TTTTGGAGCGACTATCAATGCATGGCAAGACGATTGGAATGCAAGGGCGTGGAATACATCTTTCGCCACAAATAAACATAATCAAT 
TCCTATGGGGGGATGCACAAGTATTTAATCAAGGTTATGGTTTATTAGGCTTTAAAAACGCAAAACATCATTATCAAGTTGATGGT 
AAAAGAGGCAAAGGAGAGTGGAAACATCCTCTGATGACTAGTGCAACAGGAGATGACTTATATGCTAGCAGTGATGAAAGCTATCT 
CTACCTTGCGATTAAAACAAAACCTGAAAAACTAAAAGAAAAACGATTATTACCAATAGATATTACACCAAAATCTGGTAGTAGAA 
AAATGAATGGTAGTAAGGTCACATTTTCTAAATCTAGTGACTTTGTATTGTCTATTGATCCAAATGGCAAGTCTGAATTATTTGTC 
CAAGAGCGCTATAATGCCTTAAAAGCGAACTATCTTCGACAGCTTAACGGTAAAGATTTTTATGCTTTCCCACCAAAGAAGAACAG 
TAGTAATTTTGAGCAGATAAATATGGTATTGAGAAATACAAAGATTGTTGAAGACATGGAAAAAGTAAAAGCAACAGAGAGGTTCT 
TACCAACTCATCCTACTGGTCTTCTC7\AAACAGGAACAACTGATAGGCACCAAAAAACATTTGATTCACAAACAGATATTTCGTTT 
GGAAAGGACTTTATAGAGGTCAGAATTCCGTGGCAGTTGTTGAATTTTTCTGATCCATCATCTCAAAAAATTCACGATGATTACTT 
TAAACATTATGGTGTGAAGGAGTTAGAAATTGAGAGCATTGCTTTAGGATTAGGTGCTAATAGCAAAGAAAACACACTGATAAAGA 
TGGCAGATTATCGTTTGAAAAATTGGGAGAGACCCGATACCAAAACCTTTTTAAAAGACTCCTATTATGTATTAAGAAAGA 

SEQ ID NO. 2807: SAG1552 PROM THE COHl GBS TYPE III STRAIN 

TTTACCACAGGGCTTATTAAAAGAAAATACAAGAACTAACTTTGTTGTTAAAGGTGATACTGTACTTCACAAGCCCACCAATAAAC 
CTTTTGTTGTTAAAGrGAGTAGACGTTGAGTCTTCCTTAGCGGGTTATCATCACAACGATTTTCCTATTACTCAAAAAACGTATCGT 
GAATGGTTCCATTTAATTTCCAACATGGGGGCAAATACTGTAAGAGTCAAGGTACCGATGAATGTTGCATTTTACGATGCCTTATA 
TCACCACAACAAAGAATCAAAGAGGCCACTGTATTTGTTGCAAGGAATACGTATAGATTCTTATCGCAATAATGCTTCTATAACAG 
CTTTTAATGATAATTATAGGGGGTATTTAAAACGAGAAGCAAAAGGCGTTGTGGATATTCTCCATGGGCGTAAGCAAGTATGGAAT 
ACTGATTTTGGTAGCCGTCATTATCATTATGATCTTAGTCCTTGGGTACTTGGTTATGTCGTAGGGGATGATTGGAATAGTGGTAC 
TGTCGCTTATACTAATCATCAAGAGAAAAAAACGCAATATAAAGGACGTTATTTTAAAACTTCTGTGGCAGCTAATCCATTTGAGG 
TCATGCTAGCTCAAGTAATGGATGAATTGACACATTATGAGACAGCTAAATATGGTTGGCAACATTTGATTAGTTTTTCAAACTCA 
CCAACAACAGACCCTTTTCATTATCGAAAACCATTTGAGGCACAGGCTCCTAAATACGTACAACTAAATGTAGAAAATATTCAAGC 
TAATTCAAATGTTAAAGCAGGTATGTTTGCAGCATATAAAGCTATTGATTTCCATCCTCGATACAAGGATTATCTATTATTTGATA 
AAGAGAATATCAGTAAAGAAGATAGACAAAAGATTAAAGAACTTTCTTTGTCACAGGGATACGTTAAACTGCTAAATGCTTATCAC 
AAAATCCCTGTTCTAGTCACGGGTTATGGCTATTCGACAGCGAGAGGTATTGCCCAAAAAGAAATTGATAAACGTCCTCTGCCGAT 
TAATGAAAAAGAACAAGGTCAGCGTTTACTAGAAGATTATGAATCTTTTATATCATCCGGTAGTTTTGGAGCGACTATCAATGCAT 
GGCAAGACGATTGGAATGCAAGGGCGTGGAATACATCTTTCGCCACAAATAAACATAGTCAATTCCTATGGGGGGATGCACAAGTA 
TTTAATCAAGGTTATGGTTTATTAGGCTTTAAAAACGCAAAACATCATTATCAAGTTGATGGTAAAAGAGGCAAAGGAGAGTGGAA 
ACATCCTCTGATGACTAGTGCAACAGGAGATGACTTATATGCTAGCAGTGATGAAAGCTATCTC^TACCTTGCGATTAAAACAAAAC 
CTGAAAAACTAAAAGAAAAACGATTATTACCAATAGATATTACACCAAAATCTGGTAGTAGAAAAATGAATGGTAGTAAGGTCACA 
TTTTCTAAATCTAGTGACTTTGTATTGTCTATTGATCCAAATGGCAAGTCTGAATTATTTGTCCAAGAGCGCTATAATGCCTTAAA 
AGCGAACTATCTTCGACAGCTTAACGGTAAAGATTTTTATGCTTTCCCACCAAAGAAGAACAGTAGTAATTTTGAGCAGATAAATA 
TGGTATTGAGAAATACAAAGATTGTTGAAGACATGGAAAAAGTAAAAGCAACAGAGAGGTTCTTACCAACTCATCCTACTGGTCTT 
CTCAAAACAGGAACAACTGATAGGCACCAAAAT^CATTTGATTCACAACCAGATATTTCGTTTGGAAAGGACTTTATAGAGGTCAG 
AATTCCGTGGCAGTTGTTGAATTTTTCTGATCCATCATCTCAAAAAATTCACGATGATTACTTTAAACATTATGGTGTGAAGGAGT 
TAGAAATTGAGAGCATTGCTTTAGGATTAGGTGCTAATAGCAAAGAAAACACACTGATAAAGATGGCAGATTATCGTTTGAAAAAT 
TGGGAGAGACCCGATACCAAAACCTTTTTAAAAGACT 

SEQ ID NO. 2808: SAG1552 FROM THE H36b GBS TYPE lb STRAIN 

AAGGGGCTTATTAAAAGAAAATACAAGAACTAACTTTGTTGTTAAAGGTGATACTGTACTTCACAAGCCCACCAATAAACCTTTTG 
TTGTTAAAGGAGTAGACGTTGAGTCTTCCTTAGCGGGTTATCATCACAACGATTTTCCTATTACTCAAAAAACGTATCGTGAATGG 
TTCCATTTAATTTCCAACATGGGGGCAAATACTGTAAGAGTCAAGGTACCGATGAATGTTGCATTTTACGATGCCTTATATCACCA 
CAACAAAGCATCAAAGAGGCCACTGTATTTGTTGCAAGGAATACGTATAGATTCTTATCGCAATAATGCTTCTATAACAGCTTTTA 
ATGATAATTATAGGGGGTATTTAAAACGAGAAGCAAAAGGCGTTGTGGATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGAT 
TTTGGTAGCAGTCATTATCATTATGATCTTAGTCCTTGGGTACTTGGTTATGTCGTAGGGGATGATGGACATAGTGGTACTGTCGC 
TTTATACTAATCATCT^AGAGGAGAAAAACGCAATATAAAGGACGTTATTTTAAAACTTCTGTGGCAGCTAATCCATTTGAGGTCAT 
GCTAGCTCAAGTAATGGATGAATTGACACATTATGAGACAGCTAAATATGGTTGGCAACATTTGATTAGTTTTTCAAACTCACCAA 
CAACAGACCCTTTTCATTATCGAAAACCATTTGAGGCACAGGCTCCTAAATACGTACAACTAAATGTAGAAAATATTCAAGCTAAT 
TCGAATGTTAAAGCAGGTATGTTTGCAGCATATAAAGCTATTGATTTCCATCCTCGATACAAGGATTATCTATTATTTGATAAAGA 
GAATATCAGTAAAGAAGATAGACAAAAGATTT^AAGAACTTTCTTTGTCACAGGGATACGTTAAACTGCTAAATGCTTATCACAAAA 
TCCCTGTTCTAGTCACGGGTTATGGCTACTCGACAGCGAGAGGTATTGCCCAAT^AAGAAATTGATAAACGTCCTCTGCCGATTAAT 
GAAAAAGAACAAGGTCAGCGTTTACTAGAAGATTATGAATCTTTTATATCATCCGGTAGTTTTGGAGCGACTATCAATGCATGGCA 
AGACGATTGGAATGCAAGGGTGTGGAATACATCCTTCGCCACAAATAAACATAGTCAATTCCTATGGGGGGATGCACAAGTATTTA 
ATCAAGGTTATGGTTTATTAGGCTTTAAAAACGCAAAACATCATTATCAGGTTGATGGTAAAAGAGGCAAAGAAGAGTGGAAACAT 
CCTCTGATGACTAGTGCAACAGGAGATGACTTATATGCTAGCAGTGATGAAAGCTATCTCTACCTTGCGATTAAAACAAAACCTGA 
AAAACTAAAAGAAAAACGATTATTACCAATAGATATTACACCAAAATCTGGTAGTAGAAAAATGAATGGTAGTAAGGTCACATTTT 
CT7VAATCTAGTGACTTTGTATTGTCTATTGATCCAAATGGCAAGTCTGAATTATTTGTCCAAGAGCGCTATAACGCCTTAAAAGCG 
AACTATCTTCGACAGCTTAATGGTAAAGATTTTTATGCTTTCCCACCAAAGAAGAACAGTAGTAATTTTGAGCAGATAAATATGGT 
ATTGAGAAATACAAAGATTGTTGAAGACATGGAAA7\AGTAAAAGCAACAGAGAGGTTCTTACCAACTCATCCTACTGGTCTTCTCA 
AAACAGGAACAACTGATAGGCACCAAAAAACATTTGATTCACAAACAGATATTTCGTTTGGAAAGGACTTTATAGAGGTCAGAATT 
CCGTGGCAGTTGTTGAATTTTTCTGATCCATCATCTCAAAAAATTCACGATGATTACTTTAAACATTATGGTGTGAAGGAGTTAGA 
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AATTGAGAGCATTGCTTTAGGATTAGGTGCTAATAGCAAAGAAAACACACTGATAAAGATGGCAGATTATCGTTTGAAAAATTGGG 
AGAGACCCGATACCAAAACCTTTTTAAAAGACTCCTATTATAGT 

SEQ ID NO. 2809: SAG1552 FROM THE JM9130013 GBS TYPE VIII STRAIN 

ACTTTGTTGTTAAAGGTGATACTGTACTTCACAAGCCCACCAATAAACCTTTTGTTGTTAAAGGAGTAGACGTTGAGTCTTCCTTA 
GCGGGTTATCATCACAACGATTTTCCTATTACTCAAAAAACGTATCGTGAATGGTTCCATTTAATTTCCAACATGGGGGCAAATAC 
TGTAAGAGTCAAGGTACCGATGAATGTTGCATTTTACGATGCCTTATATCACCACAACAAAGCATCAAAGAGGCCACTGTATTTGT 
TGCAAGGAATACGTATAGATTCTTATCGCAATAATGCTTCTATAACAGCTTTTAATGATAATTATAGGGGGTATTTAAAACGAGAA 
GCAAAAGGCGTTGTGGATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGATTTTGGTAGCAGTCATTATCATTATGATCTTAG 
TCCTTGGGTACTTGGTTATGTCGTAGGGGATGATTGGAATAGTGGTACTGTCGCTTATACTAATCATCAAGAGAAAAAAACGCAAT 
ATAAAGGACGTTATTTTAAAACTTCTGTGGCAGCTAATCCATTTGAGGTCATGCTAGCTCAAGTAATGGATGAATTGACACATTAT 
GAGACAGCTAAATATGGTTGGCAACATTTGATTAGTTTTTCAAACTCACCAACAACAGACCCTTTTCATTATCGAAAACCATTTGA 
GGCACAGGCTCCTAAATACGTACAACTAAATGTAGAAAATATTCAAGCTAATTCGAATGTTAAAGCAGGTATGTTTGCAGCATATA 
AAGCTATTGATTTCCATCCTCGATACAAGGATTATCTATTATTTGATAAAGAGAATATCAGTAAAGAAGATAGACAAAAGATTAAA 
GAACTTTCTTTGTCACAGGGATACGTTAAACTGCTAAATGCTTATCACAAAATCCCTGTTCTAGTCACGGGTTATGGCTACTCGAC 
AGCGAGAGGTATTGCCCAAT^AAGAAATTGATAAACGTCCTCTGCCGATTAATGAAAAAGAACAAGGTCAGCGTTTACTAGAAGATT 
ATGAATCTTTTATATCATCCGGTAGTTTTGGAGCGACTATCAATGCATGGCAAGACGATTGGAATGCAAGGGTGTGGAATACATCC 
TTCGCCACAAATAAACATAGTCAATTCCTATGGGGGGATGCACAAGTATTTAATCAAGGTTATGGTTTATTAGGCTTTAAAAACGC 
AAAACATCATTATCAGGTTGATGGTAAAAGAGGCAAAGAAGAGTGGAAACATCCTCTGATGACTAGTGCAACAGGAGATGACTTAT 
ATGCTAGCAGTGATGAAAGCTATCTCTACCTTGCGATTAAAACAAAACCTGAAAAACTAAAAGAAAAACGATTATTACCAATAGAT 
ATTACACCAAAATCTGGTAGTAGAAAAATGAATGGTAGTAAGGTCACATTTTCTAT^ATCTAGTGACTTTGTATTGTCTATTGATCC 
AAATGGCAAGTCTGAATTATTTGTCCAAGAGCGCTATAACGCCTTAAAAGCGAACTATCTTCGACAGCTTAATGGTAAAGATTTTT 
ATGCTTTCCCACCAAAGAAGAACAGTAGTAATTTTGAGCAGATAAATATGGTATTGAGAAATACAAAGATTGTTGAAGACATGGAA 
AAAGTAAAAGCAACAGAGAGGTTCTTACCAACTCATCCTACTGGTCTTCTCAAAACAGGAACAACTGATAGGCACCAAAAAACATT 
TGATTCACAAACAGATATTTCGTTTGGAAAGGACTTTATAGAGGTCAGAATTCCGTGGCAGTTGTTGAATTTTTCTGATCCATCAT 
CTCAAAAAATTCACGATGATTACTTTAAACATTATGGTGTGAAGGAGTTAGAAATTGAGAGCATTGCTTTAGGATTAGGTGCTAAT 
AGCAAAGAAAACACACTGATAAAGATGGCAGATTATCGTTTGAAAAATTGGGAGAGACCCGATACCAAAACCTTTTTAAAAGACTC 
CTATTATAGTATTAAGAAAG 

SEQ ID NO. 2810: SAG1552 FROM THE M732 GBS TYPE III STRAIN 

TACAAGAACTAACTTTGTTGTTAAAGGTGATACTGTACTTCACAAGCCCACCAATAAACCTTTTGTTGTTATVAGGAGTAGACGTTG 
AGTCTTCCTTAGCGGGTTATCATCACAACGATTTTCCTATTACTCAAAAAACGTATCGTGAATGGTTCCATTTAATTTCCAACATG 
GGGGCAAATACTGTAAGAGTCAAGGTACCGATGAATGTTGCATTTTACGATGCCTTATATCACCACAACAAAGAATCAAAGAGGCC 
ACTGTATTTGTTGCAAGGAATACGTATAGATTCTTATCGCAATAATGCTTCTATAACAGCTTTTAATGATAATTATAGGGGGTATT 
TAAAACGAGAAGCAAAAGGCGTTGTGGATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGATTTTGGTAGCCGTCATTATCAT 
TATGATCTTAGTCCTTGGGTACTTGGTTATGTCGTAGGGGATGATTGCAATAGTGGTACTGTCGCTTATACTAATCATCAAGAGAA 
AAAAACGCAATATAAAGGACGTTATTTTAAAACTTCTGTGGCAGCTAATCCATTTGAGGTCATGCTAGCTCAAGTAATGGATGAAT 
TGACACATTATGAGACAGCTAAATATGGTTGGCAACATTTGATTAGTTTTTCAAACTCACCAACAACAGACCCTTTTCATTATCGA 
AAACCATTTGAGGCACAGGCTCCTAAATACGTACAACTAAATGTAGAAAATATTCAAGCTAATTCAAATGTTAAAGCAGGTATGTT 
TGCAGCATATAAAGCTATTGATTTCCATCCTCGATACAAGGATTATCTATTATTTGATAAAGAGAATATCAGTAAAGAAGATAGAC 
AAAAGATTAAAGAACTTTCTTTGTCACAGGGATACGTTAAACTGCTAAATGCTTATCACAAAATCCCTGTTCTAGTCACGGGTTAT 
GGCTATTCGACAGCGAGAGGTATTGCCCAAAAAGAAATTGATAAACGTCCTCTGCCGATTAATGAAAAAGAACAAGGTCAGCGTTT 
ACTAGAAGATTATGAATCTTTTATATCATCCGGTAGTTTTGGAGCGACTATCAATGCATGGCAAGACGATTGGAATGCAAGGGCGT 
GGAATACATCTTTCGCCACAAATAAACATAGTCAATTCCTATGGGGGGATGCACAAGTATTTAATCAAGGTTATGGTTTATTAGGC 
TTTAAAAACGCAAAACATCATTATCAAGTTGATGGTAAAAGAGGCAAAGGAGAGTGGAAACATCCTCTGATGACTAGTGCAACAGG 
AGATGACTTATATGCTAGCAGTGATGAAAGCTATCTCTACCTTGCGATTAAAACAAAACCTGAAAAACTAAAAGAAAAACGATTAT 
TACCAATAGATATTACACCAAAATCTGGTAGTAGAAAAATGAATGGTAGTAAGGTCACATTTTCTAAATCTAGTGACTTTGTATTG 
TCTATTGATCCAAATGGCAAGTCTGAATTATTTGTCCAAGAGCGCTATAATGCCTTAAAAGCGAACTATCTTCGACAGCTTAACGG 
TAAAGATTTTTATGCTTTCCCACCAAAGAAGAACAGTAGTAATTTTGAGCAGATAAATATGGTATTGAGAAATACAAAGATTGTTG 
AAGACATGGAAAAAGTAAAAGCAACAGAGAGGTTCTTACCAACTCATCCTACTGGTCTTCTCAAAACAGGAACAACTGATAGGCAC 
CAAAAAACATTTGATTCACAAACAGATATTTCGTTTGGAAAGGACTTTATAGAGGTCAGAATTCCGTGGCAGTTGTTGAATTTTTC 
TGATCCATCATCTCAAAAAATTCACGATGATTACTTTAAACATTATGGTGTGAAGGAGTTAGAAATTGAGAGCATTGCTTTAGGAT 
TAGGTGCTAATAGCAAAGAAAACACACTGATAAAGATGGCAGATTATCGTTTGAAAAATTGGGAGAGACCCGATACCAAAACCTTT 
TTAAAAGACTCCTATTATAGTATTAAG 

SEQ ID NO. 2811: SAG1552 FROM THE M781 GBS TYPE III STRAIN 

TTTGATGGTAGTTTGTATTTACCACAGGGCTTATTAAAAGAAAATACAAGAACTAACTTTGTTGTTAAAGGTGATACTGTACTTCA 
CAAGCCCACCAATAAACCTTTTGTTGTTAAAGGAGTAGACGTTGAGTCTTCCTTAGCGGGTTATCATCACAACGATTTTCCTATTA 
CTCAAAAAACGTATCGTGAATGGTTCCATTTAATTTCCAACATGGGGGCAAATACTGTAAGAGTCAAGGTACCGATGAATGTTGCA 
TTTTACGATGCCTTATATCACCACAACAAAGAATCAAAGAGGCCACTGTATTTGTTGCAAGG7VATACGTATAGATTCTTATCGGAA 
TAATGCTTCTATAACAGCTTTTAATGATAATTATAGGGGGTATTTAAAACGAGAAGCAAAAGGCGTTGTGGATATTCTCCATGGGC 
GTAAGCAAGTATGGAATACTGATTTTGGTAGCCGTCATTATCATTATGATCTTAGTCCTTGGGTACTTGGTTATGTCGTAGGGGAT 
GATTGGAATAGTGGTACTGTCGCTTATACTAATCATCAAGAGAAAAAAACGCAATATAAAGGACGTTATTTTAAAACTTCTGTGGC 
AGCTAATCCATTTGAGGTCATGCTAGCTCAAGTAATGGATGAATTGACACATTATGAGACAGCTAAATATGGTTGGCAACATTTGA 
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TTAGTTTTTCAAACTCACCAACAACAGACCCTTTTCATTATCGAAAACCATTTGAGGCACAGGCTCCTAAATACGTACAACTAAAT 
GTAGAAAATATTCAAGCTAATTCAAATGTTAAAGCAGGTATGTTTGCAGCATATAAAGCTATTGATTTCCATCCTCGATACAAGGA 
TTATCTATTATTTGATAAAGAGAATATCAGTAAAGAAGATAGACAAAAGATTAAAGAACTTTCTTTGTCACAGGGATACGTTAAAC 
TGCTAAATGCTTATCACAAAATCCCTGTTCTAGTCACGGGTTATGGCTATTCGACAGCGAGAGGTATTGCCCAAAAAGAAATTGAT 
AAACGTCCTCTGCCGATTAATGAAAAAGAACAAGGTCAGCGTTTACTAGAAGATTATGAATCTTTTATATCATCCGGTAGTTTTGG 
AGCGACTATCAATGCATGGCAAGACGATTGGAATGCAAGGGCGTGGAATACATCTTTCGCCACAAATAAACATAGTCAATTCCTAT 
GGGGGGATGCACAAGTATTTAATCAAGGTTATGGTTTATTAGGCTTTAAAAACGCAAAACATCATTATCAAGTTGATGGTAAAAGA 
GGCAAAGGAGAGTGGAAACATCCTCTGATGACTAGTGCAACAGGAGATGACTTATATGCTAGCAGTGATGAAAGCTATCTCTACCT 
TGCGATTAAAACAAAACCTGAAAAACTAAAAGAAAAACGATTATTACCAATAGATATTACACCAAAATCTGGTAGTAGAAAAATGA 
ATGGTAGTAAGGTCACATTTTCTAAATCTAGTGACTTTGTATTGTCTATTGATCCAAATGGCAAGTCTGAATTATTTGTCCAAGAG 
CGCTATAATGCCTTAAAAGCGAACTATCTTCGACAGCTTAACGGTAAAGATTTTTATGCTTTCCCACCAAAGAAGAACAGTAGTAA 
TTTTGAGCAGATAAATATGGTATTGAGAAATACAAAGATTGTTGAAGACATGGAAAAAGTAAAAGCAACAGAGAGGTTCTTACCAA 
CTCATCCTACTGGTCTTCTCAAAACAGGAACAACTGATAGGCACCAAAAAACATTTGATTCACAAACAGATATTTCGTTTGGAAAG 
GACTTTATAGAGGTCAGAATTCCGTGGCAGTTGTTGAATTTTTCTGATCCATCATCTCAAAAAATTCACGATGATTACTTTAAACA 
TTATGGTGTGAAGGAGTTAGAAATTGAGAGCATTGCTTTAGGATTAGGTGCTAATAGCAAAGAAAACACACTGATAAAGATGGCAG 
ATTATCGTTTGAAAAATTGGGAGAGACCCGATACCAAAACCTTTTTAAAAGACTCCTATTATAGTATTAAGAAAGAATGG 

>SEQ ID NO 2850:62_JL169NT frame: 1 i 

FWKGDTVLHKPTNKPFWKGVDVESSLAGYHHNDFPITQKTYREWFHLISNMGANTVRV 
KVPMNVAFYDALYHHNKASKRPLYLLQGIRI DS YRNNAS ITAFNDNYRGYLKREAKGWD 
ILHGRKQVWNT DFG SRHYHYDLS PWVLGYVVGDDWNS GTVAYTNHQEKKTQYKGRYFKT S 
AAANPFEVMLAQVMDELTHYETAKYGWQHLISFSNSPTTDPFRYRKPFEAQAPKYVQLNV 
ENIQANSNVKAGIFAAYKAIDFHPRYKDYLLFDKENISKEDRQKIKELSLSQGYVKLLNA 
YHKI PVLVTGYGY ST ARG I AQKE I DKRPLP INEKEQGQRLLE DYE S FI S SGS FG AT IN AW 
QDDWN ARAWNT S FATNKHS Q FLWGDAQV FNQG YGLLG FKNAKHHYQVDGKRGKGEWKHPL 
MTSATGDDLYASSDESYLYLAIKTKPEKLKEKRLLPIDITPKSGSRKMNGSECVTFSKSSD 
FVLSIDPNGKSELFVQERYNALKANYLRQLNGKDFYAFPPKKNSSNFEQINMVLRNTKIV 
EDMEKVKATERFLPTHPTGLLKTGTIDRHQKTFDSQTDISFGKDFIEVRIPWQLLNFSDP 
SSQKIHDDYFKHYGVKELEIESIALGLGANSKENTLIKMADYRLKNWERPDTKTFLKDSY 
YSI.ER 

>SEQ ID NO 2851:62_18RS2I frame: 1 

KGLLKENTRTNFWKGDTVLHKPTNKPFWKGVDVESSLAGYHHNDFPITQKTYREWFHL 
I SNMGANTVRVKVPMNVAFYDALYHHNKAS KRPL YLLQGIRI DS YRNNAS ITAFNDN YRG 
YLKREAKGWDILHGRKQVWNTDLGSRHYHYDLSPWVLGYWGDDWNSGTVAYTNHQEKK 
TQYKGRYFKT S VAAN PFEVMLAQVMDELTHYETAKYGWQHL I S FSN S PTT D P FHYRKP FE 
AQAPKYVQLNVENIQANSNVKAGMFAAYKAIDFHPRYKDYLLFDKENISKEDRQKIKELS 
LSQGYyKLLNAYHKI PVLVTGYGYSTARGIAQKEIDKRPLPINEKEQGQRLLEDYESFIS 
SGS FGATINAWQDDWNARAWNTS FATNKHSQFLWGDAQVFNQGYGLLGFKNAKHHYQVDG 
KRGKGEWKHPLMTSATGDDLYASSDESYLYLAIKTKPEKLKEKRLLPIDITPKSGSRKMN 
GSKVTFSKSSDFVLSIDPNGKSELFVQERYNALKANYLRQLNGKDFYAFPPKKNSSNFEQ 
INMVLRNTKIVEDMEKVKATERFLPTHPTGLLKTGTTDRHQKTFDSQTDISFGKDFIEVR 
I PWQLLNFS DPS SQKIHDDYFKHYGVKELE IE S I ALGLGANSKENTLIKMADYRLKNWER 
PDTKTFLKDSYYVLRK 

>SEQ ID NO 2852:62_2603 frame: 3 

LKENTRTNFVVKGDTVLHKPTNKPFVVKGVDVESSLAGYHHNDFPITQKTYREWFHLISN 
MGANTVRVKVPMNVAFYDALYHHNKASKRPLYLLQGIRIDSYRNNASITAFNDNYRGYLK 
REAKGWD I LHGRKQVWNTDLGSRHYHYDL S PWVLGYWG DDWN SGTVAYTNHQEKKTQY 
KGRY FKT S VAAN PFEVMLAQVMDELTH YET AKYGWQHLI S FSN S PTT D P FHYRKP FEAQA 
PKYVQLNVENIQANSNVKAGMFAAYKAIDFHPRYKDYLLFDKENISKEDRQKIKELSLSQ 
GYVKLLNAYHKI PVLVTGYGYST ARGI AQKEI DKRPLP INEKEQGQRLLE DYES FI S SGS 
FGAT INAWQDDWNARAWNT S FATNKH SQFLWG DAQVFNQGYGLLG FKNAKHHYQVDGKRG 
KGEWKHPLMTSATGDDLYASSDESYLYLAIKTKPEKLKEKRLLPIDITPKSGSRKMNGSK 
VTFSKSSDFVLSIDPNGKSELFVQERYNALKANYLRQLNGKDFYAFPPKKNSSNFEQINM 
VLRNTKIVEDMEKVKATERFLPTHPTGLLKTGTTDRHQKTFDSQTDISFGKDFIEVRIPW 
QLLNFS DPS SQKIHDDYFKHYGVKELE IE S I ALGLGANSKENTLIKMADYRLKNWERPDT 
KTFLKDSYYSIKKEWSKERERTYGP 

>SEQ ID NO 2853:62_A909 frame: 1 

KGLLKENTRTNFWKGDTVLHKPTNKPFVVKGVDVESSLAGYHHNDFPITQKTYREWFHL 
ISNMGANTVRVKVPMNVAFYDALYHHNKASKRPLYLLQGIRIDSYRNNASITAFNDNYR^ 
YLKREAKGWDILHGRKQVWNTDLGSRHYHYDLSPWVLGYWGDDWNSGTVAYTNHQEKK 
TQYKGRYFKTS VAAN PFEVMLAQVMDELTHYETAKYGWQHLIS FSN S PTT DPFHYRKPFE 
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AQAPKYVQLNVENIQANSNVKAGMFAAYKAIDFHPRYKDYLLFDKENISKEDRQKIKELS 
LSQGYVKLLNAYHKIPVLVTGYGYSTARGIAQKEIDKRPLPINEKEQGQRLLEDYESFIS 
SG S FGAT INAWQDDWNARAWNT S FATNKHSQFLWGDAQVFNQGYGLLGFKNAKHHYQVDG 
KRGKGEWKHPLMTSATGDDLYASSDESYLYLAIKTKPEKLKEKRLLPIDITPKSGSRKMN 
GSKVTFSKSSDFVLSIDPNGKSELFVQERYNALKANYLRQLNGKDFYAFPPKKNSSNFEQ 
INMVLRNTKIVEDMEKVKATERFLPTHPTGLLKTGTTDRHQKTFDSQTDISFGKDFIEVR 
IPWQLLNFSDPSSQRIHDDYFKHYGVKELEN . EPLL . D . VLIAKKTH . .RWQIIV.KIGR 
DPIPKPF.K 

>SEQ ID MO 2854:62_A909 frame: 1 

KGLLKENTRTNFWKGDTVLHKPTNKPFWKGVDVESSLAGYHHNDFPITQKTYREWFHL 
I SNMGANTVRVKVPMNVAFYDALYHHNKASKRPLYLLQGIRI DS YRNNAS ITAFNDNYRG 
YLKREAKGWDILHGRKQVWNTDLGSRHYHYDLSPWLGYVVGDDWNSGTVAYTNHQEKK 
TQYKGRYFKTSVAANPFEVMLAQVMDELTHYETAKYGWQHLISFSNSPTTDPFHYRKPFE 
AQAPKYVQLNVENIQANSNVKAGMFAAYKAIDFHPRYKDYLLFDKENISKEDRQKIKELS 
LSQGYVKLLNAYHKIPVLVTGYGYSTARGIAQKEIDKRPLPINEKEQGQRLLEDYESFIS 
SGSFGATINAWQDDWNARAWNTSFATNKHSQFLWGDAQVFNQGYGLLGFKNAKHHYQVDG 
KRGKGEWKHPLMTSATGDDLYASSDESYLYLAIKTKPEKLKEKRLLPIDITPKSGSRKMN 
GSKVTFSKSSDFVLSIDPNGKSELFVQERYNALKANYLRQLNGKDFYAFPPKKNSSNFEQ 
INMVLRNTKIVEDMEKVKATERFLPTHPTGLLKTGTTDRHQKTFDSQTDISFGKDFIEVR 
I PWQLLN FS D PS SQRI HDDYFKHYGVKELEN . EPLL . D . VLIAKKTH . . RWQIIV . KIGR 
DPIPKPF.K 

>SEQ ID NO 2855 :62_ CJB110 frame: 1 

YYFDGSLYLPKGLLKENTRTNFWKGDTVLHKPTNKPFVVKGVDVESSLAGYHHNDFPIT 
QKTYREWFHLISNMGANTVRVKVPMNVAFYDALYHHNKASKRPLYLLQGIRIDSYRNNAS 
ITAFNDNYRGYLBCREAKGWDILHGRKQVWNTDFGSRHYHYDLSPWVLGYWGDDWNSGT 
VAYTNHQEKKTQYKGRYFKTSVAANPFEVMIAQVMDELTHYETAKYGWQHLISFSNSPTT 
D PFH YRKP FEAQAPKYVQLNVEN IQAN SNVKAGMFAAYKAI D FHPRYKD YLLFDKEN I SK 
EDRQKIKELSLSQGYVKLLNAYHKIPVLVTGYGYSTARGIAQKEIDKRPLPINEKEQGQR 
LLE DYE S FI S SGS FGAT INAWQDDWNARAWNT S FATNKHNQFLWGDAQVFNQGYGLLGFK 
NAKHHYQVDGKRGKGEWKHPLMTSATGDDLYASSDESYLYLAIKTKPEKLKEKRLLPIDI 
TPKSGSRKMNGSKVTFSKSSDFVLSIDPNGKSELFVQERYNALKANYLRQLNGKDFYAFP 
PKKNSSNFEQINMVLRNTKIVEDMEKVKATERFLPTHPTGLLKTGTTDRHQKTFDSQTDI 
SFGKDFIEVRIPWQLLNFSDPSSQKIHDDYFKHYGVKELEIESIALGLGANSKENTLIKM 
ADYRLKNWERPDTKTFLKDSYYVLRK 

>SEQ ID NO 2856:62jCOHl frame: 2 

LPQGLLKENTRTNFWKGDTVLHKPTNKPFWKGVDVESSLAGYHHNDFPITQKTYREWF 
HLISNMGANTVRVKVPMNVAFYDALYHHNKESKRPLYLLQGIRIDS YRNNAS ITAFNDNY 
RGYLKREAKGWDILHGRKQVWNTDFGSRHYHYDLSPWVLGYWGDDWNSGTVAYTNHQE 
KKTQYKGRYFKTS VAAN PFEVMLAQVMDELTHYETAKYGWQHLI S FSNS PTTDPFHYRKP 
FEAQAPKYVQLNVEN I QAN SNVKAGMFAAYKAI DFH PRYKD YLLFDKENI SKE DRQKIKE 
LSLSQGYVKLLNAYHKIPVLVTGYGYSTARGIAQKEIDKRPLPINEKEQGQRLLEDYESF 
I S SGS FGAT INAWQDDWNARAWNTS FATNKHSQFLWG DAQVFNQGYGLLGFKNAKHHYQV 
DGKRGKGEWKHPLMTSATGDDLYASSDESYLYLAIKTKPEKLKEKRLLPIDITPKSGSRK 
MNGSKVTFSKSSDFVLSIDPNGKSELFVQERYNALKANYLRQLNGKDFYAFPPKKNSSNF 
EQINMVLRNTKIVEDMEKVKATERFLPTHPTGLLKTGTTDRHQKTFDSQPDISFGKDFIE 
VRIPWQLLNFSDPSSQKIHDDYFKHYGVKELEIESIALGLGANSKENTLIKMADYRLKNW 
ERPDTKTFLKD 

>SEQ ID NO 2857:62_H36B frame: 2 

RGLLKENTRTNFWKGDTVLHKPTNKPFWKGVDVESSLAGYHHNDFPITQKTYREWFHL 
I SNMGANTVRVKVPMNVAFYDALYHHNKASKRPLYLLQGIRI DS YRNNAS ITAFN DNYRG 
YLKREAKGWDI LHGRKQVWNTDFGS SHYHYDLS PWVLGYWGDDGHSGT VALY 

>SEQ ID NO 2858 : 62_JM9130013 frame : 3 

FVVKGDTVLHKPTNKPFVVKGVDVESSLAGYHHNDFPITQKTYREWFHLISNMGANTVRV 
KVPMNVAFYDALYHHNKASKRPLYLLQGIR,IDSYRNNASITAFNDNYRGYLKREAKGVVD 
ILHGRKQVWNTDFGSSHYHYDLSPWVLGYWGDDWNSGTVAYTNHQEKKTQYKGRYFKTS 
VAAN PFEVMLAQVMDELTHYETAKYGWQHLI S FSN S PTTD PFH YRKP FEAQAPKYVQLNV 
ENIQANSNVKAGMFAAYKAIDFHPRYKDYLLFDKENISKEDRQKIKELSLSQGYVKLLNA 
YHKIPVLVTGYGYSTARGIAQKEIDKRPLPINEKEQGQRLLEDYESFISSGSFGATINAW 
QDDWNARVWNTSFATNKHSQFLWGDAQVFNQGYGLLGFKNAKHHYQVDGKRGBCEEWKHPL 
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MTSATGDDLYASSDESYLYLAIKTKPEKLKEKRLLPIDITPKSGSRKMNGSKVTFSKSSD 
FVLSIDPNGKSELEVQERYNALKANYLRQLNGKDFYAFPPKKNSSNFEQINMVLRNTKIV 
EDMEKVKATERFLPTHPTGLLKTGTTDRHQKTFDSQTDISFGKDFIEVRIPWQLLNFSDP 
SSQKIHDDYFKHYGVKELEIESIALGLGANSKENTLIKMADYRLKNWERPDTKTFLKDSY 
YSXKK 

>SEQ ID NO 2859:62_M732 frame: 2 

TRTNFWKGDTVLHKPTNKP FWKGVDVE S S LAG YHHND FP ITQKT YREW FHL I SNMGAN 
TVRVKVPMNVAFYDALYHHNKESKRPLYLLQGIRIDSYRNNASITAFNDNYRGYLKREAK 
GWDILHGRKQVWNTDFGSRHYHYDLSPWVLGYWGDDCNSGTVAYTNHQEKKTQYKGRY 
FKTSVAANPFEVMLAQVMDELTHYETAKYGWQHLISFSNSPTTDPFHYRKPFEAQAPKYV 
QLNVENIQANSNVKAGMFAAYKAIDFHPRYKDYLLFDKENISKEDRQKIKELSLSQGYVK 
LLNAYHKIPVLVTGYGYSTARGIAQKEIDKRPLPINEKEQGQRLLEDYESFISSGSFGAT 
INAWQDDWNARAWNTSFATNKHSQFLWGDAQVFNQGYGLLGFKNAKHHYQVDGKRGKGEW 
KHPLMTSATGDDLYASSDESYLYLAIKTKPEKLKEKRLLPIDITPKSGSRKMNGSKVTFS 
KSSDFVLS I DPNGKS ELFVQERYNALKAN YLRQLNGKDFYAFPPKKNS SN FEQ INMVLRN 
TKIVEDMEKVKATERFLPTHPTGLLKTGTTDRHQKTFDSQTDISFGKDFIEVRIPWQLLN 
FSDPSSQKIHDDYFKHYGVKELEIESIALGLGANSKENTLIKMADYRLKNWERPDTKTFL 
KDSYYSIK 

>SEQ ID NO 2860:62_M781 frame: 1 

FDGSLYLPQGLLKENTRTNFWKGDTVLHKPTNKPFWKGVDVESSLAGYHHNDFPITQK 
T YREWFHLI SNMGANT VRVKVPMNVAFYDALYHHNKE SKRPL YLLQGI RI DS YRNNAS IT 
AFNDNYRGYLKREAKGWDILHGRKQVWNTDFGSRHYHYDLSPWVLGYWGDDWNSGTVA 
YTNHQEKKTQYKGR YFKT SVAAN P FE VMLAQVMDELTHYETAKYGWQHL ISFSNS PTT D P 
FHYRKP FEAQAPKYVQLNVENI QAN SNVKAGMFAAYKAI DFHPRYKDYLLFDKENI SKE D 
RQKIKELSLSQGYVKLLNAYHKIPVLVTGYGYSTARGIAQKEIDKRPLPINEKEQGQRLL 
EDYES FI SSGS FGATINAWQDDWNARAWNTS FATNKHSQFLWGDAQVFNQGYGLLGFKNA 
KHHYQVDGKRGKGEWKHPLMTSATGDDLYASSDESYLYLAIKTKPEKLKEKRLLPIDITP 
KSGSRKMNGSKVTFSKSSDFVLSIDPNGKSELFVQERYNALKANYLRQLNGKDFYAFPPK 
KNSSNFEQINMVLRNTKIVEDMEKVKATERFLPTHPTGLLKTGTTDRHQKTFDSQTDISF 
GKDFIEVRIPWQLLNFSDPSSQKIHDDYFKHYGVKELEIESIALGLGANSKENTLIKMAD 
YRLKNWERPDTKT FLKDSYYS I KKEW 

SEQ ID NO. 2901: SAG1641 FROM THE 090 GBS TYPE la STRAIN 

AATCAAGAAGTTTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAAAGTTGGTGTTATGACCTTTTCTGACACTGAAAAAGCACGTTG 

GGATAAAATTGAAAAGCTAGTAGGCGATAAAGCTAAAATCAAATTCACAGAATTTACAGATTATACACAACCAAATCAAGCGACAG 

CCAATAAGGATGTGGATATTAATGCCTTTCAACATTACAATTTCTTAGAAAACTGGAATAAGGAAAATAAGAAAAACTTAATTCCA 

CTTGAAAAGACTTACTTAGCCCCAATTCGTATCTATTCTGAGAAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCCACTATTGC 

AATTCCAAATGATGCAACAAATGGTAGCCGTGCATTGTATGTCCTTCAGTCAGCAGGTTTAATCAAATTGAATGTTTCTGGTAAGA 

AGGTTGCAACAGTTGCTAATATCACATCTAATAAAAAAGATATTAATATTCAGGAGTTAGATGCGAGTCAAACACCACGTGCACTC 

AAAGATGTAGATGCAGCTATTATTAATAATACATACATTGAGCAAGCTAATTTAAAACCTTCAGATGCTATCTTTGTTGAGAAATC 

AGATAAAAATTCAAAACAATGGATTAATATCATTGCGGGACGTAAAAATTGGAAAAAGCAAAAGAACGCTAAAGCTATC 

TCTTGGATGCTTATCACACAGATGAAGTGAAAAAAGTTATCAAAGATACTTCAGCTGATATTCCACAATGGAACCCAGCTTTCTTG 

TACAA 

SEQ ID NO. 2902: SAG1641 FROM THE 1169NT1 GBS TYPE V STRAIN 
(REVERSE COMPLEMENT) 

ATCAAGAAGTTTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAAAGTTGGTGTTATGACCTTTTCTGACACTGAAAAAGCACGTTGG 
GATAAAATTGAAAAGCTAGTAGGTGATAAAGCTAAAATCAAATTTACAGAATTTACAGATTATACACAACCAAATCAAGCGACAGC 
CAATAAGGATGTGGATATTAATGCCTTTCAACATTACAATTTCTTAGT^AAACTGGAATAAGGAAAATAAGAAAAACTTAATTCCAC 
TTGAAAAGACTTACTTAGCTCCAATTCGTATCTATTCTGAGAAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCCACTATTGCA 
ATTCCAAATGATGCAACAAATGGTAGCCGTGCATTGTATGTCCTTCAGTCAGCAGGTTTAATCAAATTGAATGTTTCTGGTAAGAA 
GGTTGCAACAGTTGCTAATATCACATCTAATAAAAAGGATATTAATATTCAGGAGTTAGATGCGAGTCAAACACCACGTGCACTCA 
AAGATGTAGATGCAGCTATTATTAATAATACATACATTGAGCAAGCTAATTTAAAACCTTCAGATGCTATCTTTGTTGAGAAATCA 
GATAAAAATTCAAAACAATGGATTAATATCATTGCGGGACGTAAAAATTGGAAAAAGCAAAAGAACGCTAAAGCTATCCAAGCTAT 
CTTGGATGCTTATCACACAGATGAAGTGAAAAAAGTTATCAAAGATACTTCAGCTGATATTCCACAATGG 

SEQ ID NO. 2903: SAG1641 FROM THE 18RS21 GBS TYPE II STRAIN 

AATCAAGAAGTTTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAAAGTTGGTGTTATGACCTTTTCTGACACTGAAAAAGCACGTTG 
GGATAAAATTGAAAAGCTAGTAGGTGATAAAGCTAAAATCAAATTTACAGAATTTACAGATTATACACAACCAAATCT^AGCGACAG 
CCAATAAGGATGTGGATATTAATGCCTTTCAACATTACAATTTCTTAGAAAACTGGAATAAGGAAAATAAGAAAAACTTAATTCCA 
CTTGT^AAAGACTTACTTAGCTCCAATTCGTATCTATTCTGAGAAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCCACTATTGC 
AATTCCAAATGATGCAACAAATGGTAGCCGTGCATTGTATGTCCTTCAGTCAGCAGGTTTAATCAAATTGAATGTTTCTGGTAAGA 
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AGGTTGCAACAGTTGCTAATATCACATCTAATAAAAAGGATATTAATATTCAGGAGTTAGATGCGAGTCAAACACCACGTGCACTC 
AAAGATGTAGATGCAGCTATTATTAATAATACATACATTGAGCAAGCTAATTTAAAACCTTCAGATGCTATCTTTGTTGAGAAATC 
AGATAAAAATTCAAAACAATGGATTAATATCATTGCGGGACGTAAAAATTGGAAAAAGCAAAAGAACGCTAAAGCTATCCAAGCTA 
TCTTGGATGCTTATCACACAGATGAAGTGAAAAAAGTTATCAAAGATACTTCAGCTGATATTCCAC 

SEQ ID NO. 2904: SAG1641 FROM THE 2603 V/R GBS TYPE V STRAIN 

AATCAAGAAGTTTCAGCAAGCTCAACTTC^GTAAAGTTGTTAAAGTTGGTGTTATGACCTTTTCTGACACTGAAAAAGCACGTTG 
GGATAAAATTGAAAAGCTAGTAGGTGATAAAGCTAAAATCAAATTTACAGAATTTACAGATTATACACAACCAAATCAAGCGACAG 
CCAATAAGGATGTGGATATTAATGCCTTTCAACATTACAATTTCTTAGAAAACTGGAATAAGGAAAATAAGAAAAACTTAATTCCA 
CTTGAAAAGACTTACTTAGCTCCAATTCGTATCTATTCTGAGAAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCCACTATTGC 
AATTCCAAATGATGCAACAAATGGTAGCCGTGCATTGTATGTCCTTCAGTCAGCAGGTTTAATCAAATTGAATGTTTCTGGTAAGA 
AGGTTGCAACAGTTGCTAATATCACATCTAATAAAAAGGATATTAATATTCAGGAGTTAGATGCCAGTCAAACACCACGTGCACTC 
AAAGATGTAGATGCAGCTATTATTAATAATACATACATTGAGCAAGCTAATTTAAAACCTTCAGATGCTATCTTTGTTGAGAAATC 
AGATAAAAATTCAAAACAATGGATTAATATCATTGCGGGACGTAAAAATTGGAAAAAGCAAAAGAACGCTAAAGCTATCCAAGCTA 
TCTTGGATGCTTATCACACAGATGAAGTGAAAAAAGTTATCAAAGATACTTCAGCTGATATTCCACAATGG 

SEQ ID NO. 2905: SAG1641 FROM THE A909 GBS TYPE la STRAIN 

AATCAAGAAGTTTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAAAGTTGGTGTTATGACCTTTTCTGACACTGAAAAAGCACGTTG 
GGATAAAATTGAAAAGCTAGTAGGTGATAAAGCTAAAATCAAATTTACAGAATTTACAGATTATACAC^VACCAAATCAAGCGACAG 
CCAATAAGGATGTGGATATTAATGCCTTTCAACATTACAATTTCTTAGAAAACTGGAATAAGGAAAATAAGAAAAACTTAATTCCA 
CTTGAAAAGACTTACTTAGCTCCAATTCGTATCTATTCTGAGAAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCCACTATTGC 
AATTCCAAATGATGCAACAAATGGTAGCCGTGCATTGTATGTCCTTCAGTCAGCAGGTTTAATCAAATTGAATGTTTCTGGTAAGA 
AGGTTGCAACAGTTGCTAATATCACATCTAATAAAAAGGATATTAATATTCAGGAGTTAGATGCGAGTCAAACACCACGTGCACTC 
AAAGATGTAGATGCAGCTATTATTAATAATACATACATTGAGCAAGCTAATTTAAAACCTTCAGATGCTATCTTTGTTGAGAAATC 
AGATAAAAATTCAAAACAATGGATTAATATCATTGCGGGACGTAAAAATTGGAAAAAGCAAAAGAACGCTAAAGCTATCCAAGCTA 
TCTTGGATGCTTATCACACAGATGAAGTGAAAAAAGTTATCAAAGATACTTCAGCTGATATTCCACAATGG 

SEQ ID NO. 2906: SAG1641 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

AAGTAAAGTTGTTAAAGTTGGTGTTATGACCTTTTCTGACACTGAAAAAGCACGTTGGGATAAAATTGAAAAGCTAGTAGGCGATA 
AAGCTAAAATCAAATTCACAGAATTTACAGATTATACACAACCAAATCAAGCGACAGCCAATAAGGATGTGGATATTAATGCCTTT 
CAACATTACAATTTCTTAGAAAACTGGAATAAGGAAAATAAGAAAAACTTAATTCCACTTGAAAAGACTTACTTAGCCCCAATTCG 
TATCTATTCTGAGAAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCCACTATTGCAATTCCAAATGATGCAACAAATGGTAGCC 
GTGCATTGTATGTCCTTCAGTCAGCAGGTTTAATCAAATTGAATGTTTCTGGTAAGAAGGTTGCAACAGTTGCTAATATCACATCT 
AATAAAAAAGATATTAATATTCAGGAGTTAGATGCGAGTCAAACACCACGTGCACTCAAAGATGTAGATGCAGCTATTATTAATAA 
TACATACATTGAGCAAGCTAATTTAAAACCTTCAGATGCTATCTTTGTTGAGAAATCAGATAAAAATTCAAAACAATGGATTAATA 
TCATTGCGGGACGTAAAAATTGGAAAAAGC^AAAGAACGCTAAAGCTATCCAAGCTATCTTGGATGCTTATCACACAGATGAAGTG 
AAAAAAGTTATCAAAGATACTTCAGCTGATATTCCACAATGGAA 

SEQ ID NO. 2907: SAG1641 FROM THE COHl GBS TYPE III STRAIN 
(REVERSE COMPLEMENT) 

AGTTTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAAAGTTGGTGTTATGACCTTTTCTGACACTGAAAAAGCACGTTGGGATAAAA 
TTGAAAAGCTAGTAGGTGATAAAGCTAAAATCAAATTTACAGAATTTACAGATTATACACAACCAAATCAAGCGACAGCCAATAAG 
GATGTGGATATTAATGCCTTTCAACATTACAATTTCTTAGAAAACTGG^TAAGGAAAATAAGAAAAACTTAATTCCACTTGAAAA 
GACTTACTTAGCTCCAATTCGTATCTATTCTGAGAAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCCACTATTGCAATTCCAA 
ATGATGCAACAAATGGTAGCCGTGCATTGTATGTACTTCAGTCAGCAGGTTTAATCAAATTGAATGTTTCTGGTAAGAAGGTTGCA 
ACAGTTGCTAATATCACATCTAATAAAAAGGATATTAATATTCAGGAGTTAGATGCGAGTCAAACACCACGTGCACTCAAAGATGT 
AGATGCAGCTATTATTAATAATACATACATTGAGCAAGCTAATTTAAAACCTTCAGATGCTATCTTTGTTGAGAAATCAGATAAAA 
ATTCAAAACAATGGATTAATATCATTGCGGGACGTAAAAATTGGAAAAAGCAAAAGAACGCTAAAGCTATCCAAGCTATCTTGGAT 
GCTTATCACACAGATGAAGTGAAAAAAGTTATCAAAGATACTTCAGCTGATATTCCACAATGG 

SEQ ID NO. 2908: SAG1641 FROM THE H36b GBS TYPE lb STRAIN 

AAGAAGTTTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAAAGTTGGTGTTATGACCTTTTCTGACACTGAAAAAGCACGTTGGGAT 
AAAATTGAAAAGCTAGTAGGTGATAAAGCTAAAATCAAATTTACAGAATTTACAGATTATACACAACCAAATCAAGCGACAGCCAA 
TAAGGATGTGGATATTAATGCCTTTCAACATTACAATTTCTTAGAAAACTGGAATAAGGAAAATAAGAAAAACTTAATTCCACTTG 
AAAAGACTTACTTAGCTCCAATTCGTATCTATTCTGAGAAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCCACTATTGCAATT 
CCAAATGATGCAACAAATGGTAGCCGTGCATTGTATGTCCTTCAGTCAGCAGGTTTAATCAAATTGAATGTTTCTGGTAAGAAGGT 
TGCAACAGTTGCTAATATCACATCTAATAAAAAGGATATTAATATTCAGGAGTTAGATGCGAGTCAAACACCACGTGCACTCAAAG 
ATGTAGATGCAGCTATTATTAATAATACATACATTGAGCAAGCTAATTTAAAACCTTCAGATGCTATCTTTGTTGAGAAATCAGAT 
AAAAATTCAAAACAATGGATTAATATCATTGCGGGACGTAAAAATTGGAAAAAGCAAAAGAACGCTAAAGCTATCCAAGCTATCTT 
GGATGCTTATCACACAGATGAAGTGAAAAAAGTTATCAAAGATACTTCAGCTGATATTCCACAATGG 

SEQ ID NO. 2909: SAG1641 FROM THE JM3190013 GBS TYPE VIII STRAIN 

TTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAAAGTTGGTGTTATGACCTTTTCTGACACTGAAAAAGCACGTTGGGATAAAATTG 
AAAAGCTAGTAGGTGATAAAGCTAAAATCAAATTTACAGAATTTACAGATTATACACAACCAAATCAAGCGACAGCCAATAAGGAT 
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GTGGATATTAATGCCTTTCAACATTACAATTTCTTAGAAAACTGGAATAAGGAAAATAAGAAAAACTTAATTCCACTTGAAAAGAC 
TTACTTAGCTCCAATTCGTATCTATTCTGAGAAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCCACTATTGCAATTCCAAATG 
ATGCAACAAATGGTAGCCGTGCATTGTATGTCCTTCAGTCAGCAGGTTTAATCAAATTGAATGTTTCTGGTAAGAAGGTTGCAACA 
GTTGCTAATATCACATCTAATAAAAAGGATATTAATATTCAGGAGTTAGATGCGAGTCAAACACCACGTGCACTCAAAGATGTAGA 
TGCAGCTATTATTAATAATACATACATTGAGCAAGCTAATTTAAAACCTTCAGATGCTATCTTTGTTGAGAAATCAGATAAAAATT 
CAAAACAATGGATTAATATCATTGCGGGACGTAAAAATTGGAAAAAGCAAAAGAACGCTAAAGCTATCCAAGCTATCTTGGATGCT 
TATCACACAGATGAAGTGAAAAAAGTTATCAAAGATACTTCAGCTGATATTCCACAATGG 

SEQ ID NO. 2910: SAG1641 FROM THE M732 GBS TYPE III STRAIN 

AATCAAGAAGTTTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAAAGTTGGTGTTATGACCTTTTCTGACACTGAAAAAGCACGTTG 
GGATAAAATTGAAAAGCTAGTAGGTGATAAAGCTAAAATCAAATTTACAGAATTTACAGATTATACACAACCAAATCAAGCGACAG 
CCAATAAGGATGTGGATATTAATGCCTTTCAACATTACAATTTCTTAGAAAACTGGAATAAGGAAAATAAGAAAAACTTAATTCCA 
CTTGAAAAGACTTACTTAGCTCCAATTCGTATCTATTCTGAGAAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCCACTATTGC 
AATTCCAAATGATGCAACAAATGGTAGCCGTGCATTGTATGTCCTTCAGTCAGCAGGTTTAATCAAATTGAATGTTTCTGGTAAGA 
AGGTTGCAACAGTTGCTAATATCACATCTAATAAAAAGGATATTAATATTCAGGAGTTAGATGCGAGTCAAACACCACGTGCACTC 
AAAGATGTAGATGCAGCTATTATTAATAATACATACATTGAGCAAGCTAATTTAAAACCTTCAGATGCTATCTTTGTTGAGAAATC 
AGATAAAAATTCAAAACAATGGATTAATATCATTGCGGGACGTAAAAATTGGAAAAAGCAAAAGAACGCTAAAGCTATCCAAGCTA 
TCTTGGATGCTTATCACACAGATGAAGTGAAAAAAGTTATCAAAGATAC 

SEQ ID NO. 2911: SAG1641 FROM THE M781 GBS TYPE III STRAIN 

AGTTTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAAAGTTGGTGTTATGACCTTTTCTGACACTGAAAAAGCACGTTGGGATAAAA 

TTGAAAAGCTAGTAGGTGATAAAGCTAAAATCAAATTTACAGAATTTACAGATTATACACAACCAAATCAAGCGACAGCCAATAAG 

GATGTGGATATTAATGCCTTTCAACATTACAATTTCTTAGAAAACTGGAATAAGGAAAATAAGAAAAACTTAATTCCACTTGAAAA 

GACTTACTTAGCTCCAATTCGTATCTATTCTGAGAAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCCACTATTGCAATTCCAA 

ATGATGCAACAAATGGTAGCCGTGCATTGTATGTCCTTCAGTCAGCAGGTTTAATCAAATTGAATGTTTCTGGTAAGAAGGTTGCA 

ACAGTTGCTAATATCACATCTAATAAAAAGGATATTAATATTCAGGAGTTAGATGCGAGTCAAACACCACGTGCACTCAAAGATGT 

AG AT GC AGCT ATT ATT AAT AAT AC AT AC AT TGAGC AAGCTAATT TAAAAC CT TC AGATGCT AT CTT TGT TG AG AAATCAG AT AAAA 

ATTCAAAACAATGGATTAATATCATTGCGGGACGTAAAAATTGGAAAAAGGAAAAGAACGCT 

GCTT AT CACAC AGATGAAGT GAAAAAAGTT AT C AAAGAT ACTT C AG CTG AT ATT C CAC AATG G 

>SEQ ID NO 2950: 35_090 frame: 1 

NQEVSASSTSSKWKVGVMTFSDTEKARWDKIEKLVGDKAKIKFTEFTDYTQPNQATANK 
DVDINAFQHYNFLENWNKENKKNLIPLEKTYLAPIRIYSEKVKSLKKLKKGATIAIPNDA 
TNGSRALYVLQSAGLIKLNVSGKKVATVANITSNKKDINIQELDASQTPRALKDVDAAII 
NNTYIEQANLKPSDAIFVEKSDKNSKQWINIIAGRKNWKKQKNAKAIQAILDAYHTDEVK 
KVIKDTSADIPQWNPAFLY 

>SEQ ID NO 2951: 35JL169NT frame: 3 

QEVS AS STS SKWKVGVMT FS DTEKARWDKIEKLVGDKAKIKFTEFTDYTQPNQATANKD 
VDINAFQHYNFLENWNKENKKNLIPLEKTYLAPIRIYSEKVKSLKKLKKGATIAIPNDAT 
NGSRALYVLQSAGLIKLNVSGKKVATVANITSNKKDINIQELDASQTPRALKDVDAAIIN 
NTYIEQANLKPSDAI FVEKSDKNSKQWINIIAGRKNWKKQKNAKAIQAI LDAYHTDEVKK 
VIKDTSADIPQW 

>SEQ ID NO 2952: 35_18RS21 frame: 1 

NQEVSAS STS SKWKVGVMT FSDTEKARWDKIEKLVGDKAKIKFTE FT DYTQPNQATANK 
DVDINAFQHYNFLENWNKENKKNLIPLEKTYLAPIRIYSEKVKSLKKLKKGATIAI PNDA 
TNGSRALWLQSAGLIKLNVSGKKVATVANITSNKKDINIQELDASQTPRALKDVDAAII 
NNTYIEQANLKPSDAI FVEKSDKNSKQWINIIAGRKNWKKQKNAKAIQAILDAYHTDEVK 
KVIKDTSADIP 

>SEQ ID NO 2953 :35_ 2603 frame: 1 

NQEVSASSTSSKWKVGVMTFSDTEKARWDKIEKLVGDKAKIKFTEFTDYTQPNQATANK 
DVDINAFQHYNFLENWNKENKKNLIPLEKTYLAPIRIYSEKVKSLKKLKKGATIAIPNDA 
TNGSRALYVLQSAGLIKLNVSGKKVATVANITSNKKDINIQELDASQTPRALKDVDAAII 
NNTYIEQANLKPSDAI FVEKSDKNSKQWINIIAGRKNWKKQKNAKAIQAILDAYHTDEVK 
KVIKDTSADIPQW 

>SEQ ID NO 2954:35_A909 frame: 1 

NQEVSAS STS SKWKVGVMTFSDTEKARWDKIEKLVGDKAKIKFTE FT DYTQPNQATANK 
DVDINAFQHYNFLENWNKENKKNLIPLEKTYLAPIRIYSEKVKSLKKLKKGATIAIPNDA 
TNGSRALYVLQSAGLIKLNVSGKKVATVAN ITSNKKDIN IQELDASQTPRALKDVDAAI I 
NNTYIEQANLKPSDAI FVEKSDKNSKQWINIIAGRKNWKKQKNAKAIQAILDAYHTDEVK 
KVIKDTSADIPQW 
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>SEQ XD NO 2955:35_CJB110 frame: 2 

SKVVKVGVMTFSDTEKARWDKIEKLVGDKAKIKFTEFTDYTQPNQATANKDVDINAFQHY 
NFLENWNKENKKNLIPLEKTYLAPIRIYSEKVKSLKKLKKGATIAIPNDATNGSRALYVL 
QSAGLIKLNVSGKKVATVANITSNKKDINIQELDASQTPRALKDVDAAIINNTYIEQANL 
KPSDAIFVEKSDKNSKQWINIIAGRKNWKKQKNAKAIQAILDAYHTDEVKKVIKDTSADI 
PQW 

>SEQ XD NO 2956:35_COHl frame; 2 

VSASSTSSKWBCVGVMTFSDTEKARWDKIEKLVGDKAKIKFTEFTDYTQPNQATANKDVD 
INAFQHYNE^ENWNKENKKNLIPLEKTYLAPIRIYSEKVKSLKKIiKKGATIAIPNDATNG 
SRALYVLQSAGLIKLNVSGKKVATVANITSNKKDINIQELDASQTPRALKDVDAAIINNT 
YIEQANLKPSDAI FVEKS DKNSKQWIN I IAGRKNWKKQKNAKAIQAILDAYHTDEVKKVI 
KDTSADIPQW 

>SEQ ID NO 2957:35_H36B frame: 3 

EVSASSTSSKWKVGVMTFSDTEECARWDKIEKLVGDKAKIKFTEFTDYTQPNQATANKDV 
DINAFQHYNFLENWNKENKKNLIPLEKTYLAPIRIYSEKVKSLKKLKKGATIAIPNDATN 
GSRALYVLQSAGLIKLNVSGKKVATVANITSNKKDINIQELDASQTPRALKDVDAAIINN 
TYIEQANLKPS DAI FVEKS DKNSKQWIN 1 1 AGRKNWKKQKNAKAIQAILDAYHTDEVKKV 
IKDTSADIPQW 

>SEQ XD NO 2958:35_JM9130013 frame: 2 

SASSTSSKWKVGVMTFSDTEKARWDKIEKLVGDKAKIKFTEFTDYTQPNQATANKDVDI 
NAFQHYNFLENWNKENKKNLIPLEKTYLAPIRIYSEKVKSLKKLKKGATIAIPNDATNGS 
RALYVLQSAGLIKLNVSGKKVATVANITSNKKDINIQELDASQTPRALKDVDAAIINNTY 
IEQANLKPSDAIFVEKSDKNSKQWINIIAGRKNWKKQKNAKAIQAILDAYHTDEVKKVIK 
DTSADIPQW 

>SEQ XD NO 2959:35_M732 frame: 1 

NQEVSASSTSSKVVKVGVMTFSDTEKARWDKIEKLVGDKAKIKFTEFTDYTQPNQATANK 
DVDINAFQHYNFLENWNKENKKNLIPLEKTYLAPIRIYSEKVKSLKKLKKGATIAIPNDA 
TNGSRALYVLQSAGLIKLNVSGKKVATVANITSNKKDINIQELDASQTPRALKDVDAAII 
NNT YIEQANLKPSDAI FVEKS DKNSKQWIN 1 1 AG RKNWKKQKNAKAIQAILDAYHTDEVK 
KVIKD 

>SEQ ID NO 2960:35_M781 frame: 2 

VS AS STS SKWKVGVMT FS DTEKARWDKIEKLVG DKAKIKFTE FT DYTQPNQATANKDVD 
INAFQHYNFLENWNKENKKNLIPLEKTYLAPIRIYSEBCVKSLKKLKKGATIAIPNDATNG 
SRALYVLQSAGLIKLNVSGKKVATVANITSNKKDINIQELDASQTPRALKDVDAAIINNT 
Y IEQANLKPS DAI FVEKS DKN S KQWIN 1 1 AGRKNWKKQKNAKAIQAIWDAYHT DEVKKVI 
KDTSADIPQW 

SEQ ID NO. 3001: SA62147 FROM THE 1169NT1 GBS TYPE V STRAIN 
(REVERSE COMPLEMENT) 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAAAGTTCGCGTAGCC 

AAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGATGTAAAACAGGCT 

CCAAAACCTTCTCAGGCATCTAATGAAGTCCCAAAATCAAGTTCTCAATCTACAGAAGCT 

AATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCGGCTGTAGAACAAGCAGTTGTAACA 

GAAAATACCCCTGCTACCAGTCAGGCACAACAAACTTATGCTGTTACTGAGACAACTTAC 

AAACCTGCTCAACACCAGACAAGTGGCCAAGTATTGAGCAATGGAAATACTGCAGGGGCG 

GTCGGATCTGCTGCTGCAGCACAAATGGCTGCTGCAACAGGAGTCCCTCAGTCTACTTGG 

GAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCTAATGCCTCAGGAGCT 

TCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAACAGCTACAGTTCAGGATCAAGTT 

AATTCAGCTATTAAAGCTTATCGTGCTCAAGGTTTATCAGCTTGGGGTTAC 

SEQ ID NO. 3002: SAG2147 FROM THE 18RS21 GBS TYPE II STRAIN 
(REVERSE COMPLEMENT) 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAAAGTTC 

GCGTAGCCAAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGATGTAA 

AACAGGCTCCAAAACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAGTTCTCAATCTA 

CAGAAGCTAATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCAGCTGTAGAACAAGCAG 

TTGTAACAGAAAACACCCCTGCTACCAGTCAGGCACAACAAGCTTATGCTGTTACTGAGA 

CAACTTATAGACCTGCTCAACACCAGACGAGTGGCCAAGTATTGAGTAATGGAAATACTG 
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CAGGGGCTATTGGCTCAGCAGCTGCAGCACAAATGGCTGCTGCAACAGGAGTCCCTCAGT 
CTACTTGGGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCTAATGCCT 
CAGGAGCTTCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAACAGCTACAGTTCAGG 
ATCAAGTTAATTCAGCTATTAAAGCTTATCGTGCTCAAGGTTTATCAGCTTGGGGTTAC 

SEQ ID NO. 3003: SAG2147 FROM THE 2603 V/R GBS TYPE V STRAIN 
(REVERSE COMPLEMENT) 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAAAGT 

TCGCGTAGCCAAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGATGT 

AAAACAGGCTCCAAAACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAGTTCTCAATC 

TACAGAAGCTAATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCAGCTGTAGAACAAGC 

AGTTGTAACAGAAAACACCCCTGCTACCAGTCAGGCACAACAAGCTTATGCTGTTACTGA 

GACAACTTATAGACCTGCTCAACACCAGACGAGTGGCCAAGTATTGAGTAATGGAAATAC 

TGCAGGGGCTATTGGCTCAGCAGCTGCAGCACAAATGGCTGCTGCAACAGGAGTCCCTCA 

GTCTACTTGGGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCTAATGC 

CTCAGGAGCTTCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAACAGCTACAGTTCA 

GGATCAAGTTAATTCAGCTATTAAAGCTTATCGTGCTCAAGGTTTATCAGCTTGGGGTTA 

C 

SEQ ID NO. 3004: SAG2147 FROM THE 090 GBS TYPE la STRAIN 
(REVERSE COMPLEMENT) 

TAGCCAAAAAATCAAAAATGATTAAGGCGACATCTAAATCAAAAGTAGAAGATGTAAAAC 
AGGCTCCAAAACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAGTTCTCAATCTACAG 
AAGCTAATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCAGCTGTAGAACAAGCAGTTG 
TAACAGAAAACACCCCTGCTACCAGTCAGGCACAACAAGCTTATGCTGTTACTGAGACAA 
CTTATAGACCTGCTCAACACCAGACGAGTGGCCAAGTATTGAGTAATGGAAATACTGCAG 
GGGCTATTGGCTCAGCAGCTGCAGCACAAATGGCTGCTGCAACAGGAGTCCCTCAGTCTA 
CTTGGGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCTAATGCCTCAG 
GAGCTTCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAACAGCTACAGTTCAGGA 

SEQ ID NO. 3005: SAG2147 FROM THE A909 GBS TYPE la STRAIN 
(REVERSE COMPLEMENT) 

AAGGCGACATCTAAATCAAAAGTAGAAGATGTAAAACAGGCTCCAAAACCTTCTCAGGCA 
TCTAATGAAGCCCCAAAATCAAGTTCTCAATCTACAGAAGCTAATTCTCAGCAACAAGTT 
ACTGCGAGTGAAGAGGCAGCTGTAGAACAAGCAGTTGTAACAGAAAACACCCCTGCTACC 
AGTCAGGCACAACAAGCTTATGCTGTTACTGAGACAACTTATAGACCTGCTCAACACCAG 
ACAAGTGGCCAAGTATTGAGTAATGGAAATACTGCAGGGGCTATTGGCTCAGCAGCTGCA 
GCACAAATGGCTGCTGCAACAGGAGTCCCTCAGTCTACTTGGGAACATATTATTGCCCGT 
GAATCAAATGGTAATCCTAATGTTGCTAATGCCT CAGGAGCTTCAGGACTTTT CCAAACG 
ATGCCAGGTTGGGGTTCAACAGCTACAGTTCAGAATCAAGTTAATTCAGCTATTAAAGCT 
TATCGTGCTCAAGGTTTATCA 

SEQ ID NO. 3006: SAG2147 FROM THE CJB110 GBS NONTYPEABLE STRAIN 
(REVERSE COMPLEMENT) 

AATCTTTGTCAAAAGCAGATAAAGTTCGCGTAGCCAAAAAATCAAAAATGACTAAGGCGA 
CATCT AAATCAAAAGTAGAAGATGTAAAACAGGCT CCAAAACCTT CTCAGGCAT CT AATG 
AAGCCCCAAAATCAAGTTCTCAATCTACAGAAGCTAATTCTCAGCAACAAGTTACTGCGA 
GTGAAGAGGCAGCTGTAGAACAAGCAGTTGTAACAGAAAACACCCCTGCTACCAGTCAGG 
CACAACAAGCTTATGCTGTTACTGAGACAACTTATAGACCTGCTCAACACCAGACGAGTG 
GCCAAGTATTGAGTAATGGAAATACTGCAGGGGCTATTGGCTCAGCAGCTGCAGCACAAA 
TGGCTGCTGCAACAGGAGTCCCTCAGTCTACTTGGGAACATATTATTGCCCGTGAATCAA 
ATGGTAATCCTAATGTTGCTAATGCCTCAGGAGCTTCAGGACTTTTCCAAACGATGCCAG 
GTTGGGGTTCAACAGCTACAGTTCAGGATCAAGTTAATTCAGCTATTAAAGCTTATCGTG 
CTCAAGGTTTATCAGCTTGGGGTTAC 

SEQ ID NO. 3007: SAG2147 FROM THE COH1 GBS TYPE III STRAIN 
(REVERSE COMPLEMENT) 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAA 

AGTTCGCGTAGCCAAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGA 
TGTAAAACAGGCTCCAAAACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAGTTCTCA 
ATCTACAGAAGCTAATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCGGCTGTAGAACA 
AGCAGTTGTAACAGAAAATACCCCTGCTACCAGTCAGGCACAACAAACTTATGCTGTTAC 
TGAGACAACTTACAAACCTGCTCAACACCAGACAAGTGGCCAAGTATTGAGCAATGGAAA 
TACTGCAGGGGCGGTCGGATCTGCTGCTGCAGCACAAATGGCTGCTGCAACAGGAGTCCC 
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TCAGTCTACTTGGGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCTAA 
TGCCTCAGGAGCTTCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAACAGCTACAGT 
TCAGGATCAAGTTAATTCAGCTATTAAAGCTTATCGTGCTCAAGGTTTATCAGCTTGGGG 
TTAC 

SEQ ID NO. 3008: SAG2147 FROM THE H36b GBS TYPE lb STRAIN 
(REVERSE COMPLEMENT) 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGC 

AGAT AAAGTTCGCGTAGCCAAAAAAT CAAAAATGACTAAGGCGACATCTAAAT CAAAAGT 
AGAAGATGTAAAACAGGCTCCAAAACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAG 
TTCTCAATCTACAGAAGCTAATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCAGCTGT 
AGAACAAGCAGTTGTAACAGAAAACACCCCTGCTACCAGTCAGGCACAACAAGCTTATGC 
TGTTACTGAGACAACTTATAGACCTGCTCAACACCAGACAAGTGGCCAAGTATTGAGTAA 
TGGAAATACTGCAGGGGCTATTGGCTCAGCAGCTGCAGCACAAATGGCTGCTGCAACAGG 
AGTCCCTCAGTCTACTTGGGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGT 
TGCTAATGCCTCAGGAGCTTCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAACAGC 
TACAGTTCAGGATCAAGTTAATTCAGCTATTAAAGCTT 

SEQ ID NO. 3009: SAG2147 FROM THE M732 GBS TYPE III STRAIN 
(REVERSE COMPLEMENT) 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAAAGTTCGCGTAGC 

CAAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGATGTAAAACAGGC 

TCCAAAACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAGTTCTCAATCTACAGAAGC 

TAATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCGGCTGTAGAACAAGCAGTTGTAAC 

AGAAAATACCCCTGCTACCAGTCAGGCACAACAAACTTATGCTGTTACTGAGACAACTTA 

CAAACCTGCTCAACACCAGACAAGTGGCCAAGTATTGAGCAATGGAAATACTGCAGGGGC 

GGTCGGATCTGCTGCTGCAGCACAAATGGCTGCTGCAACAGGAGTCCCTCAGTCTACTTG 

GGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCTAATGCCTCAGGAGC 

TTCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAACAGCTACAGTTCAGGATCAAGT 

TAATTCAGCTATTAAAGCTTATCGTGCTCAAGGTTTATCAGCTTGGGGTTA 

SEQ ID NO. 3010: SAG2147 FROM THE M781 GBS TYPE III STRAIN 
(REVERSE COMPLEMENT) 

GTAACCCCAAGCTGATAAACCTTGAGCACGATAAGCTTTAATAGCTGAATTAACTTGATC 
CTGAACTGTAGCTGTTGAACCCCAACCTGGCATCGTTTGGAAAAGTCCTGAAGCTCCTGA 
GGCATTAGCAACATTAGGATTACCATTTGATTCACGGGCAATAATATGTTCCCAAGTAGA 
CTGAGGGACTCCTGTTGCAGCAGCCATTTGTGCTGCAGCAGCAGATCCGACCGCCCCTGC 
AGTATTTCCATTGCTCAATACTTGGCCACTTGTCTGGTGTTGAGCAGGTTTGTAAGTTGT 
CTCAGTAACAGCATAAGTTTGTTGTGCCTGACTGGTAGCAGGGGTATTTTCTGTTACAAC 
TGCTTGTTCTACAGCCGCCTCTTCACTCGCAGTAACTTGTTGCTGAGAATTAGCTTCTGT 
AGATTGAGAACTTGATTTTGGGGCTTCATTAGATGCCTGAGAAGGTTTTGGAGCCTGTTT 
TACATCTTCTACTTTTGATTTAGATGTCGCCTTAGTCATTTTTGATTTTTTGGCTACGCG 
AACTTTATCTGCTTTTGACAAAGA 

>SEQ ID NO 3050: 25_1169NT frame: 1 

KSSQVTTESLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEVPKSSSQSTEAN 
S QQQVTASEEAAVEQAWTENT PAT SQAQQT YAVTETT YKP AQHQT SGQVLSNGNTAGAV 
GSAAAAQMAAATGVPQSTWEHI IARESNGN PNVANASGASGLFQTMPGWGSTATVQDQVN 
SAIKAYRAQGLSAWGY 

>SEQ ID NO 3051 : 25_JL8RS21 frame: 1 

KSSQVTTESLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEAN 
SQQQVTASEEAAVEQAWTENTPAT S QAQQAYAVTETTYRP AQHQT S GQVLSNGNT AGAI 
GSAAAAQMAAATGVPQSTWEHI I ARE SNGNPNVANASGASGLFQTMPGWGSTATVQDQVN 
SAIKAYRAQGLSAWGY 

>SEQ ID NO 3052 : 25_2 603 frame: 1 

KSSQVTTESLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEAN 
SQQQVTASEEAAVEQAWTENT PAT S QAQQAYAVTETT YRPAQHQT S GQVLSNGNTAGAI 
GSAAAAQMAAATGVPQSTWEHI I ARE SNGNPNVANASGASGLFQTMPGWGSTATVQDQVN 
SAIKAYRAQGLSAWGY 

>SEQ ID NO 3053:25_090 frame: 3 

AKKSKMIKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEANSQQQVTASEEAAVEQAW 
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TENT PAT SQAQQAYAVTETT YRPAQHQT SGQVL SNGNTAGAIGS AAAAQMAAATGVPQ ST 
WEHIIARESNGNPNVANASGASGLFQTMPGWGSTATVQ 

>SEQ ID NO 3054:25_A909 frame: 1 

KATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEANSQQQVTASEEAAVEQAWTENTPAT 
SQAQQAYAVTETTYRPAQHQTSGQVLSNGNTAGAIGSAAAAQMAAATGVPQSTWEHIIAR 
E SNGN PNVANASGASGL FQTMPGWG STAT VQNQVNSAIKAYRAQGLS 

>SEQ ID NO 3055 : 25_CJB110 frame: 3 

SLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEANSQQQVTAS 
EEAAVEQAWTENT PAT SQAQQAYAVTETT YRPAQHQT SGQVL SNGNTAGAIGS AAAAQM 
AAATGVPQSTWEHIIARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVNSAIKAYRA 
QGLSAWGY 

>SEQ ID NO 3056:25_COH1 frame: 1 

KSSQVTTESLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEAN 
SQQQVTASEEAAVEQAWTENT PAT SQAQQT YAVTETT YKPAQHQTSGQVLSNGNTAGAV 
GSAAAAQMAAATGVPQSTWEHIIARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVN 
SAIKAYRAQGLSAWGY 

>SEQ ID NO 3057:25_H36B frame: 1 

KSSQVTTESLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEAN 
S QQQVTASEEAAVEQAWTENT PAT SQAQQAYAVTETT YRPAQHQT SGQVL SNGNT AGAI 
GSAAAAQMAAATGVPQSTWEHIIARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVN 
SAIKA 

>SEQ ID NO 3058:25_M732 frame: 1 

KSSQVTTESLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEAN 
S QQQVTASEEAAVEQAWTENT PAT SQAQQT YAVTETT YKPAQHQT S GQVL SNGNT AGAV 
GSAAAAQMAAATGVPQSTWEHI I ARE SNGN PNVANASGASGL FQTMPGWG ST AT VQDQVN 
SAIKAYRAQGLSAWG 

>SEQ ID NO 3059:25_M781 frame: 4 

SLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEANSQQQVTAS 
EEAAVEQAWTENTPATSQAQQTYAVTETTYKPAQHQTSGQVLSNGNTAGAVGSAAAAQM 
AAATGVPQSTWEHIIARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVNSAIKAYRA 
QGLSAWGY 

SEQ ID NO. 3101: SAG2148 FROM THE 1169NT1 GBS TYPE V STRAIN 

GC^TCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACTACGGTACAAGAGTTAGTGTCTCTCAA 
TAGTATCAGTAACGCTGATGTCATCAGTATAGGTGATGTTTTAAAATTGGATAATTCTACAGCTAGTCAAGCAGAAGCAAAATCTC 
AACCAACAATTGAAAATTCAATGAATTCTTCATCAAATTTGAGTTCAAGTGATTCAGCTGCAAAAGAAGAAATAGCTCGTCGTGAA 
TCAAATGGTAGTTATACTGCACAGAATGGACAATATTATGGAAGATATCAACTGTCTCAATCTTACCTAAATGGCGACTTATCTCC 
TGAAAATCAAGAAAAAGTAGCGGACAATTATGTGGCTTCTCGTTACGGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACG 
GCTGGTAT 

SEQ ID NO. 3102: SAG2148 FROM THE 18RS21 GBS TYPE II STRAIN 

GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACTACGGTACAAGAGTTAGTGTCTCTCAA 
TAGTATCAGTAACGCTGATGTCATCAGTATAGGTGATGTTTTAAAATTGGATAATTCTACAGCTAGTCAAGCAGAAGCAAAATCTC 
AACCAACAATTGAAAATTCAATGAATTCTTCATCAAATTTGAGTTCAAGTGATTCAGCCGCAAAAGAAGAAATAGCTCGTCGTGAA 
TCAAATGGTAGTTATACTGCACAGAATGGACAATATTATGGAAGATATCAACTGTCTCAATCTTACCTAAATGGCGACTTATCTCC 
TGAAAATCAAGAAAAAGTAGCGGACAATTATGTGGTTTCTCGTTACGGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACG 
GCTGGTAT 

SEQ ID NO. 3103: SAG2148 FROM THE 2603 V/R GBS TYPE V STRAIN 

GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACTACGGTACAAGAGTTAGTGTCTCTCAA 
TAGTATCAGTAACGCTGATGTCATCAGTATAGGTGATGTTTTAAAATTGGATAATTCTACAGCTAGTC7VAGCAGAAGCAAAATCTC 
AACCAACAATTGAAAATTCAATGAATTCTTCATCAAATTTGAGTTCAAGTGATTCAGCCGCAAAAGAAGAAATAGCTCGTCGTGAA 
TCAAATGGTAGTTATACTGCACAGAATGGACAATATTATGGAAGATATCAACTGTCTCAATCTTACCTAAATGGCGACTTATCTCC 
TGAAAATCAAGAAAAAGTAGCGGACAATTATGTGGTTTCTCGTTACGGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACG 
GCTGGTAT 

SEQ ID NO. 3104: SAG2148 FROM THE 090 GBS TYPE la STRAIN 
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GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACTACGGTACAAGAGTTAGTGTCTCTCAA 
TAGTATCAGTAACGCTGATGTCATCAGTATAGGTGATGTTTTAAAATTGGATAATTCTAAAGCTAGTCAAGCAGAAGCAAAATCTC 
AACC^CAATTGAAAATTCT^TGAATTCTTCATCAAATTTGAGTTC^GTGATTCAGCCGCAAAAGAAGAAATAGCTCGTCGTGA^ 
TCAAATGGTAGTTATACTGCACAGAATGGACAATATTATGGAAGATATCAACTGTCTCAATCTTACCTAAATGGCGACTTATCTCC 
TGAAAATCAAGAAAAAGTAGCGGACAATTATGTGGTTTCTCGTTACGGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACG 
GCTGGTAT 

SEQ ID NO. 3105: SA62148 FROM THE A909 GBS TYPE la STRAIN 

GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACTACGGTACAAGAGTTAGTGTCTCTCAA 
TAGTATCAGTAACGCTGATGTCATCAGTATAGGTGATGTTTTAAAATTGGATAATTCTACAGCTAGTCAAGCAGAAGCAAAATCTC 
AACCAACAATTGAAAATTCAATGAATTCTTCATCAAATTTGAGTTCAAGTGATTCAGCCGCAAAAGAAGAAATAGCTCGTCGTGAA 
TCAAATGGTAGTTATACT GCACAGAATGGACAATATTATGGAAGATATCAACTGTCT CAATCTTACCTAAATGGCGACTTAT CTCC 
TGAAAATCAAGAAAAAGTAGCGGACAATTATGTGGCTTCTCGTTACGGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACG 
GCTGGTAT 

SEQ ID NO. 3106: SAG2148 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACTACGGTACAAGAGTTAGTGTCTCTCAA 
TAGTATCAGTAACGCTGATGTCATCAGTATAGGTGATGTTTTAAAATTGGATAATTCTAAAGCTAGTCAAGCAGAAGCAAAATCTC 
AACCAAC^^TTGAAAATTCAATGAATTCTTCATCAAATTTGAGTTCAAGTGATTCAGCCGCAAAAGAAGAAATAGCTCGTCGTGAA 
TCAAATGGTAGTTATACTGCACAGAATGGACAATATTATGGAAGATATCAACTGTCTCAATCTTACCTAAATGGCGACTTATCTCC 
TGAAAATCAAGAAAAAGTAGCGGACAATTATGTGGTTTCTCGTTACGGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACG 
GCTGGTAT 

SEQ ID NO. 3107: SAG2148 FROM THE COHl GBS TYPE XII STRAIN 

GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACTACGGTACAATAGTTAGTGTCTCTCAA 
TAGTATCAGTAACGCTGATGTCATCAGTATAGGTGATGTTTTAAAATTGGATAATTCTACAGCTAGTCAAGCAGAAGCAAAATCTC 
AACCAACAATTGAAAATTCAATGAATTCTTCATCAAATTTGAGTTCAAGTGATTCAGCTGCAAAAGAAGAAATAGCTCGTCGTGAA 
TCAAATGGTAGTTATACTGCACAGAATGGACAATATTATGGAAGATATCAACTGTCTCAATCTTACCTAAATGGCGACTTATCTCC 
TGA2\AATCAAGAAAAAGTAGCGGACAATTATGTGGCTTCTCGTTACGGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACG 
GCTGGTAT 

SEQ ID NO. 3108: SAG2148 FROM THE H36b GBS TYPE lb STRAIN 
(REVERSE COMPLEMENT) 

GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACTACGGTACAAGAGTTAGTGTCTCTCAA 
TAGTATCAGTAACGCTGATGTCATCAGTATAGGTGATGTTTTAAAATTGGATAATTCTACAGCTAGTCAAGCAGAAGCAAAATCTC 
AACCAACAATTGAAAATTCAATGAATTCTTCATCAAATTTGAGTTCAAGTGATTCAGCCGCAAAAGAAGAAATAGCTCGTCGTGAA 
TCAAATGGTAGTTATACTGCACAGAATGGACAATATTATGGAAGATATCAACTGTCTCAATCTTACCTAAATGGCGACTTATCTCC 
TGAAAATCAAGAAAAAGTAGCGGACAATTATGTGGCTTCTCGTTACGGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACG 
GCTGGTAT 

SEQ ID NO. 3109: SAG2148 FROM THE 0M9130013 GBS TYPE VIII STRAIN 
(REVERSE COMPLEMENT) 

GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACTACGGTACAAGAGTTAGTGTCTCTCAA 
TAGTATCAGTAACGCTGACGTCATCAGTATAGGTGATGTTTTAAAATTGGATAATTCTACAACTAGTCAAGCAGAAGCAAAATCTC 
AACCAACAATTGAAAATTCAATGAATT CTT CATCAAATTTGAGTT CAAGTGATTCAGCCGCAAAAGAAGAAAT AGCTCGTCGTGAA 
TCAAATGGTAGTTATACTGCACAGAATGGACAATATTATGGAAGATATCAACTGTCTCAATCTTACCTAAATGGCGACTTATCTCC 
TGAAAATCAAGAAAAAGTAGCGGACAATTATGTGGCTTCTCGTTACGGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACG 
GCTGGTAT 

SEQ ID NO. 3110: SAG2148 FROM THE M732 GBS TYPE III STRAIN 

GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACTACGGTACAATAGTTAGTGTCTCTCAA 
TAGTATCAGTAACGCTGATGTCATCAGTATAGGTGATGTTTTAAAATTGGATAATTCTACAGCTAGTCAAGCAGAAGCAAAATCTC 
AACCAACAATTGAAAATTCAATGAATTCTTCATCAAATTTGAGTTCAAGTGATTCAGCTGCAAAAGAAGAAATAGCTCGTCGTGAA 
TCAAATGGTAGTTATACTGCACAGAATGGACAATATTATGGAAGATATCAACTGTCTCAATCTTACCTAAATGGCGACTTATCTCC 
TGAAAATCAAGAAAAAGTAGCGGACAATTATGTGGCTTCTCGTTACGGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACG 
GCTGGTAT 

SEQ ID NO. 3111: SAG2148 FROM THE M781 GBS TYPE III STRAIN 
(REVERSE COMPLEMENT) 

GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACTACGGTACAATAGTTAGTGTCTCTCAA 
TAGTATCAGTAACGCTGATGTCATCAGTATAGGTGATGTTTTAAAATTGGATAATTCTACAGCTAGTCAAGCAGAAGCAAAATCTC 
AACCAACAATTGAAAATTCAATGAATTCTTCATCAAATTTGAGTTCAAGTGATTCAGCTGCAAAAGAAGAAATAGCTCGTCGTGAA 
TCAAATGGTAGTTATACTGCACAGAATGGACAATATTATGGAAGATATCAACTGTCTCAATCTTACCTAAATGGCGACTTATCTCC 
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TGAAAATCAAGAAAAAGTAGCGGACAATTATGTGGCTTCTCGTTACGGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACG 
GCTGGTAT 

>SEQ XO NO 3150:15_1169NT frame: 1 

ASYTVKSGDTLSAIAKNHKTTVQELVSLNSISNADVISIGDVLKLDNSTASQAEAKSQPT 
IENSMNSSSNLSSSDSAAKEEIARRESNGSYTAQNGQYYGRYQLSQSYLNGDLSPENQEK 
VADNYVASRYGSWSAALS FWNSNGWY 

>SEQ ID NO 3151:15_18RS21 frame: 1 

ASYTVKSGDTLSAIAKNHOTTVQELVSLNSISNADVISIGDVLKLDNSTASQAEAKSQPT 
IENSMNSSSNLSSSDSAAKEEIARRESNGSYTAQNGQYYGRYQLSQSYLNGDLSPENQEK 
VADNYWSRYGSWSAALS FWN SNGWY 

>SEQ ID NO 3152:15_2603 frame: 1 

ASYTVKSGDTLSAIAKNHKTTVQELVSLNSISNADVISIGDVLKLDNSTASQAEAKSQPT 
IENSMNSSSNLSSSDSAAKEEIARRESNGSYTAQNGQYYGRYQLSQSYLNGDLSPENQEK 
VADNYWSRYGSWSAALS FWNSNGWY 

>SEQ ID NO 3153:15_090 frame: 1 

ASYTVKSGDTLSAIAKNHKTTVQELVSLNSISNADVISIGDVLKLDNSKASQAEAKSQPT 
IENSMNSSSNLSSSDSAAKEEIARRESNGSYTAQNGQYYGRYQLSQSYLNGDLS PENQEK 
VADNYWSRYGSWSAALS FWNSNGWY 

>SEQ ID NO 3154:15_A909 frame: 1 

ASYTVKSGDTLSAIAKNHKTTVQELVSLNSISNADVISIGDVLKLDNSTASQAEAKSQPT 
IENSMNSSSNLSSSDSAAKEE I ARRESNGSYTAQNGQYYGRYQLSQSYLNGDLS PENQEK 
VADN YVASRYGSW SAALS FWN SNGWY 

>SEQ ID NO 3155:15_CJB110 frame: 1 

ASYTVKSGDTLSAIAKNHKTTVQELVSLNSISNADVISIGDVLKLDNSKASQAEAKSQPT 
IENSMNSSSNLSSSDSAAKEEIARRESNGSYTAQNGQYYGRYQLSQSYLNGDLS PENQEK 
VADNYWSRYGSWSAALS FWN SNGWY 

>SEQ ID NO 3156:15_COHl frame: 1 

ASYTVKSGDTLSAIAKNHKTTVQ. LVSLNS I SNADVIS IGDVLKLDNSTASQAEAKSQPT 
IENSMNSSSNLSSSDSAAKEEIARRESNGSYTAQNGQYYGRYQLSQSYLNGDLS PENQEK 
VADNYVASRYGSWSAALS FWNSNGWY 

>SEQ ID NO 3157:15_H36B frame: 1 

ASY'TVKSGDTLSAIAKNHKTTVQELVSLNSISNADVISIGDVLKLDNSTASQAEAKSQPT 
IENSMNSSSNLSSSDSAAKEE IARRESNGSYTAQNGQYYGRYQLSQSYLNGDLSPENQEK 
VADNYVASRYGSWSAALS FWNSNGWY 

>SEQ ID NO 3158:15_JM9130013 frame: 1 

ASYTVKSGDTLSAIAKNHKTTVQELVSLNSISNADVISIGDVLKLDNSTTSQAEAKSQPT 
IENSMNSSSNLSSSDSAAKEE I ARRESNGSYTAQNGQYYGRYQLSQSYLNGDLS PENQEK 
VADNYVASRYGSWSAALSFWN SNGWY 

>SEQ ID NO 3159:15_M732 frame: 1 

ASYTVKSGDTLSAIAKNHKTTVQ . LVSLNS I SNADVI S IGDVLKLDNSTASQAEAKSQPT 
IENSMNSSSNLSSSDSAAKEE IARRESNGSYTAQNGQYYGRYQLSQSYLNGDLSPENQEK 
VADNYVASRYGSWSAALS FWNSNGWY 

>SEQ ID NO 3160:15_M781 frame: 1 

ASYTVKSGDTLSAIAKNHKTTVQ . L VS LNS I SNADVIS IGDVLKLDNSTASQAEAKSQPT 
IENSMNSSSNLSSSDSAAKEEIARRESNGSYTAQNGQYYGRYQLSQSYLNGDLSPENQEK 
VADNYVASRYGSWSAALSFWNSNGWY 

SEQ ID NO 4001 : SAG0653 FROM THE 2603 V/R GBS TYPE V STRAIN 

ATGAAGAAAGTGTTAGTGAGTAGTCTTTTGGTTTTAGGGATTACGATA 
ACGTTACAAACAGTAGTTGAGGCTAAGGGGCCAAAAGTAGCTTATACACAAGAGGGAATG 
ACTGCTCTTTCGGACACAAATAAAGATAAAGTCACTACTATTTCTATTGACGAGATTCAA 
AAAAGCTTAGAAGGTAAGAAGCCGATTACTGTTAGTTTTGATATTGATGATACACTGCTT 
TT CAGT AGTCAATATTTTCAATATGGT AAAGAATATGTAACTCCTGGAT CGTTTGATTTT 
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CTTCATAAACAAAAATTCTGGGATCTTGTTGCAAAACGAGGAGATCAAGATTCCATTCCC 
AAAGAATATGCTAAAAAATTAATTGCTATGCATCAAAAACGAGGAGATAAAATTGTTTTT 
ATAACAGGTAGGACAAGAGGGTCAATGTATAAGGAGGGCGAGGTTGATAAAACAGCTAAA 
GCCTTAGCTAAAGATTTTAAATTAGACAAACCAATTGCTGTAAATTATACAGGCGATAAA 
CCTAAAAAGCCATACAAATATGATAAATCATATTATATTAAGAAATATGGTTCAGACATT 
CATTATGGAGATAGTGATGACGATATTCATGCAGCTAGGGAGGCCGGTGCTAGACCAATT 
AGAATTTTAAGAGCACCTAATTCTACAAATCTACCTTTACCAGAAGCTGGAGGCTACGGT 
GAAGAGGTTCTCGAAAATTCAGCTTAC 

SEQ ID NO 4002 : SAG0653 FROM THE 090 GBS TYPE XXX STRAIN 

AAGGGGCCAAAAGTAGCTTATACACAAGAGGGAATGAC 

TGCTCTTTCGGACACAAATAAAGATAAAGTCACTACTATTTCTATTGACG 

AGATTCAAAAAAGCTTAGAAGGTAAGAAGCCGATTACTGTTAGTTTTGAT 

ATTGATGATACACTACTTTTCAGTAGTCAATATTTTCAATATGGTAAAGA 

ATATGTAACTCCTGGATCGTTTGATTTTCTTCATAAACAAAAATTCTGGG 

ATCTTGTTGCAAAACGAGGAGATCAAGATTCCATTCCCAAAGAATATGCT 

AAAAAATTAATTGCTATGCATCAAAAACGAGGAGATAAAATTGTTTTTAT 

AACAGGTAGGACAAGAGGGTCAATGTATAAGGAGGGCGAGGTTGATAAAA 

CAGCTAAAGCCTTAGCTAAAGATTTTAAATTAGACAAACCAATTGCTGTA 

AATTATACAGGCGATAAACCTAAAAAGCCATACAAATATGATAAATCATA 

TTATATTAAGAAATATGGTTCAGACATTCATTATGGAGATAGTGATGACG 

ATATTCATGCAGCTAGGGAGGCCGGTGCTAGACCAATTAGAATTTTAAGA 

GCACCTAATTCTACAAATCTACCTTTACCAGAAGCTGGAGGCTACGGTGA 

AGAGGTT CTCGAAAATTCAGCTTAC 

SEQ ID NO 4003 : SAG0653 FROM THE A909 GBS TYPE la STRAIN 

AAGGGGCCAAAAGTAGCTTATACACA 

AGAGGGAATGACTGCTCTTTCGGACACAAATAAAGATAAAGTCACTACTA 
TTTCTATTGACGAGATTCAAAAAAGCTTAGAAGGTAAGAAGCCGATTACT 
GTTAGTTTTGATATTGATGATACACTGCTTTTCAGTAGTCAATATTTTCA 
ATATGGTAAAGAATATGTAACTCCTGGATCGTTTGATTTTCTTCATAAAC 
AAAAATTCTGGGATCTTGTTGCAAAACGAGGAGATCAAGATTCCATTCCC 
AAAGAATATGCTAAAAAATTAATTGCTATGCATCAAAAACGAGGAGATAA 
AATTGTTTTTATAACAGGTAGGACAAGAGGGTCAATGTATAAGGAGGGCG 
AGGTTGATAAAACAGCTAAAGCCTTAGCTAAAGATTTTAAATTAGACAAA 
CCAATTGCTGTAAATTATACAGGCGATAAACCTAAAAAGCCATACAAATA 
TGATAAATCATATTATATTAAGAAATATGGTTCAGACATTCATTATGGAG 
ATAGTGATGACGATATTCATGCAGCTAGGGAGGCCGGTGCTAGACCAATT 
AGAATTTTAAGAGCACCTAATTCTACAAATCTACCTTTACCAGAAGCTGG 
AGGCTACGGTGAAGAGGTTCTCGAAAATTCAGCTTAC 

SEQ ID NO 4004 : SAG0653 FROM THE 18RS21 GBS TYPE II STRAIN 

AAGGGGCCAAAAGTAGCTTATACACAAGA 

GGGAATGACTGCTCTTTCGGACACAAATAAAGATAAAGTCACTACTATTT 
CTATTGACGAGATTCAAAAAAGCTTAGAAGGTAAGAAGCCGATTACTGTT 
AGTTTTGATATTGATGATACACTGCTTTTCAGTAGTCAATATTTTCAATA 
TGGTAAAGAATATGTAACTCCTGGATCGTTTGATTTTCTTCATAAACAAA 
AATT CTGGGATCTTGTTGCAAAACGAGGAGATCAAGATT CCATTCCCAAA 
GAATATGCTAAAAAATTAATTGCTATGCATCAAAAACGAGGAGATAAAAT 
TGTTTTTATAACAGGTAGGACAAGAGGGTCAATGTATAAGGAGGGCGAGG 
TTGATAAAACAGCTAAAGCCTTAGCTAAAGATTTTAAATTAGACAAACCA 
ATTGCTGTAAATTATACAGGCGATAAACCTAAAAAGCCATACAAATATGA 
TAAATCATATTATATTAAGAAATATGGTTCAGACATTCATTATGGAGATA 
GTGATGACGATATTCATGCAGCTAGGGAGGCCGGTGCTAGACCAATTAGA 
ATTTTAAGAGCACCTAATTCTACAAATCTACCTTTACCAGAAGCTGGAGG 
CTACGGTGAAGAGGTTCTCGAAAATTCAGCTTAC 

SEQ ID NO 4005 : SAG0653 FROM THE M732 GBS TYPE III STRAIN 

AAGGGGCCAAAAGTAGCTTATACACAAGA 

GGGAATGACTGCTCTTTCGGACACAAATAAAGATAAAGTCACTACTATTT 
CTATTGACGAGATTCAAAAAAGCTTAGAAGGTAAGAAGCCGATTACTGTT 
AGTTTTGATATTGATGATACACTGCTTTTCAGTAGTCAATATTTTCAATA 
TGGTAAAGAATATGTAACTCCTGGATCGTTTGATTTTCTTCATAAACAAA 
AATTCTGGGATCTTGTTGCAAAACGAGGAGATCAAGATTCCATTCCCAAA 
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GAATATGCTAAAAAATTAATTGCTATGCATCAAAAACGAGGAGATAAAAT 
TGTTTTTATAACAGGTAGGACAAGAGGGTCAATGTATAAGGAGGGCGAGG 
TTGATAAAACAGCTAAAGCCTTAGCTAAAGATTTTAAATTAGACAAACCA 
ATTGCTGTAAATTATACAGGCGATAAACCTAAAAAGCCATACAAATATGA 
TAAATCATATTATATTAAGAAATATGGTTCAGACATTCATTATGGAGATA 
GTGATGACGATATTCATGCAGCTAGGGAGGCCGGTGCTAGACCAATTAGA 
ATTTTAAGAGCACCTAATTCTACAAATCTACCTTTACCAGAAGCTGGAGG 
CTACGGTGAAGAGGTTCTCGAAAATTCAGCTTAC 

SEQ ID NO 4006 : SAG0653 FROM THE COH1 GBS TYPE IXI STRAIN 

AAGGGGCCAAAAGTAGCTTATACACAAGAGGGAATGACT 

GCTCTTTCGGACACAAATAAAGATAAAGTCACTACTATTTCTATTGACGA 

GATTCAAAAAAGCTTAGAAGGTAAGAAGCCGATTACTGTTAGTTTTGATA 

TTGATGATACACTGCTTTTCAGTAGTCAATATTTTCAATATGGTAAAGAA 

TATGTAACTCCTGGATCGTTTGATTTTCTTCATAAACAAAAATTCTGGGA 

TCTTGTTGCAAAACGAGGAGATCAAGATTCCATTCCCAAAGAATATGCTA 

AAAAATTAATTGCTATGCATCAAAAACGAGGAGATAAAATTGTTTTTATA 

ACAGGTAGGACAAGAGGGTCAATGTATAAGGAGGGCGAGGTTGATAAAAC 

AGCTAAAGCCTTAGCTAAAGATTTTAAATTAGACAAACCAATTGCTGTAA 

ATTATACAGGCGATAAACCTAAAAAGCCATACAAATATGATAAATCATAT 

TATATTAAGAAATATGGTTCAGACATTCATTATGGAGATAGTGATGACGA 

TATTCATGCAGCTAGGGAGGCCGGTGCTAGACCAATTAGAATTTTAAGAG 

CACCTAATTCTACAAATCTACCTTTACCAGAAGCTGGAGGCTACGGTGAA 

GAGGTTCTCGAAAATTCAGCTTAC 

SEQ ID NO 4007 : SAG0653 FROM THE M781 GBS TYPE III STRAIN 

AAGGGGCCAAAAGTAGCTTATACACA 

AGAGGGAATGACTGCTCTTTCGGACACAAATAAAGATAAAGTCACTACTA 
TTTCTATTGACGAGATTCAAAAAAGCTTAGAAGGTAAGAAGCCGATTACT 
GTTAGTTTTGATATTGATGATACACTGCTTTTCAGTAGTCAATATTTTCA 
ATATGGTAAAGAATATGTAACTCCTGGATCGTTTGATTTTCTTCATAAAC 
AAAAATTCTGGGATCTTGTTGCAAAACGAGGAGATCAAGATTCCATTCCC 
AAAGAATATGCTAAAAAATTAATTGCTATGCATCAAAAACGAGGAGATAA 
AATTGTTTTTATAACAGGTAGGACAAGAGGGTCAATGTATAAGGAGGGCG 
AGGTTGATAAAACAGCTAAAGCCTTAGCTAAAGATTTTAAATTAGACAAA 
CCAATTGCTGTAAATTATACAGGCGATAAACCTAAAAAGCCATACAAATA 
TGATAAATCATATTATATTAAGAAATATGGTTCAGACATTCATTATGGAG 
ATAGTGATGACGATATTCATGCAGCTAGGGAGGCCGGTGCTAGACCAATT 
AGAATTTTAAGAGCACCTAATTCTACAAATCTACCTTTACCAGAAGCTGG 
AGGCTACGGTGAAGAGGTTCTCGAAAATTCAGCTTAC 

SEQ ID NO 4008 : SAGO 65 3 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

AAGGGGCCAAAAGTAGCTTATACACAAGA 

GGGAATGACTGCTCTTTCGGACACAAATAAAGATAAAGTCACTACTATTT 
CTATTGACGAGATTCAAAAAAGCTTAGAAGGTAAGAAGCCGATTACTGTT 
AGTTTTGATATTGATGATACACTGCTTTTCAGTAGTCAATATTTTCAATA 
TGGTAAAGAATATGTAACTCCTGGATCGTTTGATTTTCTTCATAAACAAA 
AATTCTGGGATCTTGTTGCAAAACGAGGAGATCAAGATTCCATTCCCAAA 
GAATATGCTAAAAAATTAATTGCTATGCATCAAAAACGAGGAGATAAAAT 
TGTTTTTATAACAGGTAGGACAAGAGGGTCAATGTATAAGGAGGGCGAGG 
TTGATAAAACAGCTAAAGCCTTAGCTAAAGATTTTAAATTAGACAAACCA 
ATTGCTGTAAATTATACAGGCGATAAACCTAAAAAGCCATACAAATATGA 
TAAATCATATTATATTAAGAAATATGGTTCAGACATTCATTATGGAGATA 
GTGATGACGATATTCATGCAGCTAGGGAGGCCGGTGCTAGACCAATTAGA 
ATTTTAAGAGCACCTAATTCTACAAATCTACCTTTACCAGAAGCTGGAGG 
CTACGGTGAAGAGGTTCTCGAAAATTCAGCTTAC 

SEQ ID NO 4009 : SAG0653 FROM THE JM9130013 GBS TYPE VIII STRAIN 

AAGGGGCCAAAAGTAGCTTATACACAAGAGGGAAT 

GACTGCTCTTTCGGACACAAATAAAGATAAAGTCACTACTATTTCTATTG 
ACGAGATTCAAAAAAGCTTAGAAGGTAAGAAGCCGATTACTGTTAGTTTT 
GATATTGATGATACACTGCTTTTCAGTAGTCAATATTTTCAATATGGTAA 
AGAATATGTAACTCCTGGATCGTTTGATTTTCTTCATAAACAAAAATTCT 
GGGATCTTGTTGCAAAACGAGGAGATCAAGATTCCATTCCCAAAGAATAT 
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GCTAAAAAATTAATTGCTATGCATCAAAAACGAGGAGATAAAATTGTTTT 
TATAACAGGTAGGACAAGAGGGTCAATGTATAAGGAGGGCGAGGTTGATA 
AAACAGCTAAAGCCTTAGCTAAAGATTTTAAATTAGACAAACCAATTGCT 
GTAAATTATACAGGCGATAAACCTAAAAAGCCATACAAATATGATAAATC 
ATATTATATTAAGAAATATGGTTCAGACATTCATTATGGAGATAGTGATG 
ACGATATTCATGCAGCTAGGGAGGCCGGTGCTAGACCAATTAGAATTTTA 
AGAGCACCTAATTCTACAAATCTACCTTTACCAGAAGCTGGAGGCTACGG 
TGAAGAGGTTCTCGAAAATTCAGCTTAC 

SEQ ID NO 4010 : SAG0653 FROM THE 2603 V/R GBS TYPE V STRAIN 

KGPKVAYTQEGMTALSDTNKDKVTTISIDEIQKSLEGKKPITVSFDIDDTLLFSSQYFQY 
GKEYVTPGS FDFLHKQKFWDLVAKRGDQDS I PKEYAKKLIAMHQKRGDKI VFITGRTRGS 
l^YKEGEVDKTAKALAKDFKLDKPIAVNYTGDKPKKPYKYDKSYYIKKYGSDIHYGDSDDD 
IHAAREAGARPIRI LRAPNSTNLPLPEAGGYGEEVLEN SAY 

SEQ ID NO 4011 : SAG0653 FROM THE 090 GBS TYPE III STRAIN 

KGPKVAYTQEGMTALSDTNKDKVTTISIDEIQKSLEGKKPITVSFDIDDTLLFSSQYFQY 
GKEYVTPGS FDFLHKQKFWDLVAKRGDQDS I PKEYAKKLIAMHQKRGDKI VFITGRTRGS 
MYKEGEVDKTAKALAKDFKLDKPIAVNYTGDKPKKPYKYDKSYYIKKYGSDIHYGDSDDD 
IHAAREAGARPIRILRAPNSTNLPLPEAGGYGEEVLENSAY 

SEQ ID NO 4012 : SAG0653 FROM THE A909 GBS TYPE la STRAIN 

KGPKVAYTQEGMTALSDTNKDKVTTISIDEIQKSLEGKKPITVSFDIDDTLLFSSQYFQY 
GKEYVT PGS FDFLHKQKFWDLVAKRGDQDS I PKEYAKKLIAMHQKRGDKI VFITGRTRGS 
MYKEGEVDKTAKALAKDFKLDKPIAVNYTGDKPKKPYKYDKSYYIKKYGSDIHYGDSDDD 
IHAAREAGARPIRILRAPNSTNLPLPEAGGYGEEVLENSAY 

SEQ ID NO 4013 : SAG0653 FROM THE 18RS21 GBS TYPE II STRAIN 

KGPKVAYTQEGMT ALS DTNKDKVT T I S I DEI QKSLEGKKPITVS FDI DDTLLFS S QYFQY 
GKEYVT PGS FDFLHKQKFWDLVAKRGDQDS I PKEYAKKLIAMHQKRGDKI VFITGRTRGS 
MYKEGEVDKTAKALAKDFKLDKPIAVNYTGDKPKKPYKYDKSYYIKKYGSDIHYGDSDDD 
IHAAREAGARPIRILRAPNSTNLPLPEAGGYGEEVLENSAY 

SEQ ID NO 4014 : SAG0653 FROM THE COHl GBS TYPE III STRAIN 

KGPKVAYTQEGMTALSDTNKDKVTTIS I DEIQKSLEGKKPI TVS FDI DDTLLFS SQYFQY 
GKEYVT PGSFDFLHKQKFWDLVAKRGDQDSIPKEYAKKLIAMHQKRGDKIVFITGRTRGS 
MYKEGEVDKTAKALAKDFKLDKPIAVNYTGDKPKKPYKYDKSYYIECKYGSDIHYGDSDDD 
IHAAREAGARPIRI LRAPNSTNLPLPEAGGYGEEVLEN SAY 

SEQ ID NO 4015 : SAG0653 FROM THE M781 GBS TYPE III STRAIN 

KGPKVAYTQEGMTALSDTNKDKVTTIS I DEIQKSLEGKKPITVS FDI DDTLLFSSQYFQY 
GKEYVT PGSFDFLHKQKFWDLVAKRGDQDS I PKEYAKKLIAMHQKRGDKI VFITGRTRGS 
MYKEGEVDKTAKALAKDFKLDKPIAVNYTGDKPKKPYKYDKSYYIKKYGSDIHYGDSDDD 
IHAAREAGARPIRILRAPNSTNLPLPEAGGYGEEVLENSAY 

SEQ ID NO 4016 : SAG0653 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

KGPKVAYTQEGMTALSDTNKDKVTTIS I DEIQKSLEGKKPITVSFDI DDT LLFSSQYFQY 
GKEYVT PGS FDFLHKQKFWDLVAKRGDQDS I PKEYAKKLIAMHQKRGDKI VFITGRTRGS 
MYKEGEVDKTAKALAKDFKLDKPIAVNYTGDKPKKPYKYDKSYYIKKYGSDIHYGDSDDD 
IHAAREAGARPIRILRAPNSTNLPLPEAGGYGEEVLENSAY 

SEQ ID NO 4017 : SAGO 653 FROM THE JM9130013 GBS TYPE VIII STRAIN 

KGPKVAYTQEGMTALSDTNKDKVTTIS I DEIQKSLEGKKPITVS FDI DDTLLFS SQYFQY 
GKEYVTPGS FDFLHKQKFWDLVAKRGDQDS I PKEYAKKLIAMHQKRGDKI VFITGRTRGS 
MYKEGEVDKTAKALAKDFKLDKPIAVNYTGDKPKKPYKYDKSYYIKKYGSDIHYGDSDDD 
IHAAREAGARPIRILRAPNSTNLPLPEAGGYGEEVLENSAY 

SEQ ID NO 4018 : SAG0653 FROM THE M732 GBS TYPE III STRAIN 

KGPKVAYTQEGMTALSDTNKDKVTTISIDEIQKSLEGKKPITVSFDIDDTLLFSSQYFQY 
GKEYVTPGS FDFLHKQKFWDLVAKRGDQDS I PKEYAKKLIAMHQKRGDKIVFITGRTRGS 
MYKEGEVDKTAKALAKDFKLDKPIAVNYTGDKPKKPYKYDKSYYIKKYGSDIHYGDSDDD 
IHAAREAGARPIRI LRAPNSTNLPLPEAGGYGEEVLEN SAY 

SEQ ID NO. 4101: SAG0649 FROM 2603 V/R GBS TYPE V STRAIN 
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ATGAAAAAGAGACAAAAAATA 

TGGAGAGGGTTATCAGTTACTTTACTAATCCTGTCCCAAATTCCATTTGGTATATTGGTA 

CAAGGTGAAACCCAAGATACCAATCAAGCACTTGGAA2^AGTAATTGTTAAAAAAACGGGA 

GACAATGCTACACCATTAGGCAAAGCGACTTTTGTGTTAAAAAATGACAATGATAAGTCA 

GAAACAAGTCACGAAACGGTAGAGGGTTCTGGAGAAGCAACCTTTGAAAACATAAAACCT 

GGAGACTACACATTAAGAGAAGAAACAGCACCAATTGGTTATAAAAAAACTGATAAAACC 

TGGAAAGTTAAAGTTGCAGATAACGGAGCAACAATAATCGAGGGTATGGATGCAGATAAA 

GCAGAGAAACGAAAAGAAGTTTTGAATGCCCAATATCCAAAATCAGCTATTTATGAGGAT 

ACAAAAGAAAATTACCCATTAGTTAATGTAGAGGGTTCCAAAGTTGGTGAACAATACAAA 

GCATTGAATCCAATAAATGGAAAAGATGGTCGAAGAGAGATTGCTGAAGGTTGGTTATCA 

AAAAAAATTACAGGGGTCAATGATCTCGATAAGAATAAATATAAAATTGAATTAACTGTT 

GAGGGTAAAACCACTGTTGAAACGAAAGAACTTAATCAACCACTAGATGTCGTTGTGCTA 

TTAGATAATTCAAATAGTATGAATAATGAAAGAGCCAATAATTCTCAAAGAGCATTAAAA 

GCTGGGGAAGCAGTTGAAAAGCTGATTGATAAAATTACATCAAATAAAGACAATAGAGTA 

GCTCTTGTGACATATGCCTCAACCATTTTTGATGGTACTGAAGCGACCGTATCAAAGGGA 

GTTGCCGATCAAAATGGTAAAGCGCTGAATGATAGTGTATCATGGGATTATCATAAAACT 

ACTTTTACAGCAACTACACATAATTACAGTTATTTAAATTTAACAAATGATGCTAACGAA 

GTTAATATTCTAAAGTCAAGAATTCCAAAGGAAGCGGAGCATATAAATGGGGATCGCACG 

CTCTATCAATTTGGTGCGACATTTACTCAAA7UVGCTCTAATGAAAGCAAATGAAATTTTA 

GAGACACAAAGTTCTAATGCTAGAAAAAAACTTATTTTTCACGTAACTGATGGTGTCCCT 

ACGATGTCTTATGCCATAAATTTTAATCCTTATATATCAACATCTTACCAAAACCAGTTT 

AATT CTTTTTTAAATAAAATACCAGATAGAAGTGGTATTCTCCAAGAGGATTTTAT AAT C 

AATGGTGATGATTATCAAATAGTAAAAGGAGATGGAGAGAGTTTTAAACTGTTTTCGGAT 

AGAAAAGTTCCTGTTACTGGAGGAACGACACAAGCAGCTTATCGAGTACCGCAAAATCAA 

CTCTCTGTAATGAGTAATGAGGGATATGCAATTAATAGTGGATATATTTATCTCTATTGG 

AGAGATTACAACTGGGTCTATCCATTTGATCCTAAGACAAAGAAAGTTTCTGCAACGAAA 

CAAATCAAAACTCATGGTGAGCCAACAACATTATACTTTAATGGAAATATAAGACCTAAA 

GGTTATGACATTTTTACTGTTGGGATTGGTGTAAACGGAGATCCTGGTGCAACTCCTCTT 

GAAGCTGAGAAATTTATGCAATCAATATCAAGTAAAACAGAAAATTATACTAATGTTGAT 

GATACAAATAAAATTTATGATGAGCTAAATAAATACTTTAAAACAATTGTTGAGGAAAAA 

CATTCTATTGTTGATGGAAATGTGACTGATCCTATGGGAGAGATGATTGAATTCCAATTA 

AAAAATGGTCAAAGTTTTACACATGATGATTACGTTTTGGTTGGAAATGATGGCAGTCAA 

TTAAAAAATGGTGTGGCTCTTGGTGGACCAAACAGTGATGGGGGAATTTTAAAAGATGTT 

ACAGTGACTTATGATAAGACATCTCAAACCATCAAAATCAATCATTTGAACTTAGGAAGT 

GGACAAAAAGTAGTTCTTACCTATGATGTACGTTTAAAAGATAACTATATAAGTAACAAA 

TTTTACAATACAAATAATCGTACAACGCTAAGTCCGAAGAGTGAAAAAGAACCAAATACT 

ATTCGTGATTTCCCAATTCCCAAAATTCGTGATGTTCGTGAGTTTCCGGTACTAACCATC 

AGTAATCAGAAGAAAATGGGTGAGGTTGAATTTATTAAAGTTAATAAAGACAAACATTCA 

GAATCGCTTTTGGGAGCTAAGTTTCAACTTCAGATAGAAAAAGATTTTTCTGGGTATAAG 

CAATTTGTTCCAGAGGGAAGTGATGTTACAACAAAGAATGATGGTAAAATTTATTTTAAA 

GCACTTCAAGATGGTAACTATAAATTATATGAAATTTCAAGTCCAGATGGCTATATAGAG 

GTTT^AAACGAAACCTGTTGTGACATTTACAATTCAAAATGGAGAAGTTACGAACCTGAAA 

GCAGATCCAAATGCTAATAAAAATCAAATCGGGTATCTTGAAGGAAATGGTAAACATCTT 

ATTACCAACACTCCCAAACGCCCACCAGGTGTTTTTCCTAAAACAGGGGGAATTGGTACA 

ATTGTCTATATATTAGTTGGTTCTACTTTTATGATACTTACCATTTGTTCTTTCCGTCGT 

AAACAATTG 

SEQ XD NO. 4102: SAG0649 FROM 090 GBS TYPE la STRAIN 

GGTGAAACCCAAGATACCAATCAAGCACTTGGAAAAG 

TAATTGTTAAAAAAACGGGAGACAATGCTACACCATTAGGCAAAGCGACT 

TTTGTGTTAAAAAATGACAATGATAAGTCAGAAACAAGTCACGAAACGGT 

AGAGGGTTCTGGAGAAGCAACCTTTGAAAACATAAAACCTGGAGACTACA 

CATTAAGAGAAGAAACAGCACCAATTGGTTATAAAAAAACTGATAAAACC 

TGGAAAGTTAAAGTTGCAGATAACGGAGCAACAATAATCGAGGGTATGGA 

TGCAGATAAAGCAGAGAAACGAAAAGAAGTTTTGAATGCCCAATATCCAA 

AATCAGCTATTTATGAGGATACAAAAGAAAATTACCCATTAGTTAATGTA 

GAGGGTTCCAAAGTTGGTGAACAATACAAAGCATTGAATCCAATAAATGG 

AAAAGATGGTCGAAGAGAGATTGCTGAAGGTTGGTTATCAAAAAAAATTA 

CAGGGGTCAATGATCTCGATAAGAATAAATATAAAATTGAATTAACTGTT 

GAGGGTAAAACCACTGTTGAAACGAAAGAACTTAATCAACCACTAGATGT 

CGTTGTGCTATTAGATAATTCAAATAGTATGAATAATGAAAGAGCCAATA 

ATTCTCAAAGAGCATTAAAAGCTGGGGAAGCAGTTGAAAAGCTGATTGAT 

AAAATTACATCAAATAAAGACAATAGAGTAGCTCTTGTGACATATGCCTC 

AACCATTTTTGATGGTACTGAAGCGACCGTATCAAAGGGAGTTGCCGATC 
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AAAATGGTAAAGCGCTGAATGATAGTGTATCATGGGATTATCATAAAACT 
ACTTTTACAGCAACTACACATAATTACAGTTATTTAAATTTAACAAATGA 
TGCTAACGAAGTTAATATTCTAAAGTCAAGAATTCCAAAGGAAGCGGAGC 
ATATAAATGGGGATCGCACGCTCTATCAATTTGGTGCGACATTTACTCAA 
AAAGCTCTAATGAAAGCAAATGAAATTTTAGAGACACAAAGTTCTAATGC 
TAGAAAAAAACTTATTTTTCACGTAACTGATGGTGTCCCTACGATGTCTT 
ATGCCATAAATTTTAATCCTTATATATCAACATCTTACCAAAACCAGTTT 
AATTCTTTTTTAAATAAAATACCAGATAGAAGTGGTATTCTCCAAGAGGA 
TTTTATAATCAATGGTGATGATTATCAAATAGTAAAAGGAGATGGAGAGA 
GTTTTAAACTGTTTTCGGATAGAAAAGTTCCTGTTACTGGAGGAACGACA 
CAAGCAGCTTATCGAGTACCGCAAAATCAACTCTCTGTAATGAGTAATGA 
GGGATATGCAATTAATAGTGGATATATTTaTCTCTATTGGAGAGATTACA 
ACTGGGTCTATCCATTTGATCCTAAGACAAAGAAAGTTTCTGCAACGAAA 
CAAATCAAAACTCATGGTGAGCCAACAACATTATACTTTAATGGAAATAT 
AAGACCTAAAGGTTATGACATTTTTACTGTTGGGATTGGTGTAAACGGAG 
ATCCTGGTGCAACTCCTCTTGAAGCTGAGAAATTTATGCAATCAATATCA 
AGTAAAACAGAAAATTATACTAATGTTGATGATACAAATAAAATTTATGA 
TGAGCTAAATAAATACTTTAAAACAATTGTTGAGGAAAAACATTCTATTG 
TTGATGGAAATGTGACTGATCCTATGGGAGAGATGATTGAATTCCAATTA 
AAAAATGGTCAAAGTTTTACACATGATGATTACGtTTTGGtTGGAAATGA 
tGGCAGTCAATTAAAAAATGGTGTGGCTCTTGGTGGACCAAACAGTGATG 
GGGGAATTTTAAAAGATGTTACAGTGACTTATGATAAGACATCTCAAACC 
ATCAAAATCAATCATTTGAACTTAGGAAGTGGACAAAAAGTAGTTCTTAC 
CTATGATGTACGTTTAAAAGATAACTATATAAGTAACAAATTTTACAATA 
CAAATAATCGTACAACGCTAAGTCCGAAGAGTGAAAAAGAACCAAATACT 
ATTCGTGATTTCCCAATTCCCAAAATTCGTGATGTTCGTGAGTTTCCGGT 
ACTAACCATCAGTAATCAGAAGAAAATGGGTGAGGTTGAATTTATTAAAG 
TTAATAAAGACAAACATTCAGAATCGCTTTTGGGAGCTAAGTTTCAACTT 
CAGATAGAAAAAGATTTTTCTGGGTATAAGCAATTTGTTCCAGAGGGAAG 
TGATGTTACAACAAAGAATGATGGTAAAATTTATTTTAAAGCACTTCAAG 
ATGGTAACTATAAATTATATGAAATTTCAAGTCCAGATGGCTATATAGAG 
GTTAAAACGAAACCTGTTGTGACATTTACAATTCAAAATGGAGAAGTTAC 
GAACCTGAAAGCAGATCCAAATGCTAATAAAAATCAAATCGGGTATCTTG 
AAGGAAATGGTAAACATCTTATTACCAACACTCCCAAACGCCCACCAGGT 
GTT 

SEQ XD NO, 4103: SAG0649 FROM A909 GBS TYPE la STRAIN 

GGTGAAACCCAAGATACCAATCAAGCACTTGGAAAA 

GTAATTGTTAAAAAAACGGGGGACAATGCTACACCATTAGGCAAAGCGAC 
TTTTGTGTTAAAAAATGACAATGATAAGTCAgAAACAAGTCACGAAACGG 
TAGAGGGTTCTGGAGAAgCAACCTTTGAAAACATAAAACCTGGAGACTAC 
ACATTAAGAGAAGAAACAGCACCAATTGGTTATAAAAAAACTGATAAAAC 
CTGGAAAGTTAAAGTTGCAGATAACGGAGCAACAATAATCGAGGGTATGG 
ATGCAGATAAAGCAGAGAAACGAAAAGAAGTTTTGAATGCCCAATATCCA 
AAATCAGCTATTTATGAGGATACAAAAGAAAATTACCCATTAgTTAATGT 
AGAGGGTTCCAAAGTTGGTGAACAATACAAAGCATTGAATCCAATAAATG 
GAAAAGATGGTCGAAGAGAGATTGCTGAAGGTTGGTTATCAAAAAAAATT 
ACAGGGGTCAATGATCTCGATAAGAATAAATATAAAATTGAATTAACTGT 
TGAGGGTAAAACCACTGTTGAAACGAAAGAACTTAATCAACCACTAGATG 
TCGTTGTGCTATTAGATAATTCAAATAGTATGAATAATGAAAGAGCCAAT 
AATTCTCAAAGAGCATTAAAAGCTGGGGAAGCAGTTGAAAAGCTGATTGA 
TAAAATTACATCAAATAAAGACAATAGAGTAGCTCTTGTGACATATGCCT 
CAACCATTTTTGATGGTACTGAAGCGACCGTATCAAAGGGAGTTGCCGAT 
CAAAATGGTAAAGCGCTGAATGATAGTGTATCATGGGATTATCATAAAAC 
TACTTTTACAGCAACTACACATAATTACAGTTATTTAAATTTAACAAATG 
ATGCTAACGAAGTTAATATTCTAAAGTCAAGAATTCCAAAGGAAGCGGAG 
CATATAAATGGGGAT CGCACGCTCTAT CAATTTGGTGCGACATTTACTCA 
AAAAGCTCTAATGAAAGCAAATGAAATTTTAGAGACACAAAGTTCTAATG 
CTAGAAAAAAACTTATTTTTCACGTAACTGATGGTGTCCCTACGATGTCT 
TATGCCATAAATTTTAATCCTTATATATCAACATCTTACCAAAACCAGTT 
TAATTCTTTTTTAAATAAAATACCAGATAGAAGTGGTATTCTCCAAGAGG 
ATTTTATAATCAATGGTGATGATTATCAAATAGTAAAAGGAGATGGAGAG 
AGTTTTAAACTGTTTTCGGATAGAAAAGTTCCTGTTACTGGAGGAACGAC 
ACAAGCAGCTTATCGAGTACCGCAAAATCAACTCTCTGTAATGAGTAATG 
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AGGGATATGCAATTAATAGTGGATATATTTATCTCTATTGGAGAGATTAC 
AACTGGGTCTATCCATTTGATCCTAAGACAAAGAAAGTTTCTGCAACGAA 
ACAAATCAAAACTCATGGTGAGCCAACAACATTATACTTTAATGGAAATA 
TAAGACCTAAAGGTTATGACATTTTTACTGTTGGGATTGGTGTAAACGGA 
GATCCTGGTGCAACTCCTCTTGAAGCTGAGAAATTTATGCAATCAATATC 
AAGTAAAACAGAAAATTATACTAATGTTGATGATACAAATAAAATTTATG 
ATGAGCTAAATAAATACTTTAAAACAATTGTTGAGGAAAAACATTCTATT 
GTTGATGGAAATGTGACTGATCCTATGGGAGAGATGATTGAATTCCAATT 
AAAAAATGGTCAAAGTTTTACACATGATGATTACGtTTTGGtTGGAAATG 
AtGGCAGTCAATTAAAAAATGGTGTGGCTCTTGGTGGACCAAACAGTGAT 
GGGGGAATTTTAAAAGATGTTACAGTGACTTATGATAAGACATCTCAAAC 
CATCAAAATCAATCATTTGAACTTAGGAAGTGGACAAAAAGTAGTTCTTA 
CCTATGATGTACGTTTAAAAGATAACTATATAAGTAACAAATTTTACAAT 
ACAAATAATCGTACAACGCTAAGTCCGAAGAGTGAAAAAGAACCAAATAC 
TATTCGTGATTTCCCAATTCCCAAAATTCGTGATGTTCGTGAGTTTCCGG 
TACTAACCATCAGTAATCAGAAGAAAATGGGTGAGGTTGAATTTATTAAA 
GTTAATAAAGACAAACATTCAGAATCGCTTTTGGGAGCTAAGTTTCAACT 
TCAGATAGAAAAAGATTTTTCTGGGTATAAGCAATTTGTTCCAGAGGGAA 
GTGATGTTACAACAAAGAATGATGGTAAAATTTATTTTAAAGCACTTCAA 
GATGGTAACTATAAATTATATGAAATTTCAAGTCCAGATGGCTATATAGA 
GGTTAAAACGAAACCTGTTGTGACATTTACAATTCAAAATGGAGAAGTTA 
CGAACCTGAAAGCAGATCCAAATGCTAATAAAAATCAAATCGGGTATCTT 
GAAGGAAATGGTAAACATCTTATTACCAACACTCCCAAACGCCCACCAGG 
TGTT 

SEQ ID NO. 4104: SAG0649 FROM 18RS21 GBS TYPE II STRAIN 

GGTGAAACCCAAGATACCAATCAAGCAC 

TTGGAAAAGTAATTGTTAAAAAAACGGGAGACAaTGCTACACCaTTAGGC 
AAAGCGACTTTTGTGTTAAAAAATGACAATGATAAGTCAGAAACAAGTCA 
CGAAACGGTAGAGGGTTCTGGAGAAgCAACCTTTGAAAACATAAAACCTG 
GAGACTACACATTAAGAGAAGAAACAGCACCAATTGGTTATAAAAAAACT 
GATAAAACCTGGAAAGTTAAAGTTGCAGATAACGGAGCAACAATAATCGA 
GGGTATGGATGCAGATAAAGCAGAGAAACGAAaAGAAGTTTTGAATGCCC 
AATATCCAAAATCAGCTATTTATGAGGATACAAAAGAAAATTACCCATTA 
GTTAATGTAGAGGGTTCCAAAGTTGGTGAACAATACAAAGCATTGAATCC 
AATAAATGGAAAAGATGGTCGAAGAGAGATTGCTGAAGGTTGGTTATCAA 
AAAAAATTaCaGGGGTCAATGATCTCGATAAGAATAAATATAAAATTGAA 
TTAACTGTTGAGGGTA7\AACCACTGTTGAAACGAAAGAACTTAATCAACC 
ACTAGATGTCGTTGTGCTATTAGATAATTCAAATAGTATGAATAATGAAA 
GAGCCAATAATTCTCAAAGAGCATTAAAAGCTGGGGAAGCAGTTGAAAAG 
CTGATTGATAAAATTACATCAAATAAAGACAATAGAGTAGCTCTTGTGAC 
ATATGCCTCAACCATTTTTGATGGTACTGAAGCGACCGTATCAAAGGGAG 
TTGCCGATCAAAATGGTAAAGCGCTGAATGATAGTGTATCATGGGATTAT 
CATAAAACTACTTTTACAGCAACTACACATAATTACAGTTATTTAAATTT 
AACAAATGATGCTAACGAAGTTAATATTCTAAAGTCAAGAATTCCAAAGG 
AAGCGGAGCATATAAATGGGGATCGCACGCTCTATCAATTTGGTGCGACA 
TTTACTCAAAAAGCTCTAATGAAAGCAAATGAAATTTTAGAGACACAAAG 
TTCTAATGCTAGAAAAAAACTTATTTTTCACGTAACTGATGGTGTCCCTA 
CGATGTCTTATGCCATAAATTTTAATCCTTATATATCAACATCTTACCAA 
AACCAGTTTAATTCTTTTTTAAATAAAATACCAGATAGAAGTGGTATTCT 
CCAAGAGGATTTTATAATCAATGGTGATGATTATCAAATAGTAAAAGGAG 
ATGGAGAGAGTTTTAAACTGTTTTCGGATAGAAAAGTTCCTGTTACTGGA 
GGAACGACACAAGCAGCTTATCGAGTACCGCAAAATCAACTCTCTGTAAT 
GAGTAATGAGGGATATGCAATTAATAGTGGATATATTTATCTCTATTGGA 
GAGATTACAACTGGGTCTATCCATTTGATCCTAAGACAAAGAAAGTTTCT 
GCAACGAAACAAATCAAAACTCATGGTGAGCCAACAACATTATACTTTAA 
TGGAAATATAAGACCTAAAGGTTATGACATTTTTACTGTTGGGATTGGTG 
TAAACGGAGATCCTGGTGCAACTCCTCTTGAAGCTGAGAAATTTATGCAA 
TCAATATCAAGTAAAACAGAAAATTATACTAATGTTGATGATACAAATAA 
AATTTATGATGAGCTAAATAAATACTTTAAAACAATTGTTGAGGAAAAAC 
ATTCTATTGTTGATGGAAATGTGACTGATCCTATGGGAGAGATGATTGAA 
TTCCAATTAAAAAATGGTCAAAGTTTTACACATGATGATTACGTTTTGGT 
TGGAAATGATGGCAGTCAATTAAAAAATGGTGTGGCTCTTGGTGGACCAA 
ACAGTGATGGGGGAATTTTAAAAGATGTTACAGTGACTTATGATAAGACA 



143 



WO 2004/018646 



PCT/US2003/026827 



SEQUENCE LISTING 



TCTCAAACCATCAAAATCAATCATTTGAACTTAGGAAGTGGACAAAAAGT 
AGTTCTTACCTATGATGTACGTTTAAAAGATAACTATATAAGTAACAAAT 
TTTACAATACAAATAATCGTACAACGCTAAGTCCGAAGAGTGAAAAAGAA 
CCAAATACTAT t cGt gATT t CCCAATTCCCAAAATTCGTGATGTTCGTGA 
GTTTCCGGTACTAACCATCAGTAATCAGAAGAAAATGGGTGAGGTTGAAT 
TTATTAAAGTTAATAAAGACAAACATTCAGAATCGCTTTTGGGAGCTAAG 
TTTCAACTTCAGATAGAAAAAGATTTTTCTGGGTATAAGCAATTTGTTCC 
AGAGGGAAGTGATGTTACAACAAAGAATGATGGTAAAATTTATTTTAAAG 
CACTTCAAGATGGTAACTATAAATTATATGAAATTTCAAGTCCAGATGGC 
TATATAGAGGTTAAAACGAAACCTGTTGTGACATTTACAATTCAAAATGG 
AGAAGTTACGAACCTGAAAGCAGATCCAAATGCTAATAAAAATCAAATCG 
GGTATCTTGAAGGAAATGGTAAACATCTTATTACCAACACTCCCAAACGC 
CCACCAGGTGTT 

SEQ ID NO. 4105: SAG0649 FROM M732 GBS TYPE III STRAIN 

GGTGAAACCCAAGATACCAATCAAGCACT 

TGGAAAAGTAATTGTTAAAAAAACGGGAGACAaTGCTACACCATTAGGCA 
AAGCGACTTTTGTGTTAAAAAATGACAATGATAAGTCAGAAACAAGTCAC 
GAAACGGTAGAGGGTTCTGGAGAAGCAACCTTTGAAAACATAAAACCTGG 
AGACTACACATTAAGAGAAGAAACAGCACCAATTGGTTATAAAAAAACTG 
ATAAAACCTGGAAAGTTAAAGTTGCAGATAACGGAGCAACAATAATCGAG 
GGTATGGATGCAGATAAAGCAGAGAAACGAAAAGAAGTTTTGAATGCCCA 
ATATCCAAAATCAGCTATTTATGAGGATACAAAAGAAAATTACCCATTAg 
TTAATGTAGAGGGTTCCAAAGTTGGTGAACAATACAAAGCATTGAATCCA 
ATAAATGGAAAAGATGGTCGAAGAGAGATTGCTGAAGGTTGGTTATCAAA 
AAAAAaTaCaGGGGTCAATGATCTCGATAAGAATAAATATAAAATTGAAT 
TAACTGTTGAGGGTAAAACCACTGTTGAAACGAAAGAACTTAATCAACCA 
CTAGATGTCGTTGTGCTATTAGATAATTCAAATAGTATGAATAATGAAAG 
AGCCAATAATTCTCAAAGAGCATTAAAaGCTGGGGAAGCAGTTGAAAAGC 
TGATTGATAAAATTACATCAAATAAAGACAATAGAGTAGCTCTTGTGACA 
TATGCCTCAACCATTTTTGATGGTACTGAAGCGACCGTATCAAAGGGAGT 
TGCCGATCAAAATGGTAAAGCGCTGAATGATAGTGTATCATGGGATTATC 
ATAAAACTACTTTTACAGCAACTACACATAATTACAGTTATTTAAATTTA 
ACAAATGATGCTAACGAAGTTAATATTCTAAAGTCAAGAATTCCAAAGGA 
AGCGGAGCATATAAATGGGGATCGCACGCTCTATCAATTTGGTGCGACAT 
TTACTCAAAAAGCTCTAATGAAAGCAAATGAAATTTTAGAGACACAAAGT 
TCTAATGCTAGAAAAAAACTTATTTTTCACGTAACTGATGGTGTCCCTAC 
GATGTCTTATGCCATAAATTTTAATCCTTATATATCAACATCTTACCAAA 
ACCAGTTTAATTCTTTTTTAAATAAAATACCAGATAGAAGTGGTATTCTC 
CAAGAGGATTTTATAATCAATGGTGATGATTATCAAATAGTAAAAGGAGA 
TGGAGAGAGTTTTAAACTGTTTTCGGATAGAAAAGTTCCTGTTACTGGAG 
GAACGACACAAGCAGCTTATCGAGTACCGCAAAATCAACTCTCTGTAATG 
AGTAATGAGGGATATGCAATTAAT AGTGGATATATTTAT CT CT ATTGGAG 
AGATTACAACTGGGTCTATCCATTTGATCCTAAGACAAAGAAAGTTTCTG 
CAACGAAACAAATCAAAACTCATGGTGAGCCAACAACATTATACTTTAAT 
GGAAATATAAGACCTAAAGGTTATGACATTTTTACTGTTGGGATTGGTGT 
AAACGGAGATCCTGGTGCAACTCCTCTTGAAGCTGAGAAATTTATGCAAT 
CAATATCAAGTAAAACAGAAAATTATACTAATGTTGATGATACAAATAAA 
ATTTATGATGAGCTAAATAAATACTTTAAAACAATTGTTGAGGAAAAACA 
TTCTATTGTTGATGGAAATGTGACTGATCCTATGGGAGAGATGATTGAAT 
TCCAATTAAAAAATGGTCAAAGTTTTACACATGATGATTACGtTTTGGtT 
GGAAATGAtGGCAGTCAATTAAAAAATGGTGTGGCTCTTGGTGGACCAAA 
CAGTGATGGGGGAATTTTAAAAGATGTTACAGTGACTTATGATAAGACAT 
CTCAAACCATCAAAATCAATCATTTGAACTTAGGAAGTGGACAAAAAGTA 
GTTCTTACCTATGATGTACGTTTAAAAGATAACTATATAAGTAACAAATT 
TTACAATACAAATAATCGTACAaCGCTAAGTCCGAAGAGTGAAAAAGAAC 
CAAATACTATTCGTGATTTCCCAATTCCCAAAATTCGTGATGTTCGTGAG 
TTTCCGGTACTAACCATCAGTAATCAGAAGAAAATGGGTGAGGTTGAATT 
TATTAAAGTTAATAAAGACAAACATTCAGAATCGCTTTTGGGAGCTAAGT 
TTCAACTTCAGATAGAAAAAGATTTTTCTGGGTATAAGCAATTTGTTCCA 
GAGGGAAGTGATGTTACAACAAAGAATGATGGTAAAATTTATTTTAAAGC 
ACTTCAAGATGGTAACTATAAATTATATGAAATTTCAAGTCCAGATGGCT 
ATATAGAGGTTAAAACGAAACCTGTTGTGACATTTACAATTCAAAATGGA 
GAAGTTACGAACCTGAAAGCAGATCCAAATGCTAATAAAAATCAAATCGG 
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GTATCTTGAAGGAAATGGTAAACATCTTATTACCAACACTCCCAAACGCC 
CACCAGGTGTT 

SEQ ID NO. 4106: SAG0649 FROM COHX GBS TYPE III STRAIN 

GGTGAAACCCAAGATACCAATCAAGCACTTGGAAAAG 

TAATTGTTAAAAAAACGGGAGACAaTGCTACACCATTAGGCAAAGCGACT 

TTTGTGTTAAAAAATGACAATGATAAGTCAGAAACAAGTCACGAAACGGT 

AGAGGGTTCTGGArAAGCAACCTTTGAAAACATAAAACCTGGAGACTACA 

CATTAAGAGAAGAAACAGCACCAATTGGTTATAAAAAAACTGATAAAACC 

TGGAAAGTTAAAGTTGCAGATAACGGAGCAACAATAATCGAGGGTATGGA 

TGCAGATAAAGCAGAGAAACGAAAAGAAGTTTTGAATGCCCAATATCCAA 

AATCAGCTATTTATGAGGATACAAAAGAAAATTACCCATTAgTTAATGTA 

GAGGGTTCCAAAGTTGGTGAACAATaCAAAGCATTGAATCCAATAAATGG 

AAAAGATGGTCGAAGAGAGATTGCTGAAGGTTGGTTATCAAAAAAAAATA 

CAGGGGTCAATGATCTCgATAAGAATAAATATAAAATTGAATTAACTGTT 

GAGGGTAAAACCACTGTTGAAACGAAAGAACTTAATCAACCACTAGATGT 

CGTTGTGCTATTAGATAATTCAAATAGTATGAATAATGAAAGAGCCAATA 

ATTCTCAAAGAGCATTAAAAGCTGGGGAAGCAGTTGAAAAGCTGATTGAT 

AAAATTACATCAAATAAAGACAATAGAGTAGCTCTTGTGACATATGCCTC 

AACCATTTTTGATGGTACTGAAGCGACCGTATCAAAGGGAGTTGCCGATC 

AAAATGGTAAAGCGCTGAATGATAGTGTATCATGGGATTATCATAAAACT 

ACTTTTACAGCAACTACACATAATTACAGTTATTTAAATTTAACAAATGA 

TGCTAACGAAGTTAATATTCTAAAGTCAAGAATTCCAAAGGAAGCGGAGC 

ATATAAATGGGGATCGCACGCTCTATCAATTTGGTGCGACATTTACTCAA 

AAAGCTCTAATGAAAGCAAATGAAATTTTAGAGACACAAAGTTCTAATGC 

TAGAAAAAAACTTATTTTTCACGTAACTGATGGTGTCCCTACGATGTCTT 

ATGCCATAAATTTTAATCCTTATATATCAACATCTTACCAAAACCAGTTT 

AATTCTTTTTTAAATAAAATACCAGATAGAAGTGGTATTCTCCAAGAGGA 

TTTTATAATCAATGGTGATGATTATCAAATAGTAAAAGGAGATGGAGAGA 

GTTTTAAACTGTTTTCGGATAGAAAAGTTCCTGTTACTGGAGGAACGACA 

CAAGCAGCTTATCGAGTACCGCAAAATCAACTCTCTGTAATGAGTAATGA 

GGGATATGCAATTAATAGTGGATATATTTATCTCTATTGGAGAGATTACA 

ACTGGGTCTATCCATTTGATCCTAAGACAAAGAAAGTTTCTGCAACGAAA 

CAAATCAAAACTCATGGTGAGCCAACAACATTATACTTTAATGGAAATAT 

AAGACCTAAAGGTTATGACATTTTTACTGTTGGGATTGGTGTAAACGGAG 

ATCCTGGTGCAACTCCTCTTGAAGCTGAGAAATTTATGCAATCAATATCA 

AGTAAAACAGAAAATTATACTAATGTTGATGATACAAATAAAATTTATGA 

TGAGCTAAATAAATACTTTAAAACAATTGTTGAGGAAAAACATTCTATTG 

TTGATGGAAATGTGACTGATCCTATGGGAGAGATGATTGAATTCCAATTA 

AAAAATGGTCAAAGTTTTACACATGATGATTACGTTTTGGTTGGAAATGA 

TGGCAGTCAATTAAAAAATGGTGTGGCTCTTGGTGGACCAAACAGTGATG 

GGGGAATTTTAAAAGATGTTACAGTGACTTATGATAAGACATCTCAAACC 

ATCAAAATCAATCATTTGAACTTAGGAAGTGGACAAAAAGTAGTTCTTAC 

CTATGATGTACGTTTAAAAGATAACTATATAAGTAACAAATTTTACAATA 

CAAATAATCGTACAACGCTAAGTCCGAAGAGTGAAAAAGAACCAAATACT 

ATTCGTGATTTCCCAATTCCCAAAATTCGTGATGTTCGTGAGTTTCCGGT 

ACTAACCATCAGTAATCAGAAGAAAATGGGTGAGGTTGAATTTATTAAAG 

TTAATAAAGACAAACATTCAgAATCGCTTTTGGGAGCTAAGTTTCAACTT 

CAGATAGAAAAAGATTTTTCTGGGTATAAGCAATTTGTTCCAGAGGGAAG 

TGATGTTACAACAAAGAATGATGGTAAAATTTATTTTAAAGCACTTCAAG 

ATGGTAACTATAAATTATATGAAATTTCAAGTCCAgATGGCTATATAGAG • 

GTTAAAACGAAACCTGTTGTGACATTTACAATTCAAAATGGAGAAGTTAC 

GAACCTGAAAGCAGATCCAAATGCTAATAAAAATCAAATCGGGTATCTTG 

AAGGAAATGGTAAACATCTTATTACCAACACTCCCAAACGCCCACCAGGT 

GTT 

SEQ ID NO. 4107: SAG0649 FROM M781 GBS TYPE III STRAIN 

TTGGAAAAGTAATTGTTAAAAAAACGGGAGACACTGCTACACCATTAGGC • 

AAAGCGACTTTTGTGTTAAAAAATGACAATGATAAGTCAGAAACAAGTCA 

CGAAACGGTAGAGGGTTCTGGAAAAGCAACCTTTGAAAACATAAAACCTG 

GAGACTACACATTAAGAGAAGAAACAGCACCAATTGGTTATAAAAAAACT 

GATAAAACCTGGAAAGTTAAAGTTGCAGATAACGGAGCAmCAATAATCGA 

GGGTATGGATGCAGATAAAGCAGAGAAACGAAAAGAAGTTTTGAATGCCC 

AATATCCAAAATCAGCTATTTATGAGGATACAAAAGAAAATTACCCATTA 
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gTTAATGTAGAGGGTTCCAAAGTTGGTGAACAATACAAAGCATTGAATCC 
AATAAATGGAAAAGATGGTCgAAGAGAGATTGCTGAAGGTTGGTTATCAA 
AAAAAATTACaGGGGTCAATGATCTCGATAAGAATAAATATAAAATTGAA 
TTAACTGTTGAGGGTAAAACCACTGTTGAAACgAAAGAACTTAATCAACC 
ACTAGATGTCGTTGTGCTATTAGATAATTCAAATAGTATGAATAATGAAA 
GAGCCAATAATTCTCAAAGAGCATTAAAAGCTGGGGAAGCAGTTGAAAAG 
CTGATTGATAAAATTACATCAAATAAAGACAATAGAGTAGCTCTTGTGAC 
ATATGCCTCAACCATTTTTGATGGTACTGAAGCGACCGTATCAAAGGGAG 
TTGCCGATCAAAATGGTAAAGCGCTGAATGATAGTGTATCATGGGATTAT 
CAT7\AAACTACTTTTACAGCAACTACACATAATTACAGTTATTTAAATTT 
AACAAATGATGCTAACGAAGTTAATATTCTAAAGTCAAGAATTCCAAAGG 
AAGCGGAGCATATAAATGGGGATCGCACGCTCTATCAATTTGGTGCGACA 
TTTACTCAAAAAGCTCTAATGAAAGCAAATGAAATTTTAGAGACACAAAG 
TTCTAATGCTAGAAAAAAACTTATTTTTCACGTAACTGATGGTGTCCCTA 
CGATGTCTTATGCCATAAATTTTAATCCTTATATATCAACATCTTACCAA 
AACCAGTTTAATTCTTTTTTAAAT7VAAATACCAGATAGAAGTGGTATTCT 
CCAAGAGGATTTTATAATCAATGGTGATGATTATCAAATAGTAAAAGGAG 
ATGGAGAGAGTTTTAAACTGTTTTCGGATAGAAAAGTTCCTGTTACTGGA 
GGAACGACACAAGCAGCTTATCGAGTACCGCAAAATCAACTCTCTGTAAT 
GAGTAATGAGGGATATGCAATTAATAGTGGATATATTTATCTCTAtTGGA 
GAGATTACAACTGGGTCTATCCATTTGATCCTAAGACAAAGAAAGTTTCT 
GCAACGAAACAAATCAAAACTCATGGTGAGCCAACAACATTATACTTTAA 
TGGAAATATAAGACCTAAAGGTTATGACATTTTTACTGTTGGGATTGGTG 
TAAACGGAGATCCTGGTGCAACTCCTCTTGAAGCTGAGAAATTTATGCAA 
TCAATATCAAGTAAAACAGAAAATTATACTAATGTTGATGATACAAATAA 
AATTTATGATGAGCTAAATAAATACTTTAAAACAATTGTTGAGGAAAAAC 
ATTCTATTGTTGATGGAAATGTGACTGATCCTATGGGAGAGATGATTGAA 
TTCCAATTAAAAAATGGTCAAAGTTTTACACATGATGATTACGTTTTGGT 
TGGAAATGATGGCAGTCAATTAAAAAATGGTGTGGCTCTTGGTGGACCAA 
ACAGTGATGGGGGAATTTTAAAAGATGTTACAGTGACTTATGATAAGACA 
TCTCAAACCATCAAAATCAATCATTTGAACTTAGGAAGTGGACAAAAAGT 
AGTTCTTACCTATGATGTACGTTTAAAAGATAACTATATAAGTAACAAAT 
TTTACAATACAAATAATCGTACAACGCTAAGTCCGAAGAGTGAAAAAGAA 
CCAAATACTATTCGTGATTTCCCAATTCCCAAAATTCGTGATGTTCGTGA 
GTTTCCGGTACTAACCATCAGTAATCAGAAGAAAATGGGTGAGGTTGAAT 
TTATTAAAGTTAATAAAGACAAACATTCAGAATCGCTTTTGGGAGCTAAG 
TTTCAACTTCAGATAGAAAAAGATTTTTCTGGGTATAAGCAATTTGTTCC 
AGAGGGAAGTGATGTTACAACAAAGAATGATGGTAAAATTTATTTTAAAG 
CACTTCAAGATGGTAACTATAAATTATATGAAATTTCAAGTCCAGATGGC 
TATATAGAGGTTAAAACGAAACCTGTTGTGACATTTACAATTCAAAATGG 
AGAAGTTACGAACCTGAAAGCAGATCCAAATGCTAATAAAAATCAAATCG 
GGTATCTTGAAGGAAATGGTAAACATCTTATTACCAACACTCCCAAACGC 
CCACCAGGTGTT 

SEQ ID NO. 4108: SAGO 64 9 FROM CJB GBS NONTYPEABLE STRAIN 

GGTGAAACCCAAGATACCAATCAAGCACTTGGAAAAGT 

AATTGTTAAAAAAACGGGAGACAaTGCTACACCATTAGGCAAAGCGACTT 

TTGTGTTAAAAAATGACAATGATAAGTCAGAAACAAGTCACGAAACGGTA 

GAGGGTTCTGGArAAGCAACCTTTGAAAACATAAAACCTGGAGACTACAC 

ATTAAGAGAAGAAACAGCACCAATTGGTTATAAAAAAACTGATAAAACCT 

GGAAAGTTAAAGTTGCAGATAACGGAGCAACAATAATCGAGGGTATGGAT 

GCAGATAAAGCAGAGAAACGAAAAGAAGTTTTGAATGCCCAATATCCAAA 

ATCAGCTATTTATGAGGATACAAAAGAAAATTACCCATTAgTTAATGTAG 

AGGGTTCCAAAGTTGGTGAACAATACAAAGCATTGAATCCAATAAATGGA 

AAAGATGGTCGAAGAGAGATTGCTGAAGGTTGGTTATCAAAAAAAATTAC 

aGGGGTCAATGATCTCGATAAGAATAAATATAAAATTGAATTAACTGTTG 

AGGGTAAAACCACTGTTGAAACGAAAGAACTTAATCAACCACTAGATGTC 

GTTGTGCTATTAgATAATTCAAATAGTATGAATAATGAAAGAGCCAATAA 

TTCTCAAAGAGCATTAAAAGCTGGGGAAGCAGTTGAAAAGCTGATTGATA 

AAATTACATCAAATAAAGACAATAGAGTAGCTCTTGTGACATATGCCTCA 

ACCATTTTTGATGGTACTGAAGCGACCGTATCAAAGGGAGTTGCCGATCA 

AAATGGTAAAGCGCTGAATGATAGTGTATCATGGGATTATCATAAAACTA 

CTTTTACAGCAACTACACATAATTACAGTTATTTAAATTTAACAAATGAT 

GCTAACGAAGTTAATATTCTAAAGTCAAGAATTCCAAAGGAAGCGGAGCA 
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TATAAATGGGGATCGCACGCTCTATCAATTTGGTGCGACATTTACTCAAA 
AAGCTCTAATGAAAGCAAATGAAATTTTAGAGACACAAAGTTCTAATGCT 
AGAAAAAAACTTATTTTTCACGTAACTGATGGTGTCCCTACGATGTCTTA 
TGCCATAAATTTTAATCCTTATATATCAACATCTTACCAAAACCAGTTTA 
ATTCTTTTTTAAATAAAATACCAGATAGAAGTGGTATTCTCCAAGAGGAT 
TTTATAATCAATGGTGATGATTATCAAATAGTAAAAGGAGATGGAGAGAG 
TTTTAAACTGTTTTCGGATAGAAAAGTTCCTGTTACTGGAGGAACGACAC 
AAGCAGCTTATCGAGTACCGCAAAATCAACTCTCTGTAATGAGTAATGAG 
GGATATGCAATTAATAGTGGATATATTTATCTCTATTGGAGAGATTACAA 
CTGGGTCTATCCATTTGATCCTAAGACAAAGAAAGTTTCTGCAACGAAAC 
AAATCAAAACTCATGGTGAGCCAACAACATTATACTTTAATGGAAATATA 
AGACCTAAAGGTTATGACATTTTTACTGTTGGGATTGGTGTAAACGGAGA 
TCCTGGTGCAACTCCTCTTGAAGCTGAGAAATTTATGCAATCAATATCAA 
GTAAAACAGAAAATTATACTAATGTTGATGATACAAATAAAATTTATGAT 
GAGCTAAATAAATACTTTAAAACAATTGTTGAGGAAAAACATTCTATTGT 
TGATGGAAATGTGACTGATCCTATGGGAGAGATGATTGAATTCCAATTAA 
AAAATGGTCAAAGTTTTACACATGATGATTACGTTTTGGTTGGAAATGAt 
GGCAGTCAATTAAAAAATGGTGTGGCTCTTGGTGGACCAAACAGTGATGG 
GGGAATTTTAAAAGATGTTACAGTGACTTATGATAAGACATCTCAAACCA 
TCAAAATCAATCATTTGAACTTAGGAAGTGGACAAAAAGTAGTTCTTACC 
TATGATGTACGTTTAAAAGATAACTATATAAGTAACAAATTTTACAATAC 
AAATAATCGTACAACGCTAAGTCCGAAGAGTGAAAAAGAACCAAATACTA 
TTCGTGATTTCCCAATtCCCAAAATTCGTGATGTTCGTGAGTTTCCGGTA 
CTAACCATCAGTAATCAGAAGAAAATGGGTGAGGTTGAATTTATTAAAGT 
TAATAAAGACAAACATTCAGAATCGCTTTTGGGAGCTAAGTTTCAACTTC 
AGATAGAAAAAGATTTTTCTGGGTATAAGCAATTTGTTCCAGAGGGAAGT 
GATGTTACAACAAAGAATGATGGTAAAATTTATTTTAAAGCACTTCAAGA 
TGGTAACTATAAATTATATGAAATTTCAAGTCCAGATGGCTATATAGAGG 
TTAAAACGAAACCTGTTGTGACATTTACAATTCAaAATGGAGAAGTTACG 
AACCTGAAAGCAGATCCAAATGCTAATAAAAATCAAATCGGGTATCTTGA 
AGGAAATGGTAAACATCTTATTACCAACACTCCCAAACGCCCACCAGGTG 
TT 

SEQ ID NO. 4109: SAG0649 FROM JM9130013 GBS TYPE VIII STRAIN 

GGTGAAACCCAAGATACCAATCAAGCACTTGGAAAAG 

TAATTGTTAAAAAAACGGGAGACAATGCTACACCATTAGGCAAAGCGACT 

TTTGTGTTAAAAAATGACAATGATAAGTCAGAAACAAGTCACGAAACGGT 

AGAGGGTTCTGGAGAAGCAACCTTTGAAAACATAAAACCTGGAGACTACA 

CATTAAGAGAAGAAACAGCACCAATTGGTTATAAAAAAACTGATAAAACC 

TGGAAAGTTAAAGTTGCAGATAACGGAGCAACAATAATCGAGGGTATGGA 

TGCAGATAAAGCAGAGAAACGAAAAGAAGTTTTGAATGCCCAATATCCAA 

AATCAGCTATTTATGAGGATACAAAAGAAAATTACCCATTAGTTAATGTA 

GAGGGTTCCAAAGTTGGTGAACAATACAAAGCATTGAATCCAATAAATGG 

AAAAGATGGTCGAAGAGAGATTGCTGAAGGTTGGTTATCAAAAAAAATTA 

CAGGGGTCAATGATCTCGATAAGAATAAATATAAAATTGAATTAACTGTT 

GAGGGTAAAACCACTGTTGAAACGAAAGAACTTAATCAACCACTAGATGT 

CGTTGTGCTATTAGATAATTCAAATAGTATGAATAATGAAAGAGCCAATA 

ATTCTCAAAGAGCATTAAAAGCTGGGGAAGCAGTTGAAAAGCTGATTGAT 

AAAATTACATCAAATAAAGACAATAGAGTAGCTCTTGTGACATATGCCTC 

AACCATTTTTGATGGTACTGAAGCGACCGTATCAAAGGGAGTTGCCGATC 

AAAATGGTAAAGCGCTGAATGATAGTGTATCATGGGATTATCATAAAACT 

ACTTTTACAGCAACTACACATAATTACAGTTATTTAAATTTAACAAATGA 

TGCTAACGAAGTTAATATTCTAAAGTCAAGAATTCCAAAGGAAGCGGAGC 

ATATAAATGGGGATCGCACGCTCTATCAATTTGGTGCGACATTTACTCAA 

AAAGCTCTAATGAAAGCAAATGAAATTTTAGAGACACAAAGTTCTAATGC 

TAGAAAAAAACTTATTTTTCACGTAACTGATGGTGTCCCTACGATGTCTT 

ATGCCATAAATTTTAATCCTTATATATCAACATCTTACCAAAACCAGTTT 

AATTCTTTTTTAAATAAAATACCAGATAGAAGTGGTATTCTCCAAGAGGA 

TTTTATAATCAATGGTGATGATTATCAAATAGTAAAAGGAGATGGAGAGA 

GTTTTAAACTGTTTTCGGATAGAAAAGTTCCTGTTACTGGAGGAACGACA 

CAAGCAGCTTATCGAGTACCGCAAAATCAACTCTCTGTAATGAGTAATGA 

GGGATATGCAATTAATAGTGGATATATTTATCTCTATTGGAGAGATTACA 

ACTGGGTCTATCCATTTGATCCTAAGACAAAGAAAGTTTCTGCAACGAAA 

CAAATCAAAACTCATGGTGAGCCAACAACATTATACTTTAATGGAAATAT 
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AAGACCTAAAGGTTATGACATTTTTACTGTTGGGATTGGTGTAAACGGAG 
ATCCTGGTGCAACTCCTCTTGAAGCTGAGAAATTTATGCAATCAATATCA 
AGTAAAACAGAAAATTATACTAATGTTGATGATACAAATAAAATTTATGA 
TGAGCTAAATAAATACTTTAAAACAATTGTTGAGGAAAAACATTCTATTG 
TTGATGGAAATGTGACTGATCCTATGGGAGAGATGATTGAATTCCAATTA 
AAAAATGGTCAAAGTTTTACACATGATGATTACGTTTTGGTTGGAAATGA 
TGGCAGTCAATTAAAAAATGGTGTGGCTCTTGGTGGACCAAACAGTGATG 
GGGGAATTTTAAAAGATGTTACAGTGACTTATGATAAGACATCTCAAACC 
ATCAAAATCAATCATTTGAACTTAGGAAGTGGACAAAAAGTAGTTCTTAC 
CTATGATGTACGTTTAAAAGATAACTATATAAGTAACAAATTTTACAATA 
CAAATAATCGTACAACGCTAAGTCCGAAGAGTGAAAAAGAACCAAATACT 
ATTCGTGATTTCCCAATTCCCAAAATTCGTGATGTTCGTGAGTTTCCGGT 
ACTAACCATCAGTAATCAAAAGAAAATGGGTGAGGTTGAATTTATTAAAG 
TTAATAAAGACAAACATTCAGAATCGCTTTTGGGAGCTAAGTTTCAACTT 
CAGATAAAAAAAGATTTTTCTGGGTATAAGCAATTTGTTCCAGAGGGAAG 
TGATGTTACAACAAAGAATGATGGTAAAATTTATTTTAAAGCACTTCAAG 
ATGGTAACTATAAATTATATGAAATTTCAAGTCCAGATGGCTATATAGAG 
GTTAAAACGAAACCTGTTGTGACATTTACAATTCAAAATGGAGAAGTTAC 
GAACCTGAAAGCAGATCCAAATGCTAATAAAAATCAAATCGGGTATCTTG 
AA 

SEQ ID NO. 4110: SAG0649 FROM 2603 V/R GBS TYPE V STRAIN 

MKKRQKIWRGLSVTLLILSQIPFGILVQGETQDTNQALGKVIVKKTGDNATPLGKATFVL 
BCNDNDKSETSHETVEGSGEATFENIKPGDYTLREETAPIGYKKTDKTWKVKVADNGATII 
EGMDADKAEKRKEVLNAQYPKSAIYEDTKENYPLVNVEGSECVGEQYKALNPINGKDGRRE 
IAEGWLSKKITGVNDLDKNICYKIELTVEGKTTVETKELNQPLDVWLLDNSNSMNNERAN 
N S QRALKAGEAVE KL I DKI T SNKDNRVALVT YAST I FDGTEATVSKGVADQNGKALNDS V 
SWDYHKTTFTATTHNYSYLNLTNDANEVNILKSRIPKEAEHINGDRTLYQFGATFTQKAL 
MKANEILETQSSNARKKLIFHVTDGVPTMSYAINFNPYISTSYQNQFNSFLNKIPDRSGI 
LQEDFIINGDDYQIVKGDGESFKLFSDRKVPVTGGTTQAAYRVPQNQLSVMSNEGYAINS 
GYIYLYWRDYNWVYPFDPECTKKVSATKQIKTHGEPTTLYFNGNIRPKGYDIFTVGIGVNG 
DPGATPLEAEKFMQSISSKTENYTNVDDTNKIYDELNKYFKTIVEEKHSIVDGNVTDPMG 
EMIEFQLKNGQSFTHDDYVLVGNDGSQLKNGVALGGPNSDGGILKDVTVTYDKTSQTIKI 
NHLNLGSGQKWLTYDVRLKDNYISNKFYNTNNRTTLSPKSEKEPNTIRDFPIPKIRDVR 
EFPVLTISNQKKMGEVEFIKVNKDKHSESLLGAKFQLQIEKDFSGYKQFVPEGSDVTTKN 
DGKIYFKALQDGNYKLYEISSPDGYIEVKTKPWTFTIQNGEVTNLKADPNANKNQIGYL 
EGNGKHLITNTPKRPPGVFPKTGGIGTIVYILVGSTFMILTICSFRRKQL 

SEQ ID NO. 4111: SAG0649 FROM 090 GBS TYPE la STRAIN 

GETQDTNQALGKVIVKKTGDNATPLGKATFVLKNDNDKSETSHETVEGSGEATFENIKPG 
DYT LREETAP IG YKKT DKT WKVKVADNG AT I IEGMD ADKAE KRKE VLN AQ Y PK S AI YE DT 
KENYPLTOVEGSKVGEQYKALNPINGKDGRREIAEGWLSKKITGVNDLDKNKYKIELTVE 
GKTTVETKELNQPLDVWLLDNSNSMNNERANNSQRALKAGEAVEKLIDKITSNKDNRVA 
LVTYASTIFDGTEATVSKGVADQNGKALNDSVSWDYHKTTFTATTHNYSYLNLTNDANEV 
NILKSRIPKEAEHINGDRTLYQFGATFTQKALMKANEILETQSSNARKKLIFHVTDGVPT 
MS YAIN FNPYI STS YQNQFNS FLNKI PDRSGI LQE DFI INGDDYQI VKGDGE S FKLFS DR 
KVPVTGGTTQAAYRVPQNQLSVMSNEGYAINSGYIYLYWRDYNWVYPFDPKTKKVSATKQ 
IKTHGE PTTLYFNGN IRPKGYDI FTVGIGVNGDPGAT PLEAEKFMQS I S SKTENYTNVDD 
TNKIYDELNBCYFKTIVEEKHSIVDGNVTDPMGEMIEFQLKNGQSFTHDDYVLVGNDGSQL 
KNGVALGGPNSDGGILKDVTVTYDKTSQTIKINHLNLGSGQKWLTYDVRLKDNYISNKF 
YNTNNRTTLS PKSEKE PNT IRDFP I PKIRDVRE FPVLT I SNQKKMGE VE FIKVNKDKHSE 
SLLGAKFQLQIEKDFSGYKQFVPEGSDVTTKNDGKIYFBCALQDGNYKLYEISSPDGYIEV 
KTKPWTFTIQNGEVTNLKADPNANKNQIGYLEGNGKHLITNTPKRPPGV 

SEQ ID NO. 4112: SAG0649 FROM A909 GBS TYPE la STRAIN 

GETQDTNQALGKVIVKKTGDNATPLGKATFVLKNDNDKSETSHETVEGSGEATFENIKPG 
DYTLREETAPIGYKKTDKTWKVKVADNGATIIEGMDADKAEKRKEVLNAQYPKSAIYEDT 
KENYPLVNVEGSKVGEQYKALNPINGKDGRREIAEGWLSKKITGVNDLDKNKYKIELTVE 
GKTTVETKELNQPLDVWLLDNSNSMNNERANNSQRALKAGEAVEKLIDKITSNKDNRVA 
LVTYAST I FDGTEATVSKGVADQNGKALNDS VSWDYHKTTFTATTHNYSYLNLTNDANEV 
NIIiKSRIPKEAEHINGDRTLYQFGATFTQICALMKANEILETQSSNARKKLIFHVTDGVPT 
MSYAINFNPYISTSYQNQFNSFLNKIPDRSGILQEDFIINGDDYQIVKGDGESFKLFSDR 
KVPVTGGTTQAAYRVPQNQLSVMSNEGYAINSGYIYLYWRDYNWVYPFDPKTKKVSATKQ 
IKTHGEPTTLYFNGNIRPKGYDIFTVGIGVNGDPGATPLEAEKFMQS IS SKTENYTNVDD 
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TNKIYDELNKYFKTIVEEKHSIVDGNVTDPMGEMIEFQLKNGQSFTHDDYVLVGNDGSQL 
KNGVALGGPNSDGGILKDVTVTYDKTSQTIKINHLNLGSGQKWLTYDVRLKDNYISNKF 
YNTNNRTTLSPKSEKEPNTIRDFPIPKIRDVREFPVLTISNQKKMGEVEFIKVNKDKHSE 
SLLGT^KFQLQIEKDFSGYKQFVPEGSDVTTKNDGKIYFKALQDGNYKLYEISSPDGYIEV 
KTKPVVTFTIQNGEVTNLKADPNANKNQIGYLEGNGKHLITNTPKRPPGV 

SEQ ID NO. 4113: SAG0649 FROM 18RS21 GBS TYPE II STRAIN 

GETQDTNQALGKVIVKKTGDNATPLGKATFVLKNDNDKSETSHETVEGSGEATFENIKPG 
DYTLREETAPIGYKKTDKTWKVKVADNGATIIEGMDADKAEKRKEVLNAQYPKSAIYEDT 
KENYPLVNVEGSKVGEQYKALNPINGKDGRREIAEGWLSKKITGVNDLDKNKYKIELTVE 
GKTTVETKELNQPLDVWLLDNSNSMNNERANNSQRALKAGEAVEKLIDKITSNKDNRVA 
LVTYASTIFDGTEATVSKGVADQNGKALNDSVSWDYHKTTFTATTHNYSYLNLTNDANEV 
NILKSRI PKEAEHINGDRTLYQFGATFTQKALMKANE ILETQS SNARKKLI FHVTDGVPT 
MS YAINFN P YI ST S YQNQFN S FLNKI PDRSGI LQEDFI ING DD YQI VKGDGES FKLFS DR 
KVPVTGGTTQAAYRVPQNQLSVMSNEGYAINSGYIYLYWRDYNWVYPFDPKTKKVSATKQ 
IKTHGEPTTLYFNGNIRPKGYDIFTVGIGVNGDPGATPLEAEKFMQSISSKTENYTNVDD 
TNKIYDELNKYFKTIVEEKHSIVDGNVTDPMGEMIEFQLKNGQSFTHDDYVLVGNDGSQL 
KNGVALGGPNSDGGILKDVTVTYDKTSQTIKINHLNLGSGQKWLTYDVRLKDNYISNKF 
YNTNNRTTLSPKSEKEPNTIRDFPIPKIRDVREFPVLTISNQKKMGEVEFIKVNKDKHSE 
SLLGAKFQLQIEKDFSGYKQFVPEGSDVTTKNDGKIYFKALQDGNYKLYEISSPDGYIEV 
KTKPVVTFTIQNGEVTNLKADPNANKNQIGYLEGNGKHLITNTPKRPPGV 

SEQ ID NO. 4114: SAG0649 FROM M732 GBS TYPE III STRAIN 

GETQDTNQALGKVIVKKTGDNATPLGKATFVLKNDNDKSETSHETVEGSGEATFENIKPG 
DYTLREETAPIGYKKT DKTWKVKVADNGAT I IEGMDADKAEKRKEVLNAQYPKSAI YEDT 
KENYPLVNVEGSKVGEQYKALNPINGKDGRREIAEGWLSKKNTGVNDLDKNKYKIELTVE 
GKTTVETKELNQPLDWVLLDNSNSMNNERANNSQRALKAGEAVEKLIDKITSNKDNRVA 
LVTYASTIFDGTEATVSKGVADQNGKALNDSVSWDYHKTTFTATTHNYSYLNLTNDANEV 
NILKSRIPKEAEHINGDRTLYQFGATFTQKALMKANEILETQSSNARKKLIFHVTDGVPT 
MSYAINFNPYISTSYQNQFNSFLNKIPDRSGILQEDFIINGDDYQIVKGDGESFKLFSDR 
KVPVTGGTTQAAYRVPQNQLSVMSNEGYAINSGYIYLYWRDYNWVYPFDPKTKKVSATKQ 
IKTHGEPTTLYFNGNIRPKGYDIFTVGIGVNGDPGATPLEAEKFMQSISSKTENYTNVDD 
TNKIYDELNKYFKTIVEEKHSIVDGNVTDPMGEMIEFQLKNGQSFTHDDYVLVGNDGSQL 
KNGVALGGPNSDGGILKDVTVTYDKTSQTIKINHLNLGSGQKVVLTYDVRLKDNYISNKF 
YNTNNRTTLSPKSEKEPNTIRDFPIPKIRDVREFPVLTISNQKKMGEVEFIKVNKDKHSE 
SLLGAKFQLQIEKDFSGYKQFVPEGSDVTTKNDGKIYFKALQDGNYKLYEISSPDGYIEV 
KTKPWTFTIQNGEVTNLKADPNANKNQIGYLEGNGKHLITNTPKRPPGV 

SEQ ID NO. 4115: SAGO 649 FROM COH1 GBS TYPE III STRAIN 

GETQDTNQALGKVIVKKTGDNATPLGKATFVLKNDNDKSETSHETVEGSGXATFENIKPG 
DYTLREETAPIGYKKTDKTWKVKVADNGATI IEGMDADKAEKRKEVLNAQYPKSAI YEDT 
KENYPLVNVEGSKVGEQYKALNPINGKDGRREIAEGWLSKKNTGVNDLDKNKYKIELTVE 
GKTTVETKELNQPLDVVVLLDNSNSMNNERANNSQRALKAGEAVEKLIDKITSNKDNRVA 
LVTYASTIFDGTEATVSKGVADQNGKALNDSVSWDYHKTTFTATTHNYSYLNLTNDANEV 
NILKSRI PKEAEHINGDRTLYQFGATFTQKALMKANEILETQSSNARKKLI FHVTDGVPT 
MS YAINFN P YI ST SYQNQFNSFLNK I PDRSGILQEDFIINGDDYQ I VKGDGES FKLFS DR 
KVPVTGGTTQAAYRVPQNQLSVMSNEGYAINSGYIYLYWRDYNWVYPFDPKTKKVSATKQ 
IKTHGEPTTLYFNGNIRPKGYDIFTVGIGVNGDPGATPLEAEKFMQSISSKTENYTNVDD 
TNKIYDELNKYFKTIVEEKHSIVDGNVTDPMGEMIEFQLKNGQSFTHDDYVLVGNDGSQL 
KNGVALGGPNSDGGILKDVTVTYDKTSQTIKINHLNLGSGQKWLTYDVRLKDNYISNKF 
YNTNNRTTLSPKSEKEPNTIRDFPIPKIRDVREFPVLTISNQKKMGEVEFIKVNKDKHSE 
SLLGAKFQLQIEKDFSGYKQFVPEGS DVTTKNDGKI YFKALQDGNYKLYE I S S PDGYIEV 
KTKPWT FTIQNGEVTNLKADPNANKNQIGYLEGNGKHL ITNT PKRP PGV 

SEQ ID NO. 4115: SAG0649 FROM M781 GBS TYPE III STRAIN 

GKVIVKKTGDTATPLGKATFVLKNDNDKSETSHETVEGSGKATFENIKPGDYTLREETAP 
IGYKKT DKTWKVKVADNGAXI IEGMDADKAEKRKEVLNAQYPKSAI YE DTKENY PLVNVE 
GSKVGEQYKALNPINGKDGRREIAEGWLSKKITGVNDLDKNKYKIELTVEGKTTVETKEL 
NQPLDVWLLDNSNSMNNERANNSQRALKAGEAVEKLIDKITSNKDNRVALVTYASTIFD 
GTEATVSKGVADQNGKALNDSVSWDYHKTTFTATTHNYSYLNLTNDANEVNILKSRIPKE 
AEHINGDRTLYQFGAT FTQKALMKANEI LETQS SNARKKLI FHVT DGVPTMS YAIN FN P Y 
I STSYQNQFNS FLNKI PDRSGI LQEDFI ING DDYQ I VKGDGESFKLFSDRKVPVTGGTTQ 
AAYRVPQNQLSVMSNEGYAINSGYIYLYWRDYNWVYPFDPKTKKVSATKQIKTHGEPTTL 
YFNGNIRPKGYDIFTVGIGVNGDPGATPLEAEKFMQSISSKTENYTNVDDTNKIYDELNK 
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YFKTIVEEKHSIVDGNVTDPMGEMIEFQLKNGQSFTHDDYVLVGNDGSQLKNGVALGGPN 
SDGGILKDVTVTYDKTSQTIKINHLNLGSGQKWLTYDVRLKDNYISNKFYNTNNRTTLS 
PKSEKEPNTIRDFPIPKIRDVREFPVLTISNQKKMGEVEFIKVNKDKHSESLLGAKFQLQ 
IEKDFSGYKQFVPEGSDVTTKNDGKIYFKALQDGNYKLYEISSPDGYIEVKTKPWTFTI 
QNGEVTNLKADPNANKNQIGYLEGNGKHLITNTPKRPPGV 

SEQ ID NO, 4117: SAG0649 FROM CJB110 GBS NONTYPEABLE STRAIN 

GETQDTNQALGPCVIVKKTGDNATPLGKATFVLKNDNDKSETSHETVEGSGXATFENIKPG 
DYTLREETAPIGYKKT DKTWKVKVADNGAT I IEGMDADKAEKRKEVLNAQY PKSAI YEDT 
KENYPLVNVEGSKVGEQYKALNPINGKDGRREIAEGWLSKKITGVNDLDKNKYKIELTVE 
GKTTVETKELNQPLDVWLLDNSNSMNNERANNSQRALKAGEAVEKLIDKITSNKDNRVA 
LVTYASTIFDGTEATVSKGVADQNGKALNDSVSWDYHKTTFTATTHNYSYLNLTNDANEV 
NILKSRIPKEAEHINGDRTLYQFGATFTQKALMKANEILETQSSNARKKLIFHVTDGVPT 
MSYAINFNPYISTSYQNQFNSFLNKIPDRSGILQEDFIINGDDYQIVKGDGESFKLFSDR 
KVPVTGGTTQAAYRVPQNQLSVMSNEGYAINSGYIYLYWRDYNWVYPFDPKTKKVSATKQ 
IKTHGEPTTLYFNGNIRPKGYDIFTVGIGVNGDPGATPLEAEKFMQSISSKTENYTNVDD 
TNKIYDELNKYFBCTIVEEKHSIVDGNVTDPMGEMIEFQLKNGQSFTHDDYVLVGNDGSQL 
KNGVALGGPNSDGGILKDVTVTYDKTSQTIKINHLNLGSGQJCWLTYDVRLKDNYISNKF 
YNTNNRTTLSPKSEKEPNTIRDFPIPKIRDVREFPVLTISNQKKMGEVEFIKVNKDKHSE 
SLLGAKFQLQIEKDFSGYKQFVPEGSDVTTKNDGKIYFKALQDGNYKLYEISSPDGYIEV 
KTKPWTFTIQNGEVTNLKADPNANKNQIGYLEGNGKHLITNTPKRPPGV 

SEQ ID NO. 4118: SAG0649 FROM OM9130013 GBS TYPE VIII STRAIN 

GETQDTNQALGKVIVKKTGDNATPLGKATFVLKNDNDKSETSHETVEGSGEATFENIKPG 
DYTLREETAPIGYKKTDKTWKVKVADNGATIIEGMDADKAEKRKEVLNAQYPKSAIYEDT 
KENYPLVNVEGSKVGEQYKALNPINGKDGRREIAEGWLSKKITGVNDLDKNKYKIELTVE 
GKTTVETKELNQPLDVVVLLDNSNSMNNERANNSQR7U!iKAGEAVEKLIDKITSNKDNRVA 
LVTYASTI FDGTEATVSKGVADQNGKALNDSVSWDYHKTT FTATTHNYS YLNLTNDANEV 
NILKSRIPKEAEHINGDRTLYQFGATFTQKALMKANEILETQSSNARKKLIFHVTDGVPT 
MSYAINFNPYISTSYQNQFNSFLNKIPDRSGILQEDFI INGDDYQIVKGDGESFKLFSDR 
KVPVTGGTTQAAYRVPQNQLSVMSNEGYAINSGYIYLYWRDYNWVYPFDPKTKKVSATKQ 
IKTHGEPTTLYFNGNIRPKGYDIFTVGIGVNGDPGATPLEAEKFMQSISSKTENYTNVDD 
TNKIYDELNKYFKTIVEEKHSIVDGNVTDPMGEMIEFQLKNGQSFTHDDYVLVGNDGSQL 
KNGVALGGPNSDGGILKDVTVTYDKTSQTIKINHLNLGSGQKWLTYDVRLKDNYISNKF 
YNTNNRTTLS PKSEKEPNTI RDFPI PKIRDVREFPVLT I SNQKKMGEVEFIKVNKDKHSE 
SLLGAKFQLQIKKDFSGYKQFVPEGSDVTTKNDGKIYFKALQDGNYKLYEISSPDGYIEV 
KTKPWTFTIQNGEVTNLKADPNANKNQIGYLE 

SEQ ID NO. 4201: 2603 V/R STRAIN 

ATGGTAAAATTAGTATTCGCACGCCACGGTGAATCTGAGTGGAATAAAGCTAACCTTTTC 
ACTGGATGGGCTGACGTAGATCTTTCAGAAAAAGGTACACAACAAGCTATTGATGCTGGG 
AAATTAATTCAAGCAGCAGGTATTGAGTTCGACCTTGCTTTTACATCAGTTCTTAAACGT 
GCCATCAAAACAACTAACCTTGCCCTTGAAGCAGCTGATCAACTTTGGGTACCAGTTGAA 
AAATCATGGCGCTTGAACGAACGTCATTACGGTGGATTGACAGGAAAAAATAAAGCAGAA 
GCAGCTGAACAATTTGGTGATGAGCAAGTTCATATTTGGCGTCGTTCATATGATGTATTG 
CCTCCAGATATGGCTAAAGATGATGAACATTCAGCACATACTGATCGTCGCTATGCTTCA 
CTAGATGATTCTGTTATTCCAGATGCAGAAAACCTAAAAGTTACTTTAGAGCGTGCTCTT 
CCTTTCTGGGAAGATAAAATTGCTCCTGCTCTTAAAGATGGTAAAAATGTGTTTGTTGGT 
GCACACGGTAACTCAATCCGTGCTCTTGTAAAACATATCT^AACAATTGTCAGATGATGAA 
ATCATGGACGTTGAAATTCCTAACTTCCCACCACTTGTTTTCGAATTTGATGAAAAATTA 
AACCTTGTTTCAGAATATTACTTAGGTAAA 

SEQ ID NO. 4202: 090 STRAIN 

GTAAAATTAGTATTCGCACGCCACGGTGAATCTGAGTG 

GAATAAAGCTAACCTTTTCACTGGATGGGCTGACGTAGATCTTTCAGAAA 

AAGGTACACAACAAGCTATTGATGCTGGGAAATTAATTCAAGCAGCAGGT 

ATTGAGTTCGACCTTGCTTTTACATCAGTTCTTAAACGTGCCATCAAAAC 

AACTAACCTTGCCCTTGAAGCAGCTGATCAACTTTGGGTACCAGTTGAAA 

AATCATGGCGCTTGAACGAACGTCATTACGGTGGATTGACAGGAAAAAAT 

AAAGCAGAAGCAGCTGAACAATTTGGTGATGAGCAAGTTCATATTTGGCG 

TCGTTCATATGATGTATTGCCTCCAGATATGGCTAAAGATGATGAACATT 

CAGCACATACTGATCGTCGCTATGCTTCACTAGATGATTCTGTTATTCCA 

GATGCAGAAAACCTAAAAGTTACTTTAGAGCGTGCTCTTCCTTTCTGGGA 

AGATAAAATTGCTCCTGCTCTTAAAGATGGTAAAAATGTGTTTGTTGGTG 
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CACACGGTAACTCAATCCGTGCTCTTGTAAAACATATCAAACAATTGTCA 
GATGATGAAATCATGGACGTTGAAATTCCTAACTTCCCACCACTTGTTTT 
CGAATTTGATGAAAAATTAAACCTTGTTTCAGAATATTACTTAGGTAAA 

SEQ ID NO. 4203: A909 STRAIN 

GTAAAATTAGTATTCGCACGCCACGGTGAATCTGAGTGG 

AATAAAGCTAACCTTTTCACTGGATGGGCTGACGTAGATCTTTCAGAAAA 

AGGTACACAACAAGCTATTGATGCTGGGAAATTAATTCAAGCAGCAGGTA 

TTGAGTTCGACCTTGCTTTTACATCAGTTCTTAAACGTGCCATCAAAACA 

ACTAACCTTGCCCTTGAAGCAGCTGATCAACTTTGGGTACCAGTTGAAAA 

ATCATGGCGCTTAAACGAACGTCATTACGGTGGATTGACAGGAAAAAATA 

AAGCAGAAGCAGCTGAACAATTTGGTGATGAGCAAGTTCATATTTGGCGT 

CGTTCATATGATGTATTGCCTCCAGATATGGCTAAAGATGATGAACATTC 

AGCACATACTGATCGTCGCTATGCTTCACTAGATGATTCTGTTATTCCAG 

ATGCAGAAAACCTAAAAGTTACTTTAGAGCGTGCTCTTCCTTTCTGGGAA 

GATAAAATTGCTCCTGCTCTTAAAGATGGTAAAAATGTGTTTGTTGGTGC 

ACACGGTAACTCAATCCGTGCTCTTGTAAAACATATCAAACAATTGTCAG 

ATGATGAAATCATGGACGTTGAAATTCCTAACTTCCCACCACTTGTTTTC 

GAATTTGATGAAAAATTAAACCTTGTTTCAGAATATTACTTAGGTAAA 

SEQ ID NO. 4204: H36B STRAIN 

GTAAAATTAGTATTCGCACGCCACGGTGAATCTGAG 

TGGAATAAAGCTAACCTTTTCACTGGATGGGCTGACGTAGATCTTTCAGA 
AAAAGGTACACAACAAGCTATTGATGCTGGGAAATTAATTCAAGCAGCAG 
GTATTGAGTTCGACCTTGCTTTTACATCAGTTCTTAAACGTGCCATCAAA 
ACAACTAACCTTGCCCTTGAAGCAGCTGATCAACTTTGGGTACCAGTTGA 
AAAATCATGGCGCTTGAACGAACGTCATTACGGTGGATTGACAGGAAAAA 
ATAAAGCAGAAGCAGCTGAACAATTTGGTGATGAGCAAGTTCATATTTGG 
CGTCGTTCATATGATGTATTGCCTCCAGATATGGCTAAAGATGATGAACA 
TTCAGCACATACTGATCGTCGCTATGCTTCACTAGATGATTCTGTTATTC 
CAGATGCAGAAAACCTAAAAGTTACTTTAGAGCGTGCTCTTCCTTTCTGG 
GAAGATAAAATTGCTCCTGCTCTTAAAGATGGTAAAAATGTGTTTGTTGG 
TGCACACGGTAACTCAATCCGTGCTCTTGTAAAACATATCAAACAATTGT 
CAGATGATGAAATCATGGACGTTGAAATTCCTAACTTCCCACCACTTGTT 
TTCGAATTTGATGAAAAATTAAACCTTGTTTCAGAATATTACTTAGGTAA 
A 

SEQ ID NO. 4205: 18RS21 STRAIN 

GTAAAATTAGTATTCGCACGCCACGGTGAATCTGAGTGG 

AATAAAGCTAACCTTTTCACTGGATGGGCTGACGTAGATCTTTCAGAAAA 

AGGTACACAACAAGCTATTGATGCTGGGAAATTAATTCAAGCAGCAGGTA 

(TTGAGTTCGACCTTGCTTTTACATCAGTTCTTAAACGTGCCATCAAAACA 

ACTAACCTTGCCCTTGAAGCAGCTGATCAACTTTGGGTACCAGTTGAAAA 

ATCATGGCGCTTGAACGAACGTCATTACGGTGGATTGACAGGAAAAAATA 

AAGCAGAAGCAGCTGAACAATTTGGTGATGAGCAAGTTCATATTTGGCGT 

CGTTCATATGATGTATTGCCTCCAGATATGGCTAAAGATGATGAACATTC 

AGCACATACTGATCGT CGCTATGCTTCACTAGATGATT CTGTTATTCCAG 

ATGCAGAAAACCTAAAAGTTACTTTAGAGCGTGCTCTTCCTTTCTGGGAA 

GATAAAATTGCTCCTGCTCTTAAAGATGGTAAAAATGTGTTTGTTGGTGC 

ACACGGTAACTCAATCCGTGCTCTTGTAAAACATATCAAACAATTGTCAG 

ATGATGT^AATCATGGACGTTGAAATTCCTAACTTCCCACCACXTGTTTTC 

GAATTTGATGAAAAATTAAACCTTGTTTCAGAATATTACTTAGGTAAA 

SEQ ID NO. 4206: M732 STRAIN 

GTAAAATTAGTATTCGCACGCCACGGTGAATCTGAGTGG 

AATAAAGCTAACCTTTT CACTGGATGGGCTGACGTAGATCTTT CAGAAAA 

AGGTACACAACAAGCTATTGATGCTGGGAAATTAATTCAAGCAGCAGGTA 

TTGAGTTCGACCTTGCTTTTACATCAGTTCTTAAACGTGCCATCAAAACA 

ACTAACCTTGCCCTTGAAGCAGCTGATCAACTTTGGGTACCAGTTGAAAA 

ATCATGGCGCTTGAACGAACGTCATTACGGTGGATTGACAGGAAAAAATA 

AAGCAGAAGCAGCTGAACAATTTGGTGATGAGCAAGTTCATATTTGGCGT 

CGTTCATATGATGTATTGCCTCCAGATATGGCTAAAGATGATGAACATTC 

AGCACATACTGATCGTCGCTATGCTTCACTAGATGATTCTGTTATTCCAG 

ATGCAGAAAACCTAAAAGTTACTTTAGAGCGTGCTCTTCCTTTCTGGGAA 
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GATAAAATTGCTCCTGCTCTTAAAGATGGTAAAAATGTGTTTGTTGGTGC 
ACACGGTAACTCAATCCGTGCTCTTGTAAAACATATCAAACAATTGTCAG 
ATGATGAAATCATGGACGTTGAAATTCCTAACTTCCCACCACTTGTTTTC 
GAATTTGATGAAAAATTAAACCTTGTTTCAGAATATTACTTAGGTAAA 

SEQ ID NO. 4207: COH1 STRAIN 

GTAAAATTAGTATTCGCACGCCACGG 

TGAATCTGAGTGGAATAAAGCTAACCTTTTCACTGGATGGGCTGACGTAG 
ATCTTTCAGAAAAAGGTACACAACAAGCTATTGATGCTGGGAAATTAATT 
CAAGCAGCAGGTATTGAGTTCGACCTTGCTTTTACATCAGTTCTTAAACG 
TGCCATCAAAACAACTAACCTTGCCCTTGAAGCAGCTGATCAACTTTGGG 
TACCAGTTGAAAAATCATGGCGCTTGAACGAACGTCATTACGGTGGATTG 
ACAGGAAAAAATAAAGCAGAAGCAGCTGAACAATTTGGTGATGAGCAAGT 
TCATATTTGGCGTCGTTCATATGATGTATTGCCTCCAGATATGGCTAAAG 
ATGATGAACATTCAGCACATACTGATCGTCGCTATGCTTCACTAGATGAT 
TCTGTTATTCCAGATGCAGAAAACCTAAAAGTTACTTTAGAGCGTGCTCT 
TCCTTTCTGGGAAGATAAAATTGCTCCTGCTCTTAAAGATGGTAAAAATG 
TGTTTGTTGGTGCACACGGTAACTCAATCCGTGCTCTTGTAAAACATATC 
AAACAATTGTCAGATGATGAAATCATGGACGTTGAAATTCCTAACTTCCC 
ACCACTTGTTTTCGAATTTGATGAAAAATTAAACCTTGTTTCAGAATATT 
ACTTAGGTAAA 

SEQ ID NO. 4208: CJB110 STRAIN 

GTAAAATTAGTATTCGCACGCCACGG 

TGAATCTGAGTGGAATAAAGCTAACCTTTTCACTGGATGGGCTGACGTAG 
ATCTTTCAGAAAAAGGTACACAACAAGCTATTGATGCTGGGAAATTAATT 
CAAGCAGCAGGTATTGAGTTCGACCTTGCTTTTACATCAGTTCTTAAACG 
TGCCATCAAAACAACTAACCTTGCCCTTGAAGCAGCTGATCAACTTTGGG 
TACCAGTTGAAAAATCATGGCGCTTGAACGAACGTCATTACGGTGGATTG 
ACAGGAAAAAATAAAGCAGAAGCAGCTGAACAATTTGGTGATGAGCAAGT 
TCATATTTGGCGTCGTTCATATGATGTATTGCCTCCAGATATGGCTAAAG 
ATGATGAACATTCAGCACATACTGATCGTCGCTATGCTTCACTAGATGAT 
TCTGTTATTCCAGATGCAGAAAACCTAAAAGTTACTTTAGAGCGTGCTCT 
TCCTTTCTGGGAAGATAAAATTGCTCCTGCTCTTAAAGATGGTAAAAATG 
TGTTTGTTGGTGCACACGGTAACTCAATCCGTGCTCTTGTAAAACATATC 
AAACAATTGTCAGATGATGAAATCATGGACGTTGAAATTCCTAACTTCCC 
ACCACTTGTTTTCGAATTTGATGAAAAATTAAACCTTGTTTCAGAATATT 
ACTTAGGTAAA 

SEQ ID NO. 4209: 1169NT STRAIN 

AGTATTCGCACGCCACGGTGAATCTGAGTGGAATAAAGCTAACCTTTTCA 
CTGGATGGGCTGACGTAGATCTTTCAGAAAAAGGTACACAACAAGCTATT 
GATGCTGGGAAATTAATTCAAGCAGCAGGTATTGAGTTCGACCTTGCTTT 
TACATCAGTTCTTAAACGTGCCATCAAAACAACTAACCTTGCCCTTGAAG 
CAGCTGATCAACTTTGGGTACCAGTTGAAAAATCATGGCGCTTGAACGAA 
CGTCATTACGGTGGATTGACAGGAAAAAATAAAGCAGAAGCAGCTGAACA 
ATTTGGTGATGAGCAAGTTCATATTTGGCGTCGTTCATATGATGTATTGC 
CTCCAGATATGGCTAAAGATGATGAACATTCAGCACATACTGATCGTCGC 
TATGCTTCACTAGATGATTCTGTTATTCCAGATGCAGAAAACCTAAAAGT 
TACTTTAGAGCGTGCTCTTCCTTTCTGGGAAGATAAAATTGCTCCTGCTC 
TTAAAGATGGTAAAAATGTGTTTGTTGGTGCACACGGTAACTCAATCCGT 
GCTCTTGTAAAACATATCAAACAATTGTCAGATGATGAAATCATGGACGT 
TGAAATTCCTAACTTCCCACCACTTGTTTTCGAATTTGATGAAAAATTAA 
ACCTTGTTTCAGAATATTACTTAGGTAAA 

SEQ ID NO. 4210: M781 STRAIN 

GTAAAATTAGTATTCGCACGCCACGGT 

GAATCTGAGTGGAATAAAGCTAACCTTTTCACTGGATGGGCTGACGTAGA 
TCTTTCAGAAAAAGGTACACAACAAGCTATTGATGCTGGGAAATTAATTC 
AAGCAGCAGGTATTGAGTTCGACCTTGCTTTTACATCAGTTCTTAAACGT 
GCCATCAAAACAACTAACCTTGCCCTTGAAGCAGCTGATCAACTTTGGGT 
ACCAGTTGAAAAATCATGGCGCTTGAACGAACGTCATTACGGTGGATTGA 
CAGGAAAAAATAAAGCAGAAGCAGCTGAACAATTTGGTGATGAGCAAGTT 
CATATTTGGCGTCGTTCATATGATGTATTGCCTCCAGATATGGCTAAAGA 



152 



WO 2004/018646 



PCT/US2003/026827 



SEQUENCE LISTING 



TGATGAACATTCAGCACATACTGATCGTCGCTATGCTTCACTAGATGATT 
CTGTTATTCCAGATGCAGAAAACCTAAAAGTTACTTTAGAGCGTGCTCTT 
CCTTTCTGGGAAGATAAAATTGCTCCTGCTCTTAAAGATGGTAAAAATGT 
GTTTGTTGGTGCACACGGTAACTCAATCCGTGCTCTTGTAAAACATATCA 
AACAATTGTCAGATGATGAAATCATGGACGTTGAAATTCCTAACTTCCCA 
CCACTTGTTTTCGAATTTGATGAAAAATTAAACCTTGTTTCAGAATATTA 
CTTAGGTAAA 

SEQ ID NO. 4211: JM930013 STRAIN 

GTAAAATTAGTATTCGCACGCCACGGTGAATCT 

GAGTGGAATAAAGCTAACCTTTTCACTGGATGGGCTGACGTAGATCTTTC 
AGAAAAAGGTACACAACAAGCTATTGATGCTGGGAAATTAATTCAAGCAG 
CAGGTATTGAGTTCGACCTTGCTTTTACATCAGTTCTTAAACGTGCCATC 
AAAACAACTAACCTTGCCCTTGAAGCAGCTGATCAACTTTGGGTACCAGT 
TGAAAAATCATGGCGCTTGAACGAACGTCATTACGGTGGATTGACAGGAA 
.AAAATAAAGCAGAAGCAGCTGAACAATTTGGTGATGAGCAAGTTCATATT 
TGGCGTCGTTCATATGATGTATTGCCTCCAGATATGGCTAAAGATGATGA 
ACATTCAGCACATACTGATCGTCGCTATGCTTCACTAGATGATTCTGTTA 
TTCCAGATGCAGAAAACCTAAAAGTTACTTTAGAGCGTGCTCTTCCTTTC 
TGGGAAGATAAAATTGCTCCTGCTCTTAAAGATGGTAAAAATGTGTTTGT 
TGGTGCACACGGTAACTCAATCCGTGCTCTTGTAAAACATATCAAACAAT 
TGTCAGATGATGAAATCATGGACGTTGAAATTCCTAACTTCCCACCACTT 
GTTTTCGAATTTGATGAAAAATTAAACCTTGTTTCAGAATATTACTTAGG 
TAAA 

SEQ ID NO. 4212: 2603 V/R STRAIN 

VKLVFARHGESEWNKANLFTGWADVDLSEKGTQQAIDAGKLIQAAGIEFDLAFTSVLKRA 
IKTTNLALEAADQLWVPVEKSWRLNERHYGGLTGKNKAEAAEQFGDEQVHIWRRSYDVLP 
PDMAKDDEHSAHTDRRYASLDDSVIPDAENLKVTLERALPFWEDKIAPALKDGKNVFVGA 
HGNSIRALVKHIKQLSDDEIMDVEIPNFPPLVFEFDEKLNLVSEYYLGK 

SEQ ID NO. 4213: 090 STRAIN 

VKLVFARHGESEWNKANLFTGWADVDLSEKGTQQAIDAGKLIQAAGIEFDLAFTSVLKRA 
IKTTNLALEAADQLWVPVEKSWRLNERHYGGLTGKNKAEAAEQFGDEQVHIWRRSYDVLP 
PDMAKDDEHSAHTDRRYASLDDSVIPDAENLKVTLERALPFWEDKIAPALKDGJCNVFVGA 
HGNSIRALVKHIKQLSDDEIMDVEIPNFPPLVFEFDEKLNLVSEYYLGK 

SEQ ID NO. 4214: A909 STRAIN 

VKLVFARHGESEWNKANLFTGWADVDLSEKGTQQAIDAGKLIQAAGIEFDLAFTSVLKRA 
IKTTNLALEAADQLWVPVEKSWRLNERHYGGLTGKNKAEAAEQFGDEQVHIWRRSYDVLP 
PDMAKDDEHSAHTDRRYASLDDSVIPDAENLKVTLERALPFWEDKIAPALKDGKNVFVGA 
HGNSIRALVKHIKQLSDDEIMDVEIPNFPPLVFEFDEKLNLVSEYYLGK 

SEQ ID NO. 4215: H36B STRAIN 

VKLVFARHGESEVWKANLFTGWADVDLSEKGTQQAIDAGKLIQAAGIEFDLAFTSVLKRA 
IKTTNLALEAADQLWVPVEKSWRLNERHYGGLTGEOJKAEAAEQFGDEQVHIWRRSYDVLP 
PDMAKDDEHSAHTDRRYASLDDSVIPDAENLKVTLERALPFWEDKIAPALKDGKNVFVGA 
HGNSIRALVKHIKQLSDDEIMDVEIPNFPPLVFEFDEKLNLVSEYYLGK 

SEQ ID NO. 4216: 18RS21 STRAIN 

VKLVFARHGESEWNKANLFTGWADVDLSEKGTQQAIDAGKLIQAAGIEFDLAFTSVLKRA 
IKTTNLALEAADQLWVPVEKSWRLNERHYGGLTGKNKAEAAEQFGDEQVHIWRRSYDVLP 
PDMAKDDEHSAHTDRRYASLDDSVIPDAENLKVTLERALPFWEDKIAPALKDGKNVFVGA 
HGNSIRALVKHIKQLSDDEIMDVEIPNFPPLVFEFDEKLNLVSEYYLGK 

SEQ ID NO. 4217: M732 STRAIN 

VKLVFARHGESEWNKANLFTGWADVDLSEKGTQQAIDAGKLIQAAGIEFDLAFTSVLKRA 
IKTTNLALEAADQLWVPVEKSWRLNERHYGGLTGKNKAEAAEQFGDEQVHIWRRSYDVLP 
PDMAKDDEHSAHTDRRYASLDDSVIPDAENLKVTLERALPFWEDKIAPALKDGKNVFVGA 
HGNSIRALVKHIKQLSDDEIMDVEIPNFPPLVFEFDEKLNLVSEYYLGK 

SEQ ID NO. 4218: COHl STRAIN 

VKLVFARHGESEWNECANLFTGWADVDLSEKGTQQAIDAGKLIQAAGIEFDLAFTSVLKRA 
IKTTNLALEAADQLWVPVEKSWRLNERHYGGLTGKNKAEAAEQFGDEQVHIWRRSYDVLP 
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PDMAKDDEHSAHTDRRYASLDDSVIPDAENLKVTLERALPFWEDKIAPALKDGKNVFVGA 
HGNSIRALVKHIKQLSDDEIMDVEIPNFPPLVFEFDEKLNLVSEYYLGK 

SEQ ID NO, 4219: CJB110 STRAIN 

VKLV FARHGE SEWNKANLFTGWADVDLS EKGTQQAI DAGKL I QAAG IE FDLAFTS VLKRA 
IKTTNLALEAADQLWVPVEKSWRLNERHYGGLTGKNBCAEAAEQFGDEQVHIWRRSYDVLP 
PDMAKDDEHSAHTDRRYASLDDSVIPDAENLKVTLERALPFWEDKIAPALKDGKNVFVGA 
HGNSIRALVKHIKQLSDDEIMDVEIPNFPPLVFEFDEKLNLVSEYYLGK 

SEQ ID NO. 4220: 1169NT STRAIN 

VFARHGESEWNKANLFTGWADVDLSEKGTQQAIDAGKLIQAAGIEFDLAFTSVLKRAIKT 
TNLALEAADQLWVPVEKSWRLNERHYGGLTGKNKAEAAEQFGDEQVHIWRRSYDVLPPDM 
AKDDEHSAHTDRRYASLDDSVIPDAENLKVTLERALPFWEDKIAPALKDGKNVFVGAHGN 
SIRALVKHIKQLSDDEIMDVEIPNFPPLVFEFDEKLNLVSEYYLGK 

SEQ ID NO. 4221: M781 STRAIN 

VKLVFARHGESEWNKANLFTGWADVDLSEKGTQQAIDAGKLI QAAG IE FDLAFTS VLKRA 
IKTTNLALEAADQLWVPVEKSWRLNERHYGGLTGKNKAEAAEQFGDEQVHIWRRSYDVLP 
PDMAKDDEHSAHTDRRYASLDDSVIPDAENLKVTLERALPFWEDKIAPALKDGKNVFVGA 
HGNSIRALVKHIKQLSDDEIMDVEIPNFPPLVFEFDEKLNLVSEYYLGK 

SEQ ID NO. 4222: OM9130013 STRAIN 

VKLVFARHGESEWNKANLFTGWADVDLSEKGTQQAIDAGKLIQAAGIEFDLAFTSVLKRA 

IKTTNLALEAADQLWVPVEKSWRLNERHYGGLTGKNKAEAAEQFGDEQVHIWRRSYDVLP 

PDMAKDDEHSAHTDRRYASLDDSVIPDAENLKVTLERALPFWEDKIAPALKDGKNVFVGA 

HGNSIRALVKHIKQLSDDEIMDVEIPNFPPLVFEFDEKLNLVSEYYLGK 

SEQ ID NO. 4301: 2603 V/R STRAIN 

ATGAATCTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAGGTACTCAAGCAGCTAAGATC 
GTTGAAGAATTTGGTGTTGCTCACATCTCAACAGGGGATATGTTCCGCGCCGCAATGGCT 
AATCAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGGTTCCT 
GATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGCAGAAAAA 
GGTTTTTTACTTGATGGATATCCACGTACTATTGAACAAGCACACGCCTTAGATGCTACG 
CTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTGGATCCATCATGT 
CTTATAGAGCGTTTGAGTGkTCGTATTATCAATCGTAAAACTGGTGAAACTTTCCACAAA 
GTGTTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAG 
CCTGAAACTGTCAAACGTCGCTTGGACGTTAATATTGCTCAAGGAGAACCTATTCTTGAA 
CACTATCGTAAGCTTGGTCTTGTTACAGATATTGAAGGTAATCAAGAAATAACAGAAGTT 
TTTGCAGATGTTGAAAAAGCGTTGCTAGAACTCAAA 

SEQ ID NO. 4302: 090 STRAIN (reverse complement) 

AATCTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAGGTACTCA 

AGCAGCTAAGATCGTTGAAGAATTTGGTGTTGCTCACATCTCAACAGGGGATATGTTCCG 
CGCCGCAATGGCTAATCAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGG 
TGAATTGGTTCCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGA 
TATCGCAGAAAAAGGTTTTTTACTTGATGGATATCCACGTACTATTGAACAAGCACACGC 
CTTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGT 
GGATCCATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGA 
AACTTTCCACAAAGTGTTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATCAACG 
TGAAGATGATAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTAATATTGCTCAAGGAGA 
ACCTATTCTTGAACACTATCGTAAGCTTGGTCTTGTTACAGATATTGAAGGTAATCAAGA 
AATAACAGAAGTTTTTGCAGATGTTGAAAAAGCGTTG 

SEQ ID NO. 4303: 1169NT STRAIN (REVERSE COMPLEMENT) 

TGGTAAAGGGACTCAAGCAGCTAAGATTGTTGAAGAATTTGGTGTTGCGCACATCTCAAC 
AGGGGATATGTTCCGCGCCGCAATGGCTAATCAAACCGAAATGGGACGTTTAGCTAAAAG 
TTATATTGATAAAGGTGAATTGGTTCCTGATCAAGTAACAAACGGGATTGTAAAAGAGCG 
CTTAGCTGAGGATGATATCGCAGAAAAAGGTTTTTTACTTGATGGGTATCCACGTACTAT 
TGAACAAGCACACGCCTTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGT 
TATTAATATTAAAGTGGATCCATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCAA 
TCGTAAAACTGGTGAAACTTTCCACAAAGTGTTCAACCCACCAGTAGATTATAAAGAAGA 
AGATTACTATCAACGTGAAGATGATAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTCA 
TATTGCTCAAGGAGAACCTATTCTTGAACACTATAGTAAGCTTGGCCTTGTTACAGATAT 
TGAAGGTAATCAAGAAATAA 
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SEQ ID NO. 4304: 18RS21 STRAIN (REVERSE COMPLEMENT) 

AATCTTTTAACCACGGGTTCGCCTGGTGCTGGTAAAGGTACTCAAGCAGCTAAGATCG 

TTGAAGAATTTGGTGTTGCTCACATCTCAACAGGGGATATGTTCCGCGCCGCAATGGCTA 

ATCAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGGTTCCTG 

ATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGCAGAAAAAG 

GTTTTTTACTTGATGGATATCCACGTACTATTGAACAAGCACACGCCTTAGATGCTACGC 

TTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTGGATCCATCATGTC 

TTATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGAAACTTTCCACAAAG 

TGTTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGC 

CTGAAACTGTCAAACGTCGCTTGGACGTTAATATTGCTCAAGGAGAACCTATTCTTGAAC 

ACTATCGTAAGCTTGGTCTTGTTACAGATATTGAAGGTAATCAAGAAATAACAGAAGTTT 

TTGCAGATGTTGAAAAAGCGTTG 

SEQ ID NO. 4305: A909 STRAIN (REVERSE COMPLEMENT) 

AATCTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAGGTACTCAAGCAG 

CTAAGATCGTTGAAGAATTTGGTGTTGCTCACATCTCAACAGGGGATATGTTCCGCGCCG 

CAATGGCTAATCAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAAT 

TGGTTCCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCG 

CAGAAAAAGGTTTTTTACTTGATGGATATCCACGTACTATTGAACAAGCACACGCCTTAG 

ATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTGGATC 

CATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGAAACTT 

TCCACAAAGTGTTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAG 

ATGATAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTAATATTGCTCAAGGAGAATCTA 

TTCTTGAACACTATCGAAAGCTTGGTCTTGTTACAGATATTGAAGGTAA 

SEQ ID NO. 4306: CJB110 STRAIN (REVERSE COMPLEMENT) 

AATCTTTTAACCACGGGTTTGCTTGGTGCTGGTAAAGGTACTCAAGCAGCTAA 

GATCGTTGAAGAATTTGGTGTTGCTCACATCTCAACAGGGGATATGTTCCGCGCCGCAAT 

GGCTAATCAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGGT 

TCCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGCAGA 

AAAAGGTTTTTTACTTGATGGATATCCACGTACTATTGAACAAGCACACGCCTTAGATGC 

TACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTGGATCCATC 

ATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGAAACTTTCCA 

CAAAGTGTTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGA 

TAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTAATATTGCTCAAGGAGAACCTATTCT 
TGAACACTATAG 

SEQ ID NO. 4307: COH1 STRAIN (REVERSE COMPLEMENT) 

ATCTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAGGTACTCAAGCAGCTAAGATTGTTG 

AAGAATTTGGTGTTGCTCACATCTCAACAGGGGATATGTTCCGCGCCGCAATGGCTAATC 

AAACCCAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGGTTCCTGATG 

AAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGCAGAAAAAGGTT 

TTTTACTTGATGGATATCCACGTACTATTGAGCAAGCACACGCCTTAGATGCTACGCTTG 

AAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTGGATCCAACATGCCTTA 

TAGAGCGTTTGAGTGGCCGTATTATCAATCGTAAAACTGGTGAAACTTTCCACAAAGTGT 

TCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCTG 

AAACTGTCAAACGTCGCTTGGACGTTAATATTGCTCAAGGAGAACCTATTCTTGAACACT 

ATCGTAAGCTTGGTCTTGTTACAGATATTGAAGGTAATCAAGAAATAACAGAAGTTTTTG 
CAGATGTTGAAAAAGCGTTG 

SEQ ID NO. 4308: H36B STRAIN (REVERSE COMPLEMENT) 

CAGGGGATATGTTCCGCGCCGCAATGGCTAATCAAACCGAAATGGGACGTTTAGCTAAAA 
GTTATATTGATAAAGGTGAATTGGTTCCTGATGAAGTAACAAACGGGATTGTAAAAGAGC 
GCTTAGCTGAGGATGATATCGCAGAAAAAGGTTTTTTACTTGATGGATATCCACGTACTA 
TTGAACAAGCACACGCCTTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTG 
TTATTAATATTAAAGTGGATCCATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCA 
ATCGTAAAACTGGTGAAACTTTCCACAAAGTGTTCAACCCACCAGTAGATTATAAAGAAG 
AAGATTACTATCAACGTGAAGATGATAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTA 
ATATTGCTCAAGGAGAATCTATTCTTGAACACTATCGTAAGCTTGGTCTTGTTACAGATA 
TTGAAGGTAATCAAGAAATAACAGAAGTTTTTGCAGATGTTGAAAAAGCGTTG 

SEQ ID NO. 4309: JM9130013 STRAIN (REVERSE COMPLEMENT) 

AATCTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAGGT 

ACTCAAGCAGCTAAGATCGTTGAAGAATTTGGTGTTGCTCACATCTCAACAGGGGATATG 
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TTCCGCGCCGCAATGGCTAATCAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGAT 

AAAGGTGAATTGGTTCCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAG 

GATGATATCGCAGAAAAAGGTTTTTTACTTGATGGATATCCACGTACTATTGAACAAGCA 

CACGCCTTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATT 

AAAGTGGATCCATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACT 

GGTGAAACTTTCCACAAAGTGTTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTAT 

CAACGTGAAGATGATAAGCCTGAAACTGTTAAACGTCGCTTGGACGTTAATATTGCTCAA 

GGAGAACCTATTCTTGAACACTATAAAAAGCTTGGTCTTGTTACAGATATTGAAGGTAAT 
CA 

SEQ ID NO. 4310: M732 STRAIN (REVERSE COMPLEMENT) 

CTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAGGTACTCAAGCAGCTAAGATTGTTGAA 
GAATTTGGTGTTGCTCACATCTCAACAGGGGATATGTTCCGCGCCGCAATGGCTAATCAA 
ACCCAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGGTTCCTGATGAA 
GTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGCAGAAAAAGGTTTT 
TTACTTGATGGATATCCACGTACTATTGAGCAAGCACACGCCTTAGATGCTACGCTTGAA 
GAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTGGATCCAACATGCCTTATA 
GAGCGTTTGAGTGGCCGTATTATCAATCGTAAAACTGGTGAAACTTTCCACAAAGTGTTC 
AACCCACCAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCTGAA 
ACTGTCAAACGTCGCTTGGACGTTAATATTGCTCAAGGAGAACCTATTCTTGAACACTAT 
CGTAAGCTTGGTCTTGTTACAGATATTGAAGGTAATCAAGAAATAACAGAAGTTTTTGCA 
GATGTTGAAAAAGCGTTG 

SEQ ID NO. 4311: M781 STRAIN (REVERSE COMPLEMENT) 

AATCTTTTAATTACGGGTTTGCCTGGTGCTGGTAAAGGTACTCAA 

GCAGCTAAGATTGTTGAAGAATTTGGTGTTGCTCACATCTCAACAGGGGATATGTTCCGC 
GCCGCAATGGCTAATCAAACCCAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGT 
GAATTGGTTCCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGAT 
ATCGCAGAAAAAGGTTTTTTACTTGATGGATATCCACGTACTATTGAGCAAGCACACGCC 
TTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTG 
GATCCAACATGCCTTATAGAGCGTTTGAGTGGCCGTATTATCAATCGTAAAACTGGTGAA 
ACTTTCCACAAAGTGTTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATCAACGT 
GAAGATGATAAGCCTGAAACTGTCAAACGTCGCTTGGACGTTAATATTGCTCAA 

SEQ ID NO. 4312: 2603 V/R STRAIN 

MNLLIMGLPGAGKGTQAAKI VEE FGVAHI STGDMFRAAMANQTEMGRLAKS YI DKGELVP 
DEVTNGIVBCERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPSC 
LIERLSXRIINRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGEPILE 
HYRKLGLVTDIEGNQEITEVFADVEKALLELK 

SEQ ID NO. 4313: 090 STRAIN 

NLLIMGLPGAGKGTQAAKIVEEFGVAHI STGDMFRAAMANQTEMGRLAKS YIDKGELVPD 
EVTNGIVKERIAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPSCL 
IERLSGRIINRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGEPILEH 
YRKLGLVTDIEGNQEITEVFADVEKALLELK 

SEQ ID NO. 4314: 1169NT STRAIN 

GKGTQAAKIVEEFGVAHI STGDMFRAAMANQTEMGRLAKS YI DKGELVP DQVTNGIVKER 
LAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPSCLIERLSGRIIN 
RKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVHIAQGEPILEHYSKLGLVTDI 
EGNQEI 

SEQ ID NO. 4315: 18RS21 STRAIN 

NLLTTGSPGAGKGTQAAKIVEEFGVAHISTGDMFRAAMANQTEMGRLAKS YIDKGELVPD 
EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPSCL 
IERLSGRIINRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGEPILEH 
YRKLGLVTDIEGNQEITEVFADVEKALLE 

SEQ ID NO. 4316: A909 STRAIN 

NLLIMGLPGAGKGTQAAKIVEEFGVAHI STGDMFRAAMANQTEMGRLAKS YIDKGELVPD 
EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIBCVDPSCL 
IERLSGRIINRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGESILEH 
YRKLGLVT D I EG 
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SEQ ID NO. 43X7: A909 STRAIN 

NLLIMGLPGAGKGTQAAKIVEE FGVAHI STGDMFRAAMANQTEMGRLAKS YI DKGELVPD 
EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPSCL 
IERLSGRI INRKTGET FHKV FN P PVDYKEE DYYQRE DDKPETVKRRLDVN I AQGES I LEH 
YRKLGLVTDIEG 

SEQ ID NO. 4318: CJB110 STRAIN 

NLLTTGLLGAGKGTQAAKIVEEFGVAHISTGDMFRAAMANQTEMGRLAKSYIDKGELVPD 
EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPSCL 
IERLSGRIINRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGEPILEH 

SEQ ID NO. 4319: COH1 STRAIN 

LLIMGLPGAGKGTQAAKIVEEFGVAHISTGDMFRAAMANQTQMGRLAKSYIDKGELVPDE 
VTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPTCLI 
ERLSGRIINRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGEPILEHY 
RKLGLVTDIEGNQEITEVFADVEKALL 

SEQ ID NO. 4320: H36B STRAIN 

GDMFRAAMANQTEMGRLAKSYIDKGELVPDEVTNGIVKERLAEDDIAEKGFLLDGYPRTI 
EQAHALDATLEELGLRLDGVINIKVDPSCLIERLSGRIINRKTGETFHKVFNPPVDYKEE 
DYYQRE DDKPETVKRRLDVN IAQGE SI LEH YRKLGLVTDIEGNQEITEVFADVEKAL 

SEQ ID NO. 4321: JM9130013 STRAIN 

NLLIMGLPGAGKGTQAAKI VEE FGVAHI STGDMFRAAMANQTEMGRLAKS YI DKGELVPD 

EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPSCL 

IERLSGRI INRKTGET FHKVFNPPVDYKEEDYYQRE DDKPETVKRRLDVN IAQGE PI LEH 
YKKLGLVT D I EGN 

SEQ ID NO. 4322: M732 STRAIN 

LLIMGLPGAGKGTQAAKIVEEFGVAHISTGDMFRAAMANQTQMGRLAKSYIDKGELVPDE 
VTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPTCLI 
ERLSGRIINRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGEPILEHY 
RKLGLVTDIEGNQEITEVFADVEKALLELK 

SEQ ID NO. 4323: M781 STRAIN 

NLLITGLPGAGKGTQAAKIVEE FGVAHI STGDMFRAAMANQTQMGRLAKSYI DKGELVPD 
EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRLDGVINIKVDPTCL 
IERLSGRIINRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQ 

SEQ ID NO. 4401 
STRAIN 2603 

GTGGATAAACATCACTCAAAAAAGGCTATTTTAAAGTTAACA 

CTTATAACAACTAGTATTTTATTAATGCATAGCAATCAAGTGAATGCAGAGGAGCAAGAA 
TTAAAT^AACCAAGAGCAATCACCTGTAATTGCTAATGTTGCTCAACAGCCATCGCCATCG 
GTAACTACTAATACTGTTGAAAAAACATCTGTAACAGCTGCTTCTGCTAGTAATACAGCG 
AAAGAAATGGGTGATACATCTGTAAAAAATGACAAAACAGAAGATGAATTATTAGAAGAG 
TTATCTAAAAACCTTGATACGTCTAATTTGGGGGCTGATCTTGAAGAAGAATATCCCTCT 
AAACCAGAGACAACCAACAATAAAGAAAGCAATGTAGTAACAAATGCTTCAACTGCAATA 
GCACAGAAAGTTCCCTCAGCATATGAAGAGGTGAAGCCAGAAAGCAAGTCATCGCTTGCT 
GTTCTTGATACATCTAAAATAACAAAATTACAAGCCATAACCCAAAGAGGAAAGGGAAAT 
GTAGTAGCTATTATTGATACTGGCTTTGATATTAACCATGATATTTTTCGTTTAGATAGC 
CCAAAAGATGATAAGCACAGCTTTAAAACTAAGACAGAATTTGAGGAATTAAAAGCAAAA 
CATAATATCACTTATGGGAAATGGGTTAACGATAAGATTGTTTTTGCACATAACTACGCC 
AACAATACAGAAACGGTGGCTGATATTGCAGCAGCTATGAAAGATGGTTATGGTTCAGAA 
GCAAAGAATATTTCGCATGGTACACACGTTGCTGGTATTTTTGTAGGTAATAGTAAACGT 
CCAGCAATCAATGGTCTTCTTTTAGAAGGTGCAGCGCCAAATGCTCAAGTCTTATTAATG 
CGTATTCCAGATAAAATTGATTCGGACAAATTTGGTGAAGCATATGCTAAAGCAATCACA 
GACGCTGTTAATCTAGGAGCAAAAACGATTAATATGAGTATTGGAAAAACAGCTGATTCT 
TTAATTGCTCTCAATGATAAAGTTAAATTAGCACTTAAATTAGCTTCTGAGAAGGGCGTT 
GCAGTTGTTGTGGCTGCCGGAAATGAAGGCGCATTTGGTATGGATTATAGCAAACCATTA 
TCAACTAATCCTGACTACGGTACGGTTAATAGTCCAGCTATTTCTGAAGATACTTTGAGT 
GTTGCTAGCTATGAATCACTTAAAACTATCAGTGAGGTCGTTGAAACAACTATTGAAGGT 
AAGTTAGTTAAGTTGCCGATTGTGACTTCTAAACCTTTTGACAAAGGTAAGGCCTACGAT 
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GTGGTTTATGCCAATTATGGTGCAAAAAAAGACTTTGAAGGTAAGGACTTTAAAGGTAAG 
ATTGCATTAATTGAGCGTGGTGGTGGACTTGATTTTATGACTAAAATCACTCATGCTACA 
AATGCAGGTGTTGTTGGTATCGTTATTTTTAACGATCAAGAAAAACGTGGAAATTTTCTA 
ATT CCTTACCGTGAAT t ACCTGTGGGGATTATTAGTAAAGTAGATGGCGAGCGTATAAAA 
AATACTTCAAGTCAGTTAACATTTAACCAGAGTTTTGAAGTAGTTGATAGCCAAGGTGGT 
AATCGTATGCTGGAACAATCAAGTTGGGGCGTGACAGCTGAAGGAGCAATCAAGCCTGAT 
GTAACAGCTTCTGGCTTTGAAATTTATTCTTCAACCTATAATAATCAATACCAAACAATG 
TCTGGTACAAGTATGGCTTCACCACATGTTGCAGGATTAATGACAATGCTTCAAAGTCAT 
TTGGCTGAGAAATATAAAGGGATGAATTTAGATTCTAAAAAATTGCTAGAATTGTCTAAA 
AACATCCTCATGAGCTCAGCAACAGCATTATATAGTGAAGAGGATAAGGCGTTTTATTCA 
CCACGTCAGCAAGGTGCAGGTGTAGTTGATGCTGAAAAAGCTATCCAAGCTCAATATTAT 
ATTACTGGAAACGATGGCAAAGCTAAAATTAATCTCAAACGAATGGGAGATAAATTTGAT 
ATCACAGTTACAATTCATAAACTTGTAGAAGGTGTCAAAGAATTGTATTATCAAGCTAAT 
GTAGCAACAGAACAAGTAAATAAAGGTAAATTTGCCCTTAAACCACAAGCCTTGCTAGAT 
ACTAATTGGCAGAAAGTAATTCTTCGTGATAAAGAAACACAAGTTCGATTTACTATTGAT 
GCTAGTCAATTTAGTCAGAAATTAAAAGAACAGATGGCAAATGGTTATTTCTTAGAAGGT 
TTTGTACGTTTTAAAGAAGCCAAGGATAGTAATCAGGAGTTAATGAGTATTCCTTTTGTA 
GGATTTAATGGTGATTTTGCGAACTTACAAGCACTTGAAACACCGATTTATAAGACGCTT 
TCTAAAGGTAGTTTCTACTATAAACCAAATGATACAACTCATAAAGACCAATTGGAGTAC 
AATGAATCAGCTCCTTTTGAAAGCAACAACTATACTGCCTTGTTAACACAATCAGCGTCT 
TGGGGCTATGTTGATTATGTCAAAAATGGTGGGGAGTTAGAATTAGCACCGGAGAGTCCA 
AAAAGAATTATTTTAGGAACTTTTGAGAATAAGGTTGAGGATAAAACAATTCATCTTTTG 
GAAAGAGATGCAGCGAATAATCCATATTTTGCCATTTCTCCAAATAAAGATGGAAATAGG 
GACGAAATCACTCCCCAGGCAACTTTCTTAAGAAATGTTAAGGATATTTCTGCTCAAGTT 
CTAGATCAAAATGGAAATGTTATTTGGCAAAGTAAGGTTTTACCATCTTATCGTAAAAAT 
TTCCATAATAATCCAAAGCAAAGTGATGGTCATTATCGTATGGATGCTCTTCAGTGGAGT 
GGTTTAGATAAGGATGGCAAAGTTGTAGCAGATGGTTTTTATACTTATCGCTTACGTTAC 
ACACCAGTAGCAGAAGGAGCAAATAGTCAGGAGTCAGACTTTAAAGTACAAGTAAGTACT 
AAGTCACCAAATCTTCCTTCACGAGCTCAGTTTGATGAAACTAATCGAACATTAAGCTTA 
GCCATGCCTAAGGAAAGTAGTTATGTTCCTACATATCGTTTACAATTAGTTTTATCTCAT 
GTTGTAAAAGATGAAGAATATGGGGATGAGACTTCTTACCATTATTTCCATATAGATCAA 
GAAGGTAAAGTGACACTTCCTAAAACGGTTAAGATAGGAGAGAGTGAGGTTGCGGTAGAC 
CCTAAGGCCTTGACACTTGTTGTGGAAGATAAAGCTGGTAATTTCGCAACGGTAAAATTG 
TCTGATCTCTTGAATAAGGCAGTAGTATCAGAGAAAGAAAACGCTATAGTAATTTCTAAC 
AGTTTCAAATATTTTGATAACTTGAAAAAAGAACCTATGTTTATTTCTAAAAAAGAAAAA 
GTAGTAAACAAGAATCTAGAAGAAATAATATTAGTTAAGCCGCAAACTACAGTTACTACT 
CAATCATTGTCTAAAGAAATAACTAAATCAGGAAATGAGAAAGTCCTCACTTCTACAAAC 
AATAATAGTAGCAGAGTAGCTAAGATCATATCACCTAAACATAACGGGGATTCTGTTAAC 
CATACCTTACCTAGTACATCAGATAGAGCAACGAATGGTCTATTTGTTGGTACTTTGGCA 
TTGTTATCTAGTTTACTTCTTTATTTGAAACCCAAAAAGACTAAAAATAATAGTAAA 

SEQ XD NO. 4402 
STRAIN 090 

GAGGAGCAAGAATTAAAAAACCAAGAGCAATCACCTGTAATTGCT 

AATGTTGCTCAACAGCCATCGCCATCGGTAACTACTAATATTGTTGAAAA 

AACATCTGTAACAGCTGCTTCTGCTAGTAATACAGTGAAAGAAATGGGTG 

ATACATCTGTAAAAAATGACAAAACAGAAGATGAATTATTAGAAGAGTTA 

TCTAAAAACCTTGATACGTCTAATTTGGGGGCTGATCTTGAAGAAGAATA 

TCCCTCTAAACCAGAGACAACCAACAATAAAGAAAGCAATGTAGTAACAA 

ATGCTTCAACTGCAATAGCACAGAAAGTTCCCTCAGCGTATG7UVGAGGTG 

AAGCCAGAAAGCAAGTCATCGCTTGCTGTTTTTGATACATCTAAAATAAC 

AAAATTGCAAGCCATAACCCAAAGAGGAAAGGGAAATGTAGTAGCTATTA 

TTGATACTGGCTTTGATATTAACCATGATATTTTTCGTTTAGATAGCCCA 

AAAGATGATAAGCACAGCTTTAAAACTAAAGCAGAATTCGAGGAATTAAA 

AGCAAAACATAATATCACTTATGGGAAATGGGTTAACGATAAGATTGTTT 

TTfeCACATAACTACGCCAACAATACAGAAACGGTGGCTGATATTGCAGCA 

GCTATGAAAGATGGTTATGGGTCAGAAGCAAAGAATATTTCGCATGGTAC 

ACACGTTGCTGGTATTTTTGTAGGTAATAGTAAACGTCCAGCAATCAATG 

GTCTTCTTTTAGAAGGTGCAGCGCCAAATGCTCAAGTCTTATTAATGCGT 

ATTCCAGATAAAATTGATTCGGACAAATTTGGAGAAGCATATGCTAAAGC 

AATCACAGACGCTGtTAATCTAGGAGCAAAAaCGATTAATATGAGCCTTG 

GAAAAACAGCAGATTCTTTAAttGCaCTCAATGATAAAGTTAAATTAGCA 

CTTAAATTAGCTTCTGAGAAGGGCGTTGCAGTTGTTGTGGCTGCCGGAAA 

TGAAGGTGCATTTGGTATGGATTATAGCAAACCATTATCAACTAATcCTG 
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ACTACGGTACGGTTAATAGTCCAGCTATTTCTGAAGATACTtTGAGTGTT 
GCTAGCTATGAATCACTTAAAACTATCAGTGAGGTCGTTGAAACAACTAT 
TGaaGGTAAGTTAGTTAAGTTGCCGATTGTGACTTCTAAACCTTTtGACA 
AAGGTAAGGCCTACGATGTGGTTTATGCCAATTATGGTGCAaAAAAAGAC 
TTTGAAGGTAAgGACTTTAAAGGTAAGATTGCATTAATtGAGCGTGGtGG 
TGGACTTGATTTTATGACTAAaatCACTcATGCTACAAATGCAgGTGTTG 
tTGGTaTCGTtATTtttAACgAtCAAGAaaAACGtGGAAATTTTcTAATT 
CCTTACCGTGAATTACCTGTGGGGGTTATTAGTAAAGTAGATGGCGAGCG 
TATAAAAAATACTTCAAGTCAGTTAACATTTAACCAGAGTTTTgAAGTAG 
TTGATAGCCAAGGTGGCAATCGTATGCTGGAACAATCAAGTTGGGGCGTG 
ACAGCTGAAGGAGCAATCAAGCCTGATGTAACAGCTTCTGGCTTTGAAAT 
TTATTCTTCAACCTATAATAATCAATACCAAACAATGTCTGGTACAAGTA 
TGGCTTCACCACATGTTGCAGGATTAATGACAATGCTTCAAAGTCATTTG 
GCTGAGAAATATAAAGGGATGAATTTAgATTCTAAAAAATTGCTAGAATT 
GTCTAaAAACATCCTCATGAGCTCAGCaaCAGCATTATATAGTgAAGAgG 
ATAAGGCGTtTtATTCaCCACGTCAGCAAGGtGCAGGtGTAGTTGATGCT 
GAAAAAGCTATCCAAGCTCAATATTATGTTACTGGAAACGATGGCAAAGC 
TAAAATTAATCTCAAACGAGTGGGAGATAAATTTGATATCACAGTTACAA 
TTCATAAACTTGTAGAAGGTGTCAAAGAATTGTATTATCAAGCTAATGTA 
GCAACAGAACaAGTAAATAAAGGTAAATTTGCCCTTAAACCACAAGCCtT 
GCTAGATACTAATTGGCAGAaAGTAATTCTTcGTGATAAAGAAACACAAG 
TTcGATTTACTATTGATGCTAGTCAATTTAGTCAGAAATTAAAAGAACAG 
ATGGCAAATGGTTATTTCTTAgAAGGTTTTGTACGTTTTAAAGAAGCCAA 
GGATAGtAATCAGGAGTTAaTGAGTATTCCTTtTGTAGGATttAATGGTG 
ATTTTGCGAACTTACAAGCACTTGAAACACCGATTTATAAGACGCTTTCT 
AAAGGTAGTTTCTACTATAAACCAAATGATACAACTCATAAAGACCAATT 
GGAGTACAATGAAT CAGCTCCTTTTGAAAGCAACAACT ATACTGCCT TGT 
TAACACAATCAGCGTCTTGGGGCTATGTTGATTATGTCAAAAATGGTGGG 
GAGTTAGAATTAGCACCGGAgAGTcCAAAAAGAATTATTTTAgGAACTTT 
TGAGAATAAGGTTGAGGATAAAACAATTCATCTTTTGGAAAGAGATGCAG 
CgAATAATCCATATTTTGCCATTTCTCCAAATAAAGATGGAAATAGGGAT 
GAAATCACTCCCCAGGCAACTTTCTTAAGAAATGTTAAGGATATTTCTGC 
TCAAGTTCTAGATCAAAATGGAAATGTTATTTGGCAAAGTAAGGTTTTAC 
CATCTTATCGTAAAAATTTCCATAATAATCCAAAGCAAAGTGATGGTCAT 
TATCGTATGGATGCCTTTCAGTGGAGTGGTTTAGATAAGGATGGCAAAGT 
TGTAGCAGATGGTTTTTATACTTATCGCCTACGTTACACACCAGTAGCAG 
AAGGAGCAAATAGTCAGGAGTCAGACTTTAAAGTTCAAGTAAGTACTAAG 
TCACCAAATCTTCCTTTACTAGCTCAGTTTGATGAAACTAATCGAACATT 
AAGCTTAGCCATGCCTAAGGAAAGTAGTTATGTTCCTACATATCGTTTAC 
AATTAGTTTTATCTCATGTTGTAAAAGATGAAGAATATGGGGATGAGACT 
TCTTACCATTATTTCCATATAGATCAAGAAGGTAAAGTGACACTTCCTAA 
AACGGTTAAGATAGGAGAGAGTGAGGTTGCAGTAGACCCTAAGGCCTTGA 
CACTTGTTGTGGAAGATAAAGCTGGTAATTTTGCAACGGTAAAATTGTCT 
GACCTCTTGAATAAGGCAGTAGTATCAGAGAAAGAAAACGCTATAGTAAT 
TTCTAACAGTTTCAAATATTTTGATAACTTGAAAAAAGAATCTATGTTTA 
TTTCTAAAGAAGGAAAAGTAGTAAACAAGAATCTAGAAGAAATAACATTA 
GTTAAGCCGCAAACTACAGTTACTACTCAATCATTGTCTAAAGAAATAAC 
TAAATCAGGAAATGAGAAAGTCCTCACTTCTACAAACAATAATAGTAGCA 
GAGTAGCTAAGATCATATCACCTAAACATAACGGGGATTCTGTTAACCAT 
ACC 

SEQ ID NO. 4403 
STRAIN A909 

GAGGAGCAAGAATTAAAAAACCAAGAGCAAT 

CACCTGTAATTGCTAATGTTGCTCAACAGCCATCGCCATCGGTAACTACT 
AATACTGTTGAAAAAACATCTGTAACATCTGCTTCTGCTAGTAATACAGC 
GAAAGAAATGGGTGATACATCTGTAAAAAATGACAAAACAGAAGATGAAT 
TATTAGAAGAGTTATCTAAAAACCTTGATACGTCTAATTTGGGGGCTGAT 
CTTGAAGAAGAATATCCCTCTAAACCAGAGACAACCAACAATAAAGAAAG 
CAATGTAGTAACAAATGCTTCAACTGCAATAGCACAGAAAGTTCCCTCAG 
CATATGAAGAGGTGAAGCCAGAAAGCAAGTCATCACTTGCTGTTCTTGAT 
ACATCTAAAATAACAAAATTGCAAGCCATAACCCAAAGAGGAAAGGGAAA 
TGTAGTAGCTATTATTGATACTGGCTTTGATATTAACCATGATATTTTTC 
GTTTAGATAGCCCAAAAGATgaTAAGCACAGCTTTAaAACTAAGGCAGAA 
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TTTGAGGAATTAAAAGCAAAACATAATATCACTTATGGGAAATGGGTTAA 
CGATAAGATTGtTTTTGCACATAACTACGCCAaCAATACAGAAACGGTGG 
CTGATATTGCAGCAGCTATGAAAGATGGTTATGGGTCAGAAGCAAAGAAT 
ATTTCGCATGGTACACACGTTGCTGGTATTTTTGTAGGTAATAGTAAACG 
TCCAGCAATCAATGGTCTTCTTTTAGAAGGTGCAGCGCCAAATGCTCAAG 
TCTTATTAATGCGTATTCCAGATAAAATTGATTCGGACAAATTTGGTGAA 
GCATATGCTAAAGCAATCACAGACGCTGTTAATCTAGGAGCAAAAACGAT 
TAATATGAGCCTTGGAAAAACAGCAGATTCTTTAATTGCTCTCAATGATA 
AAGTTAAATTAGCACTTAAATTAGCTTCTGAGAAGGGCGTTGCAGTTGTT 
GTGGCTGCCGGAAATGAAGGTGCATTTGGTATGGATTATAGCAAACCATT 
ATCAACTAATCCTGACTACGGTACGGTTAATAGTCCAGCTATTTCTGAAG 
ATACTTTGAGTGTTGCTAGCTATGAATCACTTAAAACTATCAGTGAGGTC 
GTTGAAACAACTATTGAAGGTAAGTTAGTTAAGTTGCCGATTGTGACTTC 
TAAACCTTtTGACAAAGGTAAGGCCTACGATGTGGTTTATGCCAATTATG 
GTGCAAAAAAAAGACTTTGAAGGTAAGGACTTTAAAGGTAAGATTGCATT 
AATTGAGCGTGGTGGTGGACTTGATTTTATGACTAAAATCACTCATGCTA 
CAAATGCAGGTGTTGTTGGTATCGTTATTTTTAACGATCAAGAAAAACGT 
GGAAATTTTCTAATTCCTTACCGTGAATTACCTGTGGGGGTTATTAGTAA 
AGTAGATGGCGAGCGTATAAAAAATACTTCAAGTCAGTTAACATTTAACC 
AGAGTTTTGAAGTAGTTGATAGCCAAGGTGGCAATCGTATGCTGGAACAA 
TCAAGTTGGGGCGTGACAGCTGAAGGAGCAATCAAGCCTGATGTAACAGC 
TTCTGGCTTTGAAATTTATTCTTCAACCTATAATAATCAATACCAAACAA 
TGTCTGGTACAAGTATGGCTTCACCACATGtTGCAGGATTAATGACAATG 
CTTCAAAGTCATTTGGCTGAGaAATATAAAGGGATGAATTTAGATTCTAA 
AAAATTGCTAGaATTGTCTAAAAACATcCTCATGAGCTCAGCAACAGCAT 
TATATAGTGAAGAGGATAAGGCGTTTTATTCACCACGTCAGCAAGGTGCA 
GGTGTAGTTGATGCTGAAAAAGCTATCCAAGCTCAATATTATGTTACTGG 
AAACGATGGCAAAGCTAAAATTAATCTCAAACGAGTGGGAGATAAATTTG 
ATATCACAGTTACAATTCATAAACTTGTAGAAGGTGTCAAAGAATTGTAT 
TATCAAGCTAATGTAGCAACAGAACAAGTAAATAAAGGTAAATTTGCCCT 
TaAACCaCAAGCCTTGCTAGATACTAATTGGCAGAAAGTAATTCTTcGTG 
ATAAAGAAACACAAGTTCGATTTACTAtTGATTCTAGTCAATTTAGTCAG 
AAATTAAAAGAACAGATGGCAAATGGTTATTTCTTAGAAGGTTTTGTACG 
TTTTAAAGAAGCCAAGGATAGTAATCAGGAGTTAATGAGTATTCCTTTTG 
TAGGATTTAATGGTGATTTTGCGAACTTACAAGCACTTGAAACACCGATT 
TATAAGACGCTTTCTAAAGGTAGTTTCTACTATAAACCAAATGATACAAC 
TCATAAAGACCAATTGGAGTACAATGAATCAGCTCCTTTTGAAAGCAACA 
ACTATACTGCCTTGTTAACACAATCAGCGTCTTGGGGCTATGTTGATTAT 
GTCAAAAATGGTGGGGAGTTAGAATTAGCACCGGAGAGTCCAAAAAGAAT 
TATTTTAGGAACTTTTGAGAATAAGGTTGAGGATAAAACAATTCATCTTT 
TGGAAAGAGATGCAGCGAATAATCCATATTTTGCCATTTCTCCAAATAAA 
GATGGAAATAGGGATGAAATCACTCCCCAGGCAACTTTCTTAAGAAATGT 
TAAGGATATTTCTGCTCAAGTTCTAGATCAAAATGGAAATGTTATTTGGC 
A7\AGTAAGGTTTTACCATCTTATCGTAAAAATTTCCATAATAATCCAAAG 
CAAAGTGATGGTCATTATCGTATGGATGCCCTTCAGTGGAGTGGTTTAGA 
TAAGGATGGCAAAGTTGTAGCAGATGGTTTTTATACTTATCGTTTACGTT 
ACACACCAGTAGCAGAAGGAGCAAATAGTCAGGAGTCAGACTTTAAAGTT 
CAAGTAAGTACTAAGTCACCAAATCTTCCTTCACGAGCTCAGTTTGATGA 
AACTAATCGAACATTAAGCTTAGCCATGCCTAAGGAAAGTAGTTATGTTC 
CTACATATCGTCTACAATTAGTTTTATCTCATGTTGTAAAAGATGAAGAA 
TATGGAGATGAGACTTCTTACCATTATTTCCATATAGATCGAGAAGGTAA 
AGTGACACTTCCTAAAACAGTTAAGATAGGAGAGAGTGAGGTTGCAGTAG 
ACCCTAAGACCTTGACACTTGTTGTGGAAGATAAAGCTGGTAATTTCGCA 
ACGGTAAAATTGTCTGACCTCTTGAATAAGGCAGTAGTATCAGAGAAAGA 
AAACGCTATAGTAATTTCTAACAATTTCAAATATTTTGATAACTTGAAAA 
AAGAACCTATGTTTATTTCTAAAGAAGGAAAAGTAGTAAACAAGAATCTA 
GAAGAAATAGCATTAGTTAAGCCGCAAACTACAGTTACTACTCAATCATT 
GTCTAAAGAAATAACTCAATCAGGAAATGAGAAAGTCCTCACTTCTACAA 
ACAATAATAGTAGCAGAGTAGCTAAGATCATATGACCTAAACATAACGGG 
GATTCTGTTAACCATACC 

SEQ ID NO. 4404 
STRAIN H36B 

GAGGAGCAAGAATTAAAAAACCAAGAGCAATCACCTGTAATTGC 
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TAATGTTGCTCAACAGCCATCGCCATCGGTAACTACTAATACTGTTGAAA 
AAACATCTGTAACATCTGCTTCTGCTAGTAATACAGCGAAAGAAATGGGT 
GATACATCTGTAAAAAATGACAAAACAGAAGATGAATTATTAGAAGAGTT 
ATCTAAAAACCTTGATACGTCTAATTTGGGGGCTGATCTTGAAGAAGAAT 
ATCCCTCTAAACCAGAGACAACCAACAATAAAGAAAGCAATGTAGTAACA 
AATGCTTCAACTGCAATAGCACAGAAaGTTCCCTCAGCATATGAAGAGGT 
GAAGCCAGAAAGCAAGTCATCACTTGCTGTTCTTGATACATCTAAAATAA 
CAAAATTGCAAGCCATAACCCAAAGAGGAAAGGGAAATGTAGTAGCTATT 
ATTGATACTGGCTTTGATATTAACCATGATATTTTTCGTTTAGATAGCCC 
AAAAGATGATAAGCACAGCTTTAAAACTAAGGCAGAATTTGAGGAATTAA 
AAGCAAAACATAATATCACTTATGGGAAATGGGTTAACGATAAGATTGTT 
TTTGCACATAACTACGCCAaCAATACAGAAACGGTGGCTGATATTGCAGC 
AGCTATGAAAGATGGTTATGGGTCAGAAGCAAAGAATATTTCGCATGGTA 
CACACGTTGCTGGTATTTTTGTAGGTAATAGTAAACGTCCAGCAATCAAT 
GGTCTTCTTTTAGAAGGTGCAGCGCCAAATGCTCAAGTCTTATTAATGCG 
TATTCCAGATAAAATTGATTCGGACAAATTTGGTGAAGCATATGCTAAAG 
CAATCACAGACGCTGTTAATCTAGGAGCAAAAACGATTAATATGAGCCTT 
GGAAAAACAGCAGATTCTTTAATTGCTCTCAATGATAAAGTTAAATTAGC 
ACTTAAATTAGCTTCTGAGAAGGGCGTTGCAGTTGTTGTGGCTGCCGGAA 
ATGAAGGTGCATTTGGTATGGATTATAGCAAACCATTATCAACTAATCCT 
GACTACGGTACGGTTAATAGTCCAGCTATTTCTGAAGATACTTTGAGTGT 
TGCTAGCTATGAATCACTTAAAACTATCAGTGAGGTCGTTGAAACAACTA 
TTGAAGGTAAGTTAGTTAAGTTGCCGATTGTGACTTCTAAACCTTtTGAC 
AAAGGTAAGGCCTACGATGTGGTTTATGCCAATTATGGTGCAAAAAAAGA 
CTTTGAAGGTAAGGACTTTAAAGGTAAGATTGCATTAATTGAGCGTGGTG 
GTGGACTTGATTTTATGACTAAAATCACTCATGCTACAAATGCAGGTGTT 
GTTGGTATCGTTATTTTTAACGATCAAGAAAAACGTGGAAATTTTCTAAT 
TCCTTACCGTGAATTACCTGTGGGGGTTATTAGTAAAGTAGATGGCGAGC 
GTATAAAAAATACTTCAAGTCAGTTAACATTTAACCAGAGTTTTGAAGTA 
GTTGATAGCCAAGGTGGCAATCGTATGCTGGAACAATCAAGTTGGGGCGT 
GACAGCTGAAGGAGCAATCAAGCCTGATGTAACAGCTTCTGGCTTTGAAA 
TTTATTCTTCAACCTATAATAATCAATACCAAACAATGTCTGGTACAAGT 
ATGGCTTCACCACATGTTGCAGGATTAATGACAATGCTTCAAAGTCATTT 
GGCTGAGAAATATAAAGGGATGAATTTAGATTCTAAAAAATTGCTAGAAT 
TGTCTAAAAACATCCTCATGAGCTCAGCAACAGCATTATATAGTGAAGAG 
GATAAGGCGTTTTATTCACCACGTCAGCAAGGTGCAGGTGTAGTTGATGC 
TGAAAAAGCTATCCAAGCTCAATATTATGTTACTGGAAACGATGGCAAAG 
CTAAAATTAATCTCAAACGAGTGGGAGATAAATTTGATATCACAGTTACA 
ATTCATAAACTTGTAGAAGGTGTCAAAGAATTGTATTATCAAGCTAATGT 
AGCAACAGAACAAGTAAATAAAGGTAAATTTGCCCTTAAACCaCAAGCCT 
TGCTAGATACTAATTGGCAGAAAGTAATTCTTCGTGATAAAGAAACACAA 
GTTCGATTTACTATTGATTCTAGTCAATTTAGTCAGAAATTAAAAGAACA 
GATGGCAAATGGTTATTTCTTAGAAGGTTTTGtACGTTTTAAAGAAGCCA 
AGGATAGTAATCAGGAGTTAATGAGTATTCCTTTTGTAGGATTTAATGGT 
GATTTTGCGAACTtACAAGCACTTGAAACACCGATTTATAAGACGCTTTC 
TAAAGGTAGTTTCTACTATAAACCAAATGATACAACTCATAAAGACCAAT 
TGGAGTACAATGAATCAGCTCCTTTTGAAAGCAACAACTATACTGCCTTG 
TTAACACAATCAGCGTCTTGGGGCTATGTTGATTATGTCAAAAATGGTGG 
GGAGTTAgAATTAgCACCGGAGAGTCCAAAAAGAATTATTTTAGGAACTT 
TTGAGAATAAGGTTGAGGATAAAACAATTCATCTTTTGGAAAGAGATGCA 
GCGAATAATCCATATTTTGCCATTTCTCCAAATAAAGATGGAAATAGGGA 
TGAAATCACTCCCCAGGCAACTTTCTTAAGAAATGTTAAGGATATTTCTG 
CTCAAGTTCTAGATCAAAATGGAAATGTTATTTGGCAAAGTAAGGTTTTA 
CCATCTTATCGTAAAAATTTCCATAATAATCCAAAGCAAAGTGATGGTCA 
TTATCGTATGGATGCCCTTCAGTGGAGTGGTTTAGATAAGGATGGCAAAG 
TTGTAGCAGATGGTTTTTATACTTATCGTTTACGTTACACACCAGTAGCA 
GAAGGAGCAAATAGTCAGGAGTCAGACTTTAAAGTTCAAGTAAGTACTAA 
GTCACCAAATCTTCCTTCACGAGCTCAGTTTGATGAAACTAATCGT^ACAT 
TAAGCTTAGCCATGCCTAAGGAAAGTAGTTATGTTCCTACATATCGTCTA 
CAATTAGTTTTATCTCATGTTGTAAAAGATGAAGAATATGGAGATGAGAC 
TTCTTACCATTATTTCCATATAGATCAAGAAGGTAAAGTGACACTTCCTA 
AAACAGTTAAGATAGGAGAGAGTGAGGTTGCAGTAGACCCTAAGACCTTG 
ACACTTGTTGTGGAAGATAAAGCTGGTAATTTCGCAACGGTAAAATTGTC 
TGACCTCTTGAATAAGGCAGTAGTATCAGAGAAAGAAAACGCTATAGTAA 
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TTTCTAACAATTTCAAATATTTTGATAACTTGAAAAAAGAACCTATGTTT 
ATTTCTAAAGAAGGAAAAGTAGTAAACAAGAATCTAGAAGAAATAGC^TT 
AGTTAAGCCGCAAACTACAGTTACTACTCAATCATTGTCTAAAGAAATAA 
CTCAATCAGGAAATGAGAAAGTCCTCACTTCTACAAACAATAATAGTAGC 
AGAGTAGCTAAGATCATATCACCTAAACATAACGGGGATTCTGTTAACCA 
TACC 

SEQ ID NO. 4405 
STRAIN 18RS21 

GAGGAGCAAGAATTAAAAAACCAAGAGCAATCACC 

TGTAATTGCTAATGTTGCTCAACAGCCATCGCCATCGGTAACTACTAATA 
CTGTTGAAAAAACATCTGTAACAGCTGCTTCTGCTAGTAATACAGCGAAA 
GAAATGGGTGATACATCTGTAAAAAATGACAAAACAGAAGATGAATTATT 
AGAAGAGTTATCTAAAAACCTTGATACGTCTAATTTGGGGGCTGATCTTG 
AAGAAGAATATCCCTCTAAACCAGAGACAACCAACAATAAAGAAAGCAAT 
GTAGTAACAAATGCTTCAACTGCAATAGCACAGAAAGTTCCCTCAGCATA 
TGAAGAGGTGAAGCCAGAAAGCAAGTCATCGCTTGCTGTTCTTGATACAT 
CTAAAATAACAAAATTACAAGCCATAACCCAAAGAGGAAAGGGAAATGTA 
GTAGCTATTATTGATACTGGCTTTGATATTAACCATGATATTTTTCGTTT 
AGATAGCCCAAAAGATGATAAGCACAGCTTTAAAACTAAGACAGAATTTG 
AGGAATTAAAAGCAAAACATAATATCACTTATGGGAAATGGGTTAACGAT 
AAGATTGTTTTTGCACATAACTACGCCAACAATACAGAAACGGTGGCTGA 
TATTGCAGCAGCTATGAAAGATGGTTATGGTTCAGAAGCAAAGAATATTT 
CGCATGGTACACACGTTGCTGGTATTTTTGTAGGTAATAGTAAACGTCCA 
GCAATCAATGGTCTTCTTTTAGAAGGTGCAGCGCCAAATGCTCAAGTCTT 
ATTAATGCGTATTCCAGATAAAATTGATTCGGACAAATTTGGTGAAGCAT 
ATGCTAAAGCAATCACAGACGCTGTTAATCTAGGAGCAAAAACGATTAAT 
ATGAGTATTGGAAAAACAGCTGATTCTTTAATTGCTCTCAATGATAAAGT 
TAAATTAGCACTTAAATTAGCTTCTGAGAAGGGCGTTGCAGTTGTTGTGG 
CTGCCGGAAATGAAGGCGCATTTGGTATGGATTATAGCAAACCATTATCA 
ACTAATCcTGACTACGGTACGGTTAATAGTCCAGCTATTTCTGAAGATAC 
TTTGAGTGTTGCTAGCTATGAATCACTTAAAACTATCAGTGAGGTCGTTG 
AAACAACTATTGAAGGTAAGTTAGTTAAGTTGCCGATTGTGACTTCTAAA 
CCTTTTGACAAAGGTAAGGCCTACGATGTGGTTTATGCCAATTATGGTGC 
AAAAAAAGACTTTGAAGGTAAGGACTTTAAAGGTAAGATTGCATTAATTG 
AGCGTGGTGGTGGACTTGATTTTATGACTAAAATCACTCATGCTACAAAT 
GCAGGTGTTGTTGGTATCGTTATTTTTAACGATCAAGAAAAACGTGGAAA 
TTTTCTAATTCCTTACCGTGAATTACCTGTGGGGATTATTAgTAAAGTAG 
ATGGCGAGCGTATAAAAAATACTTCAAGTCAGTTAACATTtAACCAgAGT 
TTTGAAGtAGTTGATAGCCAAGGTGGtAATCGTaTGCTGGAACAATCAAG 
TTGGGGCGTGACAGCTGAAGGAGCAATCAAGCCTGATGTAACAGCTTCTG 
GCTTTGAAATTTATTCTTCAACCTATAATAATCAATACCAAaCAATGTCT 
GGTACAAGTATGGCTTCACCACATGTTGCAGGATTAATGACAATGCTTCA 
AAGTCATTTGGCTGAGAAATATAAAGGGATGAATTTAGATTCTAAAAAAT 
TGCTAGAATTGTCTAAAAACATCCTCATGAGCTCAGCAACAGCATTATAT 
AGTGAAGAGGATAAGGCGTTTTATTCACCACGTCAGCAAGGTGCAGGTGT 
AGTTGATGCTGAAAAAGCTATCCAAGCTCaATATTATATTACTGGAAACG 
ATGGCAaAGCTAAAATTAATCTCAAACGAATGGGAGATAAATTTGATATC 
ACAGTTACAATTCATaAACTTGTAGAAGGTGTCAAAGAATTGTATTATCA 
AGCTAATGTAGCAACAGAACAAGTAAATAAAGGTAAATTTGCCCTTaAAC 
CACAAGCCTTGCTAGATACTAATTGGCAGAAAGTAATTCTTcGTGATAAA 
GAAACACAAGTTCGATTTACTATTGATGCTAGTCAATTTAGTCAGAAATT 
AAAAGAACAGATGGCAAATGGTTATTTCTTAgAAGGTTTTGTACGTTTTA 
AAGAAGCCAAGGATAGTAATCAGGAGTTAATGAGTATTCCTTTTGTAGGA 
TTTAATGGTGATTTTGCGAACTTACAAGCACTTGAAACACCGATTTATAA 
GACGATTTCTAAAGGTAGTTTCTACTATAAACCAAATGATACAACTCATA 
AAGACCAATTGGAGTACAATGAATCAGCTCCTTTTGAAAGCAACAACTAT 
ACTGCCTTGTTAACACAATCAGCGTCTTGGGGCTATGTTGATTATGTCAA 
AAATGGTGGGGAGTTAGAATTAGCaCCGGAGAGTCCAAAAAGAATTATTT 
TAGGAACTTTTGAGAATAAGGTTGAGGATAAAACAATTCATCTTTTGGAA 
AGAGATGCAGCGAATAATCCATATTTTGCCATTTCTCCAAATAAAGATGG 
AAATAGGGACGAAATCACTCCCCAGGCAACtTTCTTAAGAAATGTTAAGG 
ATATTTCTGCTCAAGTTCTAGATCAAAATGGAAATGTTATTTGGCAAAGT 
AAGGTTTTACCATCTTATCGTAAAAATTTCCATAATAATCCAAAGCAAAG 
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TGATGGTCATTATCGTATGGATGCTCTTCAGTGGAGTGGTTTAGATAAGG 
ATGGCAAAGTTGTAGCAGATGGTTTTTATACTTATCGCTTACGTTACACA 
CCAGTAGCAGAAGGAGCAAATAGTCAGGAGTCAGACTTTAAAGTACAAGT 
AAGTACTAAGTCACCAAATCTTCCTTCACGAGCTCAGTTTGATGAAACTA 
ATCGAACATTAAGCTTAGCCATGCCTAAGGAAAGTAGTTATGTTCCTACA 
TATCGTTTACAATTAGTTTTATCTCATGTTGTAAAAGATGAAGAATATGG 
GGATGAGACTTCTTACCATTATTTCCATATAGATCAAGAAGGTAAAGTGA 
CACTTCCTAAAACGGTTAAGATAGGAGAGAGTGAGGTTGCGGTAGACCCT 
AAGGCCTTGACACTTGTTGTGGAAGATAAAGCTGGTAATTTCGcAACGGT 
AAAATTGTCTGATCTCTTGAATAAGGCAGTAGTATCAGAGAAAGAAAACG 
CTATAGTAATTTCTAACAGTTTCAAATATTTTGATAACTTGAAAAAAGAA 
CCTATGTTTATTTCTAAAAAAGAAAAAGTAGTAAACAAGAATCTAGAAGA 
AATAATATTAGTTAAGCCGCAAACTACAGTTACTACTCAATCATTGTCTA 
AAGAAATAACTAAATCAGGAAATGAGAAAGTCCTCACTTCTACAAACAAT 
AATAGTAGCAGAGTAGCTAAGATCATATCACCTAAACATAACGGGGATTC 
TGTTAACCATACC 

SEQ ID NO. 4406 
STRAIN M732 

GAGGAGCAAGAATTAAAAAACCAAGAGCAATCACCT 

GTAATTGCTAATGTTGCTCAACAGCCATCGCCATCGGT7UVCTACTAATAT 
TGTTGAAAAAACATCTGTAACAGCTGCTTCTGCTAGTAATACAGTGAAAG 
AAATGGGTGATACATCTGTAAAAAATGACAAAACAGAAGATGAATTATTA 
GAAGAGTTATCTAAAAACCTTGATACGTCTAATTTGGGGGCTGATCTTGA 
AGAAGAATATCCCTCTAAACCAGAGACAACCAACAATAAAGAAAGCAATG 
TAGTAACAAATGCTTCAACTGCAATAGCACAGAAAGTTCCCTCAGCATAT 
GAAGAGGTGAAGTCAGAAAGCAAGTCATCGCTTGCTGTTCTTGATACATC 
TAAAATAACAAAATTACAAGCCACAACCCAAAGAGGAAAGGGAAATGTAG 
TAGCTATTATTGATACTGGCTTTGATATTAACCATGATATTTTTCGTTTA 
GATAGCCCAAAAGATGATAAGCACAGCTTTAAAACTAAGGCAGAATTTGA 
GGAATTAAAAGCAAAACATAATATCACTTATGGGAAATGGGTTAACGATA 
AGATTGTTTTTGCACATAACTACGCCAACAATACAGAAACGGTGGCTGAT 
ATTGCAGCAGCTATGAAAGATGGTTATGGGTCAGAAGCAAAGAATATTTT 
GCATGGTACACACGTTGCTGGTATTTTTGTAGGTAATAGTAAACGTCCAG 
CAATCAATAGTCTTCTTTTAGAAGGTGCAGCGCCAAATGCTCAAGTCTTA 
TTAATGCGTATTCCAGATAAAATTGATTCGGACAAATTTGGAGAAGCATA 
TGCTAAAGCAATCATAGACGCTGTTAATCTAGGAGCAAAAACGATTAATA 
TGAGCCTGGGAAAAACGGCTGATTCTTTAATTGCTCTCAATGATAAAGTT 
AAATTAGCACTTAAATTAGCTTCTGAGAAGGGCGTTGCAGTTGTTGTGGC 
TGCCGGAAATGAAGGTGCATTTGGTATGGATTATAGCAAACCATTATCAA 
CTAATCCTGACTACGGTACGGTTAATAGTCCAGCTATTTCTGAAGATACT 
TTGAGTGTTGCTAGCTATGAATCACTTAAAACTATCAGTGAGGTCGTTGA 
AACAACTATTGAAGGTAAGTTAGTTAAGTTGCCGATTGTGACTTCTAAAC 
CTTtTGACAAAGGTAAGGCCTACGATGTGGTTTATGCCAATTATGGTGCA 
AAAAAGATTTTGAAGGTAAGGACTTTAAAGGTAAGATTGCATTAATTGAG 
CGTGGTGGTGGACTTGATTTTATGACTAAAATCACTCATGCTACAAATGC 
AGGTGTTGTTGGTATCGTTATTTTTAACGATCAAGAAAAACGTGGAAATT 
TTCTAATTCCTTACCGTGAATTACCTGTGGGGGTTATTAGTAAAGTAGAT 
GGCGAGCGTATAAAAAATACTTCAAGTCAGTTAACATTTAACCAGAGTTT 
TGAAGTAGTTGATAGCCAAGGTGGCAATCGTATGCTGGAACAATCAAGTT 
GGGGCGTGACAGCTGAAGGAGCAATCAAGCCTGATGTAACAGCTTCTGGC 
TTTGAAATTTATTCTTCAACCTATAATAATCAATACTAAACAATGTCTGG 
TACAAGTATGGCTTCACCACATGTTGCAGGATTAATGACAATGCTTCAAA 
GTCATTTGGCTGAGAAATATAAAGGGATGAATTTAGATTCTAAAAAATTG 
CTAGAATTGTCTAAAAACATCCTCATGAGCTCAGCAACAGCATTATATAG 
TGAAGAGGATAAGGCGTTTTATTCACCACGTCAGCAAGGTGCAGGTGTAG 
TTGATGCTGAAAAAGCTATCCAAGCTCAATATTATGTTACTGGAAACGAT 
GGCAAAGTTAAAATTAATCTCAAACGAGAGGGAGATAAATTTGATATCAC 
AGTTACAATTCATaAACTTGTAGAAGGTGTCAAAGAATTGTATTATCAAG 
CTAATGTAGC AACAGAa CAAGTAAATAAAGGTAAATTTGCCCTT aAACCA 
CAAGCCTTGCTAGATACTAATTGGCAGAAAGTAATTCTTCGTGATAAAGA 
AACACAAGTTCGATTTACTATTGATGCTAGTCAATTTAGTCAGAAATTAA 
AAGAACAGATGGCAAATGGTTATTTCTTAGAAGGTTTTGTACGTTTTAAA 
GAAGCCAAGGATAGTAATCAGGAGTTAATGAGTATTCCTTTTGTAGGATT 
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TAATGGTGATTTTGCGAACTTACAAGCACTTGAAACaCCGATTTATAAGA 
CGCTTTCTAAAGGTAGTTTCTACTATAAACCAAATGATACAACTCATAAA 
GACCAATTGGAGTACAATGAATCAGCTCCTTTTGAAAGCAACAACTATAC 
TGCCTTGTTAACACAATCAGCGTCTTGGGGCTATGTTGATTATGTCAAAA 
ATGGTGGGGAGTTAGAATTAGCACCGGAGAGTCCAAAAAGAATTATTTTA 
GGAACTTTTGAGAATAAGGTTGAGGATAAAACAATTCATCTTTTGGAAAG 
AGATGCAGCGAATAATCCATATTTTGCCATTTCTCCAAATAAAGATGGAA 
ATAGGGACGAAATCACTCCCCAGGCAACTTTCTTAAGAAATGTTAAGGAT 
ATTTCTGCTCAAGTTCTAGATCAAAATGGAAATGTTATTTGGCAAAGTAA 
GGTTTTACCATCTTATCGTAAAAATTTCCATAATAATCCAAAGCAAAGTG 
ATGGTCATTATCGTATGGATGCTCTTCAGTGGAGTGGTTTAGATAAGGAT 
GGCAAAGTTGTAGCAGATGGTTTTTATACTTATCGCTTACGTTACACACC 
AGTAGCAGAAGGAGCaAATAGTCAGGAGTCAGACTTTAAAGTTCAAGTAA 
GTACTAAGTCACCAAATCTTCCTTCACGAGCTCAGTTTGATGAAACTAAT 
CGAACATTAAGCTTAGCCATGCCTAAGGAAAGTAGTTATGTTCCTACATA 
TCGTTTACAATTAGTTTTATCTCATGTTGTAAAAGATGAAGAATATGGGG 
ATGAGACTTCTTACCATTATTTCCATATAGATCAAGAAGGTAAAGTGACA 
CTTCCTAAAACGGTTAAGATAGGAGAGAGTGAGGTTGCGGTAGACCCTAA 
GGCCTTGACACTTGTTGTGGAAGATAAAGCTGGTAATTTTGCAACGGTAA 
AATTGTCTGACCTCTTGAATAAGGCAGTAGTATCAGAGAAAGaAAACGCT 
ATAGTAATTTCTAACAGTTTCAAATATTTTGATAACTTGAAGAAAGAACC 
TATGTTTATTTCTAAAGAAGGAAAAGTAGTAAACAAGAATCTAGAAGAAA 
TAACATTAGTTAAGCCTCAAACTACAGTTACTACTCAATCATTGTCTAAA 
GAAATAACTAAATCAGGAAATGAGAAAGTCCT CACTT CTACAAAC AATAA 
TAGTAGCAGAGTAGCTAAGATCATATCACCTAAACATAACGGGGATTCTG 
TTAACCATACC 

SEQ ID NO. 4407 
STRAIN COH1 

GAGGAGCAAGAATTAAAAAACCAAGAGCAAT CACCTGT 

AATTGCTAATGTTGCTCAACAGCCATCGCGATCGGTaACTACTAATATTG 

TTGAAAAAACATCTGTAACAGCTGCTTCTGCTAGTAATACAGTGAAAGAA 

ATGGGtgATACATCTGTAAAAAATGACAAAACAGAAGATGAATTATTAGA 

AGAGTTATCTAAAAACCTTGATACGTCTAATTTGGGGGCTGATCTTGAAG 

AAGAATATCCCTCTAAACCAGAGaCAACCAACAATAAAGAAAGCAATGTA 

GTAACAAATGCTTCAACTGCAATAGCACAGAAAGTTCCCTCAGCATATGA 

AGAGGTGAAGTCAGAAAGCAAGTCATCGCTTGCTGTTCTTGATACATCTA 

AAATAACAAAATTACAAGCCACAACCCAAAGAGGAAAGGGAAATGTAGTA 

GCTATTATTGATACTGGCTTTGATATTAACCATGATATTTTTCGTTTAGA 

TAGCCCAAAAGATGATAAGCACAGCTTTAAAACTAAGGCAGAATTTGAGG 

AAtTAAAAGCAAAACATAATATCACTTATGGGAAATGGGTTAACGATAAG 

ATTGTTTTTGCACATAACTACGCCAaCAATACAGAAACGGTGGCTGATAT 

TGCAGCAGCTATGAAAGATGGTTATGGGTCAGAAGCAAAGAATATTTTGC 

ATGGTACACACGTTGCTGGTATTTTTGTAGGTAATAGTAAACGTCCAGCA 

ATCAATAGTCTTCTTTTAGAAGGTGCAGCGCCAAATGCTCAAGTCTTATT 

AATGCGTATTCCAGATAAAATTGATTCGGACAAATTTGGAGAAGCATATG 

CTAAAGCAATCATAGACGCTGTTAATCTAGGAGCAAAAACGATTAATATG 

AGCCTGGGAAAAACGGCTGATTCTTTAATTGCTCTCAATGATAAAGTTAA 

ATTAGCACTTAAATTAGCTTCTGAGAAGGGCGTTGCAGTTGTTGTGGCTG 

CCGGAAATGAAGGTGCATTTGGTATGGATTATAGCAAACCATTATCAACT 

AATCCTGACTACGGTACGGTTAATAGTCCAGCTATTTCTGAAGATACTTT 

GAGTGTTGCTAGCTATGAATCACTTAAAACTATCAGTGAGGTCGTTGAAA 

CAACTATTGAAGGTAAGTTAGTTAAGTTGCCGATTGTGACTTCTAAACCT 

TtTGACAAAGGTAAGGCCTACGATGTGGTTTATGCCAATTATGGTGCAAA 

AAAGATTTTGAAGGTAAGGACTTTAAAGGTAAGATTGCATTAATTGAGCG 

TGGTGGTGGACTTGATTTTATGACTAAAATCACTCATGCTACAAATGCAG 

GTGTTGTTGGTATCGTTATTTTTAACGATCAAGAAAAACGTGGAAATTTT 

CTAATTCCTTACCGTGAATTACCTGTGGGGGTTATTAGTAAAGTAGATGG 

CGAGCGTATAAAAAATACTTCAAGTCAGTTAACATTTAACCAGAGTTTTG 

AAGTAGTTGATAGCCAAGGTGGCAATCGTATGCTGGAACAATCAAGTTGG 

GGCGTGACAGCTGAAGGAGCAATCAAGCCTGATGTAACAGCTTCTGGCTT 

TGAaATTTATTCTTCAACCTATAATAATCAATACTAAACAATGTCTGGTA 

CAAGTATGGCTTCACCACATGTTGCAGGATTAATGACAATGCTTCAAAGT 

CATTTGGCTGAGAAATATAAAGGGATGAATTTAGATTCTAaAAAATTGCT 
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AGaATTGTCTAaaAACATCCTCATGAGCTCAGCAACAGCATTATATAGTG 

AAGAGGATAAGGCGTTTTATTCACCACGTCAGCAAGGTGCAGGTGTAGTT 

GATGCTGAAAAAGCTATCCAAGCTCAATATTATGTTACTGGAAACGATGG 

CAAAGTTAAAATTAATCTCAAACGAGAGGGAGATAAATTTGATATCACAG 

TTACAATTCATaAACTTGTAGAAGGTGTCAAAGAATTGTATTATCAAGCT 

AATGTAGCAaCAGAACAAGTAAATAAAGGTAAATTTGCCCTTAAACCACA 

AGCCTTGCTAGATACTAATTGGCAGAAAGTAATTCTTcGTGATAAAGAAA 

CACAAGTTCGATTTACTATTGATGCTAGTCAATTTAGTCAGAAATTAAAA 

GAACAGATGGCAAATGGTTATTTCTTAGAAGGTTTTGTACGTTTTAAAGA 

AGCCAAGGATAGTAATCAGGAGTTAATGAGTATTCCTTTTGTAGGATTTA 

ATGGTGATTTTGCGAACTTACAAGCACTTGAAACACCGATTTATAAGACG 

CTTTCTAAAGGTAGTTTCTACTATAAACCAAATGATACAACTCATAAAGA 

CCAATTGGAGTACAATGAATCAGCTCCTTTTGAAAGCAACAACTATACTG 

CCTTGTTAACACAATCAGCGTCTTGGGGCTATGTTGATTATGTCAAAAAT 

GGTGGGGAGTTAGAATTAGCACCGGAGAGTCCAAAAAGAATTATTTTAGG 

aACTTTTGAGAATAAGGTTGAGGATAAAACAATTCATCTTTTGGAAAGAG 

ATGCAGCGAATAATCCATATTTTGCCATTTCTCCAAATAAAGATGGAAAT 

AGGGACGAAATCACTCCCCAGGCaACTTTCTTAAGAAATGTTAAGGATAT 

TTCTGCTCAAGtTCTAGATCAAAATGGAAATGTTATTTGGCAAAGTAAGG 

TTTTACCATCTTATCGTAAAAATTTCCATAATaATCCAAAGCAAAGTGAT 

GGTCATTATCGTATGGATGCTCTTCAGTGGAGTGGTTTAgATAAGGATGG 

CAAAGTTGTAgCAGATGGtTTTTATACTTATCGCTTACGTTACACACCAG 

TAGCAGAAGGAGCAAATAGTCAGGAGTCAGACTTTaAAGTTCAAGTAAGT 

AcTAAGTCACCAAATCTTCCTTCACGAGCTCAGTTTGATGaAACTAATCG 

AACATTAAGCTTAGCCATGCCTAAGGAAAGTAGTTATGTTCCTACATATC 

GTTTACAATTAGTTTTATCTCATGTTGTAAAAGATGAAGAATATGGGGAT 

GAGACTTCTTACCATTATTTCCATATAGATCAAGAAGGTAAAGTGACACT 

TCCTAAAACGGTTAAGATAGGAGAGAGTGAGGTTGCGGTAGACCCTAAGG 

CCTTGACACTTGTTGTGGAAGATAAAGCTGGTAATTTTGCAACGGTAAAA 

TTGTCTGACCTCTTGAATAAGGCAGTAGTATCAGAGAAAGAAAACGCTAT 

AGTAATTTCTAACAGTTTCAAATATTTTGATAACTTGAAGAAAGAACCTA 

TGTTTATTTCTAAAGAAGGAAAAGTAGTAAACAAGAATCTAGAAGAAATA 

ACATTAGTTAAGCCTCAAACTACAGTTACTACTCAATCATTGTCTAAAGA 

AATAACTAAATCAGGAAATGAGAAAGTCCTCACTTCTACAAACAATAATA 

GTAGCAGAGTAGCTAAGATCATATCACCTAAACATAACGGGGATTCTGTT 
AACCATACC 

SEQ ID NO. 4408 
STRAIN M781 

GAGGAGCAAGAATTAAAAAACCAAGAGCAATCACCTGT 

AATTGCTAATGTTGCTCAACAGCCATCGCCATCGGTAACTACTAATATTG 

TTGAAAAAACATCTGTAACAGCTGCTTCTGCTAGTAATACAGTGAAAGAA 

ATGGGTGATACATCTGTAAAAAATGACAAAACAGAAGATGAATTATTAGA 

AGAGTTATCTAAAAACCTTGATACGTCTAATTTGGGGGCTGATCTTGAAG 

AAGAATATCCCTCTAAACCAGAGACAACCAACAATAAAGAAAGCAATGTA 

GTAACAAATGCTTCAACTGCAATAGCACAGAAAGTTCCCTCAGCATATGA 

AGAGGTGAAGT C AGAAAGCAAGTCATCGCTTGCTGTTCTTGATACAT CTA 

AAATAACAAAATTACAAGCCACAACCCAAAGAGGAAAGGGAAATGTAGTA 

GCTATTATTGATACTGGCTTTGATATTAACCATGATATTTTTCGTTTAGA 

TAGCCCAAAAGATGATAAGCACAGCTTTAAAACTAAGGCAGAATTTGAGG 

AATTAAAAGCAAAACATAATATCACTTATGGGAAATGGGTTAACGATAAG 

ATTGTTTTTGCACATAACTACGCCAaCAATACAGAAACGGTGGCTGATAT 

TGCAGCAGCTATGAAAGATGGTTATGGGTCAGAAGCAAAGAATATTTTGC 

ATGGTACACACGTTGCTGGTATTTTTGTAGGTAATAGTAAACGTCCAGCA 

ATCAATAGTCTTCTTTTAGAAGGTGCAGCGCCAAATGCTCAAGTCTTATT 

AATGCGTATTCCAGATAAAATTGATTCGGACAAATTTGGAGAAGCATATG 

CTAAAGCAATCATAGACGCTGTTAATCTAGGAGCAAAAACGATTAATATG 

AGCCTGGGAAAAACGGCTGATTCTTTAATTGCTCTCAATGATAAAGTTAA 

ATTAGCACTTAAATTAGCTTCTGAGAAGGGCGTTGCAGTTGTTGTGGCTG 

CCGGAAATGAAGGTGCATTTGGTATGGATTATAGCAAaCCATTATCAaCT 

AATCCTGACTACGGTACGGTTAATAGTCCAGCTATTTCTGAAGATACTTT 

GAGTGTTGCTAGCTATGAATCACTtAAAACTATCAGTGAGGTCGTTGAAA 

CAACTATTGAAGGTAAGTTAGTTAAGTTGCCGATTGTGACtTCTAaACCT 

TTTGACAAAGGTAAGGCCTACGATGTGGTTTATGCCAATTATGGTGCAAA 
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AAAGATTTTGAAGGTAAGGACTTTAAAGGTAAGATTGCATTAATTGAGCG 
TGGTGGTGGACTTGATTTTATGACTAAAATCACTCATGCTACAAATGCAG 
GTGTTGTTGGTATCGTTATTTTTAACGATCAAGAAAAACGTGGAAATTTT 
cTAATTCCTTACCGTGAATTACCTGTGgGGGTTATTAGTAAAGTAGATGG 
CGAGCGTATAAAAAATACTTCAAGTCAGTTAACATTTAACCAGAGTTTTg 
AAGTAGTTGATAGCCAAGGTGGCAATCGTATGCTGGAACAATCAAGTTGG 
GGCGTGACAGCTGAAGGAGCAATCAAGCCTGATGTAACAGCTTCTGGCTT 
TGAAATTTATTCTTCAACCTATAATAATCAATACTAAACAATGTCTGGTA 
CAAGTATGGCTTCACCACATGTTGCAGGATTAATGACAATGCTTCAAAGT 
CATTTGGCTGAGAAATATAAAGGGATGAATTTAGATTCTAAAAAATTGCT 
AGAATTGTCTAAAAACATCCTCATGAGCTCAGCAACAGCATTATATAGTG 
AAGAGGATAAGGCGTTTTATTCACCACGTCAGCAAGGTGCAGGTGTAGTT 
GATGCTGAAAAAGCTATCCAAGCTCAATATTATGTTACTGGAAACGATGG 
CAAAGTTAAAATTAATCTCAAACGAGAGGGAGATAAATTTGATATCACAG 
TTACAATTCAT a aACTTGTAgAAGGTGTCAAAGAATTGTATTATCAAGCT 
AATGTAGCaaCAGAACAAGTAAATAaAGGTAAATTTGCCCTTaAaCCaCA 
AGCCTTGCTAGATACTAATTGGCAGAaAGTaATTCTTcGTGATAAAGAAA 
CACAAGTTcGATTTACTAtTGATGCTAGTCAATTTAGTCAGAAATTAAAA 
GAACAGATGGCAAATGGTTATTTCTTAGAAGGTTTTGTACGTTTTAAAGA 
AGCCAAGGATAGTAATCAGGAGTTAATGAGTATTCCTTTTGTAGGATTTA 
ATGGTGATTTTGCGAACTtACAAGCACTTGAAACACCGATTTATAAGACG 
CTTTCTAAAGGTAGTTTCTACTATAAaCCAAATGATACAACTCATAAAGA 
CCAATTGGAGTACAATGAATCAGCTCCTTTTGAAAGCAACAACTATACTG 
CCTTGTTAACACAATCAGCGTCTTGGGGCTATGTTGATTATGTCAAAAAT 
GGTGGGGAGTTAGAATTAGCACCGGAGAGTCCAAAAAGAATTATTTTAGG 
AACTTTTGAGAATAAGGTTGAGGATAAAACAATTCATCTTTTGGAAAGAG 
ATGCAGCGAATAATCCATATTTTGCCATTTCTCCAAATAAAGATGGAAAT 
AGGGACGaaATCACTCCCCAGGCaACtTTCTTAAGAAATGTTAAGGATAT 
TTCTGCTCAAGtTCTAGATCAAAATGGAAATGTTATTTGGCAAAGTAAGG 
TTTTACCATCTTATCGTAAAAATTTCCATAATaATCCAAAGCAAAGTGAT 
GGTCATTATCGTATGGATGCTCTTCAGTGGAGTGGTTTAGATAAGGATGG 
CAAAGTTGTAGCAGATGGTTTTTATACTTATCGCTTACGTTACACACCAG 
TAGCAGAAGGAGGAAATAGTCAGGAGTCAGACTTTAAAGTTCAAGTAAGT 
ACTAAGTCACCAAATCTTCCTTCACGAGCTCAGTTTGATGAAACTAATCG 
AACATTAAGCTTAGCCATGCCTAAGGAAAGTAGTTATGTTCCTACAtATC 
GTTTACAATTAGTTTTATCTCATGTTGTAAAAGATGAAGAATATGGGGAT 
GAGACTTCTTACCATTATTTCCATATAGATCAAGAAGGTAAAGTGACACT 
TCCTAAAACGGTTAAGATAGGAGAGAGTGAGGTTGCGGTAGACCCTAAGG 
CCTTGACACTTGTTGTGGAAGATAAAGCTGGTAATTTTGCAACGGTAAAA 
TTGTCTGACCTCTTGAATAAGGCAGTAGTATCAGAGAAAGAAAACGCTAT 
AGTAATTTCTAACAGTTTCAAATATTTTGATAACTTGAAGAAAGAACCTA 
TGTTTATTTCTAAAGAAGGAAAAGTAGTAAACAAGAATCTAGAAGAAATA 
ACATTAGTTAAGCCTCAAACTACAGTTACTACTCAATCATTGTCTAAAGA 
AATAACTAAATCAGGAAATGAGAAAGTCCTCACTTCTACAAACAATAATA 
GTAGCAGAGTAGCTAAGATCATATCACCTAAACATAACGGGGATTCTGTT 
AACCATACC 

SEQ ID NO. 4409 
STRAIN CJB110 

GAGGAGCAAGAATTAAAAAACCAAGAGCAATCACCTGTAA 

TTGCTAATGTTGCTCAACAGCCATCGCCATCGGTAACTACTAATATTGTT 

GAAAAAACATCTGTAnCAGCTGCTTCTGCTAGTAATACAGCGAAAGAAAT 

GGGTGATACATCTGTAAAAAATGACAAAACAGAAGATGAATTATTAGAAG 

AGTTATCTAAAAACCTTGATACGTCTAATwTGGGGGCTGATCTTGAAGAA 

GAATATCCCTCTAAACCAGAGACAACCAACAATAAAGAAAGCAATGTAGT 

AACAAATGCTTCAACTGCAATAGCACAGAAAGTTCCCTCAGCGTATGAAG 

AGGTGaAGCCAGAAAGCAAGTCATCGCTTGCTGTTTTTGATACATCTAAA 

ATAACAAAATTGCAAGCCATAACCCAAAGAGGAAAGGGAAATGTAGTAGC 

TATTATTGATACTGGCTTTGATATTAACCATGATATTTTTCGTTTAGATA 

GCCCAAAAGATGATAAGCACAGCTTTAAAACTAAAGCAGAATTCGAGGAA 

tTAAAAGCAAAACATAATATCACTTATGGGAAATGGGTTAACGATAAGAT 

TGTTTTTGCACATAACTACGCCAACAATACAGAAACGGTGGCTGATATTG 

CAGCAGCTATGAAAGATGGTTATGGGTCAGAAGCAAAGAATATTTCGCAT 

GGTACACACGTTGCTGGTATTTTTGTAGGTAATAGTAAACGTCCAGCAAT 
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CAATGGTCTTCTTTTAGAAGGTGCAGCGCCAAATGCTCAAGTCTTATTAA 

TGCGTATTCCAGATAAAATTGATTCGGACAAATTTGGAGAAGCATATGCT 

AAAGCAATCACAGACGCTGTTAATCTAGGAGCAAAAACGATTAATATGAG 

CCTTGGAAAAACAGCAGATTCTTTAATTGCACTCAATGATAAAGTTAAAT 

TAgCACTTAAATTAGCTTcTGAGAAGGGCGTTGCAGTTGTTGTGGCTGCC 

GGAAATGAAGGTGCATTTGGTATGGATTATAgCAAACCATTATCAACTAA 

TcCTGACTACGGtACGGTTAATAGTCCAGCTATTTcTGAAGATACTTTGA 

GTGTTGCTAGCTATGAATCACTTAAAACTATCAGTGAGGTCGTTGaAACA 

ACTATTGAAGGTAAGTTAGTTAAGTTGCCGATTGTGACTTcTAAACCTTT 

TGACAAAGGTAAGGCCTACGATGTGGTTTATGCCAATTATGGTGCAAAAA 

AAGACTTTGAAGGTAAGGACTTTAAAGGTAAGATTGCATTAATTGAGCGT 

GGTGGTGGACTTGATTTTATGACTAAAATCACTCATGCTACAAATGCAGG 

TGTTGTTGGTATCGTTATTTTTAACGATCAAGAAAAACGTGGAAATTTTC 

TAATTCCTTACCGTGAATTACCTGTGgGGGTTATTAGTAAAGTAGATGGC 

GAGCGTATAAT^AAATACTTCAAGTCAGTTAACATTTAACCAgAGTTTTGA 

AGTAgTTGATAGCCAAgGTGGCAATCGTATGCTGGAACAATCAAGTtGGG 

GCGTGACAGCTGAAGGAGCAATCAAGCCTGATGTAACAGCTTCTGGCTTT 

GAAATTTATTCTTCAACCTATAATAATCAATACCAAACAATGTCTGGTAC 

AAGTATGGCTTCACCACATGtTGCAGGATTAATGACAATGCTTCAAAATC 

ATTTGGCTGAGAAATATAAAGGGATGAATTTAGATTCTAAAAAATTGCTA 

GAATTGTCTAAAAACATCCTCATGAGCTCAGCAACAGCATTATATAGTGA 

AGAGGATAAGGCGTTTTATTCACCACGTCAGCAAGGtGCAGGTGTAGTTG 

ATGCTGAAAAAGCTATCCAAGCTCAATATTATGTTACTGGAAACGATGGC 

AAAGCTAAAATTAATCTCAAACGAGTGGGAGATAAATTTGATATCACAGT 

TACAATTCATAAACTTGTAGAAGGTGTCAAAGAATTGTATTATCAAGCTA 

ATGTAGCAACAGAACAAGTAAATAAAGGTAAATTTGCCCTTaAACCACAA 

GCCTTGCTAGATACTAATTGGCAGAAAGTAATTCTTcGTGATAAAGAAAC 

ACAAGTTCGATTTACTAtTGATGCTAGTCAATTTAgTCAGAAATTAAAAG 

AACAGATGGCAAATGGTTATTTCTTAgAAGGTTTTGTACGTTTTAAAGAA 

GCCAAGGATAGTAATCAGGAGTTAATGAGTATTCCTTTTGTAGGATTTAA 

TGGTGATTTTGCGAACTtACAAGCACTTGAAACACCGATTTATAAGACGC 

TTTCTAAAGGTAGTtTCTACTATAAACCAAATGATACAACTCATAAAGAC 

CAATTGGAGTACAATGAATCAGCTCctTTTGAAAGCAACAACTATACTGC 

CTTGTTAACACAATCAGCGTCTTGGGGCTATGTTGATTATGTCAAAAATG 

GTGGGGAGTTAGAATTAGCACCGGAGAGTCCAAAAAGAATTATTTTAGGA 

ACTTTTGAGAATAAGGTTGAGGATAAAACAATTCATCTTTTGGA2\AGAGA 

TGCAGCGAATAATCCATATTTTGCCATTTCTCCAAATAAAGATGGAAATA 

GGGATGaaATCACTCCCCAGGCAACtTTCTTAAGAAATGTTAAGGATATT 

TCTGCTCAAGTTCTAGATCAAAATGGAAATGTTATTTGGCAAAGTAAGGT 

TTTACCATCTTATCGTAAAAATTTCCATAATAATCCAAAGCAAAGTGATG 

GTCATTATCGTATGGATGCCTTTCAGTGGAGTGGTTTAgATAAgGATGGC 

AAAGTTGTAGCAGATGGTTTTTATACTTATCGCCTACGTTACACACCAGT 

AGCAGAAgGAGCAAATAGTCAGGAGTCAgACTTTAAAGTTCAAGTAAGTA 

CTAAGTCACCAAATCTTCCTTTACTAGCTCAGTTTGATGAAACTAATCGA 

ACATTAAGCTTAGCCATGCCTAAGGAAAGTAGTTATGTTCCTACATATCG 

TTTACAATTAGTTTTATCTCATGTTGTAAAAGATGAAGAATATGGGGATG 

AGACTTCTTACCATTATTTCCATATAGATCAAGAAGGTAAAGTGACACTT 

CCTAAAACGGTTAAGATAGGAGAGAGTGAGGTTGCAGTAGACCCTAAGGC 

CTTGACACTTGTTGTGGAAGATAAAGCTGGTAATTTTGCAACGGTaAAAT 

TGTCTGACCTCTTGAaTAAgGCAGTAGTATCAGAGAAAGAAAACGCTATA 

GTAATTTCTAACAGTTTCAAATATTTTGATAACTTGAAAAAAGAATCTAT 

GTTTATTTCTAAAGAAGGAAAAGTAGTAAACAAGAATCTAGAAGAAATAA 

CATTAGTTAAGCCGCAaACTACAGTTACTACTCAATCATTGTCTAAAGAA 

ATAACTAAATCAGGAAATGAGAAAGTCCTCACTTCTACAAACAATAATAG 

TAGCAGAGTAGCTAAGATCATATCACCTAAACATAACGGGGATTCTGTTA 
ACCATACC 

SEQ ID NO. 4410 
STRAIN X169NT 

GAGGAGCAAGAATTAAAAAACCAAGAGCAATC 

ACCTGTAATTGCTAATGTTGCTCAACAGCCATCGCCATCGGTAACTACTA 
ATATTGTTGAAAAAACATCTGTAACAGCTGCTTCTGCTAGTAATACAGCG 
AAAGAAATGGGTGATACATCTGTAAAAAATGACAAAACAGAAGATGAATT 
ATTAGAAGAGTTATCTAAAAACCTTGATACGTCTAATATGGGGGCTGATC 
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TTGAAGAAGAATAT CCCTCT AAAC CAGAGACAACCAACAATAAGGAAAGC 

AATGTAGTAACAAATGCTTCAACTGCAATAGCACAGAAAGTTCCCTCAGC 

ATATGAAGAGGTGAAGCCAAAAAGCAAGTCATCGCTTGCTGTTCTTGATA 

CATCTAAAATAACAAAATTGCAAGCCATAACCCAAAGAGGAAAGGGAAAT 

GTAGTAGCTATTATTGATACTGGCTTTGATATTAACCATGATATTTTTCG 

TTTAGATAGCCCAAAAGATGATAAGCACAGCTTTAAAAATAAGGCAGAAT 

TCGAGGAATTAAAAGCAAAACATAATATCACTTATGGGAAATGGGTTAAC 

GATAAGATTGTTTTTGCACATAACTACGCCAACAATACAGAAACGGTGGC 

TGATATTGCAGCAGCTATGAAAgATGGTTATGGTTCAGAAGCAAAGAATA 

TTTCGCATGGTACACACGTTGCTGGTATTtTTGTAGGTAATAGTAAACGT 

CCAGCAATCAATGGTCTTCTTTTAgAAGGTGCAgCGCCAAATGCTCAAGT 

CTTATTAATGCGTATTCCAGATAAAATtGATTCGGACAAATTtGGAGAAG 

CATATGCTAAAGCAATCACAGACGCTGTTAATCTAGGAGCTaAAACGATT 

AATATGAGTATTGGAAAAACAGCTGATTCTTTAATTGCTCTCAATGATAA 

AGTTAAATTAgCACTTAAATTAGCTTCTGAGAAGGGCGTTGCAGTTGTTG 

TGGCTGcCGGAAATGAAGGCGCATTtGGTATGGATTATAGCAAACCGTTA 

TCAACTAATcCTGACTACGGtACGGtTAATAGTCCAGCTATTTCTGAAGA 

TACTTTGAGTGTTGCTAGCTATGAATCACTTAAAACTATCAGTGAGGTCG 

TTGAAACAACTATTGAAGGTAAGTTAGTTAAGTtGCCGATTGtGACTTCT 

AAACCTTttGACAAAGGTAAGGCCTACGATGTGGTTTATGCCAATTATGG 

TGCAAAAAAAGACTTTGAAGGTAAGGACTTTAAAGGTAAGATTGCATTAA 

TTGAGCGTGGTGGTGGACTTGATTTTATGACTAAAATCACTCATGCTACA 

AATGCAGGTGTTGTTGGTATCGTTATTTTTAACGATCAAGAAAAACGTGG 

AAATTTTCTAATTCCTTACCGTGAATTACCTGTGGGGGTTATTAGTAAAG 

TAGATGGCGAGCGTATAAAAaATACTTCAAGTCAGTTAACATTTAACCAg 

AGATTTGAAGTAGTTGATAGCCAAgGTGGCAATCGTATGCTGGAACAATC 

aAGTtGGGGCGTGACAGCTGAAGGAGCAATCAAGCCTGATGTAACAGCTT 

CTGGCTTCGaAATTTATTCTTCaaCCTATAATAATCAATACCAAACAATG 

TCTGGTACAAGTATGGCTTCACCACATGTTGCAGGATTAATGACAATGCT 

TCAAAGTCATTTGGCTGAGaAATATAAAGGGATGAATTTAgATTCTAaAA 

AATTGCTAGAATTGTCTAAAAACATCCTCATGAGCTCAGCAACAGCATTA 

TATAGTGAAGAGGATAAGGCGTTTTATTCACCACGTCAGCAAGGtGCAGG 

TGTAGTTGATGCTGAAAAAGCTATCCAAGCTCAATATTATGTTACTGGAA 

ACGATGGCAAAGCTAAAATTAATCTCAAACGAGTGGGAGATAAATTTGAT 

ATCACAGTTACAATTCATAAACTTGTAGAAGGTGTCAAAGAATTGTATTA 

TCAAGCTAATGTAGCAACAGAACAAGTAAATAAAGGTAAATTTGCCCTTA 

AACCACAAGCCTTGCTAGATACTAATTGGCAGAAAGTAATTCTTcGTGAT 

AAAGAAACACAAGTTCGATTTACTATTGATGCTAGTCAATTTAgTCAGAA 

ATTAAAAGAACAGATGGCAAATGGTTATTTCTTAgAAGGTTTTGTACGTT 

TTAAAGAAGCTAAGGATAGTAATCAGGAGTTAATGAGTATTCCTTTTGTA 

GGATTTAATGGTGATTTTGCGAGCTTACAAGCACTTGAAACACCGATTTA 

TAAGACGCTTTCTAAAGGTAGTTTCTACTATAAACCAAATGATACAACTC 

ATAAAGACCAATTGGAGTATAATGAATCAGCTCCTTTTGAAAGCAACAAC 

TATACTGCCTTGTTAACACAATCAGCGTCTTGGGGCTATGTTGATTATGT 

CaAAAATGGTGGGGAGTTAGAATTAGCACCGGAGAGTcCAAAAAGAATTA 

TTTTAGGAACTTTTGAGAATAAGGTTGAGGATAAAACAATTCATCTTTTG 

GAAAGAGATGCAGCGAATAATCCATATTTTGCCATTTCTCCAAATAAAGA 

TGGAAATAGGGATGAAATCACTCCCCAGGCAACTTTCTTAAGAAATGTTA 

AGGATATTTCTGCTCAAGTTCTAGATCAAAATGGAAATGTTATTTGGCAA 

AGTAAGGTTTTACCATCTTATCGTAAAAATTTCCATAATAATCCAAAGCA 

GAGTGATGGTCATTATCGTATGGATGCCCTTCAGTGGAGTGGTTTAgATA 

AGGATGGCAAAGTTGTAGCAGATGGTTTTTATACTTATCGCTTACGTTAC 

ACACCAGTAGCAGAAGGAGCAAATAGTCAGGAGTCAGACTTTAAAGTTCA 

AGTAAGTACTAAGTCACCAAATCTTCCTTCACGAGCTCAGTTTGATGaAA 

CTAATCGAACATTAAGCTTAGCCATGCCTAAGGGAAGTAGTTATGTTCCT 

ATATATCGTCTACAATTAGTTTTATCTCATGTTGTAAAAGATGAAGAATA 

TGGAGATGAGACTTCTTACTATTATTTCCATATAGATCAAGAAGGTAAAG 

CGACACTTCCTAAAACGGTTAAGATAGGAGAGAGTGAGGTTGCAGTAGAC 

CCTAAGGCCTTGACACTTGTTGTGGAAGATAAAGCTGGTAATTTCGCAaC 

GGTAAAATTGTCTGACCTCTTGAATAAGGCAGTAGTATCAGAGAAAGAAA 

ACGCTATAGTAATTTCTAACAGTTTCAAATATTTTGATAACTTGAAAAAA 

GAACCTATGTTTATTTCTAAAAAAGAAAAAGTAGTAAACAAGAATCTAGA 

AGAaATAATATTAGTTAAGCCGCAcACTACAGTTACTACTCAaTCATTGT 

CT AAAG AAAT AACT AAAT CAGGAAATG AGAAAGT CCT C ACT T CT AC AAAC 
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AATAATAGTAGTAGAGTAGCTAAAATCATATCACCTAAACATAATGGGGA 
TTCTGTTAACCATACC 

SEQ ID NO. 4411 
STRAIN* JM9130013 

GAGGAGCAAGAATTAAAAAACCAAGAGCAAT CACCTGTAA 

TTGCTAATGTTGCTCAACAGCCATCGCCATCGGTAACTACTAATACTGTT 

GAAAAAACATCTGTAACAGCTGCTTCTGCTAGTAATACAGCGAAAGAAAT 

GGGTGATACATCTGTAAAAAATGACAAAACAGAAGATGAATTATTAGAAG 

AGTTATCTAAAAACCTTGATACGTCTAATTTGGGGGCTGATCTTGAAGAA 

GAATATCCCTCTAAACCAGAGACAACCAACAATAAAGAAAGCAATGTAGT 

AACAAATGCTTCAACTGCAATAGCACAGAAAGTTCCCTCAGCATATGAAG 

AGGTGAAGCCAGAAAGCAAGTCATCGCTTGCTGTTCTTGATACATCTAAA 

ATAACAAAATTACAAGCCATAACCCAAAGAGGAAAGGGAAATGTAGTAGC 

TATTATTGATACTGGCTTTGATATTAACCATGATATTTTTCGTTTAGATA 

GCCCAAAAGATGATAAGCACAGCTTTAAAACTAAGACAGAATTTGAGGAA 

TTAAAAGCAAAACATAATATCACTTATGGGAAATGGGTTAACGATAAGAT 

TGTTTTTGCACATAACTACGCCAACAATACAGAAACGGTGGCTGATATTG 

CAGCAGCTATGAAAGATGGTTATGGTTCAGAAGCAAAGAATATTTCGCAT 

GGTACACACGTTGCTGGTATTTTTGTAGGTAATAGTAAACGTCCAGCAAT 

CAATGGTCTTCTTTTAGAAGGTGCAGCGCCAAATGCTCAAGTCTTATTAA 

TGCGTATTCCAGATAAAATTGATTCGGACAAATTTGGTGAAGCATATGCT 

AAAGCAATCACAGACGCTGTTAATCTAGGAGCAAAAACGATTAATATGAG 

TATTGGAAAAACAGCTGATTCTTTAATTGCTCTCAATGATAAAGTTAAAT 

TAGCACTTAAATTAGCTTCTGAGAAGGGCGTTGCAGTTGTTGTGGCTGCC 

GGAAATGAAGGCGCATTTGGTATGGATTATAGCAAACCATTATCAACTAA 

TCCTGACTACGGTACGGTTAATAGTCCAGCTATTTCTGAAGATACTTTGA 

GTGTTGCTAGCTATGAATCACTTAAAACTATCAGTGAGGTCGTTGAAACA 

ACTATTGAAGGTAAGTTAGTTAAGTTGCCGATTGTGACTTCTAAACCTTT 

TGACAAAgGTAAgGCCTACGATGTGGTTTATGCCAATTATGGTGCAAAAA 

AAGACTTTGAAGGTAAGGACTTTAAAGGTAAGATTGCATTAATTGAGCGT 

GGTGGTGGACTTGATTTTATGACTAAAATCACTCATGCTACAAATGCAGG 

TGTTGTTGGTATCGTTATTTTTAACGATCAAGAAAAACGTGGAAATTTTC 

TAATTCCTTACCGTGAATTACCTGTGGGGATTATTAGTAAAGTAGATGGC 

GAGCGTATAAAAAATACTTCT^AGTCAGTTAACATTTAACCAGAGTTTTGA 

AGTAGTTGATAGCCAAGGTGGTAATCGTATGCTGGAACAATCAAGTTGGG 

GCGTGACAGCTGAAGGAGCAATCAAGCCTGATGTAACAGCTTCTGGCTTT 

GAAATTTATTCTTCAACCTATAATAATCAATACCAAACAATGTCTGGTAC 

AAGTATGGCTTCACCACATGTTGCAGGATTAATGACAATGCTTCAAAGTC 

ATTTGGCTGAGAAATATAAAGGGaTGAATTTAGATTCTAAAAAATTGCTA 

GAATTGTCTAAAAACATCCTCATGAGCTCAGCAACAGCATTATATAGTGA 

AGAGGATAAGGCGTTTTATTCACCACGTCAGCAAGGTGCAGGTGTAGTTG 

ATGCTGAAAAAGCTATCCAAGCTCaATATTATATTACTGGAAACGATGGC 

AAAGCTAAAATTAATCTCAAACGAATGGGAGATAAATTTGATATCACAGT 

TACAATTCATaAACTTGTAGAAGGTGTCAAAGAAtTGTATTATCAAGCTA 

ATGTAGCAACAGAACAAGTAAATAAAGGTAAATTTGCCCTTaAACCACAA 

GCCTTGCTAGATACTAATTGGCAGAAAGTAATTCTTCGTGATAAAGAAAC 

ACAAGTTCGATTTACTATTGATGCTAGTCAATTTAGTCAGAAATTAAAAG 

AACAGATGGCAAATGGTTATTTCTTAGAAGGTTTTGTACGTTTTAAAGAA 

GCCAAGGATAGTAATCAGGAGTTAATGAGTATTCCTTTTGTAGGATTTAA 

TGGTGATTTTGCGAACTTACAAGCACTTGAAACACCGATTTATAAGACGC 

TTTCTAAAGGTAGTTTCTACTATAAACCAAATGATACAACTCATAAAGAC 

CAATTGGAGTACAATGAATCAGCTCCTTTTGAAAGCAACAACTATACTGC 

CTTGTTAACACAATCAGCGTCTTGGGGCTATGTTGATTATGTCAAAAATG 

GTGGGGAGTTAGAATTAGCACCGGAGAGTCCAAAAAGAATTATTTTAGGA 

ACTTTTGAGAATAAGGTTGAGGATAAAACAATTCATCTTTTGGAAAGAGA 

TGCAGCGAATAATCCATATTTTGCCATTTCTCCAAATAAAGATGGAAATA 

GGGACGAAATCACTCCCCAGGCAACTTTCTTAAGAAATGTTAAGGATATT 

TCTGCTCAAGTTCTAGATCAAAATGGAAATGTTATTTGGCAAAGTAAGGT 

TTTACCATCTTATCGTAAAAATTTCCATAATAATCCAAAGCAAAGTGATG 

GTCATTATCGTATGGATGCTCTTCAGTGGAGTGGTTTAGATAAGGATGGC 

AAAGTTGTAGCAGATGGTTTTTATACTTATCGCTTACGTTACACACCAGT 

AGCAGAAGGAGCAAATAGTCAGGAGTCAGACTTTAAAGTACAAGTAAGTA 

CTAAGTCACCAAATCTTCCTTCACGAGCTCAGTTTGATGAAACTAATCGA 
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ACATTAAGCTTAGCCATGCCTAAGGAAAGTAGTTATGTTCCTACATATCG 
TTTACAATTAGTTTTATCTCATGTTGTAAAAGATGAAGAATATGGGGATG 
AGACTTCTTACCATTATTTCCATATAGATCAAGAAGGTAAAGTGACACTT 
CCTAAAACGGTTAAGATAGGAGAGAGTGAGGTTGCGGTAGACCCTAAGGC 
CTTGACACTTGTTGTGGAAGATAAAGCTGGTAATTTCGCAaCGGTAAAAT 
TGTCTGATCTCTTGAATAAGGCAGTAGTATCAGAGAAAGAAAACGCTATA 
GTAATTTCTaACAGTTTCAAATATTTTGATAACTTGAAAAAAGAACCTAT 
GTTTATTTCTAAAAAAGAAAAAGTAGTAAACAAGAATCTAGAAGAAATAA 
TATTAGTTAAGCCGCAAACTACAGTTACTACTCAATCATTGTCTAAAGAA 
ATAACTAAATCAGGAAATGAGAAAGTCCTCACTTCTACAAACAATAATAG 
TAGCAGAGTAGCTAAGATCATATCACCTAAACATAACGGGGATTCTGTTA 
ACCATACC 

SEQ ID NO. 4412 
STRAIN 2603 

VDKHHSKKAI LKLTIiITT S I LLMHSNQVNAEEQELKNQEQS PVI ANVAQQPS PS VTTNTV 
EKTSVTAASASNTAKEMGDTSVKNDKTEDELLEELSKNLDTSNLGADLEEEYPSKPETTN 
NKESNWTNASTAIAQKVPSAYEEVKPESKSSLAVLDTSKITKLQAITQRGKGNWAIID 
TGFDINHDIFRLDSPKDDKHSFKTKTEFEELKAKHNITYGKWVNDKIVFAHNYANNTETV 
ADIAAAMKDGYGSEAKNI SHGTHVAGI FVGNSKRPAINGLLLEGAAPNAQVLLMRI PDKI 
DS DKFGE1AYAKAITDAVNLGAKTINMS IGKTADSLIALNDKVKLALKLASEKGVAVVVAA 
GNEGAFGMDYSKPLSTNPDYGTVNSPAISEDTLSVASYESLKTISEWETTIEGKLVKLP 
IVTSKPFDKGKAYDWYANYGAKKDFEGKDFKGKIALIERGGGLDFMTKITHATNAGWG 
IVIFNDQEKRGNFLIPYRELPVGIISKVDGERIKNTSSQLTFNQSFEWDSQGGNRMLEQ 
SSWGVTAEGAIKPDVTASGFEIYSSTYNNQYQTMSGTSMASPHVAGLMTMLQSHLAEKYK 
GMNLDSKKLLELSKNILMSSATALYSEEDKAFYSPRQQGAGWDAEKAIQAQYYITGNDG 
KAKINLKRMGDKFDITVTIHKLVEGVKELYYQANVATEQVNKGKFALKPQALLDTNWQKV 
ILRDKETQVRFTIDASQFSQKLKEQMANGYFLEGFVRFKEAKDSNQELMSIPFVGFNGDF 
ANLQALETPIYKTLSKGSFYYKPNDTTHKDQLEYNESAPFESNNYTALLTQSASWGYVDY 
VKNGGELELAPESPKRIILGTFENKVEDKTIHLLERDAANNPYFAISPNKDGNRDEITPQ 
ATFLRNVKDISAQVLDQNGNVIWQSKVLPSYRKNFHNNPKQSDGHYRMDALQWSGLDKDG 
KVVADGFYTYRLRYTPVAEGANSQESDFKVQVSTKSPNLPSRAQFDETNRTLSLAMPKES 
SYVPTYRLQLVLSHWKDEEYGDETSYHYFHIDQEGKVTLPKTVKIGESEVAVDPKALTL 
WE DKAGNFAT VKLS DLLNKAWSEKENAI VI SNS FKY FDNLKKE PMFI SKKEKWNKNL 
EEIILVKPQTTVTTQSLSKEITKSGNEKVLTSTNNNSSRVAKIISPKHNGDSVNHTLPST 
S DRATNGL FVGT LALLS S LLL YLKPKKTKNN S K 

SEQ ID NO. 44X3 
STRAIN AS 09 

EEQELKNQEQSPVIANVAQQPSPSVTTNTVEKTSVTSASASNTAKEMGDTSVKNDKTEDE 
LLEELSKNLDTSNLGADLEEEYPSKPETTNNKESNWTNASTAIAQKVPSAYEEVKPESK 
S S LAVLDTSKITKLQAITQRGKGNVVAI IDTGFDINHDI FRLDS PKDDKHS FKTKAEFEE 
LKAKHN I TYGKWVNDKIVFAHNYANNTETVADIAAAMKDGYGSEAKNI SHGTHVAGI FVG 
N SKRPAINGLLLEGAAPNAQVLLMRI PDKI DS DKFGEAYAKAIT DAVNLGAKT INMS LGK 
TADSLIALNDKVKLALKLASEKGVAWVAAGNEGAFGMDYSKPLSTNPDYGTVNSPAISE 
DTLSVASYESLKTISEWETTIEGKLVKLPIVTSKPFDKGKAYDWYANYGAKKRL . R . G 
L . R . DCIN . AWWWT . FYD . NHSCYKCRCCWYRYF . RSRKTWKFSNSLP . ITCGGY . . SRW 
RAYKKYFKSVNI . PEF. SS . . PRWQSYAGTIKLGRDS . RSNQA. CNSFWL . NLFFNL . ,S 
IPNNVWYKYGFTTCCRINDNASKSFG . EI . RDEFRF. KIARIV . KHPHELSNSII . . RG . 
GVLFTTSARCRCS . C . KSYPSSILCYWKRWQS .N. SQTSGR. I . YHSYNS . TCRRCQRIV 
LSS . CSNRTSK . R . ICP . TTSLARY . LAESNSS . . RNTSSIYY . F . SI . SEIKRTDGKWL 
FLRRFCTF . RSQG . . SGVNEYS FCRI . W . FCELTST . NTDL . DAF . R . FLL . TK . YNS . R 
PIGVQ . ISSF . KQQL YC LVNT I S VLGLC . LCQKWWGVRISTGESKKNYFRNF. E .G.G.N 
NSSFGKRCSE . SIFCHFfiK . RWK . G . NHS PGN FLKKC . GYFCSSSRSKWKCYLAK . GFTI 
LS . KFP . . SKAK . WSLS YGCPSVEWFR . GWQSCSRWFLYLS FTLHTS SRRSK . SGVRL . S 
SSKY.VTKSSFTSSV. . N . SNIKLSHA. GK. LCSYISSTISFISCCKR. RIWR . DFLPLF 
PYRSRR . SDTS . NS . DRRE . GCSRP . DLDTCCGR . SW . FRNGKIV . PLE . GSS IRERKRY 
SNF . QFQI F . . LEKRTYVYF . RRKSSKQE SRRNS IS . AANYSYYS I IV . RNNS IRK . ESP 
HFYKQ . . . QSS . DHIT . T . RGFC . PY 

SEQ ID NO. 4414 
STRAIN H36B 

EEQELKNQEQS PVI ANVAQQPS PS VTTNTVEKTSVTS AS ASNTAKEMGDTSVKNDKTEDE 
LLEELSKNLDTSNLGADLEEEYPSKPETTNNKESNWTNASTAIAQBCVPSAYEEVKPESK 
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S SLAVLDTSKITKLQAITQRGKGNWAI I DTGFDINHDI FRLDS PKDDKHS FKTKAEFEE 
LKAKHNITYGKWVNDKIVFAHNYANNTETVADIAAAMKDGYGSEAKNISHGTHVAGIFVG 
NSKRPAINGLLLEGAAPNAQVLLMRIPDKIDSDKFGEAYAKAITDAVNLGAKTINMSLGK 
T ADS L I ALN DKVKLALKLASEKGVAWVAAGNEGAFGMD YSKPLS TN P DYGTVNS PAI SE 
DTLSVASYESLKTISEWETTIEGKLVKLPIVTSKPFDKGKAYDVVYANYGAKKDFEGKD 
FKGKIALIERGGGLDFMTKITHATNAGWGIVIFNDQEKRGNFLIPYRELPVGVISKVDG 
ERIKNTSSQLTFNQSFEWDSQGGNRMLEQSSWGVTAEGAIKPDVTASGFEIYSSTYNNQ 
YQTMSGTSMASPHVAGLMTMLQSHLAEKYKGMNLDSKKLLELSKNILMSSATALYSEEDK 
AFY S PRQQGAG WDAEKAIQAQYYVTGN DGKAK IN LKRVG DKFDI TVT IHKLVEGVKELY 
YQANVATEQVNKGKFALKPQALLDTNWQKVILRDKETQVRFTIDSSQFSQKLKEQMANGY 
FLEGFVRFKEAKDSNQELMSIPFVGFNGDFANLQALETPIYKTLSKGSFYYKPNDTTHKD 
QLEYNES APFESNN YTALLTQS ASWGYVDYVKNGGELELAPE S PKRI I LGT FENKVEDKT 
IHLLERDAANNPYFAISPNKDGNRDEITPQATFLRNVKDISAQVLDQNGNVIWQSKVLPS 
YRKNFHNNPKQSDGHYRMDALQWSGLDKDGKWADGFYTYRLRYTPVAEGANSQESDFKV 
QVSTKSPNLPSRAQFDETNRTLSLAMPKESSYVPTYRLQLVLSHVVKDEEYGDETSYHYF 
HIDQEGKVTLPKTVKIGESEVAVDPKTLTLVVEDKAGNFATVKLSDLLNKAVVSEKENAI 
VISNNFKYFDNLKKEPMFISKEGKVVNKNLEEIALVKPQTTVTTQSLSKEITQSGNEKVL 
TSTNNNSSRVAKIISPKHNGDSVNHT 

SEQ ID NO. 4415 
STRAIN 18RS21 

EEQELKNQEQS PVI ANVAQQPS PSVTTNTVEKT S VTAAS ASNTAKEMGDTS VKNDKTE DE 
LLEELSKNLDTSNLGADLEEEYPSKPETTNNKESNVVTNASTAIAQKVPSAYEEVKPESK 
SSLAVLDTSKITKLQAITQRGKGNWAIIDTGFDINHDIFRLDSPKDDKHSFKTKTEFEE 
LKAKHNITYGKWVNDKIVFAHNYANNTETVADIAAAMKDGYGSEAKNISHGTHVAGIFVG 
NSKRPAINGLLLEGAAPNAQVLLMRI PDKI DS DKFGEAYAKAI T DAVN LGAKT INMSIGK 
TADSLIALN DKVKLALKLASEKGVAVVVAAGNEGAFGMDYSKPLSTNP DYGTVNS PAI SE 
DTLSVASYESLKTISEWETTIEGKLVKLPIVTSKPFDKGBCAYDWYANYGAKKDFEGKD 
FKGKI ALIERGGGLDFMTKITHATNAGWGI VI FN DQEKRGN FLI PYRELPVGI I SKVDG 
ERIKNTSSQLTFNQSFEWDSQGGNRMLEQSSWGVTAEGAIKPDVTASGFEIYSSTYNNQ 
YQTMSGTSMASPHVAGLMTMLQSHLAEKYKGMNLDSKKLLELSKNILMSSATALYSEEDK 
AFYS PRQQGAG WDAEKAI QAQYYITGN DGKAKIN LKRMGDKFD I TVT IHKLVEGVKE LY 
YQANVATEQVNKGKFALKPQALLDTNWQKVI LRDKETQVRFT I DASQFSQKLKEQMANG Y 
FLEGFVRFKEAKDSNQELMSIPFVGFNGDFANLQALETPIYKTISKGSFYYKPNDTTHKD 
QLEYNESAPFESNNYTALLTQSASWGYVDYVKNGGELELAPESPKRIILGTFENKVEDKT 
IHLLERDAANNPYFAISPNKDGNRDEITPQATFLRNVKDISAQVLDQNGNVIWQSKVLPS 
YRKNFHNNPKQSDGHYRMDALQWSGLDKDGKVVADGFYTYRLRYTPVAEGANSQESDFKV 
QVSTKSPNLPSRAQFDETNRTLSLAMPKESSYVPTYRLQLVLSHWKDEEYGDETSYHYF 
HIDQEGKVTLPKTVKIGESEVAVDPKALTLVVEDKAGNFATVKLSDLLNKAVVSEKENAI 
VISNSFKYFDNLBCKEPMFISEOCEKVVNKNLEEIILVKPQTTVTTQSLSKEITKSGNEKVL 
TSTNNNS SRVAKI I S PKHNG DS VNHT 

SEQ ID NO. 4416 
STRAIN M732 

EEQELKNQEQSPVIANVAQQPSPSVTTNIVEKTSVTAASASNTVKEMGDTSVKNDKTEDE 
LIiEELSKNLDTSNLGADLEEEYPSKPETTNNKESNWTNASTAIAQKVPSAYEEVKSESK 
SSLAVLDTSKITKLQATTQRGKGNWAIIDTGFDINHDI FRLDS PKDDKHS FKTKAEFEE 
LKAKHNITYGKWVNDKIVFAHNYANNTETVADIAAAMKDGYGSEAKNILHGTHVAGIFVG 
NSKRPAINSLLLEGAAPNAQVLLMRI PDKI DS DKFGEAYAKAI I DAVN LGAKT INMSLGK 
TADSLIALNDKVKLALKLASEKGVAVWAAGNEGAFGMDYSKPLSTNPDYGTVNSPAISE 
DTLSVASYESLKTISEVVETTIEGKLVKLPIVTSKPFDKGKAYDVVYANYGAKKILKVRT 
LKVRLH . LSVWDLIL . LKSLMLQMQVLLVSLFLTIKKNVEIF. FLTVNYLWGLLVK. MA 
SV . KILQVS . HLTRVLK . LIAKVAIVCWNNQVGA . QLKEQSSLM. QLLALKFILQPI UN 
TKQCLVQVWLHHMLQD . . QCFKVIWLRNIKG . I . ILKNC . NCLKTSS . AQQQHYIVKRIR 
RFIHHVSKVQV . LMLKKLSKLNIMLLETMAKLKLISNEREINLISQLQFINL . KVSKNCI 
IKLM . QQNK . IKVNLPLNHKPC . ILIGRK . FFVIKKHKFDLLLMLVNLVRN . KNRWQMVI 
S . KVLYVLKKPRIVIRS . . VFLL. DLMVILRTYKHLKHRFIRRFLKWSTINQMIQLIKT 
NWSTMNQLLLKATTILPC . HNQRLGAMLIMSKMVGS . N . HRRVQKELF . ELLRIRLRIKQ 
FIFWKEMQRIIHILPFLQIKMEIGTKSLPRQLS .EMLRIFLLKF. IKMEMLFGKVRFYHL 
IVKISIIIQSKVMVIIVWMLFSGW . IRMAKL . QMVFILIAYVTHQ . QKEQIVRSQTLKF 
K . VLSHQI FLHELS LMKLIEH . A . PCLRKWMFLHIVYN . FYLML.KMKNMGMRLLTIIS 
I . IKKVK . HFLKRLR . ERVRLR . TLRP . H LLWKIKLV I LQR . NCLTS . IRQ . YQRKKTL . 
. FLTVSNILIT . RKNLCLFLKKEK . . TRI . KK . H . LSLKLQLLLNHCLKK . LNQEMRKSS 
LLQTIIVAE. LRSYHLNITGILLTI 
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SEQ ID NO. 4417 
STRAIN COH1 

EEQELKNQEQSPVIANVAQQPSPSVTTNIVEKTSVTAASASNTVKBMGDTSVKNDKTEDE 
LLEELSKNLDTSNLGADLEEEYPSKPETTNNKESNWTNASTAIAQKVPSAYEEVKSESK 
SSIAVLDTSKITKLQATTQRGKGNWAIIDTGFDINHDIFRLDSPKDDKHSFKTKAEFEE 
LKAKHNIT YGKWVN DKI VFAHN YANNTET VAD I AAAMK DG YGSEAKN I LHGTH VAG I FVG 
NSKRPAINSLLLEGAAPNAQVLLMRI PDKI DS DKFGEAYAKAI I DAVN LGAKT INM S LGK 
TADSLIALNDKVKLALKLASEKGVAVVVAAGNEGAFGMDYSKPLSTNPDYGTVNSPAISE 
DTLSVASYESLKTISEWETTIEGKLVKLPIVTSKPFDKGKAYDWYANYGAKKILKVRT 
LKVRLH . LSVWDLIL . LKS LMLQMQVLL VS L FLT I KKN VE I F . FLTVNYLWGLLVK . MA 
SV . KILQVS . HLTRVLK . LIAKVAIVCWNNQVGA . QLKEQSSLM . QLLALKFI LQP 1 1 IN 
TKQCLVQVWLHHMLQD . . QC FKVI WLRN I KG . I . ILKNC . NCLKTSS . AQQQHYIVKRIR 
RFI HHVSKVQV . LMLKKLSKLNIMLLETMAKLKLISNEREINLISQLQFINL . KVSKNCI 
IKLM . QQNK . IKVNLPLNHKPC . ILIGRK . FFVIKKHKFDLLLMLVNLVRN . KNRWQMVI 
S . KVLYVLKKPRIVIRS . . VFLL . DLMVILRTYKHLKHRFIRRFLKWSTINQMIQLIKT 
NWSTMNQLLLKATT ILPC . HNQRLGAMLIMSI^MVGS . N . HRRVQKELF . ELLRIRLRIKQ 
FI FWKEMQRI IHILPFLQIKMEIGTKSLPRQLS . EMLRI FLLKF . IKMEMLFGKVRFYHL 
IVKISIIIQSKVMVIIVWMLFSGW. IRMAKL. QMVFILIAYVTHQ. QKEQIVRSQTLKF 
K . VLSHQI FLHELSLMKLIEH . A . PCLRKWMFLHIVYN . FYLML . KMKNMGMRLLTIIS 
I . IKKVK . HFLKRLR . ERVRLR . TLRP . HLLWKIKLVILQR . NCLTS . IRQ . YQRKKTL 
. FLTVSNILIT . RKNLCLFLKKEK . . TRI . KK . H . LSLKLQLLLNHCLKK . LNQEMRKSS 
LLQTIIVAE . LRSYHLNITGILLTI 

SEQ ID NO. 4418 
STRAIN M781 

EEQELKNQEQSPVIANVAQQPSPSVTTNIVEKTSVTAASASNTVKEMGDTSVKNDKTEDE 
LLEELSKNLDTSNLGADLEEEYPSKPETTNNKESNWTNASTAIAQKVPSAYEEVKSESK 
S S LAVLDTSKITKLQATTQRGKGNWAI I DTGFDINHDI FRLDS PKDDKHS FKTKAE FEE 
LKAKHNITYGKWVNDKIVFAHNYANNTETVADIAAAMKDGYGSEAKNILHGTHVAGIFVG 
NSKRPAINSLLLEGAAPNAQVLLMRI PDKI DS DKFGEAYAKAI I DAVNLGAKTINMSLGK 
TADSLIALNDKVKLALKLASEKGVAWVAAGNEGAFGMDYSKPLSTNPDYGTVNSPAISE 
DTLSVASYESLKTISEWETTIEGKLVKLPIVTSKPFDKGKAYDVVYANYGAKKILKVRT 
LKVRLH . LSVWDLIL . LKS LMLQMQVLL VS LFLT IKKNVEI F . FLTVNYLWGLLVK . MA 
SV . KILQVS . HLTRVLK. LIAKVAIVCWNNQVGA. QLKEQSSLM . QLLALKFI LQPI I IN 
TKQCLVQVWLHHMLQD . . QCFKVIWLRNIKG . I . ILKNC . NCLKTS S . AQQQHYIVKRIR 
RFIHHVSKVQV. LMLKKLSKLNIMLLETMAKLKLISNEREINLISQLQFINL. KVSKNCI 
IKLM . QQNK . IKVNLPLNHKPC . ILIGRK . FFVIKKHKFDLLLMLVNLVRN . KNRWQMVI 
S . KVLYVLKKPRIVIRS . . VFLL . DLMVILRTYKHLKHRFIRRFLKWSTINQMIQLIKT 
NWSTMNQLLLKATTILPC . HNQRLGAMLIMSKMVGS . N . HRRVQKELF. ELLRIRLRIKQ 
FIFWKEMQRIIHILPFLQIKMEIGTKSLPRQLS .EMLRI FLLKF. IKMEMLFGKVRFYHL 
IVKISIIIQSKVMVI IVWMLFSGW . IRMAKL . QMVFILIAYVTHQ . QKEQIVRSQTLKF 
K. VLSHQI FLHELSLMKLIEH .A. PCLRKWMFLHIVYN . FYLML . KMKNMGMRLLT IIS 
I . IKKVK . HFLKRLR . ERVRLR . TLRP . HLLWKIKLVILQR . NCLTS . IRQ . YQRKKTL 
. FLTVSNILIT . RKNLCLFLKKEK . . TRI . KK . H . LSLKLQLLLNHCLKK . LNQEMRKSS 
LLQTIIVAE . LRSYHLNITGILLTI 

SEQ ID NO. 4419 
STRAIN JM9130013 

EEQELKNQEQSPVIANVAQQPSPSVTTNTVEKTSVTAASASNTAKEMGDTSVKNDKTEDE 
LLEELSKNLDTSNLGADLEEEYPSKPETTNNKESNWTNASTAIAQKVPSAYEEVKPESK 
SSLAVLDTSKITBCLQAITQRGKGNWAIIDTGFDINHDI FRLDS PKDDKHSFKTKTE FEE 
LKAKHNIT YGKWVNDKIVFAHNYANNTETVADI AAAMKDGYGSEAKNI SHGTHVAGI FVG 
NSKRPAINGLLLEGAAPNAQVLLMRIPDKIDSDKFGEAYAKAITDAVNLGAKTINMSIGK 
TADSLIALNDKVKLALKLASEKGVAVWAAGNEGAFGMDYSKPLSTNPDYGTVNSPAISE 
DTLSVASYESLKTISEWETTIEGKLVKLPIVTSKPFDKGKAYDWYANYGAKKDFEGKD 
FKGKIALIERGGGLDFMTKITHATNAGWGIVIFNDQEKRGNFLIPYRELPVGIISKVDG 
ERIKNTSSQLTFNQS FEVVDSQGGNRMLEQSSWGVTAEGAIKPDVTASGFEIYSSTYNNQ 
YQTMSGTSMAS PHVAGLMTMLQSHLAEKYKGMNLDSKKLLELSKNILMSSATALYSEEDK 
AFYSPRQQGAGWDAEKAIQAQYYITGNDGKAKINLKRMGDKFDITVTIHKLVEGVKELY 
YQANVATEQVNKGKFALKPQALLDTNWQKVI LRDKETQVRFT I DASQFSQKLKEQMANG Y 

FLEGFVRFKEAKDSNQELMSIPFVGFNGDFANLQALETPIYKTLSKGSFYYKPNDTTHKD 
QLEYNESAPFESNNYTALLTQSASWGYVDYVKNGGELELAPES PKRI ILGTFENKVEDKT 
IHLLERDAANNPYFAISPNKDGNRDEITPQATFLRNVKDISAQVLDQNGNVIWQSKVLPS 
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YRKNFHNNPKQSDGHYRMDALQWSGLDKDGBCVVADGFYTYRLRYTPVAEGANSQESDFKV 
QVSTKSPNLPSRAQFDETNRTLSLAMPKESSYVPTYRLQLVLSHWKDEEYGDETSYHYF 
HIDQEGKVTLPKTVKIGESEVAVDPKALTLWEDKAGNFATVKLSDLLNKAVVSEKENAI 
VI SN S FKYFDNLKKE PMFI SKKEKWNKNLEE 1 1 LVKPQTT VTTQS LSKE I TKSGNEKVL 
TSTNNNSSRVAKIISPKHNGDSVNHT 

SEQ ID NO. 4420 
STRAIN 090 

EEQELKNQEQS PVIANVAQQPS PS VTTN I VEKTSVTAASASNTVKEMGDTSVKNDKTEDE 
LLEELSKNLDTSNLGADLEEEYPSKPETTNNKESNVVTNASTAIAQKVPSAYEEVKPESK 
SS LAVFDTSKITKLQAITQRGKGNWAI I DTGFDINHDI FRLDS PKDDKHS FKTKAE FEE 
LKAKHNITYGKWVNDKIVFAHNYANNTETVADIAAAMKDGYGSEAKNI SHGTHVAGI FVG 
NSKRPAINGLLLEGAAPNAQVLLMRIPDKIDSDKFGEAYAKAITDAVNLGAKTINMSLGK 
TADSLIALNDKVKLALKLASEKGVAVWAAGNEGAFGMDYSKPLSTNPDYGTVNSPAISE 
DTLSVASYESLKTISEWETTIEGKLVKLPIVTSKPFDKGKAYDWYANYGAKKDFEGKD 
FKGKIALIERGGGLDFMTKITHATNAGWGlVI FNDQEKRGNFLI PYRELPVGVI SKVDG 
ERIKNTSSQLTFNQSFEWDSQGGNRMLEQSSWGVTAEGAIKPDVTASGFEIYSSTYNNQ 
YQTMSGTSMASPHVAGLMTMLQSHLAEKYKGMNLDSICKLLELSKNILMSSATALYSEEDK 
AFYS PRQQGAGVVDAEKAIQAQYYVTGNDGKAKINLKRVGDKFDITVT IHKLVEGVKELY 
YQANVATEQVNKGKFALKPQALLDTNWQKVILRDKETQVRFTIDASQFSQKLKEQMANGY 
FLEGFVRFKEAKDSNQELMSIPFVGFNGDFANLQALETPIYKTLSKGSFYYKPNDTTHKD 
QLEYNESAPFESNNYTALLTQSASWGYVDYVKNGGEI^LAPESPKRIILGTFENKVEDKT 
IHLLERDAANNPYFAISPNKDGNRDEITPQATFLRNVKDISAQVLDQNGNVIWQSKVLPS 
YRKNFH1WPKQSDGHYRMDAFQWSGLDKDGKVVADGFYTYRLRYTPVAEGANSQESDFKV 
QVSTKSPNLPLLAQFDETNRTLSLAMPKESSYVPTYRLQLVLSHWKDEEYGDETSYHYF 
HIDQEGKVTLPKTVKIGESEVAVDPKALTLWEDKAGNFATVKLSDLLNKAVVSEKENAI 
VISNSFKYFDNLKKESMFISKEGKWNKNLEEITLVKPQTTVTTQSLSKEITKSGNEKVL 
TSTNNNSSRVAKIISPKHNGDSVNHT 

SEQ ID NO. 4421 
STRAIN CJB110 

EEQELKNQEQS PVIANVAQQPS PS VTTNIVEKT SVT AASASNTAKEMGDT SVKNDKTE DE 
LLEELSKNLDTSNLGADLEEEYPSKPETTNNKESNWTNASTAIAQKVPSAYEEVKPESK 
SSLAVFDTSKITKLQAITQRGKGNWAI I DTGFDINHDI FRLDS PKDDKHS FKTKAE FEE 
LKAKHNITYGKWWDKIVFAHNYANNTETVADIAAAMKDGYGSEAKNISHGTHVAGIFVG 
NSKRPAINGLLLEGAAPNAQVLLMRIPDKIDSDKFGEAYAKAITDAVNLGAKTINMSLGK 
TADSLIALNDKVKLALKLASEKGVAVVVAAGNEGAFGMDYSKPLSTNPDYGTVNSPAISE 
DTLSVASYESLKTISEWETTIEGKLVKLPIVTSKPFDKGKAYDWYANYGAKKDFEGKD 
FKGKIALIERGGGLDFMTKITHATNAGVVGIVI FNDQEKRGNFLI PYRELPVGVI SKVDG 
ERIKNTSSQLTFNQS FEWDSQGGNRMLEQSSWGVTAEGAIKPDVTASGFEIYSSTYNNQ 
YQTMSGTSMASPHVAGLMTMLQNHLAEKYKGMNLDSKKLLELSKNILMSSATALYSEEDK 
AFYSPRQQGAGWDAEKAIQAQYYVTGNDGKAKINLKRVGDKFDITVTIHKLVEGVKELY 
YQANVATEQVNKGKFALKPQALLDTNWQKVI LRDKETQVRFTI DASQFSQKLKEQMANGY 
FLEGFVRFKEAKDSNQELMSIPFVGFNGDFANLQALETPIYBCTLSKGSFYYKPNDTTHKD 
QLEYNESAPFESNNYTALLTQSASWGYVDYVKNGGELELAPESPKRIILGTFENKVEDKT 
IHLLERDAANNPYFAIS PNKDGNRDEITPQATFLRNVKDI SAQVLDQNGNVIWQSKVLPS 
YRKNFHNNPKQSDGHYRMDAFQWSGLDKDGKWADGFYTYRLRYTPVAEGANSQESDFKV 
QVSTKSPNLPLLAQFDETNRTLSLAMPKESSYVPTYRLQLVLSHWKDEEYGDETSYHYF 
HIDQEGKVTLPKTVKIGESEVAVDPKALTLWEDKAGNFATVKLSDLLNKAWSEKENAI 
VI SNSFKYFDNLKKESMFISKEGKWNKNLEEITLVKPQTT VTTQS LSKEITKSGNEKVL 
TSTNNN S SRVAKI I S PKHNGDS VNHT 

SEQ ID NO. 4422 
STRAIN 1169NT 

EEQELKNQEQS PVIANVAQQPS PS VTTN I VEKTSVTAASASNTAKEMGDTSVKNDKTEDE 
LLEELSKNLDTSNMGADLEEEYPSKPETTNNKESNWTNASTAIAQKVPSAYEEVKPKSK 
S S LAVLDT SKITKLQAITQRGKGNVVAI I DTG FDINHDI FRLDS PKDDKHS FKNKAE FEE 
LKAKHNITYGKWVNDKIVFAHNYANNTETVADIAAAMKDGYGSEAKNISHGTHVAGIFVG 
NSKRPAINGLLLEGAAPNAQVLLMRIPDKIDSDKFGEAYAKAITDAVNLGAKTINMSIGK 
TADSLIALNDKVKLALKLASEKGVAVVVAAGNEGAFGMDYSKPLSTNPDYGTVNSPAISE 
DTLSVASYESLKTISEWETTIEGKLVKLPIVTSKPFDKGKAYDWYANYGAKKDFEGKD 
FKGKIALIERGGGLDFMTKITHATNAGWGIVI FNDQEKRGNFLI PYRELPVGVI SKVDG 
ERIKNTSSQLTFNQRFEWDSQGGNRMLEQSSWGVTAEGAIKPDVTASGFEIYSSTYNNQ 
YQTMSGTSMASPHVAGLMTMLQSHLAEKYKGMNLDSKKLLELSKNILMSSATALYSEEDK 
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AFYSPRQQGAGWDAEKAIQAQYYVTGNDGKAKINLKRVGDKFDITVTIHKLVEGVKELY 
YQANVATEQVNKGKFALKPQALLDTNWQKVILRDKETQVRFTIDASQFSQKLBCEQMANGY 
FLEGFVRFKEAKDSNQELMSIPFVGFNGDFASLQALETPIYKTLSKGSFYYKPNDTTHKD 
QLEYNESAPFESNNYTALLTQSASWGYVDYVKNGGELELAPESPKRIILGTFENKVEDKT 
I HLLERDAANN P YFAI S PNKDGNRDE IT PQAT FLRNVKDI SAQVLDQNGNVIWQS KVL PS 
YRKNFHNN PKQS DGH YRMDALQWSGLDKDGKWADG FYTYRLRYT PVAEGANS QE S D FKV 
QVSTKSPNLPSRAQFDETNRTLSLAMPKGSSYVPIYRLQLVLSHWKDEEYGDETSYYYF 
HIDQEGKATLPKTVKIGESEVAVDPECALTLWEDKAGNFATVKLSDLLNKAWSEKENAI 
VISNSFKYFDNLKKEPMFISKKEKVWKNLEEIILVKPHTTVTTQSLSKEITKSGNEKVL 
TSTNNNS SRVAKI I S PKHNGDS VNHT 

SEQ ID NO. 4501 
STRAIN 2603 

ATGAAAAAGATTAGAAAAAGTTTAGGACTTCTACTATGTTGCTTTTTAGGATTGGTACAA 
TTAGCGTTTTTTTCGGTAGCCAGTGTAAATGCTGATACCCCTAATCAACTAACAATCACA 
CAGATAGGACTTCAGCCAAATACTACAGAGGAGGGGATTTCTTATCGTTTATGGACTGTG 
ACTGACAACTTAAAAGTTGATTTATTGAGCCAAATGACAGATAGCGAATTGAACCAGAAG 
TATAAGAGTATCTTGACTTCTCCTACTGATACTAATGGTCAGACAAAGATAGCACTCCCA 
AATGGTTCGTACTTTGGTCGTGCTTATAAAGCTGATCAAAGCGTTTCAACAATAGTACCT 
TTTTATATTGAATTACCAGATGATAAGTTATCAAATCAATTACAGATAAATCCTAAGCGA 
AAAGTTGAAACAGGCCGATTAAAACTTATTAAATATACAAAAGAAGGAAAGATAAAGAAA 
AGGCTATCCGGAGTAATATTTGTATTATACGATAACCAGAATCAGCCAGTTCGCTTTAAA 
AATGGACGATTTACGACCGATCAAGATGGGATTACTTCATTAGTAACTGATGATAAGGGA 
GAAATTGAGGTTGAAGGTTTATTACCTGGTAAGTATATTTTTCGAGAAGCAAAAGCACTA 
ACTGGTTACCGTATATCTATGAAGGATGCTGTAGTTGCTGTAGTTGCTAATAAAACACAG 
GAAGTAGAGGTAGAAAACGAAAAAGAAACTCCTCCACCAACAAATCCTAAACCATCACAA 
CCGCTTTTTCCACAATCATTTCTTCCTAAAACAGGAATGATTATTGGTGGAGGACTGACA 
ATTCTTGGTTGTATTATTTTGGGAATTTTGTTTATCTTTTTAAGAAAAACTAAAAATAGC 
AAATCTGAAAGAAACGATACAGTA 

SEQ ID NO. 4502 
STRAIN 090 

GATACCCCTAATCAACTAACAATCACAC 

AGATAGGACTTCAGCCAAATACTACAGAGGAGGGGATTTCTTATCGTTTA 
TGGACTGTGACTGACAACTTAAAAGTTGATTTATTGAGCCAAATGACAGA 
TAGCGAATTGAACCAGAAGTATAAGAGTATCTTGACTTCTCCTACTGATA 
CTAATGGtCAGACAAAGATAGCACTCCCAAATGGTTCGTACTTTGGTCGT 
GCTTATAAAGCTGATCAAAGCGTTTCAACAATAGTACCTTTTTATATTGA 
ATTACCAGATGATAAGTTATCAAATCAATTACAGATAAATCCTAAGCGAA 
AAGTTGAAACAGGCCGATTAAAACTTATTAAATATACAAAAGAAGGAAAG 
ATAAAGAAAAGGCTATCAGGAGTAATATTTGTATTATACGATAACCAGAA 
TCAGCCAGTTCGCTTTAAAAATGGACGATTTACGACCGATCAAGATGGGA 
TTACTTCATTAGTAACTGATGATAAGGGAGAAATTGAGGTTGAAGGTTTA 
TTACCTGGTAAGTATATTTTTCGAGAAGCAAAAGCACTAACTGGtTACCG 
TATATCTATGAAGGATGCTGTAGTTGCTGTAGTTGCTAATAAAACACAGG 
AAGTaGAGGTaGAAAACGAAAAAGAAACTCCTCCACCAACAAATCCTAAA 
CCATCACAACCG 

SEQ ID NO. 4503 
STRAIN H36B 

GATACCCCTAATCAACTAACAATCACACAGA 

TAGGACTTCAGCCAAATACTACAGAGGAGGGGATTTCTTATCGTTTATGG 
ACTGTGACTGACAACTTAAAAGTTGATTTATTGAGCCAAATGACAGATAG 
CGAATTGAACCAGAAGTATAAGAGTATCTTGACTTCTCCTACTGATACTA 
ATGGtCAGACAAAGATAGCACTCCCAAATGGTTCGTACTTTGGTCGTGCT 
TATAAAGCTGATCAAAGCGTTTCAACAATAGTACCTTTTTATATTGAATT 
ACCAGATGATAAGTTATCAAATCAATTACAGATAAATCCTAAGCGAAAAG 
TTGAAACAGGCCGATTAAAACTTATTAAATATACAAAAGAAGGAAAGATA 
AAGAAAAGGCTwTCCGGAGTAATATTTGTATTATACGATAACCAGAATCA 
GCCAGTTCGCTTTAAAAATGGACGATTTACGACCGATCAAGATGGGATTA 
CTTCATTAGTAACTGATGATAAGGGAGAAATTGAGGTTGAAGGTTTATTA 
CCTGGTAAGTATATTTTTCGAGAAGCAAAAGCACTAACTGGTTACCGTAT 
ATCTATGAAGGATGCTGTAGTTGCTGTAGTTGCTAATAAAACACAGGAAG 
TAGAGGTAGAAAACGAAAAAGAAACTCCTCCACCAACAAATCCTAAACCA 
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TCACAACCGC 

SEQ XD NO. 4504 
STRAIN 18RS21 

GATACCCCTAATCAACTAACAATCACACAG 

ATAGGACTTCAGCCAAATACTACAGAGGAGGGGATTTCTTATCGTTTATG 
GACTGTGACTGACAACTTAAAAGTTGATTTATTGAGCCAAATGACAGATA 
GCGAATTGAACCAGAAGTATAAGAGTATCTTGACTTCTCCTACTGATACT 
AATGGtCAGACAAAGATAGCACTCCCAAATGGTTCGTACTTTGGTCGTGC 
TTATAAAGCTGATCAAAGCGTTTCAACAATAGTACCTTTTTATATTGAAT 
TACCAGATGATAAGTTATCAAATCAATTACAGATAAATCCTAAGCGAAAA 
GTTGAAACAGGCCGATTAAAACTTATTAAATATACAAAAGAAGGAAAGAT 
AAAGAAAAGGCTATCCGGAGTAATATTTGTATTATACGATAACCAGAATC 
AGCCAGTTCGCTTTAAAAATGGACGATTTACGACCGATCAAGATGGGATT 
ACTTCATTAGTAACTGATGATAAGGGAGAAATTGAGGTTGAAGGTTTATT 
ACCTGGTAAGTATATTTTTCGAGAAGCAAAAGCACTAACTGGTTACCGTA 
TATCTATGAAGGATGCTGTAGTTGCTGTAGTTGCTAATAAAACACAGGAA 
GTAGAGGTAGAAAACGAAAAAGAAACTCCTCCACCAACAAATCCTAAACC 
ATCACAACC 

SEQ XD NO. 4505 
STRAIN CJB110 

GATACCCCTAATCAACTAACAATCACACA 

GATAGGACTTCAGCCAAATACTACAGAGGAGGGGATTTCTTATCGTTTAT 
GGaCTGTGACTGACAACTTAAAAGTTGATTTATTGAGCCAAATGACAGAT 
AGCGAATTgAACCAGAAGTATAAGAGTATCTTGACTTCTCctACTGATAc 
TAATGGTCAGACAAAGATAGCACTCCCAAATGGTTcGTACTTTGGTCGTG 
CTTATAAAGCTGATCAAAGCGTTTCAACAATAGTACCTTTTTATATTGAA 
TTACCAGATGATAAGTTATCAAATCAATTACAGatAAATCCTAAGCGAAA 
AGTTGAAACAGGCCGATTaaAACTTATTAAATATACAAAAGAAGGAAAGA 
TAAAGAAAAGGCTaTCAGGAGTAATATTTGTATTATACGATAACCAGAAT 
CAGCCAGTTCGCTTTAAAAATGGACGATTTACGACCGATCAAGATGGGAT 
TACTTCATTAGTAACTGATGATAAGGGAGAAATTGAGGTTGAAGGTTTAT 
TACCTGGTAAGTATATTTTTCGAGAAGCAAAAGCACTAACTGGTTaCCGT 
ATATCTATGAAGGATGCTGTAGTTGCTGTAGTTGCTAATAAAACACAGGA 
AGTAGAGGTAGAAAACGAAAAAGAAACTCCTCCACCAACAAATCCTAAAC 
CATCACAACC 

SEQ XD NO. 4506 
STRAIN 1169NT 

GATACCCCTAATCAACTAACAATCACACAG 

ATAGGACTTCAGCCAAATACTACAGAGGAGGGGATTTCTTATCGTTTATG 
GACTGTGACTGACAACTTAAAAGTTGATTTATTGAGCCAAATGACAGATA 
GCGAATTGAACCAGAAGTATAAGAGTATCTTGACTTCTCCTACTGATACT 
AATGGtCAgaCAAAGATAGCACTCCCAAATGGTTCGTACTTTGGTCGTGC 
TTATAAAGCTGATCAAAGCGTTTCAACAATAGTACCTTTTTATATTGAAT 
TACCAGATGATAAGTTATCAAATCAATTACAGATAAATCCTAAGCGAAAA 
GTTGAAACAGGCCGATTAAAACTTATTAAATATACAAAAGAAGGAAAGAT 
AAAGAAAAGGCTATCAGGAGTAATATTTGTATTATACGATAACCAGAATC 
AGCCAGTTCGCTTTAAAAATGGACGATTTACGACCGATCAAGATGGGATT 
ACTTCATTAGTAACtgaTGATAAGGGAGAAATTGAGGTTGAAGGTTTATT 
ACCTGGTAAGTATATTTTTCGAGAAGCAAAAGCACTAACTGGTTACCGTA 
TATCTATGAAGGATGCTGTAGTTGCTGTAGTTGCTAATAAAACACAGGAA 
GTAGAGGTAGAAAACGAAAAAGAAACTCCTCCACCAACAAATCCTAAACC 
ATCACAACC 

SEQ ID NO. 4507 
STRAIN 2603 

MKKIRKSLGLLLCCFLGLVQLAFFSVASVNADTPNQLTITQIGLQPNTTEEGISYRLWTV 
TDNLKVDLLSQMTDSELNQKYKSILTSPTDTNGQTKIALPNGSYFGRAYKADQSVSTIVP 
FYIELPDDKLSNQLQINPKRKVETGRLKLIKYTKEGKIKKRLSGVIFVLYDNQNQPVRFK 
NGRFTTDQDGITSLVTDDKGEIEVEGLLPGKYIFREAKALTGYRISMKDAWAWANKTQ 
EVEVENEKETPPPTNPKPSQPLFPQSFLPKTGMIIGGGLTILGCIILGILFIFLRKTKNS 

KSERNDTV 
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SEQ ID NO. 4508 
STRAIN 090 

DTPNQLTITQIGLQPNTTEEGISYRLWTVTDNLKVDLLSQMTDSELNQKYKSILTSPTDT 
NGQTKIALPNGSYFGRAYKADQSVSTIVPFYIELPDDKLSNQLQINPKRKVETGRLKLIK 
YTKEGKIKKRLSGVIFVLYDNQNQPVRFKNGRFTTDQDGITSLVTDDKGEIEVEGLLPGK 
YIFREAKALTGYRISMKDAWAVVANKTQEVEVENEKETPPPTNPKPSQP 

SEQ ID NO. 4509 
STRAIN H36B 

DTPNQLTITQIGLQPNTTEEGISYRLWTVTDNLKVDLLSQMTDSELNQKYKSILTSPTDT 
NGQTKIALPNGSYEX3RAYKADQSVSTIVPFYIELPDDBCLSNQLQINPKRKVETGRLKLIK 
YTKEGKIKKRLSGVIFVLYDNQNQPVRFKNGRFTTDQDGITSLVTDDKGEIEVEGLLPGK 
YIFREAKALTGYRISMKDAWAWANKTQEVEVENEKETPPPTNPKPSQP 

SEQ ID NO. 4510 
STRAIN 18RS21 

DTPNQLTITQIGLQPNTTEEGISYRLWTVTDNLKVDLLSQMTDSELNQKYKSILTSPTDT 
NGQTKIALPNGSYFGRAYKADQSVSTIVPFYIELPDDKLSNQLQINPKRKVETGRLKLIK 
YTKEGKIKKRLSGVIFVLYDNQNQPVRFKNGRFTTDQDGITSLVTDDKGEIEVEGLLPGK 
YIFREAKALTGYRISMKDAWAWANKTQEVEVENEKETPPPTNPKPSQ 

SEQ ID NO. 4511 
STRAIN 1169NT 

DTPNQLTITQIGLQPNTTEEGISYRLWTVTDNLKVDLLSQMTDSELNQBCYKSILTSPTDT 
NGQTKIALPNGSYFGRAYKADQSVSTIVPFYIELPDDKLSNQLQINPKRKVETGRLKLIK 
YTKEGKIKKRLSGVIFVLYDNQNQPVRFKNGRFTTDQDGITSLVTDDKGEIEVEGLLPGK 
YIFREAKALTGYRISMKDAWAWANKTQEVEVENEKETPPPTNPKPSQ 

SEQ ID NO. 4601 
STRAIN A9 09 

TGACAAATATTATTTTACCCAACGTGGTTTAGAGCAAGCAGGTGTAACTATATTACCTTT 
CTCACCGAATAATATCAGTGAGGATTTAGAGATTATTGCAGGAAATGCTTTTCGTCCAGA 
TAACAATGAAGAGTTGGCTTATGTTATTGAAAAGGGCTATCATTTTAAACGATATCATGA 
ATTTCTCGGAGATTTTATGCGTCAGTTCACTAGTCTAGGTGTAGCTGGGGCACATGGAAA 
AACCTCAACGACAGGTTTATTAGCTCATGTTTTAAAAAATATTACAGACACTTCTTTCCT 
AATTGGAGATGGTACAGGACGTGGTTCTGCTAATGCTAATTACTTTGTGTTTGAAGCTGA 
TGAATACGAACGTCATTTTATGCCGTACCATCCAGAATACTCAATTATTACCAATATTGA 
TTTTGACCATCCTGATTATTTTACAGGCCTAGAGGACGTATTCAATGCCTTTAATGACTA 
TGCTAAGCAAGTTCAAAAAGGTTTATTCATTTATGGAGAAGATCCAAAACTTCATGAAAT 
CACTTCTGAGGCACCAATATATTATTATGGTTTTGAAGATTCAAATGATTTTATAGCAAA 
AGACATCACTCGAACTGTTAATGGTTCTGACTTTAAGGTTTTCTATAACCAAGAAGAAAT 
TGGTCAGTTTCATGTACCAGCATACGGTAAACATAATATCTTAAATGCAACTGCTGTTAT 
TGCTAACCTTTACATAATGGGAATTGATATGGCATTAGTAGCTGAGCATTTGAAGACATT 
TTCAGGGGTAAAGCGTCGTTTTACTGAGAAGATTATTGACGATACTGTCATTATTGATGA 
CTTTGCTCACCATCCTACTGAGATTATTGCGACATTAGATGCTGCTCGACAAAAATACCC 
GTCAAAAGAAATTGTAGCTATTTTCCAACCGCATACGTTCACTCGTACGATAGCTCTTTT 
AGACGAATTTGCCCATGCCTTGAGTCAAGCGGATAGCGTTTATCTCGCTCAAATATATGG 
TTCTGCTAGAGAAGTAGATAATGGTGAGGTGAAGGTAGAAGATTTAGCTGCTAAGATTGT 
CAAACACTCAGATTTAGTGACAGTCGAAAATGTCTCGCCTTTACTCAATCATGATAATGC 
TGTCTATGTCTTTATGGGTGCTGGAGACATTCAATTGTATGAGCGCTCTTTTGAAGAATT 
ATTAGCTAACCTAACTAAAAATACACAA 

SEQ ID NO. 4602 
STRAIN 1169NT 

AAAAGCAGGCTCTAGTGACGTTGACAAATATTATTTTACCCAACGTGGTTTAGAGCAAGC 
AGGTGTAACTATATTACCTTTCTCACCGAATAATATCAGTGAGGATTTAGAGATTATTGC 
AGGAAATGCTTTTCGTCCAGATAACAATGAAGAGTTGGCTTATGTTATTGAAAAGGGCTA 
TCATTTTAAACGATATCATGAATTTCTCGGAGATTTTATGCGTCAGTTCACTAGTCTAGG 
TGTAGCTGGGGCACATGGAAAAACCTCAACGACAGGTTTATTAGCTCATGTTTTAAAAAA 
TATTACAGACACTTCTTTCCTAATTGGAGATGGTACAGGACGTGGTTCTGCTAATGCTAA 
TTACTTTGTGTTTGAAGCTGATGAATACGAACGTCATTTTATGCCGTACCATCCAGAATA 
CTCAATTATTACCAATATTGATTTTGACCATCCTGATTATTTTACAGGCCTAGAGGACGT 
ATTCAATGCCTTTAATGACTATGCTAAGCAAGTTCAAAAAGGTTTATTCATTTATGGAGA 
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AGATCCAAAACTTCATGAAATCACTTCTGAGGCACCAATATATTATTATGGTTTTGAAGA 
TTCAAATGATTTTATAGCAAAAGACATCACTCGAACTGTTAATGGTTCTGACTTTAAGGT 
TTTCTATAACCAAGAAGAAATTGGTCAGTTTCATGTACCAGCATACGGTAAACATAATAT 
CTTAAATGCAACTGCTGTTATTGCTAACCTTTACATAATGGGAATTGATATGGCATTAGT 
AGCTGAGCATTTGAAGACATTTTCAGGGGTAAAGCGTCGTTTTACTGAGAAGATTATTGA 
CGATACTGTCATTATTGATGACTTTGCTCACCATCCTACTGAGATTATTGCGACATTAGA 
TGCTGCTCGACAAAAATACCCGTCAAAAGAAATTGTAGCTATTTTCCAACCGCATACGTT 
CACTCGTACGATAGCTCTTTTAGACGAATTTGCCCATGCCTTGAGTCAAGCGGATAGCGT 
TTATCTCGCTCAAATATATGGTTCTGCTAGAGAAGTAGATAATGGTGAGGTGAAGGTAGA 
AGATTTAGCTGCTAAGATTGTCAAACACTCAGATTTAGTGACAGTCGAAAATGTCTCGCC 
TTTACTCAATCATGATAATGCTGTCTATGTCTTTATGGGTGCTGGAGACATTCAATTGTA 
TGAGCGCTCTTTTGAAGAATTATTAGCTAACCTAACTAAAAATACACAA 

SEQ ID NO. 4603 
STRAIN 090 

AAAGCAGGCTCTAGTGACGTTGACAAATATTATTTTACCCAACGTGGTTTAGAGCAAGCA 
GGTGTAACTATATTACCTTTCTCACCGAATAATATCAGTGAGGATTTAGAGATTATTGCA 
GGAAATGCTTTTCGTCCAGATAACAATGAAGAGTTGGCTTATGTTATTGAAAAGGGCTAT 
CATTTTAAACGATATCATGAATTTCTCGGAGATTTTATGCGTCAGTTCACTAGTCTAGGT 
GTAGCTGGGGCACATGGAAAAACCTCAACGACAGGTTTATTAGCTCATGTTTTAAAAAAT 
ATTACAGACACTTCTTTCCTAATTGGAGATGGTACAGGACGTGGTTCTGCTAATGCTAAT 
TACTTTGTGTTTGAAGCTGATGAATACGAACGTCATTTTATGCCGTACCATCCAGAATAC 
TCAATTATTACCAATATTGATTTTGACCATCCTGATTATTTTACAGGCCTAGAGGACGTA 
TTCAATGCTTTTAATGACTATGCTAAGCAAGTTCAAAAAGGTTTATTCATTTATGGAGAA 
GATTCAAAACTTCATGAAATCACTTCTAAGGCACCAATATATTATTATGGTTTTGAAGAT 
TCAAATGATTTTATAGCAAAAGACATCACTCGAACTGTTAATGGTTCTGACTTTAAGGTT 
TTCTATAACCAAGAAGAAATTGGTCAGTTTCATGTACCAGCATACGGTAAACATAATATC 
TTAAATGCAACTGCTGTTATTGCTAACCTTTACATAATGGGAATTGATATGGCATTAGTA 
GCTGAGCATTTGAAGACATTTTCAGGGGTAAAACGTCGTTTTACTGAGAAGATTATTGAC 
GATACTGTCATTATTGATGACTTTGCTCACCATCCTACTGAGATTATTGCGACATTAGAT 
GCTGCTCGACAAAAATACCCGTCAAAAGAAATTGTAGCTATTTTCCAACCGCATACGTTC 
ACTCGTACGATAGCTCTTTTAGACGATTTTGCCCATGCTTTGAGTCAAGCGGATAGCGTT 
TATCTTGCT CAAAT ATATGGT TCTGCTAGAGAAGT AGAT AATGGTGAGGTGAAGGT AGAA 
GATTTAGCTGCTAAGATTGTCAAACACTCAGATTTAGTGACAGTCGAAAATGTCTCGCCT 
TTACTCAATCATGATAATGCTGTCTATGTCTTTATGGGTGCTGGAGACATTCAATTGTAT 
GAGCGCTCTTTTGAAGAATTATTAGCTAACCTAACTAAAAATACACAA 

SEQ ID NO. 4604 
STRAIN H36B 

AAAAGCAGGCTCTAGTgACGTTgACAAATATtATTTTACTCAACGTGGTTtAGAGCAAGCAGGT 

ATAACTATATTACCTTTCTCACCGAATAATATCAGTGAGGATTTAGAGATTATTGCAGGA 

AATGCTTTTCGTCCAGATAACAATGAAGAGTTGGCTTATGTTATTGAAAAGGGCTATCAT 

TTTAAACGATATCATGAATTTCTCGGAGATTTTATGCGTCAGTTCACTAGTCTAGGTGTA 

GCTGGGGCACATGGAAAAACCTCAACGACAGGTTTATTAGCTCATGTTTTAAAAAATATT 

ACAGACACTTCTTTCCTAATTGGAGATGGTACAGGACGTGGTTCTGCTAATGCTAATTAC 

TTTGTGTTTGAAGCTGATGAATACGAACGTCATTTTATGCCGTACCATCCAGAATACTCA 

ATTATTACCAATATTGATTTTGACCATCCTGATTATTTTACAGGCCTAGAGGACGTATTC 

AATGCTTTTAATGACTATGCTAAGCAAGTTCAAAAAGGTTTATTCATTTATGGAGAAGAT 

CCAAAACTTCATGAAATCACTTCTGAGGCACCAATATATTATTATGGTTTTGAAGATTCA 

AATGATTTTATAGCAAAAGATATCACTCGAACTGTTAATGGTTCTGACTTTAAGGTTTTC 

TATAACCAAGAAGAAATTGGTCAGTTTCACGTACCAGCATACGGTAAACATAATATCTTA 

AATGCAACTGCTGTTATTGCTAACCTTTACATAATGGGAATTGATATGGCATTAGTAGCT 

GAGCATTTGAAGACATTTTCAGGGGTAAAACGTCGTTTTACTGAGAAAATTATTGACGAT 

ACTGTCATTATTGATGACTTTGCTCACCATCCTACTGAGATTATTGCGACATTAGATGCT 

GCTCGACAAAAATACCCGTCAAAAGAAATTGTAGCTATTTTCCAACCGCATACGTTCACT 

CGTACGATAGCTCTTTTAGACGAATTTGCCCATGCCTTGAGTCAAGCGGATAGCGTTTAT 

CTCGCTCAAATATATGGTTCTGCTAGAGAAGTAGATAATGGTGAGGTGAAGGTAGAAGAT 

TTAGCTGCTAAGATTGTCAAACACTCAGATTTAGTGACAGTCGAAAATGTCTCGCCTTTA 

CTCAATCATGATAATGCTGTCTATGTCTTTATGGGTGCTGGAGACATTCAATTGTATGAG 

CGCTCTTTTGAAGAATTATTAGCTAACCTAACTAAAAATACACAA 

SEQ ID NO. 4605 
STRAIN 18RS21 

AAAGCAGGCTCTAGTGACGTTGACAAATATTATTTTACCCAACGTGGTTTAGAGCAAGCA 
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GGTGTAACTATATTACCTTTCTCACCGAATAATATCAGTGAGGATTTAGAGATTATTGCA 
GGAAATGCTTTTCGTCCAGATAACAATGAAGAGTTGGCTTATGTTATTGAAAAGGGCTAT 
CATTTTAAACGATATCATGAATTTCTCGGAGATTTTATGCGTCAGTTCACTAGTCTAGGT 
GTAGCTGGGGCACATGGAAAAACCTCAACGACAGGTTTATTAGCTCATGTTTTAAAAAAT 
ATTACAGACACTTCTTTCCTAATTGGAGATGGTACAGGACGTGGTTCTGCTAATGCTAAT 
TACTTTGTGTTTGAAGCTGATGAATACGAACGTCATTTTATGCCGTACCATCCAGAATAC 
TCAATTATTACCAATATTGATTTTGACCATCCTGATTATTTTACAGGCTTAGAGGACGTA 
TTCAATGCCTTTAATGACTATGCTAAGCAAGTTCAAAAAGGTTTATTCATTTATGGAGAA 
GATCCAAAACTTCATGAAATCACTTCTGAGGCACCAATATATTATTATGGTTTTGAAGAT 
TCAAATGATTTTATAGCAAAAGACATCACTCGAACTGTTAATGGTTCTGACTTTAAGGTT 
TTCTATAACCAAGAAGAAATTGGTCAGTTTCATGTACCAGCATACGGTAAACATAATATC 
TTAAATGCAACTGCTGTTATTGCTAACCTTTACATAATGGGAATTGATATGGCATTAGTA 
GCTGAGCATTTGAAGACGTTTTCAGGGGTAAAGCGTCGTTTTACTGAGAAGATTATTGAC 
GATACTGTCATTATTGATGACTTTGCTCACCATCCTACTGAGATTATTGCGACATTAGAT 
GCTGCTCGACAAAAATACCCGTCAAAAGAAATTGTAGCTATTTTCCAACCGCATACGTTC 
ACTCGTACGATAGCTCTTTTAGACGAATTTGCCCATGCCTTGAGTCAAGCGGATAGCGTT 
TATCTCGCTCAAATATATGGTTCTGCTAGAGAAGTAGATAATGGTGAGGTGAAGGTAGAA 
GATTTAGCTGCTAAGATTGTCAAACACTCAGATTTAGTGACAGTCGAAAATGTCTCGCCT 
TTACTCAATCATGATAATGCTGTCTATGTCTTTATGGGTGCTGGAGACATTCAATTGTAT 
GAGCGCTCTTTTGAAGAATTATTAGCTAACCTAACTAAAAATACACAA 

SEQ ID NO. 4606 
STRAIN M732 

AAAAGCAGGCTCTAGTGACGTtGACAAATAtTATTTTACCCAACGTGGTTTAGAGCAAGCAG 

GTGTAACTATATTACCTTTCTCACCGAATAATATCAGTGAGGATTTAGAGATTATTGCAG 

GAAATGCTTTTCGTCCAGATAACAATGAAGAGTTGGCTTATGTTATTGAAAAGGGCTATC 

ATTTTAAACGATATCATGAATTTCTCGGAGATTTTATGCGTCAGTTCACTAGTCTAGGTG 

TAGCTGGGGCACATGGAAAAACCTCAACGACAGGTTTATTAGCTCATGTTTTAAAAAATA 

TTACAGACACTTCTTTCCTAATTGGAGATGGTACAGGACGTGGTTCTGCTAATGCTAATT 

ACTTTGTGTTTGAAGCTGATGAATACGAACGTCATTTTATGCCGTACCATCCAGAATACT 

CAATTATTACCAATATTGATTTTGACCATCCTGATTATTTTACAGGCCTAGAGGACGTAT 

TCAATGCCTTTAATGACTATGCTAAGCAAGTTCAAAAAGGTTTATTCATTTATGGAGAAG 

ATCCAAAACTTCATGAAATCACTTCTGAGGCACCAATATATTATTATGGTTTTGAAGATT 

CAAATGATTTTATAGCAAAAGACATCACTCGAACTGTTAATGGTTCTGACTTTAAGGTTT 

TCTATAACCAAGAAGAAATTGGTCAGTTTCATGTACCAGCATACGGTAAACATAATATCT 

TAAATGCAACTGCTGTTATTGCTAACCTTTACATAATGGGAATTGATATGGCATTAGTAG 

CTGAGCATTTGAAGACATTTTCAGGGGTAAAGCGTCGTTTTACTGAGAAGATTATTGACG 

ATACTGTCATTATTGATGACTTTGCTCACCATCCTACTGAGATTATTGCGACATTAGATG 

CTGCTCGACAAAAATACCCGTCAAAAGAAATTGTAGCTATTTTCCAACCGCATACGTTCA 

CTCGTACGATAGCTCTTTTAGACGAATTTGCCCATGCCTTGAGTCAAGCGGATAGCGTTT 

ATCTCGCTCAAATATATGGTTCTGCTAGAGAAGTAGATAATGGTGAGGTGAAgGTAGAAG 

ATTTAGCTGCTAAgATTGTCAAACACTCAGATTTAGTGACAGTCGAAAATGTCTCGCCTT 

TACTCAATCATGATAATGCTGTCTATGTCTTTATGGGTGCTGGAGACATTCAATTGTATG 

AGCGCTCTTTTGAAGAATTATTAGCTAACCTAACTAAAAATACACAA 

SEQ ID NO. 4607 
STRAIN M781 

AAAGCAGGCTCTAGTGACGTtGACAAATATTATTTTACCCAACGTGGTTTAGAGCAAGCAG 

GTGTAACTATATTACCTTTCTCACCGAATAATATCAGTGAGGATTTAGAGATTATTGCAG 

GAAATGCTTTTCGTCCAGATAACAATGAAGAGTTGGCTTATGTTATTGAAAAGGGCTATC 

ATTTTAAACGATATCATGAATTTCTCGGAGATTTTATGCGTCAGTTCACTAGTCTAGGT 

GTAGCTGGGGCACATGGAAAAACCTCAACGACAGGTTTATTAGCTCATGTTTTAAAAAA 

TATTACAGACACTTCTTTCCTAATTGGAGATGGTACAGGACGTGGTTCTGCTAATGCTAA 

TTACTTTGTGTTTGAAGCTGATGAATACGAACGTCATTTTATGCCGTACCATCCAGAATA 

CTCAATTATTACCAATATTGATTTTGACCATCCTGATTATTTTACAGGCCTAGAGGACGT 

ATTCAATGCCTTTAATGACTATGCTAAGCAAGTTCAAAAAGGTTTATTCATTTATGGAGA 

AGATCCAAAACTTCATGAAATCACTTCTGAGGCACCAATATATTATTATGGTTTTGAAGA 

TTCAAATGATTTTATA(GCAAAAGACATCACTCGAACTGTTAATGGTTCTGACTTTAAGGT 

TTTCTATAACCAAGAAGAAATTGGTCAGTTTCATGTACCAGCATACGGTAAACATAATAT 

CTTAAATGCAACTGCTGTTATTGCTAACCTTTACATAATGGGAATTGATATGGCATTAGT 

AGCTGAGCATTTGAAGACATTTTCAGGGGTAAAGCGTCGTTTTACTGAGAAGATTATTGA 

CGATACTGTCATTATTGATGACTTTGCTCACCATCCTACTGAGATTATTGCGACATTAGA 

TGCTGCTCGACAAAAATACCCGTCAAAAGAAATTGTAGCTATTTTCCAACCGCATACGTT 

CACTCGTACGATAGCTCTTTTAGACGAATTTGCCCATGCCTTGAGTCAAGCGGATAGCGT 
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TTATCTCGCTCAAATATATGGTTCTGCTAGAGAAGTAGATAATGGTGAGGTGAAGGTAGA 
AGATTTAGCTGCTAAGATTGTCAAACACTCAGATTTAGTGACAGTCGAAAATGTCTCGCC 
TTTACTCAAT CATGATAATGCTGT CTATGTCTTTATGGGTGCTGGAGACATTCAATTGTA 
TGAGCGCTCTTTTGAAGAATTATTAGCTAACCTAACTAAAAATACACAA 

SEQ XD NO. 4608 
STRAIN CJB110 

AAAAAGCAGGCTCTAGTGACGTtGACAAATAtTATTTTACCCAACGTGGTTTAGAGCAAGCA 

GGTGTAACTATATTACCTTTCTCACCGAATAATATCAGTGAGGATTTAGAGATTATTGCA 

GGAAATGCTTTTCGTCCAGATAACAATGAAGAGTTGGCTTATGTTATTGAAAAGGGCTAT 

CATTTTAAACGATATCATGAATTTCTCGGAGATTTTATGCGTCAGTTCACTAGTCTAGGT 

GTAGCTGGGGCACATGGAAAAACCTCAACGACAGGTTTATTAGCTCATGTTTTAAAAAAT 

ATTACAGACACTTCTTTCCTAATTGGAGATGGTACAGGACGTGGTTCTGCTAATGCTAAT 

TACTTTGTGTTTGAAGCTGATGAATACGAACGTCATTTTATGCCGTACCATCCAGAATAC 

TCAATTATTACCAATATTGATTTTGACCATCCTGATTATTTTACAGGCCTAGAGGACGTA 

TTCAATGCTTTTAATGACTATGCTAAGCAAGTTCAAAAAGGTTTATTCATTTATGGAGAA 

GATTCAAAACTTCATGAAATCACTTCTAAGGCACCAATATATTATTATGGTTTTGAAGAT 

TCAAATGATTTTATAGCAAAAGACATCACTCGAACTGTTAATGGTTCTGACTTTAAGGTT 

TTCTATAACCAAGAAGAAATTGGTCAGTTTCATGTACCAGCATACGGTAAACATAATATC 

TTAAATGCAACTGCTGTTATTGCTAACCTTTACATAATGGGAATTGATATGGCATTAGTA 

GCTGAGCATTTGAAGACATTTTCAGGGGTAAAACGTCGTTTTACTGAGAAGATTATTGAC 

GATACTGTCATTATTGATGACTTTGCTCACCATCCTACTGAGATTATTGCGACATTAGAT 

GCTGCTCGACAAAAATACCCGTCAAAAGAAATTGTAGCTATTTTCCAACCGCATACGTTC 

ACTCGTACGATAGCTCTTTTAGACGATTTTGCCCATGCTTTGAGTCAAGCGGATAGCGTT 

TATCTTGCTCAAATATATGGTTCTGCTAGAGAAGTAGATAATGGTGAGGTGAAGGTAGAA 

GATTTAGCTGCTAAGATTGTCAAACACTCAGATTTAGTGACAGTCGAAAATGTCTCGCCT 

TTACTCAATCATGATAATGCTGTCTATGTCTTTATGGGTGCTGGAGACATTCAATTGTAT 

GAGCGCTCTTTTGAAGAATTATTAGCTAACCTAACTAAAAATACACAA 

SEQ ZD NO. 4609 

STRAIN JM9130013 (reverse complement) 

GTTCAAAAAAGCAGGCTCTAGTGACGTTGACAAATATTATTTTACTCAACGTGGTTTAGA 
GCAAGCAGGTATAACTATATTACCTTTCTCACCGAATAATATCAGTGAGGATTTAGAGAT 
TATTGCAGGAAATGCTTTTCGTCCAGATAACAATGAAGAGTTGGCTTATGTTATTGAAAA 
GGGCTATCATTTTAAACGATATCATGAATTTCTCGGAGATTTTATGCGTCAGTTCACTAG 
TCTAGGTGTAGCTGGGGCACATGGAAAAACCTCAACGACAGGTTTATTAGCTCATGTTTT 
AAAAAATATTACAGACACTTCTTTCCTAATTGGAGATGGTACAGGACGTGGTTCTGCTAA 
TGCTAATTACTTTGTGTTTGAAGCTGATGAATACGAACGTCATTTTATGCCGTACCATCC 
AGAATACTCAATTATTACCAATATTGATTTTGACCATCCTGATTATTTTACAGGCCTAGA 
GGACGTATTCAATGCTTTTAATGACTATGCTAAGCAAGTTCAAAAAGGTTTATTCATTTA 
TGGAGAAGATCCAAAACTTCATGAAATCACTTCTGAGGCACCAATATATTATTATGGTTT 
TGAAGATTCAAATGATTTTATAGCAAAAGATATCACTCGAACTGTTAATGGTTCTGACTT 
TAAGGTTTTCTATAACCAAGAAGAAATTGGTCAGTTTCACGTACCAGCATACGGTAAACA 
TAATATCTTAAATGCAACTGCTGTTATTGCTAACCTTTACATAATGGGAATTGATATGGC 
ATTAGTAGCTGAGCATTTGAAGACATTTTCAGGGGTAAAACGTCGTTTTACTGAGAAAAT 
TATTGACGATACTGTCATTATTGATGACTTTGCTCACCATCCTACTGAGATTATTGCGAC 
ATTAGATGCTGCTCGACAAAAATACCCGTCAAAAGAAATTGTAGCTATTTTCCAACCGCA 
TACGTTCACTCGTACGATAGCTCTTTTAGACGAATTTGCCCATGCCTTGAGTCAAGCGGA 
TAGCGTTTATCTCGCTCAAATATATGGTTCTGCTAGAGAAGTAGATAATGGTGAGGTGAA 
GGTAGAAGATTTAGCTGCTAAGATTGTCAAACACTCAGATTTAGTGACAGTCGAAAATGT 
CTCGCCTTTACTCAATCATGATAATGCTGTCTATGTCTTTATGGGTGCTGGAGACATTCA 
ATTGTATGAGCGCTCTTTTGAAGAATTATTAGCTAACCTAACTAAAAATACACAA 

SEQ ID NO. 4610 

STRAIN COH1 reverse complement 

CAGGCTCTAGTGACGTGACAAATATtATTTTACCCAACGTGGTTAGAGCAAGCAGGTGTAA 

CTATATTACCTTTCTCACCGAATAATATCAGTGAGGATTTAGAGATTATTGCAGGAAATG 

CTTTTCGTCCAGATAACAATGAAGAGTTGGCTTATGTTATTGAAAAGGGCTATCATTTTA 

AACGATATCATGAATTTCTCGGAGATTTTATGCGTCAGTTCACTAGTCTAGGTGTAGCTG 

GGGCACATGGAAAAACCTCAACGACAGGTTTATTAGCTCATGTTTTAAAAAATATTACAG 

ACACTTCTTTCCTAATTGGAGATGGTACAGGACGTGGTTCTGCTAATGCTAATTACTTTG 

TGTTTGAAGCTGATGAATACGAACGTCATTTTATGCCGTACCATCCAGAATACTCAATTA 

TTACCAATATTGATTTTGACCATCCTGATTATTTTACAGGCCTAGAGGACGTATTCAATG 

CCTTTAATGACTATGCTAAGCAAGTTCAAAAAGGTTTATTCATTTATGGAGAAGATCCAA 
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AACTTCATGAAATCACTTCTGAGGCACCAATATATTATTATGGTTTTGAAGATTCAAATG 
ATTTTATAGCAAAAGACATCACTCGAACTGTTAATGGTTCTGACTTT7VAGGTTTTCTATA 
ACCAAGAAGAAATTGGTCAGTTTCATGTACCAGCATACGGTAAACATAATATCTTAAATG 
CAACTGCTGTTATTGCTAACCTTTACATAATGGGAATTGATATGGCATTAGTAGCTGAGC 
ATTTGAAGACATTTTCAGGGGTAAAGCGTCGTTTTACTGAGAAGATTATTGACGATACTG 
TCATTATTGATGACTTTGCTCACCATCCTACTGAGATTATTGCGACATTAGATGCTGCTC 
GACAAAAATACCCGTCAAAAGAAATTGTAGCTATTTTCCAACCGCATACGTTCACTCGTA 
CGATAGCTCTTTTAGACGAATTTGCCCATGCCTTGAGTCAAGCGGATAGCGTTTATCTCG 
CTCAAATATATGGTTCTGCTAGAGAAGTAGATAATGGTGAGGTGAAGGTAGAAGATTTAG 
CTGCTAAGATTGTCAAACACTCAGATTTAGTGACAGTCGAAAATGTCTCGCCTTTACTCA 
ATCATGATAATGCTGTCTATGTCTTTATGGGTGCTGGAGACATTCAATTGTATGAGCGCT 
CTTTTGAAGAATTATTAGCTAACCTAACTAAAAATACACAA 

SEQ ID NO. 4611 
STRAIN 2603 

atgtcaaaaacttatcattttattggtattaaaggatccggaatgagtgccctagcactg 

atgcttcatcaaatgggacataacgtccaaggaagtgacgttgacaaatattattttacc 

caacgtggtttagagcaagcaggtgtaactatattacctttctcaccgaataatatcagt 

gaggatttagagattattgcaggaaatgcttttcgtccagataacaatgaagagttggct 

tatgttattgaaaagggctatcaatttaaacgatatcatgaatttctcggagattttatg 

cgtcagttcactagtctaggtgtagctggggcacatggaaaaacctcaacgacaggttta 

ttagctcatgttttaaaaaatattacagacacttctttcctaattggagatggtacagga 

cgtggttctgctaatgctaattactttgtgtttgaagctgatgaatacgaacgtcatttt 

atgccgtaccatccagaatactcaattattaccaatattgattttgaccatcctgattat 

tttacaggcttagaggacgtattcaatgcctttaatgactatgctaagcaagttcaaaaa 

ggtttattcatttatggagaagatccaaaacttcatgaaatcacttctgaggcaccaata 

tattattatggttttgaagattcaaatgattttatagcaaaagacatcactcgaactgtt 

aatggttctgactttaaggttttctataaccaagaagaaattggtcagtttcatgtacca 

gcatacggtaaacataatatcttaaatgcaactgctgttattgctaacctttacataatg 

ggaattgatatggcattagtagctgagcatttgaagacgttttcaggggtaaagcgtcgt 

tttactgagaagattattgacgatactgtcattattgatgactttgctcaccatcctact 

gagattattgcgacattagatgctgctcgacaaaaatacccgtcaaaagaaattgtagct 

attttccaaccgcatacgttcactcgtacgatagctcttttagacgaatttgcccatgcc 

ttgagtcaagcggatagcgtttatctcgctcaaatatatggttctgctagagaagtagat 

aatggtgaggtgaaggtagaagatttagctgctaagattgtcaaacactcagatttagtg 

acagtcgaaaatgtctcgcctttactcaatcatgataatgctgtctatgtctttatgggt 

gctggagacattcaattgtatgagcgctcttttgaagaattattagctaacctaactaaa 
aatacacaa 

SEQ ID NO. 4612 

STRAIN COH1 reverse complement 

CAGGCTCTAGTGACGTtGACAAATAtTATTTTACCCAACGTGGtTTAGAGCAAGCAGGTGTAA 

CTATATTACCTTTCTCACCGAATAATATCAGTGAGGATTTAGAGATTATTGCAGGAAATG 

CTTTTCGTCCAGATAACAATGAAGAGTTGGCTTATGTTATTGAAAAGGGCTATCATTTTA 

AACGATATCATGAATTTCTCGGAGATTTTATGCGTCAGTTCACTAGTCTAGGTGTAGCTG 

GGGCACATGGAAAAACCTCAACGACAGGTTTATTAGCTCATGTTTTAAAAAATATTACAG 

ACACTTCTTTCCTAATTGGAGATGGTACAGGACGTGGTTCTGCTAATGCTAATTACTTTG 

TGTTTGAAGCTGATGAATACGAACGTCATTTTATGCCGTACCATCCAGAATACTCAATTA 

TTACCAATATTGATTTTGACCATCCTGATTATTTTACAGGCCTAGAGGACGTATTCAATG 

CCTTTAATGACTATGCTAAGCAAGTTCAAAAAGGTTTATTCATTTATGGAGAAGATCCAA 

AACTTCATGAAATCACTTCTGAGGCACCAATATATTATTATGGTTTTGAAGATTCAAATG 

ATTTTATAGCAAAAGACATCACTCGAACTGTTAATGGTTCTGACTTTAAGGTTTTCTATA 

ACCAAGAAGAAATTGGTCAGTTTCATGTACCAGCATACGGTAAACATAATATCTTAAATG 

CAACTGCTGTTATTGCTAACCTTTACATAATGGGAATTGATATGGCATTAGTAGCTGAGC 

ATTTGAAGACATTTTCAGGGGTAAAGCGTCGTTTTACTGAGAAGATTATTGACGATACTG 

TCATTATTGATGACTTTGCTCACCATCCTACTGAGATTATTGCGACATTAGATGCTGCTC 

GACAAAAATACCCGTCAAAAGAAATTGTAGCTATTTTCCAACCGCATACGTTCACTCGTA 

CGATAGCTCTTTTAGACGAATTTGCCCATGCCTTGAGTCAAGCGGATAGCGTTTATCTCG 

CTCAAATATATGGTTCTGCTAGAGAAGTAGATAATGGTGAGGTGAAGGTAGAAGATTTAG 

CTGCTAAGATTGTCAAACACTCAGATTTAGTGACAGTCGAAAATGTCTCGCCTTTACTCA 

ATCATGATAATGCTGTCTATGTCTTTATGGGTGCTGGAGACATTCAATTGTATGAGCGCT 

CTTTTGAAGAATTATTAGCTAACCTAACTAAAAATACACAA 

SEQ ID NO. 4613 
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STRAIN A909 frame: 2 

DKYYFTQRGLEQAGVT ILPFS PNNI SEDLE 1 1 AGNAFRPDNNEELAYVIEKG YH FKRYHE 
FLGDl^QFTSLGVAGAHGKTSTTGLLAHVLKNITDTSFLIGDGTGRGSANANYFVFEAD 
EYERHFMPYHPEYSIITNIDFDHPDYFTGLEDVFNAFNDYAKQVQKGLFIYGEDPKLHEI 
TSEAPIYYYGFEDSNDFIAKDITRTVNGSDFKVFYNQEEIGQFHVPAYGKHNILNATAVI 
ANLYIMGI DMALVAEHLKT FSGVBCRRFTEKI I DDT VI I DDFAHHPTE I IATLDAARQKYP 
SKE I VAI FQPHTFTRT IALLDEFAHALSQADSVYLAQIYGSAREVDNGEVKVEDLAAKI V 
KHS DLVT VENVS PLLNHDNAVYVFMGAGDI QL YERS FEELLANLTKNTQ 

SEQ ID NO. 4614 
STRAIN 1169NT frame: 2 

KAGS S DVDKYYFTQRGLEQAGVT I L P FS PNN I SE DLE I IAGNAFRPDNNEE LAYVI EKGY 
HFKRYHE FLGDFMRQFTSLGVAGAHGKTSTTGLLAHVLKNITDTSFLIGDGTGRGSANAN 
YFVFEADEYERHFMPYHPEYSIITNIDFDHPDYFTGLEDVFNAFNDYAKQVQKGLFIYGE 
DPKLHEITSEAPIYYYGFEDSNDFIAKDITRTVNGSDFKVFYNQEEIGQFHVPAYGKHNI 
LNAT AVI ANLYIMGI DMALVAEHLKT FSGVKRRFTEKI IDDTVI I DDFAHHPTE 1 1 ATLD 
AARQKYPSKEIVAIFQPHTFTRTIALLDEFAHALSQADSVYLAQIYGSAREVDNGEVKVE 
DLAAKIVKHSDLVTVENVSPLLNHDNAVYVFMGAGDIQLYERS FEELLANLTKNTQ 

SEQ ID NO. 4615 
STRAIN 090 FRAME : 1 

KAGSSDVDKYYFTQRGLEQAGVTILPFSPNNISEDLEIIAGNAFRPDNNEELAYVIEKGY 
HFKRYHEFLGDFMRQFTSLGVAGAHGKTSTTGLLAHVLKNITDTSFLIGDGTGRGSANAN 
YFVFEADEYERHFMPYHPE YS I ITNI DFDHPDYFTGLE DVFNAFNDYAKQVQKGLFI YGE 
DSKLHEITSKAPIYYYGFEDSNDFIAKDITRTVNGSDFKVFYNQEEIGQFHVPAYGKHNI 
LNATAVIANLYIMGI DMALVAEHLKTFSGVKRRFTEKIIDDTVII DDFAHHPTE I IATLD 
AARQKYPSKEIVAI FQPHTFTRT I ALLDDFAHALSQADSVYLAQIYGSAREVDNGEVKVE 
DLAAKIVKHSDLVTVENVSPLLNHDNAVYVFMGAGDIQLYERSFEELLANLTKNTQ 

SEQ ID NO. 4616 
STRAIN H36B frame: 2 

KAGSSDVDKYYFTQRGLEQAGITILPFSPNNISEDLEIIAGNAFRPDNNEELAYVIEKGY 
HFKRYHE FLGD FMRQFT S LGVAGAHGKT STTGLLAHVLKN ITDT S FLI GDGTGRGS ANAN 
YFVFEADEYERHFMPYHPEYSIITNIDFDHPDYFTGLEDVFNAFNDYAKQVQKGLFIYGE 
DPKLHE ITSEAPI YYYGFEDSNDFI AKDITRTVNGS DFKVFYNQEE IGQFHVPAYGKHN I 
LNATAVIANLYIMGI DMALVAEHLKTFSGVKRRFTEKI IDDTVI I DDFAHHPTEI IATLD 
AARQKYPSKEIVAI FQPHTFTRT IALLDEFAHALSQADSVYLAQIYGSAREVDNGEVKVE 
DLAAKIVKHSDLVTVENVSPLLNHDNAVYVFMGAGDIQL YERS FEELLANLTKNTQ 

SEQ ID NO. 4617 
STRAIN 18RS21 frame: 1 

KAGS S DVDKYYFTQRGLEQAGVT I LP FS PNN I SEDLE 1 1 AGNAFRPDNNEELAYVIEKGY 
HFKRYHE FLGD FMRQ FT SLGVAGAHGKTSTTGLLAHVLKN I TDTS FLI GDGTGRGS ANAN 
YFVFEADEYERHFMPYHPEYSIITNIDFDHPDYFTGLEDVFNAFNDYAKQVQKGLFIYGE 
DPKLHE IT SEAP I YYYGFEDSNDFIAKDITRTVNGSDFKVFYNQEE IGQFHVPAYGKHN I 
LNAT AVI ANLY IMG I DMALVAEHLKT FSGVKRRFTEKI I DDT VI I DDFAHH PTE 1 1 ATLD 
AARQKYPSKEIVAI FQPHTFTRTIALLDEFAHALSQADSVYLAQIYGSAREVDNGEVKVE 
DLAAKIVKHS DLVT VENVS PLLNHDNAVYVFMGAGDIQLYERS FEELLANLTKNTQ 

SEQ ID NO. 4618 
STRAIN M732 frame: 2 

KAGSS DVDKYYFTQRGLEQAGVT ILPFS PNN I SEDLE I IAGNAFRPDNNEELAYVI EKGY 
HFKRYHEFLGDFMRQFTSLGVAGAHGKTSTTGLLAHVLKNITDTSFLIGDGTGRGSANAN 
YFVFEADE YE RHFMPYHPEYS I ITNI DFDHPDYFTGLE DVFNAFNDYAKQVQKGLFI YGE 
DPKLHEITSEAPIYYYGFEDSNDFIAKDITRTVNGSDFKVFYNQEEIGQFHVPAYGKHNI 
LNATAVIANLYIMGI DMALVAEHLKT FSGVKRRFTEKI I DDTVI I DDFAHHPTE 1 1 ATLD 
AARQKYP SKE I VAI FQPHTFTRT I ALLDEFAHALSQADSVYLAQIYGS ARE VDNGEVKVE 
DLAAKIVKHS DLVTVENVS PLLNHDNAVYVFMGAGDIQLYERS FEELIiANLTKNTQ 

SEQ ID NO. 4619 

STRAIN 0M9130013 frame: 2 

FKKAGSSDVDKYYFTQRGLEQAGIT ILPFS PNNISEDLEIIAGNAFRPDNNEELAYVIEK 
GYHFKRYHE FLGD FMRQ FT SLGVAGAHGKTSTTGLLAHVLKN IT DTS FLI GDGTGRGS AN 
ANYFVFEADEYERHFMPYHPEYSIITNIDFDHPDYFTGLEDVFNAFNDYAKQVQKGLFIY 
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GEDPKLHEITSEAPIYYYGFEDSNDFIAKDITRTVNGSDFKVFYNQEEIGQFHVPAYGKH 
NILNATAVIANLYIMGIDMALVAEHLKTFSGVKRRFTEKIIDDTVIIDDFAHHPTEIIAT 
LDAARQKYPSKEIVAIFQPHTFTRTIALLDEFAHALSQADSVYLAQIYGSAREVDNGEVK 
VEDLAAKIVKHSDLVTVENVSPLLNHDNAVYVFMGAGDIQLYERSFEELLANLTKNTQ 

SEQ ID NO. 4620 
STRAIN M781 frame: 1 

KAGSSDVDKYYFTQRGLEQAGVTILPFSPNNISEDLEIIAGNAFRPDNNEELAYVIEKGY 
HFKRYHEFLGDFMRQFTSLGVAGAHGKTSTTGLLAHVLKNITDTSFLIGDGTGRGSANAN 
YFVFEADEYERHFMPYHPEYSIITNIDFDHPDYFTGLEDVFNAFNDYAKQVQKGLFIYGE 
DPKLHEITSEAPIYYYGFEDSNDFIAKDITRTVNGSDFKVFYNQEEIGQFHVPAYGKHNI 
LNATAVIANLYIMGI DMALVAEHLKTFSGVKRRFTEKI I DDTVI I DDFAHHPTEI IATLD 
AARQKYPSKEIVAIFQPHTFTRTI7VLLDEFAHALSQADSVYLAQIYGSAREVDNGEVKVE 
DLAAKIVKHSDLVTVENVSPLLNHDNAVYVFMGAGDIQLYERSFEELLANLTKNTQ 

SEQ ID NO. 4621 ! 
STRAIN CJB110 frame: 3 

KAGSSDVDKYYFTQRGLEQAGVTILPFSPNNISEDLEIIAGNAFRPDNNEELAYVIEKGY 
HFKRYHEFLGDFMRQFTSLGVAGAHGKTSTTGLLAHVLKNITDTSFLIGDGTGRGSANAN 
YFVFEADEYERHFMPYHPEYSIITNIDFDHPDYFTGLEDVFNAFNDYAKQVQKGLFIYGE 
DSKLHEITSKAPIYYYGFEDSNDFIAKDITRTVNGSDFKVFYNQEEIGQFHVPAYGKHNI 
LNATAV IAN L Y IMG I DMALVAEHLKT FSGVKRRFTEKI I DDTVI I DDFAHH PTE I IATLD 

AARQKYPSKEIVAIFQPHTFTRTIALLDDFAHALSQADSVYLAQIYGSAREVDNGEVKVE 
DLAAKIVKHSDLVTVENVSPLLNHDNAVYVFMGAGDIQLYERSFEELLANLTKNTQ 

SEQ ID NO. 4622 
STRAIN 2603 frame: 1 

MSKTYHFIGIKGSGMSALALMLHQMGHNVQGSDVDKYYFTQRGLEQAGVTILPFS PNNIS 

EDLEIIAGNAFRPDNNEELAYVIEKGYQFKRYHEFLGDBMRQFTSLGVAGAHGKTSTTGL 

LAHVLKNITDTSFLIGDGTGRGSANANYFVFEADEYERHFMPYHPEYSIITNIDFDHPDY 

FTGLEDVFNAFNDYAKQVQKGLFIYGEDPKLHEITSEAPIYYYGFEDSNDFIAKDITRTV 

NGSDFKVFYNQEE I GQFHVPAYGKHN I LNATAVIANLYIMGI DMALVAEHLKT FSGVKRR 

FTEKI I DDTVI I DDFAHHPTEI I ATLDAARQKYPSKEIVAIFQPHTFTRTIALLDEFAHA 

LSQADSVYLAQIYGSAREVDNGEVKVEDLAAKIVKHSDLVTVENVSPLLNHDNAVYVFMG 
AGDIQLYERSFEELLANLTKNTQ 

SEQ ID NO. 4623 
STRAIN COH1 frame: 3 

GSSDVDKYYFTQRGLEQAGVTILPFSPNNISEDLEIIAGNAFRPDNNEELAYVIEKGYHF 

KRYHEFLGDTORQFTSLGVAGAHGKTSTTGLLAHVLBCNITDTSFLIGDGTGRGSANANYF 

VFEADEYERHFMPYHPEYSIITNIDFDHPDYFTGLEDVFNAFNDYAKQVQKGLFIYGEDP < 

KLHEITSEAPIYYYGFEDSNDFIAKDITRTVNGSDFKVFYNQEEIGQFHVPAYGKHNILN 

ATAVI ANLYIMGI DMALVAEHLKTFSGVKRRFTEKI I DDTVI I DDFAHHPTEI I AT LDAA 

RQKYPSKEIVAIFQPHTFTRTIALLDEFAHALSQADSVYLAQIYGSAREVDNGEVKVEDL 

AAKIVKHSDLVTVENVSPLLNHDNAVYVFMGAGDIQLYERSFEELLANLTKNTQ 

SEQ ID NO. 4701 
STRAIN A909 

TATTTTTTAACAACAAAAAAAGGAAAAGAGCTAAGGAAAAATGCAGAAAA 
ATTCTATGGAGAATATAAAGAAAATCCAGAAGAATATCATCAAATAGCTA 
AAGATAAAGCAAGTGAATATTCAAATTTAGCTGTTGATACTTTTAAAGAT 
TATAAAGGTAAATTTGAATCAGGTGAATTGACAACAGAGGATATCGTCTC 
AGCCGTTAAGGAAAAAAGCGGAGAAGTAGTTGACTTTGCTAATGATTTTG 
TCAATCAAGCTAAATCAAAATTCTCAGACGAGGATACTGCTAAAAAAGAA 
GATAAGGCTCCTGAAACAAAAGTAGAAGATATTGTCATTGATTATAAAGA 
AAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4702 
STRAIN H36B 

TATTTTTTAACAACAAAAAAAGGAAAAGAGCTAAGGAAAAATGCAGAAAA 
ATTCTATGGAGAATATAAAGAAAATCCAGAAGAATATCATCAAATAGCTA 
AAGATAAAGCAAGTGAATATTCAAATTTAGCTGTTGATACTTTTAAAGAT 
TATAAAGGTAAATTTGAATCAGGTGAATTGACAACAGAGGATATCGTCTC 
AGCCGTTAAGGAAAAAAGCGGAGAAGTAGTTGACTTTGCTAATGATTTTG 
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TCAATCAAGCTAAATCAAAATTCTCAGACGAGGATACTGCTAAAAAAGAA 
GATAAGGCTCCTGAAACAAAAGTAGAAGATATTGTCATTGATTATAAAGA 
AAACACAGAAGATAAAGAAAAA 

SEQ ZD NO. 4703 
STRAIN 18RS21 

TATTTTTTAACAACAAAAAAAGGAAAAGAGCTAAGGAAAAATGCAGAAAA 
ATTCTATGGAGAATATAAAGAAAATCCAGAAGAATATCATCAAATAGCTA 
AAGATAAAGCAAGTGAATATTCAAATTTAGCTGTTGATACTTTTAAAGAT 
TATAAAGGTAAATTTGAATCAGGTGAATTGACAACAGAGGATATCGTCTC 
AGCCGTTAAGGAAAAAAGCGGAGAAGTAGTTGACTTTGCTAATGATTTTG 
TCAATCAAGCTAAATCAAAATTCTCAGACGAGGATACTGCTAAAAAAGAA 
GATAAGGCTCCTGAAACAAAAGTAGAAGATATTGTCATTGATTATAAAGA 
AAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4704 
STRAIN M732 

TATTTTTTAACAACAAAAAAAGGAAAAGAGCTAAGGAAAAATGCAGAAAA 
ATTCTATGGAGAAT ATAAAGAAAATCCAGAAGAATATCAT CAAATAGCTA 
AAGATAAAGCAAGTGAATATTCAAATTTAGCTGTTGATACTTTTAAAGAT 
TATAAAGGTAAATTTGAATCAGGTGAATTGACAACAGAGGATATCGTCTC 
AGCCGTTAAGGAAAAAAGCGGAGAAGTAGTTGACTTTGCTAATGATTTTG 
TCAATCAAGCTAAATCAAAATTCTCAGACGAGGATACTGCTAAAAAAGAA 
GATAAGGCTCCTGAAACAAAAGTAGAAGATATTGTCATTGATTATAAAGA 
AAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4705 
STRAIN COH1 

TATTTTTTAACAACAAAAAAAGGAAAAGAGCTAAGGAAAAATGCAGAAAA 
ATTCTATGGAGAATATAAAGAAAATCCAGAAGAATATCATCAAATAGCTA 
AAGATAAAGCAAGTGAATATTCAAATTTAGCTGTTGATACTTTTAAAGAT 
TATAAAGGTAAATTTGAATCAGGTGAATTGACAACAGAGGATATCGTCTC 
AGCCGTTAAGGAAAAAAGCGGAGAAGTAGTTGACTTTGCTAATGATTTTG 
TCAATCAAGCTAAATCAAAATTCTCAGACGAGGATACTGCTAAAAAAGAA 
GATAAGGCTCCTGAAACAAAAGTAGAAGATATTGTCATTGATTATAAAGA 
AAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4706 
STRAIN M781 

TATTTTTTAACAACAAAAAAAGGAAAAGAGC 

TAAGGAAAAATGCAGAAAAATTCTATGGAGAATATAAAGAAAATCCAGAA 
GAATATCATCAAATAGCTAAAGATAAAGCAAGTGAATATTCAAATTTAGC 
TGTTGATACTTTTAAAGATTATAAAGGTAAATTTGAATCAGGTGAATTGA 
CAACAGAGGATATCGTCTCAGCCGTTAAGGAAAAAAGCGGAGAAGTAGTT 
GACTTTGCTAATGATTTTGTCAATCAAGCTAAATCAAAATTCTCAGACGA 
GGATACTGCTAAAAAAGAAGATAAGGCTCCTGAAACAAAAGTAGAAGATA 
TTGTCATTGATTATAAAGAAAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4707 
STRAIN 2603 

tattttttaacaacaaaaaaaggaaaagagctaaggaaaaatgcagaaaa 
attctatggagaatataaagaaaatccagaagaatatcatcaaatagcta 
aagataaagcaagtgaatattcaaatttagctgttgatacttttaaagat 
tataaaggtaaatttgaatcaggtgaattgacaacagaggatatcgtctc 
agccgttaaggaaaaaagcggagaagtagttgactttgctaatgattttg 
tcaatcaagctaaatcaaaattctcagacgaggatactgctaaaaaagaa 
gataaggctcctgaaacaaaagtagaagatattgtcattgattataaaga 
aaacacagaagataaagaaaaa 

SEQ ID NO. 4708 
STRAIN 090 

TATTTTTTaACaACAAAAAAAGGAAAAGAGCTAAGGAAAAATGCAGAAAA 
ATTCTATGGAGAATATAAAGAAAATCCAGAAGAATATCATCAAATAGCTA 
AAGATAAAGCAAGTGAATATTCAAATTTAGCTGTTGATACTTTTAAAGAT 
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TATAAAGGTAAATTTGAATCAGGTGAATTGACAACAGAGGATATCGTCTC 
AGCCGTTAAGGAAAAAAGCGGAGAAGTAGTTGACTTTGCTAATGATTTTG 
TCAATCAAGCTAAATCAAAATTCTCAGACGAGGATACTGCTAAAAAAGAa 
GATAAGGCTCCTGAAACAAAaGTAGAAGATATTGTCATTGATTATAAAGA 
AAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4709 
STRAIN CJB110 

TATTTTTTAAC7VACAAAAAAAGGAAAAGAGCTAAGGAAAA 

ATGCAGAAAAATTCTATGGAGAATATAAAGAAAATCCAGAAGAATATCAT 

CAAATAGCTAAAGATAAAGCAAGTGAATATTCAAATTTAGCTGTTGATAC 

TTTTAAAGATTATAAAGGTAAATTTGAATCAGGTgAATTGACAACAGAGG 

ATATCGTCTCAGCCGtTAAGGAAAAAAGCGGAGAAGTAGTTGACTTTGCT 

AATGATTTTGTCAATCAAGCTAAATCAAAATTCTCAGACGAGGATACTGC 

TAAAAAAGAAGATAAGGCTCCTGAAACAAAAGTAGAAGATATTGTCATTG 

ATTATAAAGAAAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4710 
STRAIN 1169NT 

TATTTTTTAACAACAAAAAAAGGAAAAGAGCTAAGGAAA 

AATGCAGAAAAATTCTATGGAGAATATAAAGAAAATCCAGAAGAATATCA 

TCAAATAGCTAAAGATAAAGCAAGTGAATATTCAAATTTAGCTGTTGATA 

CTTTTAAAGATTATAAAGGTAAATTTGAATCAGGTGAATTGACAACAGAG 

GATATCGTCTCAGCCGTTAAGGAAAAAAGCGGAGAAGTAGTTGACTTTGC 

TAATGATTTTGTCAATCAAGCTAAATCAAAATTCTCAGATGAGGATACTG 

CTAAAAAAGAAAATAAGGCTCCTGAAACAAAAGTAGAAGATATTGTCATT 

GATTATAAAGAAAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4711 
STRAIN JM9130013 

TATTTTTTAaCAACAAAAAAAGGAAAAGAGCTAAGGAAAA 

ATGCAGAAAAATTCTATGGAGAATATAAAGAAAATCCAGAAGAATATCAT 

CAAATAGCTAAAGATAAAGCAAGTGAATATTCAAATTTAGCTGTTGATAC 

TTTTAAAGATTATAAAGGTAAATTTGAATCAGGTGAATTGACAACAGAGG 

ATATCGTCTCAGCCGTTAAGGAAAAAAGCGGAGAAGTAGTTGACTTTGCT 

AATGATTTTGTCAATCAAGCTAAATCAAAATTCTCAGACGAGGATACTGC 

TAAAAAAGAAGATAAGGCTCCTGAAACAAAAGTAGAAGATATTGTCATTG 

ATTATAAAGAAAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4712 

STRAIN 2603 

YFLTTKKGKELRKNAEKFYGEYKENPEEYHQIAKDKASEYSNLAVDTFKDYKGKFESGEL 
TTEDIVSAVKEKSGEWDFANDFVNQAKSKFSDEDTAKKEDKAPETKVEDIVIDYKENTE 
DKEK 

SEQ ID NO. 4713 
STRAIN A909 frame: 1 

YFLTTKKGKELRKNAEKFYGEYKENPEEYHQIAKDKASEYSNLAVDTFKDYKGKFESGEL 
TTEDIVSAVKEKSGEWDFANDFVNQAKSKFSDEDTAKKEDKAPETKVEDIVIDYKENTE 
DKEK 

SEQ ID NO. 4714 
STRAIN H36B frame: 1 

YFLTTKKGKELRKNAEKFYGEYKENPEEYHQIAKDKASEYSNLAVDTFKDYKGKFESGEL 
TTEDIVSAVKEKSGEWDFANDFVNQAKSKFSDEDTAKKEDKAPETKVEDIVIDYKENTE 
DKEK 

SEQ ID NO. 4715 
STRAIN 18RS21 frame: 1 

YFLTTKKGKELRKNAEKFYGEYKENPEEYHQIAKDKASEYSNLAVDTFKDYKGKFESGEL 
TTEDIVSAVKEKSGEWDFANDFVNQAKSKFSDEDTAKKEDKAPETKVEDIVIDYKENTE 
DKEK 

SEQ ID NO. 4716 
STRAIN M732 frame: 1 
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YFLTTKKGKELRKNAEKFYGEYKENPEEYHQIAKDKASEYSNLAVDTFKDYKGKFESGEL 

TTEDIVSAVKEKSGEWDFANDFVNQAKSKFSDEDTAKKEDKAPETKVEDIVIDYKENTE 
DKEK 

SEQ ID NO. 4717 
STRAIN _COHl frame: 1 

YFLTTKKGKELRKNAEKFYGEYKENPEEYHQIAKDKASEYSNLAVDTFKDYKGKFESGEL 

TTEDIVSAVKEKSGEWDFANDFVNQAKSKFSDEDTAKKEDKAPETKVEDIVIDYKENTE 
DKEK 

SEQ ID NO. 4718 
STRAIN _M781 frame: 1 

YFLTTKKGKELRKNAEKFYGEYKENPEEYHQIAKDKASEYSNLAVDTFKDYKGKFESGEL 
TTEDIVSAVKEKSGEWDFANDFVNQAKSKFSDEDTAKKEDKAPETKVEDIVI DYKENTE 
DKEK 

SEQ ID NO. 4719 
STRAIN _090 frame: 1 

YFLTTKKGKELRKNAEKFYGEYKENPEEYHQIAKDKASEYSNLAVDTFKDYKGKFESGEL 

TTE DIVSAVKEKSGEVVD FAN DEVNQAKSKFSDEDTAKKEDKAPETKVEDI VI DYKENTE 
DKEK 

SEQ ID NO. 4720 

STRAIN _CJB110 frame: 1 

YFLTTKKGKELRKNAEKFYGEYKENPEEYHQIAKDKASEYSNLAVDTFKDYKGKFESGEL 

TTEDIVSAVKEKSGEWDFANDFVNQAKSKFSDEDTAKKEDKAPETKVEDIVIDYKENTE 
DKEK 

SEQ ID NO. 4721 
STRAIN 1169NT frame: 1 

YFLTTKKGKELRKNAEKFYGEYKENPEEYHQIAKDKASEYSNLAVDTFKDYKGKFESGEL 

TTE DIVSAVKEKSGEWDFANDFVNQAKSKFSDEDTAKKENKAPETKVED I VI DYKENTE 
DKEK 

SEQ ID NO. 4722 

STRAIN _JM9130013 frame: 1 

YFLTTKKGKELRKNAEKFYGEYKENPEEYHQIAKDKASEYSNLAVDTFKDYKGKFESGEL 

TTE DIVSAVKEKSGEWDFANDFVNQAKSKFSDEDTAKKEDKAPETKVED I VI DYKENTE 
DKEK 

SEQ ID NO: 4801 
STRAIN 2603 

aatagtactgagacaagtgcttcagtagttcctactacaaatactatcgt 
tcaaactaatgacagtaatcctaccgcaaaatttgtatcagaatcaggac 
aatctgtaataggtcaagtaaaaccagataattctgcggcgcttacaaca 
gttgacacgcctcatcatatttcagctccagatgctttaaaaacaactca 
atcaagtcctgtcgttgagagtacttctactaagttaactgaagagactt 
acaaacaaaaagatggtcaagatttagccaacatggtgagaagtggtcaa 
gttactagtgaggaactcgttaatatggcatacgatattattgctaaaga 
aaacccatctttaaatgcagtcattactactagacgccaagaagctattg 
aagaggctagaaaacttaaagataccaatcagccgtttttaggtgttccc 
ttgttagtcaaggggttagggcacagtattaaaggtggtgaaaccaataa 
tggcttgatctatgcagatggaaaaattagcacatttgacagtagctatg 
tcaaaaaatataaagatttaggatttattattttaggacaaacgaacttt 
ccagagtatgggtggcgtaatataacagattctaaattatacggtctaac 
gcataatccttgggatcttgctcataatgctggtggctcttctggtggaa 
gtgcagcagccattgctagcggaatgacgccaattgctagcggtagtgat 
gctggtggttctatccgtattccatcttcttggacgggcttggtaggttt 
aaaaccaacaagaggattggtgagtaatgaaaagccagattcgtatagta 
cagcagttcattttccattaactaagtcatctagagacgcagaaacatta 
ttaacttatctaaagaaaagcgatcaaacgctagtatcagttaatgattt 
aaaatctttaccaattgcttatactttgaaatcaccaatgggaacagaag 
ttagtcaagatgctaaaaacgctattatggacaacgtcacattcttaaga 
aaacaaggattcaaagtaacagagatagacttaccaattgatggtagagc 
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attaatgcgtgattattcaaccttggctattggcatgggaggagcttttt 

caacaattgaaaaagacttaaaaaaacatggttttactaaagaagacgtt 

gatcctattacttgggcagttcatgttatttatcaaaattcagataaggc 

tgaacttaagaaatctattatggaagcccaaaaacatatggatgattatc 

gtaaggcaatggagaagcttcacaagcaatttcctattttcttatcgcca 

acgaccgcaagtttagcccctctaaatacagatccatatgtaacagagga 

agataaaagagcgatttataatatggaaaacttgagccaagaagaaagaa 

ttgctctctttaatcgccagtgggagcctatgttgcgtagaacacctttt 

acacaaattgctaatatgacaggactcccagctatcagtatcccgactta 

cttatctgagtctggtttacccatagggacgatgttaatggcaggtgcaa 

actatgatatggtattaattaaatttgcaactttctttgaaaaacatcat 

ggttttaatgttaaatggcaaagaataatagataaagaagtgaaaccatc 

tactggcctaatacagcctactaactccctctttaaagctcattcatcat 

tagtaaatttagaagaaaattcacaagttactcaagtatctatctctaaa 

aaatggatgaaatcgtctgttaaaaataaaccatccgtaatggcatatca 
aaaagca 

SEQ ID NO: 4802 
STRAIN 090 

AATAGTACTGAGACAAGTGCTTCAGTAGTTCCTACTACAA 

ATACTATCGTTCAAACTAATGACAGTAATCCTACCGCAAAATTTGTATCA 

GAATCAGGACAATCTGTAATAGGTCAAGTAAAACCAGATMTTCTGCGGC 

GCTTACAACAGTTGACACGCCTCATCATATTTCAGCTCCAGATGCTTTAA 

AAACAACTCAATCAAGTCCTGTCGTTGAGAGTACTTCTACTAAGTTAACT 

GAAGAGACTTACAAACAAAAAGATGGTAAAGATTTAGCCAACATGGTGAG 

AAGTGGTCAAGTTACTAGTGAGGAACTCGTTAATATGGCATACGATATTA 

TTGCTAAAGAAAACCCATCTTTAAATGCAGTCATTACTACTAGACGCCAA 

GAAGCTATTGAAGAGGCTAGAAAACTTAAAGATACCAATCAGCCGTTTTT 

AGGTGTTCCCTTGTTAGTCAAGGGGTTAGGGCACAGTATTAAAGGTGGTG 

AAACCAATAATGGCTTGATCTATGCAGATGGAAAAATTAGCACATTTGAC 

AGTAGCTATGTCAAAAAATATAAAGATTTAGGATTTATTATTTTAGGACA 

AACGAACTTTCCAGAGTATGGGTGGCGTAATATAACAGATTCTAAATTAT 

ACGGTCTAACGCATAATCCTTGGGATCTTGCTCATAATGCTGGTGGCTCT 

TCTGGTGGAAGTGCAGCAGCCATTGCTAGCGGAATGACGCCAATTGCTAG 

CGGTAGTGATGCTGGTGGTTCTATCCGTATTCCATCTTCTTGGACGGGCT 

TGGTAGGTTTAAAACCAACAAGAGGATTGGTGAGTAATGAAAAGCCAGAT 

TCGTATAGTACAGCAGTTCATTTTCCATTAACTAAGTCATCTAGAGACGC 

AGAAACATTATTAACTTATCTAAAGAAAAGCGATCAAACGCTAGTATCAG 

TTAATGATTTAAAATCTTtACCAATTGCTTATACTTTGAAATCACCAATG 

GGAACAGAAGTTAGTCAAGATGCTAAAAACGCTATTATGGACAACGTCAC 

ATTCTTAAGAAAACAAGGATTCAAAGTAACAGAGATAGACTTACCAATTG 

ATGGTAGAGCATTAATGCGTGATTATTCAACCTTGGCTATTGGCATGGGA 

GGAGCTTTTTCAACAATTGAAAAAGACTTAAAAAAACATGGTTTTACTAA 

AGAAGACGTTGATCCTATTACTTGGGCAGTTCATGTTATTTATCAAAATT 

CAGATAAGGCTGAACTTAAGAAATCTATTATGGAAGCCCAAAAACATATG 

GATGATTATCGTAAGGCAATGGAGAAGCTTCACAAGCAATTTCCTATTTT 

CTTATCGCCAACGACCGCAAGTTTAGCCCCTCTAAATACAGATCCATATG 

TAACAGAGGAAGATAAAAGAGCGATTTATAATATGGAAAACTTGAGCCAA 

GAAGAAAGAATTGCTCTCTTTAATCGCCAGTGGGAGCCTATGTTGCGTAG 

AACACCTTTTACACAAATTGCTAATATGACAGGACTCCCAGCTATCAGTA 

TCCCGACTTACTTATCTGAGTCTGGTTTACCCATAGGGACGATGTTAATG 

GCAGGTGCAAACTATGATATGGTATTAATTAAATTTGCAACTTTCTTTGA 

AAAACATCATGGTTTTAATGTTAAATGGCAAAGAATAATAGATAAAGAAG 

TGAAACCATCTACTGGCCTAATACAGCCTACTAACTCCCTCTTTAAAGCT 

CATTCATCATTAGTAAATTTAGAAGAAAATTCACAAGTTACTCAAGTATC 

TATCTCTAAAAAATGGATGAAATCGTCTGTTAAAAATAAACCATCCGTAA 

TGGCATATCAAAAAGCA 

SEQ ID NO: 4803 
STRAIN A909 

TACTACAAATACTATCGTTCAAACTAATGACAGTAATCCTACCGCAAAAT 
TTGTATCAGAATCAGGACAATCTGTAATAGGTCAAGTAAAACCAGATAAT 
TCTGCGGCGCTTACAACAGTTGACACGCCTCATCATATTTCAGCTCCAGA 
TGCTTTAAAAACAACTCAATCAAGTCCTGTCGTTGAGAGTACTTCTACTA 
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AGTTAACTGAAGAGACTTACAAACAAAAAGATGGTCAAGATTTAGCCAAC 
ATGGTGAGAAGTGGTCAAGTTACTAGTGAGGAACTCGTTAATATGGCATA 
CGATATTATTGCTAAAGAAAACCCATCTTTAAATGCAGTCATTACTACTA 
GACGCCAAGAAGCTATTGAAGAGGCTAGAAAACTTAAAGATACCAATCAG 
CCGTTTTTAGGTGTTCCCTTGTTAGTCAAGGGGTTAGGGCACAGTATTAA 
AGGTGGTGAAACCAATAATGGCTTGATCTATGCAGATGGAAAAATTAGCA 
CATTTGACAGTAGCTATGTCAAAAAATATAAAGATTTAGGATTTATTATT 
TTAGGACAAACGAACTTTCCAGAGTATGGGTGGCGTAATATAACAGATTC 
TAAATTATACGGTCTAACGCATAATCCTTGGGATCTTGCTCATAATGCTG 
GTGGCTCTTCTGGTGGAAGTGCAGCAGCCATTGCTAGCGGAATGACGCCA 
ATTGCTAGCGGTAGTGATGCTGGTGGTTCTATCCGTATTCCATCTTCTTG 
GACGGGCTTGGTAGGTTTAAAACCAACAAGAGGATTGGTGAGTAATGAAA 
AGCCAGATTCGTATAGTACAGCAGTTCATTTTCCATTAAcTAAGTCATCT 
AGAGACGCAGAAACATTATTAACTTATCTAAAGAAAAGCGATCAAACGCT 
AGTATCAGTTAATGATTTAAAATCTTTACCAATTGCTTATACTTTGAAAT 
CACCAATGGGAACAGAAGTTAGTCAAGATGCTAAAAACGCTATTATGGAC 
AACGTCACaTTCTTAAGAAAACAAGGATTCAAAGTAACAGAGATAGACTT 
ACCAATTGATGGTAGAGCATTAATGCGTGATTATTCAACCTTGGCTATTG 
GCATGGGAGGAGCTTTTTCAACAATTGAAAAAGACTTAAAAAAACATGGT 
TTTACTAAAGAAGACGTTGATCCTATTACTTGGGCAGTTCATGTTATTTA 
TCAAAATTCAGATAAGGCTGAACTTAAGAAATCTATTATGGAAGCCCAAA 
AACATATGGATGATTATCGTAAGGCAATGGAGAAGCTTCACAAGCAATTT 
CCTATTTTCTTATCGCCAACGACCGCAAGTTTAGCCCCTCTAAATACAGA 
TCCATATGTaACAGAGGAAGATAAAAGAGCGATTTATAATATGGAAAACT 
TGAGCCAAGAAGAAAGAATTGCTCTCTTTAATCGCCAGTGGGAGCCTATG 
TTGCGTAGAACACCTTTTACACAAATTGCTAATATGACAGGACTCCCAGC 
TATCAGTATCCCGACTTACTTATCTGAGTCTGGTTTACCCATAGGGACGA 
TGTTAATGGCAGGTGCAAACTATGATATGGTATTAATTAAATTTGCAACT 
TTCTTTGAAAAACATCATGGTTTTAATGTTAAATGGCAAAGAATAATAGA 
TAAAGAAGTGAAACCATCTACTGGCCTAATACAGCCTACTAACTCCCTCT 
TTAAAGCTCATTCATCATTAGTAAATTTAGAAGAAAATTCA'CAAGTTACT 
CAAGTATCTATCTCTAAAAAATGGATGAAATCGTCTGTTAAAAATAAACC 
ATCCGTAATGGCATATCAAAAAGCA 

SEQ ID NO: 4804 
STRAIN COH1 

AATAGTACTGAGACAAGTGCTTCAGTAGCTCCTACTACAAAT 

ACTATCGTTCAAACTAATGACAGTAATCCTACCGCAAAATTTGCATCAGA 

ATCAGGACAATCTGTAATAGGTCAAGTAAAACCAGCTAATTCTGCGGCGC 

TTACAACAGTTGACACGCCTCATATTTCAGCTCCAGATGCTTTAAAAACA 

ACTCAATCAAGTCCTGTCGTTGAGAGTCCTTCTACTAAGTTAACTGAAGA 

GACATACAAACAAAAAGATGGTCAAGATTTAGCCAACATGGTGAGAAGTG 

GTCAAGTTACTAGTGAGGAACTCGTCAATATGGCATACGATATTATCGCT 

AAAGAAAACCCATCTTTAAATGCAGTCATTACTACTAGACGCCAAGAAGC 

CATTGAAGAGGCTAGAAAACTTAAAGATACTAATCAGCCGTTTTTAGGTG 

TTCCcTTGTTAGTCAAGGGGTTAGGGCACAGTATTAAAGGTGGTGAAACC 

AATAATGGCTTGATCTATGCAGATGGAAAAATTAGCACATTTGACAGTAG 

CTATGTCAAAAAATATAAAGATTTAGGATTTATTATTTTAGGACAAACGA 

ATTTTCCAGAGTATGGGTGGCGTAATATAACAGACTCTAAATTATACGGT 

CCAACGCATAATCCTTGGAATCTTGCTCATAACGCTGGTGGCTCTTCTGG 

TGGAAGTGCAGCAGCTATTGCTAGCGGAATGACGCCAATTGCTAGCGGCA 

GTGATGCTGGTGGTTCTATCCGTATTCCATCTTCTTGGACGGGCTTAGTA 

GGTTTAAAACCAACAAGAGGATTGGTGAGTAATGAAAAGCCAGATTCGTA 

TAGTACAGCAGTTCATTTTCCATTAACTAAGTCATCTAGAGACGCAGAAA 

CATTGTTAACTTACCTAAAGAAAAGCGATCAAACGCTAGTATCAGTTAAT 

GATTTAAAATCTTTACCAATTGCTTATACTTTGAAATCACCAATGGGAAC 

AGAAGTTAGTCAAGATGCTAAAAATGCTATTATGGACAACGTCACATTCT 

TAAGAAAACAAGGATTCAAAGTGACAGAGATAGATTtACCAATTGATGGT 

AGAGCATTAATGCGTGATTATTCAACCTTGGCTATTGGCATGGGAGGAGC 

TTTTTCAACAATTGAAAAAGACTTAAAAAAACATGGTTTTACTAAAGAAG 

ACGTTGATCCCATTACTTGGGCAGTTCATGTTATTTATCAAAATTCAGAT 

AAGGCTGAACTTAAGAAATCTATTGTGGAAGCCCAAAAACATATGGATGA 

TTATCGTAAGGCAATGGAGAAGCTTCACAAGCAATTTCCTATTTTCTTAT 

CGCCAACGACCGCAAgTTTAGCCCCTCTAAATACAGATCCATATGTAACA 
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GAGAAAGATAAAAGAGCGATTTATAATATGGAAAACTTGAGCCAAGAAGA 
AAGAATTGCTCTCTTTAATCGCCAGTGGGAGCCTATGTTGCGTAGAACAC 
CTTTTACACCAATTGCTAATAtGACAGGACTCCCAGCTATCAGTATCCCG 
ACTTACTTATCTGAGTCTGGTTTACCCATAGGGACGATGTTAATGGCAGG 
TGCAAACTATGATATGGTATTAATTAAATTTGCAACTTTCTTTGAAAAAC 
ATCATGGTTTTAATGTTAAATGGCAAAGAATAATAGATAAAGAAGTGAAA 
CCATCTGCTGACCTAATACAGCCTACTAACTCCCTCTTTAAAGCTCATTC 
ATCATTAGTAAATTTAGAAGAAAATTCACAAGTTACTCAAGTATCTATCT 
CTAAAAAATGGATGAAATCGTCTGTTAAAAATAAACCATCCGTAATGGCA 
TATCAAAAAGCA 

SEQ ID NO: 4805 
STRAIN M732 

TCAGTAGCTCCTACTACAAATACTATCGTTCAAACTAATGACAGTAATCC 
TACCGCAAAATTTGCATCAGAATCAGGACAATCTGTAATAGGTCAAGTAA 
AACCAGCTAATTCTGCGGCGCTTACAACAGTTGACACGCCTCATATTTCA 
GCTCCAGATGCTTTAAAAACAACTCAATCAAGTCCTGTCGTTGAGAGTCC 
TTCTACTAAGTTAACTGAAGAGACATACAAACAAAAAGATGGTCAAGATT 
TAGCCAACATGGTGAGAAGTGGTCAAGTTACTAGTGAGGAACTCGTCAAT 
ATGGCATACGATATTATCGCTAAAGAAAACCCATCTTTAAATGCAGTCAT 
TACTACTAGACGCCAAGAAGCCATTGAAGAGGCTAGAAAACTTAAAGATA 
CTAATCAGCCGTTTTTAGGTGTTCCCTTGTTAGTCAAGGGGTTAGGGCAC 
AGTATTAAAGGTGGTGAAACCAATAATGGCTTGATCTATGCAGATGGAAA 
AATTAGCACATTTGACAGTAGCTATGTCAAAAAATATAAAGATTTAGGAT 
TTATTATTTTAGGACAAACGAATTTTCCAGAGTATGGGTGGCGTAATATA 
ACAGACTCTAAATTATACGGTCnAACGCATAATCCTTGGGATCTTGCTCA 
TAACGCTGGTGGCTCTTCTGGTGGAAGTGCAGCAGCTATTGCTAGCGGAA 
TGACGCCAATTGCTAGCGGCAGTGATGCTGGTGGTTCTATCCGTATTCCA 
TCTTCTTGGACGGGCTTAGTAGGTTTAAAACCAACAAGAGGATTGGTGAG 
TAATGAAAAGCCAGATTCGTATAGTACAGCAGTTCATTTTCCATTAACTA 
AGTCATCTAGAGACGCAGAAACATTGTTAACTTACCTAAAGAAAAGCGAT 
CAAACGCTAGTATCAGTTAATGATTTAAAATCTTTACCAATTGCTTATAC 
TTTGAAATCACCAATGGGAACAGAAGTTAGTCAAGATGCTAAAAATGCTA 
TTATGGACAACGTCACATTCTTAAGAAAACAAGGATTCAAAGTGACAGAG 
ATAGATTTACCAATTGATGGTAGAGCATTAATGCGTGATTATTCAACCTT 
GGCTATTGGCATGGGAGGAGCTTTTTCAACAATTGAAAAAGACTTAAAAA 
AACATGGTTTTACTAAAGAAGACGTTGATCCCATTACTTGGGCAGTTCAT 
GTTATTTATCAAAATTCAGATAAGGCTGAACTTAAGAAATCTATTGTGGA 
AGCCCAAAAACATATGGATGATTATCGTAAGGCAATGGAGAAGCTTCACA 
AGCAATTTCCTATTTTCTTATCGCCAACGACCGCAAGTTTAGCCCCTCTA 
AATACAGATCCATATGTTACAGAGAAAGATAAAAGAGCGATTTATAATAT 
GGAAAACTTGAGCCAAGAAGAAAGAATTGCTCTCTTTAATCGCCAGTGGG 
AGCCTATGTTGCGTAGAACACCTTTTACACCAATTGCTAATATGACAGGA 
CTCCCAGCTATCAGTATCCCGACTTACTTATCTGAGTCTGGTTTACCCAT 
AGGGACGATGTTAATGGCAGGTGCAAACTATGATATGGTATTAATTAAAT 
TTGCAACTTTCTTTGAAAAACATCATGGTTTTAATGTTAAATGGCAAAGA 
ATAATAGATAAAGAAGTGAAACCATCTGCTGACCTAATACAGCCTACTAA 
CTCCCTCTTTAAAGCTCATTCATCATTAGTAAATTTAGAAGAAAATTCAC 
AAGTTACTCAAGTATCTATCTCTAAAAAATGGATGAAATCGTCTGTTAAA 
AATAAACCATCCGTAATGGCATATCAAAAAGCA 

SEQ ID NO: 4806 
STRAIN 18RS21 

AATAGTACTGAGACAAGTGCTTCAGTAGTTCCTACTACAAATACTATCGT 
TCAAACTAATGACAGTAATCCTACCGCAAAATTTGTATCAGAATCAGGAC 
AATCTGTAATAGGTCAAGTAAAACCAGATAATTCTGCGGCGCTTACAACA 
GTTGACACGCCTCATCATATTTCAGCTCCAGATGCTTTAAAAACAACTCA 
ATCAAGTCCTGTCGTTGAGAGTACTTCTACTAAGTTAACTGAAGAGACTT 
ACAAACAAAAAGATGGTCAAGATTTAGCCAACATGGTGAGAAGTGGTCAA 
GTTACTAGTGAGGAACTCGTTAATATGGCATACGATATTATTGCTAAAGA 
AAACCCATCTTTAAATGCAGTCATTACTACTAGACGCCAAGAAGCTATTG 
AAGAGGCTAGAAAACTTAAAGATACCAATCAGCCGTTTTTAGGTGTTCCC 
TTGTTAGTCAAGGGGTTAGGGCACAGTATTAAAGGTGGTGAAACCAATAA 
TGGCTTGATCTATGCAGATGGAAAAATTAGCACATTTGACAGTAGCTATG 



188 



WO 2004/018646 



PCT/US2003/026827 



SEQUENCE LISTING 



TCAAAAAATATAAAGATTTAGGATTTATTATTTTAGGACAAACGAACTTT 

CCAGAGTATGGGTGGCGTAATATAACAGATTCTAAATTATACGGTCTAAC 

GCATAATCCTTGGGATCTTGCTCATAATGCTGGTGGCTCTTCTGGTGGAA 

GTGCAGCAGCCATTGCTAGCGGAATGACGCCAATTGCTAGCGGTAGTGAT 

GCTGGTGGTTCTATCCGTATTCCATCTTCTTGGACGGGCTTGGTAGGTTT 

AAAACCAACAAGAGGATTGGTGAGTAATGAAAAGCCAGATTCGTATAGTA 

CAGCAGTTCATTTTCCATTAACTAAGTCATCTAGAGACGCAGAAACATTA 

TTAACTTATCTAAAGAAAAGCGATCAAACGCTAGTATCAGTTAATGATTT 

AAAATCTTTACCAATTGCTTATACTTTGAAATCACCAATGGGAACAGAAG 

TTAGTCAAGATGCTAAAAACGCTATTATGGACAACGTCACATTCTTAAGA 

AAACAAGGATTCAAAGTAACAGAGATAGACTTACCAATTGATGGTAGAGC 

ATTAATGCGTGATTATTCAACCTTGGCTATTGGCATGGGAGGAGCTTTTT 

CAACAATTGAAAAAGACTTAAAAAAACATGGTTTTACTAAAGAAGACGTT 

GATCCTATTACTTGGGCAGTTCATGTTATTTATCAAAATTCAGATAAGGC 

TGAACTTAAGAAATCTATTATGGAAGCCCAAAAACATATGGATGATTATC 

GTAAGGCAATGGAGAAGCTTCACAAGCAATTTCCTATTTTCTTATCGCCA 

ACGACCGCAAGTTTAGCCCCTCTAAATACAGATCCATATGTAACAGAGGA 

AGatAAAAGAGCGATTTATAATATGGAAAACTTGAGCCAAGAAGAAAGAA 

TTGCTCTCTTTAATCGCCAGTGGGAGCCTATGTTGCGTAGAACACCTTTT 

ACACAAATTGCTAATATGACAGGACTCCCAGCTATCAGTATCCCGACTTA 

CTTATCTGAGTCTGGTTTACCCATAGGGACGATGTTAATGGCAGGTGCAA 

ACTATGATATGGTATTAATTAAATTTGCAACTTTCTTTGAAAAACATCAT 

GGTTTTAATGTTAAATGGCAAAGAATAATAGATAAAGAAGTGAAACCATC 

TACTGGCCTAATACAGCCTACTAACTCCCTCTTTAAAGCTCATTCATCAT 

TAGTAAATTTAGAAGAAAATTCACAAGTTACTCAAGTATCTATCTCTAAA 

AAATGGATGAAATCGTCTGTTAAAAATAAACCATCCGTAATGGCATATCA 
AAAAGCA 

SEQ ID NO: 4807 
STRAIN M781 

TGCTTCAGTAGCTCCTACTACAAATACTATCGTTCAAACTAATGACAGTA 
ATCCTACCGCAAAATTTGCATCAGAATCAGGACAATCTGTAATAGGTCAA 
GTAAAACCAGCTAATTCTGCGGCGCTTACAACAGTTGACACGCCTCATAT 
TTCAGCTCCAGATGCTTTAAAAACAACTCAATCAAGTCCTGTCGTTGAGA 
GTCCTTCTACTAAGTTAACTGAAGAGACATACAAACAAAAAGATGGTCAA 
GATTTAGCCAACATGGTGAGAAGTGGTCAAGTTACTAGTGAGGAACTCGT 
CAATATGGCATACGATATTATCGCTAAAGAAAACCCATCTTTAAATGCAG 
TCATTACTACTAGACGCCAAGAAGCCATTGAAGAGGCTAGAAAACTTAAA 
GATACTAATCAGCCGTTTTTAGGTGTTCCCTTGTTAGTCAAGGGGTTAGG 
GCACAGTATtAAAGGTGGTGAAACCAATAATGGCTTGATCTATGCAGATG 
GAAAAATTAGCACATTTGACAGTAGCTATGTCAAAAAATATAAAGATTTA 
GGATTTATTATTTTAGGACAAACGaATTTTCCAGAGTATGGGTGGCGTAA 
TATAACAGACTCTAAATTATACGGTCCAACGCATAATCCTTGGAaTCTTG 
CTCATAACGCTGGTGGCTCTTCTGGTGGAAGTGCAGCAGCTATTGCTAGC 
GGAATGACGCCAATTGCTAGCGGCAGTGATGCTGGTGGTTCTATCCGTAT 
TCCATCTTCTTGGACGGGCTTAGTAGGTTTAAAACCAACAAGAGGATTGG 
TGAGTAATGAAAAGCCAGATTCGTATAGTACAGCAGTTCATTTTCCATTA 
ACTAAGTCATCTAGAGACGCAGAAACATTGTTAACTTACCTAAAGAAAAG 
CGATCAAACGCTAGTATCAGTTAATGATTTAAAaTCTTTACCAATTGCTT 
ATACTTTGAAATCACCAATGGGAACAGAAgTTAGTCAAGATGCTAAAAAT 
GCTATTATGGACAACGTCACATTCTTAAGAGAACAAGGATTCAAAGTGAC 
AGAGATAGATTTACCAATTGATGGTAGAGCATTAATGCGTGATTATTCAA 
CCTTGGCTATTGGCATGGGAGGAGCTTTTTCAACAATTGAAAAAGACTTA 
AAAAAACATGGTTTTACTAAAGAAGACGTTGATCCCATTACTTGGGCAGT 
TCATGTTATTTATCAAAATTCAGATAAGGCTGAACTTAAGAAATCTATTG 
TGGAAGCCCAAAAACATATGGATGATTATCGTAAGGCAATGGAGAAGCTT 
CACAAGCAATTTCCTATTTTCTTATCGCCAACGACCGCAAGTTTAGCCCC 
TCTAAATACAGATCCATATGTAACAGaGaAAGATAAAAGAGCGATTTATA 
ATATGGAAAACTTGAGCCAAGAAGAAAGAATTGCTCTCTTTAATCGCCAG 
TGGGAGCCTATGTTGCGTAGAACACCTTTTACACCAATTGCTAATAtGAC 
AGGACTCCCAGCTATCAGTATCCCGACTTACTTATCTGAGTCTGGTTTAC 
CCATAGGGACGATGTTAATGGCAGGTGCAAACTATGATATGGTATTAATT 
AAATTTGCAACTTTCTTTGAAAAACATCATGGTTTTAATGTTAAATGGCA 
AAGAATAATAGATAAAGAAGTGAAACCATCTGCTGACCTAATACAGCCTA 
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CTAACTCCCTCTTTAAAGCTCATTCATCATTAGTAAATTTAGAAGAAAAT 
TCACAAGTTACTCAAGTATCTATCTCTAAAAAATGGATGAAATCGTCTGT 
TAAAAATAAACCATCCGTAATGGCATATCAAAAAGCA 

SEQ ID NO: 4810 
STRAIN CJB110 

TAGTTCCTACTACAAATACTATCGTTCAAACTAATGACAGTAATCCTACC 
GCAAAATTTGTATCAGAATCAGGACAATCTGTAATAGGTCAAGTAAAACC 
AGATAATTCTGCGGCGCTTACAACAGTTGACACGCCTCATCATATTTCAG 
CTCCAGATGCTTTAAAAACAACTCAATCAAGTCCTGTCGTTGAGAGTACT 
TCTACTAAGTTAACTGAAGAGACTTACAAACAAAAAGATGGTAAAGATTT 
AGCCAACATGGTGAGAAGTGGTCAAGTTACTAGTGAGGAACTCGTTAATA 
TGGCATACGATATTATTGCTAAAGAAAACCCATCTTTAAATGCAGTCATT 
ACTACTAGACGCCAAGAAGCTATTGAAGAGGCTAGAAAACTTAAAGATAC 
CAATCAGCCGTTTTTAGGTGTTCCCTTGTTAGTCAAGGGGTTAGGGCACA 
GTATTAAAGGTGGTGAAACCAATAATGGCTTGATCTATGCAGATGGAAAA 
ATTAGCACATTTGACAGTAGCTATGTCAAAAAATATAAAGATTTAGGATT 
TATTATTTTAGGACAAACGAACTTTCCAGAGTATGGGTGGCGTAATATAA 
CAGATTCTAAATTATACGGTCTAACGCATAATCCTTGGGATCTTGCTCAT 
AATGCTGGTGGCTCTTCTGGTGGAAGTGCAGCAGCCATTGCTAGCGGAAT 
GACGCCAATTGCTAGCGGTAGTGATGCTGGTGGTTCTATCCGTATTCCAT 
CTTCTTGGACGGGCTTGGTAGGTTTAAAACCAACAAGAGGATTGGTGAGT 
CATGAAAAGCCAGATTCGTATAGTACAGCAGTTCATTTTCCATTAACTAA 
GTCATCTAGAGACGCAGAAACATTATTAACTTATCTAAAGAAAAGCGATC 
AAACGCTAGTATCAGTTAATGATTTAAAATCTTTACCAATTGCTTATACT 
TTGAAATCACCAATGGGAACAGAAGTTAGTCAAGATGCTAAAAACGCTAT 
TATGGACAACGTCACATTCTTAAGAAAACAAGGATTCAAAGTAACAGAGA 
TAGACTTACCAATTGATGGTAGAGCATTAATGCGTGATTATTCAACCTTG 
GCTATTGGCATGGGAgGAGCTTTTTCAACaATTGAAAAAGAcTTAaAAAA 
AcATGGTTTTACTAAAGAAGACGTTGATCCTATTACTTGGGCAGTTCATG 
TTATTTATCAAAATTCAGATAAGGCTGAACTTAAGAAATCTATTATGGAA 
GCCCAAAAACATATGGATGATTATCGTAAGGCAATGGAGAAGCTTCACAA 
GCAATTTCCTATTTTCTTATCGCCAACGACCGCAAGTTTAGCCCCTCTAA 
ATACAGATCCATATGTAACAGAGGAAGATAAAAGAGCGATTTATAATATG 
GAAAACTTGAGCCAAGAAGAAAGAATTGCTCTCTTTAATCGCCAGTGGGA 
GCCTATGTTGCGTAGAACACCTTTTACACAAATTGCTAATAtGACAGGAC 
TCCCAGCTATCAGTATCCCGACTTACTTATCTGAGTCTGGTTTACCCATA 
gGGACgATGTTAATGGCAGGTGCAAACTATGATATGGTATTAATTAAATT 
TGCAACTTTCTTTGAAAAACATCATGGTTTTAATGTTAAATGGCAAAGAA 
TAATAGATAAAGAAGTGAAACCATCTACTGGCCTAATACAGCCTACTAAC 
TCCCTCTTTAAAGCTCATTCATCATTAGTAAATTTAGAAGAAAATTCACA 
AGTTACTCAAGTATCTATCTCTAAAAAATGGATGAAATCGTCTGTTAAAA 
ATAAACCATCCGTAATGGCATATCAAAAAGCA 

SEQ ID NO: 4811 
STRAIN 1169NT 

AATAGTACTGAGACAAGTGCTTCAGTAGCTCCTACTACAAATACTATCGT 
TCAAACTAATGACAGTAATCCTACCGCAAAATTTGCATCAGAATCAGGAC 
AATCTGTAATATGTCAAGTAAAACCAGATAATTCTGCGGCGCTTACAACA 
GTTGACACGCCTCATATTTCAGCTCCAGATGATTTAAAAACAACTCAATC 
AAGTCCTGTCGTTGAGAGTACTTCTACTAAGTTAACTGAAGAGACATACA 
AACAAAAAGATGGTCAAGATTTAGCCAACATGGTGAGAAGTGGTCAAGTT 
ACTAGTGAGGAACTCGTCAATATGGCATACGATATTATTGCTAAAGAAAA 
CCCTTCTTTAAATGCAGTCATTACTACTAGACGCCAAGAAGCCATTGAAG 
AGGCTAGAAAACTTAAAGATACTAATCAGCCATTTTTAGGTGTTCCCTTG 
TTAGTCAAGGGGTTAGGGCACAGTATTAAAGGTGGTGAAACCAATAATGG 
CTTGATCTATGCAGATGGAAAAATtaGCACATTTGACAGTAGCTATGTCA 
AAAAATATAAAGATTTAGGATTTATTATTTTAGGACAAACGAACTTTCCA 
GAGTATGGGTGGCGTAATATAACAGATTCTAAATTATACGGTCCAACGCA 
TAACCCTCGGAATCTTGCTCATAATGCTGGTGGCTCTTCTGGTGGAAGTG 
CAGCAGCCATTGCTAGCGGrATGACGCCAATTGCTAGCGGTAGTGATGCT 
GGTGGTTCTATCCGtATTCCATCTTCTTGGACGGGCTTGGTAGGTTTAAA 
ACCAACAAGAGGATTGGTGAGTAATGAAAAGCCAGATTCGTATAGTACAG 
CAGTTCATTTTCCATTAACTAAGTCATCTAGAGACGCAGAAACATTATTA 
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ACTTATCTAAAGAAAAGCGATCAAACGCTAGTATCAGTTAATGATTTAAA 
ATCTTTACCAATTGCTTATACTTTGAAATCACCAATGGGAACAGAAGTTA 
GTCAAGATGCTAAAAACGCTATTATGGACAACGTCACATTCTTAAGAAAA 
CAAGGATTCAAAGTAACAGAGATAGACTTACCAATTGATGGTAGAGCATT 
AATGCGTGATTATTCAACCTTGGCTATTGGCATGGGAGGAGCTTTTTCAA 
CAATTGAAAAAGACTTAAAAAAACATGGTTTTACTAAAGAAGACGTTGAT 
CCTATTACTTGGGCAGTTCATGTTATTTATCAAAATTCAGATAAGGCTGA 
ACTTAAGAAATCTATTATGGAAGCCCAAAAACATATGGATGATTATCGTA 
AGGCAATGGAGAAGCTTCACAAGCAATTTCCTATTTTCTTATCGCCAACG 
ACCGCAAGTTTAGCCCCTCTAAATACAGAtCCATATGTAACAGAGGAAGA 
TAAAAGAGCGATTTATAATATGGAAAACTTGAGCCAAGAAGAAAGAATTG 
CTCTCTTTAATCGCCAGTGGGAGCCTATGTTGCGTAGAACACCTTTTACA 
CAAATTGCTAATATGACAGGACTCCCAGCTATCAGTATCCCGACTTACTT 
ATCTGAGTCTGGTTTACCCATAGGGACGATGTTAATGGCAGGTGCAAACT 
ATGATATGGTATTAATTAAATTTGCAACTTTCTTTGAAAAACATCATGGT 
TTTAATGTTAAATGGCAAAGAATAATAGATAAAGAAGTGAAACCATCTAC 
TGGCCTAATACAGCCTACTAACTCCCTCTTTAAAGCTCATTCATCATTAG 
TAAATTTAGAAGAAAATTCACAAGTTACTCAAGTATCTATCTCTAAAAAA 
TGGATGAAATCGTCTGTTAAAAATAAACCATCCGTAATGGCATATCAAAA 
AGCA 

SEQ ID NO: 4812 
STRAIN JM9130013 

TTCAGTAGCTCCTACTACAAATACTATCGTTCAAACTAATGACAGTAATC 
CTACCGCAAAATTTTCATCAGAATCAGGACAATCTGTAATAGGTCAAGTA 
AAACCAGCTAATTCTGTGGCGCTTACAACAGTTGACACGCCTCATATTTC 
AGCTCCAGATGCTTTAAAAACAACTCAATCAAGTCCTGTCGTTGAGAGTC 
CTTCTACTAAGTTAACTGAAGAGACATACAAACAAAAAGATGGTCAAGAG 
TTAGCCAACATGGTGAGAAGTGGTCAAGTTACTAGTGAGGAACTCGTCAA 
TATGGCATACGATATTATTGCTAAAGAAAACCCATCTTTAAATGCAGTCA 
TTACTACTAGACGCCAAGAAGCTATTGAAGAGGCTAGAAAACTTAAAGAT 
ACCAATCAGCCGTTTTTAGGTGTTCCCTTGTTAGTCAAGGGGTTAGGGCA 
CAGTATTAAAGGTGGTGAAACCAATAATGGCTTGATCTATGCAGGTGGAA 
AAATTAGCACATTTGACAGTAGCTATGTCAAAAAATATAAAGATTTAGGA 
TTTATTATTTTAGGACAAACGAACTTTCCAGAGTATGGATGGCGCAATAT 
AACAGATTCTAAATTATACGGTCCAACGCATAACCCTTGGAATCTTGCTC 
ATAATGCTGGTGGCTCTTCTGGTGGAAGTGCAGCAGTTATTGCTAGCGGG 
ATGACGCCAATTGCTAGCGGTAGTGATGCTGGTGGTTCTATCCGTATTCC 
ATCTTCTTGGACGGGCTTGGTAGGTTTAAAACCAACAAGAGGATTGGTGA 
GTAATGAAAAGCCAGATTCGTATAGTACAGCAGTTCATTTTCCATTAACT 
AAGTCATCTAGAGACGCAGAAACATTATTAACTTATCTAAAGAAAAGCGA 
TCAAACGCTAGTATCAGTTAATGATTTAAAATCTTTACCAATTGCTTATA 
CTTTGAAATCACCAATGGGAACAGAAGTTAGTCAAGATGCTAAAAATGCT 
ATTATGGACAACGTCATATTCTTAAGAAAACAAGGATTCAAAGTGACAGA 
GATAGACTTACCAATTGATGGTAGAGCATTAATGCGTGATTATTCAACCT 
TGGCTATTGGTATGGGAGGAGCTTTTTCAACAATTGAAAAAGACTTAAAA 
AAACATGGTTTTACTAAAGAAGACGTTGATCCCATTACTTGGGGAGTTCA 
TGTTATTTATCAAAATTCAGATAAGGCTGAACTTAAGAAATCTATTATGG 
AAGCCCAT^AAACATATGGATGATTATCGTAAGGCAATGGAGAAGCTTCAC 
AAGCAATTTCCTATTTTCTTATCGCCAACGACCGCAAGTTTAGCCCCTCT 
AAATACAGATCCATATGTAACAGAGGAAGATAAAAGAGCGATTTATAATA 
TGGAAAACTTGAGCCAAGAAGAAAGAATTGCTCTCTTTAATCGCCAGTGG 
GAGCCTATGTTGCGTAGAACACCTTTTACACAAATTGCTAATATGACAGG 
ACTCCCAGCTATCAGTATCCCGACTTACTTATCTGAGTCTGGTTTACCCA 
TAGGGACGATGTTAATGGCAGGTGCAAACTATGATATGGTATTAATTAAA 
TTTGCAACTTTCTTTGAAAAATATCATGGTTTTAATGTTAAATGGCAAAG 
AATAATAGATAAAGAAGTGAAACCATCTACTGGCCTAATACAGCCTACTA 
ACTCCCTCTTTAAAGCTCATTCATCATTAGTAAATTTAGAAGAAAATTCA 
CAAGTTACTCAAGTATCTATCTCTAAAAAATGGATGAAATCGTCTGTTAA 
AAATAAACCATCCGTAATGGCATAT 

SEQ ID NO: 4813 
STRAIN H36B 

CTTCAGTAGTTCCTACTACAAATACTATCGTTCAAACTAATGACAGTAAT 
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CCTACCGCAAAATTTTCATCAGAATCAGGACAATCTGTAATAGGTCAAGT 

AAAACCAGCTAATTCTGTGGCGCTTACAACAGTTGACACGCCTCATATTT 

CAGCTCCAGATGCTTTAAAAACAACTCAATCAAGTCCTGTCGTTGAGAGT 

CCTTCTACTAAGTTAACTGAAGAGACATACAAACAAAAAGATGGTCAAGA 

TTTAGCCAACATGGTGAGAAGTGGTCAAGTTACTAGTGAGGAACTCGTCA 

ATATGGCATaCGATAtTATTGCTAAAGAAAACCCATCTTTAAATGCAGTC 

ATTACTACTAGACGCCAAGAAGCTATTGAAGAGGCTAGAAAACTTAAAGA 

TACCAATCAGCCGTTTTTAGGTGTTCCCTTGTTAGTCAAGGGGTTAGGGC 

ACAGTATTAAAGGTGGTGAAACCAATAATGGCTTGATCTATGCAGGTGGA 

AAAATTAGCACATTTGACAGTAGCTATGTCAAAAAATATAAAGATTTAGG 

ATTTATTATTTTAGGACAAACGAACTTTCCAGAGTATGGATGGCGCAATA 

TAACAGATTCTAAATTATACGGTCCAACGCATAACCCTTGGAATCTTGCT 

CATAATGCTGGTGGCTCTTCTGGTGGAAGTGCAGCAGTTATTGCTAGCGG 

GATGACGCCAATTGCTAGCGGTAGTGATGCTGGTGGTTCTATCCGTATTC 

CATCTTCTTGGACGGGCTTGGTAGGTTTAAAACCAACAAGAGGATTGGTG 

AGTAATGAAAAGCCAGATTCGTATAGTACAGCAGTTCATTTTCCATTAAC 

TAAGTCATCTAGAGACGCAGAAACATTATTAACTTATCTAAAGAAAAGCG 

ATCAAACGCTAGTATCAGTTAATGATTTAAAATCTTTACCAATTGCTTAT 

ACTTTGAAATCACCAATGGGAACAGAAGTTAGTCAAGATGCTAAAAATGC 

TATTATGGACAACGTCATATTCTTAAGAAAACAAGGATTCAAAGTGACAG 

AGATAGACTTACCAATTGATGGTAGAGCATTAATGCGTGATTATTCAACC 

TTGGCTATTGGTATGGGAGGAGCTTTTTCAACAATTGAAAAAGACTTAAA 

AAAACATGGTTTTACTAAAGAAGACGTTGATCCCATTACTTGGGCAGTTC 

ATGTTATTTATCAAAATTCAGATAAGGCTGAACTTAAGAAATCTATTATG 

GAAGCCCAAAAACATATGGATGATTATCGTAAGGCAATGGAGAAGCTTCA 

CAAGCAATTTCCTATTTTCTTATCGCCAACGACCGCAAGTTTAGCCCCTC 

TAAATACAGATCCATATGTAACAGAGGAAGATAAAAGAGCGATTTATAAT 

ATGGAAAACTTGAGCCAAGAAGAAAGAATTGCTCTCTTTAATCGCCAGTG 

GGAGCCTATGTTGCGTAGAACACCTTTTACACAAATTGCTAATATGACAG 

GACTCCCAGCTATCAGTATCCCGACTTACTTATCTGAGTCTGGTTTACCC 

ATAGGGACGATGTTAATGGCAGGTGCAAACTATGATATGGTATTAATTAA 

ATTTGCAACTTTCTTTGAAAAATATCATGGTTTTAATGTTAAATGGCAAA 

GAATAATAGATAAAGAAGTGAAACCATCTACTGGCCTAATACAGCCTACT 

AACTCCCTCTTTAAAGCTCATTCATCATTAGTAAATTTAGAAGAAAATTC 

ACAAGTTACTCAAGTATCTATCTCTAAAAAATGGATGAAATCGTCTGTTA 
AAAATAAA 

SEQ ID NO: 4814 

STRAIN 2603 frame: 1 

NSTETSASWPTTNTIVQTNDSNPTAKFVSESGQSVIGQVKPDNSAALTTVDTPHHISAP 

DALKTTQSSPWESTSTKLTEETYKQKDGQDLANMVRSGQVTSEELVNMAYDIIAKENPS 

LNAVITTRRQEAIEEARKLKDTNQPFLGVPLLVKGLGHSIKGGETNNGLIYADGKISTFD 

SSYVKKYKDLGFIILGQTNFPEYGWRNITDSKLYGLTHNPWDLAHNAGGSSGGSAAAIAS 

GMTPIASGSDAGGSIRIPSSWTGLVGLKPTRGLVSNEKPDSYSTAVHFPLTKSSRDAETL 

LTYLKKSDQTLVSVNDLKSLPIAYTLKSPMGTEVSQDAKNAIMDNVTFLRKQGFKVTEID 

LPIDGRALMRDYSTLAIGMGGAFSTIEKDLKKHGFTKEDVDPITWAVHVIYQNSDKAELK 

KSIMEAQKHMDDYRKAMEKLHKQFPIFLSPTTASLAPLNTDPYVTEEDKRAIYNMENLSQ 

EERIALFNRQWEPMLRRTPFTQIANMTGLPAISIPTYLSESGLPIGTMLMAGANYDMVLI 

KFATFFEKHHGFNVKWQRIIDKEVKPSTGLIQPTNSLFICAHSSLVNLEENSQVTQVSISK 
KWMKSSVKNKPSVMAYQKA 

SEQ ID NO: 4815 

STRAIN _090 frame: 1 

NSTETSASWPTTNTIVQTNDSNPTAKFVSESGQSVIGQVKPDNSAALTTVDTPHHISAP 
DALKTTQSSPWESTSTKLTEETYKQKDGKDLANMVRSGQVTSEELVNMAYDIIAKENPS 
LNAVITTRRQEAIEEARKLKDTNQPFLGVPLLVKGLGHSIKGGETNNGLIYADGKISTFD 
SSYVKKYKDLGFIILGQTNFPEYGWRNITDSKLYGLTHNPWDLAHNAGGSSGGSAAAIAS 
GMTPIASGSDAGGSIRIPSSWTGLVGLKPTRGLVSNEKPDSYSTAVHFPLTKSSRDAETL 
LTYLKKSDQTLVSVNDLKSLPIAYTLKSPMGTEVSQDAKNAIMDNVTFLRKQGFKVTEID 
LPIDGRALMRDYSTLAIGMGGAFSTIEKDLKKHGFTKEDVDPITWAVHVIYQNSDKAELK 
KSIMEAQKHMDDYRKAMEKIiHKQFPIETSPTTASLAPLNTDPYVTEEDKRAIYNMENLSQ 
EERIALFNRQWEPMLRRTPFTQIANMTGLPAISIPTYLSESGLPIGTMLMAGANYDMVLI 

KFATFFEKHHGFNVKWQRIIDKEVKPSTGLIQPTNSLFKAHSSLVNLEENSQVTQVSISK 
KWMKSSVKNKPSVMAYQKA * " *~ 
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SEQ ZD NO: 4816 

STRAIN A909 frame: 2 

TTNTIVQTNDSNPTAKFVSESGQSVIGQVKPDNSAALTTVDTPHHISAPDALKTTQSSPV 
VESTSTKLTEETYKQKDGQDIiANMVRSGQVTSEELVNMAYDIIAKENPSLNAVITTRRQE 
AIEEARKLKDTNQPFLGVPLLVKGLGHSIKGGETNNGLIYADGKISTFDSSYVKKYKDLG 
FIILGQTNFPEYGWRNITDSKLYGLTHNPWDLAHNAGGSSGGSAAAIASGMTPIASGSDA 
GGSIRI PS S WTGLVGLKPTRGLVSNEKPDS YSTAVHFPLTKS SRDAETLLT YLKKS DQT L 
VSVNDLKSLPIAYTLKSPMGTEVSQDAKNAIMDNVTFLRKQGFKVTEIDLP.IDGRALMRD 
YSTLAIGMGGAFST IEKDLKKHGFTKE DVDPITWAVHVI YQNS DKAELKKS IMEAQKHMD 
DYRKAMEKLHKQFPIFLSPTTASLAPLNTDPYVTEEDKRAIYNMENLSQEERIALFNRQW 
EPMLRRTPFTQIANMTGLPAISIPTYLSESGLPIGTMLMAGANYDMVLIKFATFFEKHHG 
FNVKWQRIIDKEVKPSTGLIQPTNSLFBCAHSSLVNLEENSQVTQVSISKKWMKSSVKNKP 
SVMAYQKA 

SEQ ID NO: 4817 

STRAIN COH1 frame: 1 

NSTETSASVAPTTNTIVQTNDSNPTAKFASESGQSVIGQVKPANSAALTTVDTPHISAPD 
ALCTTQSSPVVESPSTKLTEETYKQKDGQDLANMVRSGQVTSEELVNMAYDIIAKENPSL 
NAVITTRRQEAIEEARKLKDTNQPFLGVPLLVKGLGHSIKGGETNNGLIYADGKISTFDS 
SYVKKYKDLGFIILGQTNFPEYGWRNITDSKLYGPTHNPWNLAHNAGGSSGGSAAAIASG 
MTPIASGSDAGGSIRIPSSWTGLVGLKPTRGLVSNEKPDSYSTAVHFPLTKSSRDAETLL 
TYLKKSDQTLVSVNDLKSLPIAYTLKSPMGTEVSQDAKNAIMDNVTFLRKQGFKVTEIDL 
PIDGRALMRDYSTLAJGMGGAFSTIEKDLKKHGFTKEDVDPITWAVHVIYQNSDKAELKK 
SIVEAQKHMDDYRKAMEKLHKQFPIFLSPTTASLAPLNTDPYVTEKDKRAIYNMENLSQE 
ERIALFNRQWEPMLRRTPFTPIANMTGLPAISIPTYLSESGLPIGTMLMAGANYDMVLIK 
FATFFEKHHGFNVKWQRIIDKEVKPSADLIQPTNSLFKAHSSLTOLEENSQVTQVSISKK 
WMKSSVKNKP SVMAYQKA 

SEQ ID NO: 4818 

STRAIN M732 frame: 1 

SVAPTTNTIVQTNDSNPTAKFASESGQSVIGQVKPANSAALTTVDTPHISAPDALKTTQS 
SPWESPSTKLTEETYKQKDGQDLANMVRSGQVTSEELVNMAYDIIAKENPSLNAVITTR 
RQEAIEEARKLKDTNQPFLGVPLLVKGLGHSIKGGETNNGLIYADGKISTFDSSYVKKYK 
DLGFI I LGQTNFPE YGWRN IT DS KLYGXTHN PWDLAHNAGG S SGG SAAAIASGMT PIASG 
SDAGGSIRI PS SWTGLVGLKPTRGLVSNEKPDS YSTAVHFPLTKS SRDAETLLT YLKKS D 
QTLVSVNDLKSLPIAYTLKSPMGTEVSQDAKNAIMDNVTFLRKQGFKVTEIDLPIDGRAL 
MRDYSTLAIGMGGAFST I EKDLKKHG FT KE DVDPITWAVHVI YQNS DKAELKKS I VEAQK 
HMDDYRKAMEKLHKQFPIFLSPTTASLAPLNTDPYVTEKDKRAIYNMENLSQEERIALFN 
RQWEPMLRRTPFTPIANMTGLPAISIPTYLSESGLPIGTMLMAGANYDMVLIKFATFFEK 
HHGFNVKWQRI I DKEVKP S ADL IQPTNS LFKAHS SLVNLEENSQVTQVS I SKKWMKS SVK 
NKPSVMAYQKA 

SEQ ID NO: 4819 

STRAIN 18RS21 frame: 1 

NSTETSASWPTTNTIVQTNDSNPTAKFVSESGQSVIGQVKPDNSAALTTVDTPHHISAP 
DALKTTQSSPVVESTSTKLTEETYKQKDGQDLANMVRSGQVTSEELVNMAYDIIAKENPS 
LNAVITTRRQEAIEEARKLKDTNQPFLGVPLLVKGLGHSIKGGETNNGLIYADGKISTFD 
SSYVKKYKDLGFI I LGQTNFPE YGWRN I TDSKLYGLTHNPWDLAHNAGGS SGG SAAAI AS 
GMT PI AS GS DAGGS IRI PS SWTGLVGLKPTRGLVSNEKP DS YSTAVHFPLTKS SRDAET L 
LTYLKKSDQTLVSVNDLKSLPIAYTLKSPMGTEVSQDAKNAIMDNVTFLRKQGFKVTEID 
LPIDGRALMRDYSTLAIGMGGAFSTIEKDLKICHGFTKEDVDPITWAVHVIYQNSDKAELK 
KS IMEAQKHMD DYRKAMEKLHKQFP I FLSPTTAS LAP LNTDPYVTEEDKRAIYNMENLSQ 
EERIALFNRQWEPMLRRTPFTQIANMTGLPAISIPTYLSESGLPIGTMLMAGANYDMVLI 
KFATFFEKHHGFNVKWQRIIDKEVKPSTGLIQPTNSLFKAHSSLVNLEENSQVTQVSISK 
KWMKSSVKNKPSVMAYQKA 

SEQ ID NO: 4820 
STRAIN M781 frame: 2 

ASVAPTTNTIVQTNDSNPTAKFASESGQSVIGQVKPANSAALTTVDTPHISAPDALKTTQ 
SSPWESPSTKLTEETYKQKDGQDLANMVRSGQVTSEELVNMAYDIIAKENPSLNAVITT 
RRQEAIEEARKLKDTNQPFLGVPLLVKGLGHS IKGGETNNGLI YADGKI ST FDS S YVKKY 
KDLGFI I LGQTNFPE YGWRN IT DSKLYGPTHNPWNLAHNAGGSSGGSAAAI AS GMT PI AS 
GS DAGGS IRI PSSWTGLVGLKPTRGLVSNEKPDSYSTAVHFPLTKS SRDAETLLT YLKKS 
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DQTLVSVNDLKSLPIAYTLKSPMGTEVSQDAKNAIMDNVTFLREQGFKVTEIDLPIDGRA 
LMRDYSTLAIGMGGAFSTIEKDLKKHGFTKEDVDPITWAVHVIYQNSDKAELKKSIVEAQ 
KHMDDYRKAMEKLHKQFPIFLSPTTASLAPLNTDPYVTEKDKRAIYNMENLSQEERIALF 
NRQWEPMLRRTPFTPIANMTGLPAISIPTYLSESGLPIGTMLMAGANYDMVLIKFATFFE 
KHHGFNVKWQRIIDKEVKPSADLIQPTNSLFKAHSSLVNLEENSQVTQVSISKKWMKSSV 
KNKPSVMAYQKA 

SEQ ID NO: 4821 

STRAIN CJB110 frame: 3 

VPTTNTIVQTNDSNPTAKFVSESGQSVIGQVKPDNSAALTTVDTPHHISAPDALKTTQSS 
PVVESTSTKLTEETYKQKDGKDLANMVRSGQVTSEELVNMAYDIIAKENPSLNAVITTRR 
QEAIEEARKLKDTNQPFLGVPLLVKGLGHSIKGGETNNGLIYADGKISTFDSSYVKKYKD 
LGFIILGQTNFPEYGWRNITDSKLYGLTHNPWDLAHNAGGSSGGSAAAIASGMTPIASGS 
DAGGSIRIPSSWTGLVGLKPTRGLVSHEKPDSYSTAVHFPLTKSSRDAETLLTYLKKSDQ 
TLVSVNDLKSLPIAYTLKSPMGTEVSQDAKNAIMDNVTFLRKQGFKVTEIDLPIDGRALM 
RDYSTLAIGMGGAFSTIEKDLKKHGFTKEDVDPITWAVHVIYQNSDKAELKKSIMEAQKH 
MDDYRKAMEKLHKQFPIFLSPTTASLAPLNTDPYVTEEDBCRAIYNMENLSQEERIALFNR 
QWEPMLRRTPFTQIANMTGLPAISIPTYLSESGLPIGTMLMAGANYDMVLIKFATFFEKH 
HGFNVKWQRIIDKEVKPSTGLIQPTNSLFKAHSSLVNLEENSQVTQVSISKKWMKSSVKN 
KPSVMAYQKA 

SEQ ZD NO: 4822 

STRAIN 1169NT frame: 1 

NSTETSASVAPTTNTIVQTNDSNPTAKFASESGQSVICQVKPDNSAALTTVDTPHISAPD 
DLKTTQSSPVVESTSTKLTEETYKQKDGQDLANMVRSGQVTSEELWMAYDIIAKENPSL 
NAVITTRRQEAIEEARKLKDTNQPFLGVPLLVKGLGHSIKGGETNNGLIYADGKISTFDS 
SYVKKYKDLGFIILGQTNFPEYGWRNITDSKLYGPTHNPRNLAHNAGGSSGGSAAAIASG 
MTPIASGSDAGGSIRIPSSWTGLVGLKPTRGLVSNEKPDSYSTAVHFPLTKSSRDAETLL 
TYLKKSDQTLVSVNDLKSLPIAYTLKSPMGTEVSQDAKNAIMDNVTFLRKQGFKVTEIDL 
PIDGRALMRDYSTLAIGMGGAFSTIEKDLKKHGFTKEDVDPITWAVHVIYQNSDKAELKK 
SIMEAQKHMDDYRKAMEKLHKQFPIFLSPTTASLAPLNTDPYVTEEDKRAIYNMENLSQE 
ERIALFNRQWEPMLRRTPFTQIANMTGLPAISIPTYLSESGLPIGTMLMAGANYDMVLIK 
FATFFEKHHGFNVKWQRIIDKEVKPSTGLIQPTNSLFKAHSSLVNLEENSQVTQVSISKK 
WMKS S VKNKPS VMAYQKA 

SEQ ID NO: 4823 

STRAIN JM9130013 frame: 2 

SVAPTTNTIVQTNDSNPTAKFSSESGQSVIGQVKPANSVALTTVDTPHISAPDALKTTQS 
SPWESPSTKLTEETYKQKDGQELANMVRSGQVTSEELVNMAYDIIAKENPSLNAVITTR 
RQEAIEEARKLKDTNQPFLGVPLLVKGLGHSIKGGETNNGLIYAGGKISTFDSSYVKKYK 
DLGFIILGQTNFPEYGWRNITDSKLYGPTHNPWNLAHNAGGSSGGSAAVIASGMTPIASG 
SDAGGSIRIPSSWTGLVGLKPTRGLVSNEKPDSYSTAVHFPLTKSSRDAETLLTYLKKSD 
QTLVS VNDLKSLPIAYTLKS PMGTEVSQDAKNAIMDNVI FLRKQGFKVTEI DLPI DGRAL 
MRDYSTLAIGMGGAFSTIEKDLKKHGFTKEDVDPITWGVHVIYQNSDKAELKKSIMEAQK 
HMDDYRKAMEKLHKQFPIFLSPTTASLAPLNTDPYVTEEDKRAIYNMENLSQEERIALFN 
RQWEPMLRRTPFTQIANMTGLPAISIPTYLSESGLPIGTMLMAGANYDMVLIKFATFFEK 
YHGFNVKWQRIIDKEVKPSTGLIQPTNSLFKAHSSLVNLEENSQVTQVSISKKWMKSSVK 
NKPSVMAY 

SEQ ID NO: 4824 

STRAIN H36B frame: 3 

SWPTTNTIVQTNDSNPTAKFSSESGQSVIGQVKPANSVALTTVDTPHISAPDALBCTTQS 
SPWESPSTKLTEETYKQKDGQDLANMVRSGQVTSEELVNMAYDIIAKENPSLNAVITTR 
RQEAIEEARKLKDTNQPFLGVPLLVKGLGHSIKGGETNNGLIYAGGKISTFDSSYVKKYK 
DLGFIILGQTNFPEYGWRNITDSKLYGPTHNPWNLAHNAGGSSGGSAAVIASGMTPIASG 
SDAGGSIRIPSSWTGLVGLKPTRGLVSNEKPDSYSTAVHFPLTKSSRDAETLLTYLKKSD 
QTLVSVNDLKSLPIAYTLKS PMGTEVSQDAKNAIMDNVI FLRKQGFKVTEI DLPI DGRAL 
MRDYSTLAIGMGGAFSTIEKDLKKHGFTKEDVDPITWAVHVIYQNSDKAELKKSIMEAQK 
HMDDYRJCAMEKLHKQFPIFLSPTTASLAPLNTDPYVTEEDKRAIYNMENLSQEERIALFN 
RQWEPMLRRTPFTQIANMTGLPAISIPTYLSESGLPIGTMLMAGANYDMVLIKFATFFEK 
YHGFNVKWQRIIDKEVKPSTGLIQPTNSLFKAHSSLVNLEENSQVTQVSISKKWMKSSVK 
NK 

SEQ ID NO: 4901 
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STRAIN 2603 

aaacatccgatacttaatgatcaaaaatccttagcaattgttgaacagat 
agaatatgattttgataaattcgataattcagaagcttctttttatgcaa 
cattagctagawttcgcgttatggatagagaaatcaaaaaatttattaga 
gaaaatccaaatagtcaaatcctttcaattggttgtggacttgatacaag 
gtttgaaagagtcgataatggacaaattaggtggtataaccttgatttgc 
cagaggttatggagataagaaaattattttttgaagagcatgaaagagtt 
actaatatagcaaaatcagccctagatgaaacttggacacgggaggtaaa 
tccccaaaatgccccttttctaatcgtgtcagaaggtgttttaatgtttc 
taaaagaagatgacgtagagacttttcttcatatcctgacaaattcattt 
agccaatttatggcacaatttgatttgtgtcataaggaaatgattaataa 
aggaaagcaacatgatacagtaaagtatatggatacagaatttcagtttg 
gtatcacagatggtcatgagattgtggatttagaccctaaattaaagcaa 
ataaatctgattaactttacagatgagatgagcaaatttgagttaggcac 
acttcgctctttacttccaacaattcgtaaatttaataattgtttaggtg 
tgtacgaatataaagcatc 

SEQ ID HO: 4902 
STRAIN 090 

TAATGATCAAAAATCCTTAGCAATTGTTGAACAGATAGAATATGATTTTG 
ATAAATTCGATAATTCAGAAGCTTCTTTTTATGCAACATTAGCTAGAATT 
CGCGTTATGGATAGAGAAATCAAAAAATTTATTAGAGAAAATCCAAATAG 
TCAAATCCTTTCAATTGGTTGTGGACTTGATACAAGGTTTGAAAGAGTCG 
ATAATGGACAAATTAGGTGGTATAACCTTGATTTGCCAGAgGTTATGGAG 
ATAAGAAAATTATTTTTTGAAGAGCATGAAAGAGTTACTAATATAGCAAA 
ATCAGCCATAGATGAAACTTGGACACGGGAGGTAAATCCCCAAAATGCCC 
CTTTTCTAATCGTGTCAGAAGGTGTTTTAATGTTTCTAAAAGAAGATGAC 
GTAGAGACTTTTCTTCATATCCTGACAAATTCATTTAGCCAATTTATGGC 
ACAATTTGATTTGTGTCATAAGGAAATGATTAATAAAGGAAAGCAACATG 
ATACAGTAAAGTATATGGATACAGAATTTCAGTTTGGTATCACAGATGGT 
CATGAGATTGTGGATTTAGACCCTAAATTAAAGCAAATAAATCTGATTAA 
CTTTACAGATGAGATGAGCAAATTTGAGTTAGGCACACTTCGCTCTTTAC 
TTCCAACAATTCGTAAATTTAATAATTGTTTAGGTGTGTACGAATATAAA 
GCATC 

SEQ ID NO: 4903 
STRAIN A909 

AAACATCCGATACTTAATGA 

TCAAAAATCCTTAGCAATTGTTGAACAGATAGAATATGATTTTGATAAAT 
TCGATAATTCAGAAGCTTCTTTTTATGCAACATTAGCTAGAATTCGCGTT 
ATGGATAGAGAAATCAAAAAATTTATTAGAGAAAATCCAAATAGTCAAAT 
CcTTTCaATTGGTTGTGGACTTGATACAAGGTTTGAAAGAGTCGATAATG 
GACAAATTAGGTGGTATAACCTTGATTTGCCAGAGGTTATGGAGATAAGA 
AAATTaTTTTTTGAAGAGCATGAAAGAGTTACTAATATAGCAAAATCAGC 
CCTAGATGaAACTTGGACACGGGAGGTAAATCCCCAAAATGCCCCTTTTC 
TAATCGTGTCAGAAGGTGTTTTAATGTTtCTAAAAGAAGATGACGTAGAG 
ACTTTTcTTCATATCCTGACAAATTCATTTAGCCAATTTATGGCACAATT 
TGATTTGTGTCATAAGGAAATGATTAATAAAGGAAAGCAACATGATACAG 
TAAAGTATATGGATACAGAATTTCAGTTTGGTATCACAGATGGTCATGAG 
ATTGTGGATTTAGACCCTAAATTAAAGCAAATAAATCTGATTAACTTTAC 
AGATGAGATGAGCAAATTTGAGTTAGGCACACTTCGCTCTTTACTTCCAA 
CAATTCGTAAATTTAATAATTGTTTAGGTGTGTACGAATATAAAGCATC 

SEQ ID NO: 4904 
STRAIN H36B 

AAACATCCGATACTTAATGATCAAAAAT CCTTAGCA 

ATTGTTGAACAGATAGAATATGATTTTGATAAATTCGATAATTCAGAAGC 
TTCTTTTTATGCAaCATTAGCTAGAATTCGCGTTATGGATAGAGAAATCA 
AAAAATTTATTAGAGAAAATCCAAATAGTCATATCCTTTCAATTGGCTGT 
GgACTTGATACAAGGTTTGAAAGAGTCGATAATGGACAAATTAGGTGGTA 
TAACCTTGATTTGCCAGAGGTTATGGAGATAAGAAAATTATTTTTTGAAG 
AGCATGAAAGAGTTACTAATATAGCAAAATCAGCCcTAGATGAAACTTGG 
ACACGGGAGGTAAATCCCCAAAATGCCCCTTTTCTAATCGTGTCAGAAGG 
TGTTTTAATGTTTCTAAAAGAAGATGACGTAGAGACTTTTCTTCATATCC 
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TGACAAATTCATTTAGCCAATTTATGGCACAATTTGATTTGTGTCAgAAG 
GAAATGATTAATAAAGGAAAGCAACATGATACAGTAAAGTATATGGATAC 
AGAATTTCAGTTGGGTATCACAGATGGTCATGAAATTGTGGATTTAGACC 
CTAAATTAAAGCAAATAAATCTGATTAACTTTACAGATGAGATGAGCAAA 
TTTGAGTTAGGCACACTTCGCTCTTTACTTCCAACAATTCGTAAATTTAA 
TAATTGTTTAGGTGTGTACGAATATAAAGCATC 

SEQ ID NO: 4905 
STRAIN 18RS21 

AACATCCGATACTTAATGATCAAAAATCCTTAGCAAT 

TGTTGAACAGATAGAATATGATTTTGATAAATTCGATAATTCAGAAGCTT 

CTTTTTATGCAACATTAGCTAGAATTCGCGTTATGGATAGAGAAATCAAA 

AAATTTATTAGAGAAAATCCAAATAGTCaAATCCTTTCAATTGGTTGTGG 

ACTTGATACAAGGTTTGAAAGAGTCGATAATGGACAAATTAGGTGGTATA 

ACCTTGATTTGCCAGAGGTTATGGAGATAAGAAAATTATTTTTTGAAGAG 

CATGAAAGAGTTACTAATATAGCAAAATCAGCCCTAGATGAAACTTGGAC 

ACGGGAGGTAAATCCCCAAAATGCCCCTTTTCTAATCGTGTCAgAAGGTG 

TTTTAATGTTTCTAAAAGAAGATGACGTAGAGACTTTTCTTCATATCCTG 

ACAAATTCATTTAGCCAATTTATGGCACaATTTGATTTGTGTCATAaGGA 

AATGATTAATAAAGGAAAGCAACATGATACAGTAAAGTATATGGATACAG 

AATTTCAGTTTGGTATCACAGATGGTCATGAGATTGTGGATTTAGACCCT 

AAATTAAAGCAAATAAATCTGATTAACTTTACAGATGAGATGAGCAAATT 

TGAGTTAGGCACACTTCGCTCTTTACTTCCAACAATTCGTAAATTTAATA 

ATTGTTTAGGTGTGTACGAAtATAaaGCATC 

SEQ ID NO: 4906 
STRAIN M732 

AAACATCCGATACTTAATGATCAAAAATCCTTAGCAATTGTTGAACA 

GATAGAATATGATTTGGATAAATTCGATAATTCAGAAGCTTCTTTTTATG 

CAACATTAGCTAGAATTCGCGTTATGGATAGAGAAATCAAAAAATTTATT 

AGAGAAAATCCAAATAGTCAAATCCTTTCAATTGGTTGTGGACTTGATAC 

AAGGTTTGAAAGAGTCGATAATGGACAAATTAGGTGGTATAACCTTGATT 

TGCCAGAGGTTATGGAGATAAGAAAATTATTTTTTGAAGAGCATGAAAGA 

GTTACTAATATAGCAAAATCAGCCCTAGATGAAACTTGGACACGGGAGGT 

AAATCCCCAAAATGCCCCTTTTCTAATCGTGTCAGAAGGTGTTTTAATGT 

TTCTAAAAgAAGATGACGTAGAGACTTTTCTTCAtATCCTGACAAATTCA 

TTTAGCCAATTTATGGCaCAATTTGATTTGTGTCATAAGGAAATGATTAA 

TAAAGGAAAGCAACATGATACAGTAAAGTATATGGATACAGAATTTCAGT 

TTGGTATCACAGATGGTCATGAGATTGTGGATTTAGACCCTAAATTAAAG 

CAAATAAATCTGATTAACTTTACAGATGAGATGAGCAAATTTGAGTTAgG 

CACACTTCGCTCTTTACTTCCAACAATTCGTAAATTTAATAATTGTTTAG 

GtGTGTACGAATATAAAGCATC 

SEQ ID NO: 4907 
STRAIN COH1 

AAACATCCGATACTTAATGAT CAAAAATCCTT AGCAA 

TTGTTGAACAGATAGAATATGATTTGGATAAATTCGATAATTCAGAAGCT 

TCTTTTTATGCAACATTAGCTAGAATTCGCGTTATGGATAGAGAAATCAA 

AAAATTTATTAGAGAAAATCCAAATAGTCAAATCCTTTCAATTGGTTGTG 

GACTTGATACAAGGTTTGAAAGAGTCGATAATGGACAAATTAGGTGGTAT 

AACCTTGATTTGCCAGAGGTTATGGAGATAAGAAAATTATTTTTTGAAGA 

GCATGAAAGAGTTACTAATATAGCAAAATCAGCCCTAGATGAAACTTGGA 

CACGGGAGGTAAATCCCCAAAATGCCCCTTTTCTAATCGTGTCAGAAGGT 

GTTTTAATGTTTCTAAAAGAAGATGACGTAGAGACTTTTCTTCATATCCT 

GACAAATTCATTTAGCCAATTTATGGCACAATTTGATTTGTGTCATAAGG 

AAATGATTAATAAAGGAAAGCAACATGATACAGTAAAGTATATGGATACA 

GAATTTCAGTTTGGTATCACAGATGGTCATGAGATTGTGGATTTAGACCC 

TAAATTAAAGCAAATAAATCTGATTAACTTTACAGATGAGATGAGCAAAT 

TTGAGTTAGGCACACTTCGCTCTTTACTTCCAACAATTCGTAAATTTAAT 

AATTGTTTAGGTGTGTACGAATATAAAGCATC 

SEQ ID NO: 4908 
STRAIN M781 

AAACATCCGATACTTAATGATCA 



196 



WO 2004/018646 



PCTYUS2003/026827 



SEQUENCE LISTING 



AAAATCCTTAGCAATTGTTGAACAGATAGAATATGATTTGGATAAATTCG 
ATAATTCAGAAGCTTCTTTTTATGCAACATTAGCTAGAATTCGCGTTATG 
GATAGAGAAATCAAAAAATTTATTAGAGAAAATCCAAATAGTCAT^ATCCT 
TTCAATTGGTTGTGGACTTGATACAAGGTTTGAAAGAGTCGATAATGGAC 
AAATTAGGTGGTATAACCTTGATTTGCCAGAGGTTATGGAGATAAGAAAA 
TTATTTTTTGAAGAGCATGAAAGAGTTACTAATATAGCAAAATCAGCCCT 
AGATGAAACTTGGACACGGGAGGTAAATCCCCAAAATGCCCCTTTTCTAA 
TCGTGTCAGAAGGTGTTTTAATGTTTCTAAAAgAAGATGACGTAGAGACT 
TTTCTTCATATCCTGACAAATtCATTTAGCCAATTTAtGGCACAATTTGA 
TTTGTGTCATAAGGAAATGATTAATAAAGGAAAGCAACATGATACAGTAA 
AGTATATGGATACAGAATTTCAGTTTGGTATCACAGATGGTCATGAGATT 
GTGGATTTAgACCCTAAATTAAAGCAAATAAATCTGATTAACTTTACAGA 
TGAGATGAGCAAATTTGAGTTAGGCACACTTCGCTCTTTACTTCCAACAA 
TTCGTAAATTTAATAATtGTTTAGGTGTGTACGAATATAAAGCATC 

SEQ ID NO: 4909 
STRAIN CJB110 

AAACATCCGATACTTAATGATCAAAAATCCTTAGCAA 

TTGTTGAACAGATAGAATATGATTTTGATAAATTCGATAATTCAGAAGCT 

TCTTTTTATGCAACATTAGCTAGAATTCGCGTTATGGATAGAGAAATCAA 

AAAATTTATTAGAGAAAATCCAAATAGTCAAATCCTTTCAATTGGTTGTG 

GACTTGATACAAGGTTTGAAAGAGTCGATAATGGACAAATTAGGTGGTAT 

AACCTTGATTTGCCAGAGGTTATGGAGATAAGAAAATTATTTTTTGAAGA 

GCATGAAAGAGTTACTAATATAGCAAAATCAGCCATAGATGAAACTTGGA 

CACGGGAGGTAAATCCCCAAAATGCCCCTTTTCTAATCGTGTCAGAAGGT 

GTTTTAATGTTTCTAAAAGAAGATGACGTAGAGACTTTTCTTCATATCCT 

GACAAATTCATTTAGCCAATTTATGGCACAATTTGATTTGTGTCATAAGG 

AAATGATTAATAAAGGAAAGCAACATGATACAGTAAAGTATATGGATACA 

GAATTTCAGTTTGGTATCACAGATGGTCATGAQATTGTGGATTTAGACCC 

TAAATTAAAGCAAATAAATCTGATTAACTTTACAGATGAGATGAGCAAAT 

TTGAGTTAGGCACACTTCGCTCTTTACTTCCAACAATTCGTAAATTTAAT 

AATTGTTTAGGTGTGTACGAATATAAAGCATC 

SEQ XD NO: 4910 
STRAIN 1169NT 

AAACATCCGATACTTAATGATCAAAAATCCTTAGCAAT 

TGTTGAACAGATAGAATATGATTTTGATAAATTCGATAATTCAGAAGCTT 

CTTTTTATGCAACATTAGCTAGAATTCGCGTTATGGATAGAGAAATCAAA 

AAATTTATTAGAGAAAATCCAAATAGTCATATCCTTTCTATTGGTTGTGG 

ACTTGATACAAGGTTTGAAAGAGTCGATAATGGACAAATTAGGTGGTATA 

ACCTTGATTTGCCAGAGGTTATGGAGATAAGAAAATTATTTTTTGAAGAG 

CATGAAAGAGTTACTAATATAGCAAAATCAGCCCTAGATGAAACTTGGAC 

ACAGGAGGTAAATCCCCAAAATGCCCCTTTTCTGATCGTGTCAGAAGGTG 

TTTTAATGTTTCTAAAAGAAGATGACGTAGAGACTTTTcTTCATATCCTG 

ACAAATTCATTTAGCCAATTTATGGCACAATTTGATTTGTGtCAGAAGGA 

AATGATTAATAAAGGAAAGCAACATGATACAGTAAAGTATATGGATACAG 

AATTTCAGTTTGGTATCACAGATGGTCATGAAATTGTGGATTTAGACCCT 

AAATTAAAGCAAATAAATCTGATTAACTTTACAGATGAGATGAGCAAATT 

TGAGTTAGGCACACTTCGCTCTTTACTTCCAACAATTCGTAAATTTAATA 

ATTGTTTAGGTGTGTACGAATATAAAGCATC 

SEQ ID NO: 4911 
STRAIN JM9130013 

AGCAATTGTTGAACAGATAGAATATGATT 

TTGATAAATTCGATAATTCAGAAGCTTCTTTTTATGCAACATTAGCTAGA 
ATTCGCGTTATGGATAGAGAAATCAAAAAATTTATTAGAGAAAATCCAAA 
TAGTCATATCCTTTCAATTGGCTGTGGACTTGATACAAGGTTTGAAAGAG 
TCGATAATGGACAAATTAGGTGGTATAACCTTGATTTGCCAGAGGTTATG 
GAGATAAGAAAATTATTTTTTGAAGAGCATGAAAGAGTTACTAATATAGC 
AAAATCAGCCCTAGATGAAACTTGGACACGGGAGGTAAATCCCCAAAATG 
CCCCTTTTCTAATCGTGTCAGAAGGTGTTTTAATGTTTCTAAAAGAAGAT 
GACGTAGAGACTTTTCTTCATATCCTGACAAATTCATTTAGCCAATTTAT 
GGCACAATTTGATTTGTGTCAgAAGGAAATGATTAATAAAGGAAAGCAAC 
ATGATACAGTAAAGTATATGGATACAGAATTTCAGTTTGGTATCACAGAT 
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GGTCATGAAATTGTGGATTTAGACCCTAAATTAAAGCAAATAAATCTGAT 
TAACTTTACAGATGAGATGAGCAAATTTGAGTTAGGCACACTTCGCTCTT 
TACTTCCAACAATTCGTAAATTTAATAATTGTTTAGGTGTGTACGAATAT 
AAAGCATC 

SEQ ID NO: 4912 

STRAIN 2603 frame: 1 

KHPILNDQKSLAIVEQIEYDFDKFDNSEASFYATLARXRVMDREIKKFIRENPNSQILSI 
GCGLDTRFERVDNGQIRWYNLDLPEVMEIRKLFFEEHERVTNIAKSALDETWTREVNPQN 
APFLIVSEGVLMFLKEDDVETFLHILTNSFSQFMAQFDLCHKEMINKGKQHDTVKYMDTE 
FQFGITDGHEIVDLDPKLKQINLINFTDEMSKFELGTLRSLLPTIRKFNNCLGVYEYKA 

SEQ ZD NO: 4913 

STRAIN 090 frame: 2 

NDQKSLAIVEQIEYDFDKFDNSEASFYATLARIRVMDREIKKFIRENPNSQILSIGCGLD 
TRFERVDNGQIRWYNLDLPEVMEIRKLFFEEHERVTNIAKSAI DETWTREVNPQNAPFLI 
VSEGVLMFLKEDDVETE^HILTNSFSQFMAQFDLCHKEMINKGKQHDTVKYMDTEFQFGI 
TDGHEIVDLDPKLKQINLINFTDEMSKFELGTLRSLLPTIRKFNNCLGVYEYKA 

SEQ ID NO: 4914 

STRAIN A909 frame: 1 

KHPILNDQKSLAIVEQIEYDFDKFDNSEASFYATLARIRVMDREIKKFIRENPNSQILSI 
GCGLDTRFERVDNGQIRWYNLDLPEVMEIRKLFFEEHERVTNIAKSALDETWTREVNPQN 
APFLIVSEGVLMFLKEDDVETFLHILTNSFSQFMAQFDLCHKEMINKGKQHDTVKYMDTE 
FQFGITDGHEIVDLDPKLKQINLINFTDEMSKFELGTLRSLLPTIRKFNNCLGVYEYKA 

SEQ ID NO: 4915 

STRAIN H36B frame: 1 

KHPILNDQKSLAIVEQIEYDFDKFDNSEASFYATLARIRVMDREIKKFIRENPNSHILSI 
GCGLDTRFERVDNGQIRWYNLDLPEVMEIRKLFFEEHERVTNIAKSALDETWTREVNPQN 
APFLIVSEGVLMFLKEDDVETFLHILTNSFSQFMAQFDLCQKEMINKGKQHDTVKYMDTE 
FQLGITDGHEIVDLDPKLKQINLINFTDEMSKFELGTLRSLLPTIRKFNNCLGVYEYKA 



SEQ ID NO: 4916 

STRAIN 18RS21 frame: 3 

HPILNDQKSLAIVEQIEYDFDKFDNSEASFYATLARIRVMDREIKKFIRENPNSQILSIG 
CGLDTRFERVDNGQIRWYNLDLPEVMEIRKLFFEEHERVTNIAKSALDETWTREVNPQNA 
PFLIVSEGVLMFLKEDDVETFLHILTNSFSQFMAQFDLCHKEMINKGKQHDTVKYMDTEF 
QFGITDGHEIVDLDPKLKQINLINFTDEMSKFELGTLRSLLPTIRKFNNCLGVYEYKA 

SEQ ID NO: 4917 

STRAIN M732 frame: 1 

KHPILNDQKSLAIVEQIEYDLDKFDNSEASFYATLARIRVMDREIKKFIRENPNSQILSI 
GCGLDTRFERVDNGQIRWYNLDLPEVMEIRKLFFEEHERVTNIAKSALDETWTREVNPQN 
APFLIVSEGVLMFLKEDDVETFLHILTNSFSQFMAQFDLCHKEMINKGKQHDTVKYMDTE 
FQFGITDGHEIVDLDPKLKQINLINFTDEMSKFELGTLRSLLPTIRKFNNCLGVYEYKA 

SEQ ID NO: 4918 

STRAIN COH1 frame: 1 

KHPILNDQKSLAIVEQIEYDLDKFDNSEASFYATLARIRVMDREIKKFIRENPNSQILSI 
GCGLDTRFERVDNGQIRWYNLDLPEVMEIRKLFFEEHERVTNIAKSALDETWTREVNPQN 
APFLIVSEGVIjMFLKEDDVETFLHILTNSFSQHtlAQFDLCHKEMINKGKQHDTVKYMDTE 
FQFGITDGHEIVDLDPKLKQINLINFTDEMSKFELGTLRSLLPTIRKFNNCLGVYEYKA 

SEQ ID NO: 4919 

STRAIN M781 frame: 1 

KHPILNDQKSLAIVEQIEYDLDKFDNSEASFYATLARIRVMDREIKKFIRENPNSQILSI 
GCGLDTRFERVDNGQIRWYNLDLPEVMEIRKLFFEEHERVTNIAKSALDETWTREVNPQN 
APFLIVSEGV^FLKEDDVETFLHILTNSFSQFMAQFDLCHKEMINKGKQHDTVKYMDTE 
FQFGITDGHEIVDLDPKLKQINLINFTDEMSKFELGTLRSLLPTIRKFNNCLGVYEYKA 

SEQ ID NO: 4920 

STRAIN CJB110 frame: 1 



198 



WO 2004/018646 



PCTYUS2003/026827 



SEQUENCE LISTING 



KHPILNDQKSLAIVEQIEYDFDKFDNSEASFYATLARIRVMDREIKKFIRENPNSQILSI 
GCGLDTRreRVDNGQIRWYNLDLPEVMEIRKLFFEEHERVTNIAKSAIDETWTREVNPQN 
APFLIVSEGVLMFLKEDDVETFLHILTNSFSQEWAQFDLCHKEMINKGKQHDTVKYMDTE 
FQFGITDGHEIVDLDPKLKQINLINFTDEMSKFELGTLRSLLPTIRKFNNCLGVYEYKA 

SEQ XD NO: 4921 

STRAIN 1169NT frame: 1 

KHPILNDQKSLAIVEQIEYDFDKFDNSEASFYATLARIRVMDREIKKFIRENPNSHILSI 
GCGLDTRFERVDNGQIRWYNLDLPEVMEIRKLFFEEHERVTNIAKSALDETWTQEVNPQN 
APFLIVSEGVLMFLKEDDVETFLHILTNSFSQFMAQFDLCQKEMINKGKQHDTVKYMDTE 
FQFGITDGHEIVDLDPKLKQINLINFTDEMSKFELGTLRSLLPTIRKFNNCLGVYEYKA 

SEQ ID NO: 4922 

STRAIN JM9130013 frame: 2 v 

AIVEQIEYDFDKFDNSEASFYATLARIRVMDREIKKFIRENPNSHILSIGCGLDTRFERV 
DNGQIRWYNLDLPEVMEIRKLFFEEHERVTNIAKSALDETWTREVNPQNAPFLIVSEGVL 
MFLKEDDVETFLHIIiTNSFSQH^lAQFDLCQKEMINKGKQHDTVKYMDTEFQFGITDGHEI 
VDLDPKLKQINLINFTDEMSKFELGTLRSLLPTIRKFNNCLGVYEYKA 

SEQ ID NO. 5001 
STRAIN 2603 

ATGAAAAAACAAAAACTATTACTGCTTATTGGAGGCTTATTAATAATGATAATGATGACA 

GCATGTAAGGATTCAAAAATCCCAGAAAACCGCACAAAGGAAGAGTACCAAGCTGAACAA 

AATTTTAAACCGTTTTTTGAGTTTTTAGCACAAAAAGATAAAGATTTGAGCAAAATACAA 

AAATACTTACTATTAGTATCGGATTCAGGTGATGCATTAGATTTAGAATATTTCTATAGT 

ATTCAAGATTTAAAAAAAAATAAGGATTTAGGGAAGTTTGAAACAAGAAAAAGTCAAATA 

GAAAAGCCGGGTGGCTATAATGAGTTAGAAAATAAAGAGGTCCCATTTGAATATTTTAAA 

AATAATATAGTTTATCCAAAAGGAAAACCGAATATTACATTTGATGACTTTATTATCGGA 

GCAATGGATACTAAAGAATTAAAAGAATTAAAAAAATTAAAAGTAAAAAGTTATTTATTA 

AAACATCCGGAAACTGAGTTGAAAGATATAACATATGAATTGCCGACACAGTCGAAGCTT 
ATTAAAAAA 

SEQ ID NO. 5002 

STRAIN 090 

TAAGGATTCAAAAATCCCAGAAAACCGCACAAAG 

GAAGAGTACCAAGCTGAACAAAATTTTAAACTGTTTTTTGAGTTTTTAGC 
ACAAAAATATAAAGATTTGAACAAAATACAAAAATACTTACTATTAGTAT 
CGGATTCAGGTGATGCATTAGATTTAGAATATTTCTATAGTATTCAAGAT 
TTAAAAAAAAATAAGGATTTAGGGAAGTTTGAAACAAGAAAAAGTCAAAT 
AGAAAAGCCGGGTGGCTATAATGAGTTAGAAAATAAAGAGGTCCCATTTG 
AATATTTTAAAAATAATATAGTTTATCCAAAAGGAAAACCGAATATTACA 
TTTGATGACTTTATTATCGGAGCAATGGATACTAAAGAATTAAAAAAATT 
AAAAGTAAAAAGTTATTTATTAAAACATCCGGAAACTGAGTTGAAAGATA 
TAACATATGAATTGCCGACACAGTCGAAGCTTATTAAAAAA 

SEQ ID NO. 5003 
STRAIN 18RS21 

TAAGGATTCAAAAATCCCAGAAAACCGCACAAAGGAAG 

AGTACCAAGCTGAACAAAATTTTAAACCGTTTTTTGAGTTTTTAGCACAA 

AAAGATAAAGATTTGAGCAAAATACAAAAATACTTACTATTAGTATCGGA 

TTCAGGTGATGCATTAGATTTAGAATATTTCTATAGTATTCAAGATTTAA 

AAAAAAATAAGGATTTAGGGAAGTTTGAAACAAGAAAAAGTCAAATAGAA 

AAGCCGGGTGGCTATAATGAGTTAGAAAATAAAGAGGTCCCATTTGAATA 

TTTTAAAAATAATATAGTTTATCCAAAAGGAAAACCGAATATTACATTTG 

ATGACTTTATTATCGGAGCAATGGATACTAAAGAATTAAAAGAATTAAAA 

GAATTAAAAAAATTAAAAGTAAAAAGTTATTTATTAAAACATCCGGAAAC 

TGAGTTGAAAGATATAACATATGAATTGCCGGCACAGTCGAAGCTTATTA 
AAAAA 

SEQ ID NO. 5004 

STRAIN 2603 frame: 1 

MKKQBCLLLLIGGLLIMIMMTACKDSKIPENRTKEEYQAEQNFKPFFEFLAQKDKDLSKIQ 
KYLLLVSDSGDALDLEYFYSIQDLKKNKDLGKFETRKSQIEKPGGYNELENKEVPFEYFK 
NNIVYPKGKPNITFDDFIIGAMDTKELKELKKLKVKSYLLKHPETELKDITYELPTQSKL 
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SEQ ID NO. 5005 

STRAIN 090 frame: 2 

KDSKI PENRTKEEYQAEQNFKLFFEFLAQKYKDLNKIQKYLLLVS DSGDALDLEYFYS IQ 
DLKKNKDLGKFETRKSQIEKPGGYNELENKEVPFEYFKNNIVYPKGKPNITFDDFIIGAM 
DTKELKKLKVKSYLLKHPETELKDITYELPTQSBCLIKK 

SEQ ID NO. 5006 

STRAIN 18RS21 frame: 2 

KDSKI PENRTKEEYQAEQNFKPFFE FLAQKDKDLSKIQKYLLLVS DSGDALDLE YFYS I Q 
DLKKNKDLGKFETRKSQIEKPGGYNELENBCEVPFEYFKNNIVYPKGKPNITFDDFIIGAM 
DTKELKELKELKKLKVKSYLLKHPETELKDITYELPAQSKLIKK 

SEQ ID NO. 5101 
STRAIN 2603 

ttgaataataaaggtgtcggtggcgatggtgtccaaatttatcaatacta 
tatcaaaatggacaacaataaaccttacttaagtcccaaagataagacta 
ctgtagagaagttagaagatcgctggaaaaaaattactttcaaagttcag 
gatactggcattggtttgaaagacgtttatcttcaatctgttaagtatgt 
tggtggtggcaataataatttagaccttatcacacctccaggatttaaaa 
aagaagataaaaaagttgaaaaaccaaaattagaccgtccaccaggaatt 
gatttaccagcaccaacttcaatgagaagttttgattattcaaccccacc 
gggaactaagccaagcaaacccaaagatagtttatcaactcctccaggtt 
tcccagatttaaacacgccgccggatgaagcaccaaaggatagtaaaaaa 
gacgctattgaagataaatcaggagcaattaaatatgctaagtctcttca 
acttagctttgttgatggccctattttagctagcaaagtaaatggcaaaa 
tattacaagtcgaatctgatggcaaattagtcattcctagaaatgctttg 
tcagctaatcaatttgatgacactagtcttaaaatttatcgtaataataa 
tcgcaataaagaaattactatcacaacagattattttgcagatacaaaat 
atgtcaatatcacagcggttgactatttgagcaatactacttttgagcaa 
ttagctactggtgaaacagtagattaccatgccattgtattttcaagctt 
tgctgctattaaagacaagggtggtaagatttatgttaacgataaattgc 
aagaaacttctcgtatagcgcttaaagataaatctgttaagattggtatt 
gaattaccaaatgatgtcagacatattgatagtttatctgttcgtcgttt 
gaatgaggttaaaactgttgataatatcttgaaaaatgatgaacaagaca 
ttaatctcagcaaaacttaccaattaaaatacaacccgacaaatcgtcgt 
ctagagtttactattaataacattaactcaagttcagaaatcatgaccac 
tttcaaagatggaaagatgccagaattggttgaacaaaaagatgtttctt 
tggatataaacgatatggacatgagtaagtttaaaactattcgacttgga 
cgaaaggattctgaatttaagggacaacttattgcaaaaactggaacagt 
tgaattagatatgtttttcaaacaatctcaagacccagcttcaattatta 
aaaaaatataccttatccaaaatggtgttccaaatgaattgaaaaaattt 
gactctagttttggtttaactgaaagtcagatagatggatactatattta 
taaagatgcaattaaccttaaatttaaattaaccagtggtgcaagtctta 
aagttgtttataaagggcaagaagatccatatagtcatcagaaagaagat 
atgactaaaaaaggtgaacagctcagtcattcaactcaagccaatgaaaa 
tacagcaaaagtaacctttgctaatattgactggtcacattatagtaagg 
ttactgtgaatggaaaagaagttgttaaaggtagtgagttacctttaact 
aaaggatggacaacatttgtattacataaaacagaaaattcattaaatgt 
taaaagtttgattatggagacgggtagtgtaagtaagaaagttcaacaac 
ttcctttaagtcctagattatctaaaaataagcatatgagggatatgcta 
cttactatgcaaaaagattcagcgtattacgaaacaagtgacagtctagt 
ccttcgaattaatctcactgcagatactaaacttaattttaatgctgtta 
aaggagcgagtgctcttactgaaaatatgatgatgagacagtttgcagtt 
gctggaccacaagatgatcctgttagtgaacataaatacccatcagtatt 
tctcttaactcctgccttattggaaactgctagtgaggcaactctaaatg 
gtaaggaaatcacagcatctggtattatcggtcacatcaaggatggtgat 
aaaagcaagcatgttgaagtcaaaatggtgaatgaaaatggagacatgct 
aggaacccctgttattattcaaggtaaagacttgactaatcgaacaaaac 
« cattaatgagtggacgtagagtactttatgccggtaaacaatatgagttc 
cgggctaaattaccacttagtcgttttaacacttggattagggttgaagt 
ggtaacagaagcaggagagaaagcaagtattgttcgtcgcatgttctttg 
accaatcagttccagagcttaacacagcagttgctaaacgtgatttgact 
tctgatactgctcttatccacatcgttgccaaagatgactctctaaaact 
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aaaattatatcaagatgattcattacttgaatctgttgataaaaccggtc 
tttatagttttagaaatggtgtagaaatcactaaagatatgacagtacca 
ctagaatttggagataatattattaagttatctgctgttgacttatcaaa 
ttatcgtcgtaatgagacccttcatatctatagaaaccgttttgatgtta 
aagcaagccaaatgacagctgacaaaggagctaaagtaactgtggatatg 
ttgatgaagcacttagttgttccagaaatggcaggagcttatacattaac 
aatcgacgaagctccaaacacaaatgaatcaggaatgttaacaaacgcta 
aagtatcgattcattatgtaaatggtggtgttgataaagttgatgttccg 
attaaagtagttgacttagaagctattcgtaaagctgaagaagcacgtaa 
agctgaagaagcacgtaaagctgaagaagcacgtaaagctgaagagggac 
ataaaacccaagaagcacctatagttgaagaaggctacaaggttaataac 
gttcatcaaactgatactacagttaaagcgtctgatttaccaaagactaa 
gacagtttccgcagttcatatggctagaacagacaataaacagataactt 
cacatcagacacatgttgaaaaacaaattaaaaatacattgccatccact 
ggtgacagcaaacgtggttattatatcactggaatggctatcgttatgct 
gagtgtattatttagtttagctaaaaagtttaaaagcaaatat 

SEQ ID NO. 5102 
STRAIN A909 

TTGAATAATAAAGGTGTCGGTGGCGAT 

GGTGTCCAAATTTATCAATACTATATCAAAATGGACAACAATAAACCTTA 
CTTAAGTCCCAAAGATAAGACTACTGTAGAGAAGTTAGAAGATCGCTGGA 
AAAAAATTACTTTCAAAGTTCAGGATACTGGCATTGGTTTGAAAGACGTT 
TATCTTCAATCTGTTAAGTATGTTGGTGGTGGCAATAATAATTTAGACCT 
TATCACACCTCCAGGATTTAAAAAAGAAGATAAAAAAGTTGAAAAACCAA 
AATTAGACCGTCCACCAGGAATTGATTTACCaCCACCAACTTCAATGAGA 
AGTTTTGATTATTCAACCCCACCGGGAACTAAGCCAAGCAAACCCAAAGA 
TAGTTTATCAACTCCTCCAGGTTTCCCAGATTTAAACACGCCGCCGGATG 
AAGCACTAAAGGATAGTAAAAAAGACGCTATTGAAGATAAATCAGGAGCA 
ATTAAATATGCTAAGTCTCTTCAACTTAGCTTTGTTGATGACCCTATTTT 
AGCTAGCAAAGTAAATGGCAAAATATTACAAGTCGAATCTGATGGCAAAT 
TAGTCATTCCTAGAAATGCTTTGTCAGCTAATCAATTTGATGACACTAGT 
CTTAAAATTTATCGTAATAATAATCGCAATAAAGAAATTACTATCACAAC 
AGATTATTTTGCAGATACAAAATATGTCAATATCACAGCGGTTGACTATT 
TGAGCAATACTACTTTTGAGCAATTAGCTACTGGTGAAACAGTAGATTAC 
CATGCCATTGTATTTTCAAGCTTTGCTGCTATTAAAGACAAGGGTGGTAA 
GATTTATGTTAACGATAAATTGCAAGAAACTTCTCGTATAGCGCTTAAAG 
ATAAATCTGTTAAGATTGGTATTGAATTACCAAATGATGTCAGACATATT 
GATAGTTTATCTGTTCGTCGTTTGAATGAGGTTAAAACTGTTGATAATAT 
CTTGAAAAATGATGAACAAGACATTAATCTCAGCAAAACTTACCAATTAA 
AATACAACCCGACAAATCGTCGTCTAGAGTTTACTATTAATAACATTAAC 
TCAAGTTCAGAAATCATGACCACTTTCAAAGATGGAAAGATGCCAGAATT 
GGTTGAaCAAAAAGATGTTTCTTTGGATATAaaCGATATGGACATGAGTA 
AGTTTAAAACTATTCGACTTGGACGAAAGGATTCTGAATTTAAGGGACAA 
CTTATTGCAAAAACTGGAACAGTTGAATTAGATATGTTTTTCAAACAATC 
TCAAGACCCAGCTTCAATTATTAAAAAAATATACCTTATCCAAAATGGTG 
TTCCAAATGAATTGAAAAAATTTGACTCTAGTTTTGGTTTAACTGAAAGT 
CAGATAGATGGATACTATATTTATAAAGATGCAATTAACCTTAAATTTAA 
ATTAACCAGTGGTGCAAGTCTTAAAGTTGTTTATAAAGGGCAAGAAGATC 
CATATAGTCATCAGAAAGAAGATATGACTAAAAAAGGTGAACAGCTCAGT 
CATTCAACTCAAGCCAATGAAAATACAGCAAAAGTAACCTTTGCTAATAT 
TGACTGGTCACATTATAGTAAGGTTACTGTGAATGGAAAAGAAGTTGGTA 
AAGGTAGTGAGTTACCTTTAACTAAAGGATGGACAACATTTGTATTACAT 
AAAACAGAAAATTCATTAAATGTTAAAAGTTTGATTATGGAGACGGGTAG 
TGTAAGTAAGAAAGTTCAACAACTTCCTTTAAGTCCTAGATTATCTAAAA 
ATAAGCATATGAGGGATATGCTACTTACTATGCAAAAAGATTCAGCGTAT 
TACGAaaCAAGTGACAGTCTAGTCCTTCGAATTAATCTCACTGCAGATAC 
TAAACTTAATTTTAATGCTGTTAAAGGAGCGAGTGCTCTTACTGAAAATA 
TGATGATGAGACAGTTTGCAGTTGCTGGACCACAAGATGATCCTGTTAGT 
GAACATAAATACCCATCAGTATTTCTCTTAACTCCTGCCTTATTGGAAAC 
TGCTAGTGAGGCAACTCTaAATGGTAAGGAAATCACAGCATCTGGTATTA 
TCGGTCACATCAAGGATGGTGATAAAAGCAAGCATGTTGAAGTCAAAATG 
GTGAATGAAAATGGAGACATGCTAGGAACCCCTGTTATTATTCAAGGTAA 
AGACTTGACTAATCGAACAAAACCATTAATGAGTGGACGTAGAGTACTTT 
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ATGCCGGTAAACAATATGAGTTCCGGGCTAAATTACCACTTAGTCGTTTT 
AACACTTGGATTAGGGTTGAAGTGGTAACAGAAGCAGGAGAGAAAGCAAG 
TATTGTTCGTCGCATGTTCTTTGACCAATCAGtTCCAGAGCTTAACACAG 
CAGTTGCTAAACGTGATTTGACTTCTGATACTGCTCTTATCCACATCGTT 
GCCAAAGATGACTCTCTAAAACTAAAATTATATCAAGATGATTCATTACT 
TGAATCTGTTGATAAAACCGGTCTTTATAGTTTTAGAAATGGTGTAGAAA 
TCACTAAAGATATGACAGTACCACTAGAATTTGGAGATAATATTATTAAG 
TTATCTGCTGTTGACTTATCAAATTATCGTCGTAATGAGACCCTTCATAT 
CTATAGAAACCGTTTTGATGTTAAAGCAAGCCAAATGACAGCTGACAAAG 
GAGCTAAAGTAACTGTGGATATGTTGATGAAGCACTTAGTTGTTCCAGAA 
ATGGCAGGAGCTTATACATTAACAATCGACGAAGATCCAAACACAAATGA 
ATCAGGAATGTTAACAAACGCTAAAGTATCGATTCATTATGTAAATGGTG 
GTGTTGATAAAGTTGATGTTCCGATTAAAGTAGTTGACTTAGAAGCTATT 
CGTAAAGCTGAAGAAGCACATAAAGCTGACGAAGCACGTAAAGCTGAAGA 
AGCACGTAAAGCTGAAGAAGCACGTAAAGCTGAAGAAGCACGTAAAGCTG 
AAGAGGGACATaAAACCCAAGAAGCACCTATAGTTGAAGAAGGCTACAAG 
GTTAATAACGTTCATCAAACTGATACTACAGTTAAAGCGTCTGATTTACC 
AAAGACTAAGACAGTTTCCGCAGTTCATATGGCTAGAACAGACAATAAAC 
AGATAACTTCACATCAGACACATGTTGAAAAACAAATTAAAAATA 

SEQ ID NO. 5103 
STRAIN H36B 

TGGTGTCCAAATTTATCAATACTATATCAAAATGGACAACAATAAACCTT 
ACTTAAGTCCCAAAGATAAGACTACTGTAGAGAAGTTAGaaGATCGCTGG 
AAAAAAATTACTTTCAAAGTTCAGGATACTGGCATTGGTTTGAAAGACGT 
TTATCTTCAATCTGTTAAGTATGTTGGTGGTGGCAATAATAATTTAGACC 
TTATCACACCTCCAGGATTTAAAAAAGAAGATAAAAAAGTTGAAAAACCA 
AAATTAGACCGTCCACCAGGAATTGATTTACCAGCACCAACTTCAATGAG 
AAGTTTTGATTATTCAACCCCACCGGGAACTAAGCCAAGCAAACCCAAAG 
ATAGTTTATCAACTCCTCCAGGTTTCCCAGATTTAAACACGCCGCCGGAT 
GAAGCACTAAAGGATAGTAAAAAAGACGCTATTGAAGATAAATCAGGAGC 
AATTAAATATGCTAAGTCTCTTCAACTTAGCTTTGTTGATGACCCTATTT 
TAGCTAGCAAAGTAAATGGCAAAATATTACAAGTCGAATCTGATGGCAAA 
TTAGTCATTCCTAGAAATGCTTTGTCAGCTAATCAATTTGATGACACTAG 
TCTTAAAATTTATCGTAATAATAATCGCAATAAAGAAATTacTATCACAA 
CAGATTATTTTGCAGATACAAAATATGTCAATATCACAGCGGTTGACTAT 
TTGAGCAATACTACTTTTGAGCAATTAGCTACTGGTGAAaCAGTAGATTA 
CCATGCCATTGTAtTTTCAAGCTTTGCTGCTATTAAAGACAAGGGTGGTA 
AGATTTATGTCAACGATAAATTGCAAGAAACTTCTCGTATAGCGCTTAAA 
GATAAATCTGTTAAGATTGGTATTGAATTACCAAATGATGTCAGACATAT 
TGATAGTTTATCTGTTCGTCGTTTGAATGAGGTTAAAACTGTTGATAATA 
TCTTGAAAAATGATGAACAAGACATTAATCTCAGCAAAACTTACCAATTA 
AAATACAACCCGACAAATCGTCGTCTAGAGTTTACTATTAATAACATTAA 
CTCAAGTTCAGAAATCATGACCACTTTCAAAGATGGAAAGATGCCAgAAT 
TGGTTGAACAAAAAGATGTTTCTTTGGATATAAACGATATGGACATGAGT 
AAGTTTAAAACTATTCGACTTGGACGAAAGGATTCTGAATTTAAGGGACA 
ACTTATTGCAAAAACTGGAACAGTTGAATTAGATATGTTTTTCAAACAAT 
CTCAAGACCCAGCTTCAATTATTAAAAAAATATACCTTATCCAAAATGGT 
GTTCCAAATGAATTGAAAAAATTTGACTCTAGTTTTGGTTTAACTGAAAG 
TCAGATAGATGGATACTATATTTATAAAGATGCAATTAACCTTAAATTTA 
AATTAACCAGTGGTGCAAGTCTTAAAGTTGTTTATAAAGGGCAAGAAGAT 
CCATATAGtCATCAGAAAGAAGATATGACTAAAAAAGGTGAACAGCTCAG 
TCATTCAACTCAAGCCAATGAAAATACAGCAAAAGTAACCTTTGCTAATA 
TTGACTGGTCACATTATAGTAAGGTTACTGTGAATGGAAAAGAAGTTGGT 
AAAGGTAGTGAGTTACCTTTAACTAAAGGATGGACAACATTTGTATTACA 
TAAAACAGAAAATTCATTAAATGTTAAAAGTTTGATTATGGAGACGGGTA 
GTGTAAGTAAGAAAGTTCAACAACTTCCTTTAAGTCCTAGATTATCTAAA 
AATAAGCATATGAGGGATATGCTACTTACTATGCAAAAAGATTCAGCGTA 
TTACGAAACAAGTGACAGTCTAGTCCTTCGAATTAATCTCACTGCAGATA 
CTAAACTTAATTTTAATGCTGTTAAAGGAGCGAGTGCTCTTACTGAAAAT 
ATGATGATGAGACAGTTTGCAGTTGCTGGACCACAAGATGATCCTGTTAG 
TGAACATAAATACCCATCAGTATTTCTCTTAACTCCTGCCTTATTGGAAA 
CTGCTAGTGAGGCaACTCTAAATGGTAAGGAAATCACAGCATCTGGTATT 
ATCGGTCACATCAAGGATGGtGATAAAAGCAAGCATGTTGAAGTCAAAAT 
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GGTGAATGAAAATGGAGACATGCTAGGAACCCCTGTTATTATTCAAGGTA 

AAGACTTGACTAATCGAACAAAACCATTAATGAGTGGACGTAGAGTACTT 

TATGCCGGTAAACAATATGAGTTCCGGGCTAAATTACCACTTAGTCGTTT 

TAACaCTTGGATTAGGGTTGAAGTGGTAACAGAAGCAGGAGAGAAAGCAA 

GTATTGTTCGTCGCATGTTCTTTGACCAATCAGTTCCAGAGCTTAACACA 

GCAGTTGCTAAACGTGATTTGACTTCTGATACTGCTCTTATCCACATCGT 

TGCCAAAGATGACTCTCTAAAACTAAAATTATATCAAGATGATTCATTAC 

TTGAATCTGTTGATAAAACCGGTCTTTATAGTTTTAGAAATGGTGTAGAA 

ATCACTAAAGATATGACAGTACCACTAGAATTTGGAGATAATATTACTAA 

GTTATCTGCTGTTGACTTATCAAATTATCGTCGTAATGAGACCCTTCATA 

TCTATAGAAACCGTTTTGATGTTAAAGCAAGCCAAATGACAGCTGACAAA 

GGAGCTAAAGTAACTGTGGATATGTTGATGAAGCACTTAGTTGTTCCAGA 

AATGGCAGGAGCTTATACATTAACAATCGACGAAGCTCCAAACACAAATG 

AATCAGGAATGTTAACAAACGCTAAAGTATCGATTCATTATGTAAATGGT 

GGTGTTGATAAAGttGATGTTCCGATTAAAGTAGTTGACTTAGAAGCTAT 

TCGTAAAGCTGAAGAAGCACATAAAGCTGACGAAGCACGTAAAGCTGAAG 

AAGCACGTAAAGCTGACGAAGCACATAAAGCTGAAGAAGTACGTAAAGCT 

GAAGAAGCACATAAAGTCGAAGAAGCACGTAAAGCTGAAGAGGGACATAA 

AACCCAAGAAGCACCTATAGTTGAAGAAGGCTACAAGGTTAATAACGTTC 

ATCAAACTGATACTACAGTTAAAGCGTCTGATTTACCAAAGACTAAGACA 

GTTTCCGCAGTTCATATGGCTAGAACAGACAATAAACAGATAACTTCACA 
TCAGACACATG 

SEQ ID NO. 5104 
STRAIN 18RS21 

TTGAATAATAAAGGTGTCGGTGGCGATGGTGTCCAA 

ATTTATCAATACTATATCAAAATGGACAACAATAAACCTTACTTAAGTCC 
CAAAGATAAGACTACTGTAGAGAAGTTAGAAGATCGCTGGAAAAAAATTA 
CTTTCAAAGTTCAGGATACTGGCATTGGTTTGAAAGACGTTTATCTTCAA 
TCTGTTAAGTATGTTGGTGGTGGCAATAATAATTTAGACCTTATCACACC 
TCCAGGATTTAAAAAAGAAGATAAAAAAGTTGAAAAACCAAAATTAGACC 
GTCCACCAGGAATTGATTTACCAGCACCAACTTCAATGAGAAGTTTTGAT 
TATTCAACCCCACCGGGAACTAAGCCAAGCAAACCCAAAGATAGTTTATC 
AACTCCTCCAGGTTTCCCAGATTTAAACACGCCGCCGGaTGAAGCACCAA 
AGGATAGTAAAAAAGACGCTATTGAAGATAAATCAGGAGCAATTAAATAT 
GCTAAGTCTCTTCAACTTAGCTTTGTTGATGACCCTATTTTAGCTAGCAA 
AGTAAATGGCAAAATATTACAAGTCGAATCTGATGGCAAATTAGTCATTC 
CTAGAAATGCTTTGTCAGCTAATCAATTTGATGACACTAGTCTTAAAATT 
TATCGTAATAATAATCGCAATAAAGAAATTACTATCACAACAGATTATTT 
TGCAGATACAAAATATGTCAATATCACAGCGGTTGACTATTTGAGCAATA 
CTACTTTTGAGCAATTAGCTACTGGTGAAACAGTAGATTACCATGCCATT 
GTATTTTCAAGCTTTGCTGCTATTAAAGACAAGGGTGGTAAGATTTATGT 
TAACGATAAATTGCAAGAaACTTCTCGTATAGCGCTTAAAGATAAATCTG 
TTAAGATTGGTATTGAATTACCAAATGATGTCAGACATATTGATAGTTTA 
TCTGTTCGTCGTTTGAATGAGGTTAAAACTGTTGATAATATCTTGAAAAA 
TGATGAACAAGACATTAATCTCAGCAAaACTTACCAATTAAAATACAACC 
CGACAAATCGTCGTCTAGAGTTTACTATTAATAACATTAACTCAAGTTCA 
GAAATCATGACCACTTTCAAAGATGGAAAGATGCCAGAATTGGTTGAACA 
AAAAGATGTTTCTTTGGATATaAACGATATGGACATGAGTAAGTTTAAAA 
CTATTCGACTTGGACGAAAGGATTCTGAATTTAAGGGACAACTTATTGCA 
AAAACTGGAACAGTTGAATTAGATATGTTTTTCAAACAATCTCAAGACCC 
AGCTTCAATTATTAAAAAAATATACCTTATCCAAAATGGTGTTCCT^AATG 
AATTGAAAAAATTTGACTCTAGTTTTGGTTTAACTGAAAGTCAGATAGAT 
GGATACTATATTTATAAAGATGCAATTAACCTTAAATTTAAATTAACCAG 
TGGTGCAAGT CTT AAAGTTGTTTATAAAGGGCAAGAAGAT CCATATAGTC 
ATCAGAAAGAAGATATGACTAAAAAAGGTGAACAGCTCAGTCATTCAACT 
CAAGCCAATGAAAATACAGCAAAAGTAACCTTTGCTAATATTGACTGGTC 
ACATTATAGTAAGGTTACTGTGAATGGAAAAGAAGTTGTTAAAGGTAGTG 
AGTTACCTTTAACTAAAGGATGGACAACATTTGTATTACATAAAACAGAA 
AATTCATTAAATGTTAAAAGTTTGATTATGGAGACGGGTAGTGTAAGTAA 
GAAAGTTCAACAACTTCCTTTAAGTCCTAGATTATCTAAAAATAAGCATA 
TGAGGGATATGCTACTTACTATGCAAAAAGATTCAGCGTATTACGAAACA 
AGTGACAGTCTAGTCCTTCGAATTAATCTCACTGCAGATACTAAACTT7\A 
TTTTAATGCTGTTAAAGGAGCGAGTGCTCTTACTGAAAATATGATGATGA 
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GACAGTTTGCAGTTGCTGGACCACAAGATGATCCTGTTAGTGAACATAAA 
TACCCATCAGTATTTCTCTTAACTCCTGCCTTATTGGAAACTGCTAGTGA 
GGCAACTCTAAATGGTAAGGAAATCACAGCATCTGGTATTATCGGTCACA 
TCAAGGATGGTGATAAAAGCAAGCATGT.TGAAGTCAAAATGGTGAATGAA 
AATGGAGACATGCTAGGAACCCCTGTTATTATTCAAGGTAAAGACTTGAC 
TAATCGAACAAAACCATTAATGAGTGGACGTAGAGTACTTTATGCCGGTA 
AACAATATGAGTTCCGGGCTAAATTACCACTTAGTCGTTTTAACACTTGG 
ATTAGGGTTGAAGTGGTAACAGAAGCAGGAGAGAAAGCAAGTATTGTTCG 
TCGCATGTTCTTTGACCAATCAGTTCCAGAGCTTAACACAGCAGTTGCTA 
AACGTGATTTGACTTCTGATACTGCTCTTATCCACATCGTTGCCAAAGAT 
GACTCTCTAAAACTAAAATTATATCAAGATGATTCATTACtTGAATCTGT 
TGATAAAACCGGTCTTTATAGTTTTAGAAATGGTGTAGAAATCACTAAAG 
ATATGACAGTACCACTAGAATTTGGAGATAATATTATTAAGTTATCTGCT 
GTTGACTTATCAAATTATCGTCGTAATGAGACCCTTCATATCTATAGAAA 
CCGTTTTGATGTTAAAGCAAGCCAAATGACAGCTGACAAAGGAGCTAAAG 
TAACTGTGGaTATGTTGATGAA(3CACTTAGTTGTTCCAGAAATGGCAGGA 
GCTTATACATTAACAATCGACGAAGCTCCAAACACAAATGAATCAGGAAT 
GTTAACAAACGCTAAAGTATCGATTCATTATGTAAATGGTGGTGTTGATA 
AAGTTGATGTTCCGATTAAAGTAGTTGACTTAGAAGCTATTCGTAAAGCT 
GAAGAAGCACGTAAAGCTGAAGAAGCACGTAAAGCTGAAGAGGGACATAA 
AACCCAAGAAGCACCTATAGTTGAAGAAGGCTACAAGGTTAATAACGTTC 
ATCAAACTGATACTACAGTTAAAGCGTCTGATTTACCAAAGACTAAGACA 
GTTTCCGCAGTTCATATGGCTAGAACAGACAATAAACAGATAACTTCACA 
TCAGACACATGTTGAA 

SEQ ID NO. 5105 
STRAIN M732 

TTGAATAATAAAGGTGTCGGTGGCGATGGTGTCC 

AAATTTATCAATACTATATCAAAATGGACAACAATAAACCTTACTTAAGT 
CCCAAAGATAAGACTACTGTAGAGAAGTTAGAAGATCGCTGGAAAAAAAT 
TACTTTCAAAGTTCAGGATACTGGCATTGGTTTGAAAGACGTTTATCTTC 
AATCTGTTAAGTATGTTGGTGGTGGCAATAATAATTTAGACCTTATCACA 
CCTCCAGGATTTAAAAAAGAAGATAAAAAAGTTGAAAAACCAAAATTAGA 
CCGTCCacCAGGAATTGATTTACCAGCACCAACTTCAATGAGAAGTTTTG 
ATTATTCAACCCCACCGGGAACTAAGCCAAGCAAACCCAAAGATAGTTTA 
TCAACTCCTCCAGGTTTCCCAGATTTAAACACGCCGCCGGATGAAGCCAC 
CAAAGGATAGTAAAAAAGACGCTATTGAAGATAAATCAGGAGCAATTAAA 
TATGCTAAGTCTCTTCAACTTAGCTTTGTTGATGACCCTATTTTAGCTAG 
CAAAGTAAATGGCAAAATATTACAAGTCGAATCTGATGGCAAATTAGTCA 
TTCCTAGAAATGCTTTGTCAGCTAATCAATTTGATGACACTAGTCTTAAA 
ATTTATCGTAATAATAATCGCAATAAAGAAATTACTATCACAACAGATTA 
TTTTGCAGATACAAAATATGTCAATATCACAGCGGTTGACTATTTGAGCA 
ATACTACTTTTGAGCAATTAGCTACTGGTGAAACAGTAGATTACCATGCC 
ATTGTATTTTCAAGCTTTGCTGCTATTAAAGACAAGGGTGGTAAGATTTA 
TGTTAACGATAAATTGCAAGAAACTTCTCGTATAGCGCTTAAAGATAAAT 
CTGTTAAGATTGGTATTGAATTACCAAATGATGTCAGACATATTGATAGT 
TTATCTGTTCGTCGTTTGAATGAGGTTAAAACTGTTGATAATATCTTGAA 
AAATGATGAACAAGACATTAATCTCAGCAAAACTTACCAATTAAAATACA 
ACCCGACAAATCGTCGTCTAGAGTTTACTATTAATAACATTAACTCAAGT 
TCAGAAATCATGACCACTTTCAAAGATGGAAAGATGCCAGAATTGGTTGA 
ACAAAAAGATGTTTCTTTGGATATAAACGATATGGACATGAGTAAGTTTA 
AAACTATTCGACTTGGACGAAAGGATTCTGAATTTAAGGGACAACTTATT 
GCAAAAACTGGAACAGTTGAATTAGATATGTTTTTCAAACAATCTCAAGA 
CCCAGCTTCAATT ATTAAAAAAATAT ACCTTATCCAAAATGGt GTT CCAA 
ATGAATTGAAAAAATTTGACTCTAGTTTTGGTTTAACTGAAAGTCAGATA 
GATGGATACTATATTTATAAAGATGCAATTAACCTTAAaTTTAAATTAAC 
CAGTGGTGCAAGTCTTAAAGTTGTTTATAAAGGGCAAGAAGATCCATATA 
GTCATCAGAAAGAAGATATGACTAAAAAAGGTGAACAGCTCAGTCATTCA 
ACTCAAGCCAATGAAAATACAGCAAAAGTAACCTTTGCTAATATTGACTG 
GTCACATTATAGTAAGGTTACTGTGAATGGAAAAGAAGTTGGTAAAGGTA 
GTGAGTTACCTTTAACTAAAGGATGGACAACATTTGTATTACATAAAACA 
GAAAATTCATTAAATGTTAAAAGTTTGATTATGGAGACGGGTAGTGTAAG 
TAAGAAAGTTCAACAACTTcCTTTAAGTCCTAGATTATCTAAAAATAAGC 
ATATGAGGGATATGCTACTTACTATGCAAAAAGATTCAGCGTATTACGAA 
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ACAAGTGACAGTCTAGTCCTTCGAATTAATCTCACTGCAGATACTAAACT 
TAATTTTAATGCTGTTAAAGGAGCGAGTGCTCTTACTGAAAATATGATGA 
TGAGACAGTTTGCAGTTGCTGGACCACAAGATGATCCTGTTaGTGAACAT 
AAATACCCATCAGTaTTTCTCTTAACTCCTGCCTTATTGGAAaCTGCTAG 
TGAGGCAACTCTAAATGGTAAGGAAATCACAGCATCTGGTATTATCGGTC 
ACATCAAGGATGGTGATAAAAGCAAGCATGTTGAAGTCAAAATGGTGAAT 
GAAAATGGAGACATGCTAGGAACCCCTGTTATTATTCAAGGTAAAGACTT 
GACTAATCGAACAAAACCATTAATGAGTGGACGTAGAGTACTTTATGCCG 
GTTVAACAATATGAGTTCCGGGCTAAATTACCACTTAGtCGTTTTAACACT 
TGGATTAGGGTTGAAGTGGTAACAGAAGCAGGAGAGAAAGCAAGTATTGT 
TCGTCGCATGTTCTTTGACCAATCAGTTCCAGAGCTTAACACAGCAGTTG 
CTAAACGTGATTTGACTTCTGATACTGCTCTTATCCACATCGTTGCCAAA 
GATGACTCTCTAAAACTAAAATTATATCAAGATGATTCATTACTTGAATC 
TGTTGATAAAACCGGTCTTTATAGTTTTAGAAATGGTGTAGAAATCACTA 
AAGATATGACAGTACCACTAGAATTTGGAGATAATATTATTAAGTTATCT 
GCTGTTGACTTATCAAATTATCGTCGTAATGAGACCCTTCATATCTATAG 
AAACCGTTTTGATGTTAAAGCAAGCCAAATGACAGCTGACAAAGGAGCTA 
AAGTAACTGTGGATATGTTGATGAAGCACTTAGTTGTTCCAGAAATGGCA 
GGAGCTTATACATTAACAATCGACGAAGCTCCAAACACAAATGAATCAGG 
AATGTTAACAAACGCTAAAGTATCGATTCATTATGTAAATGGTGGTGTTG 
ATAAAGTTGATGTTCCGATTAAAGTAGTTGACTTAGAAGCTATTCGTAAA 
GCTGAAGAAGCACATAAAGCTGACGAAGCACGTAAAGCTGAAGAAGCACG 
TAAAGCTGAAGAAGCACATAAAGCTGAAGAAGTACGTAAAGCTGAAGAAG 
CACATAAAGTCGAAGAAGCACGTAAAGCTGAAGAGGGACATAAAACCCAA 
GAAGCACCTATAGTTGAAGAAGGCTACAAAGTTAATAACGTTCATCAAAC 
TGATACTACAGTTAAAGCGTCTGATTTACCAAAGACTAAGACAGTTTCCG 
CAGTTCATATGGCTAGAACAGACAATAAACAGATAACTTCACATCAGACA 
CATGTTGAAAA 

SEQ ID NO. 5106 
STRAIN COH1 

TTGAATAATAAAGGTGTCGGTGGCGATGGT 

GTCCAAATTTATCAATACTATATCAAAATGGACAACAATAAACCTTACTT 
AAGTCCCAAAGATAAGACTACTGTAGAGAAGTTAGAAGATCGCTGGAAAA 
AAATTACTTTCAAAGTTCAGGATACTGGCATTGGTTTGAAAGACGTTTAT 
CTTCAATCTGTTAAGTATGTTGGTGGTGGCAATAATAATTTAGACCTTAT 
CAC ACCT CC AGGATTT AAAAAAGAAGATAAAAAAGTTGAAAAACCAAAAT 
TAGACCGTCCACCAGGAATTGATTTACCAGCACCAACTTCAATGAGAAGT 
TTTGATTATTCAACCCCACCGGGAACTAAGCCAAGCAAACCCAAAGATAG 
TTTATCAACTCCTCCAGGtTTCCCAGATTTAAACACGCCGCCGGATGAAG 
CCaCCAAAGGATAGTAAAAAAGACGCTATTGAAGATAAATCAGGAGCAAT 
TAAATATGCTAAGTCTCTTCAACTTAGCTTTGTTGATGACCCTATTTTAG 
CTAGCAAAGTAAATGGCAAAATATTACAAGTCGAATCTGATGGCAAATTA 
GTCATTCCTAGAAATGCTTTGTCAGCTAATCAATTTGATGACACTAGTCT 
TAAAATTTATCGTAATAATAATCGCAATAAAGAAATTACTATCACAACAG 
ATTATTTTGCAGATACAAAATATGTCAATATCACAGCGGTTGACTATTTG 
AGCAATACTACTTTTGAGCAATTAGCTACTGGTGAAACAGTAGATTACCA 
TGCCATTGTATTTTCAAGCTTTGCTGCTATTAAAGACAAGGGTGGTAAGA 
TTTATGTTAACGATAAATTGCAAGAAACTTCTCGTATAGCGCTTAAAGAT 
AAATCTGTTAAGATTGGTATTGAATTACCAAATGATGTCAGACATATTGA 
TAGTTTATCTGTTCGTCGTTTGAATGAGGTTAAAACTGTTGATAATATCT 
TGAAAAATGATGAACAAGACATTAATCTCAGCAAAACTTACCAATTAAAA 
TACAACCCGACAAATCGTCGTCTAGAGTTTACTATTAATAACATTAACTC 
AAGTTCAGAAATCATGACCACTTTCAAAGATGGAAAGATGCCAGAATTGG 
TTGAACAAAAAGATGTTTCTTTGGATATAAACGATATGGACATGAGTAAG 
TTTAAAACTATTCGACTTGGACGAAAGGATTCTGAATTTAAGGGACAACT 
TATTGCAAAAACTGGAACAGTTGAATTAGATATGTTTTTCAAACAATCTC 
AAGACCCAGCTTCAATTATTAAAAAAATATACCTTATCCAAAATGGTGTT 
CCAAATGAATTGAAAAAATTTGACTCTAGTTTTGGTTTAACTGAAAGTCA 
GATAGATGGATACTATATTTATAAAGATGCAATTAACCTTAAATTTAAAT 
TAACCAGTGGTGCAAGTCTTAAAGTTGTTTATAAAGGGCAAGAAGATCCA 
TATAGTCATCAGAAAGAAGATATGACTAAAAAAGGTGAACAGCTCAGTCA 
TTCAACTCAAGCCAATGAAAATACAGCAAAAGTAACCTTTGCTAATATTG 
ACTGGTCACATTATAGTAAGGTTACTGTGAATGGAAAAGAAGTTGGTAAA 
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GGTAGTGAGTTACCTTTAACTAAAGGATGGACAACATTTGTATTACATAA 
AACAGAAAATTCATTAAATGTTAAAAGTTTGATTATGGAGACGGGTAGTG 
TAAGTAAGAAAGTTCAACAACTTCCTTTAAGTCCTAgATTATCTAAAAAT 
AAGCATATGAGGGATATGCTACTTACTATGCT^AAAAGATTCAGCGTATTA 
CGAAACAAGTGACAGTCTAGTCCTTCGAATTAATCTCACTGCAGATACTA 
AACTTAATTTTTVATGCTGTTAAAGGAGCGAGTGCTCTTACTGAAAATATG 
ATGATGAGACAGTTTGCAGTTGCTGGACCACAAGATGATCCTGTTAGTGA 
ACATAAATACCCATCAGTATTTCTCTTAACTCCTGCCTTATTGGAAACTG 
CTAGTGAGGCAACTCTAAATGGTAAGGAAATCACAGCATCTGGTATTATC 
GGTCACATCAAGGATGGTGATAAAAGCAAGCATGTTGAAGTCAAAATGGT 
GAATGAAAATGGAGACATGCTAGGAACCCCTGTTATTATTCAAGGTAAAG 
ACTTGACTAATCGAACAAAACCATTAATGAGTGGACGTAGAGTACTTTAT 
GCCGGTAAACAATATGAGTTCCGGGCTAAATTACCACTTAGTCGTTTTAA 
CACTTGGATTAGGGTTGAAGTGGTAACAGAAGCAGGAGAGAAAGCAAGTA 
TTGTTCGTCGCATGTTCTTTGACCAATCAGTTCCAGAGCTTAACACAGCA 
GTTGCTAAACGTGATTtGACTTCTGATACTGCTCTTATCCACATCGTTGC 
CAAAGATGACTCTCTAAAaCTAAAATTATATCAAGATGATTCATTACTTG 
AATCTGTTGATAAAACCGGTCTTTATAGTTTTAGAAATGGTGTAGAAATC 
ACTAAAGATATGACAGTACCACTAGAATTTGGAGATAATATTATTAAGTT 
ATCTGCTGTTGACTTATCAAATTATCGTCGTAATGAGACCCTTCATATCT 
ATAGAAACCGTTTTGATGTTAAAGCAAGCCAAATGACAGCTGACAAAGGA 
GCTAAAGTAACTGTGGATATGTTGATGAAGCACTTAGTTGTTCC7VGAAAT 
GGCAGGAGCTTATACATTAACAATCGACGAAGCTCCAAACACAAATGAAT 
CAGGAATGTTAACAAACGCTAAAGTATCGATTCATTATGTAAATGGTGGT 
GTTGATAAAGTTGATGTTCCGATTAAAGTAGTTGACTTAGAAGCTATTCG 
TAAAGCTGAAGAAGCACATAAAGCTGACGAAGCACGTAAAGCTGAAGAAG 
CACGTAAAGCTGAAGAAGCACATAAAGCTGAAGAAGTACGTAAAGCTGAA 
GAAGCACATAAAGTCGAAGAAGCACGTAAAGCTGAAGAGGGACATAAAAC 
CCAAGAAGCACCTATAGTTGAAGAAGGCTACAAAGTTAATAACGTTCATC 
AAACTGATACTACAGTTAAAGCGTCTGATTTACCAAAGACTAAGACAGTT 
TCCGCAGTTCATATGGCTAGAACAGACAATAAACAGATAACTTCACATCA 
GACACATGT 

SEQ ID NO. 5107 
STRAIN M781 

TTGAATAATAAAGGTGTCGGTGGCGATGGT 

gtccaAatttatcaatactatatcaaaatggacaacaataaaccttactt 
aagtcccaaagataagactactgtagagaagttagaagatcgctggaaaa 
aaattactttcaaagttcaggatactggcattggtttgaaagacgtttat 
cttcaatctgttaagtatgttggtggtggcaataataatttagaccttat 
cacacctccaggatttaaaaaagaagataaaaaagttgaaaaaccaaaat 
tagaccgtccaccaggaattgatttaccagcaccaacttcaatgagaagt 

TTTGATTATTCAACCCCACCGGGAACTAAGCCAAGCAAACCCAAAGATAG 
TTTATCAACTCCTCCAGGTTTCCCAGATTTAAACACGCCGCCGGATGAAG 
CCaCCAAAGGATAGTAAAAAAGACGCTATTGAAGATAAATCAGGAGCAAT 
TAAATATGCTAAGTCTCTTCAACTTAGCTTTGTTGATGACCCTATTTTAG 
CTAGCAAAGTAAATGGCAAAATATTACAAGTCGAATCTGATGGCAAATTA 
GTCATTCCTAGAAATGCTTTGTCAGCTAATCAATTTGATGACACTAGTCT 
TAAaATTTATCGTAATAATAATCGCAATAAAGAAATTaCTATCACAACAG 
ATTATTTTGCAGATACAAAATATGTCAATATCACAGCGGTTGACTATTTG 
AGCAATACTACTTTTGAGCAATTAGCTACTGGTGAAACAGTAGATTACCA 
TGCCATTGTATTTTCAAGCTTTGCTGCTATTAAAGACAAGGGTGGTAAGA 
TTTATGTTAACGATAAATTGCAAGAAACTTCTCGTATAGCGCTTAAAGAT 
AAATCTGTTAAGATTGGTATTGAATTACCAAATGATGTCAGACATATTGA 
TAGTTTATCTGTTCGTCGTTTGAATGAGGTTT^AAACTGTTGATAATATCT 
TGAAAAATGATGAACAAGACATTAATCTCAGCAAAACTTACCAATTAAAA 
TACAACCCGACAAATCGTCGTCTAGAGTTTACTATTAATAACATTAACTC 
AAGTTCAGAAATCATGACCACTTTCAAAGATGGAAAGATGCCAGAATTGG 
TTGAACAAAAAGATGTTTCTTTGGATATAAACGATATGGACATGAGTAAG 
TTTAAAACTATTCGACTTGGACGAAAGGATTCTGAATTTAAGGGACAACT 
TATTGCAAAAACTGGAACAGTTGAATTAGATATGTTTTTCAAACAATCTC 
AAGACCCAGCTTCAATTATTAAAAAAATATACCTTATCCAAAATGGTGTT 
CCAAATGAATTGAAAAAATTTGACTCTAGTTTTGGTTTAACTGAAAGTCA 
GATAGATGGATACTATATTTATAAAGATGCAATTAACCTTAAATTTAAAT 
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TAACCAGTGGTGCAAGTCTTAAAGTTGTTTATAAAGGGCAAGAAGATCCA 
TATAGTCATCAGAAAGAAGATATGACTAAAAAAGGTGAACAGCTCAGTCA 
TTCAACTCAAGCCAATGAAAATACAGCAAAAGTAACCTTTGCTAATATTG 
ACTGGTCACATTATAGTAAGGTTACTGTGAATGGAAAAGAAGTTGGTAAA 
GGTAGTGAGTTACCTTTAACTAAAGGATGGACAACATTTGTATTACATAA 
AACAGAAAATTCATTAAATGTTAAAAGTTTGATTATGGAGACGGGTAGTG 
TAAGTAAGAAAGTTCAACAACTTCCTTTAAGTCCTAGATTATCTAAAAAT 
AAGCATATGAGGGATATGCTACTTACTATGCAAAAAGATTCAGCGTATTA 
CGAAACAAGTGACAGTCTAGTCCTTCGAATTAATCTCACTGCAGATACTA 
AACTTAATTTTAATGCTGTTAAAGGAGCGAGTGCTCTTACTGAAAATATG 
ATGATGAGACAGTTTGCAGTTGCTGGACCACAAGATGATCCTGTTAGTGA 
ACATAAATACCCATCAGTATTTCTCTTAACTCCTGCCTTATTGGAAACTG 
CTAGTGAGGCAACTCTAAATGGTAAGGAAATCACAGCATCTGGTATTATC 
GGTCACATCAAGGATGGTGATAAAAGCAAGCATGTTGAAGTCAAAATGGT 
GAATGAAAATGGAGACATGCTAGGAACCCCTGTTATTATTCAAGGTAAAG 
ACTTGACTAATCGAACAAAACCATTAATGAGTGGACGTAGAGTACTTTAT 
GCCGGTAAACAATATGAGTTCCGGGCTAAATTACCACTTAGTCGTTTTAA 
CACTTGGATTAGGGTTGAAGTGGTAACAGAAGCAGGAGAGAAAGCAAGTA 
TTGTTCGTCGCATGTTCTTTGACCAATCAGTTCCAGAGCTTAACACAGCA 
GTTGCTAAACGTGATTTGACTTCTGATACTGCTCTTATCCACATCGTTGC 
CAAAGATGACT CT CTAAAACTAAAATTATATCAAGATGATTCATTACTTG 
AATCTGTTGATAAAACCGGTCTTTATAGTTTTAGAAATGGTGTAGAAATC 
ACTAAAGATATGACAGTACCACTAGAATTTGGAGATAATATTATTAAGTT 
ATCTGCTGTTGACTTATCAAATTATCGTCGTAATGAGACCCTTCATATCT 
ATAGAAACCGTTTTGATGTTAAAGCAAGCCAAATGACAGCTGACAAAGGA 
GCTAAAGTAACTGTGGATATGTTGATGAAGCACTTAGTTGTTCCAGAAAT 
GGCAGGAGCTTATACATTAACAATCGACGAAGCTCCAAACACAAATGAAT 
CAGGAATGTTAACAAACGCTAAAGTATCGATTCATTATGTAAATGGTGGT 
GTTGATAAAGTTGATGTTCCGATTAAAGTAGTTGACTTAGAAGCTATTCG 
TAAAGCTGAAGAAGCACATAAAGCTGACGAAGCACGTAAAGCTGAAGAAG 
CACGTAAAGCTGAAGAAGCACATAAAGCTGAAGAAGTACGTAAAGCTGAA 
GAAGCACATAAAGTCGAAGAAGCACCGTAAAGCTGAAGAGGGACATAAAA 
CCCAAGAAGCACCTATAGTTGAAGAAGGCTACAAAGTTAATAACGTTCAT 
CAAACTGATACTACAGTTAAAGCGTCTGATTTACCAAAGACTAAGACAGT 

TTCCGCAGTTCATATGGCTAGAACAGACAATAAACAGATAACTTCACATC 
AGACACATGTTG 

SEQ ID NO. 5109 
STRAIN JM9130013 

TGGTGTCCAAATTTATCAATACTATATCAAAATGGACAACAATAAAC 

CTTACTTAAGTCCCAAAGATAAGACTACTGTAGAGAAGTTAGAAGATCGC 

TGGAAAAAAATTACTTTCAAAGTTCAGGATACTGGCATTGGTTTGAAAGA 

CGTTTATCTTCAATCTGTTAAGTATGTTGGTGGTGGCAATAATAATTTAG 

ACCTTATCACACCTCCAGGATTTAAAAAAGAAGATAAAAAAGTTGAAAAA 

CCAAAATTAGACCGTCCACCAGGAATTGATTTACCAGCACCAACTTCAAT 

GAGAAGTTTTGATTATTCAACCCCACCGGGAACTAAGCCAAGCAAACCCA 

AAGATAGTTTATCAACTCCTCCAGGTTTCCCAGATTTAAACACGCCGCCG 

GATGAAGCACCAAAGGATAGTAAAAAAGACGCTATTGAAGATAAATCAGG 

AGCAATTAAATATGCTAAGTCTCTTCAACTTAGCTTTGTTGATGACCCTA 

TTTTAGCTAGCAAAGTAAATGGCAAAATATTACAAGTCGAATCTGATGGC 

AAATTAGTCATTCCTAGAAATGCTTTGTCAGCTAATCAATTTGATGACAC 

TAGTCTTAAAATTTATCGTAATAATAATCGCAATAAAGAAATTACTATCA 

CAACAGATTATTTTGCAGATACAAAATATGTCAATATCACAGCGGTTGAC 

TATTTGAGCAaTACTACTTTTGAGCAATTAGCTACTGGTGAAACAGTAGA 

TTACCATGCCATTGTATTTTCAAGCTTTGCTGCTATTAAAGACAAGGGTG 

GTAAGATTTATGTTAACGATAAATTGCAAGAAACTTCTCGTATAGCGCTT 

AAAGATAAATCTGTTAAGATTGGTATTGAATTACCAAATGATGTCAGACA 

TATTGATAGTTTATCTGTTCGTCGTTTGAATGAGGTTAAAACTGTTGATA 

ATATCTTGAAAAATGATGAACAAGACATTAATCTCAGCAAAACTTACCAA 

TTAAAATACAACCCGACAAATCGTCGTCTAGAGTTTACTATTAATAACAT 

TAACTCAAGTTCAGAAATCATGACCACTTTCAAAGATGGAAAGATGCCAG 

AATTGGTTGAACAAAAAGATGTTTCTTTGGATATAAACGATATGGACATG 

AGTAAGTTTAAAACTATTCGACTTGGACGAAAGGATTCTGAATTTAAGGG 

ACAACTTATTGCAAAAACTGGAACAGTTGAATTAGATATGTTTTTCAAAC 
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AATCTCAAGACCCAGCTTCAATTATTAAAAAAATATACCTTATCCAAAAT 
GGTGTTCCAAATGAATTGAAAAAATTTGACTCTAGTTTTGGTTTAACTGA 
AAGTCAGATAGATGGATACTATATTTATAAAGATGCAATTAACCTTAAAT 
TTAAATTAACCAGTGGTGCAaGTCTTAAAGTTGTTTATAAAGGGCAAGAA 
GATCCATATAGTCATCAGAAAGAAGATATGACTAAAArAGGTGAACAGCT 
CAGTCATTCAACTCAAGCCAATGAAAATACAGCAAAAGTAACCTTTGCTA 
ATATTGACTGGTCACATTATAGTAAGGTTACTGTGAATGGAAAAGAAGTT 
GGTAAAGGTAGTGAGTTACCTTTAACTAAAGGATGGACAACATTTGTATT 
ACATAAAACAGAAAATTCATTAAATGTTAAAAGTTTGATTATGGAGACGG 
GTAGTGTAAGTAAGAAAGTTCAACAACTTCCTTTAAGTCCTAGATTATCT 
AAAAATAAGCATATGAGGGATATGCTACTTACTATGCAAAAAGATTCAGC 
GTATTACGAAACAAGTGACAGTCTAGTCCTTCGAATTAATCTCACTGCAG 
ATACTAAACTTAATTTTAATGCTGTTAAAGGAGCGAGTGCTCTTACTGAA 
AATATGATGATGAGACAGTTTGCAGTTGCTGGACCACAAGATGATCCTGT 
TAGTGAACATAAATACCCATCAGTATTTCTCTTAACTCCTGCCTTATTGG 
AAACTGCTAGTGAGGCAACTCTAAATGGTAAGGAAATCACAGCATCTGGT 
ATTATCGGTCACATCAAGGATGGTGATAAAAGCAAGCATGTTGAAGTCAA 
AATGGTGAATGAAAATGGAGACATGCTAGGAACCCCTGTTATTATTCAAG 
GTAAAGACTTGACTAATCGAACAAAACCATTAATGAGTGGACGTAGAGTA 
CTTTATGCCGGTAAACAATATGAGTTCCGGGCTAAATTACCACTTAGTCG 
TTTTAACACTTGGATTAGGGTTGAAGTGGTAACAGAAGCAGGAgaGaaag 
cAaGTATTGTTCGTCGCATGTTCTTTGACCAATCAGTTCCAGAGCTTAAC 
ACAGCAGTTGCTAAACGTGATTTGACTTCTGATACTGCTCTTATCCACAT 
CGTTGCCAAAGATGACTCTCTAAAACTAAAATTATATCAAGATGATTCAT 
TACTTGAATCTGTTGATAAAACCGGTCTTTATAGTTTTAGAAATGGTGTA 
GAAATCACTAAAGATATGACAGTACCACTAGAATTTGGAGATAATATTAT 
TAAGTTATCTGCTGTTGACTTATCAAATTATCGTCGTAATGAGACCCTTC 
ATATCTATAGAAACCGTTTTGATGTTAAAGCAAGCCAAATGACAGCTGAC 
AAAGGAGCTAAAGTAACTGTGGATATGTTGATGAAGCACTTAGTTGTTCC 
AGAAATGGCAGGAGCTTATACATTAACAATCGACGAAGCTCCAAACACAA 
ATGAATCAGGAATGTTAACAAACGCTAAAGTATCGATTCATTATGTAAAT 
GGTGGTGTTGATAAAGTTGATGTTCCGATTAAAGTAGTTGACTTAGAAGC 
TATTCGTAAAGCTGAAGAAGCACATAAAGCTGACGAAGCACGTAAAGCTG 
AAGAAGCACGTAAAGCTGAAGAAGCACATAAAGCTGAAGAAGTACGTAAA 
GCTGAAGAAGCACATAAAGTCGAAGAAGCACCGTAAAGCTGAAGAGGGAC 
ATAAAACCCAAGAAGCACCTATAGTTGAAGAAGGCTACAAGGTTAATAAC 
GTTCATCAAACTGATACTACAGTTAAAGCGTCTGATTTACCAAAGACTAA 
GACAGTTTCCGCAGTTCATATGGCTAGAACAGACAATAAACAGATAACTT 
CACATCAGACACATGTTG 

SEQ ID NO. 5110 
STRAIN 2603 frame: 1 

LNNKGVGGDGVQIYQYYIKMDNNKPYLSPKDKTTVEKLEDRWECKITFKVQDTGIGLKDVY 
LQSVKYVGGGNNNLDLITPPGETCKEDKKVEKPKLDRPPGIDLPAPTSMRSFDYSTPPGTK 
PSKPKDSLSTPPGFPDLNTPPDEAPKDSKKDAIEDKSGAIKYAKSLQLSFVDGPILASKV 
NGKILQVESDGKLVIPRNALSANQFDDTSLKIYRNNNRNKEITITTDYFADTKYVNITAV 
DYLSNTTFEQLATGETVDYHAIVFSSFAAIKDKGGKIYVNDKLQETSRIALKDKSVKIGI 
ELPNDVRHIDSLSVRRLNEVKTVDNILKNDEQDINLSKTYQLKYNPTNRRLEFTINNINS 
SSEIMTTFKDGiCMPELVEQKDVSLDINDMDMSKFKTIRLGRKDSEFKGQLIABCTGTVELD 
MFFKQSQDPASIIKKIYLIQNGVPNELKKFDSSFGLTESQIDGYYIYKDAINLKFKLTSG 
ASLKWYKGQE D P YS HQKE DMTKKGEQL S HSTQANENTAKVT FAN I DW S H YS KVT VNGKE 
WKGSELPLTKGWTTFVLHKTENSLNVKSLIMETGSVSKKVQQLPLSPRLSKNKHMRDML 
LTMQKDSAYYETSDSLVLRINLTADTKLNFNAVKGASALTENMMMRQFAVAGPQDDPVSE 
HKYPSVFLLTPALLETASEATLNGKEITASGIIGHIKDGDKSKHVEVKMVNENGDMLGTP 
VIIQGKDLTNRTKPLMSGRRVLYAGKQYEFRAKLPLSRFNTWIRVEWTEAGEKASIVRR 
MFFDQSVPELNTAVAKRDLTSDTALIHIVAKDDSLKLKLYQDDSLLESVDKTGLYSFRNG 
VEITKDMTVPLEFGDNIIKLSAVDLSNYRRNETLHIYRNRFDVKASQMTADKGAKVTVDM 
LMKHL W PEMAGAYT LT I DEAPNTNE S GMLTN AKVS IH YVNGGVDKVDVP I KWDLE AI R 
KAEEARBCAEEARKAEEARKAEEGHKTQEAPIVEEGYKVNNVHQTDTTVKASDLPKTKTVS 
AVHMARTDNKQITSHQTHVEKQIKNTLPSTGDSKRGYYITGMAIVMLSVLFSLAKKFKSK 
Y 

SEQ ID NO. 5111 

STRAIN A909 frame: 1 
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LNNKGVGGDGVQIYQYYIKMDNNKPYLSPKDKTTVEKLEDRWKKITFKVQDTGIGLKDVY 
LQSVKYVGGGNNNLDLITPPGFKKEDKKVEKPKLDRPPGIDLPPPTSMRSFDYSTPPGTK 
PSKPKDSLSTPPGFPDLNTPPDEALKDSKKDAIEDKSGAIKYAKSLQLSFVDDPILASKV 
NGKILQVESDGKLVIPRNALSANQFDDTSLKIYRNNNRNKEITITTDYFADTKYVNITAV 
DYLSNTTFEQLATGETVDYHAIVFSSFAAIKDKGGKIYVNDKLQETSRIALKDKSVKIGI 
ELPNDVRHIDSLSVRRLNEVKTVDNILKNDEQDINLSKTYQLKYNPTNRRLEFTINNINS 
SSEIMTTFKDGKMPELVEQKDVSLDINDMDMSKFKTIRLGRKDSEFKGQLIAKTGTVELD 
MFFKQSQDPASIIKKIYLIQNGVPNELKKFDSSFGLTESQIDGYYIYKDAINLKFKLTSG 
ASLKWYKGQEDPYSHQKEDMTKKGEQLSHSTQANENTAKVTFANIDWSHYSKVTVNGKE 
VGKGSELPLTKGWTTFVLHKTENSLNVKSLIMETGSVSKKVQQLPLSPRLSKNKHMRDML 
LTMQKDSAYYETSDSLVLRINLTADTECLNFNAVKGASALTENMMMRQFAVAGPQDDPVSE 
HKYPSVFLLTPALIiETASEATLNGKEITASGIIGHIKDGDKSKHVEVKMVNENGDMLGTP 
VIIQGKDLTNRTKPLMSGRRVLYAGKQYEFRAKLPLSRFNTWIRVEWTEAGEKASIVRR 
MFFDQSVPELNTAVAKRDLTSDTALIHIVAKDDSLKLKLYQDDSLLESVDKTGLYSFRNG 
VEITKDMTVPLEFGDNIIKLSAVDLSNYRRNETLHIYRNRFDVKASQMTADKGAKVTVDM 
LMKHLWPEMAGAYTLTIDEDPNTNESGMLTNAKVSIHYVNGGVDKVDVPIKWDLEAIR 
KAEEAHKADEARKAEEARKAEEARKAEEARKAEEGHKTQEAPIVEEGYKVNNVHQTDTTV 
KASDLPKTKTVSAVHMARTDNKQITSHQTHVEKQIKN 

SEQ ID NO. 5112 

STRAIN H36B frame: 2 

GVQIYQYYIKMDNNKPYLSPKDKTTVEKLEDRWKKITFKVQDTGIGLKDVYLQSVKYVGG 
GNNNLDLITPPGFKKEDKKVEKPKLDRPPGIDLPAPTSMRSFDYSTPPGTKPSKPKDSLS 
TPPGFPDLNTPPDEALKDSKKDAIEDKSGAIKYAKSLQLSFVDDPILASKVNGKILQVES 
DGKLVIPRNALSANQFDDTSLKIYRNNNRNKEITITTDYFADTKYVNITAVDYLSNTTFE 
QLATGETVDYHAIVFSSFAAIKDKGGKIYVNDKLQETSRIALKDKSVKIGIELPNDVRHI 
DSLSVRRLNEVKTVDNILKNDEQDINLSKTYQLKYNPTNRRLEFTINNINSSSEIMTTFK 
DGKMPELVEQKDVSLDINDMDMSKFKTIRLGRKDSEFKGQLIAKTGTVELDMFFKQSQDP 
ASIIKKIYLIQNGVPNELKKFDSSFGLTESQIDGYYIYKDAINLKFKLTSGASLKWYKG 
QEDPYSHQKEDMTKKGEQLSHSTQANENTAKVTFANIDWSHYSKVTVNGKEVGKGSELPL 
TKGWTTFVLHKTENSLNVKSLIMETGSVSKKVQQLPLSPRLSKNKHMRDMLLTMQKDSAY 
YETSDSLVLRINLTADTKLNFNAVKGASALTENMMMRQFAVAGPQDDPVSEHKYPSVFLL 
TPALLETASEATLNGKEITASGIIGHIKDGDKSKHVEVKMVNENGDMLGTPVIIQGKDLT 
NRTKPLMSGRRVLYAGKQYEFRAKLPLSRFNTWIRVEWTEAGEKASIVRRMFFDQSVPE 
LNTAVAKRDLTSDTALIHIVAKDDSLKLKLYQDDSLLESVDKTGLYSFRNGVEITKDMTV 
PLEFGDNITKLSAVDLSNYRRNETLHIYRNRFDVKASQMTADKGAKVTVDMLMKHLVVPE 
MAGAYTLTIDEAPNTNESGMLTNABCVSIHYVNGGVDKVDVPIKWDLEAIRKAEEAHKAD 
EARKAEEARKADEAHKAEEVRKAEEAHKVEEARKAEEGHKTQEAPIVEEGYBCVNNVHQTD 
TTVKAS DLPKTKTVSAVHMARTDNKQITSHQTH 

SEQ ID NO. 5113 

STRAIN 18RS21 frame: 1 

LNNKGVGGDGVQIYQYYIKMDNNKPYLSPKDKTTVEKLEDRWKKITFKVQDTGIGLKDVY 
LQSVKYVGGGNNNLDLITPPGFKKEDKKVEKPKLDRPPGIDLPAPTSMRSFDYSTPPGTK 
PSKPKDSLSTPPGFPDLNTPPDEAPKDSKKDAIEDKSGAIKYAKSLQLSFVDDPILASKV 
NGKILQVESDGKLVIPRNALSANQFDDTSLKIYRNNNRNKEITITTDYFADTKYVNITAV 
DYLSNTTFEQLATGETVDYHAIVFSSFAAIKDKGGKIYVNDKLQETSRIALKDKSVKIGI 
ELPNDVRHIDSLSVRRLNEVKTVDNILKNDEQDINLSKTYQLKYNPTNRRLEFTINNINS 
SSEIMTTFKDGKMPELVEQKDVSLDINDMDMSKFKTIRLGRKDSEFKGQLIAKTGTVELD 
MFFKQSQDPASIIKKIYLIQNGVPNELKKFDSSFGLTESQIDGYYIYKDAINLKFKLTSG 
ASLKWYKGQEDPYSHQKEDMTKKGEQLSHSTQANENTAKVTFANIDWSHYSKVTVNGKE 
VVKGSELPLTKGWTTFVLHKTENSLNVKSLIMETGSVSKKVQQLPLSPRLSKNKHMRDML 
LTMQKD S AYYET S D SLVLRINLTADTKLN FNAVKGAS ALTENMMMRQFAVAG PQDD PVSE 
HKYPSVFLLTPALLETASEATLNGKEITASGIIGHIKDGDKSKHVEVKMVNENGDMLGTP 
VIIQGKDLTNRTKPLMSGRRVLYAGKQYEFRAKLPLSRFNTWIRVEWTEAGEKASIVRR 
MFFDQSVPELNTAVAKRDLTSDTALIHIVAKDDSLKLKLYQDDSLLESVDKTGLYSFRNG 
VEITKDMTVPLEFGDNIIKLSAVDLSNYRRNETLHIYRNRFDVKASQMTADKGAKVTVDM 
LMKHLWPEMAGAYTLTIDEAPNTNESGMLTNAKVSIHYVNGGVDKVDVPIKWDLEAIR 
KAEEARKAEEARKAEEGHKTQEAPI VEEGYKVNNVHQT DTTVKAS DLPKTKTVS AVHMAR 
TDNKQITSHQTHVE 

SEQ ID NO. 5114 

STRAIN M732 frame: 1 

LNNKGVGGDGVQIYQYYIKMDNNKPYLSPKDKTTVEKLEDRWKKITFKVQDTGIGLKDVY 
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LQSVKYVGGGNNNLDLITPPGFKKEDKKVEKPKLDRPPGIDLPAPTSMRS FDYSTPPGTK 
PSKPKDSLSTPPGFPDLNTPPDEATKG . . KRRY . R . IRSN . IC . VSST . LC . . PYFS . QS 
KWQNITSRI . WQISHS . KCFVS .SI. .H.S.NLS. . .SQ. RNYYHNRLFCRYKICQYHSG 
. LFEQYYF . AI S YW . NSRLPCHCI FKLCCY . RQGW . DLC . R . IARNFS YS A . R . IC . DWY 
.ITK.CQTY. .FICSSFE.G.NC. . YLEK . . TRH . SQQNLPIKIQPDKSSSRVYY. ,H. L 
KFRNHDHFQRWKDARIG . TKRC FFG YKR YGHE . V . NYSTWTKGF. I . GTTYCKNWNS . IR 
YVFQTISRPSFNY. KNIPYPKWCSK. IEKI . L. ETWFN . KSDRWILYL. RCN . P . I . INQW 
CKS . SCL . RARRSI . SSERRYD . KR . TAQSFNSSQ . KYSKSNLC . Y . LVTL . . GYCEWKR 
SW . R . . VTFN . RMDNICIT . NRKFIKC . KFDYGDG . CK . ESSTTSFKS .U.K. AYEGYA 
T YYAKRFS VLRNK . QSSPSN . SHCRY . T . F . CC . RSECSY . KYDDETVCSCWTTR . SC . . 
T.IPISISLNSCLIGNC. . GNSKW . GNHSIWYYRSHQGW . . KQAC . SQNGE . KWRHARNP 
CYYSR . RLD . SNKTINEWT . STLCR . TI . VPG . ITT . SF. HLD . G . SGNRSRRESKYCSS 
HVL . PISSRA . HSSC.T. FDF . YCSYPHRCQR. LSKTKIISR . FIT . IC . . NRSL . F. KW 
CRNH . RYDSTTRIWR . YY . VI CC . LIKLSS . , DPS YL . KPF . C . SKPNDS . QRS . SNCGY 
VDEALSCSRNGRSLYINNRRSSKHK . IRNVNKR . S IDSLCKWWC . . S . CSD . SS . LRSYS 
.S.RST.S.RST.S.RST.S.RST.S.RST.S.RST.SRRST.S.RGT.NPRSTYS.RRL 
QS . . RSSN . YYS . SV . FTKD . DSFRSSYG . NRQ . TDNFTSDTC . K 

SEQ ID NO. 5115 

STRAIN COH1 frame: 1 

LNNKGVGGDGVQIYQYYIKMDNNKPYLSPKDKTTVEKLEDRWKKITFKVQDTGIGLKDVY 
LQSVKYVGGGNNNLDLITPPGFKKEDKKVEKPKLDRPPGIDLPAPTSMRS FDYSTPPGTK 
PSKPKDSLSTPPGFPDLNTPPDEATKG . . KRRY . R . IRSN . IC . VSST . LC . . PYFS . QS 
KWQNITSRI. WQISHS. KCFVS. SI. .H.S.NLS. . . SQ . RNYYHNRLFCRYKICQYHSG 
. LFEQYYF. AISYW . NSRLPCHCI FKLCCY . RQGW . DLC . R. IARNFS YS A. R . IC . DWY 
.ITK.CQTY. .FICSSFE.G.NC. .YLEK. . TRH . SQQNLPIKIQPDKSSSRVYY. . H . L 
KFRNHDHFQRWKDARIG . TKRC F FG YKR YGHE . V . NYSTWTKGF . I . GTTYCKNWNS . IR 
YVFQTISRPS FNY . KNI PYPKWCSK . IEKI . L . FWFN . KSDRWILYL . RCN .P.I. INQW 
CKS . SCL . RARRS3} . SSERRYD . KR . TAQSFNSSQ . KYSKSNLC . Y . LVTL . . GYCEWKR 
SW . R . . VTFN . RMDNICIT . NRKFIKC . KFDYGDG . CK . ESSTTSFKS .U.K. AYEGYA 
TYYAKRFSVLRNK . QSSPSN . SHCRY . T . F . CC . RSECSY . KYDDETVCSCWTTR . SC. . 
T.IPISISLNSCLIGNC. . GNSKW. GNHSIWYYRSHQGW . . KQAC . SQNGE . KWRHARNP 
CYYSR . RLD . SNKTINEWT . STLCR . TI . VPG .TTT . S F . HLD . G . SGNRSRRESKYCSS 
HVL . PI SSRA . HS SC . T . FDF . YCSYPHRCQR . LSKTKI I SR . FIT . IC . . NRSL . F . KW 
CRNH . RYDSTTRIWR . YY . VICC . LIKLSS . . DPSYL . KPF . C . SKPNDS . QRS . SNCGY 
VDEALSCSRNGRSLYINNRRSSKHK . IRNVNKR . S IDSLCKWWC . . S . CSD . SS . LRSYS 

.S.RST.S.RST.S.RST.S.RST.S.RST.S.RST.SRRST.S.RGT.NPRSTYS.RRL 
QS . . RSSN . YYS . SV . FTKD . DSFRSSYG . NRQ . TDNFTSDTC 

SEQ ID NO. 5116 

STRAIN M781 frame: 1 

LNNKGVGGDGVQIYQYYIKMDNNKPYLSPKDKTTVEKLEDRWKKITFKVQDTGIGLKDVY 
LQSVKYVGGGNNNLDLITPPGFKKEDKKVEKPKLDRPPGIDLPAPTSMRSFDYSTPPGTK 
PSKPKDSLSTPPGFPDLNTPPDEATKG . . KRRY . R . IRSN . IC . VSST . LC . . PYFS QS 
KWQNITSRI . WQISHS . KCFVS . SI . . H . S . NLS . . . SQ . RNYYHNRLFCRYKICQYHSG 
. LFEQYYF . AI SYW . NSRLPCHCI FKLCCY . RQGW . DLC . R . IARNFS YSA . R . IC . DWY 
.ITK.CQTY. .FICSSFE.G.NC. .YLEK. . TRH . SQQNLPIKIQPDKSSSRVYY . .H.L 
KFRNHDHFQRWKDARIG . TKRC FFG YKRYGHE . V . NYSTWTKGF . I . GTTYCKNWNS IR 
YVFQTISRPSFNY . KNIPYPKWCSK . IEKI . L . FWFN . KSDRWILYL. RCN .P.I. INQW 
CKS . SCL . RARRSI . SSERRYD . KR . TAQSFNSSQ . KYSKSNLC . Y . LVTL . . GYCEWKR 
SW . R . . VTFN . RMDNICIT . NRKFIKC . KFDYGDG . CK. ESSTTSFKS .U.K. AYEGYA 
TYYAKRFSVLRNK. QSSPSN. SHCRY. T. F.CC. RSECSY. KYDDETVCSCWTTR SC 
T.IPISISLNSCLIGNC. . GNSKW . GNHSIWYYRSHQGW . . KQAC . SQNGE . KWRHARNP 
CYYSR . RLD . SNKTINEWT . STLCR . TI . VPG . ITT . SF . HLD . G . SGNRSRRESKYCSS 
HVL . PISSRA. HSSC . T . FDF. YCSYPHRCQR . LSKTKIISR . FIT . IC . . NRSL . F KW 
CRNH . RYDSTTRIWR . YY . VICC .LIKLSS.. DPSYL . KPF . C . SKPNDS . QRS . SNCGY 
VDEALSCSRNGRSLYINNRRSSKHK . IRNVNKR . SIDSLCKWWC . . S . CSD . SS . LRSYS 

. S . RST . S . RST . S . RST . S . RST . S . RST . S . RST . SRRSTVKLKRDIKPKKHL . LKKA 
TKLITFIKLILQLKRLIYQRLRQFPQFIWLEQTINR . LHIRHML 

SEQ ID NO. 5117 

STRAIN JM9130013 frame: 2 

GVQIYQYYIKMDNNKPYLSPKDKTTVEKLEDRWKKITFKVQDTGIGLKDVYLQSVKYVGG 
GNNNLDLITPPGFKKEDKKVEKPKLDRPPGIDLPAPTSMRSFDYkTPPGTKPSKPKDSLS 
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TPPGFPDLNTPPDEAPKDSKKDAIEDKSGAIKYAKSLQLSFVDDPILASKVNGKILQVES 
DGKLVIPRNALSANQFDDTSLKIYRNNNRNKEITITTDYFADTKYVNITAVDYLSNTTFE 
QLATGETVDYHAIVFSSFAAIKDKGGKIYVNDKLQETSRIALKDKSVKIGIELPNDVRHI 
DSLSVRRLNEVKTVDNILKNDEQDINLSKTYQLKYNPTNRRLEFTINNINSSSEIMTTFK 
DGKMPELVEQKDVSLDINDMDMSKFKTIRLGRKDSEFKGQLIAKTGTVELDMFFKQSQDP 
ASIIKKIYLIQNGVPNELKKFDSSFGLTESQIDGYYIYKDAINLKFKLTSGASLKWYKG 
QEDPYSHQKEDMTKXGEQLSHSTQANENTAKVTFT^IDWSHYSKVTVNGKEVGKGSELPL 
TKGWTTFVLHKTENSLNVKSLIMETGSVSKKVQQLPLSPRLSKNICHMRDMLLTMQKDSAY 
YETSDSLVLRINLTADTKLNFNAVKGASALTENMMMRQFAVAGPQDDPVSEHKYPSVFLL 
TPALI*ETASEATLNGKEITASGIIGHIKDGDKSKHVEVKMVNENGDMLGTPVIIQGKDLT 
NRTKPLMSGRRVLYAGKQYEFRAKLPLSRFNTWIRVEWTEAGEKASIVRRMFFDQSVPE 
LNTAVAKRDLTSDTALIHIVAKDDSLKLKLYQDDSLLESVDKTGLYSFRNGVEITKDMTV 
PLEFGDNIIKLSAVDLSNYRRNETLHIYRNRFDVKASQMTADKGAKVTVDMLMKHLVVPE 
MAGAYTLTIDEAPNTNESGMLTNAKVSIHYVNGGVDBCVDVPIKWDLEAIRKAEEAHKAD 
EARKAEEARKAEEAHKAEEVRKAEEAHKVEEAP . S . RGT . NPRSTYS . RRLQG . . RSSN . 
YYS . SV . FTKD . DSFRSSYG . NRQ. TDNFTSDTC 

SEQ ZD NO. 5201 
STRAIN 090 

AGCGATACCTTTAATTTTGATATTGACCAAATTGCAGA 

CAATGCTATCACTAAAACAGATAAAACAACAGAAATTATTTCCAACCAGA 

CAACAAGCCAAACTGGGCAAATTGCCTTTTTTGAAAAACTAACACCAGCA 

CAAAAGTCTGCTATCTCTGAAAAAACACCAGCTTTGGTAGATACTTTTGT 

CGGCGATCAAAATGCGCTCCTTGATTTTGGACAATCCGCAGTAGAAGGCG 

TTAATACCACTGTTAATCATATCTTGTCTGAGCAGAAAAAAATTCAAATT 

CCTCAAGTTGATGATTTACTAAAAAATGCTAATCGCGAACTAAATGGATT 

TATTGCCAAATATAAAGATGCTACTCCGGCAGAATTAgAGAAAAAACCAA 

ACTTGATTCAAAAATTATTCAAACAAAGCAAGACCTCGCTACAGGAATTT 

TATTTTGACTCACAAAACATCGAGCAAAAAATGGATATGATGGCaGCGAA 

TGTTGTCAAACAAGAAGATACTTTGGCAAGAAATATCGtCTCTGCTGAAA 

TGCTCATTGAAGATAATACTAAATCTATTGAAAATTTGGTTGGAGTTATT 

GCTttTATTGAATCgAGTCAAGCCGAGGCTGCTAATCGtGCAaGCCACTT 

ACAACAAGAAATTCTAGCATTAGATAGCC aAACGT cCGAGTATCAAAT t A 

AAAGTaACCAATTAGCTCGAATGACTGAAGTTATCAATACCCTCGAACAG 

CAACATACTGAATATGTCAGCCGTCTCTACGTTGCATGGGCAACAACACC 

ACAGATGCGAAACTTGGTCAAAGTATCGTCAGATATGCGTCAGAAACTTG 

GCATGTTACGTCGAAATACCATTCCAACAATGAAACTCTCAATCGCTCAG 

TTAGGCATGATGCAACAATCTGTCAAATCCGGTGTCACTGCTGATGCTAT 

TGTCAACGCTAATAATGCAGCATTGCAGATGCTGGCTGAAACTAGTAAAG 

AAGCGATTCCGATGTTAGAGAAGACCGCACAAAGCCCCACTGTTTCTATT 

AAATCTGTCACTGCATTAGCTGAAAGCTTAGTGGCTCAAAATAATGGTAT 

TATCGCTGCCATAGACAAAGGACGTAAGGAACGTGCCCaATTGGAATCTG 

CTGTTATTAAATCGGCTGAAACAATCAATGATTCTGTCAAAATTCGTGAT 

AAAAAAATAGTTGAAGCCTTACTCAACGAAGGTaAATCTACCCAAGAAAA 

AGTTGATGAGTCT 

SEQ XD NO. 5202 
STRAIN A909 

AGCGATACCTTTAATTTTGATATTGACCAAATTGCAGA 

CAATGCTATCACTAAAACAGATAAAACAACAGAAATTATTTCCAACCAGA 

CAACAAGCCAAACTGGGCAAATTGCCTTTTTTGAAAAACTAACACCAGCA 

CAAAAGTCTGCTATCTCTGAAAAAACACCAGCTTTGGTAGATACTTTTGT 

CGGTGACCAAAATGCGCTCCTTGATTTTGGACAATCCGCAGTAGAAGGCG 

TTAATACCACTGTTAATCATATCTTGTCTGAGCAGAAAAAAATTCAAATT 

CCTCAAGTTGATGATTTACTAAAAAATGCTAATCGCGAACTAAATGGATT 

TATTGCCAAATATAAAGATGCTACTCCGGCAGAATTAGAGAAAAAACCAA 

ACTTGATTCAAAAATTATTCAAACAAAGCAAGACCTCGCTACAGGAATTT 

TATTTTGACTCACAAAACATCGAGCAAAAAATGGATATGATGGCAGCGAA 

TGTTGTCAAACAAGAAGATACTTTGGCAAGAAATATCGTCTCTGCTGAAA 

TGCTCATTGAAGATAATACTAAATCTATTGAAAATTTGGTTGGAGTTAwT 

GCTTTTATTGAATCGAGTCAAGCCGAGGCTGCCAATCGTGCAAGCCACTT 

ACAACAAGAAATTCTAGCATTAGATAGCCAAACGTCCGAGTATCAAATTA 

AAAGTAACCAATTAGCTCGAATGACTGAAGTTATCAATACCCTCGAACAG 

CAACATACTGAATATGTCAGCCGTCTCTACGTTGCATGGGCAACAACACC 
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ACAGATGCGAAACTTGGTCAAAGTATCGTCAGATATGCGTCAAAAACTTG 
GCATGTTACGTCGAAATACCATTCCAACaATGAAACTCTCAATCGCTCAG 
TTAGGCATGATGCAACAATCTGTCAAATCCGGTGTCACTGCTGATGCTAT 
TGTCAACGCTAATAATGCAGCATTGCAGATGCTGGCTGAAACTAGTAAAG 
AAGCGATTCCGATGTTAGAGAAGACCGCACAAAGCCCCACTGTTTCTATT 
AAATCTGTCACTGCATTAGCTGAAAGCTTAGTGGCTCAAAATAATGGTAT 
TATCGCTGCCATAGACAAAGGACGTAAAGAACGTGCCCAATTAGAATCTG 
CTGTTATTAAATCGGCTGAAACAATCAATGATTCTGTCAAAATTCGTGAT 
AAAAAAATAGTTGAAGCCTTACTCAACGAAGGTaAATCTACCCAAGAAAA 
AGtTGATGAGTCT 

SEQ ID NO. 5203 
STRAIN H36B 

AGCGaTACCTTTAATTTTGATATTGACCAAATTGCAGAC 

AATGCTATCACTAAAACAGATAAAACAACAGAAATTATTTCCAACCAGAC 

AACAAGCCAAACTGGGCAAATTGCCTTTTTTGAAAAACTAACACCAGCAC 

AAAAGTCTGCTATCTCTGAAAAAACACCAGCTTTGGTAGATACTTTTGTC 

GGTGACCAAAATGCGCTCCTTGATTTTGGACAATCCGCAGTAGAAGGCGT 

TAATACCACTGTTAATCATATCTTGTCTGAGCAGAAAAAAATTCAAATTC 

CTCAAGTTGATGATTTACTAAAAAATGCTAATCGCGAACTAAATGGATTT 

ATTGCCAAATATAAAGATGCTACTCCGGCAGAATTAGAGAAAAAACCAAA 

CTTGATTCAAAAATTATTCT^AACAAAGCAAGACCTCGCTACAGGAATTTT 

ATTTTGACTCACAAAACATCGAGCAAAAAATGGATATGATGGCAGCGAAT 

GTTGTCAAACAAGAAGATACTTTGGCAAGAAATATCGTcTCTGCTGAAAT 

GCTCATTGAAGATAATACTAAATCTATTGAAAATTTGGTTGGAGTTATTG 

CTttTATTGAATCGAGTCAAGCCGAgGCTGCCAATCGTGCAAGCCACTTA 

CAACAAGAAATTCTAGCATTAGATAGCCAAACGTcCGAGTATCAAATTAA 

AAGTAACCAATTAGCTCGAATGACTGAAGTTATCAATACCCTCGAACAGC 

AACATACTGAATATGTCAGCCGTCTCTACGTTGCATGGGCAACAACACCA 

CAGATGCGAAACTTGGTCAAAGTATCGTCAGATATGCGTCAAAAACTTGG 

CATGTTACGTCGAAATACCATTCCAACaATGAAACTCTCAATCGCTCAGT 

TAGGCATGATGCAACAATCTGTCAAATCCGGTGTCACTGCTGATGCTATT 

GTCAACGCTAATAATGCAGCATTGCAGATGCTGGCTGAAACTAGTAAAGA 

AGCGATTCCGATGTTAGAGAAGACCGCACAAAGCCCCACTGTTTCTATTA 

AATCTGTCACTGCATTATCTGAAAGCTTAGTGGCTCAAAATAATGGTATT 

ATCGCTGCCATAGACAAAGGACGTAAAGAACGTGCCCAATTAGAATCTGC 

TGTTATTAAATCGGCTGAAACAATCAATGATTCTGTCAAAAT TCGTGAT a 

AAAAAATAGTTGAAGCCTTACTCAaCGAAGGTaAATCTACCCAAGAAAAA 

GTTGATGAGTCT 

SEQ ID NO. 5204 
STRAIN 18RS21 

TTTTGATATTGACCAAATTGCAGACAATGCTATCACTAAAACAGATAAAA 
CAAC^GAAATTATTTCCAACCAGACAACAAGCCAAACTGGGCAAATTGCC 
TTTTTTGAAAAACTAACACCAGCACAAAAGTCTGCTATCTCTGAAAAAAC 
ACCAGCTTTGGTAGATACTTTTGTCGGCGATCAAAATGCGCTCCTTGATT 
TTGGACAATCCGCAGTAGAAGGCGTTAATACCACTGTTAATCATATCTTG 
TCTGAGCAGAAAAAAATTCAAATTCCTCAAGTTGATGATTTACTAAAAAA 
TGCTAATCGCGAACTAAATGGATTTATTGCCAAATATAAAGATGCTACTC 
CGGCAGAATTAGAGAAAAAACCAAACTTGATTCAAAAATTATTCAAACAA 
AGCAAGACCTCGCTACAGGAATTTTATTTTGACTCACAAAACATCGAGCA 
AAAAATGGATATGATGGCAGCGAATGTTGTCAAACAAGAAGATACTTTGG 
CAAGAAATATCGTCTCTGCTGAAATGCTCATTGAAGATAATACTAAATCT 
ATTGAAAATTTGGTTGGAGTTATTGCTTTTATTGAATCGAGTCAAGCCGA 
GGCTGCTAATCGTGCAAGCCACTTACAACAAGAAATTCTAGCATTAGATA 
GCCAAACGTCCGAGTATCAAATTAAAAGTAACCAATTAGCTCGAATGACT 
GAAGTTATCAATACCCTCGAACAGCAACATCCTGAATATGTCAGCCGTCT 
CTACGTTGCATGGGCAACAACACCACAGATGCGAAACTTGGTCAAAGTAT 
CGTCAGATATGCGTCAGAAACTTGGCATGTTACGTCGAAATACCATTCCA 
ACAATGAAACTCTCAATCGCTCAGTTAGGCATGATGCAACAATCTGTC7\A 
ATCCGGTGTCACTGCTGATGCTATTGTCAACGCTAATAATGCAGCATTGC 
AGATGCTGGCTGAAACTAGTAAAGAAGCGATTCCGATGTTAGAGAAGACC 
GCACAAAGCCCCACTGTTTCTATTAAATCTGTCACTGCATTAGCTGAAAG 
CTTAGTGGCTCAAAATAATGGTATTATCGCTGCCATAGACAAAGGACGTA 



212 



WO 2004/018646 



PCT7US2003/026827 



SEQUENCE LISTING 



AGGAACGTGCCCaATTGGAATCTGCTGTTATTAAATCGGCTGAAACAATC 
AATGATTCTGTCAAAATTCGTGATAAAAAAATAGTTGAAGCCTTACTCAA 
CGAAGGT aAATCT ACCCAAGAAAAAGTTGATGAGTCT 

SEQ ID NO. 5205 
STRAIN M732 

AGCGATACCTTTAATTTTGATATTGACCAAATTGCAGAC 

AATGCTATCACTAAAACAGATAAAACAACAGAAATTATTTCCAACCAGAC 

AACAAGCCAAACTGGGCAAATTGCCTTTTTTGAAAAACTAACACCAGCAC 

AAAAGTCTGCTATCTCTGAAAAAACACCAGCTTTGGTAGATACTTTTGTC 

GGTGACCAAAATGCGCTCCTTGATTTTGGACAATCCGCAGTAGAAGGCGT 

TAATACTACTGTTAATCATATCTTGTCTGAGCAGAAAAAAATTCAAATTC 

CTCAAGTTGATGATTTACTAAAAAATGCTAATCGCGAACTAAATGGATTT 

ATTGCCAAATATAAAGATGCTACTCCGGCAGAATTAGAGAAAAAACCAAA 

CTTGATTCAAAAATTATTCAAACAAAGCAAGACCTCGCTACAGGAATTTT 

ATTTTGACTCACAAAACATCGAGCAAAAAATGGATATGATGGCAGCAAAT 

GTTGTCAAACAAGAAGATACTTTGGCAAGAAATATCGTCTCTGCTGAAAT 

GCTCATTGAAGATAATACTAAATCTATTGAAAATTTGGTTGGAGTTATTG 

CTTT TATTGAATCGAGT CAAGCCGAGGCTGCCAATCGTGCAAGCCACTT A 

CAACAAGAAATTCTAGCATTAGATAGCCAAACGTCCGAATATCAAATTAA 

AAGTAACCAATTAGCCCGAATGACTGAAGTTATCAATACCCTCGAACAGC 

AACATACGGAATATGTCAGCCGTCTCTACGTTGCATGGGCAACAACACCA 

CAGATGCGAAACTTGGTCAAAGTATCGTCAGATATGCGTCAGAAACTTGG 

TATGTTACGTCGAAATACCATTCCAACAATGAAACTCTCAATCGCTCAGT 

TAGGCATGATGCAACAATCTGTCAAATCCGGTGTCACTGCTGATGCTATT 

GTCAACGCTAATAATGCAGCATTGCAAATGCTGGCTGAAACTAGTAAAGA 

AGCGATTCCGATGTTAGAGAAGACCGCACAAAGCCCCACTGTTTCTATTA 

AATCTGTCACTGCATTAGCTGAAAGCTTAGTGGCTCAAAATAATGGTATT 

ATCGCTGCCATAGACAAAGGACGTAAGGAACGTGCCCAATTAGAATCTGC 

TGTTATTAAATCGGCTGAAACAATCAATGATTCTGTCAAAATTCGTGATA 

AAAAAATAGTTGAAGCCTTACTCAACGAAGGTAAATCTACCCAAGAAAAA 

G 

SEQ ID NO. 5206 
STRAIN COH1 

CTAAAACAGATAAAACAACAGAAATTATTTCCAACCAGACAACAAGCCAA 
ACTGGGCAAATTGCCTTTTTTGAAAAACTAACACCAGCACAAAAGTCTGC 
TwTCTCTGAAAAAACACCAGCTTTGGTAGATACTTTTGTCGGTGACCAAA 
ATGCGCTCCTTGATTTTGGACAATCCGCAGTAGAAGGCGTTAATACTACT 
GTTAATCATATCTTGTCTGAGCAGAAAAAAATTCAAATTCCTCAAGTTGA 
TGATTTACTAAAAAATGCTAATCGCGAACTAAATGGATTTATTGCCAAAT 
ATAAAGATGCTACTCCGGCaGAATTAGAGAAAAAACCAAACTTGATTCAA 
AAATTATTCAAACAAAGCAAGACCTCGCTACAGGAATTTTATTTTGACTC 
ACAAAACATCGAGCAAAAAATGGATATGATGGCAGCAAATGTTGTCAAAC 
AAGAAGATACTTTGGCAAGAAATATCGTCTCTGCTGAAATGCTCATTGAA 
GATAATACTAAATCTATTGAAAATTTGGTTGGAGTTATTGCTTTTATTGA 
ATCGAGTCAAGCCGAgGCTGCCAATCGTGCaAGCCACTTACAACAaGAAA 
TTCTAGCaTTAGATAGCCAAACGTCCGAATATCAAATTAAAAGTAACCAA 
TTAGCCCGAATGACTGAaGTTATCAaTaCCCTCGAACAGCAACATACGGA 
aTATGTCAGCCGTCTCTACGTTGCATGGGCAACAACACCACAGATGCGAA 
ACTTGGTCAAAGTATCGTCAGATATGCGTCAGAAACTTGGTATGTTACGT 
CGAAATACCATTCCAACAATGAAACTCTCAATCGCTCAGTTAGGCATGAT 
GCAACAATCTGTCAAATCCGGTGTCACTGCTGATGCTATTGTCAACGCTA 
ATAATGCAGCATTGCAAATGCTGGCTGAAACTAGTAAAGAAGCGATTCCG 
ATGTTAGAGAAGACCGCACAAAGCCCCACTGTTTCTATTAAATCTGTCAC 
TGCATTAGCTGAAAGCTTAGTGGCTCAAAATAATGGTATTATCGCTGCCA 
TAGACAAAGGACGTAAGGAACGTGCCCAATTAGAATCTGCTGTTATTAAA 
TCGGCTGAAACAATCAATGATTCTGTCAAAATTCGTGATAAAAAAATAGT 
TGAAGCCTTACTCAaCGAAGGTAAATCTACCCAAGAAAAAGTTGATGAGT 
CT 

SEQ XD NO. 5207 
STRAIN M781 

TTTTGATATTGACCAAATTGCAGACAATGCTATCACTAAAACAGATAAAA 
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CAACAGAAATTATTTCCAACCAGACAACAAGCCAAACTGGGCAAATTGCC 
TTTTTTGAAAAACTAACACCAGCACAAAAGTCTGCTATCTCTGAAAAAAC 
ACCAGCTTTGGTAGATACTTTTGTCGGTGACCAAAATGCGCTCCTTGATT 
TTGGACAATCCGCAGTAGAAGGCGTTAATACTACTGtTAATCATATCTTG 
TCTGAGCAGAAAAAAATTCAAATTCCTCAAGTTGATGATTTACTAAAAAA 
TGCTAATCGCGAACTAAATGGATTTATTGCCAAATATAAAGATGCTACTC 
CGGCAGAATTAGAGAAAAAACCAAACTTGATTCAAAAATTATTCAAACAA 
AGCAAGACCTCGCTACAGGAATTTTATTTTGACTCACAAAACATCGAGCA 
AAAAATGGATATGATGGCAGCAAATGTTGTCAAACAAGAAGATACTTTGG 
CAAGAAATATCGTCTCTGCTGAAATGCTCATTGAAGATAATACTAAATCT 
ATTGAAAATTTGGTTGGAGTTATTGCTTTTATTGAATCGAGTCAAGCCGA 
GGCTGCCAATCGTGCAAGCCACTTACAACAAGAAATTCTAGCATTAGATA 
GCCAAACGTCCGAATATCAAATTAAAAGTAACCAATTAGCCCGAATGACT 
GAAGTTAT C AATACCCT CGAACAGCAACATACGGAATATGTCAGCCGTCT 
CTACGTTGCATGGGCAACAACACCACAGATGCGAAACTTGGTCAAAGTAT 
CGTCAGATATGCGTCAGAAACTTGGTATGTTACGTCGAAATACCATTCCA 
ACAATGAAACTCTCAATCGCTCAGTTAGGCATGATGCAACAATCTGTCAA 
ATCCGGTGTCACTGCTGATGCTATTGTCAACGCTAATAATGCAGCATTGC 
AAATGCTGGCTGAAACTAGTAAAGAAGCGATTCCGATGTTAGAGAAGACC 
GGACAAAGCCCCACTGTTTCTATTAAATCTGTCACTGCATTAGCTGAAAG 
CTTAGTGGCTCAAAATAATGGTATTATCGCTGCCATAGACAAAGGACGTA 
AGGAACGTGCCCAATTAGAATCTGCTGTTATTAAATCGGCTGAAACAATC 
AATGATTCTGTCAAAATTCGTGATAAAAAAATAGTTGAAGCCTTACTCAA 
CGAAGGTAAATCTACCCAAGAAAAAGTTGATGAGTCT 

SEQ ZD NO. 5208 
STRAIN CJB110 

TTTTGATATTGACCAAATTGCAGACAATGCTATCACTAAAACAGATAAAA 
CAACAGAAATTATTTCCAACCAGACAACAAGCCAAACTGGGCAAATTGCC 
TTTTTTGAAAAACTAACACCAGCACAAAAGTCTGCTATCTCTGAAAAAAC 
ACCAGCTTTGGTAGATACTTTTGTCGGCGATCAAAATGCGCTCCTTGATT 
TTGGACAATCCGCAGTAGAAGGCGTTAATACCACTGTTAATCATATCTTG 
TCTGAGCAGAAAAAAATTCAAATTCCTCAAGTTGATGATTTACTAAAAAA 
TGCTAATCGCGAACTAAATGGATTTATTGCCAAATATAAAGATGCTACTC 
CGGCAGAATTAGAGAAAAAACCAAACTTGATTCAAAAATTATTCAAACAA 
AGCAAGACCTCGCTACAGGAATTTTATTTTGACTCACAAAACATCGAGCA 
AAAAATGGATATGATGGCAGCGAATGTTGTCAAACAAGAAGATACTTTGG 
CAAGAAATATCGTCTCTGCTGAAATGCTCATTGAAGATAATACTAAATCT 
ATTGAAAATTTGGTTGGAGTTATTGCTTTTATTGAATCGAGTCAAGCCGA 
GGCTGCTAATCGTGCAAGCCACTTACAACAAGAAATTCTAGCATTAGATA 
GCCAAACGTCCGAGTATCAAATTAAAAGTAACCAATTAGCTCGAATGACT 
GAAGTTATCAATACCCTCGAACAGCAaCATACTGAATATGTCAGCCGTCT 
CTACGTTGCATGGGCaACaACACCACAGATGCGAAACTTGGTCAAAGTAT 
CGTCAGATATGCGTCAGAAACTTGGCATGTTACGTCGAAATACCATTCCA 
ACAATGAAACTCTCAAT CGCTCAGTTAGGCATGATGCAACAAT CTGTCAA 
ATCCGGTGTCACTGCTGATGCTATTGTCAACGCTAATAATGCAGCATTGC 
AGATGCTGGCTgAAACTAGTAAAGAAGCGATTCCGATGTTAGAGAAGACC 
GCACAAAGCCCCACTGTTTCTATTAAATCTGTCACTGCATTAGCTGAAAG 
CTTAGTGGCTCAAAATAATGGTATTATCGCTGCCATAGACAAAGGACGTA 
AGGAaCGTGCCCAATTGGAATCTGCTGTTATTAAATCGGCTGAAACAATC 
AATGATTCTGTCAAAATTCGTGATaAAAAAATAGTTGAAGCCTTACTCAA 
CGAAGGTAAATCTACCCAAGAAAAAGTTGATGAGTCT 

SEQ ID NO. 5209 
STRAIN 1169NT 

GCAGACAATGCTATCACTAAAACAGATAAAACAACAGAAATTATTTCCAA 
CCAGACAACAAGCCAAACTGGGCAAATTGCCTTTTTTGAAAAACTAACAC 
CAGCACAAAAGTCTGCTATCTCTGAAAAAACACCAGCTTTGGTAGATACT 
TTTGTCGGTGACCAAAATGCGCTCCTTGATTTTGGACAATCCGCAGTAGA 
AGGCGTTAATACCACTGTTAATCATATCTTGTCTGAGCAGAAAAAAATTC 
AAATTCCTCAAGTTGATGATTTACTAAAAAATGCTAATCGCGAACTAAAT 
GGATTTATTGCCAAATATAAAGATGCTACTCCGGCAGAATTAGAGAAAAA 
ACCAAACTTGATCCAAAAATTATTCAAACAAAGCAAGACCTCACTACAGG 
AATTTTATTTTGACTCACAAAACATCGAGCAAAAAATGGATATGATGGCA 
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GCAAATGTTGTCAAACAAGAAGATACTTTGGCAAGAAATATCGTCTCTGC 

TGAAATGCTCATTGAAGATAATACTAAATCTATTGAAAATTTGGTTGGAG 

TTATTGCTTTTATTGAATCGAGTCAAGCCGAGGCTGCCAATCGTGCAAGC 

CACTTACAACAAGAAATTCTAGCATTAGATAGCCAAACGTCCGAGTATCA 

AATTAAAAGTAACCAATTAGCTCGAATGACTGAAGTTATCAATACCCTCG 

AaCAGCAACATACTGAATATGTCAGCCGTCTCTACGTTGCATGGGCAACA 

aCACCACAGATGCGAAACTTGGTCAAAGTATCGTCAGATATGCGTCAAAA 

ACTTGGCATGTTACGTCGAAATACCATTCCAACAATGAAACTCTCAATCG 

CTCAGTTAGGCATGATGCAACAATCTGTCAAATCCGGTGTCACTGCTGAT 

GCTATTGTCAACGCTAATAATGCAGCATTGCAGATGCTGGCTGAAACTAG 

TAAAGAAGCGATTCCGATGTTAGAGAAGACCGCACAAAGCCCCACTGTTT 

CTATTAAATCTGTCACTGCATTAGCTGAAAGCTTAGTGGCTCAAAATAAT 

GGTATTATCGCTGCCATAGACAAAGGACGTAAGGAACGTGCCCAATTAGA 

ATCTGCTGTTATTAAATCGGCTGAAACAATCAATGATTCTGTCAAAATTC 

GTGATAAAAAAATAGTTGAAGCCTTACTCAACGAAGGTaAATCTACCCAA 
GAAAAAGTTGATGAGTCT 

SEQ ID NO. 5210 
STRAIN JM9130013 

AGCGATACCTTTAATTTTGATATTGACCAAATTGCAGAC 

AATGCTATCACTAAAACAGATAAAACAACAGAAATTATTTCCAACCAGAC 

AACAAGCCAAACTGGGCAAATTGCCTTTTTTGAAAAACTAACACCAGCAC 

AAAAGTCTGCTATCTCTGAAAAAACACCAGCTTTGGTAGATACTTTTGTC 

GGTGACCAAAATGCGCTCCTTGATTTTGGACAATCCGCAGTAGAAGGCGT 

TAATACCACTGTTAATCATATCTTGTCTGAGCAGAAAAAAATTCAAATTC 

CTCAAGTTGATGATTTACTAAAAAATGCTAATCGCGAACTAAATGGATTT 

ATTGCCAAATATAAAGATGCTACTCCGGCAGAATTAGAGAAAAAACCAAA 

CTTGATTCAAAAATTATTCAAACAAAGCAAGACCTCGCTACAGGAATTTT 

ATTTTGACTCACAAAACATCGAGCAAAAAATGGATATGATGGCAGCGAAT 

GTTGTCAAACAAGAAGATACTTTGGCAAGAAATATCGTCTCTGCTGAAAT 

GCTCATTGAAGATAATACTAAATCTATTGAAAATTTGGTTGGAGTTATTG 

CTTTTATTGAATCGAGTCAAGCCGAGGCTGCCAATCGTGCAAGCCACTTA 

CAACAAGAAATTCTAGCATTAGATAGCCAAACGTCCGAGTATCAAATtAA 

AAGTaACCAATTAGCTCGAATGACTGAAGTTATCAATACCCTCGAACAGC 

AACATACTGAATATGTCAGCCGTCTCTACGTTGCATGGGCAAC7\ACACCA 

CAGATGCGAAACTTGGTCAAAGTATCGTCAGATATGCGTCAAAAACTTGG 

CATGTTACGTCGAAATACCATTCCAACAATGAAACTCTCAATCGCTCAGT 

TAGGCATGATGCAACAATCTGTCAAATCCGGTGTCACTGCTGATGCTATT 

GTCAACGCTAATAATGCAGCATTGCAGATGCTGGCTGAAACTAGTAAAGA 

AGCGATTCCGATGTTAGAGAAGACCGCACAAAGCCCCACTGTTTCTATTA 

AATCTGTCACTGCATTAGCTGAAAGCTTAGTGGCTCAAAATAATGGTATT 

ATCGCTGCCATAGACAAAGGaCGTAAGGAACGTGCCCAATTAGAATCTGC 

TGTTATTAAATCGGCTGAAACAATCAATGATTCTGTCAAAATTCGTGATA 

AAAAAATAGTTGAAGCCTTACTCAACGAAGGTaAATCTACCCAAGAAAAA 
GTTGATGAGTCT 

SEQ ID NO. 5211 
STRAIN 2603 

agcgatacctttaattttgatattgaccaaattgcagacaatgctatcac 
taaaacagataaaacaacagaaattatttccaaccagacaacaagccaaa 
ctgggcaaattgccttttttgaaaaactaacaccagcacaaaagtctgct 
atctctgaaaaaacaccagctttggtagatacttttgtcggcgatcaaaa 
tgcgctccttgattttggacaatccgcagtagaaggcgttaataccactg 
ttaatcatatcttgtctgagcagaaaaaaattcaaattcctcaagttgat 
gatttactaaaaaatgctaatcgcgaactaaatggatttattgccaaata 
taaagatgctactccggcagaattagagaaaaaaccaaacttgattcaaa 
aattattcaaacaaagcaagacctcgctacaggaattttattttgactca 
caaaacatcgagcaaaaaatggatatgatggcagcgaatgttgtcaaaca 
agaagatactttggcaagaaatatcgtctctgctgaaatgctcattgaag 
ataatactaaatctattgaaaatttggttggagttattgcttttattgaa 
tcgagtcaagccgaggctgctaatcgtgcaagccacttacaacaagaaat 
tctagcattagatagccaaacgtccgagtatcaaattaaaagtaaccaat 
tagctcgaatgactgaagttatcaataccctcgaacagcaacatcctgaa 
tatgtcagccgtctctacgttgcatgggcaacaacaccacagatgcgaaa 
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cttggtcaaagtatcgtcagatatgcgtcagaaacttggcatgttacgtc 
gaaataccattccaacaatgaaactctcaatcgctcagttaggcatgatg 
caacaatctgtcaaatccggtgtcactgctgatgctattgtcaacgctaa 
taatgcagcattgcagatgctggctgaaactagtaaagaagcgattccga 
tgttagagaagaccgcacaaagccccactgtttctattaaatctgtcact 
gcattagctgaaagcttagtggctcaaaataatggtattatcgctgccat 
agacaaaggacgtaaggaacgtgcccaattggaatctgctgttattaaat 
cggctgaaacaatcaatgattctgtcaaaattcgtgataaaaaaatagtt 
gaagccttactcaacgaaggtaaatctacccaagaaaaagttgatgagtc 
t 

SEQ ID NO. 5212 

STRAIN _090 frame: 1 

SDTFNFDIDQIADNAITKTDKTTEIISNQTTSQTGQIAFFEKLTPAQKSAISEKTPALVD 
TFVGDQNALLDFGQSAVEGVNTTVNHILSEQKKIQIPQVDDLLKNANRELNGFIAKYKDA 
TPAELEKKPNLIQKLFKQSKTSLQEFYFDSQNIEQKMDMMAANWKQEDTLARNIVSAEM 
LIEDNTKSIENLVGVIAFIESSQAEAANRASHLQQEILALDSQTSEYQIKSNQLARMTEV 
INTLEQQHTEYVSRLYVAWATT PQMRNLVKVS S DMRQKLGMLRRNT I PTMKLS IAQLGMM 
QQS VKS GVTADAIVNANNAALQMLAETS KEAI PMLEKTAQS PT VS IKS VTALAE SLVAQN 
NGIIAAIDKGRKERAQLESAVIKSAETINDSVKIRDKKIVEALLNEGKSTQEKVDES 

SEQ XD NO. 52013 

STRAIN A909 frame: 1 

SDTFNFDIDQIADNAITKTDKTTEIISNQTTSQTGQIAFFEKLTPAQKSAISEKTPALVD 
TFVGDQNALLDFGQSAVEGVNTTVNHILSEQKKIQIPQVDDLLKNANRELNGFIAKYKDA 
TPAELEKKPNLIQKLFKQSKTSLQEFYFDSQNIEQKMDMMAANVVKQEDTLARNIVSAEM 
LIEDNTKSIENLVGVXAFIESSQAEAANRASHLQQEILALDSQTSEYQIKSNQLARMTEV 
INTLEQQHTE YVSRLYVAWATT PQMRNLVKVS S DMRQKLGMLRRNTI PTMKLS IAQLGMM 
QQS VKSGVT AD AI VNANN AALQMLAET SKE AI PMLEKTAQ S PT VS IKS VT ALAE S L VAQN 
NGIIAAIDKGRKERAQLESAVIKSAETINDSVKIRDKKIVEALLNEGKSTQEKVDES 

SEQ XD NO. 5214 

STRAIN H36B frame: 1 

SDTFNFDIDQIADNAITKTDKTTEIISNQTTSQTGQIAFFEKLTPAQKSAISEKTPALVD 
TFVGDQNALLDFGQSAVEGVNTTVNHILSEQKKIQIPQVDDLLKNANRELNGFIAKYKDA 
TPAELEKKPNLIQKLFKQSKTSLQEFYFDSQNIEQKMDMMAANVVKQEDTLARNIVSAEM 
LIEDNTKSIENLVGVIAFIESSQAEAANRASHLQQEILALDSQTSEYQIKSNQLARMTEV 
INTLEQQHTEYVSRLYVAWATTPQMRNLVKVSS DMRQKLGMLRRNT I PTMKLS IAQLGMM 
QQS VKSGVT ADAIVNANNAALQMLAETSKEAI PMLEKTAQS PTVSIKSVTALSESLVAQN 
NGIIAAIDKGRKERAQLESAVIKSAETINDSVKIRDKKIVEALLNEGKSTQEKVDES 

SEQ ID NO. 5215 

STRAIN 18RS21 frame: 2 

FDIDQIADNAITKTDKTTEIISNQTTSQTGQIAFFEKLTPAQKSAISEKTPALVDTFVGD 
QNALLDFGQSAVEGVNTTVNHILSEQKKIQIPQVDDLLKNANRELNGFIAKYKDATPAEL 
EKKPNLIQKLFKQSKTSLQEFYFDSQNIEQKMDMMAANWKQEDTLARNIVSAEMLIEDN 
TKSIENLVGVIAFIESSQAEAANRASHLQQEILALDSQTSEYQIKSNQLARMTEVINTLE 
QQH PE YVSRLYVAWATT PQMRNLVKVS S DMRQKLGMLRRNT I PTMKLS I AQLGMMQQS VK 
SGVTADAIVNANNAALQMLAETSKEAI PMLEKTAQS PTVSIKSVTALAESLVAQNNGI I A 
AIDKGRKERAQLESAVIKSAETINDSVKIRDKKIVEALLNEGKSTQEKVDES 

SEQ XD NO. 5216 

STRAIN M732 frame: 1 

SDTFNFDIDQIADNAITKTDKTTEIISNQTTSQTGQIAFFEKLTPAQKSAISEKTPALVD 
TFVGDQNALLDFGQSAVEGVNTTVNHILSEQKKIQIPQVDDLLKNANRELNGFIAKYKDA 
TPAELEKKPNLIQKLFKQSKTSLQEFYFDSQNIEQKMDMMAANWKQEDTLARNIVSAEM 
LIEDNTKSIENLVGVIAFIESSQAEAANRASHLQQEILALDSQTSEYQIKSNQLARMTEV 
INT LEQQHTE YVS RLYVAWATT PQMRNLVKVS S DMRQKLGMLRRNT I PTMKLS IAQLGMM 
QQS VKSGVTADAIVNANNAALQMLAETSKEAI PMLEKTAQS PTVSIKS VTALAESLVAQN 
NGIIAAIDKGRKERAQLESAVIKSAETINDSVKIRDKKIVEALLNEGKSTQEK 

SEQ ID NO. 5217 

STRAIN COH1 frame: 3 

KTDKTTEIISNQTTCQTGQIAFFEKLTPAQKSAXSEKTPALVDTFVGDQNALLDFGQSAV 
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EGVNTTVNHILSEQKKIQIPQVDDLLKNANRELNGFIAKYKDATPAELEKKPNLIQKLFK 
QSKTSLQEFYFDSQNIEQKMDMMAANVVKQEDTLARNIVSAEMLIEDNTKSIENLVGVIA 
FIESSQAEAANRASHLQQEILALDSQTSEYQIKSNQLARMTEVINTLEQQHTEYVSRLYV 
AWATT PQMRNLVKVS S DMRQKLGMLRRNTI PTMKLS IAQLGMMQQSVKSGVTADAI VNAN 
NAALQMLAET SKEAI PMLEKTAQS PT VS I KS VTALAE S LVAQNNG I IAAI DKGRKERAQL 
ESAVIKSAETINDSVKIRDKKIVEALLNEGKSTQEBCVDES 

SEQ ID NO. 5218 

STRAIN COH1 frame: 3 

KTDKTTEIISNQTTCQTGQIAFFEKLTPAQKSAXSEKTPALVDTFVGDQNALLDFGQSAV 
EGVNTTVNHILSEQKKIQIPQVDDLLKNANRELNGFIAKYKDATPAELEKKPNLIQKLFK 
QSKTSLQEFYFDSQNIEQKMDMiyiAANVVKQEDTLARNIVSAEMLIEDNTKSIENLVGVIA 
FIESSQ7VEAANRASHLQQEILALDSQTSEYQIKSNQLARMTEVINTLEQQHTEYVSRLYV 
AWATTPQMRNLVKVSS DMRQKLGMLRRNTI PTMKLS IAQLGMMQQSVKSGVTADAI VNAN 
NAALQMLAETSKEAI PMLEKTAQS PTVSIKSVTALAES LVAQNNG I IAAI DKGRKERAQL 
ESAVIKSAETINDSVKIRDKKIVEALLNEGKSTQEKVDES 

SEQ ID NO. 5219 

STRAIN M781 frame: 2 

FDIDQIADNAITKTDKTTEIISNQTTSQTGQIAFFEKLTPAQKSAISEKTPALVDTFVGD 
QNALLDFGQSAVEGVNTTVNHILSEQKKIQIPQVDDLLKNANRELNGFIAKYKDATPAEL 
EKKPNLIQKLFKQS^SLQEFYFDSQNIEQKMDMMAANWKQEDTLARNIVSAEMLIEDN 
TKSIENLVGVIAFIESSQAEAANRASHLQQEILALDSQTSEYQIKSNQLARMTEVINTLE 
QQHTE YVSRLYVAWATT PQMRNLVKVS S DMRQKLGMLRRNT I PTMKLS IAQLGMMQQS VK 
SGVTADAIVNANNAALQMLAETSKEAI PMLEKTAQS PTVS IKS VTALAE SLVAQNNGI I A 
AIDKGRKERAQLESAVIKSAETINDSVKIRDKKIVEALLNEGKSTQEKVDES 

SEQ ID NO. 5220 

STRAIN CJB110 frame: 2 

FD I DQI ADNAITKTDKTTE 1 1 SNQTT S QTGQI AFFEKLT PAQKSAI SEKT PALVDTFVGD 
QNALLDFGQSAVEGVNTTVNHILSEQKKIQIPQVDDLLKNANRELNGFIAKYKDATPAEL 
EKKPNLIQKLFKQSKTSLQEFYFDSQNIEQKMDMMAANWKQEDTLARNIVSAEMLIEDN 
TKSIENLVGVIAFIESSQAEAANRASHLQQEILALDSQTSEYQIKSNQLARMTEVINTLE 
QQHTEYVSRLYVAWATT PQMRNLVKVS S DMRQKLGMLRRNT I PTMKLS IAQLGMMQQS VK 
SGVTADAIVNANNAALQMLAETSKEAI PMLEKTAQS PTVS IKS VTALAE SLVAQNNGI I A 
AIDKGRKERAQLESAVIKSAETINDSVKIRDKKIVEALLNEGKSTQEKVDES 

SEQ ID NO. 5221 

STRAIN 1169NT frame: 1 

ADNAITKTDKTTEIISNQTTSQTGQIAFFEKLT PAQKSAI SEKTPALVDTFVGDQNALLD 
FGQSAVEGVNTTVNHILSEQKKIQIPQVDDLLKNANRELNGFIAKYKDATPAELEKKPNL 
IQKLFKQSKTSLQEFYFDSQNIEQKMDMMAANWKQEDTLARNIVSAEMLIEDNTKSIEN 
LVGVIAFIESSQAEAANRASHLQQEILALDSQTSEYQIKSNQLARMTEVINTLEQQHTEY 
VS RLYVAW ATT PQMRNLVKVS S DMRQKLGMLRRNT I PTMKLS IAQLGMMQQS VKS GVTAD 
AIVNANNAALQMLAET SKEAI PMLEKTAQS PTVS IKSVTALAES LVAQNNG I IAAI DKGR 
KERAQLESAVIKSAETINDSVKIRDKKIVEALLNEGKSTQEKVDES 

SEQ ID NO. 5222 

STRAIN JM9130013 frame: 1 

SDT FN FD I DQI ADNAITKTDKTTE 1 1 SNQTT SQTGQI AFFEKLT PAQKSAI SEKT PALVD 
TFVGDQNALLDFGQSAVEGVNTTVNHILSEQKKIQIPQVDDLLKNANRELNGFIAKYKDA 
TPAELEKKPNLIQKLFKQSKTSLQEFYFDSQNIEQKMDMMAANVVKQEDTLARNIVSAEM 
LIEDNTKSIENLVGVIAFIESSQAEAANRASHLQQEILALDSQTSEYQIKSNQLARMTEV 
INTLEQQHTE YVSRLYVAWATT PQMRNLVKVS S DMRQKLGMLRRNT I PTMKLS I AQLGMM 
QQS VKS GVTADAIVN ANN AALQMLAET SKEAI PMLEKTAQS PTVS IKS VTALAE SLVAQN 
NGIIAAI DKGRKERAQLESAVIKSAETINDSVKIRDKKIVEALLNEGKSTQEKVDES 

SEQ ID NO. 5223 
STRAIN 2603 frame: 1 

SDT FN FD I DQIADNAITKTDKTTE 1 1 SNQTT SQTGQIAFFEKLT PAQKSAI SEKT PALVD 
TFVGDQNALLDFGQSAVEGVNTTVNHILSEQKKIQIPQVDDLLKNANRELNGFIAKYKDA 
TPAELEKKPNLIQKLFKQSKTSLQEFYFDSQNIEQKMDMMAANVVKQEDTLARNIVSAEM 
LIEDNTKSIENLVGVIAFIESSQAEAANRASHLQQEILALDSQTSEYQIKSNQLARMTEV 
INT LEQQHPE YVSRLYVAWATT PQMRNLVKVS S DMRQKLGMLRRNTI PTMKLS IAQLGMM 
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QQSVKSGVTADAI VNANNAALQMI*AETSKEAI PMLEKTAQS PTVS IKSVTALAESLVAQN 
NGIIAAIDKGRKERAQLESAVIKSAETINDSVKIRDKKIVEALLNEGKSTQEKVDES 

SEQ ID NO. 5301 
STRAIN 2603 

acaaatactttgaaaaaagaattagttgaagctaaaaagacaattccatc 

cgtaaaagcttcaaaagtaccgcaaaaatcaacatcatcgaaagataaag 

agtttgttcttaaaccgattatcgatgtctctggttggcaacttcctaag 

gagattgattacgatacgctttcaaaaaatatttcaggtgttgttattcg 

tgtctttggtggatcaaagatatctaagactaataacgctgcttatacaa 

ctggaatcgataaatcgtttaagacccatatcaaagaatttcaaaagcga 

aatatcccagtagctgtctacagttatgcacttggttcaagtgttaaaga 

aatgaaagaagaggctcagatattttataagaatgcagctccttacaaac 

caactttttattggattgacgtagaagaggagacaatgtctaacatgaat 

aaaggtgtccaagcattccgaaaagaattaaaaagacttggtgctaaaaa 

tgttggtatctacattggtacttactttatgactgagcaaggcatctctg 

taaaaggatttgacgctgtttggattccaacttatggtagcgattctgga 

tactatgaagcggctccgcaaactgaacttaaatacgatttacaccaata 

cacctctcaaggttatctaccaggawtcaatcaaccgcttgatttaaatc 

aaattgcagttaataaagacaagaagaaaacttatgagaaactttttgga 
aaagtaaaagag 

SEQ ID NO. 5302 
STRAIN 090 

ACAAATACTTTGAAAAAAGAATTAG 

TTGAAGCTAAAAAGACAATTCCATCCGTAAAAGCTTCAAAAGTACCGCAA 
AAATCAACATCATCGAAAGATAAAGAGTTTGTTCTTAAACCGATTATCGA 
TGTCTCTGGTTGGCAACTTCCTAAGGAGATTGATTACGATACGCTTTCAA 
AAAATATTTCAGGTGTTGTTATTCGTGTCTTTGGTGGATCAAAGATATCT 
AAGACTAATAACGCTGCTTATACAACTGGAATCGATAAATCGTTTAAGAC 
CCATATCAAAGAATTTCAAAAGCGAAATATCCCAGTAGCTGTCTACAGTT 
ATGCACTTGGTTCAAGTGTTAAAGAAATGAAAGAAGAGGCTCAGATATTT 
TATAAGAATGCAGCTCCTTACAAACCAACTTTTTATTGGATTGACGTAGA 
AGAGGAGACAATGTCTAACATGAATAAAGGTGTCCAAGCATTCCGAAAAG 
AATTAAAAAGACTTGGTGCTAAAAATGTTGGTATCTACATTGGTACTTAC 
TTTATGACTGAGCAAGGCATCTCTGTAAAAGGATTTGACGCTGTTTGGAT 
TCCAACTTATGGTAGCGATTCTGGATACTATGAAGCGGCTCCGCAAACTG 
AACTTAAATACGATTTACACCAATACACCTCTCAAGGTTATCTACCAGGA 
TTCAATCAACCGCTTGATTTAAATCAAATTGCAGTTAATAAAGACAAGAA 
GAAAACTTATGAGAAACTTTTTGGAAAAGTAAAAGAG 

SEQ ID NO. 5303 
STRAIN A909 

ACAAATACTTTGAAAAAAGAATTAGTTGAAGCTAAAA 

AGACAATTCCATCCGTAAAAGCTTCAAAAGTACCGCAAAAATCAACATCA 

TCGAAAGATAAAGAGTTTGTTCTTAAACCGATTATCGATGTCTCTGGTTG 

GCAACTTCCTAAGGAGATTGATTACGATACGCTTTCAAAAAATATTTCAG 

GTGTTGTTATTCGTGTCTTTGGTGGATCAAAGATATCTAAGACTAATAAC 

GCTGCTTATACAACTGGAATCGATAAATCGTTTAAGACCCATATCAAAGA 

ATTTCAAAAGCGAAATATCCCAGTAGCTGTCTACAGTTATGCACTTGGTT 

CAAGTGTTAAAGAAATGAAAGAAGAGGCTCAGATATTTTATAAGAATGCA 

GCTCCTTACAAACCAACTTTTTATTGGATTGACGTAGAAGAGGAGACAAT 

GTCTAACATGAATAAAGGTGTCCAAGCATTCCGAAAAGAATTAAAAAGAC 

TTGGTGCTAAAAATGTTGGTATCTACATTGGTACTTACTTTATGACTGAG 

CAAGGCATCTCTGTAAAAGGATTTGACGCTGTTTGGATTCCAACTTATGG 

TAGCGATTCTGGATACTATGAAGCGGCTCCGCAAACTGAACTTAAATACG 

ATTTACACCAATACACCTCTCAAGGTTATCTACCAGGATTCAATCAACCG 

CTTGATTTAAATCAAATTGCAGTTAATAAAGACAAGAAGAAAACTTATGA 

GAAACTTTTTGGAAAAGTAAAAGAG 

SEQ ID NO. 5304 
STRAIN H36B 

ACAAATACTTTGAAAAAAGAATTAG 

TTGAAGCTAAAAAGACAATTCCATCCGTAAAAGCTTCAAAAGTACCGCAA 
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AAATCAACATCATCGAAAGATAAAGAGTTTGTTCTTAAACCGATTATCGA 
TGTCTCTGGTTGGCAACTTCCTAAGGAGATTGATTACGATACGCTTTCAA 
AAAATATTTCAGGTGTTGTTATTCGTGTCTTTGGTGGATCAAAGATATCT 
AAGACTAATAACGCTGCTTATACAACTGGAATCGATAAATCGTTTAAGAC 
CCATATCAAAGAATTTCAAAAGCGAAATATCCCAGTAGCTGTCTACAGTT 
ATGCACTTGGTTCAAGTGTTAAAGAAATGAAAGAAGAGGCTCAGATATTT 
TATAAGAATGCAGCTCCTTACAAACCAACTTTTTATTGGATTGACGTAGA 
AGAGGAGACAATGTCTAACATGAATAAAGGTGTCCAAGCATTCCGAAAAG 
AATTAAAAAGACTTGGTGCTAAAAATGTTGGTATCTACATTGGTACTTAC 
TTTATGACTGAGCAAGGCATCTCTGTAAAAGGATTTGACGCTGTTTGGAT 
TCCAACTTATGGTAGCGATTCTGGATACTATGAAGCGGCTCCGCAAACTG 
AACTTAAATACGATTTACACCAATACACCTCTCAAGGTTATCTACCAGGA 
TTCAATCAACCGCTTGATTTAAATCAAATTGCAGTTAATAAAGACAAGAA 
GAAAACTTATGAGAAACTTTTTGGAAAAGTAAAAGAG 

SEQ ID NO. 5305 
STRAIN 18RS21 

ACAAATACTTTGAAAAAAGAATTAGTTGAAGCTAAAAA 

GACAATTCCATCCGTAAAAGCTTCAAAAGTACCGCAAAAATCAACATCAT 

CGAAAGATAAAGAGTTTGTTCTTAAACCGATTATCGATGTCTCTGGTTGG 

CAACTTCCTAAGGAGATTGATTACGATACGCTTTCAAAAAATATTTCAGG 

TGTTGTTATTCGTGTCTTTGGTGGATCAAAGATATCTAAGACTAATAACG 

CTGCTTATACAACTGGAATCGATAAATCGTTTAAGACCCATATCAAAGAA 

TTTCAAAAGCGAAATATCCCAGTAGCTGTCTACAGTTATGCACTTGGTTC 

AAGTGTTAAAGAAATGAAAGAAGAGGCTCAGATATTTTATAAGAATGCAG 

CTCCTTACAAACCAACTTTTTATTGGATTGACGTAGAAGAGGAGACAATG 

TCTAACATGAATAAAGGTGTCCAAGCATTCCGAAAAGAATTAAAAAGACT 

TGGTGCTAAAAATGTTGGTATCTACATTGGTACTTACTTTATGACTGAGC 

AAGGCATCTCTGTAAAAGGATTTGACGCTGTTTGGATTCCAACTTATGGT 

AGCGATTCTGGATACTATGAAGCGGCTCCGCAAACTGAACTTAAATACGA 

TTTACACCAATACACCTCTCAAGGTTATCTACCAGGATTCAATCAACCGC 

TTGATTTAAATCAAATTGCAGTTAATAAAGACAAGAAGAAAACTTATGAG 

AAACTTTTTGGAAAAGTAAAAGAG 

SEQ ID NO. 5306 
STRAIN M732 

ACAAATACTTTGAAAAAAGAATTAGTTGAAGCTAAA 

AAGACAATTCCATCCGTAAAAGCTTCAAAAGTACCGCAAAAATCAACATC 

ATCGAAAGATAAAGAGTTTGTTCTTAAACCGATTATCGATGTCTCTGGTT 

GGCAACTTCCTAAGGAGATTGATTACGATACGCTTTCAAAAAATATTTCA 

GGTGTTGTTATTCGTATCTTTGGTGGATCAAAGATATCTAAGACTAATAA 

CGCTGCTTATACAACTGGAATCGATAAATCGTTTAAGACCCATATCAAAG 

AATTTCAAAAGCGAAATATCCCAGTAGCTGTCTACAGTTATGCACTTGGT 

TCAAGTGTTAAAGAAATGAAAGAAGAGGCTCAGATATTTTATAAGAATGC 

AGCTCCTTACAAaCCAACTTTTTATTGGATTGACGTAGAAGAGGAGACAA 

TGTCTAACATGAATAAAGGTGTCCAAGCATTCCGAAAAGAGTTAAAAAGA 

CTTGGTGCTAAAAATGTTGGTATCTACATCGGTACTTACTTTATGACTGA 

GCAAGGTATCTCTGTAAAAGGATTTGACGCTGTTTGGATTCCAACTTATG 

GTAGCGATTCTGGATACTATGAAGCAGCTCCACAAACTGAACTTAAATAC 

GATTTACACCAATACACCTCTCAAGGTTATCTACCAGGATTCAATCAACC 

GCTTGATTTAAATCAAATTGCAGTTAATAAAGACAAGAAGAAAACTTATG 

AGAAACTTTTTGGAAAAGTAAAAGAG 

SEQ ID NO. 5307 
STRAIN COH1 

ACAAATACTTTGAAAAAAGAATTAGTTGAAGCTAAAA 

AGACAATTCCATCCGTAAAAGCTTCAAAAGTACCGCAAAAATCAACATCA 

TCGAAAGATAAAGAGTTTGTTCTTAAACCGATTATCGATGTCTCTGGTTG 

GCAACTTCCTAAGGAGATTGATTACGATACGCTTTCAAAAAATATTTCAG 

GTGTTGTTATTCGTATCTTTGGTGGATCAAAGATATCTAAGACTAATAAC 

GCTGCTTATACAACTGGAATCGATAAATCGTTTAAGACCCATATCAAAGA 

ATTTCAAAAGCGAAATATCCCAGTAGCTGTCTACAGTTATGCACTTGGTT 

CAAGTGTTAAAGAAATGAAAGAAGAGGCTCAGATATTTTATAAGAATGCA 

GCTCCTTACAAACCAACTTTTTATTGGATTGACGTAGAAGAGGAGACAAT 
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GTCTAACATGAATAAAGGTGTCCAAGCATTCCGAAAAGAGTTAAAAAGAC 
TTGGTGCTAAAAATGTTGGTATCTACATCGGTACTTACTTTATGACTGAG 
CAAGGTATCTCTGTAAAAGGATTTGACGCTGTTTGGATTCCAACTTATGG 
TAGCGATTCTGGATACTATGAAGCAGCTCCACAAACTGAACTTAAATACG 
ATTTACACCAATACACCTCTCAAGGTTATCTACCAGGATTCAATCAACCG 
CTTGATTTAAATCAAATTGCAGTTAATAAAGACAAGAAGAAAACTTATGA 
GAAACTTTTTGGAAAAGTAAAAGAG 

SEQ ID NO. 5308 
STRAIN M781 

ACAAATACTTTGAAAAAAGAATTAGTTGAAGCTAAA 

AAGACAATTCCATCcGTAAAAGCTTCAAAAGTACCGCAAAAATCAACATC 
ATCGAAAGATAAAGAGTTTGTTCTTAAACCGATTATCGATGTCTCTGGTT 
GGCAACTTCCTAAGGAGATTGATTACGATACGCTTTCAAAAAATATTTCA 
GGTGTTGTTATTCGTATCTTTGGTGGATCAAAGATATCTAAGACTAATAA 
CGCTGCTTATACAACTGGAATCGATAAAT cGTTTAAGACCCATAT CAAAG 
AATTTCAAAAGCGAAATATCCCAGTAGCTGTCTACAGTTATGCACTTGGT 
TCAAGTGTTAAAGAAATGAAAGAAGAGGCTCAGATATTTTATAAGAATGC 
AGCTCCTTACAAACCAACTTTTTatTGGATTGACGTAGAAGAGGAGaCAA 
TGTCTAACATGAATAAAGGTGTCCAAGCATTCCGAAAAGAGTTAAAAAGA 
CTTGGTGCTAAAAATGTTGGTATCTACATCGGTACTTACTTTATGACTGA 
GCAAGGTATCTCTGTAAAAGGATTTGACGCTGTTTGGATTCCAACTTATG 
GTAGCGATTCTGGATACTATGAAGCAGCTCCACAAACTGAACTTAAATAC 
GATTTACACCAATACACCTCTCAAGGTTATCTACCAGGATTCAATCAACC 
GCTTGATTTAAATCAAATTGCAGTTAATAAAGACAAGAAGAAAACTTATG 
AGAAACTTTTTGGAAAAGTAAAAGAG 

SEQ ID NO. 5309 
STRAIN CJB110 

AAATACTTTGAAAAAAGAATTAGTTGAAGCTAAAAAGACAATTCCATCCG 

TAAAAGCTTCAAAAGTACCGCAAAAATCAACATCATCGAAAGATAAAGAG 

TTTGTTCTTAAACCGATTATCGATGTCTCTGGTTGGCAACTTCCTAAGGA 

GATTGATTACGATACGCTTTCAAAAAAT ATT TCAGGTGTTGTTATT CGTG 

TCTTTGGTGGATCAAAGATATCTAAGACTAATAACGCTGCTTATACAACT 

GGAATCGATAAATCGTTTAAGACCCATATCAAAGAATTTCAAAAGCGAAA 

TATCCCAGTAGCTGTCTACAGTTATGCACTTGGTTCAAGTGTTAAAGAAA 

TGAAAGAAGAGGCTCAGATATTTTATAAGAATGCAGCTCCTTACAAACCA 

ACTTTTTATTGGATTGACGTAGAAGAGGAGACAATGTCTAACATGAATAA 

AGGTGTCCAAGCATTCCGAAAAGAATTAAAAAGACTTGGTGCTAAAAATG 

TTGGTATCTACATTGGTACTTACTTTATGACTGAGCAAGGCATCTCTGTA 

AAAGGATTTGACGCTGTTTGGATTCCAACTTATGGTAGCGATTCTGGATA 

CTATGAAGCGGCTCCGCAAACTGAACTTAAATACGATTTACACCAATACA 

CCTCTCAAGGTTATCTACCAGGATTCAATCAACCGCTTGATTTAAATCAA 

ATTACAGTTAATAAAGACAAGAAGAAAACTTATGAGAAACTTTTTGGAAA 
AGTAAAAGAG 

SEQ ID NO. 5310 
STRAIN 1169NT 

ACAAATACTTTGAAAAAAGAATTAGTTGAAGCTAAAAAGACAATTCC 

ATCCGTAAAAGCTTCAAAAGTACCGCAAAAATCAACATCATCGAAAGATA 

AAGAGTTTGTTCTTAAACCGATTATCGATGTCTCTGGTTGGCAACTTCCT 

AAGGAGATTGATTACGATACGCTTTCAAAAAATATTTCAGGTGTTGTTAT 

TCGTGTCTTTGGTGGATCAAAGATATCTAAGACTAATAACGCTGCTTATA 

CAACTGGAATCGATAAATCGTTTAAGACCCATATCAAAGAATTTCAAAAG 

CGAAATATCCCAGTAGCTGTCTACAGTTATGCACTTGGTTCAAGTGTTAA 

AGAAATGAAAGAAGAGGCTCAGATATTTTATAAGAATGCAGCTCCTTACA 

AACCAACTTTTTATTGGATTGACGTAGAAGAGGAGACAATGTCTAACATG 

AATAAAGGTGTCCAAGCATTCCGAAAAGAATTAAAAAGACTTGGCGCTAA 

AAATGTTGGTATCTACATCGGTACTTACTTTATGACTGAGCAAGGTATCT 

CTGTAAAAGGATTTGACGCTGTTTGGATTCCAACTTATGGTAGCGATTCT 

GGATACTATGAAGCAGCTCCGCAAACTGAACTTAAATACGATTTACACCA 

ATACACCTCTCAAGGTTATCTACCAGGATTCAATCAACCGCTTGATTTAA 

ATCAAATTGCAGTTAATAAAGACAAGAAGAAAACTTATGAGAAACTTTTT 
GGAAAAGTAAAAGAG 
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SEQ ID NO. 5311 
STRAIN JM9130013 

ACAAATACTTTGAAAAAAGAATTAG 

TTGAAGCTAAAAAGACAATTCCATCCGTAAAAGCTTCAAAAGTACCGCAA 
AAATCAACATCATCGAAAGATAAAGAGTTTGTTCTTAAACCGATTATCGA 
TGTCTCTGGTTGGCAACTTCCTAAGGAGATTGATTACGATACGCTTTCAA 
AAAATATTTCAGGTGTTGTTATTCGTGTCTTTGGTGGATCAAAGATATCT 
AAGACTAATAACGCTGCTTATACAACTGGAATCGATAAATCGTTTAAGAC 
CCATATCAAAGAATTTCAAAAGCGAAATATCCCAGTAGCTGTCTACAGTT 
ATGCACTTGGTTCAAGTGTTAAAGAAATGAAAGAAGAGGCTCAGATATTT 
TATAAGAATGCAGCTCCTTACAAACCAACTTTTTATTGGATTGACGTAGA 
AGAGGAGACAATGTCTAACATGAATAAAGGTGTCCAAGCATTCCGAAAAG 
AATTAAAAAGACTTGGTGCTAAAAATGTTGGTATCTACATTGGTACTTAC 
TTTATGACTGAGCAAGGCATCTCTGTAAAAGGATTTGACGCTGTTTGGAT 
TCCAACTTATGGTAGCGATTCTGGATACTATGAAGCGGCTCCGCAAACTG 
AACTTAAATACGATTTACACCAATACACCTCTCAAGGTTATCTACCAGGA 
TTCAATCAACCGCTTGATTTAAATCAAATTGCAGTTAATAAAGACAAGAA 
GAAAACTTATGAGAAACTTTTTGGAAAAGTAAAAGAG 

SEQ ID NO. 5312 

STRAIN 2603 frame: 1 

TNTLKKELVEAKKTIPSVKASICVPQKSTSSKDBCEFVLKPIIDVSGWQLPKEIDYDTLSKN 
ISGWIRVFGGSKI SKTNNAAYTTGI DKS FKTHIKEFQKRNI PVAVYS YALGS S VKEMKE 

EAQIFYKNAAPYKPTFYWIDVEEETMSNMNKGVQAFRKELKRJjGAKNVGIYIGTYFMTEQ 

GISVKGFDAVWIPTYGSDSGYYEAAPQTELKYDLHQYTSQGYLPGXNQPLDLNQIAVNKD 
KKKTYEKLFGKVKE 

SEQ ID NO. 5313 
STRAIN 090 frame: 1 

TNTLKKELVEAKKTIPSVKASKVPQKSTSSKDKEFVLKPIIDVSGWQLPKEIDYDTLSKN 
I SGWIRVFGGSKI SKTNNAAYTTGI DKS FKTHIKEFQKRN I PVAVYS YALGS S VKEMKE 
EAQIFYKNAAPYKPTFYWIDVEEETMSNMNKGVQAFRKELKRLGAKNVGIYIGTYFMTEQ 
GI SVKGFDAVWI PT YGS DSGYYEAAPQTELKYDLHQYTSQGYLPGFNQPLDLNQI AVNKD 
KKKTYEKLFGKVKE 

SEQ ID NO. 5314 

STRAIN A909 frame: 1 

TNTLKKELVEAKKTIPSVKASKVPQKSTSSKDKEFVLKPIIDVSGWQLPKEIDYDTLSKN 

I SGWIRVFGGSKI SKTNNAAYTTGI DKS FKTHIKEFQKRN I PVAVYS YALGS S VKEMKE 

EAQIFYKNAAPYKPTFYWIDVEEETMSNMNKGVQAFRKELKRLGAKNVGIYIGTYETyiTEQ 

GI SVKGFDAVWI PTYGSDSGYYEAAPQTELKYDLHQYTSQGYLPGFNQPLDLNQIAVNKD 
KKKTYEKLFGKVKE 

SEQ ID NO. 5315 

STRAIN H36B frame: 1 

TNTLKKELVEAKKTI PSVKASKVPQKSTS SKDKEFVLKPI I DVSGWQLPKE I DYDTLSKN 

I SGWIRVFGGS KI S KTNNAAYTTG I DKS FKT HI KE FQKRN I PVAVYS YALG S SVKEMKE 

EAQIFYKNAAPYKPTFYWIDVEEETMSNMNKGVQAFRKELKRLGAKNVGIYIGTYFMTEQ 

GISVKGFDAVWIPTYGSDSGYYEAAPQTELKYDLHQYTSQGYLPGFNQPLDLNQIAVNKD 
KKKTYEKLFGKVKE 

SEQ ID NO. 5316 

STRAIN 18RS21 frame: 1 

TNTLKKELVEAKKTI PSVKASKVPQKSTS SKDKEFVLKPI I DVSGWQLPKE I DYDTLSKN 

I SGWIRVFGGSKI SKTNNAAYTTGI DKS FKTHIKEFQKRN I PVAVYS YALGS SVKEMKE 

EAQIFYKNAAPYKPTFYWIDVEEETMSNMNKGVQAFRKELKRLGAKNVGIYIGTYEMTEQ 

GISVKGFDAVWIPTYGSDSGYYEAAPQTELKYDLHQYTSQGYLPGFNQPLDLNQIAVNKD 
KKKTYEKLFGKVKE 

SEQ ID NO. 5317 

STRAIN M732 frame: 1 

TNTLKKELVEAKKTI PSVKASKVPQKSTS SKDKEFVLKPI I DVSGWQLPKE I DYDTLSKN 
I SGWIRIFGGSKISKTNNAAYTTGI DKS FKTHIKEFQKRNI PVAVYS YALGS SVKEMKE 
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EAQI FYKNAAPYKPTFYWI DVEEETMSNMNKGVQAFRKELKRLGAKNVGI YIGTYFMTEQ 

GISVKGFDAVWIPTYGSDSGYYEAAPQTELKYDLHQYTSQGYLPGFNQPLDLNQJJWNKD 
KKKTYEKLFGKVKE 

SEQ ID NO. 5318 

STRAIN COH1 frame: 1 

TNTLKKELVEAKKTIPSViCASKVPQKSTSSKDKEFVLKPIIDVSGWQLPICEIDYDTLSKN 
I SGWIRI FGGSKI SKTNNAAYTTGI DKS FKTHIKE FQKRNI P VAVYS YALGS S VKEMKE 
EAQIFYKNAAPYKPTFYWIDVEEETMSNMNKGVQAFRKELKRLGAKNVGI YIGTYFMTEQ 
GISVKGFDAVWIPTYGSDSGYYEAAPQTELKYDLHQYTSQGYLPGFNQPLDLNQIAVNKD 
KKKTYEKLFGKVKE 

SEQ ID NO. 5319 

STRAIN M781 frame: 1 

TNTLKKELVEAKKTIPSVKASKVPQKSTSSKDKEFVLKPIIDVSGWQLPKEIDYDTLSKN 
ISGWIRI FGGSKI SKTNNAAYTTGI DKS FKTHIKEFQKRNI PVAVYSYALGSS VKEMKE 
EAQI FYKNAAPYKPTFYWIDVEEETMSNMNKGVQAFRKELKRLGAKNVG I YIGTYFMTEQ 
GISVKGFDAVWIPTYGSDSGYYEAAPQTELKYDLHQYTSQGYLPGFNQPLDLNQIAVNKD 
KKKTYEKLFGKVKE 

SEQ ID NO. 5320 

STRAIN CJB110 frame: 2 

NTLKKELVEAKKTIPSVKASKVPQKSTSSKDKEFVLKPIIDVSGWQLPKEIDYDTLSKNI 
SGWIRVFGGSKI SKTNNAAYTTGI DKS FKTHIKE FQKRNI PVAVYS YALGS SVKEMKEE 
AQIFYKNAAPYKPTFYWIDVEEETMSNMNKGVQAFRKELKRLGAKNVGIYIGTYFMTEQG 

ISVKGFDAVWIPTYGSDSGYYEAAPQTELKYDLHQYTSQGYLPGFNQPLDLNQITVNKDK 
KKTYEKLFGKVKE 

SEQ ID NO. 5321 
STRAIN 1169NT frame: 1 

TNTLKKELVEAKKTIPSVKASKVPQKSTSSKDKEFVLKPIIDVSGWQLPKEIDYDTLSKN 
I SGWIRVFGGSKI SKTNNAAYTTGI DKS FKTHIKEFQKRNI PVAVYSYALGS S VKEMKE 
EAQI FYKNAAP YKPT FYW I DVEEETMSNMNKGVQAFRKELKRLGAKN VG I Y I GTYFMTEQ 

GISVKGFDAVWIPTYGSDSGYYEAAPQTELKYDLHQYTSQGYLPGFNQPLDLNQIAVNKD 
KKKTYEKLFGKVKE 

SEQ ID NO. 5322 

STRAIN JM9130013 frame: 1 

TNTLKKELVEAKKTIPSVKASKVPQKSTSSKDKEFVLKPIIDVSGWQLPKEIDYDTLSKN 
I SGWIRVFGGSKI SKTNNAAYTTGI DKS FKTHIKEFQKRNI PVAVYSYALGSS VKEMKE 
EAQI FYKNAAP YKPT FYW I DVEEETMSNMNKGVQAFRKELKRLGAKNVG I YIGTYFMTEQ 
GISVKGFDAVWIPTYGSDSGYYEAAPQTELKYDLHQYTSQGYLPGFNQPLDLNQIAVNKD 
KKKTYEKLFGKVKE 

SEQ ID NO. 5401 
STRAIN 2603 

TTGACTCACAAAAATATATTATTAACCATTATATTTGGATTATTT 

ATGATTATATTATCAGCATGTGGTATGTCTAATAAGGAAATGGCTGGTATTGATAATTGG 
GAACATTATCAAAAGGAAAAGAAAATTACTATTGGATTTGATAATACTTTTGTTCCTATG 
GGATTTGAAAGTCGTTCTGGTGACTATACCGGCTTTGATATTGATTTAGCTAATGCTGTT 
TTTAAAGAATACGGTATTTCAGTGAAATGGCAGCCTATTAACTGGGATATGAAAGAAACT 
GAACTTAATAATGGTAATATAGACCTTATTTGGAATGGTTATTCAAAAACGGCAGAACGT 
GCTAAAAAAGTCGCTTTTACAAACCCATATATGAATAATCATCAAGTAATTGTTACTAAA 
ACTTCATCACATATTAATAGTATTAAGGATATGAAGGGGAAAAAACTAGGAGCCCAGTCG 
GGTTCATCTGGTTTTGATGCTTTTAACGCTAAACCTGATATTTTAAAAAAGTTTGTAAAA 
GGAAAAGAAGCAGTTCAATACGATACTTTCACTCAGGCTTTGATTGATTTAAAAAATAAC 
CGTATTGATGGTCTTTTGATTGATGAAGTTTATGCTAACTATTATTTAAAGCAAGAAGGA 
AATATAAAAGCTTATTATTTTGTTAAAACTGCTTA.TCAAGGAGAAAATTTTGTAGTAGGA 
GCTCGTAAAGTTGATCGTAGACTAATTGAAAAGATTAACAAAGCTTTCAAACAGCTTCAT 
AATAAGGGGAGATTTCAAAAAATCTCTTACAAATGGTTTGGTGAAGATGTTTATAGTAAA 
GAA 

SEQ ID NO. 5402 

STRAIN 090 
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ATTGGGaACATTATC 

AAAAGGAAAAGAAAATTACTATTGGATTTGATAATACTTTTGTTCCTATG 
GGATTTGAAAGCCGTTCTGGTGACTAtACCGGCTTTGATATTGATTTAGC 
TAATGCTGTTTTTAAAGAATACGGTATTTCAGTGAAATGGCAGCCTATTA 
ACTGGGATATGAAAGAAACTGAACTTAATAATGGTAATATAGACCTTATT 
TGGAATGGTTATTCAAAAACGGCAGAACGTGCTAAAAAAGTCGCTTTTAC 
AAACCCATATATGAATAATCATCAAGTAATTGTTACTAAAACTTCATCAC 
ATATTAATAGTATTAAGGATATGAAGGGGAAAAAACTAGGAGCCCAGTCG 
GGTTCATCTGGTTTTGATGCTTTTAATGCTAAACCTGATATTTTAAAAAA 
GTTTGTAAAAGGAAAAGAAGCAGTTCAATACGATACTTTCACTCAGGCTT 
TGATTGATTTAAAAAATAACCGTATTGATGGTCTTTTGATTGATGAAGTT 
TATGCTAACTATTATTTAAAGCAAGAAGGAAATATAAAAGCTTATTATTT 
TGTTAAAACTGCTTATCAAGGAGAAAATTTTGTAGTAGGAGCTCGCAAAG 
TTGATCGTAGACTAATTGAAAAGATTAACAAAGCTTTCAAACAGCTTCAT 
AATAAGGGAAAATTTCAAAAAATCTCTTACAAATGGTTTGGTGAAGATGT 
TTATAGTAAAGAA 

SEQ ID NO. 5403 

STRAIN A909 
ATTGGG 

aACATTATCAAAAGGAAAAGAAAATTACTATTGGATTTGATAATACTTTT 
GTTCCTATGGGATTTGAAAGTCGTTCTGGTGACTATACCGGCTTTGATAT 
TGATTTAGCTAATGCTGTTTTTAAAGAATACGGTATTTCAGTGAAATGGC 
AGCCTATTAACTGGGATAtgAAAGAAACTGAACTTAATAATGGTAATATA 
GACCTTATTTGGAATGGTTATTCAAAAACGGCAGAACGTGCTAAAAAAGT 
CGCTTTTACAAACCCATATATGAATAATCATCAAGTAATTGTTACTAAAA 
CTTCATCACATATTAATAGTATTAAGGATATGAAGGGGAAAAAACTAGGA 
GCCCAGTCGGGTTCATCTGGTTTTGATGCTTTTAACGCTAAACCTGATAT 
TTTAAAAAAGTTTGTAAAAGGAAAAGAAGCAGtTCAATACGATACTTTCA 
CTCAGGCTTTGATTGATTTAAAAAATAACCGTATTGATGGTCTTTTGATT 
GATGAAGTTTATGCTAACTATTATTTAAAGCAAGAAGGAAATATAAAAGC 
TTATTATTTTGTTAAAACTGCTTATCAAGGAGAAAATTTTGTAGTAGGAG 
CTCGTAAAGTTGATCGTAGACTAATTGAAAAGATTAACAAAGCTTTCAAA 
CAGCTTCATAATAAGGGGAGATTTCAAAAAATCTCTTACAAATGGTTTGG 
TGAAGATGTTTATAGTAAAGaA 

SEQ ID NO. 5404 

STRAIN H36B 

ATTGGGAACATTATCAAAAGGAAAAGAAAATTACTATTGGATT 

TGATAATACTTTTGTTCCTATGGGATTTGAAAGTCGTTCTGGTGACTATA 

CCGGCTTTGATATTGATTTAGCTAATGCTGTTTTTAAAGAATACGGTATT 

TCAGTGAAATGGCAGCCTATTAACTGGGATATGAAAGAAACTGAACTTAA 

TAATGGTAATATAGACCTTATTTGGAATGGTTATTCAAAAACGGCAGAAC 

GTGCTAAAAAAGTCGCTTTTACAAACCCATATATGAATAATCATCAAGTA 

ATTGTTACTAAAACTTCATCACATATTAATAGTATTAAGGATATGAAGGG 

GAAAAAACTAGGAGCCCAGTCGGGTTCATCTGGTTTTGATGCTTTTAACG 

CTAAACCTGATATTTTAAAAAAGTTTGTAAAAGGAAAAGAAGCAGtTCAA 

TACGATACTTTCACTCAGGCTTTGATTGATTTAAAAAATAACCGTATTGA 

TGGTCTTTTGATTGATGAAGTtTATGCTAACTATTATTTAAAGCAAGAAG 

GAAATATAAAAGCTTATTATTTTGTTAAAACTGCTTATCAAGGAgAAAAT 

TTTGTAGTAGGAGCTCGTAAAGTTGATCGTAGACTAATTGAAAAGATTAA 

CAAAGCTTTCAAACAGCTTCATAATAAGGGGAGATTTCAAAAAATCTCTT 

ACAAATGGTTTGGTGAAGATGTTTATAGTAAAGAA 

SEQ ID NO. 5405 

STRAIN 18RS21 
ATTGGGAACATTA 

TCAAAAGGAAAAGAAAATTACTATTGGATTTGATAATACTTTTGTTCCTA 
TGGGATTTGAAAGTCGTTCTGGTGACTAtACCGGCTTTGATATTGATTTA 
GCTAATGCTGTTTTTAAAGAATACGGTATTTCAGTGAAATGGCAGCCTAT 
TAACTGGGATATGAAAGAAACTGAACTTAATAATGGTAATATAGACCTTA 
TTTGGAATGGTTATTCAAAAACGGCAGAACGTGCTAAAAAAGTCGCTTTT 
ACAAACCCATATATGAATAATCATCAAGTAATTGTTACTAAAACTTCATC 
ACATATTAATAGTATTAAGGATATGAAGGGGAAAAAACTAGGAGCCCAGT 
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CGGGTTCATCTGGTTTTGATGCTTTTAACGCTAAACCTGATATTTTAAAA 
AAGTTTGTAAAAGGAAAAGAAGCAGTTCAATACGATACTTTCACTCAGGC 
TTTGATTGATTTAAAAAATAACCGTATTGATGGTCTTTTGATTGATGAAG 
TTTATGCTAACTATTATTTAAAGCAAGAAGGAAATATAAAAGCTTATTAT 
TTTGTTAAAACTGCTTATCAAGGAGAAAATTTTGTAGTAGGAGCTCGTAA 
AGTTGATCGTAGACTAATTGAAAAGATTAACAAAGCTTTCAAACAGCTTC 
ATAATAAGGGGAGATTTCAAAAAATCTCTTACAAATGGTTTGGTGAAGAT 
GTTTATAGTAAAGAA 

SEQ ID NO. 5406 

STRAIN M732 

ATTGGGAACATTATCAAAAGGAAAAGAAAATTACTATTGGATTTGATAA 

TACTTTTGTTCCTATGGGATTTGAAAGTCGTTCTGGTGACTATACCGGCT 

TTGATATTGATTTAGCTAATGCTGTTTTTAAAGAATACGGTATTTCAGTG 

AAATGGCAGCCTATTAACTGGGATATGAAAGAAACTGAACTTAATAATGG 

TAATATAGACCTTATTTGGAATGGTTATTCAAAAACGGCAGAACGTGCTA 

AAAAAGTCGCTTTTACAAACCCATATATGAATAATCATCAAGTAATTGTT 

ACTAAAACTTCATCACATATTAATAGTATTAAGGATATGAAGGGGAAAAA 

ACTAGGAGCCCAGTCGGGTTCATCTGGTTTTGATGCTTTTAACGCTAAAC 

CTGATATTTTAAAAAAGTTTGTAAAAGGAAAAGAAGCAGTTCAATACGAT 

ACTTTCACTCAGGCTTTGATTGATTTAAAAAATAACCGTATTGATGGTCT 

TTTGATTGATGAAGTTTATGCTAACTATTATTTAAAGCAAGAAGGAAATA 

TAAAAGCTTATTATTTTGTTAAAACTGCTTATCAAGGAGAAAATTTTGTA 

GTAGGAGCTCGTAAAGTTGATCGTAGACTAATTGAAAAGATTAACAAAGC 

TTTCAAACAGCTTCATAATAAGGGGAGATTTCAAAAAATCTCTTACAAAT 

GGTTTGGTGAAGATGTTTATAGTAAAGAA 

SEQ ID NO. 5407 

STRAIN COH1 

ATTGGGAACATTATCAAAAGGAAAAGAAAATTACTATTGGATTTGATAA 

TACTTTTGTTCCTATGGGATTTGAAAGTCGTTCTGGTGACTATACCGGCT 

TTGATATTGATTTAGCTAATGCTGTTTTTAAAGAATACGGTATTTCAGTG 

AAATGGCAGCCTATTAACTGGGATATGAAAGAAACTGAACTTAATAATGG 

TAATATAGACCTTATTTGGAATGGTTATTCAAAAACGGCAGAACGTGCTA 

AAAAAGTCGCTTTTACAAACCCATATATGAATAATCATCAAGTAATTGTT 

ACTAAAACTTCATCACATATTAATAGTATTAAGGATATGAAGGGGAAAAA 

ACTAGGAGCCCAGTCGGGTTCATCTGGTTTTGATGCTTTTAACGCTAAAC 

CTGATATTTTAAAAAAGTTTGTAAAAGGAAAAGAAGCAGTTCAATACGAT 

ACTTTCACTCAGGCTTTGATTGATTTAAAAAATAACCGTATTGATGGTCT 

TTTGATTGATGAAGTTTATGCTAACTATTATTTAAAGCAAGAAGGAAATA 

TAAAAGCTTATTATTTTGTTAAAACTGCTTATCAAGGAGAAAATTTTGTA 

GTAGGAGCTCGTAAAGTTGATCGTAGACTAATTGAAAAGATTAACAAAGC 

TTTCAAACAGCTTCATAATAAGGGGAGATTTCAAAAAATCTCTTACAAAT 

GGTTTGGTGAAGATGTTTATAGTAAAGAA 

SEQ ID NO. 5408 

STRAIN M781 

ATTGGGAACATTATCAAAAGGAAAAGAAAATTACTATTGGATTTGATA 

ATACTTTTGTTCCTATGGGATTTGAAAGTCGTTCTGGTGACTATACCGGC 

TTTGATATTGATTTAGCTAATGCTGTTTTTAAAGAATACGGTATTTCAGT 

GAAATGGCAGCCTATTAACTGGGATATGAAAGAAACTGAACTTAATAATG 

GTAATATAGACCTTATTTGGAATGGTTATTCAAAAACGGCAGAACGTGCT 

AAAAAAGTCGCTTTTACAAACCCATATATGAATAATCATCAAGTAATTGT 

TACTAAAACTTCATCACATATTAATAGTATTAAGGATATGAAGGGGAAAA 

AACTAGGAGCCCAGTCGGGTTCATCTGGTTTTGATGCTTTTAACGCTAAA 

CCTGATATTTTAAAAAAGTTTGTAAAAGGAAAAGAAGCAGTTCAATACGA 

TACTTTCACTCAGGCTTTGATTGATTTAAAAAATAACCGTATTGATGGTC 

TTTTGATTGATGAAGTTTATGCTAACTATTATTTAAAGCAAGAAGGAAAT 

ATAAAAGCTTATTATTTTGTTAAAACTGCTTATCAAGGAGAAAATTTTGT 

AGTAGGAGCTCGTAAAGTTGATCGTAGACTAATTGAAAAGATTAACAAAG 

CTTTCAAACAGCTTCATAATAAGGGGAGATTTCAAAAAATCTCTTACAAA 

TGGTTTGGTGAAGATGTTTATAGTAAAGaA 

SEQ ID NO. 5409 
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STRAIN CJB110 

ATTGGGAACATTATC^AAAGGAAAAGAAAATTACTATTGGATTTGATAAT 
ACTTTTGTTCCTATGGGATTTGAAAGTCGTTCTGGTGACTATACCGGCTT 
TGATATTGATTTAGCTAATGCTGTTTTTAAAGAATACGGTATTTCAGTGA 
AATGGCAGCCTATTAACTGGGATATGAAAGAAACTGAACTTAATAATGGT 
AATATAGACCTTATTTGGAATGGTTATTCAAAAACGGCAGAACGTGCTAA 
AAAAGTCGCTTTTACAAACCCATATATGAATAATCATCAAGTAATTGTTA 
CTAAAACTTCATCACATATTAATAGTATTAAGGATATGAAGGGGAAAAAA 
CTAGGAGCCCAGTCGGGTTCATCTGGTTTTGATGCTTTTAACGCTAAACC 
TGATATTTTAAAAAAGTTTGTAAAAGGAAAAGAAGCAGTTCAATACGATA 
CTTTCACTCAGGCTTTGATTGATTTAAAAAATAACCGTATTGATGGTCTT 
TTGATTGATGAAGTTTATGCTAACTATTATTTAAAGCAAGAAGGAAATAT 
AAAAGCTTATTATTTTGTTAAAACTGCTTATCAAGGAGAAAATTTTGTAG 
TAGGAGCTCGTAAAGTTGATCGTAGACTAATTGAAAAGATTAACAAAGCT 
TTCAAACAGCTTCATAATAAGGGGAGATTTCAAAAAATCTCTTACAAATG 
GTTTGGTGAAGATGTTTATAGTAAAGAA 

SEQ ID NO. 5410 

STRAIN 1169NT 

ATTGGGAACATTATCAAAAGGAAAAGAAAATTACTATTGGATTTGATAA 

TACTTTTGTTCCTATGGGATTTGAAAGTCGTTCTGGTGACTATACCGGCT 

TTGATATTGATTTAGCTAATGCTGTTTTTAAAGAATACGGTATTTCAGTG 

AAATGGCAGCCTATTAACTGGGATATGAAAGAAACTGAACTCAATAATGG 

TAATATAGACCTTATTTGGAATGGTTATTCAAAAACGGCAGAACGTGCTA 

AAAAAGTCGCTTTTACAAACCCATATATGAATAATCATCAAGTAATTGTT 

ACTAAAACTTCATCACATATTAATAGTATTAAGGATATGAAGGGGAAAAA 

ACTAGGAGCCCAGTCGGGTTCATCTGGTTTTGATGCTTTTAATGCTAAAC 

CTGACATTTTAAAAAAGTTTGTAAAAGGAAAAGAAGCAGTTCAATACGAT 

ACTTTCACTCAGGCTTTGATTGATTTAAAAAATAACCGTATTGATGGTCT 

TTTGATTGATGAAGTTTATGCTAACTATTATTTAAAGCAAGAAGGAAATA 

TAAAAGCTTATTATTTTGTTAAAACTGCTTATCAAGGAGAAAATTTTGTA 

GTAGGAGCTCGCAAAGTTGATCGTAGACTAATTGAAAAGATTAACAAAGC 

TTTCAAACAGCTTCATAATAAGGGGAAATTTCAAAAAATCTCTTACAAAT 

GGTTTGGTGAAGATGTTTATAGTAAAGAA 

SEQ ID NO. 5411 

STRAIN JM9130013 
ATTGGGAACATTATC 

AAAAGGAAAAGAAAATTACTATTGGATTTGATAATACTTTTGTTCCTATG 

GGATTTGAAAGTCGTTCTGGTGACTAtACCGGCTTTGATATTGATTTAGC 

TAATGCTGTTTTTAAAGAATACGGTATTTCAGTGAAATGGCAGCCTATTA 

ACTGGGATATGAAAGAAACTGAACTTAATAATGGTAATATAGACCTTATT 

TGGAATGGTTATTCAAAAACGGCAGAACGTGCTAAAAAAGTCGCTTTTAC 

AAACCCATATATGAATAATCATCAAGTAATTGTTACTAAAACTTCATCAC 

ATATTAATAGTATTAAGGATATGAAGGGGAAAAAACTAGGAGCCCAGTCG 

GGTTCATCTGGTTTTGATGCTTTTAACGCTAAACCTGATATTTTAAAAAA 

GTTTGTAAAAGGAAAAGAAGCAGTTCAATACGATACTTTCACTCAGGCTT 

TGATTGATTTAAAAAATAACCGTATTGATGGTCTTTTGATTGATGAAGTT 

TATGCTAACTATTATTTAAAGCAAGAAGGAAATATAAAAGCTTATTATTT 

TGTTAAAACTGCTTATCAAGGAGAAAATTTTGTAGTAGGAGCTCGTAAAG 

TTGATCGTAGACTAATTGAAAAGATTAACAAAGCTTTCAAACAGCTTCAT 

AATAAGGGGAGATTTCAAAAAATCTCTTACAAATGGTTTGGTGAAGATGT 
TTATAGTAAAGAA 

SEQ ID NO. 5412 

STRAIN 2603 frame: 1 

LTHKNILLTIIFGLFMIILSACGMSNBCEMAGIDNWEHYQKEKKITIGFDNTEVPMGFESR 
SGDYTGFDIDLANAVFKEYGISVKWQPINWDMKETELNNGNIDLIWNGYSKTAERAKKVA 
FTNPYMNNHQVIVTKTSSHINSIKDMKGKKLGAQSGSSGFDAFNAKPDILKKFVKGKEAV 
QYDTFTQALI DLKNNRI DGLLI DEVYAN YYLKQEGN IKAYYFVKTAYQGEN EWGARKVD 
RRLIEKINKAFKQLHNKGRFQKISYKWFGEDVYSKE 

SEQ ID NO. 5413 

STRAIN 090 frame: 3 
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WEHYQKEKKITIGFDNTFVPMGFESRSGDYTGFDIDLANAVFKEYGISVKWQPINWDMKE 

TELNNGNIDLIWNGYSKTAERAKKVAFTNPYMNNHQVIVTKTSSHINSIKDMKGKKLGAQ 

SGSSGFDAFNAKPDILKKFVKGKEAVQYDTFTQALIDLKNNRIDGLLIDEVYANYYLKQE 

GNIKAYYFVKTAYQGENFWGARKVDRRLIEKINBCAFKQLHNKGKFQKISYKWFGEDVYS 
KE 

SEQ ID NO. 5414 

STRAIN A909 frame: 3 

WEHYQKEKKITIGFDNT FVPMGFESRSGDYTGFDI DLANAVFKEYGI S VKWQPINWDMKE 

TELNNGNIDLIWNGYSKTAERAKKVAFTNPYMNNHQVIVTKTS SHINS IKDMKGKKLGAQ 

SGSSGFDAFNAKPDILKKEVKGKEAVQYDTFTQALIDLKNNRIDGLLIDEVYANYYLKQE 

GNIKAYYFVKTAYQGENFWGARKVDRRLIEKINKAFKQLHNKGRFQKISYKWFGEDVYS 
KE 

SEQ ID NO. 5415 

STRAIN H36B frame: 3 

WEHYQKEKKITIGFDNTFVPMGFESRSGDYTGFDIDLANAVFKEYGISVKWQPINWDMKE 
TELNNGNIDLIWNGYSKTAERAKKVAFTNPYMNNHQVIVTKTSSHINSIKDMKGKKLGAQ 
SGS SGFDAFNAKPDILKKFVKGKEAVQYDT FTQALI DLKNNRI DGLLIDEVYANYYLKQE 

GNIKAYYFVKTAYQGENFWGARKVDRRLIEKINKAFKQLHNKGRFQKISYKWFGEDVYS 
KE 

SEQ ID NO. 5416 

STRAIN 18RS21 frame: 3 

WEHYQKEKKIT I GFDNTFVPMGFESRSGDYTGFDIDLANAVFKEYG IS VKWQPINWDMKE 
TELNNGN I DL I WNGYSECT7\ERAKKVAFTNPYMNNHQVIVTKTS SHINS IKDMKGKKLGAQ 
SGS SGFDAFNAKPDILKKFVKGKEAVQYDT FTQALI DLKNNRI DGLLIDEVYANYYLKQE 

GNIKAYYFVKTAYQGENFWGARKVDRRLIEKINKAFKQLHNKGRFQKISYKWFGEDVYS 
KE 

SEQ ID NO. 5417 

STRAIN M732 frame: 3 

WEHYQKEKKITIGFDNTFVPMGFESRSGDYTGF.DIDLANAVFKEYGISVKWQPINWDMKE 

TELNNGN I DLIWNGYSKTAERAKKVAFTNPYMNNHQVIVTKTS SHINS IKDMKGKKLGAQ 

SGSSGFDAFNAKPDILKKFVKGKEAVQYDTFTQALIDLKNNRI DGLLIDEVYANYYLKQE 

GNIKAYYFVKTAYQGENFWGARKVDRRLIEKINKAFKQLHNKGRFQKISYKWFGEDVYS 
KE 

SEQ ID NO. 5418 

STRAIN COH1 frame: 3 

WEHYQKEKKITIGFDNTFVPMGFESRSGDYTGFDI DLANAVFKEYGI SVKWQPINWDMKE 
TELNNGN I DLIWNGYSKTAERAKKVAFTNPYMNNHQVIVTKTSSHINSIKDMKGKKLGAQ 
SGS SGFDAFNAKPD I LKKFVKGKEAVQYDT FTQALI DLKNNRI DGLLI DEVYANYYLKQE 

GNIKAYYFVKTAYQGENFWGARKVDRRLIEKINKAFKQLHNKGRFQKISYKWFGEDVYS 
KE 

SEQ ID NO. 5419 

STRAIN M781 frame: 3 

WEHYQKEKKITIGFDNT FVPMGFESRSGDYTGFDI DLANAVFKEYGI S VKWQPINWDMKE 
TELNNGNIDLIWNGYSKTAERAKKVAFTNPYMNNHQVIVTKTSSHINSIKDMKGKKLGAQ 
SGS SGFDAFNAKPDILKKFVKGKEAVQYDTFTQALI DLKNNRI DGLLIDEVYANYYLKQE 

GNIKAYYFVKTAYQGENFWGARKVDRRLIEKINKAFKQLHNKGRFQKISYKWFGEDVYS 
KE 

SEQ ID NO. 5420 

STRAIN CJB110 frame: 3 

WEHYQKEKKITIGFDNTFVPMGFESRSGDYTGFDIDLANAVFKEYGISVKWQPINWDMKE 
TE LNNGN I DLIWNGYSKTAERAKKVAFTNPYMNNHQV I VTKTS SHINS IKDMKGKKLGAQ 
SGSSGFDAFNAKPDILKKFVKGKEAVQYDTFTQALIDLKNNRI DGLLIDEVYANYYLKQE 
GNIKAYYFVKTAYQGENFWGARKVDRRLIEKINKAFKQLHNKGRFQKISYKWFGEDVYS 
KE 

SEQ ID NO. 5421 

STRAIN 1169NT frame: 3 
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WEHYQKEKKITIGFDNTFVPMGFESRSGDYTGFDIDIJ^AVFKEYGISVKWQPINWDMKE 

TELNNGNIDLIWNGYSKTAERAKKVAFTNPYMNNHQVIVTKTSSHINSIKDMKGKKLGAQ 

SGSSGFDAFNAKPDILKKFVKGKEAVQYDTFTQALIDLKNNRIDGLLIDEVYANYYLKQE 

GNIKAYYFVKTAYQGENBVVGARKVDRRLIEKINKAFKQLHNKGKFQKISYKWFGEDVYS 
KE 

SEQ ID NO, 5422 

STRAIN JM9130013 frame: 3 

WEHYQKEBQCITIGFDNTFVPMGFESRSGDYTGFDIDLANAVBTCEYGISVKWQPINWDMICE 
TELNNGNIDLIWNGYSKTAERAKKVAFTNPYMNNHQVIVTKTSSHINSIKDMKGKKDGAQ 
SGSSGFDAFNAKPDILKKFVKGKEAVQYDTFTQALIDLKNNRIDGLLIDEVYANYYLKQE 

GNIKAYYFVKTAYQGENFWGARKVDRRLIEKINKAFKQLHNKGRFQKISYKWFGEDVYS 

KE ' " "" 

SEQ ID NO. 5501 
STRAIN 2603 

ATGCTTAAATCTTTTTTGATTTTCTTAGTTCGCTTTTACCAAAAAAATATTTCTCCAGCT 

TTCCCAGCTAGCTGTCGTTATCGTCCAACTTGCTCTACGTATATGATAGAAGCTATTCAA 

AAACATGGTCTAAAAGGTGTGTTGATGGGGATTGCACGTATTTTGCGATGTCATCCCTTA 

GCCCACGGAGGAAATGATCCTGTCCCTGATCATTTTAGCTTAAGACGTAATAAAACGGAT 
ATATCAGAT 

SEQ ID NO. 5502 

STRAIN 090 

TTCCCAGCTAGCTGTCGTTATCGTCCAACTTGCTCTACGTATATGATAGA 
AGCTATTCAAAAACATGGTCTAAAAGGTGTGTTGATGGGGATTGCACGTA 
TTTTGCGATGTCATCCCTTAGCCCACGGAGGAAATGATCCTGTCCCTGAT 
CATTTTAGCTT 

SEQ ID NO. 5503 

STRAIN A909 

TTCCCAGCTAGCTGTCGTTATCGTCCAACtTGCTCTACGTATATGATAGA 
AGCTATTCAAAAACATGGTCTAAAAGGTGTGTTGATGGGGATTGCACGTA 
TTTTGCGATGTCATCCCTTAGCCCACGGAGGAAATGATCCTGTCCCTGAT 
CATTTTAgCTTAAGACGTAATAAAACGGATATA 

SEQ ID NO. 5504 

STRAIN H36B 

TTCCCAGCTAGCTGTCGTTATCGTCCaACTTGCTCTACGTATATGATAGA 
AGCTATTCAAAAACATGGTCTAAAAGGTGTTCTGATGGGGATTGCACGTA 
TTTTGCGATGTCATCCCTTAGCCCACGGAGGAAATGATCCTGTCCCTGAT 
CATTTTAGCTTAAGACGTAATAAAACGGATATATCAGAT 

SEQ ID NO. 5505 

STRAIN 18RS21 

TTCCCAGCTAGCTGTCGTTATCGTCCAACTTGCTCTACGTATATGATAGA 
AGCTATTCAAAAACATGGTCTAAAAGGTGTGTTGATGGGGATTGCACGTA 
TTTTGCGATGTCATCCCTTAGCCCACGGAGGAAATGATCCTGTCCCTGAT 
CATTTTAGCTTAAGACGTAATAAAACGGATATATCAGAT 

SEQ ID NO. 5506 

STRAIN M732 

TTCCCAGCTAGCTGTCGTTATCGTCCAACTTGCTCTACGTATATGATAGA 
AGCTATTCAAAAACATGGTCTAAAAGGTGTGTTGATGGGGATTGCACGTA 
TTTTGCGATGTCATCCCTTAgCCCACGGAGGAAATGATCCTGTCCCTGAT 
CATTTTAGCTT AAGACGTAATAAAACGGATATATCAGAT 

SEQ ID NO. 5507 

STRAIN COH1 

TTCCCAGCTAGCTGTCGTTATCGTCCAACTTGCTCTACGTATATGATAGAAGCTATTCAA 
AAACATGGTCTAAAAGGTGTGTTGATGGGGATTGCACGTATTTTGCGATGTCATCCCTTA 
GCCCACGGAGGAAATGAtCCTGtCCCTGATCATTTTAGCT 

SEQ ID NO. 5508 
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STRAIN M781 

TTCCCAGCTAGCTGTCGTTATCGTCCAACTTGCTCTACGTATATGATAGA 
AGCTATTCAAAAACATGGTCTAAAAGGTGTGTTGATGGGGATTGCACGTA 
TTTTGCGATGTCATCCCTTAGCCCACGGAGGAAATGATCCTGTCCCTGAT 
CATTTTAGCTTAAGACGTAATAAAACGGATATATCAGAT 

SEQ ID NO. 5509 

STRAIN CJB110 

TTCCCAGCTAGCTGTCGTTATCGTCCAACTTGCTCTACGTATATGATAGA 
AGCTATTCAAAAACATGGTCTAAAAGGTGTGTTGATGGGGATTGCACGTA 
TTTTGCGATGTCATCCCTTAGCCCACGGAGGAAATGATCCTGTCCCTGAT 
CATTTTAGCTTAAGACGTAATAAAACGGATATATCAGAT 

SEQ ID NO. 5510 

STRAIN 1169NT 

TTCCCAGCTAGCTGTCGTTATCGTCCAACTTGCTCTACGTATATGATAGA 
AGCTATTCAAAAACATGGTCTAAAAGGTGTGGTGATGGGGATTGCACGTA 
TTTTGCGATGTCATCCCTTAGCCCACGGAGGAAATGATCCTGTCCCTGAT 
TATTTTAGCTTAAGACGTAATAAAACGGATATATCAGAT 

SEQ ID NO. 551X 

STRAIN JM9130013 

TTCCCAGCTAGCTGTCGTTATCGTCCAACTTGCTCTACGTATATGATAGA 
AGCTATTCAAAAACATGGTCTAAAAGGTGTTCTGATGGGGATTGCACGTA 
TTTTGCGATGTCATCCCTTAGCCCACGGAGGAAATGATCCTGTCCCTGAT 
CATTTTAGCTTAAGACGTAATAAAACGGATATATCAGAT 

SEQ ID NO. 5512 

STRAIN 2603 frame: 1 

MLKSFLIFLVRFYQKNISPAFPASCRYRPTCSTYMIEAIQKHGLKGVLMGIARILRCHPL 
AHGGNDPVPDHFSLRRNKTDISD 

SEQ ID NO. 5513 

STRAIN 090 frame: 1 

FPASCRYRPTCSTYMIEAIQKHGLKGVLMGIARILRCHPLAHGGNDPVPDHFS 

SEQ ID NO. 5514 

STRAIN A909 frame: 1 

FPASCRYRPTCSTYMIEAIQKHGLKGVLMGIARILRCHPLAHGGNDPVPDHFSLRRNKTD 
I 

SEQ ID NO. 5515 

STRAIN H36B frame: 1 

FPASCRYRPTCSTYMIEAIQKHGLKGVLMGIARILRCHPLAHGGNDPVPDHFSLRRNKTD 
ISD 

SEQ ID NO. 5516 

STRAIN 18RS21 frame: 1 

FPASCRYRPTCSTYMIEAIQKHGLKGVLMGIARILRCHPLAHGGNDPVPDHFSLRRNKTD 
ISD 

SEQ ID NO. 5517 

STRAIN M732 frame: 1 

FPASCRYRPTCSTYMIEAIQKHGLKGVLMGIARILRCHPLAHGGNDPVPDHFSLRRNKTD 
ISD 

SEQ ID NO. 5518 

STRAIN COH1 frame: 1 

FPASCRYRPTCSTYMIEAIQKHGLKGVLMGIARILRCHPLAHGGNDPVPDHFS 

SEQ ID NO. 5519 
STRAIN M781 frame: 1 

FPASCRYRPTCSTYMIEAIQKHGLKGVLMGIARILRCHPLAHGGNDPVPDHFSLRRNKTD 
ISD 
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SEQ ID NO. 5520 
STRAIN CJB110 frame: 1 

FPASCRYRPTCSTYMIEAIQKHGLKGVLMGIARILRCHPLAHGGNDPVPDHFSLRRNKTD 
ISD 

SEQ ID NO. 5521 

STRAIN 1169NT frame: 1 

FPASCRYRPTCSTYMIEAIQKHGLKGWMGIARILRCHPLAHGGNDPVPDYFSLRRNKTD 
ISD 

SEQ ID NO. 5522 

STRAIN JM9130013 frame: 1 

FPASCRYRPTCSTYMIEAIQKHGLKGVLMGIARILRCHPLAHGGNDPVPDHFSLRRNKTD 
ISD 

SEQ ID NO. 5601 
STRAIN 2603 

aagaagcttacttttatttgggatttagatgggacattaatagattcgta 
tgtaccaattatggaagctcttgaagaaacctatcgtcattttggtttaa 
tatttgataaagaattaatccatgaatatattttacaggaatcagtgggg 
aaattattggtaaacctttcagaggaagagcaaatacctcatgaaaaact 
gaaagcatattttacaaaagaacaagaaagtcgagattctaaaatacatt 
taatgccatatgcaaaagagattttagaatggaccaaagaacaagatatc 
cccaattttatgtatacacataaaggagcaagtacgcattcagtgttgga 
aaccttgcagatctctcattattttgatgaaattttaactggtgtttcgg 
gattcgagcgaaaaccacatccacaagggattaattatttagttaaacga 
tattctttagataaatcaatgacttattacataggagatcgtccactaga 
tttggaggttgctcaaaatgctggtataaaatccataaacttaaggttag 
agaattccaaagaaaactataatatttcaagtctcaaagatataatatca 
cttgatttcactcgtttggat 

SEQ ID NO. 5602 
STRAIN COH1 

AAGAAGCTTACTTTTATTTGGGATTTAGATGGGACATTAA 

TAGATTCGTATGTACCAATTATGGAAGCTCTTGAAGAAACCTATCGTCAT 

TTTGGCTTAATATTTGATAAAGAATTAATCCATGAATATATTTTACAGGA 

ATCAGTGGGGCAATTATTGGTAAACCTTTCAGAGGAAGAGCAAATACCTC 

ATGAAAAACTGAAAGCATATTTTACAAAAGAACAAGAAAGTCGAGATTCT 

AAAATACATTTAATGCCATATGCAAAAGAGATTTTAGAATGGACCAAAGA 

ACAAGATATTCCCAATTTTATGTATACACATAAAGGAGCAAGTACGCATT 

CAGTGTTGGAAACCTTGCAGATCTCTCATTATTTTGATGAAATTTTAACT 

GGTGTTTCGGGATTCGAGCGAAAACCACATCCACAAGGGATTAATTATTT 

AGTTAAACGATATTCTTTAGATAAATCAATGACTTATTACATAGGAGATC 

GTCCACTAGATTTGGAGGTTGCTCAAAATGCTGGTATAAAATCCATAAAC 

TTAAGGTTAGAGAATTCCAAAGAAAACTATAATATTTCAAGTCTCAAAGA 

TATAATATCACTTGATTTCACTCGTTTGGAT 

SEQ ID NO. 5603 

STRAIN A909 

AAGAAGCTTACTTTTATTTGGGATTTAGATGGGACATTAAT 

AGATTCGTATGTACCAATTATGGAAGCTCTTGAAGAAACCTATCGTCATTTTGGTTTAAT 
ATTTGATAAAGAATTAATCCATGAATATATTTTACAGGAATCAGTGGGGAAATTATTGGT 
AAACCTTTCAGAGGAAGAGCAAATACCTCATGAAAAACTGAAAGCATATTTTACAAAAGA 
ACAAGAAAGTCGAGATTCTAAAATACATTTAATGCCATATGCAAAAGAGATTTTAGAATG 
GACCAAAGAACAAGATATCCCCAATTTTATGTATACACATAAAGGAGCAAGTACGCATTC 
AGTGTTGGAAACCTTGCAGATCTCTCATTATTTTGATGAAATTTTAACTGGTGTTTCGGG 
ATTCGAGCGAAAACCACATCCACAAGGGATTAATTATTTAGTTAAACGATATTCTTTAGA 
TAAATCAATGACTTATTACATAGGAGATCGTCCACTAGATTTGGAGGTTGCTCAAAATGC 
TGGTATAAAATCCATAAACTTAAGGTTAGAGAATTCCAAAGAAAACTATAATATTTCAAG 
TCTCAAAGATATAATATCACTTGATTTCACTCGT 

SEQ ID NO. 5604 

STRAIN H36B 
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AAGAAGCTTACTTTTATTTGGGATTTAGATGGGACATTAATAGATTCG 

TATGTACCAATTATGGAAGCTCTTGAAGAAACCTATCGTCATTTTGGTTTAATATTTGAT 

A7VAGAATTAATCCATGAATATATTTTACAGGAATCAGTGGGGAAATTATTGGTAAACCTT 

TCAGAGGAAGAGCAAATACCTCATGAAAAACTGAAAGCATATTTTAGAAAAGAACAAGAA 

AGTCGAGATTCT/^AAATACATTTAATGCCATATGCAAAAGAGATTTTAGAATGGACCAAA 

GAACAAGATATCCCCAATTTTATGTATACACATAAAGGAGCAAGTACGCATTCAGTGTTG 

GAAACCTTGCAGATCTCTCATTATTTTGATGAAATTTTAACTGGTGTTTCGGGATTCGAG 

CGAAAACCACATCCACAAGGGATTAATTATTTAGTTAAACGATATTCTTTAGATAAATCA 

ATGACTTATTACATAGGAGATCGTCCACTAGATTTGGAGGTTGCTCAAAATGCTGGTATA 

AAATCCATAAACTTAAGGTTAGAGAATTCCAAAGAAAACTATAATATTTCAAGTCTCAAA 

GATATAATATCACTTGATTTCACTCGTTTGGAT 

SEQ ID NO. 5605 

STRAIN 18RS21 

AAGAAGCTTACTTTTATTTGGGATTTAGATGGGACATTAATAGATT 

CGTATGTACCAATTATGGAAGCTCTTGAAGAAACCTATCGTCATTTTGGTTTAATATTTG 
ATAAAGAATTAATCCATGAATATATTTTACAGGAATCAGTGGGGAAATTATTGGTAAACC 
TTTCAGAGGAAGAGCAAATACCTCATGAAAAACTGAAAGCATATTTTACAAAAGAACAAG 
AAAGTCGAGATTCTAAAATACATTTAATGCCATATGCAAAAGAGATTTTAGAATGGACCA 
AAGAACAAGATATCCCCAATTTTATGTATACACATAAAGGAGCAAGTACGCATTCAGTGT 
TGGAAACCTTGCAGATCTCTCATTATTTTGATGAAATTTTAACTGGTGTTTCGGGATTCG 
AGCGAAAACCACATCCACAAGGGATTAATTATTTAGTTAAACGATATTCTTTAGATAAAT 
CAATGACTTATTACATAGGAGATCGTCCACTAGATTTGGAGGTTGCTCAAAATGCTGGTA 
TAAAATCCATAAACTTAAGGTTAGAGAATTCCAAAGAAAACTATAATATTTCAAGTCTCA 
AAGATATAATATCACTTGATTTCACTCGTTTGGAT 

SEQ ID NO. 5606 

STRAIN M732 

AAGAAGCTTACTTTTATTTGGGATTTAGATGGGACATTAATAGAT 

TCGTATGTACCAATTATGGAAGCTCTTGAAGAAACCTATCGTCATTTTGGCTTAATATTT 
GATAAAGAATTAATCCATGAATATATTTTACAGGAATCAGTGGGGCAATTATTGGTAAAC 
CTTTCAGAGGAAGAGCAAATACCTCATGAAAAACTGAAAGCATATTTTACAAAAGAACAA 
GAAAGTCGAGATTCTAAAATACATTTAATGCCATATGCAAAAGAGATTTTAGAATGGACC 
AAAGAACAAGATATTCCCAATTTTATGTATACACATAAAGGAGCAAGTACGCATTCAGTG 
TTGGAAACCTTGCAGATCTCTCATTATTTTGATGAAATTTTAACTGGTGTTTCGGGATTC 
GAGCGAAAACCACATCCACAAGGGATTAATTATTTAGTTAAACGATATTCTTTAGATAAA 
TCAATGACTTATTACATAGGAGATCGTCCACTAGATTTGGAGGTTGCTCAAAATGCTGGT 
ATAAAATCCATAAACTTAAGGTTAGAGAATTCCAAAGAAAACTATAATATTTCAAGTCTC 
AAAGATATAATATCACT TGATTTC ACTCGTTTGGAT 

SEQ ID NO. 5607 
STRAIN CJB110 

AAGAAGCTTACTTTTATTTGGGATTTAGATGGGACATT 

AATAGATTCGTATGTACCAATTATGGAAGCTCTTGAAGAAACCTATCGTCATTTTGGCTT 
AATATTTGATAAAGAATTAATCCATGAATATATTTTACAGGAATCAGTGGGGCAATTATT 
GGTAAACCTTTCAGAGGAAGAGCAAATACCTCATGAAAAACTGAAAGCATATTTTACAAA 
AGAACAAGAAAGTCGAGATTCTAAAATACATTTAATGCCATATGCAAAAGAGATTTTAGA 
ATGGACCAAAGAACAAGATATCCCCAATTTTATGTATACACATAAAGGAGCAAGTACGCA 
TTCAGTGTTGGAAACCTTGCAGATCTCTCATTATTTTGATGAAATTTTAACTGGTGTTTC 
TGGATTCGAGCGAAAACCACATCCACAAGGGATTAATTATTTAGTTAAACGATATTCTTT 
AGATAAATCAATGACTTATTACATAGGAGATCGTCCCCTAGATTTGGAGGTTGCTCAAAA 
TGCTGGTATAAAATCCATAAACTTAAGGTTAGAGAATTCCAAAGAAAACTATAATATTTC 
AAGTCTCAAGGATATAATATCACTTGATTTCACTCGTT 

SEQ ID NO. 5608 

STRAIN 1169NT 

aAGAAGCTTACTTTTATTTGGGATTTAGATGGGACATTAATAGATTCGTATGTACCAATTA 

TAGAAGCTCTTGAAGAAACCTATCGTCATTTTGGCTTAATATTTGATAAAGAATTAATCC 

ATGAATATATTTTACAGGAATCAGTGGGGAAATTATTGGTAAACCTTTCAGAGGAAGAGC 

AAATACCTCATGAAAAACTGAAAGCATATTTTACAAAAGAACAAGAAAGTCGAGATTCTA 

AAATACATTTAATGCCATACGCAAAAGAGATTTTAGAATGGACCAAAGAACAAGATATCC 

CCAATTTTATGTATACACATAAAGGAGCAAGTACGCATTCAGTGTTGGAAACCTTGCAGA 

TCTCTCATTATTTTGATGAAATTTTAACTGGTGTTTCGGGATTCGAGCGAAAACCACATC 

CACAAGGGATTAATTATTTAGTTAAACGATATTCTTTAGATAAATCAATGACTTATTACA 
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TAGGAGATCGTCCCCTAGATTTGGAGGTTGCTCAAAATGCTGGTATAAAATCCATAAACT 
TAAGGTTAGAGAATT CCAAAGAAAACTATAAT ATTT CAAGTCTCAAGGATATAATATCAC 
TTGATTTCACTCGTTTGGAT 

SEQ ID NO. 5609 

STRAIN JM9130013 

AAGAAGCTTACTTTTATTTGGGATTTAGATGGGACATTAATAGA 

TTCGTATGTACCAATTATGGAAGCTCTTGAAGAAACCTATCGTCATTTTGGTTTAATATT 
TGATAAAGAATTAATCCATGAATATATTTTACAGGAATCAGTGGGGAAATTATTGGTAAA 
CCTTTCAGAGGAAGAGCAAATACCTCATGAAAAACTGAAAGCATATTTTACAAAAGAACA 
AGAAAGTCGAGATTCTAAAATACATTTAATGCCATATGCAAAAGAGATTTTAGAATGGAC 
CAAAGAACAAGATATCCCCAATTTTATGTATACACATAAAGGAGCAAGTACGCATTCAGT 
GTTGGAAACCTTGCAGATCTCTCATTATTTTGATGAAATTTTAACTGGTGTTTCGGGATT 
CGAGCGAAAACCACATCCACAAGGGATTAATTATTTAGTTAAACGATATTCTTTAGATAA 
ATCAATGACTTATTACATAGGAGATCGTCCACTAGATTTGGAGGTTGCTCAAAATGCTGG 
TATAAAATCCATAAACTTAAGGTTAGAGAATTCCAAAGAAAACTATAATATTTCAAGTCT 
CAAAGATATAATATCACTTGATTTCACTCGT 

SEQ ID NO. 5610 

STRAIN 090 

AAGAAGCTTACTTTTATTTGG 

GATTTAGATGGGACATTAATAGATTCGTAT GT ACCAAT TATGGAAGCTCT 
TGAAGAAACCTATCGTCATTTTGGCTTAATATTTGATAAAGAATTAATCC 
ATGAATATATTTTACAGGAATCAGTGGGGCAATTATTGGTAAACCTTTCA 
GAGGAAGAGCAAATACCTCATGAAAAACTGAAAGCATATTTTACAAAAGA 
ACAAGAAAGTCGAGATTCTAAAATACATTTAATGCCATATGCAAAAGAGA 
TTTTAGAATGGACCAAAGAACAAGATATCCCCAATTTTATGTATACACAT 
AAAGGAGCAAGTACGCATTCAGTGTTGGAAACCTTGCAGATCTCTCATTA 
TTTTGATGAAATTTTAACTGGTGTTTCTGGATTCGAGCGAAAACCACATC 
CACAAGGGATTAATTATTTAGTTAAACGATATTCTTTAGATAAATCAATG 
ACTTATTACATAGGAGATCGTCCCCTAGATTTGGAGGTTGCTCAAAATGC 
TGGTATAAAATCCATAAACTTAAGGTTAGAGAATTCCAAAGAAAACTATA 
ATATTTCAAGTCTCAAGGATATAATATCACTTGATTTCACTCGT 

SEQ ID NO. 5611 

STRAIN M781 

AAGAAGCTTACTTTTATTTGGGATTTAGATGGGACATTAATAGATTCGT 

ATGTACCAATTATGGAAGCTCTTGAAGAAACCTATCGTCATTTTGGCTTA 

ATATTTGATAAAGAATTAATCCATGAATATATTTTACAGGAATCAGTGGG 

GCAATTATTGGTAAACCTTTCAGAGGAAGAGCAAATACCTCATGAAAAAC 

TGAAAGCATATTTTACAAAAGAACAAGAAAGTCGAGATTyTAAAATACAT 

TTAATGCCATATGCAAAAGAGATTTTAGAATGGACCAAAGAACAAGATAT 

TCCCAATTTTATGTATACACATAAAGGAGCAAGTACGCATTCAGTGTTGG 

AAACCTTGCAGATCTCTCATTATTTTGATGAAATTTTAACTGGTGTTTCG 

GGATTCGAGCGAAAACCACATCCACAAGGGATTAATTATTTAGTTAAACG 

ATATTCTTTAGATAAATCAATGACTTATTACATAGGAGATCGTCCACTAG 

ATTTGGAGGTTGCTtAAAATGCTGGTATAAAATCCATAAACTTAAGGTTA 

GAGAATTCCAAAGAAAACTATAATATTTCAAGTCTCAAAGATATAATATC 

ACTTGATTTCACTCGT 

SEQ ID NO. 5612 
STRAIN 2603 frame: 1 

KKLTFIWDLDGTLIDSYVPIMEALEETYRHFGLIFDKELIHEYILQESVGKLLVNLSEEE 
QIPHEKLKAYFTKEQESRDSKIHLMPYAKEILEWTKEQDIPNFMYTHKGASTHSVLETLQ 
ISHYFDEILTGVSGFERKPHPQGINYLVKRYSLDKSMTYYIGDRPLDLEVAQNAGIKSIN 
LRLENSKENYNISSLKDIISLDFTRLD 

SEQ ID NO. 5613 

STRAIN A909 frame: 1 

KKLTFIWDLDGTLIDSYVPIMEALEETYRHFGLIFDKELIHEYILQESVGKLLVNLSEEE 
QIPHEKLKAYFTJCEQESRDSKIHLMPYAKEILEWTKEQDIPNFMYTHKGASTHSVLETLQ 
ISHYFDEILTGVSGFERKPHPQGINYLVKRYSLDKSMTYYIGDRPLDLEVAQNAGIKSIN 
LRLENSKENYNISSLKDIISLDFTR 
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SEQ ID NO. 5614 

STRAIN H36B frame: 1 

KKLTFIWDLDGTLIDSYVPIMEALEETYRHFGLIFDBCELIHEYILQESVGKLLVNLSEEE 
QIPHEKLKAYFTBCEQESRDSKIHLMPYAKEILEWTKEQDIPNFMYTHKGASTHSVLETLQ 
ISHYFDEILTGVSGFERKPHPQGINYLVKRYSLDKSMTYYIGDRPLDLEVAQNAGIKSIN 
LRLENSKENYNISSLKDIISLDFTRLD 

SEQ ID NO. 5615 

STRAIN 18RS21 frame: 1 

KKLTFIWDLDGTLIDSYVPIMEALEETYRHFGLIFDKELIHEYILQESVGKLLVNLSEEE 
QIPHEKLKAYFTKEQESRDSKIHLMPYAKEILEWTKEQDIPNFMYTHKGASTHSVLETLQ 
ISHYFDEILTGVSGFERKPHPQGINYLVKRYSLDKSMTYYIGDRPLDLEVAQNAGIKSIN 
LRLENSKENYNISSLKDIISLDFTRLD 

SEQ ID NO. 5616 

STRAIN M732 frame: 1 

KKLTFIWDLDGTLIDSYVPIMEALEETYRHFfcLIFDKELIHEYILQESVGQLLVNLSEEE 
QIPHEKLKAYFTKEQESRDSKIHLMPYAKEILEWTKEQDIPNFMYTHKGASTHSVLETLQ 
ISHYFDEILTGVSGFERKPHPQGINYLVKRYSLDKSMTYYIGDRPLDLEVAQNAGIKSIN 
LRLENSKENYNISSLKDIISLDFTRLD 

SEQ ID NO. 5617 

STRAIN COH1 frame: 1 

KKLTFIWDLDGTLIDSYVPIMEALEETYRHFGLIFDKELIHEYILQESVGQLLVNLSEEE 
QIPHEKLKAYFTKEQESRDSKIHLMPYAKEILEWTKEQDIPNFMYTHKGASTHSVLETLQ 
ISHYFDEILTGVSGFERKPHPQGINYLVKRYSLDKSMTYYIGDRPLDLEVAQNAGIKSIN 
LRLENSKENYNISSLKDIISLDFTRLD 

SEQ ID NO. 5618 

STRAIN CJB110 frame: 1 

KKLTFIWDLDGTLIDSYVPIMEALEETYRHFGLIFDKELIHEYILQESVGQLLVNLSEEE 
QIPHEKLKAYFTKEQESRDSKIHLMPYAKEILEWTKEQDIPNFMYTHKGASTHSVLETLQ 
ISHYFDEILTGVSGFERKPHPQGINYLVKRYSLDKSMTYYIGDRPLDLEVAQNAGIKSIN 
LRLENSKENYNISSLKDIISLDFTR 

SEQ ID NO. 5619 

STRAIN 1169NT frame: 1 

KKLTFIWDLDGTLIDSYVPIIEALEETYRHFGLIFDKELIHEYILQESVGKLLVNLSEEE 
QIPHEKLKAYFTKEQESRDSKIHLMPYAKEILEWTKEQDIPNFMYTHKGASTHSVLETLQ 
ISHYFDEILTGVSGFERKPHPQGINYLVKRYSLDKSMTYYIGDRPLDLEVAQNAGIKSIN 
LRLENSKENYNISSLKDIISLDFTRLD 

SEQ ID NO. 5620 

STRAIN JM9130013 frame: 1 

KKLTFIWDLDGTLIDSYVPIMEALEETYRHFGLIFDKELIHEYILQESVGKLLVNLSEEE 
QIPHEKLKAYFTKEQESRDSKIHLMPYAKEILEWTKEQDIPNFMYTHKGASTHSVLETLQ 
ISHYFDEILTGVSGFERKPHPQGINYLVKRYSLDKSMTYYIGDRPLDLEVAQNAGIKSIN 
LRLENSKENYNISSLKDIISLDFTR 

SEQ ID NO. 5621 

STRAIN 090 frame: 1 

KKLTFIWDLDGTLIDSYVPIMEALEETYRHFGLIFDKELIHEYILQESVGQLLVNLSEEE 
QIPHEKLKAYFTKEQESRDSKIHLMPYAKEILEWTKEQDIPNFMYTHKGASTHSVLETLQ 
ISHYFDEILTGVSGFERKPHPQGINYLVKRYSLDKSMTYYIGDRPLDLEVAQNAGIKSIN 
LRLENSKENYNISSLKDIISLDFTR 

SEQ ID NO. 5622 
STRAIN M781 frame: 1 

KKLTFIWDLDGTLIDSYVPIMEALEETYRHFGLIFDKELIHEYILQESVGQLLVNLSEEE 
QIPHEKLKAYFTKEQESRDXKIHLMPYAKEILEWTKEQDIPNFMYTHKGASTHSVLETLQ 
ISHYFDEILTGVSGFERKPHPQGINYLVKRYSLDKSMTYYIGDRPLDLEVAQNAGIKS IN 
LRLENSKENYNISSLKDI ISLDFTR 

SEQ ID NO: 5701 
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STRAIN 2603 

ATGCTTATGACAAAAATAATAGGACTGACAGGAGGGATAGCTTCT 

GGAAAGTCAACGGTAACAAAAATAATACGAGAATCAGGTTTTAAAGTCATAGATGCGGAT 
CAAGTGGTTCATAAATTGCAAGCTAAGGGTGGGAAACTTTACCAAGCTTTATTAGAATGG 
TTGGGTCCCGAGATACTTGATGCTGATGGTGAGTTGGATAGACCAAAGCTTTCTCAAATG 
ATTTTTGCTAATCCAGACAATATGAAGACATCAGCTAGGCTACAAAATAGTATCATTCGT 
CAAGAGTTAGCATGTCAGCGCGACCAATTAAAACAAACAGAAGAGATATTTTTCATGGAT 
ATTCCTTTATTGATTGAAGAAAAGTATATAAAATGGTTTGATGAGATTTGGTTGGTATTT 
GTTGATAAAGAAAAACAATTACAACGATTAATGGCCCGTAACAACTACAGTCGAGAAGAA 
GCAGAATTACGACTTTCACACCAAATGCCTTTAACAGATAAAAAAAGTTTCGCTAGTCTT 

ATTATTGACAATAATGGTGATTTAATAACTTTAAAAGAGCAAATATTGGATGCTCTTCAA 
CGTTTA 

SEQ ID NO: 5702 

STRAIN 090 

AAGTCAACGGTAACAAAAATAATACGAGAATCAG 

GTTTTAAAGTCATAGATGCGGATCAAGTGGTTCATAAATTGCAAGCTAAG 
GGTGGGAAACTTTACCAAGCTTTATTAGAATGGTTGGGTCCCGAGATACT 
TGATGCTGATGGTGAGTTGGATAGACCAAAGCTTTCTCAAATGATTTTTG 
CTAATCCAGACAATATGAAGACATCAGCTAGGCTACAAAATAGTATCATT 
CGTCAAGAGTTAGCATGTCAGCGCGACCAATTAAAACAAACAGAAGAGAT 
ATTTTTCGTGGATATTCCTTTATTGATTGAAGAAAAGTATATAAAATGGT 
TTGATGAGATTTGGTTGGTATTTGTTGATAAAGAAAAACAATTACAACGA 
TTAATGGCCCGTAACAACTACAGTCGAGAAGAAGCAGAATTACGACTTTC 
ACACCAAATGCCTTTAACAGATAAAAAAAGTTTCGCTAGTCTTATTATTA 
ATAATAATGGTGATTTAATAACTTTAAAAGAGCAAATATTGGATGCTCTT 
CAACGTTTA 

SEQ ID NO: 5703 

STRAIN A909 

AAGTCAACGGTAACAAAAATAATACGAGAATCAG 

GTTTTAAAGTCATAGATGCGGATCAAGTGGTTCATAAATTGCAAGCTAAG 
GGTGGGAAACTTTACCAAGCTTTATTAGAATGGTTGGGTCCCGAGATACT 
TGATGCTGATGGTGAGTTGGATAGACCAAAGCTTTCTCAAATGATTTTTG 
CTAATCCAGACAATATGAAGACATCAGCTAGGCTACAAAATAGTATCATT 
CGTCAAGAGTTAGCATGTCAGCGCGACCAATTAAAACAAACAGAAGAGAT 
ATTTTTCATGGATATTCCTTTATTGATTGAAGAAAAGTATATAAAATGGT 
TTGATGAGATTTGGTTGGTATTTGTTGATAAAGAAAAACAATTACAACGA 
TTAATGGCCCGTaACAACTACAGTCGAGAAGAAGCAGAATTACGACTTTC 
ACACCAAATGCCTTTAACAGATAAAAAAAGTTTCGCTAGTCTTATTATTG 
ACAATAATGGTGATTTAATAACTTTAAAAGAGCAAATATTGGATGCTCTT 
CAACGTTTA 

SEQ ID NO: 5704 

STRAIN H36B 

AAGTCAACGGTAACAAAAATAATACGAGAATCAGG 

TTTTAAAGTCATAGATGCGGATCAAGTGGTTCATAAATTGCAAGCTAAGG 

GTGGGAAACTTTACCAAGCTTTATTAGAATGGTTGGGTCCCGAGATACTT 

GATGCTGATGGTGAGTTGGATAGACCAAAGCTTTCTCAAATGATTTTTGC 

TAATCCAGACAATATGAAGACATCAGCTAGGCTACAAAATAGTATCATTC 

GTCAAGAGTTAGCATGTCAGCGCGACCAATTAAAACAAACAGAAGAGATA 

TTTTTCATGGATATTCCTTTATTGATTGAAGAAAAGTATATAAAATGGTT 

TGATGAGATTTGGTTGGTATTTGTTGATAAAGAAAAACAATTACAACGAT 

TAATGGCCCGtAACAACTACAGTCGAGAAGAAGCGGAATTACGACTTTCA 

CACCAAATACCTTTAACAGATAAAAAAAGTTTCGCTAGTCTTATTATTGA 

TAATAATGGTGATTTAATAACTTTAAAAGAGCAAATGTTGGATGCTCTTC ' 

AACGTTTA 

SEQ ID NO: 5705 
STRAIN 18RS21 

AAGTCAACGGTAACAAAAATAATACGAGAATCAGG 

TTTTAAAGTCATAGATGCGGATCAAGTGGTTCATAAATTGCAAGCTAAGG 
GTGGGAAACTTTACCAAGCTTTATTAGAATGGTTGGGTCCCGAGATACTT 
GATGCTGATGGTGAGTTGGATAGACCAAAGCTTTCTCAAATGATTTTTGC 
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TAATCCAGACAATATGAAGACATCAGCTAGGCTACAAAATAGTATCATTC 
GTCAAGAGTTAGCATGTCAGCGCGACCAATTAAAACAAACAGAAGAGATA 
TTTTTCATGGATATTCCTTTATTGATTGAAGAAAAGTATATAAAATGGTT 
TGATGAGATTTGGTTGGTATTTGTTGATAAAGAAAAACAATTACAACGAT 
TAATGGCCCGTAACAACTACAGTCGAGAAGAAGCAGAATTACGACTTTCA 
CACCAAATGCCTTTAACAGATAAAAAAAGTTTCGCTAGTCTTATTATTGA 
CAATAATGGTGATTTAATAACTTTAAAAGAGCAAATATTGGATGCTCTTC 
AACGTTTA 

SEQ ID NO: 5706 • 
STRAIN M732 

AAGTCAACGGTAACAAAAATAATACGAGAATCAGGTT 

TTAAAGTCATAGATGCGGATCAAGTGGTTCATAAATTGCAAGCTAAGGGT 

GGGAAACTTTACCAAGCTTTATTAGAATGGTTGGGTCCCGAGATACTTGA 

TGCTGATGGTGAGTTGGATAGACCAAAGCTTTCTCAAATGATTTTTGCTA 

ATCCAGACAATATGAAGACATCAGCTAGGCTACAAAATAGTATCATTCGT 

CAAGAGTTAGCATGTCAGCGCGACCAATTAAAACAAACAGAAGAGATATT 

TTTCATGGATATTCCTTTATTGATTGAAGAAAAGTATATAAAATGGTTTG 

ATGAGATTTGGTTGGTATTTGTTGATAAAGAAAAACAATTACAACGATTA 

ATGGCCCGTAACAACTACAGTCGAGAAGAAGCAGAATTACGACTTTCACA 

CCAAATGCCTTTAACAGATAAAAAAAGTTTCGCTAGTCTTATTATTGACA 

ATAATGGTGATTTAATAACTTTAAAAGAGCAAATATTGGATGCTCTTCAA 

CGTTTA 

SEQ ID NO: 5707 

STRAIN COH1 

AAGTCAACGGTAACAAAAATAATACGAGAATCAGGT 

TTTAAAGTCATAGATGCGGATCAAGTGGTTCATAAATTGCAAGCTAAGGG 
TGGGAAACTTTACCAAGCTTTATTAGAATGGTTGGGTCCCGAGATACTTG 
ATGCTGATGGTGAGTTGGATAGACCAAAGCTTTCTCAAATGATTTTTGCT 
AATCCAGACAATATGAAGACATCAGCTAGGCTACAAAATAGTATCATTCG 
TCAAGAGTTAGCATGTCAGCGCGACCAATTAAAACAAACAGAAGAGATAT 
TTTTCATGGATATTCCTTTATTGATTGAAGAAAAGTATATAAAATGGTTT 
GATGAGATTTGGTTGGTATTTGTTGATAAAGAAAAACAATTACAACGATT 
AATGGCCCGTaACAACTACAGTCGAGAAGAAGCAGAATTACGACTTTCAC 
ACCAAATGCCTTTAACAGATAAAAAAAGTTTCGCTAGTCTTATTATTGAC 
AATAATGGTGATTTAATAACTTTAAAAGAGCAAATATTGGATGCTCTTCA 
ACGTTTA 

SEQ ID NO: 5708 

STRAIN M781 

AAGTCAAQGGTAACAAAAATAATACGAGAATCAGG 

TTTTAAAGTCATAGATGCGGATCAAGTGGTTCATAAATTGCAAGCTAAGG 
GTGGGAAACTTTACCAAGCTTTATTAGAATGGTTGGGTCCCGAGATACTT 
GATGCTGATGGTGAGTTGGATAGACCAAAGCTTTCTCAAATGATTTTTGC 
TAATCCAGACAATATGAAGACATCAGCTAGGCTACAAAATAGTATCATTC 
GTCAAGAGTTAGCATGTCAGCGCGACCAATTAAAACAAACAGAAGAGATA 
TTTTTCATGGATATTCCTTTATTGATTGAAGAAAAGTATATAAAATGGTT 
TGATGAGATTTGGTTGGTATTTGTTGATAAAGAAAAACAATTACAACGAT 
TAATGGCCCGTAACAACTACAGTCGAGAAGAAGCAGAATTACGACTTTCA 
CACCAAATGCCTTTAACAGATAAAAAAAGTTTCGCTAGTCTTATTATTGA 
CAATAATGGTGATTTAATAACTTTAAAAGAGCAAATATTGGATGCTCTTC 
AACGTTTA 

SEQ ID NO: 5709 

STRAIN CJB110 

AAGTCAACGGTAACAAAAATAATACGAGAA 

TCAGGTTTTAAAGTCATAGATGCGGATCAAGTGGTTCATAAATTGCAAGC 
TAAGGGTGGGAAACTTTACCAAGCTTTATTAGAATGGTTGGGTCCCGAGA 
TACTTGATGCTGATGGTGAGTTGGATAGACCAAAGCTTTCTCAAATGATT 
TTTGCTAATCCAGACAATATGAAGACATCAGCTAGGCTACAAAATAGTAT 
CATTCGTCAAGAGTTAGCATGTCAGCGCGACCAATTAAAACAAACAGAAG 
AGATATTTTTCGTGGATATTCCTTTATTGATTGAAGAAAAGTATATAAAA 
TGGTTTGATGAGATTTGGTTGGTATTTGTTGATAAAGAAAAACAATTACA 



234 



WO 2004/018646 



PC17US2003/026827 



SEQUENCE LISTING 



ACGATTAATGGCCCGTaACAACTACAGTCGAGAAGAAGCAGAATTACGAC 
TTTCACACCAAATGCCTTTAACAGATAAAAAAAGTTTCGCTAGTCTTATT 
ATTAATAATAATGGTGATTTAATAACTTTAAAAGAGCAAATATTGGATGC 
TCTTCAACGTTTA 

SEQ ID HO: 5710 

STRAIN 1169NT 

AAGTCAACGGTAACAAAAATAATACGAGAATCAGG 

TTTTAAAGTCATAGATGCGGATCAAGTGGTTCATAAATTGCAAGCTAAGG 
GTGGGAAACTTTACCAAGCTTTATTAGAATGGTTGGGTCCCGAGATACTT 
GATGCTGATGGTGAGTTGGATAGACCAAAGCTTTCTCAAATGATTTTTGC 
TAATCCAGACAATATGAAGACATCAGCTAGGCTACAAAATAGTATCATTC 
GTCAAGAGTTAGCATGTCAGCGCGACCAATTAAAACAAACAGAAGAGATA 
TTTTTCATGGATATTCCTTTATTGATTGAAGAAAAGTATATAAAATGGTT 
TGATGAGATTTGGTTGGTATTTGTTGATAAAGAAAAACAATTACAACGAT 
TAATGGCCCGTAACAACTACAGTCGAGAAGAAGCAGAATTACGACTTTCA 
CACCAAATACCTTTAACAGATAAAAAAAGTTTCGCTAGTCTTATTATTGA 
TAATAATGGTGATTTAATAACTTTAAAAGAGCAAATGTTGGATGCTCTTC 
AACGTTTA 

SEQ ID NO: 5711 

STRAIN JM9130013 

AAGTCAACGGTAACAAAAATAATACGAGAATCAGGT 

TTTAAAGTCATAGATGCGGATCAAGTGGTTCATAAATTGCAAGCTAAGGG 
TGGGAAACTTTACCAAGCTTTATTAGAATGGTTGGGTCCCGAGATACTTG 
ATGCTGATGGTGAGTTGGATAGACCAAAGCTTTCTCAAATGATTTTTGCT 
AATCCAGACAATATGAAGACATCAGCTAGGCTACAAAATAGTATCATTCG 
TCAAGAGTTAGCATGTCAGCGCGACCAATTAAAACAAACAGAAGAGATAT 
TTTTCATGGATATTCCTTTATTGATTGAAGAAAAGTATATAAAATGGTTT 
GATGAGATTTGGTTGGTATTTGTTGATAAAGAAAAACAATTACAACGATT 
AATGGCCCGTAACAACTACAGTCGAGAAGAAGCGGAATTACGACTTTCAC 
ACCAAATACCTTTAACAGATAAAAAAAGTTTCGCTAGTCTTATTATTGAT 
AATAATGGTGATTTAATAACTTTAAAAGAGCAAATGTTGGATGCTCTTCA 
ACGTTTA ( 

SEQ ID NO: 5712 

STRAIN 2603 frame: 1 

MIjMTKI igltggiasgkstvtkiiresgfkvi dadqwhklqakggklyqallewlgpei 
ldadgeldrpklsqmi fanpdnmktsarlqnsiirqelacqrdqlkqteeiffmdiplli 
eekyikwfdeiwlvfvdkekqlqrlmarnnysreeaelrlshqmpltdkksfasliidnn 

GDLITLKEQILDALQRL 

SEQ ID NO: 5713 

STRAIN 090 frame: 1 

KSTVTKI IRE SGFKV I DADQWHKLQAKGGKLYQALLEWLGPEI LDADGELDRPKLSQMI 
FANPDNMKTSARLQNS I IRQELACQRDQLKQTEE I FFVDI PLLIEEKYIKWFDEIWLVFV 
DKEKQLQRLMARNNYSREEAELRLSHQMPLTDKKSFASLIINNNGDLITLKEQILDALQR 
L 

SEQ ID NO: 5714 

STRAIN A909 frame: 1 

KSTVTKI IRE SGFKVI DADQWHKLQAKGGKLYQALLEWLGPEI LDADGELDRPKLSQMI 
FANPDNMKTSARLQNS I IRQELACQRDQLKQTEEI FFMDI PLLIEEKYIKWFDEIWLVFV 
DKEKQLQRLMARNNYSREEAELRLSHQMPLTDKKSFASLIIDNNGDLITLKEQILDALQR 
L 

SEQ ID NO: 5715 
STRAIN H36B frame: 1 

KSTVTKI IRESGFKVI DADQWHKLQAKGGKLYQALLEWLGPEI LDADGELDRPKLSQMI 
FANPDNMKTSARLQNS I IRQELACQRDQLKQTEEI FFMDI PLLIEEKYIKWFDEIWLVFV 
DKEKQLQRLMARNNYSREEAELRLSHQI PLTDKKSFASLIIDNNGDLITLKEQMLDALQR 
L 

SEQ ID NO: 5716 
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STRAIN 18RS21 frame: 1 

KSTVTKI IRESGFKVI DADQWHKLQAKGGKLYQALLEWLGPE I LDADGELDRPKLSQMI 
FANPDNMKTSARLQNSIIRQELACQRDQLKQTEEIFFMDIPLLIEEKYIKWFDEIWLVFV 
DKEKQLQRLMARNNYSREEAELRLSHQMPLTDKKSFASLIIDNNGDLITLKEQILDALQR 
L 

SEQ ID NO: 5717 

STRAIN M732 frame: 1 

KSTVTKI IRESGFKVI DADQWHKLQAKGGKLYQALLEWLGPEI LDADGELDRPKLSQMI 
FANPDNMKTSARLQNSIIRQELACQRDQLKQTEEIFFMDIPLLIEEKYIKWFDEIWLVFV 
DKEKQLQRLMARNNYSREEAELRLSHQMPLTDKKSFASLIIDNNGDLITLKEQILDALQR 
L 

SEQ ID NO: 5718 

STRAIN COH1 frame: 1 

KSTVTKI IRESGFKVI DADQWHKLQAKGGKLYQALLEWLGPEILDADGELDRPKLSQMI 
FANPDNMKTSARLQNSIIRQELACQRDQLKQTEEIFFMDIPLLIEEKYIKWFDEIWLVFV 
DKEKQLQRLMARNNYSREEAELRLSHQMPLTDKKSFASLIIDNNGDLITLKEQILDALQR 
L 

SEQ ID NO: 5719 

STRAIN M781 frame: 1 

KSTVTKI IRESGFKVI DADQWHKLQAKGGKLYQALLEWLGPE I LDADGELDRPKLSQMI 
FANPDNMKTSARLQNSIIRQELACQRDQLKQTEEIFFMDIPLLIEEKYIKWFDEIWLVFV 
DKEKQLQRLMARNN YSREEAELRLSHQMPLT DKKS FASLI I DNNGDLITLKEQI LDALQR' 
L 

SEQ ID NO: 5720 

STRAIN CJB110 frame: 1 

KSTVTKIIRESGFKVIDADQWHKLQAKGGKLYQALLEWLGPEILDADGELDRPKLSQMI 
FANPDNMKTSARLQNSIIRQELACQRDQLKQTEEIFFVDIPLLIEEKYIKWFDEIWLVFV 
DKEKQLQRLMARNNYSREEAELRLSHQMPLTDKKSFASLIINNNGDLITLKEQI LDALQR 
L 

SEQ ID NO: 5721 
STRAIN 1169NT frame: 1 

KSTVTKI IRESGFKVI DADQWHKLQAKGGKLYQALLEWLGPE I LDADGELDRPKLSQMI 
FANPDNMKTSARLQNSIIRQELACQRDQLKQTEEIFFMDIPLLIEEKYIKWFDEIWLVFV 
DKEKQLQRLMARNNYSREEAELRLSHQIPLTDKKSFASLIIDNNGDLITLKEQMLDT^LQR 
L 

SEQ ID NO: 5722 

STRAIN JM9130013 frame: 1 

KSTVTKI IRESGFKVIDADQWHKLQAKGGKLYQALLEWLGPE I LDADGELDRPKLSQMI 
FANPDNMKTSARLQNSIIRQELACQRDQLKQTEEIFFMDIPLLIEEKYIKWFDEIWLVFV 
DKEKQLQRLMARNNYSREEAELRLSHQIPLTDKKSFASLIIDNNGDLITLKEQMLDALQR 
L 

SEQ ID NO. 5801 
STRAIN 2603 

ATGTTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATTATGATTTTAGCCTTTTTATTG 
GTAAATAATAGTTATTTTAGACAGTTAATTGAAGAGCGGTCTAAACGTGAAACGGTAGTC 
CTTGTCATCATTTTCGGCTTGTTTGTTATTATATCTAATATAACAGGAATTGAAATAAAA 
GGGGATCGAAGTTTGGTCGAGCGCCCTTTTCTAACAACGATTTCTCATTCTGACTCACTT 
GCTAATACAAGGACTTTAGTTATTACAACGGCAAGTTTGGTTGGTGGACCTCTGGTTGGA 
TCAATTGTTGGTTTTATTGGAGGAGTTCATCGCTTTTTTCAAGGAAGCTTTTCAGGTTCT 
TTCTATATTGTCAGTTCAGTTCTAGTCGGCATTGTTAGCGGAAAGATTGGTGATAAGCTT 
AAGGAAAACCATCTCTACCCTTCAACAAGCCAAGTTATTTTAATTAGTATTATTGCCGAA 
AGTATCCAGATGCTATTTGTTGGCATTTTTACAGGATGGGAACTTGTCAAAATGATTGTC 
ATTCCAATGATGATTTTAAATAGTTTAGGTTCCACACTTTTCCTTGCGATTTTGAAAACT 
TATTTGTCAAATGAAAGTCAGTTACGCGCAGTTCAAACGAGAGATGTTCTTGAATTGACT 
CGACAGACTCTGCCCTACCTTAGACAAGGTTTGACACCGCAATCTGCTAGGAGCGTTTGC 
GAAATTATAAAGAGGCATACTAACTTTGATGCTGTGGGATTAACAGATCGGTCAAACGTA 
TTAGCTCATATTGGTGTTGGCCATGATCACCATATTGCAGGACAACCGGTCAAAACAGAC 
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TTATCTAAAAGTGTTATTTTTGATGGCGAACCAAGAATTGCGCAAGATAAAGCGGCGATT 
TCTTGTCCAGATCACAACTGTCAGTTAAATTCTGCTATTGTAGTTCCTCTAAAAATAAAT 
GATAAAACTGTGGGTGCCTTAAAAATGTACTTTGCAGGAGATAAGACAATGTCTGAGGTG 
GAGGAAAACCTAGTCCTTGGTTTAGCGCAAATATTTTCAGGACAACTGGCAATGGGGATA 
ACAGAGGAACAAAATAAGTTAGCCAGTATGGCAGAGATAAAGGCTTTACAAGCACAAATC 
AACCCTCATTTCTTCTTTAATGCCATTAACACAATTAGTGCATTAATCCGTATTGATTCT 
GATAAAGCACGTTATGCACTGATGCAGTTAAGTACTTTTTTTAGAACAAGTTTGCAGGGT 
GGTCAGGATCGTGAGGTAACGCTTGAGCAAGAAAAATCACATGTGGATGCTTATATGAAT 
GTTGAAAAATTACGTTTCCCTGATAAATATCAGTTATCTTATGATATTAGTGCACCAGAA 
AAAATGAAGTTACCACCTTTTGGTTTACAGGTACTGGTAGAGAATGCAGTTCGACATGCT 
TTCAAAGAACGTAAGACGGACAACCATATATTGGTTCAAATAAAGCCAGATGGTCATTAT 
TATTGTGTTTCTGTTAGTGACAATGGACAAGGAATCTCAGATACTATCATTGATAAATTA 
GGTCAAGAAACAGTTGCAGAGAGTAAGGGTACAGGTACTGCTCTAGTTAATCTAAATAAC 
AGGCTGAATTTATTATATGGTAGTGTAAGTTGCCTTCATTTTTCGAGCGACAAGAATGGT 
ACAAAAGTTTGGTATCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAATTTTAAT 
TCT 



SEQ ID NO. 5802 

STRAIN 090 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATTAT 

GATTTTAGCCTTTTTATTGGTAAATAATAGTTATTTCAGACAGTTAATTG 

AAGAGCGGTCTAAACGTGAAACGGTAGTACTTGTCATCATTTTCGGCTTG 

TTTGTTATTATATCTAATATAACAGGAATTGAAATAAAAGGGGATCGAAG 

TTTGGTCGAGCGCCCTTTTCTAACAACGATTTCCCATTCTGACTCACTTG 

CTAATACAAGGACTTTAGTTATTACAACGGCAAGTTTGGTTGGTGGACCT 

CTGGTTGGATCAATTGTTGGTTTTATTGGAGGAGTTCATCGCTTTTTTCA 

AGGAAGCTTTTCAGGTTCTTTCTATATTGTCAGTTCAGTTCTAGTCGGCA 

TTGTTAGCGGAAAGATTGGTGATAAGCTTAAGGAAAACCATCTCTACCCT 

TCAACAAGCCAAGTTATTTTAATTAGTATTATTGCCGAAAGTATCCAGAT 

GCTATTTGTTGGTATTTTTACAGGATGGGAACTTGTCAAAATGATTGTCA 

TTCCAATGATGATTTTAAATAGTTTAGGTTCCACACTTTTCCTTGCGATT 

TTGAAAACTTATTTGTCAAATGAAAGTCAGTTACGCGCAGTTCAAACGAG 

AGATGTTCTTGAATTGACTCGACAGACTCTGCCCTACCTCAGACAAGGTT 

TGACACCGCAATCTGCTAGGAGCGTTTGCGAAATTATAAAGAGGCATACT 

AACTTTGATGCTGTAGGATTAACAGATCGGTCAAACGTATTAGCTCATAT 

TGGTGTTGGCCATGATCACCATATTGCAGGACAACCAGTCAAAACAGACC 

TATCTAAAAGTGTTATTTTTGATGGCGAACCAAGAATTGCGCAAGATAAA 

GCGGCGATTTCTTGTCCAGATCACAACTGTCAGTTAAATTCTGCTATTGT 

AGTTCCTCTAAAAATAAATGATAAAACTGTGGGTGCCTTAAAAATGTACT 

TTGCAGGAGATAAGACAATGTCTGAGGTGGAGGAAAACCTAGTCCTTGGT 

TTAGCGCAAATATTTTCAGGACAACTGGCAATGGGGATAACAGAGGAACA 

AAATAAGTTAGCCAGTATGGCAGAGATAAAGGCTTTACAAGCACAAATCA 

ACCCTCATTTCTTCTTTAATGCCATTAACACAATTAGTGCATTAATCCGT 

ATTGATTCTGATAAAGCACGTTATGCACTGATGCAGTTAAGTACTTTTTT 

TAGAACAAGTTTGCAAGGTGGTCAGGATCGTGAGGTAACGCTTGAGCAAG 

AAAAATCACATGTGGATGCTTATATGAATGTTGAAAAATTACGTTTCCCT 

GAT AAATAT CAGTTAT CTTATGATATTAGTGCACCAGAAAAAATGAAGTT 

ACCGCCTTTTGGTTTACAGGTACTGGTAGAGAATGCAGTTAGACATGCTT 

TCAAAGAACGTAAGACGGACAACCATATATTGGTTCAAATAAAGCCAGAT 

GGTCATTATTATTGTGTTTCTGTTAGTGACAATGGACAAGGAATCTCAGA 

TACTATCATTGATAAATTAGGTCAAGAAACAGTTGCAGAGAGTAAGGGTA 

CAGGTACTGCTCTAGTTAATCTAAATAACAGGCTGAATTTATTATATGGT 

AGTGTAAGTTGCCTTCATTTTTCGAGCGACAAGAATGGTACAAAAGTTTG 

GTATCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAATTTTAATT 

CT 



SEQ ID NO. 5803 

STRAIN A909 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATTAT 

GATTTTAGCCTTTTTATTGGTAAATAATAGTTATTTCAGACAGTTAATTG 

AAGAGCGGTCTAAACGTGAAACGGTAGTCCTTGTCATCATTTTCGGCTTG 

TTTGTTATTATATCTAATATAACAGGAATTGAAATAAAAGGGGATCGAAG 

TTTGGTCGAGCGCCCTTTTCTAACAACGATTTCTCATTCTGACTCACTTG 

CTAATACAAGGACTTTAGTTATTACAACGGCAAGTTTGGTTGGTGGACCT 
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CTGGTTGGATCAATTGTTGGTTTTATTGGAGGAGTTCATCGCTTTTTTCA 
AGGAAGCTTTTCAGGTTCTTTCTATATTGTCAGTTCAGTTCTAGTCGGCA 
TTGTTAGCGGAAAGATTGGTGATAAGCTTAAGGAAAACCATCTCTACCCT 
TCAACAAGCCAAGTTATTTTAATTAGTATTATTGCCGAAAGTATCCAGAT 
GCTATTTGTTGGCATTTTTACAGGATGGGAACTTGTCAAAATGATTGTCA 
TTCCAATGATGATTTTAAATAGTTTAGGTTCCACACTTTTCCTTGCGATT 
TTGAAAACTTATTTGTCAAATGAAAGTCAGTTACGCGCAGTTCAAACGAG 
AGATGTTCTTGAATTGACTCGACAGACTCTGCCCTACCTTAGACAAGGTT 
TGACACCGCAATCTGCTAGGAGCGTTTGCGAAATTATAAAGAGGCATACT 
7UVCTTTGATGCTGTGGGATTAACAGATCGGTCAAACGTATTAGCTCATAT 
TGGTGTTGGCCATGATCACCATATTGCAGGACAACCGGTCAAAACAGACT 
TATCTAAAAGTGTTATTTTTGATGGCGAACCAAGAATTGCGCAAGATAAA 
GCGGCGATTTCTTGTCCAGATCACAACTGTCAGTTAAATTCTGCTATTGT 
AGTTCCTCTAAAAATAAATGATAAAACTGTGGGTGCCTTAAAAATGTACT 
TTGCAGGAGATAAGACAATGTCTGAGGTGGAGGAAAACCTAGTCCTTGGT 
TTAGCGCAAATATTTTCAGGACAACTGGCAATGGGGATAACAGAGGAACA 
AAATAAGTTAGCCAGTATGGCAGAGATAAAGGCTTTACAAGCACAAATCA 
ACCCTCATTTCTTCTTTAATGCCATTAACACAATTAGTGCATTAATCCGT 
ATTGATTCTGATAAAGCACGTTATGCACTGATGCAGTTAAGTACTTTTTT 
TAGAACAAGTTTGCAGGGTGGTCAGGATCGTGAGGTAACGCTTGAGCAAG 
AAAAATCACATGTGGATGCTTATATGAATGTTGAAAAATTACGTTTCCCT 
GATAAATATCAGTTATCTTATGATATTAGTGCACCAGAAAAAATGAAGTT 
ACCACCTTTTGGTTTACAGGTACTGGTAGAGAATGCAGTTCGACATGCTT 
TCAAAGAACGTAAGACGGACAACCATATATTGGTTCAAATAAAGCCAGAT 
GGTCATTATTATTGTGTTTCTGTTAGTGACAATGGACAAGGAATCTCAGA 
TACTATCATTGATAAATTAGGTCAAGAAACAGTTGCAGAGAGTAAGGGTA 
CAGGTACTGCTCTAGTTAATCTAAATAACAGGCTGAATTTATTATATGGT 
AGTGTAAGTTGCCTTCATTTTTCGAGCGACAAGAATGGTACAAAAGTTTG 
GTATCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAATTTTAATT 
CT 

SEQ ID NO. 5804 

STRAIN H36B 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATTATG 

ATTTTAGCCTTTTTATTGGTAAATAATAGTTATTTCAGACAGTTAATTGA 

AGAGCGGTCTAAACGTGAAACGGTAGTCCTTGTCATCATTTTCGGCTTGT 

TTGTTATTATATCTAATATAACAGGAATTGAAATAAAAGGGGATCGAAGT 

TTGGTCGAGCGCCCTTTTCTAACAACGATTTCTCATTCTGACTCACTTGC 

TAATACAAGGACTTTAGTTATTACAACGGCAAGTTTGGTTGGTGGACCTC 

TGGTTGGATCAATTGTTGGTTTTATTGGAGGAGTTCATCGCTTTTTTCAA 

GGAAGCTTTTCAGGTTCTTTCTATATTGTCAGTTCAGTTCTAGTCGGCAT 

TGTTAGCGGAAAGATTGGTGATAAGCTTAAGGAAAACCATCTCTACCCTT 

CAACAAGCCAAGTTATTTTAATTAGTATTATTGCCGAAAGTATCCAGATG 

CTATTTGTTGGCATTTTTACAGGATGGGAACTTGTCAAAATGATTGTCAT 

TCCAATGATGATTTTAAATAGTTTAGGTTCCACACTTTTCCTTGCGATTT 

TGAAAACTTATTTGTCAAATGAAAGTCAGTTACGCGCAGTTCAAACGAGA 

GATGTTCTTGAATTGACTCGACAGACTCTGCCCTACCTTAGACAAGGTTT 

GACACCGCAATCTGCTAGGAGCGTTTGCGAAATTATAAAGAGGCATACTA 

ACTTTGATGCTGTGGGATTAACAGATCGGTCAAACGTATTAGCTCATATT 

GGTGTTGGCCATGATCACCATATTGCAGGACAACCGGTCAAAACAGACTT 

ATCTAAAAGTGTTATTTTTGATGGCGAACCAAGAATTGCGCAAGATAAAG 

CGGCGATTTCTTGTCCAGATCACAACTGTCAGTTAAATTCTGCTATTGTA 

GTTCCTCTAAAAATAAATGATAAAACTGTGGGTGCCTTAAAAATGTACTT 

TGCAGGAGATAAGACAATGTCTGAGGTGGAGGAAAACCTAGTCCTTGGTT 

TAGCGCAAATATTTTCAGGACAACTGGCAATGGGGATAACAGAGGAACAA 

AATAAGTTAGCCAGTATGGCAGAGATAAAGGCTTTACAAGCACAAATCAA 

CCCTCATTTCTTCTTTAATGCCATTAACACAATTAGTGCATTAATCCGTA 

TTGATTCTGATAAAGCACGTTATGCACTGATGCAGTTAAGTACTTTTTTT 

AGAACAAGTTTGCAGGGTGGTCAGGATCGTGAGGTAACGCTTGAGCAAGA 

AAAATCACATGTGGATGCTTATATGAATGTTGAAAAATTACGTTTCCCTG 

ATAAATATCAGTTATCTTATGATATTAGTGCACCAGAAAAAATGAAGTTA 

CCACCTTTTGGTTTACAGGTACTGGTAGAGAATGCAGTTCGACATGCTTT 

CAAAGAACGTAAGACGGACAACCATATATTGGTTCAAATAAAGCCAGATG 

GTCATTATTATTGTGTTTCTGTTAGTGACAATGGACAAGGAATCTCAGAT 
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ACTATCATTGATAAATTAGGTCAAGAAACAGTTGCAGAGAGTAAGGGTAC 
AGGTACTGCTCTAGTTAATCTAAATAACAGGCTGAATTTATTATATGGTA 
GTGTAAGTTGCCTTCATTTTTCGAGCGACAAGAATGGTACAAAAGTTTGG 
TATCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAATTTTAATTC 
T 

SEQ ID NO. 5805 
STRAIN 18RS21 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATTATG 

ATTTTAGCCTTTTTATTGGTAAATAATAGTTATTTTAGACAGTTAATTGA 

AGAGCGGTCTAAACGTGAAACGGTAGTCCTTGTCATCATTTTCGGCTTGT 

TTGTTATTATATCTAATATAACAGGAATTGAAATAAAAGGGGATCGAAGT 

TTGGTCGAGCGCCCTTTTCTAACAACGATTTCTCATTCTGACTCACTTGC 

TAATACAAGGACTTTAGTTATTACAACGGCAAGTTTGGTTGGTGGACCTC 

TGGTTGGATCAATTGTTGGTTTTATTGGAGGAGTTCATCGCTTTTTTCAA 

GGAAGCTTTTCAGGTTCTTTCTATATTGTCAGTTCAGTTCTAGTCGGCAT 

TGTTAGCGGAAAGATTGGTGATAAGCTTAAGGAAAACCATCTCTACCCTT 

CAACAAGCCAAGTTATTTTAATTAGTATTATTGCCGAAAGTATCCAGATG 

CTATTTGTTGGCATTTTTACAGGATGGGAACTTGTCAAAATGATTGTCAT 

TCCAATGATGATTTTAAATAGTTTAGGTTCCACACTTTTCCTTGCGATTT 

TGAAAACTTATTTGTCAAATGAAAGTCAGTTACGCGCAGTTCAAACGAGA 

GATGTTCTTGAATTGACTCGACAGACTCTGCCCTACCTTAGACAAGGTTT 

GACACCGCAATCTGCTAGGAGCGTTTGCGAAATTATAAAGAGGCATACTA 

ACTTTGATGCTGTGGGATTAACAGAT CGGTCAAACGTATTAG CTCATATT 

GGTGTTGGCCATGATCACCATATTGCAGGACAACCGGTCAAAACAGACTT 

ATCT7^AAAGTGTTATTTTTGATGGCGAACCAAGaATTGCGCAAGATAAAG 

CGGCGATTTCTTGTCCAGATCACAACTGTCAGTTAAATTCTGCTATTGTA 

GTTCCTCTAAAAATAAATGATAAAACTGTGGGTGCCTTAAAAATGTACTT 

TGCAGGAGATAAGACAATGTCTGAGGTGGAGGAAAACCTAGTCCTTGGTT 

TAGCGCAAATATTTTCAGGACAACTGGCAATGGGGATAACAGAGGAACAA 

AATAAGTTAGCCAGTATGGCAGAGATAAAGGCTTTACAAGCACAAATCAA 

CCCTCATTTCTTCTTTAATGCCATTAACACAATTAGTGCATTAATCCGTA 

TTGATTCTGATAAAGCACGTTATGCACTGATGCAGTTAAGTACTTTTTTT 

AGAACAAGTTTGCAGGGTGGTCAGGATCGTGAGGTAACGCTTGAGCAAGA 

AAAATCACATGTGGATGCTTATATGAATGTTGAAAAATTACGTTTCCCTG 

ATAAATATCAGTTATCTTATGATATTAGTGCACCAGAAAAAATGAAGTTA 

CCACCTTTTGGTTTACAGGTACTGGTAGAGAATGCAGTTCGACATGCTTT 

CAAAGAACGTAAGACGGACAACCATATATTGGTTCAAATAAAGCCAGATG 

GTCATTATTATTGTGTTTCTGTTAGTGACAATGGACAAGGAATCTCAGAT 

ACTATCATTGATAAATTAGGTCAAGAAACAGTTGCAGAGAGTAAGGGTAC 

AGGTACTGCTCTAGTTAATCTAAATAACAGGCTGAATTTATTATATGGTA 

GTGTAAGTTGCCTTCATTTTTCGAGCGACAAGAATGGTACAAAAGTTTGG 

TATCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAATTTTAATTC 

T 

SEQ ID NO. 5806 

STRAIN M732 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATTATGAT 

TTTAGCCTTTTTATTGGTAAATAATAGTTATTTCAGACAGTTAATTGAAG 

AGCGGTCTAAACGTGAAACGGTAGTCCTTGTCATCATTTTCGGCTTGTTT 

GTTATTATATCTAATATAACAGGAATTGAAATAAAAGGGGATCGAAGTTT 

GGTCGAGCGCCCTTTTCTAACAACGATTTCCCATTCTGACTCACTTGCTA 

ATACAAGGACTTTAGTTATTACAACGGCAAGTTTGGTTGGTGGACCTCTG 

GTTGGATCAATTGTTGGTTTTATTGGAGGAGTTCATCGCTTTTTTCAAGG 

AAGCTTTTCAGGTTCTTTCTATATTGTCAGTTCAGTTCTAGTCGGCATTG 

TTAGCGGAAAGATTGGTGATAAGCTTAAGGAAAACCATCTCTACCCTTCA 

ACAAGCCAAGTTATTTTAATTAGTATTATTGCCGAAAGTATCCAGATGCT 

ATTTGTTGGCATTTTTACAGGATGGGAACTTGTCAAAATGATTGTCATTC 

CAATGATGATTTTAAATAGTTTAGGTTCCACACTTTTCCTTGCGATTTTG 

AAAACTTATTTGTCAAATGAAAGTCAGTTACGCGCAGTTCAAACGAGAGA 

TGTTCTTGT^ATTGACTCGACAGACTCTGCCCTACCTTAGACAAGGTTTGA 

CACCGCAATCTGCTAGGAGCGTTTGCGAAATTATAAAGAGGCATACTAAC 

TTTGATGCTGTGGGATTAACAGATCGGTCAAACGTATTAGCTCATATTGG 

TATTGGCCATGATCACCATATTGCAGGACAACCGGTCAAAACAGACTTAT 
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CTAAAAGTGTTATTTTTGATGGCGAACC^WSAATTGCGCAAGATAAAGCG 
GCGAtTTCTTGTCCAGATCACAACTGTCAGTTAAATTCTGCTATTGTAGT 
TCCTCTAAAAATAAATGATAAAACTGTGTGTGCCTTAAAAATGTACTTTG 
CAGGAGATAAGACAATGTCTGAGGTGGAGGAAAACCTAGTCCTTGGTTTA 
GCGCAAATATTTTCAGGACAACTGGCAATGGGGATAACAGAGGAACAAAA 
TAAGTTAGCCAGTATGGCAGAGATAAAGGCTTTACAAGCACAAATCAACC 
CTCATTTCTTCTTTAATGCCATTAACACAATTAGTGCATTAATCCGTATT 
GATTCTGATAAAGCACGTTATGCACTGATGCAGTTAAGTACTTTTTTTAG 
AACAAGTTTGCAAGGTGGTCAGGATCGTGAGGTAACGCTTGAGCAAGAAA 
AATCACATGTGGATGCTTATATGAATGTTGAAAAATTACGTTTCCCTGAT 
AAATATCAGTTATCTTATGATATTAGTGCACCAGAAAAAATGAAGTTACC 
GCCTTTTGGTTTACAGGTACTGGTAGAGAATGCAGTTCGACATGCTTTCA 
AAGAACGTAAGACGGACAACCATATATTGGTTCAAATAAAGCCAGATGGT 
CATTATTATTGTGTTTCTGTTAGTGACAATGGACAAGGAATCTCAGATAC 
TATCATTGATAAATTAGGTCAAGAAACAGTTGCAGAGAGTAAGGGGACAG 
GTACTGCTCTAGTTAATCTAAATAACAGGCTGAATTTATTATATGGTAGT 
GTAAGTTGCCT TCATTTTT CGAGCGACAAGAATGGTACAAAAGTTTGGTA 
TCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAATTTTAATTCT 

SEQ ID NO. 5807 

STRAIN COH1 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTAT 

TATGATTTTAGCCTTTTTATTGGTAAATAATAGTTATTTCAGACAGTTAA 
TTGAAGAGCGGTCTAAACGTGAAACGGTAGTCCTTGTCATCATTTTCGGC 
TTGTTTGTTATTATATCTAATATAACAGGAATTGAAATAAAAGGGGATCG 
AAGTTTGGTCGAGCGCCCTTTTCTAACAACGATTTCCCATTCTGACTCAC 
TTGCTAATACAAGGACTTTAGTTATTACAACGGCAAGTTTGGTTGGTGGA 
CCTCTGGTTGGATCAATTGTTGGTTTTATTGGAGGAGTTCATCGCTTTTT 
TCAAGGAAGCTTTTCAGGTTCTTTCTATATTGTCAGTTCAGTTCTAGTCG 
GCATTGTTAGCGGAAAGATTGGTGATAAGCTTAAGGAAAACCATCTCTAC 
CCTTCAACAAGCCAAGTTATTTTAATTAGTATTATTGCCGAAAGTATCCA 
GATGCTATTTGTTGGCATTTTTACAGGATGGGAACTTGTCAAAATGATTG 
TCATTCCAATGATGATTTTAAATAGTTTAGGTTCCACACTTTTCCTTGCG 
ATTTTGAAAACTTATTTGTCAAATGAAAGTCAGTTACGCGCAGTTCAAAC 
GAGAGATGTTCTTGAATTGACTCGACAGACTCTGCCCTACCTTAGACAAG 
GTTTGACACCGCAATCTGCTAGGAGCGTTTGCGAAATTATAAAGAGGCAT 
ACTAACTTTGATGCTGTGGGATTAACAGATCGGTCAAACGTATTAGCTCA 
TATTGGTGTTGGCCATGATCACCATATTGCAGGACAACCGGTCAAAACAG 
ACTTATCTAAAAGTGTTATTTTTGATGGCGAACCAAGAATTGCGCAAGAT 
AAAGCGGCGATTTCTTGTCCAGATCACAACTGTCAGTTAAATTCTGCTAT 
TGTAGTTCCTCTAAAAATAAATGATAAAACTGTGTGTGCCTTAAAAATGT 
ACTTTGCAGGAGATAAGACAATGTCTGAGGTGGAGGAAAACCTAGTCCTT 
GGTTTAGCGCAAATATTTTCAGGACAACTGGCAATGGGGATAACAGAGGA 
ACAAAATAAGTTAGCCAGTATGGCAGAGATAAAGGCTTTACAAGCACAAA 
TCAACCCTCATTTCTTCTTTAATGCCATTAACACAATTAGTGCATTAATC 
CGTATTGATTCTGATAAAGCACGTTATGCACTGATGCAGTTAAGTACTTT 
TTTTAGAACAAGTTTGCAAGGTGGTCAGGATCGTGAGGTAACGCTTGAGC 
AAGAAAAATCACATGTGGATGCTTATATGAATGTTGAAAAATTACGTTTC 
CCTGATAAATATCAGTTATCTTATGATATTAGTGCACCAGAAAAAATGAA 
GTTACCGCCTTTTGGTTTACAGGTACTGGTAGAGAATGCAGTTCGACATG 
CTTTCAAAGAACGTAAGACGGACAACCATATATTGGTTCAAATAAAGCCA 
GATGGTCATTATTATTGTGTTTCTGTTAGTGACAATGGACAAGGAATCTC 
AGATACTATCATTGATAAATTAGGTCAAGAAACAGTTGCAGAGAGTAAGG 
GGACAGGTACTGCTCTAGTTAATCTAAATAACAGGCTGAATTTATTATAT 
GGTAGTGTAAGTTGCCTTCATTTTTCGAGCGACAAGAATGGTACAAAAGT 
TTGGTATCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAATTTTA 
ATTCT 

SEQ ZD NO. 5808 
STRAIN M781 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATTA 
TGATTTTAGCCTTTTTATTGGTAAATAATAGTTATTTCAGACAGTTAATT 
GAAGAGCGGTCTAAACGTGAAACGGTAGTCCTTGTCATCATTTTCGGCTT 
GTTTGTTATTATATCTAATATAACAGGAATTGAAATAAAAGGGGATCGAA 
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GTTTGGTCGAGCGCCCTTTTCTAACAACGATTTCCCATTCTGACTCACTT 
GCTAATACAAGGACTTTAGTTATTACAACGGCAAGTTTGGTTGGTGGACC 
TCTGGTTGGATCAATTGTTGGTTTTATTGGAGGAGTTCATCGCTTTTTTC 
AAGGAAGCTTTTCAGGTTCTTTCTATATTGTCAGTTCAGTTCTAGTCGGC 
ATTGTTAGCGGAAAGATTGGTGATAAGCTTAAGGAAAACCATCTCTACCC 
TTCAACAAGCCAAGTTATTTTAATTAGTATTATTGCCGAAAGTATCCAGA 
TGCTATTTGTTGGCATTTTTACAGGATGGGAACTTGTCAAAATGATTGTC 
ATTCCAATGATGATTTTAAATAGTTTAGGTTCCACACTTTTCCTTGCGAT 
TTTGAAAACTTATTTGTCAAATGAAAGTCAGTTACGCGCAGtTCAAACGA 
GAGATGTTCTTGAATTGACTCGACAGACTCTGCCCTACCTTAGACAAGGT 
TTGACACCGCAATCTGCTAGGAGCGTTTGCGAAATTATAAAGAGGCATAC 
TAACTTTGATGCTGTGGGATTAACAGATCGGTCAAACGTATTAGCTCATA 
TTGGTGTTGGCCATGATCACCATATTGCAGGACAACCGGTCAAAACAGAC 
TTATCTAAAAGTGTTATTTTTGATGGCGAACCAAGAATTGCGCAAGATAA 
AGCGGCGATTTCTTGTCCAGATCACAACTGTCAGTTAAATTCTGCTATTG 
TAGTTCCTCTAAAAATAAATGATAAAACTGTGTGTGCCTTAAAAATGTAC 
TTTGCAGGAGATAAGACAATGTCTGAGGTGGAGGAAAACCTAGTCCTTGG 
TTTAGCGCAAATATTTTCAGGACAACTGGCAATGGGGATAACAGAGGAAC 
AAAATAAGTTAGCCAGTATGGCAGAGATAAAGGCTTTACAAGCACAAATC 
AACCCTCATTTCTTCTTTAATGCCATTAACACAATTAGTGCATTAATCCG 
TATTGATTCTGATAAAGCACGTTATGCACTGATGCAGTTAAGTACTTTTT 
TTAGAACAAGTTTGCAAGGTGGTCAGGATCGTGAGGTAACGCTTGAGCAA 
GAAAAATCACATGTGGATGCTTATATGAATGTTGAAAAATTACGTTTCCC 
TGATAAATATCAGTTATCTTATGATATTAGTGCACCAGAAAAAATGAAGT 
TACCGCCTTTTGGTTTACAGGTACTGGTAGAGAATGCAGTTCGACATGCT 
TTCAAAGAACGTAAGACGGACAACCATATATTGGTTCAAATAAAGCCAGA 
TGGTCATTATTATTGTGTTTCTGTTAGTGACAATGGACAAGGAATCTCAG 
ATACTATCATTGATAAATTAGGTCAAGAAACAGTTGCAGAGAGTAAGGGG 
ACAGGTACTGCTCTAGTTAATCTAAATAACAGGCTGAATTTATTATATGG 
TAGTGTAAGTTGCCTTCATTTTTCGAGCGACAAGAATGGTACAAAAGTTT 
GGTATCGAATACGTAATAGAATAAGGGAGGATGAGCATGAAAATTTTAAT 
TCT 

SEQ ID NO. 5809 

STRAIN CJB110 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATTAT 

GATTTTAGCCTTTTTATTGGTAAATAATAGTTATTTCAGACAGTTAATTG 

AAGAGCGGT CT AAACGTGAAACGGTAGT ACTTGT CATCATTTTCGGCTTG 

TTTGTTATTATATCTAATATAACAGGAATTGAAATAAAAGGGGATCGAAG 

TTTGGTCGAGCGCCCTTTTCTAACAACGATTTCCCATTCTGACTCACTTG 

CTAATACAAGGACTTTAGTTATTACAACGGCAAGTTTGGTTGGTGGACCT 

CTGGTTGGATCAATTGTTGGTTTTATTGGAGGAGTTCATCGCTTTTTTCA 

AGGAAGCTTTTCAGGTTCTTTCTATATTGTCAGTTCAGTTCTAGTCGGCA 

TTGTTAGCGGAAAGATTGGTGATAAGCTTAAGGAAAACCATCTCTACCCT 

TCAACAAGCCAAGTTATTTTAATTAGTATTATTGCCGAAAGTATCCAGAT 

GCTATTTGTTGGTATTTTTACAGGATGGGAACTTGTCAAAATGATTGTCA 

TTCCAATGATGATTTTAAATAGTTTAGGTTCCACACTTTTCCTTGCGATT 

TTGAAAACTTATTTGTCAAATGAAAGTCAGTTACGCGCAGTTCAAACGAG 

AGATGTTCTTGAATTGACTCGACAGACTCTGCCCTACCTCAGACAAGGTT 

TGACACCGCAATCTGCTAGGAGCGTTTGCGAAATTATAAAGAGGCATACT 

AACTTTGATGCTGTAGGATTAACAGATCGGTCAAACGTATTAGCTCATAT 

TGGTGTTGGCCATGATCACCATATTGCAGGACAACCAGTCAAAACAGACC 

TATCTAAAAGTGTTATTTTTGATGGCGAACCAAGAATTGCGCAAGATAAA 

GCGGCGATTTCTTGTCCAGATCACAACTGTCAGTTAAATTCTGCTATTGT 

AGTTCCTCTAAAAATAAATGATAAAACTGTGGGTGCCTTAAAAATGTACT 

TTGCAGGAGATAAGACAATGTCTGAGGTGGAGGAAAACCTAGTCCTTGGT 

TTAGCGCAAATATTTTCAGGACAACTGGCAATGGGGATAACAGAGGAACA 

AAATAAGTTAGCCAGTATGGCAGAGATAAAGGCTTTACAAGCACAAATCA 

ACCCTCATTTTTTCTTTAATGCCATTAACACAATTAGTGCATTAATCCGT 

ATTGATTCTGATAAAGCACGTTATGCACTGATGCAGTTAAGTACTTTTTT 

TAGAACAAGTTTGCAAGGTGGTCAGGATCGTGAGGTAACGCTTGAGCAAG 

AAAAATCACATGTGGATGCTTATATGAATGTTGAAAAATTACGTTTCCCT 

GATAAATATCAGTTATCTTATGATATTAGTGCACCAGAAAAAATGAAGTT 

ACCGCCTTTTGGTTTACAGGTACTGGTAGAGAATGCAGTTAGACATGCTT 
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TCAAAGAACGTAAGACGGACAACCATATATTGGTTCAAATAAAGCCAGAT 
GGTCATTATTATTGTGTTTCTGTTAGTGACAATGGACAAGGAATCTCAGA 
TACTATCATTGATAAATTAGGTCAAGAAACAGTTGCAGAGAGTAAGGGTA 
CAGGTACTGCTCTAGTTAATCTAAATAACAGGCTGAATTTATTATATGGT 
AGTGTAAGTTGCCTTCATTTTTCGAGCGACAAGAATGGTACAAAAGTTTG 
GTATCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAATTTTAATT 
CT 

SEQ ID NO. 5810 

STRAIN 1169NT 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATT 

ATGATTTTAGCCTTTTTATTGGTAAATAATAGTTATTTCAGACAGTTAAT 

TGAAGAGCGGTCTAAACGTGAAACGGTAGTACTTGTCATCATTTTCGGCT 

TGTTTGTTATTATATCTAATATAACAGGAATTGAAATAAAAGGGGATCGA 

AGTTTGGTCGAGCGCCCTTTTCTAACAACGATTTCTCATTCTGACTCACT 

TGCTAATACAAGGACTTTAGTTATTACAACGGCAAGTTTGGTTGGTGGAC 

CTCTGGTTGGATCAATTGTTGGTTTTATTGGAGGAGTTCATCGCTTTTTT 

CAAGGAAGCTTTTCAGGTTCTTTCTATATTGTCAGTTCAGTTCTAGTCGG 

CATTGTGAGCGGAAAGATTGGTGATAAGCTTAAGGAAAACCATCTCTACC 

CTTCAACAAGCCAAGTTATTTTAATTAGTATTATTGCCGAAAGTATCCAG 

ATGCTATTTGTTGGCATTTTTACAGGATGGGAACTTGTCAAAATGATTGT 

CATTCCAATGATGATTTTAAATAGTTTAGGTTCCACACTTTTCCTTGCGA 

TTTTGAAAACTTATTTGTCAAATGAAAGTCAGTTACGCGCAGTTCAAACG 

AGAGATGTTCTTGAATTGACTCGACAGACTCTGCCCTACCTTAGACAAGG 

TTTGACACCGCAATCTGCTAGGAGCGTTTGCGAAATTATAAAGAGGCATA 

CTAATTTTGATGCTGTGGGATTAACAGATCGGTCAAACGTATTAGCTCAT 

ATTGGTGTTGGCCATGATCACCATATTGCAGGACAACCAGTCAAAACAGA 

CCTATCTAAAAGTGTTATTTTTGATGGCGAACCAAGAATTGCGCAAGATA 

AAGCGGCGATTTCTTGTCCAGATCACAACTGTCAGTTAAATTCTGCTATT 

GTAGTTCCTCTAAAAATAAATGATAAAACTGTGGGTGCCTTAAAAATGTA 

CTTTGCAGGAGATAAGACAATGTCTGAGGTGGAGGAAAACCTAGTCCTTG 

GTTTAGCG C AAAT AT T TT C AGGAC AACT GGCAAT GGGGAT AAC AGAGG AA 

CAAAATAAGTTAGCCAGTATGGCAGAGATAAAGGCTTTACAAGCACAAAT 

CAACCCTCATTTCTTCTTTAATGCCATTAACACAATTAGTGCATTAATCC 

GTATTGATTCTGATAAAGCACGTTATGCACTGATGCAGTTAAGTACTTTT 

TTTAGAACAAGTTTGCAAGGTGGTCAGGATCGTGAGGTAACGCTTGAGCA 

AGAAAAATCACATGTGGATGCTTATATGAATGTTGAAAAATTACGTTTCC 

CTGATAAATATCAGTTATCTTATGATATTAGTGCACCAGAAAAAATGAAG 

TTACCGCCTTTTGGTTTACAGGTACTGGTAGAGAATGCAGTTCGACATGC 

TTTTAAAGAACGTAAGACGGACAACCATATATTGGTTCAAATAAAGCCAG 

ATGGTCATTATTATTGTGTTTCTGTTAGTGACAATGGACAAGGAATCTCA 

GATACTATCATTGATAAATTAGGTCAAGAAACAGTTGCAGAGAGTAAGGG 

TACAGGTACTGCTCTAGTTAATCTAAATAACAGGCTGAATTTATTATATG 

GTAGTGTAAGTTGCCTTCATTTTTCGAGCGACAAGAATGGTACAAAAGTT 

TGGTATCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAATTTTAA 

TTCT 

SEQ ID NO. 5810 

STRAIN JM9130013 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATT 

ATGATTTTAGCCTTTTTATTGGTAAATAATAGTTATTTCAGACAGTTAAT 
TGAAGAGCGGTCTAAACGTGAAACGGTAGTCCTTGTCATCATTTTCGGCT 
TGTTTGTTATTATATCTAATATAACAGGAATTGAAATAAAAGGGGATCGA 
AGTTTGGTCGAGCGCCCTTTTCTAACAACGATTTCTCATTCTGACTCACT 
TGCTAATACAAGGACTTTAGTTATTACAACGGCAAGTTTGGTTGGTGGAC 
CTCTGGTTGGATCAATTGTTGGTTTTATTGGAGGAGTTCATCGCTTTTTT 
CAAGGAAGCTTTTCAGGTTCTTTCTATATTGTCAGTTCAGTTCTAGTCGG 
CATTGTTAGCGGAAAGATTGGTGATAAGCTTAAGGAAAACCATCTCTACC 
CTTCAACAAGCCAAGTTATTTTAATTAGTATTATTGCCGAAAGTATCCAG 
ATGCTATTTGTTGGCATTTTTACAGGATGGGAACTTGTCAAAATGATTGT 
CATTCCAATGATGATTTTAAATAGTTTAGGTTCCACACTTTTCCTTGCGA 
TTTTGAAAACTTATTTGTCAAATGAAAGTCAGTTACGCGCAGTTCAAACG 
AGAGATGTTCTTGAATTGACTCGACAGACTCTGCCCTACCTTAGACAAGG 
TTTGACACCGCAATCTGCTAGGAGCGTTTGCGAAATTATAAAGAGGCATA 
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CTAACTTTGATGCTGTGGGATTAACAGATCGGTCAAACGTATTAGCTCAT 
ATTGGTGTTGGCCATGATCACCATATTGCAGGACAACCGGTCAAAACAGA 
CTTATCTAAAAGTGTTATTTTTGATGGCGAACCAAGAATTGCGCAAGATA 
AAGCGGCGATTTCTTGTCCAGATCACAACTGTCAGTTAAATTCTGCTATT 
GTAGTTCCTCTAAAAATAAATGATAAAACTGTGGGTGCCTTAAAAATGTA 
CTTTGCAGGAGATAAGACAATGTCTGAGGTGGAGGAAAACCTAGTCCTTG 
GTTTAGCGCAAATATTTTCAGGACAACTGGCAATGGGGATAACAGAGGAA 
CAAAATAAGTTAGCCAGTATGGCAGAGATAAAGGCTTTACAAGCACAAAT 
CAACCCTCATTTCTTCTTTAATGCCATTAACACAATTAGTGCATTAATCC 
GTATTGATTCTGATAAAGCACGTTATGCACTGATGCAGTTAAGTACTTTT 
TTT AGAACAAGTTTGCAGGGTGGTCAGGAT CGTGAGGT AACGCT TGAGCA 
agAAAAATCACATGTGGATGCTTATATGAATGTTGAAAAATTACGTTTCC 
CTGATAAATATCAGTTATCTTATGATATTAGTGCACCAGAAAAAATGAAG 
TTACCACCTTTTGGTTTACAGGTACTGGTAGAGAATGCAGTTCGACATGC 
TTTCAAAGAACGTAAGACGGACAACCATATATTGGTTCAAATAAAGCCAG 
ATGGTCATTATTATTGTGTTTCTGTTAGTGACAATGGACAAGGAATCTCA 
GATACTATCATTGATAAATTAGGTCAAGAAACAGTTGCAGAGAGTAAGGG 
TACAGGTACTGCTCTAGTTAATCTAAATAACAGGCTGAATTTATTATATG 
GTAGTGTAAGTTGCCTTCATTTTTCGAGCGACAAGAATGGTACAAAAGTT 
TGGTATCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAATTTTAA 
TTCT 

SEQ ID NO. 5811 
STRAIN 2603 frame: 1 

LMVLLFQRLGI IMI LAFLLVNN S YFRQLI EERSKRETWLVI IFGLFVIISNITGIEIKG 
DRSLVERPFLTTISHSDSLANTRTLVITTASLVGGPLVGSIVGFIGGVHRFFQGSFSGSF 
YIVSSVLVGIVSGKIGDKLKENHLYPSTSQVILISIIAESIQMLFVGIFTGWELVKMIVI 
PMMILNSLGSTLFLAILKTYLSNESQLRAVQTRDVLELTRQTLPYLRQGLTPQSARSVCE 
I IKRHTNFDAVGLTDRSNVLAHIGVGHDHHI AGQPVKTDLSKSVI FDGE PRI AQDKAAI S 
CPDHNCQLNSAIWPLKINDKTVGALKMYFAGDKTMSEVEENLVLGLAQIFSGQLAMGIT 
EEQNKLASMAEIKALQAQINPHFFFNAINTISALIRIDSDKARYALMQLSTFFRTSLQGG 
QDREVTLEQEKSHVDAYMNVEKLRFPDKYQLSYDISAPEKMKLPPFGLQVLVENAVRHAF 
KERKTDNHILVQIKPDGHYYCVSVSDNGQGISDTIIDKLGQETVAESKGTGTALVNLNNR 
LNLL YGS VS CLHFS S DKNGTKVWYRI PNRIRE DEHEN FNS 

SEQ ID NO. 5812 

STRAIN 090 frame: 1 

LMVLLFQRLGI IMILAFLLVNNSYFRQLIEERSKRETWLVI IFGLFVIISNITGIEIKG 
DRSLVERPFLTTISHSDSLANTRTLVITTASLVGGPLVGSIVGFIGGVHRFFQGSFSGSF 
YIVSSVLVGIVSGKIGDKLKENHLYPSTSQVILISIIAESIQMLFVGIFTGWELVKMIVI 
PMMILNSLGSTLFLAILKTYLSNESQLRAVQTRDVLELTRQTLPYLRQGLTPQSARSVCE 
I IKRHTNFDAVGLTDRSNVLAHI GVGHDHHI AGQPVKTDLSKSVI FDGEPRIAQDKAAIS 
CPDHNCQLNSAIWPLKINDKTVGALKMYFAGDKTMSEVEENLVLGLAQIFSGQLAMGIT 
EEQNKLASMAEIKALQAQINPHFFFNAINTISALIRIDSDKARYALMQLSTFFRTSLQGG 
QDREVTLEQEKSHVDAYMNVEKLRFPDKYQLSYDISAPEKMKLPPFGLQVLVENAVRHAF 
KERKTDNHILVQIKPDGHYYCVSVSDNGQGISDTIIDKLGQETVAESKGTGTALVNLNNR 
LNLLYGSVS CLHFS S DKNGTKVWYRI PNRIRE DEHEN FNS 

SEQ ID NO. 5813 

STRAIN A909 frame: 1 

LMVLLFQRLGI IMILAFLLVNNSYFRQLIEERSKRETWLVIIFGLFVIISNITGIEIKG 
DRSLVERPFLTTISHSDSLANTRTLVITTASLVGGPLVGSIVGFIGGVHRFFQGSFSGSF 
YIVSSVLVGIVSGKIGDKLKENHLYPSTSQVILISIIAESIQMLFVGIFTGWELVKMIVI 
PMMILNSLGSTLFLAILKTYLSNESQLRAVQTRDVLELTRQTLPYLRQGLTPQSARSVCE 
I IKRHTNFDAVGLTDRSNVLAHIGVGHDHHIAGQPVKTDLSKS VI FDGEPRI AQDKAAI S 
CPDHNCQLNSAIWPLKINDKTVGALKMYFAGDKTMSEVEENLVLGLAQIFSGQLAMGIT 
EEQNKLASMAEIKALQAQINPHFFFNAINTISALIRIDSDKARYALMQLSTFFRTSLQGG 
QDREVTLEQEKSHVDAYMNVEKLRFPDKYQLSYDISAPEKMKLPPFGLQVLVENAVRHAF 
KERKTDNHI LVQI KPDGH YYCVS VS DNGQG I S DT 1 1 DKLGQET VAE S KGTGT ALVNLNNR 
LNLLYGSVSCLHFSSDKNGTKVWYRI PNRIRE DEHEN FNS 

SEQ ID NO. 5814 

STRAIN H36B frame: 1 

LMVLLFQRLGIIMILAFLLVNNSYFRQLIEERSKRETWLVIIFGLFVIISNITGIEIKG 
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DRSLVERPFLTTISHSDSLANTRTLVITTASLVGGPLVGSIVGFIGGVHRFFQGSFSGSF 
YIVSSVLVGIVSGKIGDKLKENHLYPSTSQVILISIIAESIQMLFVGIFTGWELVKMIVI 
PMMILNSLGSTLFLAILKTYLSNESQLRAVQTRDVLELTRQTLPYLRQGLTPQSARSVCE 
IIKRHTNFDAVGLTDRSNVLAHIGVGHDHHIAGQPVKTDLSKSVIFDGEPRIAQDKAAIS 
CPDHNCQLNSAIWPLKINDKTVGALKMYFAGDKTMSEVEENLVLGLAQIFSGQLAMGIT 
EEQNKLASMAEIKALQAQINPHFFFNAINTISALIRIDSDKARYALMQLSTFFUTSLQGG 
QDREVTLEQEKSHVDAYMNVEKLRFPDKYQLSYDISAPEKMKLPPFGLQVLVENAVRHAF 
KERKT DNHI LVQIKP DGHYYCVS VS DNGQGI S DT 1 1 DKLGQETVAE SKGTGTALVNLNNR 
LNLLYGSVSCLHFSSDKNGTKVWYRIPNRIREDEHENFNS 

SEQ ID NO. 5815 

STRAIN 18RS21 frame: 1 

LMVLLFQRLGI IMILAFLLVNNSYFRQLIEERSKRETWLVI I FGLFVI ISNITGIEIKG 
DRSLVERPFLTTISHSDSLANTRTLVITTASLVGGPLVGSIVGFIGGVHRFFQGS FSGSF 
YIVSSVLVGIVSGKIGDKLKENHLYPSTSQVILISIIAESIQMLFVGIFTGWELVKMIVI 
PMMILNSLGSTLFLAILKTYLSNESQLRAVQTRDVLELTRQTLPYLRQGLTPQSARSVCE 
IIKRHTNFDAVGLTDRSNVLAHIGVGHDHHIAGQPVKTDLSKSVIFDGEPRIAQDKAAIS 
CPDHNCQLNSAIWPLKINDKTVGALKMYFAGDKTMSEVEENLVLGIAQIFSGQLAMGIT 
EEQNKLASMAE IKALQAQIN PHFFFNAINT I SALIRI DS DKARYALMQLST FFRT SLQGG 
QDREVTLEQEKSHVDAYMNVEKLRFPDKYQLSYDISAPEKMKLPPFGLQVLVENAVRHAF 
KERKTDNHILVQIKPDGHYYCVSVS DNGQGI S DTI I DKLGQETVAESKGTGTALVNLNNR 
LNLLYGSVSCLHFSSDKNGTKVWYRIPNRIREDEHENFNS 

SEQ ID NO. 5816 

STRAIN M732 frame: 1 

LMVLLFQRLGI IMILAFLLVNNSYFRQLIEERSKRETWLVI I FGLFVI ISNITGIEIKG 
DRSLVERPFLTTISHSDSLANTRTLVITTASLVGGPLVGSIVGFIGGVHRFFQGSFSGSF 
YIVSSVLVGIVSGKIGDKLKENHLYPSTSQVILISIIAESIQMLFVGIFTGWELVKMIVI 
PMMILNSLGSTLFLAILKTYLSNESQLRAVQTRDVLELTRQTLPYLRQGLTPQSARSVCE 
IIKRHTNFDAVGLTDRSNVLAHIGIGHDHHIAGQPVKTDLSKSVIFDGEPRIAQDKAAIS 
CPDHNCQLNSAIWPLKINDKTVCALKMYFAGDKTMSEVEENLVLGLAQIFSGQLAMGIT 
EEQNKIiASMAE IKALQAQIN PHFFFNAINT I SALIRI DS DKARYALMQLST FFRT SLQGG 
QDREVTLEQEKSHVDAYMNVEKLRFPDKYQLSYDISAPEKMKLPPFGLQVLVENAVRHAF 
KERKTDNHILVQIKPDGHYYCVSVSDNGQGISDTIIDKLGQETVAESKGTGTALVNLNNR 
LNLLYGSVSCLHFSSDKNGTKVWYRIPNRIREDEHENFNS 

SEQ ID NO. 5817 

STRAIN COH1 frame: 1 

LMVLLFQRLGI IMILAFLLVNNSYFRQLIEERSKRETWLVI I FGLFVI ISNITGIEIKG 
DRSLVERPFLTTISHSDSLANTRTLVITTASLVGGPLVGSIVGFIGGVHRFFQGS FSGSF 
YIVSSVLVGIVSGKIGDKLKENHLYPSTSQVILISIIAESIQMLFVGIFTGWELVKMIVI 
PMMILNSLGSTLFLAILKTYLSNESQLRAVQTRDVLELTRQTLPYLRQGLTPQSARSVCE 
IIKRHTNFDAVGLTDRSNVLAHIGVGHDHHIAGQPVKTDLSKSVIFDGEPRIAQDKAAIS 
CPDHNCQLNSAIWPLKINDKTVCALKMYFAGDKTMSEVEENLVLGLAQIFSGQLAMGIT 
EEQNKLASMAEIKALQAQINPHFFFNAINTISALIRIDSDKARYALMQLSTFFRTSLQGG 
QDREVTLEQEKSHVDAYMNVEKLRFPDKYQLSYDISAPEKMKLPPFGLQVLVENAVRHAF 
KERKT DNH I LVQIKPDGHYYCVSVSDNGQG IS DTI I DKLGQETVAE SKGTGTALVNLNNR 
LN LL YGS VS CLHFS S DKNGTKVW YRI PNR I RE DEHEN FN S 

SEQ ID NO. 5818 

STRAIN M781 frame: 1 

LMVLLFQRLGI IMILAFLLVNNSYFRQLIEERSKRETWLVI IFGLFVI ISNITGIEIKG 
DRSLVERPFLTTISHSDSLANTR^LVITTASLVGGPLVGSIVGFIGGVHRFFQGSFSGSF 
YIVS SVLVGIVSGKIGDKLKENHLYPSTSQVILISIIAESIQMLFVGIFTGWELVKMIVI 
PMMILNSLGSTLFLAILKTYLSNESQLRAVQTRDVLELTRQTLPYLRQGLTPQSARSVCE 
IIKRHTNFDAVGLTDRSNVLAHIGVGHDHHIAGQPVKTDLSKSVIFDGEPRIAQDKAAIS 
CPDHNCQLNSAIWPLKINDKTVCALKMYFAGDKTMSEVEENLVLGLAQIFSGQLAMGIT 
EEQNKLASMAEIKALQAQINPHFFFNAINTISALIRIDSDKARYALMQLSTFFRTSLQGG 
QDREVTLEQEKSHVDAYMNVEKLRFPDKYQLSYDISAPEKMKLPPFGLQVLVENAVRHAF 
KERKT DNHI LVQIKPDGHYYCVSVSDNGQG IS DTI I DKLGQETVAE SKGTGTALVNIjNNR 
LNLLYGSVSCLHFSSDKNGTKVWYRIPNRIREDEHENFNS 

SEQ ID NO. 5819 

STRAIN CJB110 frame: 1 
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I^VLLFQRLGIIMILAFLLVNNSYFRQLIEEJRSKRETWLVIIFGLFVIISNITGIEIKG 
DRSLVERPFLTTISHSDSLANTRTLVITTASLVGGPLVGSIVGFIGGVHRFFQGSFSGSF 
YIVSSVLVGIVSGKIGDBCLKENHLYPSTSQVILISIIAESIQMLFVGIFTGWELVKMIVI 
PMMILNSLGSTLFLAILKTYLSNESQLRAVQTRDVLELTRQTLPYLRQGLTPQSARSVCE 
I IKRHTN FDAVGLT DRSNVLAHIGVGHDHHI AGQPVKTDLSKS VI FDGE PRI AQDKAAI S 
CPDHNCQLN SAI WPLKINDKTVGALKMYFAGDKTMSEVEENLVLGLAQI FSGQLAMGIT 
EEQNKLASMAEIKALQAQINPHFFFNAINTISALIRIDSDKARYALMQLSTFFRTSLQGG 
QDREVTLEQEKSHVDAYMNVEKLRFPDKYQLSYDISAPEKMKLPPFGLQVLVENAVRHAF 
KERKTDNHILVQIKPDGHYYCVSVSDNGQGISDTIIDKLGQETVAESKGTGTALVNLNNR 
LNLLYGS VS CLHFS S DKNGTKVWYRI PNRI RE DEHEN FN S 

SEQ ID NO. 5820 

STRAIN 1169NT frame: 1 

LMVLLFQRLGI IMI LAFLLVNNS Y FRQL I EE RSKRETWLV 1 1 FGLFVI I SN ITG IE I KG 
DRSLVERPFLTTISHSDSLANTRTLVITTASLVGGPLVGSIVGFIGGVHRFFQGSFSGSF 
YIVSSVLVGIVSGKIGDKLKENHLYPSTSQVILISIIAESIQMLFVGIFTGWELVKMIVI 
PMMILNSLGSTLFLAILKTYLSNESQLRAVQTRDVLELTRQTLPYLRQGLTPQSARSVCE 
I IKRHTN FDAVGLT DRSNVLAHIGVGHDHH I AGQPVKTDLSKSVI FDGE PRI AQDKAAI S 
CPDHNCQLNSAIWPLKINDKTVGALKMYFAGDKTMSEVEENLVLGLAQIFSGQLAMGIT 
EEQNKLASMAE IKALQAQ IN PHFFFNAINT I S ALI RI DS DKARYALMQLST FFRT SLQGG 
QDREVTLEQEKSHVDAYMNVEKLRFPDKYQLSYDISAPEKMKLPPFGLQVLVENAVRHAF 
KERKTDNHILVQIKPDGHYYCVSVSDNGQGI SDTI I DKLGQETVAESKGTGTALVNLNNR 
LNLLYGSVSCLHFSSDKNGTKVWYRIPNRIREDEHENFNS 

SEQ ID NO. 5821 

STRAIN JM9130013 frame: 1 

LMVLLFQRLGIIMILAFLLVNNSYFRQLIEERSKRETVVLVIIFGLFVIISNITGIEIKG 
DRSLVERPFLTTISHSDSLANTRTLVITTASLVGGPLVGSIVGFIGGVHRFFQGSFSGSF 
YI VS S VLVGI VSGKI GDKLKENHLYPST SQVILISI I AE S IQMLFVGI FTGWELVKMI VI 
PMMILNSLGSTLFLAILKTYLSNESQLRAVQTRDVLELTRQTLPYLRQGLTPQSARSVCE 
IIKRHTNFDAVGLTDRSNVLAHIGVGHDHHIAGQPVKTDLSKSVIFDGEPRIAQDKAAIS 
CPDHNCQLNSAIWPLKINDKTVGALKMYFAGDKTMSEVEENLVLGLAQIFSGQLAMGIT 
EEQNKLASMAEIKALQAQINPHFFFNAINTISALIRIDSDKARYALMQLSTFFRTSLQGG 
QDREVTLEQEKSHVDAYMNVEKLRFPDKYQLSYDISAPEKMKLPPFGLQVLVENAVRHAF 
KERKTDNHILVQIKPDGHYYCVSVSDNGQGI SDTI I DKLGQETVAESKGTGTALVNLNNR 
LNLLYGSVSCLHFSS DKNGTKVWYRI PNRIRE DEHEN FNS 

SEQ ID NO. 5901 
STRAIN 2603 

ATGAATAAAAGAAGAAAATTATCAAAATTGAATGTAAAAAAACATCATTTAGCTTATGGA 
GCTATCACTTTAGTAGCCCTTTTTTCATGTATTTTGGCTGTAATGGTCATCTTTAAAAGT 
TCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAAAGTTCGCGTAGCCAAAAAATCA 
AAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGATGTAAAACAGGCTCCAAAACCT 
TCTCAGGCATCTAATGAAGCCCCAAAATCAAGTTCTCAATCTACAGAAGCTAATTCTCAG 
CAACAAGTTACTGCGAGTGAAGAGGCAGCTGTAGAACAAGCAGTTGTAACAGAAAACACC 
CCTGCTACCAGTCAGGCACAACAAGCTTATGCTGTTACTGAGACAACTTATAGACCTGCT 
CAACACCAGACGAGTGGCCAAGTATTGAGTAATGGAAATAcTGCAGGGGCTATTGGCTCA 
GCAGCTGCAGCACAAATGGCTGCTGCAAcAGGAGTCCCTCAGTCTACTTGGGAAcATATT 
ATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCTAATGCCTCAGGAGCTTCAGGACTT 
TTCCAAACGATGCCAGGTTGGGGTTCAACAGCTACAGTTCAGGATCAAGTTAATTCAGQT 
ATT7VAAGCTTATCGTGCTCAAGGTTTATCAGCTTGGGGTTACTAG 

SEQ ID NO. 5902 

STRAIN JM9130013 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAA 

AGCAGATAAAGTTCGCGTAGCCAAAAAATCAAAAATGAATAAGGCAACAT 
CTAAATCAAAAGTAGAAGGTGTAAAACAGGCTCCAAAACCAAGTTCTCAA 
TCTACAGAAGCTAATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCAGC 
TGTAGAACAAGCAGTTGTAACAGAAAATACCCCTGCTACCAGTCAAGCAC 
AACAAGCTTATGCTGTTACTGAGACAACTTATAGACCTGCTCAACACCAG 
CCGAGTGGCCAAGTATTGAGCAATGGAAATACTGCAGGGGTTATTGGCTC 
AGCAGCAGCAGCACAAATGGCTGCTGCAACGGGAGTTCCTCAGTCTACTT 
GGGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAACGTTGCTAAT 
GCCTCAGGAGCTTCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAAC 



245 



WO 2004/018646 



PCT/US2003/026827 



SEQUENCE LISTING 



AGCTACAGTTCAGGATCAAGTTAATtCAGCTATTAAAGCTTATCGTGCTC 
AAGGTTTATCAGCTTGGGGTTAC 

SEQ ID NO. 5903 

STRAIN 1169NT reverse complement 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAAAGTTCGCGTAGCC 

AAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGATGTAAAACAGGCT 

CCAAAACCTTCTCAGGCATCT7VATGAAGTCCCAAAATCAAGTTCTCAATCTACAGAAGCT 

AATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCGGCTGTAGAACAAGCAGTTGTAACA 

GAAAATACCCCTGCTACCAGTCAGGCACAACAAACTTATGCTGTTACTGAGACAACTTAC 

AAACCTGCTCAACACCAGACAAGTGGCCAAGTATTGAGCAATGGAAATACTGCAGGGGCG 

GTCGGATCTGCTGCTGCAGCACAAATGGCTGCTGCAACAGGAGTCCCTCAGTCTACTTGG 

GAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCTAATGCCTCAGGAGCT 

TCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAACAGCTACAGTTCAGGATCAAGTT 

AATTCAGCTATTAAAGCTTATCGTGCTCAAGGTTTATCAGCTTGGGGTTAC 

SEQ ID NO. 5904 

STRAIN 18RS21 reverse complement 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAAAGTTC 

GCGTAGCCAAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGATGTAA 

AACAGGCTCCAAAACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAGTTCTCAATCTA 

CAGAAGCTAATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCAGCTGTAGAACAAGCAG 

TTGTAACAGAAAACACCCCTGCTACCAGTCAGGCACAACAAGCTTATGCTGTTACTGAGA 

CAACTTATAGACCTGCTCAACACCAGACGAGTGGCCAAGTATTGAGTAATGGAAATACTG 

CAGGGGCTATTGGCTCAGCAGCTGCAGCACAAATGGCTGCTGCAACAGGAGTCCCTCAGT 

CTACTTGGGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCTAATGCCT 

CAGGAGCTTCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAACAGCTACAGTTCAGG 

ATCAAGTTAATTCAGCTATTAAAGCTTATCGTGCTCAAGGTTTATCAGCTTGGGGTTAC 

SEQ ID NO. 5905 

STRAIN 090 reverse complement 

TAGCCAAAAAATCAAAAATGATTAAGGCGACATCTAAATCAAAAGTAGAAGATGTAAAAC 
AGGCTCCAAAACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAGTTCTCAATCTACAG 
AAGCTAATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCAGCTGTAGAACAAGCAGTTG 
TAACAGAAAACACCCCTGCTACCAGTCAGGCACAACAAGCTTATGCTGTTACTGAGACAA 
CTTATAGACCTGCTCAACACCAGACGAGTGGCCAAGTATTGAGTAATGGAAATACTGCAG 
GGGCTATTGGCTCAGCAGCTGCAGCACAAATGGCTGCTGCAACAGGAGTCCCTCAGTCTA 
CTTGGGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCTAATGCCTCAG 
GAGCTTCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAACAGCTACAGTTCAGGA 

SEQ ID NO. 5906 

STRAIN A909 reverse complement 

AAGGCGACATCTAAATCAAAAGTAGAAGATGTAAAACAGGCTCCAAAACCTTCTCAGGCA 
TCTAATGAAGCCCCAAAATCAAGTTCTCAATCTACAGAAGCTAATTCTCAGCAACAAGTT 
ACTGCGAGTGAAGAGGCAGCTGTAGAACAAGCAGTTGTAACAGAAAACACCCCTGCTACC 
AGTCAGGCACAACAAGCTTATGCTGTTACTGAGACAACTTATAGACCTGCTCAACACCAG 
ACAAGTGGCCAAGTATTGAGTAATGGAAATACTGCAGGGGCTATTGGCTCAGCAGCTGCA 
GCACAAATGGCTGCTGCAACAGGAGTCCCTCAGTCTACTTGGGAACATATTATTGCCCGT 
GAATCAAATGGTAATCCTAATGTTGCTAATGCCTCAGGAGCTTCAGGACTTTTCCAAACG 
ATGCCAGGTTGGGGTTCAACAGCTACAGTTCAGAATCAAGTTAATTCAGCTATTAAAGCT 
TATCGTGCTCAAGGTTTATCA 

SEQ ID NO. 5907 

STRAIN CJB110 reverse complement 

AATCTTTGTCAAAAGCAGATAAAGTTCGCGTAGCCAAAAAATCAAAAATGACTAAGGCGA 
CATCTAAATCAAAAGTAGAAGATGTAAAACAGGCTCCAAAACCTTCTCAGGCATCTAATG 
AAGCCCCAAAATCAAGTTCTCAATCTACAGAAGCTAATTCTCAGCAACAAGTTACTGCGA 
GTGAAGAGGCAGCTGTAGAACAAGCAGTTGTAACAGAAAACACCCCTGCTACCAGTCAGG 
CACAACAAGCTTATGCTGTTACTGAGACAACTTATAGACCTGCTCAACACCAGACGAGTG 
GCCAAGTATTGAGTAATGGAAATACTGCAGGGGCTATTGGCTCAGCAGCTGCAGCACAAA 
TGGCTGCTGCAACAGGAGTCCCTCAGTCTACTTGGGAACATATTATTGCCCGTGAATCAA 
ATGGTAATCCTAATGTTGCTAATGCCTCAGGAGCTTCAGGACTTTTCCAAACGATGCCAG 
GTTGGGGTTCAACAGCTACAGTTCAGGATCAAGTTAATTCAGCTATTAAAGCTTATCGTG 
CTCAAGGTTTATCAGCTTGGGGTTAC 



246 



WO 2004/018646 PCTAJS2003/026827 



SEQUENCE LISTING 



SEQ ID NO. 5908 

STRAIN COH1 reverse complement 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAA 

AGTTCGCGTAGCCAAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGA 

TGTAAAACAGGCTCCAAAACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAGTTCTCA 

ATCTACAGAAGCTAATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCGGCTGTAGAACA 

AGCAGTTGTAACAGAAAATACCCCTGCTACCAGTCAGGCACAACAAACTTATGCTGTTAC 

TGAGACAACTTACAJ\ACCTGCTCAACACCAGACAAGTGGCCAAGTATTGAGCAATGGAAA 

TACTGCAGGGGCGGTCGGATCTGCTGCTGCAGCACAAATGGCTGCTGCAACAGGAGTCCC 

TCAGTCTACTTGGGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCTAA 

TGCCTCAGGAGCTTCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAACAGCTACAGT 

TCAGGATCAAGTTAATTCAGCTATTAAAGCTTATCGTGCTCAAGGTTTATCAGCTTGGGG 
TTAC 

SEQ ID NO. 5909 

STRAIN H36B reverse complement 
AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGC 

AGATAAAGTTCGCGTAGCCAAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGT 
AGAAGATGTAAAACAGGCTCCAAAACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAG 
TTCTCAATCTACAGAAGCTAATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCAGCTGT 
AGAACAAGCAGTTGTAACAGAAAACACCCCTGCTACCAGTCAGGCACAACAAGCTTATGC 
TGTTACTGAGACAACTTATAGACCTGCTCAACACCAGACAAGTGGCCAAGTATTGAGTAA 
TGGAAATACTGCAGGGGCTATTGGCTCAGCAGCTGCAGCACAAATGGCTGCTGCAACAGG 
AGTCCCTCAGTCTACTTGGGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGT 
TGCTAATGCCTCAGGAGCTTCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAACAGC 
TACAGTTCAGGATCAAGTTAATTCAGCTATTAAAGCTT 

SEQ ID NO. 5910 

STRAIN M732 reverse complement 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAAAGTTCGCGTAGC 

CAAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGATGTAAAACAGGC 

TCCAAAACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAGTTCTCAATCTACAGAAGC 

TAATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCGGCTGTAGAACAAGCAGTTGTAAC 

AGAAAATACCCCTGCTACCAGTCAGGCACAACAAACTTATGCTGTTACTGAGACAACTTA 

CAAACCTGCTCAACACCAGACAAGTGGCCAAGTATTGAGCAATGGAAATACTGCAGGGGC 

GGTCGGATCTGCTGCTGCAGCACAAATGGCTGCTGCAACAGGAGTCCCTCAGTCTACTTG 

GGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCTAATGCCTCAGGAGC 

TTCAGGACTTTTGCAAACGATGCCAGGTTGGGGTTCAACAGCTACAGTTCAGGATCAAGT 

TAATTCAGCTATTAAAGCTTATCGTGCTCAAGGTTTATCAGCTTGGGGTTA 

SEQ ID NO. 5911 

STRAIN M781 reverse complement 

TCTTTGTCAAAAGCAGATAAAGTTCGCGTAGCCAAAAAATCAAAAATGACTAAGGCGACA 
TCTAAATCAAAAGTAGAAGATGTAAAACAGGCTCCAAAACCTTCTCAGGCATCTAATGAA 
GCCCCAAAATCAAGTTCTCAATCTACAGAAGCTAATTCTCAGCAACAAGTTACTGCGAGT 
GAAGAGGCGGCTGTAGAACAAGCAGTTGTAACAGAAAATACCCCTGCTACCAGTCAGGCA 
CAACAAACTTATGCTGTTACTGAGACAACTTACAAACCTGCTCAACACCAGACAAGTGGC 
CAAGTATTGAGCAATGGAAATACTGCAGGGGCGGTCGGATCTGCTGCTGCAGCACAAATG 
GCTGCTGCAACAGGAGTCCCTCAGTCTACTTGGGAACATATTATTGCCCGTGAATCAAAT 
GGTAATCCTAATGTTGCTAATGCCTCAGGAGCTTCAGGACTTTTCCAAACGATGCCAGGT 
TGGGGTTCAACAGCTACAGTTCAGGATCAAGTTAATTCAGCTATTAAAGCTTATCGTGCT 
CAAGGTTTATCAGCTTGGGGTTAC 

SEQ ID NO. 5912 
STRAIN 2603 frame: 1 

MNKRRKLSKLNVKKHHIAYGAITLVALFSCII^VMVIFKSSQVTTESLSKADKVRVAKKS 
KMTKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEANSQQQVTASEEAAVEQAWTENT 
PATSQAQQAYAVTETTYRPAQHQTSGQVLSNGNTAGAIGSAAAAQMAAATGVPQSTWEHI 
IARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVNSAIKAYRAQGLSAWGY 

SEQ ID NO. 5913 
STRAIN 1169NT frame: 1 

KSSQVTTESLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEVPKSSSQSTEAN 
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S QQQVTASEEAAVEQAWTENT PATS QAQQT YAVTETT YKPAQHQT SGQVLSNGNTAGAV 
GSAAAAQMAAATGVPQSTWEHIIARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVN 
SAIKAYRAQGLSAWGY 

SEQ ID NO. 5914 

STRAIN 18RS21 frame: 1 

KSSQVTTESLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEAN 
SQQQVT ASEEAAVEQAWTENT PAT S QAQQAYAVTETT YRPAQHQTSGQVLSNGNT AGAI 
GSAAAAQMAAATGVPQSTWEHI IARESNGN PNVANASGASGLFQTMPGWGSTATVQDQVN 
SAIKAYRAQGLSAWGY 

SEQ ID NO. 5915 

STRAIN 2603 frame: 1 

KSSQVTTESLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEAN 
S QQQVTASEEAAVEQAWTENT PAT S QAQQAYAVT ETT YRPAQHQT S GQVL SNGNTAGAI 
GSAAAAQMAAATGVPQSTWEHIIARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVN 
SAIKAYRAQGLSAWGY 

SEQ ID NO. 5916 

STRAIN 090 frame: 3 

AKKSKMIKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEANSQQQVTASEEAAVEQAW 
TENTPATSQAQQAYAVTETTYRPAQHQTSGQVLSNGNTAGAIGSAAAAQMAAATGVPQST 
WEHIIARESNGNPNVANASGASGLFQTMPGWGSTATVQ 

SEQ ZD NO. 5917 

STRAIN A909 frame: 1 

KATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEANSQQQVT ASEEAAVEQAWTENT PAT 
SQAQQAYAVTETTYRPAQHQTSGQVLSNGNTAGAIGSAAAAQMAAATGVPQSTWEHIIAR 
ESNGNPNVANASGASGLFQTMPGWGSTATVQNQVNSAIKAYRAQGLS 

SEQ ID NO. 5918 

STRAIN CJB110 frame: 3 

SLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEANSQQQVTAS 
EEAAVEQAWTENTPATSQAQQAYAVTETTYRPAQHQTSGQVLSNGNTAGAIGSAAAAQM 
AAATGVPQSTWEHIIARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVNSAIKAYRA 
QGLSAWGY 

SEQ ID NO. 5919 

STRAIN COH1 frame: 1 

KSSQVTTESLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEAN 
S QQQVTASEEAAVEQAWTENT PAT SQAQQT YAVTETT YKPAQHQT S GQVLSNGNTAGAV 
GSAAAAQMAAATGVPQSTWEHI IARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVN 
SAIKAYRAQGLSAWGY 

SEQ ID NO. 5920 

STRAIN H36B frame: 1 

KSSQVTTESLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEAN 
SQQQVTAS EEAAVEQAWTENT PAT S QAQQAYAVTETT YRPAQHQT SGQVLSNGNT AGAI 
GSAAAAQMAAATGVPQSTWEHIIARESNGN PNVANASGASGLFQTMPGWGSTATVQDQVN 
SAIKA 

SEQ ID NO. 5921 

STRAIN M732 frame: 1 

KSSQVTTESLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEAN 
SQQQVTAS EEAAVEQAWTENT PAT S QAQQT YAVTETT YK PAQHQT SGQVLSNGNTAGAV 
GSAAAAQMAAATGVPQSTWEHIIARESNGN PNVANASGASGLFQTMPGWGSTATVQDQVN 
SAIKAYRAQGLSAWG 

SEQ ID NO. 5922 
STRAIN M781 frame: 4 

SLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEAN SQQQVTAS 
EEAAVEQAWTENT PAT S QAQQT YAVTETT YK PAQHQT S GQVL SNGNTAGAVGSAAAAQM 
AAATGVPQSTWEHIIARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVNSAIKAYRA 
QGLSAWGY 
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SEQ ID NO. 5923 

STRAIN JM9130013 frame: 1 

KSSQVTTESLSKADKVRVAKKSKMNKATSKSKVEGVKQAPKPSSQSTEANSQQQVTASEE 

AAVEC^WTENTPATSQAQQAYAVTETTYRPAQHQPSGQVLSNGNTAGVIGSAAAAQMAA 

ATGVPQSTWEHIIARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVNSAIKAYRAQG 
LSAWGY 

SEQ ID NO. 6001 
STRAIN 2603 

ATGAAAGAAAAACAGTCGAAAAGGCTTATTTATATACTACTGGTTGTTTCCATTATTTTT 

ATAAGTGTTTTTACATACAGTATTAGCCAGCCTTCTAAACTACTTCCACCAAAAGAATTA 

GTTATTCTAAGTCCAAATAGTCAAGCCATTTTAACAGGAACGATTCCAGCTTTTGAGGAA 

AAATACGGTATAAAAGTTAAGCTTATTCAAGGTGGGACAGGGCAACTAATAGATAGATTA 

AGTAAGGAGGGTAAGCAGTTGAAGGCGGATATTTTCTTTGGAGGAAATTATACGCAATTT 

GAAAGTCATAAGGCATTGTTTGAGTCTTACGTATCAAAGAATGTTCATACTGTTATTCCA 

GACTATATCCATCCAAGTGATACGGCGACACCTTATACTATAAATGGGAGTGTCTTGATT 

GTAAATAACGAATTAGCTAAGGGACTTACCATCAAGAGTTATGAAGATTTATTACAGCCT 

TCCTTAAAAGGTAAAATTGCCTTTGCAGATCCGAATACTTCCTCTAGTGCTTTCTCACAA 

CTCACTAATATACTCTTGGCCAAGGGTGGTTACACCAATCCAAAAGCGTGGAACTATGTT 

AAAAAGCTACAACATAATATTAATGCTATCAAATCTTCTAGCTCTTCAGAAGTTTATCAA 

TCAGTTGCAGAAGGAAAAATGATTGTGGGGCTGACTTACGAAGACCCTAGTGTCAATTTG 

CAAAAAAGTGGTGCCAATGTTTCTATTGTATATCCGACAGAAGGGACAGTTTTTGTCCCA 

TCTTCGGTTGCAATTATAAAGAATGCTCCTTCTATGAAAGAAGCAAAGTTATTTATTAAT 

TTTATGCTTTCTTTAGATGTTCAAAATGCCTTTGGGCAGTCAACGAGTAACCGACCTATT 

CGTAAAGATGCCCAAACGAGTAATGGCATGAAAGCTTTAAAGGATATTGCTACTCTTAAA 

GAAGATTATCGCTATGTCACTAAGCATAAGGGCCAAATCCTTAAAACCTATAATCGTATT 
CGTAGAAATGCTGAT 

SEQ ID NO. 6002 

STRAIN 090 

CAGCCTTCTAAACTACTTCCACCAAAAGAATTAGTTATTCTAAGT 

CCAAATAGTCAAGCCATTTTAACAGGAACGATTCCAGCTTTTGAGGAAAA 

ATACGGTATAAAAGTTAAGCTTATTCAAGGTGGGACAGGGCAACTAATAG 

ATAGATTAAGTAAGGAGGGTAAGCAGTTGAAGGCGGATATTTTCTTTGGA 

GGAAATTATACGCAATTTGAAAGTCATAAGGCATTGTTTGAGTCTTACGT 

ATCAAAGAATGTTCATACTGTTATTCCAGACTATATCCATCCAAGTGATA 

CGGCGACACCTTATACTATAAATGGGAGTGTCTTGATTGTAAATAACGAA . 

TTAGCTAAGGGACTTACCATCAAGAGTTATGAAGATTTATTACAGCCTTC 

CTTAAAAGGTAAAATTGCCTTTGCAGATCCGAATACTTCCTCTAGTGCTT 

TCTCACAACTCACTAATATACTCTTGGCCAAGGGTGGTTACACCAATCCA 

AAAGCGTGGAACTATGTTAAAAAGCTACAACATAATATTAATGCTATCAA 

ATCTTCTAGCTCTTCAGAAGTTTATCAATCAGTTGCAGAAGGAAAAATGA 

TTGTGGGGCTGACTTACGAAGACCCTAGTGTCAATTTGCAAAAAAGTGGT 

GCCAATGTTTCTATTGTATATCCGACAGAAGGGACAGTTTTTGTCCCATC 

TTCGGTTGCAATTATAAAGAATGCTCCTTCTATGAAAGAAGCAAAGTTAT 

TTATTAATTTTATGCTTtCTTTAgATGTTCAAAATGCCTTTGGGCAGTCA 

ACGAGTAACCGACCTATTCGTAAAGATGCCCAAACGAGTAATGGCATGAA 

AGCTTTAAAGGATATTGCTACTCTTAAAGAAGATTATCGCTATGTCACTA 

AGCATAAGGGCCAAATCCTTAAAACCTATAATCGTATTCGTAGAAATGCT 

GAT 

SEQ ID NO. 6003 

STRAIN A909 

CAGCCTTCTAAACTACTTCCACCAAAAGAATTAG 

TTATTCTAAGTCCAAATAGTCAAGCCATTTTAACAGGAACGATTCCAGCT 
TTTGAGGAAAAATACGGTATAAAAGTTAAGCTTATTCAAGGTGGGACAGG 
TCAACTAATAGATAGATTAAGTAAGGAGGGTAAGCAGTTGAAGGCGGATA 
TTTTCTTTGGAGGAAATTATACGCAATTTGAAAGTCATAAGGCATTGTTT 
GAGTCTTACGTATCAAAGAATATTCATACTGTTATTCCAGATTATATCCA 
TCCGAGTGATACGGCGACACCTTATACTATAAATGGGAGTGTCTTGATTG 
TAAATAACGAATTAGCTAAGGGACTTACCATCAAGAGTTATGAAGATTTA 
TTACAGCCTTCCTTAAAAGGTAAAATTGCCTTTGCAGATCCGAATACTTC 
CTCTAGTGCTTTCTCACAACTCACTAATATACTCTTGGCCAAGGGTGGTT 
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ACACCAATCCAAAAGCGTGGAACTATGTTAAAAAGCTACAACATAATATT 
AATGCTATCAAATCTTCTAGCTCTTCAGAAGTTTATCAATCAGTTGCAGA 
AGGAAAAATGATTGTGGGGTTGACTTACGAAGACCCTAGTGTCAATTTGC 
AAAAAAGTGGTGCCAATGTTTCTATTGTATATCCGACAGAAGGGACAGTT 
TTTGTCCCATCTTCGGTTGCAATTATAAAGAATGCTCCTTCTATGAAAGA 
AGCAAAGTTATTTATTAATTTTATGCTTTCTTTAGATGTTCAAAATGCCT 
TTGGGCAGTCAACGAGTAACCGACCTATTCGTAAAGATGCCCAAACGAGT 
AATGGCATGAAAGCTTTAAAGGATATTGCTACTCTTAAAGAAGATTATCG 
CTATGTCACTAAGCATAAGGGCCAAATCCTTAAAACCTATAATCGTATTC 
GTAGAAATGCTGAT 

SEQ ID NO. 6004 

STRAIN H36B 

TAAACTACTTCCACCAAAAGAATTAGTTATTCTAAGTCCAAATAGTCAAG 
CCATTTTAACAGGAACGATTCCAGCTTTTGAGGAAAAATACGGTATAAAA 
GTTAAGCTTATTCAAGGTGGGACAGGTCAACTAATAGATAGATTAAGTAA 
GGAGGGTAAGCAGTTGAAGGCGGATATTTTCTTTGGAGGAAATTATACGC 
AATTTGAAAGTCATAAGGCATTGTTTGAGTCTTACGTATCAAAGAATATT 
CATACTGTTATTCCAGATTATATCCATCCGAGTGATACGGCGACACCTTA 
TACTATAAATGGGAGTGTCTTGATTGTAAATAAcGAATTAGTTAAGGGAC 
TTACCATCAAGAGTTATGAAGATTTATTACAGCCTTCCTTAAAAGGTAAA 
ATTGCCTTTGCAGATCCGAATACTTCCTcTAGTGCTTTCTCACAACTCAC 
TAATATACTCTTGGCCAAGGGTGGTTACACCAATCCAAAAGCGTGGAACT 
ATGTTAAAAAGCTACAACATAATATTAATGCTATCAAATCTTCTAGCTCT 
TCAGAAGTTTATCAATCAGTTGCAGAAGGAAAAATGATTGTGGGGTTGAC 
TTACGAAGACCCTAGTGTCAATTTGCAAAAAAGTGGTGCCAATGTTTCTA 
TTGTATATCCGACAGAAGGGACAGTTTTTGTCCCATCTTCGGTTGCAATT 
ATAAAGAATGCTCCTTCTATGAAAGAAGCAAAGTTATTTATTAATTTTAT 
GCTTTCTTTAGATGTTCAAAATGCCTTTGGGCAGTCAACGAGTAACCGAC 
CTATTCGTAAAGATGCCCAAACGAGTAATGGCATGAAAGCTTTAAAGGAT 
ATTGCTACTCTTAAAGAAGATTATCGCTATGTCACTAAGCATAAGGGCCA 
AATCCTTAAAACCTATAATCGTATTCGTAGAAATGCTGAT 

SEQ ID NO. 6005 

STRAIN 18RS21 

CAGCCTTCTAAACTACTTCCACCAAAAGAATTAGTTATTCTAAGTCCAAA 
TAGTCAAGCCATTTTAACAGGAACGATTCCAGCTTTTGAGGAAAAATACG 
GTATAAAAGTTAAGCTTATTCAAGGTGGGACAGGGCAACTAATAGATAGA 
TTAAGTAAGGAGGGTAAGCAGTTGAAGGCGgATATTTTCTTTGGAGGAAA 
TTATACGCAATTTGAAAGTCATAAGGCATTGTTTGAGTCTTACGTATCAA 
AGAATGTTCATACTGTTATTCCAGACTATATCCATCCAAGTGATACGGCG 
ACACCTTATACTATAAATGGGAGTGTCTTGATTGTAAATAACGAATTAGC 
TAAGGGACTTACCATCAAGAGTTATGAAGATTTATTACAGCCTTCCTTAA 
AAGGTAAAATTGCCTTTGCAGATCCGAATACTTCCTCTAGTGCTTTCTCA 
CAACTCACTAATATACTCTTGGCCAAGGGTGGTTACACCAATCCAAAAGC 
GTGGAACTATGTTAAAAAGCTACAACATAATATTAATGCTATCAAATCTT 
CTAGCTCTTCAGAAGTTTATCAATCAGTTGCAGAAGGAAAAATGATTGTG 
GGGCTGACTTACGAAGACCCTAGTGTCAATTTGCAAAAAAGTGGTGCCAA 
TGTTTCTATTGTATATCCGACAGAAGGGACAGTTTTTGTCCCATCTTCGG 
TTGCAATTATAAAGAATGCTCCTTCTATGAAAGAAGCAAAGTTATTTATT 
AATTTTATGCTTTCTTTAGATGTTCAAAATGCCTTTGGGCAGTCAACGAG 
TAACCGACCTATTCGTAAAGATGCCCAAACGAGTAATGGCATGAAAGCTT 
TAAAGGATATTGCTACTCTTAAAGAAGATTATCGCTATGTCACTAAGCAT 
AAGGGCCAAATCCTTAAAACCTATAATCGTATTCGTAGAAATGCTGAT 

SEQ ID NO. 6006 

STRAIN M732 

CAGCCTTCTAAACTACTTCCACCAAAAGAATTAGT 

TATTCTAAGTCCAAATAGTCAAGCCATTTTAACAGGAACGATTCCAGCTT 
TTGAGGAAAAATACGGTATAAAAGTTAAGCTTATTCAAGGTGGGACAGGG 
CAACTAATAGATAGATTAAGTAAGGAGGGTAAGCAGTTGAAGGCGGATAT 
TTTCTTTGGAGGAAATTATACGCAATTTGAAAGTCATAAGGCATTGTTTG 
AGTCTTACGTATCAAAGAATGTTCATACTGTTATTCCAGACTATATCCAT 
CCGAGTGATACGGCGACACCTTATACTATAAATGGGAGTGTCTTGATTGT 
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AAATAACGAATTAGCTAAGGGACTTACCATCAAGAGTTATGAAGATTTAT 
TACAGCCTTCCTTAAAAGGTAAAATTGCCTTTGCAGATCCGAATACTTCC 
TCTAGTGCTTTCTCACAACTCACTAATATACTCTTGGCCAAGGGTGGTTA 
CACCAATCCAAAAGCGTGGAACTATGTTAAAAAGCTACAACATAATATTA 
ATGCTATCAAATCTTCTAGCTCTTCAGAAGTTTATCAATCAGTTGCAGAA 
GGAAAAATGATTGTGGGGTTGACTTACGAAGACCCTAGTGTCAATTTGCA 
AAAAAGTGGTGCCAATGTTTCTATTGTATACCCGACAGAAGGGACAGTTT 
TTGTCCCATCTTCGGTTGCAATTATAAAGAATGCTCCTTCTATGAAAGAA 
GCAAAGTTATTTATTAATTTTATGCTTTCTTTAGATGTTCAAAATGCCTT 
TGGGCAGTCAACGAGTAACCGACCTATTCGTAAAGATGCCCAAACAAGTA 
ATGGCATGAAAGCTTTAAAGGATATCGCTACTCTTAAAGAAGATTATCGC 
TATGTCACTAAGCATAAGAGCCAAATCCTTAAAACCTATAATCGCATTCG 
TAGAAATGCTGAT 

SEQ ID NO. 6007 

STRAIN COH1 

CAGCCTTCTAAACTACTTCCACCAAAAGAATTAGTT 

ATTCTAAGTCCAAATAGTCAAGCCATTTTAACAGGAACGATTCCAGCTTT 
TGAGGAAAAATACGGTATAAAAGTTAAGCTTATTCAAGGTGGGACAGGGC 
AACTAATAGATAGATTAAGTAAGGAGGGTAAGCAGTTGAAGGCGGATATT 
TTCTTTGGAGGAAATTATACGCAATTTGAAAGTCATAAGGCATTGTTTGA 
GTCTTACGTATCAAAGAATGTTCATACTGTTATTCCAGACTATATCCATC 
CGAGTGATACGGCGACACCTTATACTATAAATGGGAGTGTCTTGATTGTA 
AATAACGAATTAGCTAAGGGACTTACCATCAAGAGTTATGAAGATTTATT 
ACAGCCTTCCTTAAAAGGTAAAATTGCCTTTGCAGATCCGAATACTTCCT 
CTAGTGCTTTCTCACAACTCACTAATATACTCTTGGCCAAGGGTGGTTAC 
ACCAATCCAAAAGCGTGGAACTATGTTAAAAAGCTACAACATAATATTAA 
TGCTATCAAAT CT TCTAGCTCTTCAGAAGTTTATCAATCAGTTGCAGAAG 
GAAAAATGATTGTGGGGTTGACTTACGAAGACCCTAGTGTCAATTTGCAA 
AAAAGTGGTGCCAATGTTTCTATTGTATACCCGACAGAAGGGACAGTTTT 
TGTCCCATCTTCGGTTGCAATTATAAAGAATGCTCCTTCTATGAAAGAAG 
CAAAGTTATTTATTAATTTTATGCTTTCTTTAGATGTTCAAAATGCCTTT 
GGGCAGTCAACGAGTAACCGACCTATTCGTAAAGATGCCCAAACAAGTAA 
TGGCATGAAAGCTTTAAAGGATATCGCTACTCTTAAAGAAGATTATCGCT 
ATGTCACTAAGCATAAGAGCCAAATCCTTAAAACCTATAATCGCATTCGT 
AGAAATGCTGAT 

SEQ ID NO. 6008 

STRAIN M781 

CAGCCTTCTAAACTACTTCCACCAAAAGAATTAGTTATT 

CTAAGTCCAAATAGTCAAGCCATTTTAACAGGAACGATTCCAGCTTTTGA 

GGAAAAATACGGTATAAAAGTTAAGCTTATTCAAGGTGGGACAGGGCAAC 

TAATAGATAGATTAAGTAAGGAGGGTAAGCAGTTGAAGGCGGATATTTTC 

TTTGGAGGAAATTATACGCAATTTGAAAGTCATAAGGCATTGTTTGAGTC 

TTACGTATCAAAGAATGTTCATACTGTTATTCCAGACTATATCCATCCGA 

GTGATACGGCGACACCTTATACTATAAATGGGAGTGTCTTGATTGTAAAT 

AACGAATTAGCTAAGGGACTTACCATCAAGAGTTATGAAGATTTATTACA 

GCCTTCCTTAAAAGGTAAAATTGCCTTTGCAGATCCGAATACTTCCTCTA 

GTGCTTTCTCACAACTCACTAATATACTCTTGGCCAAGGGTGGTTACACC 

AATCCAAAAGCGTGGAACTATGTTAAAAAGCTACAACATAATATTAATGC 

TATCAAATCTTCTAGCTCTTCAGAAGTTTATCAATCAGTTGCAGAAGGAA 

AAATGATTGTGGGGTTGACTTACGAAGACCCTAGTGTCAATTTGCAAAAA 

AGTGGTGCCAATGTTTCTATTGTATACCCGACAGAAGGGACAGTTTTTGT 

CCCATCTTCGGTTGCAATTATAAAGAATGCTCCTTCTATGAAAGAAGCAA 

AGTTATTTATTAATTTTATGCTTTCTTTAGATGTTCAAAATGCCTTTGGG 

CAGTCAACGAGTAACCGACCTATTCGTAAAGATGCCCAAACAAGTAATGG 

CATGAAAGCTTTAAAGGATATCGCTACTCTTAAAGAAGATTATCGCTATG 

TCACTAAGCATAAGAGCCAAATCCTTAAAACCTATAATCGCATTCGTAGA 

AATGCTGAT 

SEQ ID NO. 6009 
STRAIN CJB110 

CAGCCTTTTAAACTACTTCCACCAAAAGAATTAGTTATTCT 
AAGTCCAAATAGTCAAGCCATTTTAACAGGAACGATTCCAGCTTTTGAGg 
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AAAAATACGGTATAAAAGTTAAGCTTATTCAAGGTGGGACAGGGCAACTA 

ATAGATAGATTAAGTAAGGAGGGTAAGCAGTTGAAGGCGGATATTTTCTT 

TGGAGGAAATTATACGCAATTTGAAAGTCATAAGGCATTGTTTGAGTCTT 

ACGTATCAAAGAATGTTCATACTGTTATTCCAGACTATATCCATCCAAGT 

GATACGGCGACACCTTATACTATAAATGGGAGTGTCTTGATTGTAAATAA 

CGAATTAGCTAAGGGACTTACCATCAAGAGTTATGAAGATTTATTACAGC 

CTTCCTTAAAAGGTAAAATTGCCTTTGCAGATCCGAATACTTCCTCTAGT 

GCTTTCTCACAACTCACTAATATACTCTTGGCCAAGGGTGGTTACACCAA 

TCCAAAAGCGTGGAACTATGTTAAAAAGCTACAACATAATATTAATGCTA 

TCAAATCTTCTAGCTCTTCAGAAGTTTATCAATCAGTTGCAGAAGGAAAA 

ATGATTGTGGGGCTGACTTACGAAGACCCTAGTGTCAATTTGCAAAAAAG 

TGGTGCCAATGTTTCTATTGTATATCCGACAGAAGGGACAGTTTTTGTCC 

CATCTTCGGTTGCAATTATAAAGAATGCTCCTTCTATGAAAGAAGCAAAG 

TTATTTATTAATTTTATGCTTTCTTTAGATGTTCAAAATGCCTTTGGGCA 

GTCAACGAGTAACCGACCTATTCGTAAAGATGCCCAAACGAGTAATGGCA 

TGAAAGCTTTAAAGGATATTGCTACTCTTAAAGAAGATTATCGCTATGTC 

ACTAAGCATAAGGGCCAAATCCTTAAAACCTATAATCGTATTCGTAGAAA 
TGCTGAT 

SEQ ID NO. 6010 

STRAIN 1169NT 

ATAGTCAAGCCATTTTAACAGGAACGATTCCAGCTTTTGAGGAAAAATAC 
GGTATAAAAGTTAAGCTTATTCAAGGTGGGACAGGGCAACTAATAGATAG 
ATTAAGTAAGGAGGGTAAGCATTTGAAGGCGGATATTTTCTtTGGAGGAA 
ATTATACGCAATTTGAAAGTCATAAGGCATTGTTTGAGTCTTACGTATCA 
AAGAATGTTCATACTGTTATTCCAGACTATATCCATCCAAGTGATACGGC 
GACACCTTATACTATAAATGGGAGTGTCTTGATTGTAAATAACGAATTAG 
CTAAGGGACTTACCATCAAGAGTTATGAAGATTTATTACAGCCTTCCTTA 
AAAGGTAAAATTGCCTTTGCAGATCCGAATACTTCCTCTAGTGCTTTCTC 
ACAACTCACCAATATACTCTTGGCAAAGGGTGGTTACACCAATCCAAAAG 
CGTGGAACTATGTTAAAAAGCTACAACATAATATTAATGCTATCAAATCT 
TCTAGCTCTTCAGAAGTTTATCAATCAGTTGCAGAAGGAAAAATGATTGT 
GGGGTTGACTTACGAAGACCCTAGTGTCAATTtGCAAAAAAGTGGTGCCA 
ATGTTTCTATTGTATATCCGACAGAAGGGACAGTTTTTGTCCCATCTTCG 
GTTGCAATTATAAAGAATGCTCCTTCTATGAAAGAAGCAAAGTTATTTAT 
TAATTTTATGCTTTCTTTAGATGTTCAAAATGCCTTTGGGCAGTCAACGA 
GTAACCGACCTATTCGTAAAGATGCCCAAACGAGTAATGGCATGAAAGCT 
TTAAAGGATATTGCTACTCTTAAAGAAGATTATCGCTATGTCACTAAGCA 
TAAGGGCCAAATCCTTAAAACCTATAATCGTATTCGTAGAAATGCTGAT 

SEQ ID NO. 6011 

STRAIN JM91130013 

CAGCCTTCT AAACTACTT CCACCAAAAGAATTAGT 

TATTCTAAGTCCAAATAGTCAAGCCATTTTAACAGGAACGATTCCAGCTT 

TTGAGGAAAAATACGGTATAAAAGTTAAGCTTATTCAAGGTGGGACAGGG 

CAACTAATAGATAGATTAAGTAAGGAGGGTAAGCAGTTGAAGGCGGATGT 

TTTCTTTGGAGGAAATTATACGCAATTTGAAAGTCATAAGGCATTGTTTG 

AGTCTTACGTATCAAAGAATGTTCATACTGTTATTCCAGACTATATCCAT 

CCGAGTGATACGGCGACACCTTATACTATAAATGGGAGTGTCTTGATTGT 

AAATAACGAATTAGCTAAGGGACTTACCATCAAGAGTTATGAAGATTTAT 

TACAGCCTTCCTTAAAAGGTAAAATTGCCTTTGCAGATCCGAATACTTCC 

TCTAGTGCTTTCTCACAACTCACCAATATACTCTTGGCAAAGGGTGGTTA 

CACCAATCCAAAAGCGTGGAACTATGTTAAAAAGCTACAACATAATATTA 

ATGCTATCAAATCTTCTAGCTCTTCAGAAGTTTATCAATCAGTTGCAGAA 

GGCAAAATGATTGTGGGGCTGACTTACGAAGACCCTAGTGTCAATTTGCA 

AAAAAGTGGTGCCAATGTTTCTATTGTGTATCCGACAGAAGGGACAGTTT 

TTGTCCCATCTTCGGTTGCAATTATAAAGAATGCTCCTTCTATGAAAGAA 

GCAAAGTTATTTATTAATTTTATGCTTTCTTTAGATGTTCAAAATGCCTT 

TGGGCAGTCAACGAGTAACCGACCTATTCGTAAAGATGCCCAAACGAGTA 

ATGGCATGAAAGCTTTAAAGGATATTGCTACTCTTAAAGAAGATTATCGC 

TATGTCACTAAGCATAAGGGCCAAATCCTTAAAACCTATAATCGTATTCG 
TAGAAATGCTGAT 

SEQ ID NO. 6012 
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STRAIN 2603 frame: 1 

MKEKQSKRLIYILLVVSIIFISVFTYSISQPSKLLPPKELVILSPNSQAILTGTIPAFEE 
KYGIKVKLIQGGTGQLIDRLSKEGKQLKADIFFGGNYTQFESHKALFESWSKNVHTVIP 
DYIHPSDTATPYTINGSVLIVNNELAKGLTIKSYEDLLQPSLKGKIAFADPNTSSSAFSQ 
LTNILLAKGGYTNPKAWNYVKKLQHNINAIKSSSSSEVYQSVAEGKMIVGLTYEDPSVNL 
QKSGANVSIVYPTEGTVFVPSSVAIIKNAPSMKEAKLFINFMLSLDVQNAFGQSTSNRPI 
RKDAQT SNGMKALKD I ATLKE D YR YVTKHKGQI LKTYNR I RRNAD 

SEQ ID NO. 6013 

STRAIN 090 frame: 1 

QPSKLLPPKELVILSPNSQAILTGTIPAFEEKYGIKVKLIQGGTGQLIDRLSKEGKQLKA 
DIFFGGNYTQFESHKALFESYVSKNVHTVIPDYIHPSDTATPYTINGSVLIVNNELAKGL 
TIKSYEDLLQPSLKGKIAFADPNTSSSAFSQLTNILLAKGGYTNPKAWNYVKKLQHNINA 
IKSS S SSEVYQS VAEGKMI VGLT YE DPS VNLQKSGANVS I VYPTEGTVFVPS SVAI IKNA 
PSMKEAKL FIN FMLS LDVQNAFGQSTSNR PI RKDAQT SNGMKALKDIATLKE DYRYVTKH 
KGQILKT YNRI RRNAD ' 

SEQ ID NO. 6014 

STRAIN A909 frame: 1 

QPSKLLPPKELVILSPNSQAILTGTIPAFEEKYGIKVKLIQGGTGQLIDRLSKEGKQLKA 
DI FFGGNYTQFESHKALFE S YVSKNIHT VI PDYIHPS DTAT PYTINGSVLI VNNELAKGL 
TIKSYEDLLQPSLKGKIAFADPNTSSSAFSQLTNILLAKGGYTNPKAWNYVKKLQHNINA 
IKS S S S SEVYQSVAEGKMIVGLTYE D PS VNLQKSGANVS I VYPTEGTVFVPS SVAI I KNA 
PSMKEAKLFINFMLSLDVQNAFGQSTSNRPIRKDAQTSNGMKALKDIATLKEDYRYVTKH 
KGQILKT YNRIRRNAD 

SEQ ID NO. 6015 

STRAIN H36B frame: 2 

KLLPPKELVILSPNSQAILTGTIPAFEEKYGIKVKLIQGGTGQLIDRLSKEGKQLKADIF 
FGGNYTQFESHKALFESYVSKNIHTVIPDYIHPSDTATPYTINGSVLIVNNELVKGLTIK 
S YEDLLQPSLKGKI AFADPNTS S S AFSQLTN I LLAKGGYTNPKAWN YVKKLQHNINAI KS 
SSSSEVYQSVAEGKMIVGLTYEDPSVNLQKSGANVS I VYPTEGTVFVPS SVAI IKNAPSM 
KEAKLFINFMLSLDVQNAFGQSTSNRPIRKDAQT SNGMKALKD I ATLKE DYRYVTKHKGQ 
I LKTYNR I RRNAD 

SEQ ID NO. 6016 

STRAIN 18RS21 frame: 1 

QPSKLLP PKELVILS PNSQAI LTGT I P AFEEKYGIKVKLIQGGTGQLI DRLSKEGKQLKA 
DIFFGGNYTQFESHKALFESYVSKNVHTVI PDYIHPS DTATPYTINGSVLIVNNEIAKGL 
T I KS YE DLLQPS LKGKI AFADPNT S S S AFS QLTN I LLAKGG YTN PKAWN Y VKKLQHN I N A 
IKSSSSSEVYQSVAEGKMIVGLTYEDPSVNLQKSGANVS I VYPTEGTVFVPS SVAI IBCNA 
PSMKEAKLFINFMLSLDVQNAFGQSTSNRPIRKDAQTSNGMKALKDIATLKEDYRYVTKH 
KGQILKT YNRIRRNAD 

SEQ ID NO. 6017 

STRAIN M732 frame: 1 

QPSKLLPPKELVILS PNSQAI LTGT I PAFEEKYGIKVKL I QGGTGQLI DRLSKEGKQLKA 
DIFFGGNYTQFESHKALE*ESYVSKNVHTVI PDYIHPS DTAT PYTINGSVLI VNNELAKGL 
TIKSYEDLLQPSLKGKIAFADPNTSSSAFSQLTNILLAKGGYTNPKAWNYVKKLQHNINA 
IKS SSSSEVYQSVAEGKMIVGLTYEDPSVNLQKSGANVSIVYPTEGTVFVPS SVAI IKNA 
P SMKEAKLFIN FMLS LDVQNAFGQS T SNRPI RKDAQT SNGMKALKDIATLKE DYRYVTKH 
KSQILKT YNRIRRNAD 

SEQ ID NO. 6018 

STRAIN COH1 frame: 1 

QPSKLL P PKELVILS PNSQAI LTGT I PAFEEKYG I KVKLI QGGTGQLI DRLSKEGKQLKA 
DIFFGGNYTQFESHKALFESYVSKNVHTVIPDYIHPSDTATPYTINGSVLIVNNELAKGL 
T IKS YEDLLQPSLKGKI AFADPNTS SSAFSQLTN I LLAKGG YTN PKAWN YVKKLQHN IN A 
IKSSSSSEVYQSVAEGKMIVGLTYEDPSVNLQKSGANVSIVYPTEGTVFVPSSVAIIKNA 
PSMKEAKL FIN FMLS LDVQNAFGQS TSNRPIRKDAQT SNGMKALKDIATLKE DYRYVTKH 
KSQILKT YNRIRRNAD 

SEQ ID NO. 6019 

STRAIN M781 frame: 1 
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QPSKLLPPKELVILSPNSQAILTGTIPAFEEKYGIKVKLIQGGTGQLIDRLSKEGKQLKA 
DIFFGGNYTQFESHKALFESYVSKNVHTVIPDYIHPSDTATPYTINGSVLIVNNELAKGL 
T I KS YE DLLQP S LKGKI AFADPNTS S S AFS QLTN I LLAKGGYTN PKAWNYVKKLQHN INA 
IKSSSSSEVYQSVAEGKMIVGLTYEDPSVNLQKSGANVSIVYPTEGTVFVPSSVAIIKNA 
PSMKEAKLFINFMLSLDVQNAFGQSTSNRPIRKDAQTSNGMKALKDIATLKEDYRYVTKH 
KSQILKTYNRIRRNAD 

SEQ ZD NO. 6020 

STRAIN CJB110 frame: 1 

QPFKLLPPKELVILSPNSQAILTGTIPAFEEKYGIKVKLIQGGTGQLIDRLSKEGKQLKA 

DIFFGGNYTQFESHKALFESYVSKNVHTVIPDYIHPSDTATPYTINGSVLIVNNELAKGL 

TIKSYEDLLQPSLKGKIAFADPNTSSSAFSQLTNILIAKGGYTNPKAWNYVKKLQHNINA . 

IKSSSSSEVYQSVAEGKMIVGLTYEDPSVNLQKSGANVSIVYPTEGTVFVPSSVAIIKNA 

PSMKEAKLFINFMLSLDVQNAFGQSTSNRPIRKDAQTSNGMKALKDIATLKEDYRYVTKH 

KGQILKTYNRIRRNAD 

SEQ ZD NO. 6021 

STRAIN 1169NT frame: 3 

SQAILTGTIPAFEEKYGIKVKLIQGGTGQLIDRLSKEGKHLKADIFFGGNYTQFESHKAL 
FESYVSKNVHTVIPDYIHPSDTATPYTINGSVLIVNNELAKGLTIKSYEDLLQPSLKGKI 
AFADPNTS S SAFSQLTN I LLAKGGYTN PKAWNYVKKLQHN IN AI KSSSS SE VYQS VAEGK 
MIVGLTYEDPSVNLQKSGANVSIVYPTEGTVFVPSSVAIIKNAPSMKEAKLFINFMLSLD 
VQNAFGQSTSNRPIRKDAQTSNGMKALKDIATLKEDYRYVTKHKGQILKTYNRIRRNAD 

SEQ ID NO. 6022 

STRAIN JM91130013 frame: 1 

QPSKLLPPKELVILSPNSQAILTGTIPAFEEKYGIKVKLIQGGTGQLIDRLSKEGKQLKA 
DVFFGGNYTQFESHKALFESYVSKNVHTVIPDYIHPSDTATPYTINGSVLIVNNELAKGL 
TIKSYEDLLQPSLKGKIAFADPNTSSSAFSQLTNILLAKGGYTNPKAWNYVKKLQHNINA 
IKSSSSSEVYQSVAEGKMIVGLTYEDPSVNLQKSGANVSIVYPTEGTVFVPSSVAIIKNA 
PSMKEAKLFINFMLSLDVQNAFGQSTSNRPIRKDAQTSNGMKALKDIATLKEDYRYVTKH 
KGQILKTYNRIRRNAD 

SEQ ZD NO. 6101 
STRAIN 2603 

ATGGTAAAAGTTAGTGTAAGTTCTGTAGGAACTCAAGCATCAACAGTAGCTATTTCTATG 

TTTAGTCGTGTATCGGCTTTAAATGATGCAATAACAAAACTATCATCTTTTGCAGAGGCT 

GCAACTCTTCAAGGGACTGCTTATTCAAATGCAAAAAGCTATGCTACTGGAACGTTAACT 

CCGATGCTTCAAGGAATGATTCTTTTCTCTGAAACATTGAGTGAGAAATGTACAGAATTA 

CAAACCTTATATGTCTCAATTTGTGGTGATGAGGATTTAGACTCTGTCGTTTTAGAATCA ' 

AAATTAGCAAGTGATAGGGCATCATTAAAGATTGCTGAAGCACTTTTAGAGCATCTTAAC 

GATGATCCAGAACCTTCCAAATCTGCCATAAGTTCTACAAAAAGTAATATTAAAAAATTA 

AAAAAACGTATAAAATCTAATCAAAAGAAATTAGACAACCTTAATGAATTTAACGCCCAT 

TCAGCAACAGTATTTGCGGACATTTCTAATGCACAGTCAACTGTTAACCAAGCACTAGCG 

GCTGTTTCAACAGGATTTTCTGGATATAATAGTAAAACCGGAGCTTTTGGAAAACCAACA 

TCCGGACAGATGGAATGGACAAAGACAGTTAAGAAGAATTGGAAAGAGCGAGAAGACGCC 

AAAGCTGAAGAACTGAAAAGTAAAAAGGCTGAAGAAAGTAAGAAAGCTTCAAAAATTGAA 

AATACTACTAAAAAAAGTAATGTTTCAGTTGATAAAAAGAAATTAATAAAAGCGGCTAAT 

GAAGCGTATAAATTAGGAGAAATTAAAAAAGATACCTATGAATCAATTATCAGTGGTTTA 

AGTAATGCATCGGCTGCCTTACTTAAAGAGGTAGCTAAATCAAAATTGACTGACACAGCT 

CGGCTATTGATG 

SEQ ID NO. 6102 

STRAIN 090 

TTAAATGATGCAATAACAAAACTATCATCTTTTGCAGAGGCT 

GCAACTCTTCAAGGGACTGCTTATTCAAATGCAAAAAGCTATGCTACTGG 

AACGTTAACTCCGATGCTTCAAGGAATGATTCTTTTCTCTGAAACATTGA 

GTGAGAAATGTACAGAATTACAAACCTTATATGTCTCAATTTGTGGTGAT 

GAGGATTTAGACTCTGTCGTTTTAGAATCAAAATTAGCAAGTGATAGGGC 

ATCATTAAAGATTGCTGAAGCACTTTTAGAGCATCTTAACGATGATCCAG 

AACCTTCCAAATCTGCCATAAGTTCTACAAAAAGTAATATTAAAAAATTA 

AAAAAACGTATAAAATCTAATCAAAAGAAATTAGACAACCTTAATGAATT 

TAACGCCCATTCAGCAACAGTATTTGCGGACATTTCTAATGCACAGTCAA 

CTGTTAACCAAGCACTAGCGGCTGTTTCAACAGGATTTTCTGGATATAAT 
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AGTAAAACCGGAGCTTTTGGAAAACCAACATCCGGACAGATGGAATGGAC 
AAAGACAGTTAAGAAGAATTGGAAAGAGCGAGAAGACGCCAAAGCTGAAG 
AACTGAAAAGTAAAAAGGCTGAAGAAAGTAAGAAAGCTTCAAAAATTGAA 
AATACTACTAAAAAAAGTAATGTTTCAGTTGATAAAAAGAAATTAATAAA 
AGCGGCTAATGAAGCGTATAAATTAGGAGAAATTAAAAAAGATACCTATG 
AATCAATTATCAGTGGTTTAAGTAATGCATCGGCTGCCTTACTTAAAGAG 
GTAGCTAAATCAAAATTGACTGACACAGCTCGGCTATTGATG 

SEQ ID NO. 6103 

STRAIN 18RS21 

TTAAATGATGCAATAACAAAACTATCATCTTTTGCAGAGGC 

TGCAACTCTTCAAGGGACTGCTTATTCAAATGCAAAAAGCTATGCTACTG 

GAACGTTAACTCCGATGCTTCAAGGAATGATTCTTTTCTCTGAAACATTG 

AGTGAGAAATGTACAGAATTACAAACCTTATATGTCTCAATTTGTGGTGA 

TGAGGATTTAGACTCTGTCGTTTTAGAATCAAAATTAGCAAGTGATAGGG 

CATCATTAAAGATTGCTGAAGCACTTTTAGAGCATCTTAACGATGATCCA 

GAACCTTCCAAATCTGCCATAAGTTCTACAAAAAGTAATATTAAAAAATT 

AAAAAAACGTATAAAAT CTAATCAAAAGAAATTAGACAACCTTAATGAAT 

TTAACGCCCATTCAGCAACAGTATTTGCGGACATTTCTAATGCACAGTCA 

ACTGTTAACCAAGCACTAGCGGCTGTTTCAACAGGATTTTCTGGATATAA 

TAGTAAAACCGGAGCTTTTGGAAAACCAACATCCGGACAGATGGAATGGA 

CAAAGACAGTTAAGAAGAATTGGAAAGAGCGAGAAGACGCCAAAGCTGAA 

GAACTGAAAAGTAAAAAGGCTGAAGAAAGTAAGAAAGCTTCAAAAATTGA 

AAATACTACTAAAAAAAGTAATGTTTCAGTTGATAAAAAGAAATTAATAA 

AAGCGGCTAATGAAGCGTATAAATTAGGAGAAATTAAAAAAGATACCTAT 

GAATCAATTATCAGTGGTTTAAGTAATGCATCGGCTGCCTTACTTAAAGA 

GGTAGCTAAATCAAAATTGACTGACACAGCTCGGCTATTGATG 

SEQ ID NO. 6104 

STRAIN 2603 frame: 1 

MVKVSVSSVGTQASTVAISMFSRVSALNDAITKLSSFAEAATLQGTAYSNAKSYATGTLT 

PMLQGMILFSETLSEKCTELQTLYVSICGDEDLDSWLESKLASDRASLKIAEALLEHLN 

DDPEPSKSAISSTKSNIKKLKKRIKSNQKKLDNLNEFNAHSATVFADISNAQSTVNQALA 

AVSTGFSGYNSKTGAFGKPTSGQMEWTKTVKKNWKEREDAKAEELKSKKAEESKKASKIE 

NTTKKSNVSVDKKKLIKAANEAYKLGEIKKDTYESIISGLSNASAALLKEVAKSKLTDTA 
RLLM 

SEQ ID NO. 6105 

STRAIN 090 frame: 1 

LNDAITKLSSFAEAATLQGTAYSNAKSYATGTLTPMLQGMILFSETLSEKCTELQTLYVS 
ICGDEDLDSWLESKLASDRASLKIAEALLEHLNDDPEPSKSAISSTKSNIKKLKKRIKS 
NQKKLDNLNEFNAHSATVFADISNAQSTVNQALAAVSTGFSGYNSKTGAFGKPTSGQMEW 
TKTVKKNWKEREDAKAEELKSKKAEESKKASKIENTTKKSNVSVDKKKLIKAANEAYKLG 
EIKKDTYESIISGLSNASAALLKEVAKSKLTDTARLLM 

SEQ ID NO. 6106 

STRAIN 18RS21 frame: 1 

LNDAITKLSSFAEAATLQGTAYSNAKSYATGTLTPMLQGMILFSETLSEKCTELQTLYVS 
ICGDEDLDSWLESKLASDRASLKIAEALLEHLNDDPEPSKSAISSTKSNIKKLKKRIKS 
NQKKLDNLNEFNAHSATVFADISNAQSTVNQALAAVSTGFSGYNSKTGAFGKPTSGQMEW 
TKTVKKNWKEREDAKAEELKSKKAEESKKASKIENTTKKSNVSVDKKKLIKAANEAYKLG 
E IKKDTYE S 1 1 SGLSNASAALLECE VAKSKLT DTARLLM 

SEQ ID NO. 6201 
STRAIN 2603 

ATGATTTTAAAAATTTGTCGTGCAGCATATAGTTTACAATGGGGAGGTGTTTACCAATTA 
GCTTTGCTGGATTATCCTCGAATTAAGGCGTTTGAATTGGAAAGGATAGGAGCTTTCATA 
GCTTACGAGAAACAATATAAAAGAAAAACTGAGATACAATGTGACGATAAACATCTCCTC 
GCAAAAATTGTTCATTTTTTAAAATACAATAGTTTTACTTTTCCCTATATTCCCAAATAT 
AGAGAAGCGGCAGCTACTTTTAATGAGGATGGTATTAGTTTAACTTCTGATTTTTTAAGC 
CATACATGTACGATTGAAACTGCAAAACTAATTTTTAAAGAAGGTAAAATCTTATCAGCA 
GTTAAAGCCTTTAATAAGCCTGCTGAAGTACTGGTAAAAGATAAGAGGAATGCTGCTGGA 
GACCCTAAAGATTACTTTGACTATGTGATGTTGAACTGGTCAAATACCAATTCTGGTTAT 
CGTTTAGTAATGGAAAGATTGTTAGGCAAAGCACCATCTGAACAGGAGTTAACAGTAGGT 
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TTTAAGCCAGGGGTCAGTTTTCATTTTACTTATCAAGATATCATCAATCATCCTGATTCT 
ATTTTTGATGGTTATCATCCTGCTAAAATTAAAAATCAGCTTTCTTTAGCAGAACATTTA 
GTTGCATGTGTTATCCCAAAACATTATCAAGAAGATTATCAAAGCCTTGTGCCCAATGAC 
TTGAAACACAGGGTTTATTATTTAGATTACTGTAACGAAACACTTTATGAGTGGAATCAA 
AAAGTTTATGATTTTCTTTGTCATTTGGAAAATAAA 

SEQ XD NO. 6202 
STRAIN 090 

TGGATTATCCTCTAATTAAGGCGTTTGAATTGGAAAGGATAGGAGCTTTC 
ATAGCTTACGAGAAACAATATAAAAGAAAAATTGAGATACAATGTGACGA 
TAAACATCTCCTCACAAAAATTGTTCATTTTTTAAAATACAATAGTTTTA 
CTTTTCCCTATATTCCCAAATATAGAGAAGCGGCAGCTACTTTTAATGAG 
GATGGTATTAGTTTAACTTCTGATTTTTTAAGCCATACATGTACGATTGA 
AACTGCAAAACTAATTTTTAAAGAAGGTAAAATCTTATCAGCAGTTAAAG 
CCTTTAATAAGCCTGCTGAAGTACTGGTAAATGATAAGAGGAATGCTGCT 
GGAGACCCTAAAGATTACTTTGACTATGTGATGTTGAACTGGTCAAATAC 
CAATTCTGGTTATCGTTTAGTAATGGAAAGATTGTTAGGCAAAGCACCAT 
CTGAACAGGAGTTAACAGTAGCTTTTAAGCCAGGGGTCAGCTTTCATTTT 
AATTaTCAAGATATCATCAATCATCCTGATTCTATTTTTGATGGTTATCA 
TCCTGCTAAAATTAAAAJVTCAACTTTCTTTAGCAGAACATTTAGTTGCAT 
GTGTTATCCCAAAACATfATCAAGAAGATTATCAAAGCCTTGTGCCTAAT 
GACTTGAAACACAGAGTTTATTATTTAGATTACTGTAACGAAACACTTTA 
TGAGTGGAATCAAAAAGTTTATGATTTTCTTTGTCATTTGGAAAATAAA 

SEQ XD NO. 6203 
STRAIN A909 

TTGCTGGATTATCCTCGAATTAAGGCGTTTGAATTGGAAAGGATA 

GGAGCTTTCATAGCTTACGAGAAACAATATAAAAGAAAAATTGAGATACA 

AT GT GACG AT AAACATC TCCT CACAAAAAT T GTT C AT T T TTTAAAATACA 

ATAGTTTTACTTTTCCCTATATTCCCAAATATAGAGAAGCGGCAGCTACT 

TTTAATGAGGATGGTATTAGTTTAACTTCTGATTTTTTAAGCCATACATG 

TACGATTGAAACTGCAAAACTAATTTTTAAAGAAGGTAAAATCTTATCAG 

CAGTTAAAGCCTTTAATAAGCCTGCTGAAGTACTGGTAAATGATAAGAGG 

AATGCTGCTGGAGACCCTAAAGATTACTTTGACTATGTGATGTTGAACTG 

GTCAAATACCAATTCTGGTTATCGTTTAGTAATGGAAAGATTGTTAGGCA 

AAGCACCATCTGAACAGGAGTTAACAGTAGCTTTTAAGCCAGGGGTCAGC 

TTTCATTTTAATTATCAAGATATCATCAATCATCCTGATTCTATTTTTGA 

TGGTTATCATCCTGCTAAAATTAAAAATCAACTTTCTTTAGCAGAACATT 

TAGTTGCATGTGTTATCCCAAAACATTATCAAGAAGATTATCAAAGCCTT 

GTGCCTAATGACTTGAAACACAGAGTTTATTATTTAGATTACTGTAACGA 

AACACTTTATGAGTGGAATCAAAAAGTTTATGATTTTCTTTGTCATTTGG 

AAAATAAA 

SEQ ID NO. 6204 
STRAIN H36B 

TTAAGGCGTTTGAATTGGAAAGGATAGGAGCTTTCATAGCTTACGAGAAA 
CAATATAAAAGAAAAATTGAGATACAATGTGACGATAAACATCTCCTCAC 
AAAAATTGTTCATTTTTTAAAATACAATAGTTTTACTTTTCCCTATATTC 
CCAAATATAGAGAAGCGGCAGCTACTTTTAATGAGGATGGTATTAGTTTA 
ACTTCTGATTTTTTAAGCCATACATGTACGATTGAAACTGCAAAACTAAT 
TTTTAAAGAAGGTAAAATCTTATCAGCAGTTAAAGCCTTTAATAAGCCTG 
CTGAAGTACTGGTAAATGATAAGAGGAATGCTGCTGGAGACCCTAAAGAT 
TACTTTGACTATGTGATGTTGAACTGGTCAAATACCAATTCTGGTTATCG 
TTTAGTAATGGAAAGATTGTTAGGCAAAGCACCATCTGAACAGGAGTTAA 
CAGTAGCTTTTAAGCCAGGGGTCAGCTTTCATTTTAATTATCAAGATATC 
ATCAATCATCCTGATTCTATTTTTGATGGTTATCATCCTGCTAAAATTAA 
AAATCAACTTTCTTTAGCAGAACATTTAGTTGCATGTGTTATCCCAAAAC 
ATTATCAAGAAGATTATCAAAGCCTTGTGCCTAATGACTTGAAACACAGA 
GTTTATTATTTAGATTACTGTAACGAAACACTTTATGAGTGGAATCAAAA 
AGTTTATGATTTTCTTTGTCATTTGG AAAATAAA 

SEQ ID NO. 6205 
STRAIN 18RS21 

TTGCTGGATTATCCTCGAATTAAGGCGTT 
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TGAATTGGAAAGGATAGGAGCTTTCATAGCTTACGAGAAACAATATAAAA 
GAAAAACTGAGATACAATGTGACGATAAACATCTCCTCGCAAAAATTGTT 
CATTTTTTAAAATACAATAGTTTTACTTTTCCCTATATTCCCAAATATAG 
AGAAGCGGCAGCTACTTTTAATGAGGATGGTATTAGTTTAACTTCTGATT 
TTTTAAGCCATACATGTACGATTGAAACTGCAAAACTAATTTTTAAAGAA 
GGTAAAATCTTATCAGCAGTTAAAGCCTTTAATAAGCCTGCTGAAGTACT 
GGTAAAAGATAAGAGGAATGCTGCTGGAGACCCTAAAGATTACTTTGACT 
ATGTGATGTTGAACTGGTCAAATACCAATTCTGGTTATCGTTTAGTAATG 
GAAAGATTGTTAGGCAAAGCACCATCTGAACAGGAGTTAACAGTAGGTTT 
TAAGCCAGGGGTCAGTTTTCATTTTACTTATCAAGATATCATCAATCATC 
CTGATTCTATTTTTGATGGTTATCATCCTGCTAAAATTAAAAATCAGCTT 
TCTTTAGCAGAACATTTAGTTGCATGTGTTATCCCAAAACATTATCAAGA 
AGATTATCAAAGCCTTGTGCCCAATGACTTGAAACACAGGGTTTATTATT 
TAGATTACTGTAACGAAACACTTTATGAGTGGAATCAAAAAGTTTATGAT 
TTTCTTTGTCATTTGGAAAATAAA 

SEQ ID NO. 6206 
STRAIN M732 

TTGCTGGATTATCCTCGAATTAAGGCGTT 

TGAATTGGAAAGGATAGGAGCTTTCATAGCTTACGAGAAACAATATAAAA 
GAAAAACTGAGATACAATGTGACGATAAACATCTCCTCGCAAAAATTGTT 
CATTTTTTAAAATACAATAGTTTTACTTTTCCCTATATTCCCAAATATAG 
AGAAGCGGCAGCTACTTTTAATGAGGATGGTATTAGTTTAACTTCTGATT 
TTTTAAGCCATACATGTACGATTGAAACTGCAAAACTAATTTTTAAAGAA 
GGTAAAATCTTATCAGCAGTTAAAGCCTTTAATAAGCCTGCTGAAGTACT 
GGTAAAAGATAAGAGGAATGCTGCTGGAGACCCTAAAGATTACTTTGACT 
ATGTGATGTTGAACTGGTCAAATACCAATTCTGGTTATCGTTTAGTAATG 
GAAAGATTGTTAGGCAAAGCACCATCTGAACAGGAGTTAACAGTAGGTTT 
TAAGCCAGGGGTCAGTTTTCATTTTACTTATCAAGATATCATCAATCATC 
CTGATTCTATTTTTGATGGTTATCATCCTGCTAAAATTAAAAATCAGCTT 
TCTT TAGCAGAAC AT TTAGT TG CAT GT GTT AT CCC AAAAC AT TAT CAAG A 
AGATTATCAAAGCCTTGTGCCCAATGACTTGAAACACAGGGTTTATTATT 
TAGATTACTGTAACGAAACACTTTATGAGTGGAATCAAAAAGTTTATGAT 
TTTCTTTGnCATTTGGAAAATAAA 

SEQ ZD NO. 6207 
STRAIN COH1 
TTGCTGGAT 

TATCCTCGAATTAAGGCGTTTGAATTGGAAAGGATAGGAGCTTTCATAGC 
TTACGAGAAACAATATAAAAGAAAAACTGAGATACAATGTGACGATAAAC 
ATCTCCTCGCAAAAATTGTTCATTTTTTAAAATACAATAGTTTTACTTTT 
CCCTATATTCCCAAATATAGAGAAGCGGCAGCTACTTTTAATGAGGATGG 
TATTAGTTTAACTTCTGATTTTTTAAGCCATACATGTACGATTGAAACTG 
CAAAACTAATTTTTAAAGAAGGTAAAATCTTATCAGCAGTTAAAGCCTTT 
AATAAGCCTGCTGAAGTACTGGTAAAAGATAAGAGGAATGCTGCTGGAGA 
CCCTAAAGATTACTTTGACTATGTGATGTTGAACTGGTCAAATACCAATT 
CTGGTTATCGTTTAGTAATGGAAAGATTGTTAGGCAAAGCACCATCTGAA 
CAGGAGTTAACAGTAGGTTTTAAGCCAGGGGTCAGTTTTCATTTTACTTA 
TCAAGATATCATCAATCATCCTGATTCTATTTTTGATGGTTATCATCCTG 
CTAAAATTAAAAATCAGCTTTCTTTAGCAGAACATTTAGTTGCATGTGTT 
ATCCCAAAACATTATCAAGAAGATTATCAAAGCCTTGTGCCCAATGACTT 
GAAACACAGGGTTTATTATTTAGATTACTGTAACGAAACACTTTATGAGT 
GGAATCAAAAAGTTTATGATTTTCTTTGGCATTTGGAAAATAAA 

SEQ ID NO. 6208 
STRAIN M781 
TTGCTGGA 

TTATCCTCGAATTAAGGCGTTTGAATTGGAAAGGATAGGAGCTTTCATAG 
CTTACGAGAAACAATATAAAAGAAAAACTGAGATACAATGTGACGATAAA 
CATCTCCTCGCAAAAATTGTTCATTTTTTAAAATACAATAGTTTTACTTT 
TCCCTATATTCCCAAATATAGAGAAGCGGCAGCTACTTTTAATGAGGATG 
GTATTAGTTTAACTTCTGATTTTTTAAGCCATACATGTACGATTGAAACT 
GCAAAACTAATTTTTAAAGAAGGTAAAATCTTATCAGCAGTTAAAGCCTT 
TAATAAGCCTGCTGAAGTACTGGTAAAAGATAAGAGGAATGCTGCTGGAG 



257 



WO 2004/018646 



PCT/US2003/026827 



SEQUENCE LISTING 



ACCCTAAAGATTACTTTGACTATGTGATGTTGAACTGGTCAAATACCAAT 
TCTGGTTATCGTTTAGTAATGGAAAGATTGTTAGGCAAAGCACCATCTGA 
ACAGGAGTTAACAGTAGGTTTTAAGCCAGGGGTCAGTTTTCATTTTACTT 
ATCAAGATATCATCAATCATCCTGATTCTATTTTTGATGGTTATCATCCT 
GCTAAAATTAAAAATCAGCTTTCTTTAGCAGAACATTTAGTTGCATGTGT 
TATCCCAAAACATTATCAAGAAGATTATCAAAGCCTTGTGCCCAATGACT 
TGAAACACAGGGTTTATTATTTAGATTACTGTAACGAAACACTTTATGAG 
TGGAATCAAAAAGTTTATGATTTTCTTTGTCATTTGGAAAATAAA 

SEQ ID NO. 6209 
STRAIN CJB110 

TTGCTGGATTATCCTCC^TTAAGGC 

GTTTGAATTGGAAAGGATAGGAGCTTTCATAGCTTACGAGAAACAATATA 
AAAGAAAAATTGAGATACAATGTGACGATAAACATCTCCTCACAAAAATT 
GTTCATTTTTTAAAATACAATAGTTTTACTTTTCCCTATATTCCCAAATA 
TAGAGAAGCGGCAGCTACTTTTAATGAGGATGGTATTAGTTTAACTTCTG 
ATTTTTTAAGCCATACATGTACGATTGAAACTGCAAAACTAATTTTTAAA 
GAAGGTAAAATCTTATCAGCAGTTAAAGCCTTTAATAAGCCTGCTGAAGT 
ACTGGTAAATGATAAGAGGAATGCTGCTGGAGACCCTAAAGATTACTTTG 
ACTATGTGATGTTGAACTGGTCAAATACCAATTCTGGTTATCGTTTAGTA 
ATGGAAAGATTGTTAGGCAAAGCACCATCTGAACAGGAGTTAACAGTAGC 
TTTTAAGCCAGGGGTCAGCTTTCATTTTAATTATCAAGATATCATCAATC 
ATCCTGATTCTATTTTTGATGGTTATCATCCTGCTAAAATTAAAAATCAA 
CTTTCTTTAGCAGAACATTTAGTTGCATGTGTTATCCCAAAACATTATCA 
AGAAGATTATCAAAGCCTTGTGCCTAATGACTTGAAACACAGAGTTTATT 
ATTTAGATTACTGTAACGAAACACTTTATGAGTGGAATCA^AAAGTTTAT 
GATTTTCTTTGTCATTTGGAAAATAAA 

SEQ ID NO. 6210 
STRAIN 1169NT 

AATTAAGGCGTTTGAATTGGAAAGGATAGGAGCTTTCATAGCTTACGAGA 
AAC AAT AT AAAAGAAAAACT GAGAT ACAATGTG ACGAT AAAC ATCTCCT C 
GCAAAAATTGTTCATTTTTTAAAATACAATAGTTTTACTTTTCCCTATAT 
TCCCAAATATAGAGAAGCGGCAGCTACTTTTAATGAGGATGGTATTAGTT 
TAACTTCTGATTTTTTAAGCCATACATGTACGATTGAAACTGCAAAACTA 
ATTTTTAAAGAAGGTAAAATCTTATCAGCAGTTAAAGCCTTTAATAAGCC 
TGCTGAAGTACTGGTAAATGATAAGAGGAATGCTGCTGGAGACCCTAAAG 
ATTACTTTGACTATGTGATGTTGAACTGGTCAAATACCAATTCTGGTTAT 
CGTTTAGTAATGGAAAGATTGTTAGGCAAAGCACCATCTGAACAGGAGTT 
AACAGTAGGTTTTAAGCCAGGGGTCAGCTTTCATTTTACTTATCAAGATA 
TCATCAATCATCCTGATTCTATTTTTGATGGTTATCATCCTGCTAAAATT 
AAAAATCAGCTTTCTTTAGCAGAACATTTAGTTGCGTGTGTTATCCCAAA 
ACATTATCAAGAAGATTATCAAAATCTTGTGCCCAATGACTTGAAACACA 
GAGTTTATTATTTAGATTACTGTAACGAAACACTTTATGAGTGGAATCAA 
AAAGTTTATGATTTTCTTTGTCATTTGGAAAATAAA 

SEQ ID NO. 6211 
STRAIN JM9130013 

ATAGGAGCTTTCATAGCTTACGAGAAACAATATAAAAGAAAAATTGAGAT 
ACAATGTGACGATAAACATCTCCTCACAAAAATTGTTCATTTTTTAAAAT 
ACAATAGTTTTACTTTTCCCTATATTCCCAAATATAGAGAAGCGGCAGCT 
ACTTTTAATGAGGATGGTATTAGTTTAACTTCTGATTTTTTAAGCCATAC 
ATGTACGATTGAAACTGCAAAACTAATTTTTAAAGAAGGTAAAATCTTAT 
CAGCAGTTAAAGCCTTTAATAAGCCTGCTGAAGTACTGGTAAATGATAAG 
AGGAATGCTGCTGGAGACCCTAAAGATTACTTTGACTATGTGATGTTGAA 
CTGGTCAAATACCAATTCTGGTTATCGTTTAGTAATGGAAAGATTGTTAG 
GCAAAGCACCATCTGaACAGGAGTTAACAGTAGCTTTTAAGCCAGGGGTC 
AGCTTTCATTTTAATTATCAAGATATCATCAATCATCCTGATTCTATTTT 
TGATGGTTATCATCCTGCTAAAATTAAAAATCAACTTTCTTTAGCAGAAC 
ATTTAGTTGCATGTGTTATCCCAAAACATTATCAAGAAGATTATCAAAGC 
CTTGTGCCTAATGACTTGAAACACAGAGTTTATTATTTAGATTACTGTAA 
CGAAACACTTTATGAGTGGAATCAAAAAGTTTATGATTTTCTTTGTCATT 
TGGAAAATAAA 
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SEQ ID NO. 6212 

STRAIN 2603 frame: 1 

MILKICRAAYSLQWGGVYQLALLDYPRIKAFELERIGAFIAYEKQYKRKTEIQCDDKHLL 
AKIVHFLKYNSFTFPYIPKYREAAATFNEDGISLTSDFLSHTCTIETAKLIFKEGKILSA 
VKAFNKPAEVLVKDKRNAAGDPKDYFDYVMLNWSNTNSGYRLVMERLLGKAPSEQELTVG 
FKPGVSFHFTYQDIINHPDSIFDGYHPAKIKNQLSLAEHLVACVIPKHYQEDYQSLVPND 
LKHRVYYLDYCNETLYEWNQKVYDFLCHLENK 

SEQ ID NO. 6213 

STRAIN A909 frame: 1 

LLDYPRIKAFELERIGAFIAYEKQYKRKIEIQCDDKHLLTKIVHFLKYNSFTFPYIPKYR 
EAAATFNEDGISLTSDFLSHTCTIETAKLIFKEGKILSAVKAFNKPAEVLVNDKRNAAGD 
PKDYFDYVMLNWSNTNSGYRLVMERLLGKAPSEQELTVAFKPGVSFHFNYQDIINHPDSI 
FDGYHPAKIKNQLSLAEHLVACVIPKHYQEDYQSLVPNDLKHRVYYLDYCNETLYEWNQK 
VYDFLCHLENK 

SEQ ID NO. 6214 

STRAIN H36B frame: 3 

KAFELERIGAFIAYEKQYKRKIEIQCDDKHLLTKIVHFLKYNSFTFPYIPKYREAAATFN 
EDGISLTSDFLSHTCTIETAKLIFKEGKILSAVKAFNKPAEVLVNDKRNAAGDPKDYFDY 
VMLNWSNTNSGYRLVMERLLGKAPSEQELTVAFKPGVSFHFNYQDIINHPDSIFDGYHPA 
KIKNQLSLAEHLVACVIPECHYQEDYQSLVPNDLKHRVYYLDYCNETLYEWNQKVYDFLCH 
LENK 

SEQ ID NO. 6215 

STRAIN 18RS21 frame: 1 

LLDYPRIKAFELERIGAFIAYEKQYKRKTEIQCDDKHLLAKIVHFLKYNSFTFPYIPKYR 
EAAATFNEDGISLTSDFLSHTCTIETAKLIFKEGKILSAVKAFNKPAEVLVKDKRNAAGD 
PKDYFDYVMLNWSNTNSGYRLVMERLLGKAPSEQELTVGFKPGVSFHFTYQDIINHPDSI 
FDGYHPAKIKNQLSIAEHLVACVIPKHYQEDYQSLVPNDLKHRVYYLDYCNETLYEWNQK 
VYDFLCHLENK 

SEQ ID NO. 6216 

STRAIN M732 frame: 1 

LLDYPRIKAFELERIGAFIAYEKQYKRKTEIQCDDKHLIAKIVHFLKYNSFTFPYIPKYR 
EAAATFNEDGISLTSDFLSHTCTIETAKLIFKEGKILSAVKAFNKPAEVLVKDKRNAAGD 
PKDYFDYVMLNWSNTNSGYRLVMERLLGKAPSEQELTVGFKPGVSFHFTYQDIINHPDSI ) 
FDGYHPAKIKNQLSLAEHLVACVIPKHYQEDYQSLVPNDLKHRVYYLDYCNETLYEWNQK 
VYDFLXHLENK 

SEQ ID NO. 6217 

STRAIN COH1 frame: 1 

LLDYPRIKAFELERIGAFIAYEKQYKRKTEIQCDDKHLLAKIVHFLKYNSFTFPYIPKYR 
EAAATFNEDGI S LT S DFLSHTCT I ET AKLI FKEGKI LS AVKAFNKPAE VLVKDKRNAAG D 
PKDYFDYVMLNWSNTNSGYRLVMERLLGKAPSEQELTVGFKPGVSFHFTYQDIINHPDSI 
FDGYHPAKIKNQLSLAEHLVACVIPKHYQEDYQSLVPNDLKHRVYYLDYCNETLYEWNQK 
VYDFLWHLENK 

SEQ ID NO. 6218 

STRAIN M781 frame: 1 

LLDYPRIKAFELERIGAFIAYEKQYKRKTEIQCDDKHLLAKIVHFLKYNSFTFPYIPKYR 
EAAATFNEDGI SLTS DFLSHTCT IETAKLIFKEGKILSAVKAFNKPAEVLVKDKRNAAGD 
PKDYFDYVMLNWSNTNSGYRLVMERLLGKAPSEQELTVGFKPGVSFHFTYQDIINHPDSI 
FDGYHPAKIKNQLSLAEHLVACVIPKHYQEDYQSLVPNDLKHRVYYLDYCNETLYEWNQK 
VYDFLCHLENK 

SEQ ID NO. 6219 

STRAIN CJB110 frame: 1 

LLDYPRIKAFELERIGAFIAYEKQYKRKIEIQCDDKHLLTKIVHFLKYNSFTFPYIPKYR 
EAAATFNEDG I SLTSDFLSHTCTIET AKLI FKEGKI LS AVKAFNKPAE VLVNDKRNAAGD 
PKDYFDYVMLNWSNTNSGYRLVMERLLGBCAPSEQELTVAFKPGVSFHFNYQDIINHPDSI 
FDGYHPAKIKNQLSLAEHLVACVIPKHYQEDYQSLVPNDLKHRVYYLDYCNETLYEWNQK 
VYDFLCHLENK 
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SEQ ID NO. 6220 

STRAIN 1169NT frame: 2 

IKAFELERIGAFIAYEKQYKRKTEIQCDDKHLLAKIVHFLKYNSFTFPYIPKYREAAATF 
NEDGISLTSDFLSHTCTIETAKLIFKEGKILSAVKAFNKPAEVLVNDKRNAAGDPKDYFD 
YVMLNWSNTNSGYRLVMERLLGKAPSEQELTVGFKPGVSFHFTYQDIINHPDSIFDGYHP 
AKIKNQLSLAEHLVACVIPKHYQEDYQNLVPNDLKHRVYYLDYCNETLYEWNQKVYDFLC 
HLENK 

SEQ ID NO. 6221 

STRAIN JM9130013 frame: 1 

igafiayekqykrkieiqcddkhlltkivhflkynsftfpyipkyreaaatfnedgislt 
sdflshtctietaklifkegkilsavkafnkpaevlvndkrnaagdpkdyfdyvmlnwsn 
tnsgyrlvmerllgkapseqeltvafkpgvsfhfnyqdiinhpdsifdgyhpakiknqls 
laehlvacvipkhyqedyqslvpndlkhrvyyldy™etlyewnqkvydflchlenk 

SEQ ID NO. 6222 

STRAIN 090 frame: 3 

DYPLIKAFELERIGAFIAYEKQYKRKIEIQCDDKHLLTKIVHFLKYNSFTFPYIPKYREA 
AATFNEDGISLTSDFLSHTCTIETAKLIFKEGKILSAVKAFNKPAEVLVNDKRNAAGDPK 
DYFDYVMLNWSNTNSGYRLVMERLLGKAPSEQELTVAFKPGVSFHFNYQDIINHPDSIFD 
GYHPAKIKNQLSLAEHLVACVIPKHYQEDYQSLVPNDLKHRVYYLDYCNETLYEWNQKVY 
DFLCHLENK 

SEQ ID NO. 6301 
STRAIN 2603 

ATGAAAAGTCGAAAAAAAGATAAATTGGTATTGAGGTTAACAACAACACTATTGGTTTTT 
GGTTTGGGTGGGGTTTGGTTTTATAATTATAAAAATGATAATGTCGAACCGACAGTCACT 
AGTGCATCGGATCAAACGACGACTTTTATTCAAACGATTTCTCCAACAGCTATTGAAATT 
TCTAAGACCTATGATTTGTATGCGTCAGTCTTATTAGCACAAGCTATTTTGGAATCATCC 
AGTGGACAATCAGATTTGTCTAAGGCTCCTAATTATAACCTCTTTGGCATCAAAGGAGAA 
TATAAAGGTAAATCTGTCCAAATGCCTACTTTAGAAGATGATGGGAAAGGCAATATGACT 
CAAATCCAAGCTCCTTTTCGCGCCTATCCAAATTATTCTGCTTCACTATATGATTATGCT 
GAGTTAGTATCTAGT CAAAAGTATGCATCTGTTTGGAAATCAAATACCT CTTCTTATAAG 
GATGCTACTGCAGCTCTAACAGGTCTTTATGCGACAGATACTGCTTATGCTAGTAAATTA 
AACCAAATTATTGAAACCTACAGTCTAGATGCTTATGATAAA 

SEQ ID NO. 6302 

STRAIN 090 

GGGGTTTGGTTTTATAATTATAA 

AAATGATAATGTCGAACCGACAGTCACTAGTGCATCGGATCAAACGACGA 
CTTTTATTCAAACGATTTCTCCAACAGCTATTGAAATTTCTAAGACCTAT 
GATTTGTATGCGTCAGTCTTATTAGCACAAGCTATTTTGGAATCATCCAG 
TGGACAATCAGATTTGTCTAAGGCTCCTAATTATAACCTCTTTGGCATCA 
AAGGAGAATATAAAGGTAAATCTGTCCAAATGCCTACTTTAGAAGATGAT 
GGGAAAGGCAATATGACTCAAATCCAAGCTCCTTTTCGCGCCTATCCAAA 
T TAT T CT G CTT C ACT AT ATG ATT ATG CTG AGT TAG TAT CTAGTCAAAAGT 
ATGCATCTGTTTGGAAATCAAATACCTCTTCTTATAAGGATGCTACTGCA 
GCTCTAACAGGTCTTTATGCGACAGATACTGCTTATGCTAGTAAATTAAA 
CCAAATTATTGAAACCTACAGTCTAGATGCTTATGATAAA 

SEQ ID NO. 6303 

STRAIN A909 

GGGGTTTGGTTTTATAATTATAA 

AAATGATAATGTCGAACCGACAGTCACTAGTGCATCGGATCAAACGACGA 
CTTTTATTCAAACGATTTCTCCAACAGCTATTGAAATTTCTAAGACCTAT 
GATTTGT ATGCGT CAGTCTTATTAGCACAAGCTATTTTGGAATCAT CC AG 
TGGACAATCAGATTTGTCTAAGGCTCCTAATTATAACCTCTTTGGCATCA 
AAGGAGAATATAAAGGTAAATCTGTCCAAATGCCTACTTTAGAAGATGAT 
GGGAAAGGCAATATGACTCAAATCCAAGCTCCTTTTCGCGCCTATCCAAA 
TTATTCTGCTTCACTATATGATTATGCTGAGTTAGTATCTAGTCAAAAGT 
ATGCATCTGCTTGGAAATCAAATACTTCTTCTTATAAGGATGCTACTGCA 
GCTCTAACAGGTCTTTATGCGACAGATACTGCTTATGCTAGTAAATTAAA 
CCAAATTATTGAAACCTACAGTCTAGATGCTTATGATAAA 

I. 
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SEQ ID NO. 6304 

STRAIN H36B 

GGGGTTTGGTTTTATAATTATAAAAATGATA 

ATGTCGAACCGACAGTCACTAGTGCATCGGATCAAACGACGACTTTTATT 
CAAACGATTTCTCCAACAGCTATTGAAATTTCTAAGACCTATGATTTGTA 
TGCGTCAGTCTTATTAGCACAAGCTATTTTGGAATCATCCAGTGGACAAT 
CAGATTTGTCTAAGGCTCCTAATTATAACCTCTTTGGCATCAAAGGAGAA 
TATAAAGGTAAATCTGTCCAAATGCCTACTTTAGAAGATGATGGGAAAGG 
CAATATGACTCAAATCCAAGCTCCTTTTCGCGCCTATCCAAATTATTCTG 
CTTCACTATATGATTATGCTGAGTTAGTATCTAGTCAAAAGTaTGCATCT 
GCTTGGAAATCAAATACTTCTTCTTATAAGGATGCTACTGCAGCTCTAAC 
AGGTCTTTATGCGACAGATACTGCTTATGCTAGTAAATTAAACCAAATTA 
TTGAAACCTACAGTCTAGATGCTTATGATAAA 

SEQ ID NO. 6305 

STRAIN 18RS21 

GGGGTTTGGTTTTATAATTATAAAAATGATAATG 

TCGAACCGACAGTCACTAGTGCATCGGATCAAACGACGACTTTTATTCAA 
ACGATTTCTCCAACAGCTATTGAAATTTCTAAGACCTATGATTTGTATGC 
GTCAGTCTTATTAGCACAAGCTATTTTGGAATCATCCAGTGGACAATCAG 
ATTTGTCTAAGGCTCCTAATTATAACCTCTTTGGCATCAAAGGAGAATAT 
AAAGGTAAATCTGTCCAAATGCCTACTTTAGAAGATGATGGGAAAGGCAA 
TATGACTCAAATCCAAGCTCCTTTTCGCGCCTATCCAAATTATTCTGCTT 
CACTATATGATTATGCTGAGTTAGTATCTAGTCAAAAGTATGCATCTGTT 
TGGAAATCAAATACCTCTTCTTATAAGGATGCTACTGCAGCTCTAACAGG 
TCTTTATGCGACAGATACTGCTTATGCTAGTAAATTAAACCAAATTATTG 
AAACCTACAGTCTAGATGCTTATGATAAA 

SEQ ID NO. 6306 

STRAIN M732 

GGGGTTTGGTTTTATAATTATAA 

AAATGATAATGTCGAACCGACAGTCACTAGTGCATCGGATCAAACGACGA 
CTTTTATTCAAACGATTTCTCCAACAGCTATTGAAATTTCTAAGACCTAT 
GATTTGTATGCGTCAGTCTTATTAGCACAAGCTATTTTGGAATCATCCAG 
TGGACAATCAGATTTGTCTAAGGCTCCTAATTATAACCTCTTTGGCATCA 
AAGGAGAATATAAAGGTAAATCTGTCCAAATGCCTACTTTAGAAGATGAT 
GGGAAAGGCAATATGACTCAAATCCAAGCTCCTTTTCGCGCCTATCCAAA 
TTATTCTGCTTCACTATATGATTATGCTGAGTTAGTATCTAGTCAAAAGT 
ATGCATCTGTTTGGAAATCAAATACTTCTTCTTATAAGGATGCTACTGCA 
GCTCTAACAGGTCTTTATGCGACAGATACTGCTTATGCTAGTAAATTAAA 
CCAAATTATTGAAACCTACAGTCTAGATGCTTATGATAAA 

SEQ ID NO. 6307 

STRAIN COH1 

GGGGTTTGGTTTTATAATTATAA 

AAATGATAATGTCGAACCGACAGTCACTAGTGCATCGGATCAAACGACGA 
CTTTTATTCAAACGATTTCTCCAACAGCTATTGAAATTTCTAAGACCTAT 
GATTTGTATGCGTCAGTCTTATTAGCACAAGCTATTTTGGAATCATCCAG 
TGGACAATCAGATTTGTCTAAGGCTCCTAATTATAACCTCTTTGGCATCA 
AAGGAGAATATAAAGGTAAATCTGTCCAAATGCCTACTTTAGAAGATGAT 
GGGAAAGGCAATATGACTCAAATCCAAGCTCCTTTTCGCGCCTATCCAAA 
TTATTCTGCTTCACTATATGATTATGCTGAGTTAGTATCTAGTCAAAAGT 
ATGCATCTGTTTGGAAATCAAATACTTCTTCTTATAAGGATGCTACTGCA 
GCTCTAACAGGTCTTTATGCGACAGATACTGCTTATGCTAGTAAATTAAA 
CCAAATTATTGAAACCTACAGTCTAGATGCTTATGATAAA 

SEQ ID NO. 6308 

STRAIN M7 81 

GGGGTTTGGTTTTATAATTATAAAAATGA 

TAATGTCGAACCGACAGTCACTAGTGCATCGGATCAAACGACGACTTTTA 
TTCAAACGATTTCTCCAACAGCTATTGAAATTTCTAAGACCTATGATTTG 
TATGCGTCAGTCTTATTAGCACAAGCTATTTTGGAATCATCCAGTGGACA 
ATCAGATTTGTCTAAGGCTCCTAATTATAACCTCTTTGGCATCAAAGGAG 
AATATAAAGGTAAATCTGTCCAAATGCCTACTTTAGAAGATGATGGGAAA 
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GGCAATATGACTCAAATCCAAGCTCCTTTTCGCGCCTATCCAAATTATTC 
TGCTTCACTATATGATTATGCTGAGTTAGTATCTAGTCAAAAGTATGCAT 
CTGTTTGGAAATCAAATACTTCTTCTTATAAGGATGCTACTGCAGCTCTA 
ACAGGTCTTTATGCGACAGATACTGCTTATGCTAGTAAATTAAACCAAAT 
TATTGAAACCTACAGTCTAGATGCTTATGATAAA 

SEQ ID NO. 6309 

STRAIN CJB110 

GGGGTTTGGTTTTATAATTATAAAAATGATAATGT 

CGAACCGACAGTCACTAGTGCATCGGATCAAACGACGACTTTTATTCAAA 
CGATTTCTCCAACAGCTATTGAAATTTCTAAGACCTATGATTTGTATGCG 
TCAGTCTTATTAGCACAAGCTATTTTGGAATCATCCAGTGGACAATCAGA 
TTTGTCTAAGGCTCCTAATTATAACCTCTTTGGCATCAAAGGAGAATATA 
AAGGTAAATCTGTCCAAATGCCTACTTTAGAAGATGATGGGAAAGGCAAT 
ATGACTCAAATCCAAGCTCCTTTTCGCGCCTATCCAAATTATTCTGCTTC 
ACTATATGATTATGCTGAGTTAGTATCTAGTCAAAAGTATGCATCTGTTT 
GGAAATCAAATACCTCTTCTTATAAGGATGCTACTGCAGCTCTAACAGGT 
CTTTATGCGACAGATACTGCTTATGCTAGTAAATTAAACCAAATTATTGA 
AACCTACAGTCTAGATGCTTATGATAAA 

SEQ ID NO. 6310 

STRAIN 1169NT 

GGGGTTTGGTTTTATAATTATAAAAATGATAATGT 

CGAACAGACAGTCACTAGTGCATCGGATCAAACGACGACTTTTATTCAAA 
CGATTTCCCCAACAGCTATTGAAATTTCTAAGACCTATGATTTGTATGCG 
TCAGTCTTATTAGCACAAGCTATTTTGGAATCATCCAGTGGACAATCAGA 
TTTGTCTAAGGCTCCTAATTATAACCTCTTTGGCATCAAAGGAGAATATA 
AAGGTAAATCTGTCCAAATGCCTACTTTAGAAGATGATGGGAAAGGCAAT 
ATGACTCAAATCCAAGCTCCTTTTCGCGCCTATCCAAATTATTCTGCTTC 
ACTATATGATTATGCTGAGTTAGTATCTAGTCAAAAGTATGCATCTGTTT 
GGAAATCAAATACTTCTTCTTATAAGGATGCTACTGCAGCTCTAACAGGT 
CTTTATGCGACAGATACTGCTTATGCTAGTAAATTAAACCAAATTATTGA 
AACCTACAGTCTAGATGCTTATGATAAA 

SEQ ID NO. 6311 

STRAIN JM9130013 

TTTGGTTTTATAATTATAAAAATGATAATGTCGAACCGACAGTCACTAGT 
GCATCGGATCAAACGACGACTTTTATTCAAACGATTTCCCCAACAGCTAT 
TGAAATTTCTAAGACCTATGATTTGTATGCGTCAGTCTTATTAGCACAAG 
CTATTTTGGAATCATCCAGTGGACAATCAGATTTGTCTAAGGCTCCTAAT 
TATAACCTCTTTGGCATCAAAGGAGAATATAAAGGTAAATCTGTTCAAAT 
GCCTACTTTAGAAGATGATGGGAAAGGTAATATGACCCAAATCCAAGCTC 
CTTTTCGCGCCTATCCAAATTATTCTGCTTCACTATATGATTATGCTGAG 
TTAGTATCTAGTCAAAAGTATGCATCTGTTTGGAAATCAAATACCTCTTC 
TTATAAGGATGCTACTGCAGCTCTAACAGGTCTTTATGCGACAGATACTG 
CTTATGCTAGTAAATTAAACCAAATTATTGAAAACTACAGTCTAGATGCT 
TATGATAAA 

SEQ ID NO. 6312 
STRAIN 2603 frame: 1 

MKSRKKDKLVLRLTTTLLVFGLGGVWFYNYKNDNVEPTVTSASDQTTTFIQTISPTAIEI 
SKTYDLYASVLLAQAILESSSGQSDLSKAPNYNLFGIKGEYKGKSVQMPTLEDDGKGNMT 
Q I QAP FRAYPN YS AS L YDYAE LVS SQKYAS VWKSNT S S YKDATAALTGLYAT DT AYASKL 
NQI IET YSLDAYDK 

SEQ ID NO. 6313 

STRAIN 090 frame: 1 

GVWFYNYKNDNVEPTVTSASDQTTTFIQTISPTAIEISKTYDLYASVLLAQAILESSSGQ 
SDLSBCAPNYNLFGIKGEYKGKSVQMPTLEDDGKGNMTQIQAPFRAYPNYSASLYDYAELV 
S S QKYAS VWKSNT S S YKDATAALTGLYAT DTAYASKLNQI I ET Y S L DAYDK 

SEQ ID NO. 6314 

STRAIN A909 frame: 1 

GVW FYN YKNDNVE PTVT S AS DQTTT FIQT I S PT AI E I S KT Y DLY AS VLLAQAI LE S S SGQ 
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SDLSKAPNYNLFGIKGEYKGKSVQMPTLEDDGKGNMTQIQAPFRAYPNYSASLYDYAELV 
S SQKYASAWKSNT S S YKDATAALTGLYATDTAYASKLNQI IET YSLDAYDK 

SEQ ID NO. 6315 

STRAIN H36B frame: 1 

GVW FYN YKN DNVE PT VT S AS DQTTT FI QT I S PT AIE I SKTYDLYAS VLLAQAI LE S S SGQ 
SDLSKAPNYNLFGIKGEYKGKSVQMPTLEDDGKGNMTQIQAPFRAYPNYSASLYDYAELV 
S SQKYASAWKSNT S S YKDAT AALTGLYAT DTAYAS KLNQI IET YS LDAYDK 

SEQ ID NO. 6316 

STRAIN 18RS21 frame: 1 

GVW FYNYKNDNVEPTVTSASDQTTTFIQTISPTAIEISKTYDLYAS VLLAQAI LESSSGQ 
SDLSKAPNYNLFGIKGEYKGKSVQMPTLEDDGKGNMTQIQAPFRAYPNYSASLYDYAELV 
SSQKYASVWKSNTSS YKDATAALTGLYATDTAYASKLNQI IET YSLDAYDK 

SEQ ID NO. 6317 

STRAIN M732 frame: 1 

GVW FYNYKNDNVEPTVTS AS DQTTTFIQTISPTAIE I SKTYDLYAS VLLAQAI LESSSGQ 
SDLSKAPNYNLFGIKGEYKGKSVQMPTLEDDGKGNMTQIQAPFRAYPNYSASLYDYAELV 
SSQKYASVWKSNTSSYKDATAALTGLYATDTAYASKLNQI IET YSLDAYDK 

SEQ ID NO. 6318 

STRAIN M781 frame: 1 

G W FYN YKN DNVEPTVTSAS DQTTTFIQTISPTAIE I SKTYDLYAS VLLAQAI LESS SGQ 
SDLSKAPNYNLFGIKGEYKGKSVQMPTLEDDGKGNMTQIQAPFRAYPNYSASLYDYAELV 
S SQKYASVWKSNTS S YKDAT AALTGLYAT DTAYASKLNQI IET YSLDAYDK 

SEQ ID NO. 6319 

STRAIN CJB110 frame: 1 

GVW FYNYKNDNVEPTVTS AS DQTTTFIQTISPTAIE I SKTYDLYAS VLLAQAI LESS SGQ 
SDLSKAPNYNLFGIKGEYKGKSVQMPTLEDDGKGNMTQIQAPFRAYPNYSASLYDYAELV 
SSQKYASVWKSNTSS YKDAT AALTGLYATDTAYASKLNQIIET YSLDAYDK 

SEQ ID NO. 6320 

STRAIN 1169NT frame: 1 

GVW E*YN YKN DNVE QTVTS AS DQTTTFIQTISPTAIE I SKTYDLYAS VLLAQAI LESS SGQ 
SDLSKAPNYNLFGIKGEYKGKSVQMPTLEDDGKGNMTQIQAPFRAYPNYSASLYDYAELV 
S SQKYAS VWKSNT S S YKDATAALTGLYAT DTAYAS KLNQI IETYS LDAYDK 

SEQ ID NO. 6321 

STRAIN JM9130013 frame: 3 

WFYN YKN DNVEPTVTS AS DQTTTFIQT I SPTAI EI SKTYDLYAS VLLAQAI LESSSGQSD 
LSKAPNYNLFGIKGEYKGKSVQMPTLEDDGKGNMTQIQAPFRAYPNYSASLYDYAELVSS 
QKYAS VWKSNT S S YKDATAALTGLYAT DTAYASKLNQI I ENYS LDAYDK 

SEQ ID NO. 6401 
STRAIN 2603 

ATGAACAAGTCTAAGAAAATCGAAAATTATCAATTATTATTACTACAAGCGCAAGCTCTA 
TTCTCAGATGAAACAAATGCTCTTGCCAACTTATCAAATGCTTCAGCTATGCTAAATGCT 
ATGCTTCCAAATTCTGTATTTACAGGCTTTTATTTATTTGATGGAGAAGAGTTAATTCTT 
GGCCCTTTCCAGGGTGGTGTATCATGTGTGCATATTACTTTAGGAAAAGGTGTTTGTGGT 
GAATCTGCACAAACTGCTAAGACGCTGATCGTTGATGATGTTACAAAGCATGCTAACTAT 
ATCTCCTGTGATTCAAAAGCTATGAGTGAAATCGTAGTACCTATGTTTAAAAATGGCAAA 
CTTCTAGGAGTTCTAGATTTAGATTCTTCTTTAGTAGCAGATTATGATGAGATTGATCAA 
GAATACTTAGAAAAATTTGTAGGTATTCTAGTAGAACATACGATTTGGAATTTGGATATG 
TTTGGAGTTGAAAAG 

SEQ ID NO. 6402 

STRAIN 090 

CTCTATTCTCAGATGAAACAAATGCTCTTGCCAACTTA 

TCAAATGCTTCAGCTATGCTAAATGCTATGCTTCCAAATTCTGTATTTAC 

AGGCTTTTATTTATTTGATGGAAAGGAGTTAATTCTTGGCCCTTTCCAGG 

GTGGTGTATCATGTGTGCATATTACTTTAGGAAAAGGTGTTTGTGGTGAA 

TCTGCACAAACTGCTAAGACGCTGATTGTTGATGATGTTACAAAGCATGC 
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TAACTATATCTCCTGTGATTCAAAAGCTATGAGTGAAATCGTAGTACCTA 
TGTTTAAAAATGGCAAACTTCTAGGAGTTCTAGATTTAGATTCTTCTTTA 
GTAGCAGATTATGATGAGATTGATCAAGAATACTTAGAAAAATTTGTAGG 
TATTCTAGTAGAACATACGATTTGGAATTTGGATA 

SEQ ID NO. 6403 

STRAIN A909 

CTCTATTCTCAGATGAAACAAATGCTCTTGCCAA 

CTTATCAAATGCTTCAGCTATGCTAAATGCTATGCTTCCAAATTCTGTAT 
TTACAGGCTTTTATTTATTTGATGGAGAAGAGTTAATTCTTGGCCCTTTC 
CAGGGTGGTGTATCATGTGTGCATATTACTTTAGGAAAAGGTGTTTGTGG 
TGAATCTGCACAAACTGCTAAGACGCTGATCGTTGATGATGTTACAAAGC 
ATGCTAACTATATCTCCTGTGATTCAAAAGCTATGAGTGAAATCGTAGTA 
CCTATGTTTAAAAATGGCAAACTTCTAGGAGTTCTAGATTTAGATTCTTC 
TTTAGTAGCAGATTATGATGAGATTGATCAAGAATACTTAGAAAAATTTG 
TAGGTATTCTAGTAGAACATACGATTTGGAATTTGGATATGTTTGGAGTT 
GAAAAG 

SEQ ID NO. 6404 

STRAIN H36B 

CTCTATTCTCAGATGAAACAAATGCTCTTGC 

CAACTTATCAAATGCTTCAGCTATGCTAAaTGCTATGCTTCCAAATTCTG 
TATTTACAGGCTTTTATTTATTTGATGGAGAAGAGTTAATTCTTGGCCCT 
TTCCAGGGTGGTGTATCATGTGTGCATATTACTTTAGGAAAAGGTGTTTG 
TGGTGAATCTGCACAAACTGCTAAGACGCTGATCGTTGATGATGTTACAA 
AGCATGCTAACTATATCTCCTGTGATTCAAAAGCTATGAGTGAAATCGTA 
GTACCTATGTTTAAAAATGGCAAACTTCTAGGAGTTCTAGATTTAGATTC 
TTCTTTAGTAGCAGATTATGATGAGATTGATCAAGAATACTTAGAAAAAT 
TTGTAGGTATTCTAGTAGAACATACGATTTGGAATTTGGATATGTTTGGA 
GTTGAAAAG 

SEQ ID NO. 6405 

STRAIN 18RS21 

CTCTATTCTCAGATGAAACAAATGCTCTTGCCAACTT 

ATCAAATGCTTCAGCTATGCTAAATGCTATGCTTCCAAATTCTGTATTTA 

CAGGCTTTTATTTATTTGATGGAGAAGAGTTAATTCTTGGCCCTTTCCAG 

GGTGGTGTATCATGTGTGCATATTACTTTAGGAAAAGGTGTTTGTGGTGA 

ATCTGCACAAACTGCTAAGACGCTGATCGTTGATGATGTTACAAAGCATG 

CTAACTATATCTCCTGTGATTCAAAAGCTATGAGTGAAATCGTAGTACCT 

ATGTTTAAAAATGGCAAACTTCTAGGAGTTCTAGATTTAGATTCTTCTTT 

AGTAGCAGATTATGATGAGATTGATCAAGAATACTTAGAAAAATTTGTAG 

GTATTCTAGTAGAACATACGATTTGGAATTTGGATATGTTTGGAGTTGAA 

AAG 

SEQ ID NO. 6406 

STRAIN M732 

CTCTATTCTCAGATGAAACAAATGCTCTTGCCAACTT 

ATCAAATGCTTCAGCTATGCTAAATGCTATGCTTCCAAATTCTGTATTTA 

CAGGCTTTTATTTATTTGATGGAGAGGAGTTAATTCTTGGCCCTTTTCAG 

GGTGGTGTATCATGTGTGCATATTACTTTAGGAAAAGGTGTTTGTGGTGA 

ATCTGCACAAACTGCTAAGACGCTGATTGTTGATGATGTTACAAAGCATG 

CTAACTATATCTCCTGTGATTCAAAAGCTATGAGTGAAATCGTAGTACCC 

ATGTTTAAAAATGGCAAACTTCTAGGAGTTCTAGATTTAGATTCTTCTTT 

AGTAGCAGATTATGATGAGATTGATCAAGAATACTTAGAAAAATTTGTAG 

GTATTCTAGTAGAACATACGATTTGGAATTTGGATATGTTTGGAGTTGAA 

AAG 

SEQ ID NO. 6407 

STRAIN COH1 

CTCTATTCTCAGATGAAACAAATGCTCTTGCCAAC 

TTATCAAATGCTTCAGCTATGCTAAATGCTATGCTTCCAAATTCTGTATT 
TACAGGCTTTTATTTATTTGATGGAGAGGAGTTAATTCTTGGCCCTTTTC 
AGGGTGGTGTATCATGTGTGCATATTACTTTAGGAAAAGGTGTTTGTGGT 
GAATCTGCACAAACTGCTAAGACGCTGATTGTTGATGATGTTACAAAGCA 
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TGCTAACTATATCTCCTGTGATTCAAAAGCTATGAGTGAAATCGTAGTAC 
CCATGTTTAAAAATGGCAAACTTCTAGGAGTTCTAGATTTAGATTCTTCT 
TTAGTAGCAGATTATGATGAGATTGATCAAGAATACTTAGAAAAATTTGT 
AGGTATTCTAGTAGAACATACGATTTGGAATTTGGATATGTTTGGAGTTG 
AAAAG 

SEQ ID NO. 6408 

STRAIN M781 

CTCTATTCTCAGATGAAACAAATGCTCTTGCCAACTT 

ATCAAATGCTTCAGCTATGCTAAATGCTATGCTTCCAAATTCTGTATTTA 

CAGGCTTTTATTTATTTGATGGAGAGGAGTTAATTCTTGGCCCTTTTCAG 

GGTGGTGTATCATGTGTGCATATTACTTTAGGAAAAGGTGTTTGTGGTGA 

ATCTGCACAAACTGCTAAGACGCTGATTGTTGATGATGTTACAAAGCATG 

CTAACTATATCTCCTGTGATTCAAAAGCTATGAGTGAAATCGTAGTACCC 

ATGTTTAAAAATGGCAAACTTCTAGGAGTTCTAGATTTAGATTCTTCTTT 

AGTAGCAGATTATGATGAGATTGATCAAGAATACTTAGAAAAATTTGTAG 

GTATTCTAGTAGAACATACGATTTGGAATTTGGATATGTTTGGAGTTGAA 

AAG 

SEQ ID NO. 6409 

STRAIN CJB110 

CTCTATTCTCAGATGAAACAAATGCTCTTGCCAACTTA 

TCAAATGCTTCAGCTATGCTAAATGCTATGCTTCCAAATTCTGTATTTAC 

AGGCTTTTATTTATTTGATGGAAAGGAGTTAATTCTTGGCCCTTTCCAGG 

GTGGTGTATCATGTGTGCATATTACTTTAGGAAAAGGTGTTTGTGGTGAA 

TCTGCACAAACTGCTAAGACGCTGATTGTTGATGATGTTACAAAGCATGC 

TAACTATATCTCCTGTGATTCAAAAGCTATGAGTGAAATCGTAGTACCTA 

TGTTTAAAAATGGCAAACTTCTAGGAGTTCTAGATTTAGATTCTTCTTTA 

GTAGCAGATTATGATGAGATTGATCAAGAATACTTAGAAAAATTTGTAGG 

TATTCTAGTAGAACATACGATTTGGAATTTGGATATGTTTGGAGTTGAAA 



SEQ ID NO. 6410 

STRAIN 1169NT 

CTCTATTCTCAGATGAAACAAATGCTCTTGCCAACTTA 

TCAAATGCTTCAGCTATGCTAAATGCTATGCTTCCAAATTCTGTATTTAC 

AGGCTTTTATTTATTTGATGGAGAAGAGTTAATTCTTGGCCCTTTCCAGG 

GTGGTGTATCATGTGTGCATATTACTTTAGGAAAAGGTGTTTGTGGTGAA 

TCTGCACAAACTGCTAAGACGCTGATTGTTGATGATGTTACAAAGCATGC 

TAACTATATCTCCTGTGATTCAAAAGCTATGAGTGAAATCGTAGTACCCA 

TGTTTAAAAATGGCAAACTTCTAGGAGTTCTAGATTTAGATTCTTCTTTA 

GTAGCAGATTATGATGAGATTGATCAAGAATACTTAGAAAAATTTGTAGG 

TATTCTAGTAGAACATACGATTTGGAATTTGGATATGTTTGGAGTTGAAA 

AG 

SEQ ID NO. 6411 

STRAIN JM9130013 

CTCTATTCTCAGATGAAACAAATGCTCTTGCCAACTTA 

TCAAATGCTTCAGCTATGCTAAATGCTATGCTTCCAAATTCTGTATTTAC 

AGGCTTTTATTTATTTGATGGAGAAGAGTTAATTCTTGGCCCTTTCCAGG 

GTGGTGTATCATGTGTGCATATTACTTTAGGAAAAGGTGTTTGTGGTGAA 

TCTGCACAAACTGCTAAGACGCTGATCGTTGATGATGTTACAAAGCATGC 

TAACTATATCTCCTGTGATTCAAAAGCTATGAGTGAAATCGTAGTACCTA 

TGTTTAAAAATGGCAAACTTCTAGGAGTTCTAGATTTAGATTCTTCTTTA 

GTAGCAGATTATGATGAGATTGATCAAGAATACTTAGAAAAATTTGTAGG 

TATTCTAGTAGAACATACGATTTGGAATTTGGATATGTTTGGAGTTGAAA 

AG 

SEQ ID NO. 6412 
STRAIN 2603 frame: 1 

MNKSKKIENYQLLLLQAQALFSDETNALANLSNASAMLNAMLPNSVFTGFYLFDGEELIL 
GPFQGGVSCVHITLGKGVCGESAQTAKTLIVDDVTKHANYISCDSKAMSEIVVPMFKNGK 
LLGVLDLDSSLVADYDEIDQEYLEKFVGILVEHTIWNLDMFGVEK 

SEQ ID NO. 6413 
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STRAIN 090 frame: 3 

LFSDETNAIANLSNASAMLNAMLPNSVFTGFYLFDGKELILGPFQGGVSCVHITLGKGVC 
GESAQTAKTLIVDDVTKHANYISCDSKAMSEIWPMFKNGKLLGVLDLDSSLVADYDEID 
QEYLEKFVGILVEHTIWNLD 

SEQ ID NO. 6414 

STRAIN A909 frame: 3 

LFSDETNALANLSNASAMLNAMLPNSVFTGFYLFDGEELILGPFQGGVSCVHITLGKGVC 
GESAQTAKTLIVDDVTKHANYISCDSKAMSEIWPMFKNGKLLGVLDLDSSLVADYDEID 
QEYLEKFVGILVEHTIWNLDMFGVEK 

SEQ ZD NO. 6415 

STRAIN H36B frame: 3 

LFSDETNALANLSNASAMLNAMLPNSVFTGFYLFDGEELILGPFQGGVSCVHITLGKGVC 
GESAQTAKTLIVDDVTKHANYISCDSKAMSEIWPMFKNGKLLGVLDLDSSLVADYDEID 
QEYLEKFVGILVEHTIWNLDMFGVEK 

SEQ ID NO. 6416 

STRAIN 18RS21 frame: 3 

LFSDETNALANLSNASAMLNAMLPNSVFTGFYLFDGEELILGPFQGGVSCVHITLGKGVC 
GESAQTAKTLIVDDVTKHANYISCDSKAMSEIWPMFKNGKLLGVLDLDSSLVADYDEID 
QEYLEKFVGILVEHTIWNLDMFGVEK 

SEQ ID NO. 6417 

STRAIN M732 frame: 3 

LFSDETNALANLSNASAMLNAMLPNSVFTGFYLFDGEELILGPFQGGVSCVHITLGKGVC 
GESAQTAKTLIVDDVTKHANYISCDSKAMSEIWPMFKNGKLLGVLDLDSSLVADYDEID 
QEYLEKFVGILVEHTIWNLDMFGVEK 

SEQ XD NO. 6418 

STRAIN COH1 frame: 3 

LFSDETNALANLSNASAMLNAMLPNSVFTGFYLFDGEELILGPFQGGVSCVHITLGKGVC 
GESAQTAKTLIVDDVTKHANYISCDSKAMSEIVVPMFKNGKLLGVLDLDSSLVADYDEID 
QEYLEKFVGILVEHTIWNLDMFGVEK 

SEQ ID NO. 6419 

STRAIN M781 frame: 3 

LFSDETNALANLSNASAMLNAMLPNSVFTGFYLFDGEELILGPFQGGVSCVHITLGKGVC 
GESAQTAKTLIVDDVTKHANYISCDSKAMSEIWPMFKNGKLLGVLDLDSSLVADYDEID 
QEYLEKFVGILVEHTIWNLDMFGVEK 

SEQ ID NO. 6420 

STRAIN M781 frame: 3 

LFSDETNALANLSNASAMLNAMLPNSVFTGFYLFDGEELILGPFQGGVSCVHITLGKGVC 
GESAQTAKTLIVDDVTKHANYISCDSKAMSEIWPMFKNGKLLGVLDLDSSLVADYDEID 
QEYLEKFVGILVEHTIWNLDMFGVEK 

SEQ ID NO. 6421 

STRAIN CJB110 frame: 3 

LFSDETNALANLSNASAMLNAMLPNSVFTGFYLFDGKELILGPFQGGVSCVHITLGKGVC 
GESAQTAKTLIVDDVTKHANYISCDSKAMSEIWPMFKNGKLLGVLDLDSSLVADYDEID 
QEYLEKFVGILVEHTIWNLDMFGVEK 

SEQ ID NO. 6422 

STRAIN 1169NT frame: 3 

LFSDETNALANLSNASAMLNAMLPNSVFTGFYLFDGEELILGPFQGGVSCVHITLGKGVC 
GESAQTAKTLIVDDVTKHANYISCDSKAMSEIWPMFKNGKLLGVLDLDSSLVADYDEID 
QEYLEKFVGILVEHTIWNLDMFGVEK 

SEQ ID NO. 6423 

STRAIN JM9130013 frame: 3 

LFSDETNALANLSNASAMLNAMLPNSVFTGFYLFDGEELILGPFQGGVSCVHITLGKGVC 
GESAQTAKTLIVDDVTKHANYISCDSKAMSEIWPMFKNGKLLGVLDLDSSLVADYDEID 
QEYLEKFVGILVEHTIWNLDMFGVEK 
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SEQ XD NO. 6501 
STRAIN 2603 

ATGAAAAAGAGTACCCAAATAATACTACTAATAGTTGCA 

TTATTCATACTTGTTTTTAGCGGAGGATTTTATATGAAAGAACAACAAAGAAAAGAAGAA 
CTAAAACGGAATCGAGAATATGAAGTTAGTCTAGTCAAAGCATTGAAAAATTCCTATGAG 
AATATAGAAGAAATAAAAATCACACATCCTGTTTCAACTGAAATTCCTGGAGATTGGCAT 
TGTACTGTAAAGATTTCATTTAATGATAAAAAATCTATTGTTTATAATATTACACATAAT 
TTGGAATCGAAAAAAAATTATAGCGGAAAATTTAATGAAAAAAATATGAATTTTTTTGAT 
TCAAGAATTGGTAAAACAAAAAAAACTATAAAAATTATTTTTTCAGATGGTCAGGAGAAG 
ATACAA 

SEQ XD NO. 6502 

STRAIN 090 

GGAGGATTTTATATGAAAGAACA 

ACAAAGAAAAGAAGAACTAAAACGGAATCGAGAATATGAAGTTAGTCTAG 
TCAAAGCATTGAAAAATTCCTATGAGAATATAGAAGAAATAAAAATCACA 
CATCCTGTTTCAACTGAAATTCCTGGAGATTGGCATTGTACTGTAAAGAT 
TTCATTTAATGATAAAAAATCTATTGTTTATAATATTACACATAATTTGG 
AATCGAAAAAAAATTATAGCGGAAATTTTAATGAAAAAAATATGAATTTT 
TTTGATTCAAGAATTGGTAAAACAAAAAAAACTATAAAAATTATTTTTTC 
AGAtGGtCAGGAGAAGATaCAA 

SEQ XD NO. 6503 

STRAIN A909 

GGAGGATTTTATATGAAAGAACAACAA 

AGAAAAGAAGAACTAAAACGGAATCGAGAATATGAAGTTAGTCTAGTCAA 
AGCATTGAAAAATTCCTATGAGAATATAGAAGAAATAAAAATCACACATC 
CTGTTTCAACTGAAATTCCTGGAGATTGGCATTGTACTGTAAAGATTTCA 
TTTAATGATAAAAAATCTATTGTTTATAATATTACACATAATTTGGAATC 
GAAAAAAAATTATAGCGGAAAATTTAATGAAAAAAATATGAATTTTTTTG 
ATTCAAGAATTGGTAAAACAAAAAAAACTATAAAAATTATTTTTTCAGAT 
GGtCAGGAGAAGATACAA 

SEQ XD NO. 6504 

STRAIN H36B 

GGAGGATTTTATATGAAAGAACA 

ACAAAGAAAAGAAGAACTAAAACGGAATCGAGAATATGAAGTTAGTCTAG 
TCAAAGCATTGAAAAATTCCTATGAGAATATAGAAGAAATAAAAATCACA 
CATCCTGTTTCAACTGAAATTCCTGGAGATTGGCATTGTACTGTAAAGAT 
TTCATTTAATGATAAAAAATCTATTGTTTATAATATTACACATAATTTGG 
AATCGAAAAAAAATTATAGCGGAAAATTTAATGAAAAAAATATGAATTTT 
TTTGATTCAAGAATTGGTAAAACAAAAAAAACTATAAAAATTAtTTTTTC 
AGATGGt CAGGAGAAGAT aCAA 

SEQ XD NO. 6505 

STRAIN 18RS21 
GGAGGATTTTATATGAAAGAACAAC 

AAAGAAAAGAAGAACTAAAACGGAATCGAGAATATGAAGTTAGTCTAGTC 
AAAGCATTGAAAAATTCCTATGAGAATATAGAAGAAATAAAAATCACACA 
TCCTGTTTCAACTGAAATTCCTGGAGATTGGCATTGTACTGTAAAGATTT 
CATTTAATGATAAAAAATCTATTGTTTATAATATTACACATAATTTGGAA 
TCGAAAAAAAATTATAGCGGAAAATTTAATGAAAAAAATATGAATTTTTT 
TGATTCAAGAATTGGTAAAACAAAAAAAACTATAAAAATTATTTTTTCAG 
ATGGtCAGGAGAAGATaCAA 

SEQ XD NO. 6506 

STRAIN M781 

GGAGGATTTTATATGAAAGAACAACAAAGAAAA 

GAAGAACTAAAACGGAATCGAGAATATGAAGTTAGTCTAGTCAAAGCATT 
GAAAAATTCCTATGAGAATATAGAAGAAATAAAAATCACACATCCTGTTT 
CAACTGAAATTCCTGGAGATTGGCATTGTACTGTAAAGATTTCATTTAAT 
GATAAAAAATCTATTGTTTATAATATTACACATAATTTGGAATCGAAAAA 
AAATTATAGCGGAAAATTTAATGAAAAAAATATGAATTTTTTTGATTCAA 
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GAATTGGTAAAAC^\AAAAAAACTATAAAAATTATTTTTTCAGATGGTCAG 
GAGAAGATACAA 

SEQ ID NO, 6507 

STRAIN CJB110 

GGAGGATTTTATATGAAAGAACAACAAAGAAAAGAAGAA 

CTAAAACGGAATCGAGAATATGAAGTTAGTCTAGTCAAAGCATTGAAAAA 

TTCCTATGAGAATATAGAAGAAATAAAAATCACACATCCTGTTTCAACTG 

AAATTCCTGGAGATTGGCATTGTACTGTAAAGATTTCATTTAATGATAAA 

AAATCTATTGTTTATAATATTACACATAATTTGGAATCGAAAAAAAATTA 

TAGCGGAAATTTTAATGAAAAAAATATGAATTTTTTTGATTCAAGAATTG 

GTAAAACAAAAAAAACTATAAAAATTATTTTTTCAGATGGTCAGGAGAAG 

ATACAA 

SEQ ID NO. 6508 

STRAIN 1169NT 

GGAGGATTTTATATGAAAGAACAACAAAG 

AAAAGAAGAACTAAAACGGAATCGAGAATATGAAGTTAGTCTAGTCAAAG 
CATTGAAAAATTCCTATGAGAATATAGAAGAAATAAAAATCACACATCCT 
GTTTCAACTGAAATTCCTGGAGATTGGCATTGTACTGTAAAGATTTCATT 
TAATGATAAAAJ\ATCTATTGTTTATAATATTACACATAATTTGGAATCGA 
AAAAAAATTATAGTGGAAAATTTAATGAAAAAAATATGAATTTTTTTGAT 
TCAAGAATTGGTAAAACAAAAAAAACTATAAAAATT ATT TTTTCAGATGG 
TCAGGAGAAGATACAA 

SEQ ID NO. 6509 

STRAIN JM9130013 
GGAGGATTTTATATGAAAGAACAAC 

AAAGAAAAGAAGAACTAAAACGGAATCGAGAATATGAAGTTAGTCTAGTC 
AAAGCATTGAAAAATTCCTATGAGAATATAGAAGAAATAAAAATCACACA 
TCCTGTTTCAACTGAAATTCCTGGAGATTGGCATTGTACTGTAAAGATTT 
CATTTAATGATAAAAAATCTATTGTTTATAATATTACACATAATTTGGAA 
TCGAAAAAAAATTATAGCGGAAAATTTAATGAAAAAAATATGAATTTTTT 
TGATTCAAGAATTGGTAAAACAAAAAAAACTATAAAAATTATTTTTTCAG 
AtGGtCAGGAGAAGATACAA 

SEQ ID NO. 6510 
STRAIN 2603 frame: 1 

MKKSTQIILLIVALFILVFSGGFYMKEQQRKEELKRNREYEVSLVKALBCNSYENIEEIKI 
THPVSTEIPGDWHCTVKISFNDKKSIVYNITHNLESKKNYSGKFNEKNMNFFDSRIGKTK 
KTIKIIFSDGQEKIQ 

SEQ ID NO. 651 X 

STRAIN 090 

GGFYMKEQQRKEELKRNREYEVSLVKALKNSYENIEEIKITHPVSTEIPGD 

WHCTVKISFNDKKSIVYNITHNLESKKNYSGNFNEKNMNFFDSRIGKTKKTIKIIFSDGQ 

EKIQ 

SEQ ID NO. 6512 

STRAIN A909 

GGFYMKEQQRKEELKRNREYEVSLVKALKNSYENIEEIKITHPVSTEIPGDWH 
CTVKISFNDKKS IVYNITHNLESKKNYSGKFNEKNMNFFDSRIGKTKKTIKIIFSDGQEK 
IQ 

SEQ ID NO. 6513 

STRAIN H36B 

GGFYMKEQQRKEELKRNREYEVSLVKALKNSYENIEEIKITHPVSTEIPGD 

WHCTVKISFNDKKSIVYNITHNLESKKNYSGKFNEKNMNFFDSRIGKTKKTIKIIFSDGQ 

EKIQ 

SEQ ID NO. 6514 
STRAIN 18RS21 

GGFYMKEQQRBCEELKRNREYEVSLVKALECNSYENIEEIKITHPVSTEIPGDW 
HCTVKISFNDBCKSIVYNITHNLESKKNYSGKFNEKNMNFFDSRIGKTKKTIKIIFSCX3QE 
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KIQ 

SEQ ID NO. 6515 

STRAIN CJB110 

GGFYMKEQQRKEELKRNREYEVSLVKALKNSYENIEEIKITHPVSTEIPGDWHCTVK 
ISTODKKSIVYNITHNLESKKNYSGNFNEKNMNFFDSRIGKTKKTIKIIFSDGQEKIQ 

SEQ ZD NO. 6516 

STRAIN JM9130013 

GGFYMKEQQRKEELKRNREYEVSLVKALKNSYENIEEIKITHPVSTEIPGDW 

HCTVKISFNDKKSIVYNITHNLESKKNYSGKFNEKNMNFFDSRIGECTKKTIKIIFSDGQE 

KIQ 

SEQ ID NO. 6517 

STRAIN 1169NT frame: 1 

GGFYMKEQQRKEELKRNREYEVSLVKALKNSYENIEEIKITHPVSTEIPGDWHCTVKISF 
NDKKSIVYNITHNLESKKNYSGKFNEKNMNFFDSRIGKTKKTIKIIFSDGQEKIQ 

SEQ ID NO. 6518 

STRAIN M781 frame: 1 

GGFYMKEQQRKEELKRNREYEVSLVKALKNSYENIEEIKITHPVSTEIPGDWHCTVKISF 
NDKKS IVYN ITHNLE SKKN YSGKFNEKNMNFFDSRIGKTKKT IKI I FS DGQEKIQ 

SEQ ID NO. 6601 
STRAIN 2603 

TTGACAAGGCATATAAAAATTTCTATACTAAATTTACAAAATGAAGGAGAGGGAACTATG 
GAAATACTGATTGCAGGTGGTAGTGGTTTTTTAGGAAAGCAGATAATAAAAGCAGCGCTT 
ACAAAAGGGCATAAAGTGGCTTACTTATCAAGACATGAAGGTAAAGGTGATATATTTAAG 
GATCCTAGATTAACCTACATTAGGGGAGATATTACAGAAGCTGATAAGATTCATTTAGAA 
GACAGAACTTTTGATATATTAATTGACTGTATTGGAGCGATTAAGCCCAATCAACTAGAT 
GAGCTTAACGTTAAAGCAACCCAAAAAGCAGTAGCACTCTGTCACAAAAATCAAATACCA 
AAGTTAGTTTATATTTCAGCCAACAGCGGCTATTCAGCTTACATTAAAAGTAAAAGGAAG 
GCAGAGCAGATAATCAAAGCAAGCGGTCTGGATTATCTTTTTGTAAGACCAGGTTTGATG 
TATGGTGAAGAGCGACCTCTCTCGATTTTCCAAGCCAAGTGTATAAAGTTATTTAGTCAT 
TTGCCTTTCTTAGGTATTGTTGTACAAAAGGTCTTTCCAACTAAGGTTGTGATAGTGGCA 
GAAGCAATCGTTACTACGCTTAGGAAAAAACCAACCCAAAAAATCCTTTCTATTGAAGAA 
TTAAATAATAAA 

SEQ ID NO. 6602 
STRAIN 090 

ACAAGGCATATAAAAATTTCTATACTAAATTTACAAAAT 

GAAGGAGAGGGAACTATGGAAATACTGATTGCAGGTGGTAGTGGTTTTTT 

AGGAAAGCAGATAATAAAAGCAGCGCTTACAAAAGGGCATAAAGTGGCTT 

ACTTATCAAGACATGAAGGTAAAGGTGATATATTTAAGGATCCTAGATTA 

ACCTACATTAGGGGAGATATTACAGAAGCTGATAAGATTCATTTAGAAGA 

CAGAACTTTTGATATATTAATTGACTGTATTGGAGCGATTAAGCCCAATC 

AACTAGATGAGCTTAACGTTAAAGCAACCCAAAAAGCAGTAGCACTCTGT 

CACAAAAATCAAATACCAAAGTTAGTTTATATTTCAGCCAACAGCGGCTA 

TTCAGCTTACATTAAAAGTAAAAGGAAGGCAGAGCAGATAATCAAAGCAA 

GCGGTCTGGATTATCTTTTTGTAAGACCAGGTTTGATGTATGGTGAAGAG 

CGACCTCTCTCGATTTTCCAAGCCAAGTGTATAAAGTTATTTAGTCATTT 

GCCTTTCTTAGGTATTGTTGTACAAAAGGTCTTTCCAACTAAGGTTGTGA 

TAGTGGCAGAAGCAATCGTTACTACGCTTAGGAAAAAACCAACCCAAAAA 

ATCCTTTCTATTGAAGAATTAAATAATAAA 

SEQ ID NO. 6603 
STRAIN A909 

ACAAGGCATATAAAAATTTCTATACTAAATTTACAAAATG 

AAGGAGAGGGAACTATGGAAATACTGATTGCAGGTGGTAGTGGTTTTTTA 

GGAAAGCAGATAATAAAAGCAGCGCTTACAAAAGGGCATAAAGTGGCTTA 

CTTATCAAGACATGAAGGTAAAGGTGATATATTTAAGGATCCTAGATTAA 

CCTACATTAGGGGAGATATTACAGAAGCTGATAAGATTCATTTAGAAGAC 

AGAACTTTTGATATATTAATTGACTGTATTGGAGCGATTAAGCCCAATCA 

ACTAGATGAGCTTAACGTTAAAGCAACCCAAAAAGCAGTAGCACTCTGTC 
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ACAAAAATCAAATACCAAAGTTAGTTTATATTTCAGCCAACAGCGGCTAT 
TCAGCTTACATTAAAAGTAAAAGGAAGGCAGAGCAGATAATCAAAGCAAG 
CGGTCTGGATTATCTTTTTGTAAGACCAGGTTTGATGTATGGTGAAGAGC 
GACCTCTCTCGATTTTCCAAGCCAAGTGTATAAAGTTATTTAGTCATTTG 
CCTTTCTTAGGTATTGTTGTACAAAAGGTCTTTCCAACTAAGGTTGTGAT 
AGTGGCAGAAGCAATCGTTACTACGCTTAGGAAAAAACCAACCCAAAAAA 
TCCTTTCTATTGAAGAATTAAATAATAAA 

SEQ ID MO. 6604 
STRAIN H36B 

TATAAAAATTTCTATACTAAATTTACAAAATGAAGGAGAGGGAACTATGG 
AAATACTGATTGCAGGTGGTAGTGGTTTTTTAGGAAAGCAGATAATAAAA 
GCAGCGCTTACAAAAGGGCATAAAGTGGCTTACTTATCAAGACATGAAGG 
TAAAGGTGATATATTTAAGGATCCTAGATTAACCTACATTAGGGGAGATA 
TTACAGAAGCTGATAAGATTCATTTAGAAGACAGAACTTTTGATATATTA 
ATTGACTGTATTGGAGCGATTAAGCCCAATCAACTAGATGAGCTTAACGT 
TAAAGCAACCCAAAAAGCAGTAGCACTCTGTCACAAAAATCAAATACCAA 
AGTTAGTTTATATTTCAGCCAACAGCGGCTATTCAGCTTACATTAAAAGT 
AAAAGGAAGGCAGAGCAGATAATCAAAGCAAGCGGTCTGGATTATCTTTT 
TGTAAGACCAGGTTTGATGTATGGTGAAGAGCGACCTCTCTCGATTTTCC 
AAGCCAAGTGTATAAAGTTATTTAGTCATTTGCCTTTCTTAGGTATTGTT 
GTACAAAAGGTCTTTCCAACTAAGGTTGTGATAGTGGCAGAAGCAATCGT 
TACTACGCTTAGGAAAAAACCAACCCAAAAAATCCTTTCTATTGAAGAAT 
TAAATAATAAA 

SEQ ID NO. 6605 
STRAIN 18RS21 

ACAAGGCATATAAAAATTTCTATACTAAATTTACAAAAT 

GAAGGAGAGGGAACTATGGAAATACTGATTGCAGGTGGTAGTGGTTTTTT 

AGGAAAGCAGATAATAAAAGCAGCGCTTACAAAAGGGCATAAAGTGGCTT 

ACTTATCAAGACATGAAGGTAAAGGTGATATATTTAAGGATCCTAGATTA 

ACCTACATTAGGGGAGATATTACAGAAGCTGATAAGATTCATTTAGAAGA 

CAGAACTTTTGATATATTAATTGACTGTATTGGAGCGATTAAGCCCAATC 

AACTAGATGAGCTTAACGTTAAAGCAACCCAAAAAGCAGTAGCACTCTGT 

CACAAAAATCAAATACCAAAGTTAGTTTATATTTCAGCCAACAGCGGCTA 

TTCAGCTTACATTAAAAGTAAAAGGAAGGCAGAGCAGATAATCAAAGCAA 

GCGGTCTGGATTATCTTTTTGTAAGACCAGGTTTGATGTATGGTGAAGAG 

CGACCTCTCTCGATTTTCCAAGCCAAGTGTATAAAGTTATTTAGTCATTT 

GCCTTTCTTAGGTATTGTTGTACAAAAGGTCTTTCCAACTAAGGTTGTGA 

TAGTGGCAGAAGCAATCGTTACTACGCTTAGGAAAAAACCAACCCAAAAA 

ATCCTTTCTATTGAAGAATTAAATaATAAA 

SEQ ID NO. 6606 
STRAIN M732 

CAAAATGAAGGAGAgGGAACTATGgAAATACTGATTGCAGGTGGTAGTGG 
TTTTCTAGGGAAGCAGATAATAAAAGCAGCGCTTACAAAAGGGCATAAGG 
TGGCTTACTTATCAAGGCATGAAGGTAAAGGTGATATATTTAAGGATCcT 
AGATTAACCTACATTAAGGGAGATATTACAGAAGCTGATAAGATTCATTT 
AGaACATAGAAATTTTGATATATTAATTGACTGTATTGGAGCGATTAAGC 
CCAATCAACTAGATGAGCTTAACGTTAAAGCAACCCAAAAAGCAGTAGCA 
CTCTGTCACAAAAATCAAATACCAAAGTTAGTTTACATTTCAGCCAATAG 
CGGCTATTCAGCTTACATTAAAAGTAAAAGGAAGGCAGAGCAGATAATCA 
AAGCAAGCGGTCTGGATTATCTTTTTGTAAGACCAGGTTTGATGTATGGT 
GAAGAGCGACCTCTCTCGATTTTCCAAGCCAAGTGTATAAAATTATTTAG 
TCATTTGCCTTTCTTAGGTATTGTTGTACAAAAAGTCTTTCCAACTAAGG 
TTGTGATAGTGGCAGAAGCAATCGTTACTTCGCTTAGGAAAAAACCAACT 
CAAAAAATCCTTTCTATTGAAGAATTAAATAATAAA 

SEQ ID NO. 6607 
STRAIN COH1 

ACAAGGCATATAAAAATTTCTATACTAAATTTAC 

AAAATGAAGGAGAGGGAACTATGGAAATACTGATTGCAGGTGGTAGTGGT 
TTTCTAGGGAAGCAGATAATAAAAGCAGCGCTTACAAAAGGGCATAAGGT 
GGCTTACTTATCAAGGCATGAAGGTAAAGGTGATATATTTAAGGATCCTA 
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GATTAACCTACATTAAGGGAGATATTACAGAAGCTGATAAGATTCATTTA 
GAACATAGAAATTTTGATATATTAATTGACTGTATTGGAGCGATTAAGCC 
CAATCAACTAGATGAGCTTAACGTTAAAGCAACCCAAAAAGCAGTAGCAC 
TCTGTCACAAAAATCAAATACCAAAGTTAGTTTACATTTCAGCCAATAGC 
GGCTATTCAGCTTACATTAAAAGTAAAAGGAAGGCAGAGCAGATAATCAA 
AGCAAGCGGTCTGGATTATCTTTTTGTAAGACCAGGTTTGATGTATGGTG 
AAGAGCGACCTCTCTCGATTTTCCAAGCCAAGTGTATAAAATTATTTAGT 
CATTTGCCTTTCTTAGGTATTGTTGTACAAAAAGTCTTTCCAACTAAGGT 
TGTGATAGTGGCAGAAGCAATCGTTACTTCGCTTAGGAAAAAACCAACTC 
AAAAAATCCTTTCTATTGAAGAATTAAATAATAAA 

SEQ ID NO. 6608 
STRAIN M781 

ACAAGGCATATAAAAATTTcTATACTAAATTTaCA 

AAATGAAGGAGAGGGAACTATGGAAATACTGATTGCAGGTGGTAGTGGTT 
TTCTAGGGAAGCAGATAATAAAAGCAGCGCTTACAAAAGGGCATAAGGTG 
GCTTACTTATCAAGGCATGAAGGTAAAGGTGATATATTTAAGGATCCTAG 
ATTAACCTACATTAAGGGAGATATTACAGAAGCTGATAAGATTCATTTAG 
AACATAGAAATTTTGATATATTAATTGACTGTATTGGAGCGATTAAGCCC 
AATCAACTAGATGAGCTTAACGTTAAAGCAACCCAAAAAGCAGTAGCACT 
CTGTCACAAAAATCAAATACCAAAGTTAGTTTACATTTCAGCCAATAGCG 
GCTATTCAGCTTACATTAAAAGTAAAAGGAAGGCAGAGCAGATAATCAAA 
GCAAGCGGTCTGGATTATCTTTTTGTAAGACCAGGTTTGATGTATGGTGA 
AGAGCGACCTCTCTCGATTTTCCAAGCCAAGTGTATAAAATTATTTAGTC 
ATTTGCCTTTCTTAGGTATTGTTGTACAAAAAGTCTTTCCAACTAAGGTT 
GTGATAGTGGCAGAAGCAATCGTTACTTCGCTTAGGAAAAAACCAACTCA 
AAAAATCCTTT CTAt TGAAGAATTAAATAAT AAA 

SEQ ID NO. 6609 
STRAIN 1169NT 

ACAAGGCAT AT AAAAATTT CTAT ACT AAAT TTACAAA 

ATGAAGGAGAGGGAACTATGGAAATACTGATTGCAGGTGGTAGTGGTTTT 

TTAGGAAAGCAGATAATAAAAGCAGCGCTTACAAAAGGGCATAAGTTGGC 

TTACTTATCAAGACATGAAGGTAAAGGTGATATATTTAAGGATCCTAGAT 

TAACCTACATTAAGGGAGATATTACAGAAGCTGATAAGATTCATTTAGAA 

GACAGAACTTTTGATATATTAATTGACTGTATTGGAGCGATTAAGCCCAA 

TCAACTAGATGAGCTTAACGTTAAAGCAACCCAAAAAGCAGTAGCACTCT 

GTCACAAAAATCAAATACCAAAGTTAGTTTACATTTCAGCCAACAGCGGC 

TATTCAGCTTACATTAGAAGTAAAAGGAAGGCAGAGCAGATAATCAAAGC 

AAGCGGTCTGGATTATCTTTTTGTAAGACCAGGTTTGATGTATGGTGAAG 

AGCGACCTCTCTCGATTTTCCAAGCCAAGTGTATAAAATTATTTAGTCAT 

TTGCCTTTCTTAGGTATTGTTGTACAAAAGGTCTTTCCAACTAAGGTTGT 

GATAGTGGCAGAAGCAATCGTTACTACGCTTAGGACAAAACCAACTCAAA 

AAATCCTTTCTATTGAAGAATTAAATAATAAA 

SEQ ID NO. 6610 
STRAIN CJB110 

ACAAGGCATATAAAAATTTCTATACTAAATTTACAAA 

ATGAAGGAGAGGGAACTATGGAAATACTGATTGCAGGTGGTAGTGGTTTT 

TTAGGAAAGCAGATAATAAAAGCAGCGCTTACAAAAGGGCATAAAGTGGC 

TTACTTATCAAGACATGAAGGTAAAGGTGATATATTTAAGGATCCTAGAT 

TAACCTACATTAGGGGAGATATTACAGAAGCTGATAAGATTCATTTAGAA 

GACAGAACTTTTGATATATTAATTGACTGTATTGGAGCGATTAAGCCCAA 

TCAACTAGATGAGCTTAACGTTAAAGCAACCCAAAAAGCAGTAGCACTCT 

GTCACAAAAATCAAATACCAAAGTTAGTTTATATTTCAGCCAACAGCGGC 

TATTCAGCTTACATTAAAAGTAAAAGGAAGGCAGAGCAGATAATCAAAGC 

AAGCGGTCTGGATTATCTTTTTGTAAGACCAGGTTTGATGTATGGTGAAG 

AGCGACCTCTCTCGATTTTCCAAGCCAAGTGTATAAAGTTATTTAGTCAT 

TTGCCTTTCTTAGGTATTGTTGTACAAAAGGTCTTTCCAACTAAGGTTGT 

GATAGTGGCAGAAGCAATCGTTACTACGCTTAGGAAAAAACCAACCCAAA 

AAATCCTTTCTATTGAAGAATTAAATAATAAA 

SEQ ID NO. 6611 
STRAIN JM9130013 
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ACAAGGCATATAAAAATTTCTATACTAAATTTACAAAATG 

AAGGAGAGGGAACTATGGAAATACTGATTGCAGGTGGTAGTGGTTTTTTA 

GGAAAGCAGATAATAAAAGCAGCGCTTACAAAAGGGCATAAAGTGGCTTA 

CTTATCAAGACATGAAGGTAAAGGTGATATATTTAAGGATCCTAGATTAA 

CcTACATTAGGGGAGATATTACAGAAGCTGATAAGATTCATTTAGAAGAC 

AGAACTTTTGATATATTAATTGACTGTATTGGAGCGATTAAGCCCAATCA 

ACTAGATGAGCTTAACGTTAAAGCAACCCAAAAAGCAGTAGCACTCTGTC 

ACAAAAATCAAATACCAAAGTTAGTTTATATTTCAGCCAACAGCGGCTAT 

TCAGCTTACATTAAAAGTAAAAGGAAGGCAGAGCAGATAATCAAAGCAAG 

CGGTCTGGATTATCTTTTTGTAAGACCAGGTTTGATGTATGGTGAAGAGC 

GACCTCTCTCGATTTTCCAAGCCAAGTGTATAAAGTTATTTAGTCATTTG 

CCtTTCTTAgGTATTGTTGTACAAAAGGTCTTTCCAACTAAGGTTGTGAT 

AGTGGCAGAAGCAATCGTTACTACGCTTAGGAAAAAACCAACCCAAAAAA 

TCCTTTCTATTGAAGAATTAAATAATAAA 

SEQ ID NO. 6612 
STRAIN 2603 frame: 1 

TRHIKISILNLQNEGEGTMEILIAGGSGFLGKQIIKAALTKGHKVAYLSRHEGKGDIFKD 
PRLTYIRGDITEADKIHLEDRTFDILIDCIGAIKPNQLDELNVECATQKAVALCHKNQIPK 
LVYISANSGYSAYIKSKRKAEQIIKASGLDYLFVRPGLMYGEERPLSIFQAKCIKLFSHL 
PFLGIWQKVFPTKWIVAEAIVTTLRKKPTQKILSIEELNNK 

SEQ ID NO. 66X3 

STRAIN 090 frame: 1 

TRHIKISILNLQNEGEGTMEILIAGGSGFLGKQIIKAALTKGHKVAYLSRHEGKGDIFKD 
PRLTYIRGDITEADKIHLEDRTFDILIDCIGAIKPNQLDELNVKATQKAVALCHKNQIPK 
LVYISANSGYSAYIKSKRKAEQIIKASGLDYLFVRPGLMYGEERPLSIFQAKCIKLFSHL 
PFLGIWQKVFPTKWIVAEAIVTTLRKKPTQKILSIEELNNK 

SEQ ID NO. 6614 

STRAIN A909 frame: 1 

TRHIKISILNLQNEGEGTMEILIAGGSGFLGKQIIKAALTKGHKVAYLSRHEGKGDIFKD 
PRLTYIRGDITEADKIHLEDRTFDILIDCIGAIKPNQLDELNVKATQKAVALCHKNQIPK 
LVYISANSGYSAYIKSKRKAEQIIKASGLDYLFVRPGLMYGEERPLSIFQAKCIKLFSHL 
PFLGIWQKVFPTKWIVAEAIVTTLRKKPTQKILSIEELNNK 

SEQ ID NO. 6615 

STRAIN H36B frame: 2 

IKISILNLQNEGEGTMEILIAGGSGFLGKQIIKAALTKGHKVAYLSRHEGKGDIFKDPRL 
TYIRGDITEADKIHLEDRTFDILIDCIGAIKPNQLDELNVKATQKAVALCHKNQIPKLVY 
ISANSGYSAYIKSKRKAEOHKASGLDYLFVRPGLMYGEERPLSIFQAKCIKLFSHLPFL 
GIWQKVFPTKWIVAEAIVTTLRKKPTQKILSIEELNNK 

SEQ ID NO. 6616 

STRAIN 18RS21 frame: 1 

TRHIKISILNLQNEGEGTMEILIAGGSGFLGKQIIKAALTKGHKVAYLSRHEGKGDIFKD 
PRLTYIRGDITEADKIHLEDRTFDILIDCIGAIKPNQLDELNVKATQKAVALCHKNQIPK 
LVYISANSGYSAYIKSKRKAEQIIKASGLDYLFVRPGLMYGEERPLSIFQAKCIKLFSHL 
PFLGIWQKVFPTKWIVAEAIVTTLRKKPTQKILSIEELNNK 

SEQ ID NO. 6617 

STRAIN M732 frame: 1 

QNEGEGTMEILIAGGSGFLGKQIIKT^ALTKGHKVAYLSRHEGKGDIFKDPRLTYIKGDIT 
EADKIHLEHRNFDILIDCIGAIKPNQLDELNVKATQKAVALCHKNQIPKLVYISANSGYS 
AYIKSKRKAEQIIKASGLDYLFVRPGLMYGEERPLSIFQAKCIKLFSHLPFLGIWQKVF 
PTKWIVAEAIVTSLRKKPTQKILSIEELNNK 

SEQ ID NO. 6618 

STRAIN COH1 frame: 1 

TRHIKISILNLQNEGEGTMEILIAGGSGFLGKQIIKAALTKGHKVAYLSRHEGKGDIFKD 
PRLTYIKGDITEADKIHLEHRNFDILIDCIGAIKPNQLDELNVKATQKAVALCHKNQIPK 
LVYISANSGYSAYIKSKRKAEQIIKASGLDYLFVRPGLMYGEERPLSIFQAKCIKLFSHL 
PFU3IWQKVFPTKWIVAEAIVTSLRKKPTQKILSIEELNNK 
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SEQ ID NO. 6619 

STRAIN M781 frame: 1 

TRHIKISILNLQNEGEGTMEILIAGGSGFLGKQIIKAALTKGHKVAYLSRHEGKGDIFKD 
PRLTYIKGDITEADKIHLEHRNFDILIDCIGAIKPNQLDELNVKATQKAVALCHKNQIPK 
LVYISANSGYSAYIKSKRKAEQIIBCASGLDYLFVRPGLMYGEERPLSIFQAKCIKLFSHL 
PFLGIWQKVFPTKWIVAEAIVTSLRKKPTQKILSIEELNNK 

SEQ ID NO. 6620 

STRAIN 1169NT frame: 1 

TRHIKISILNLQNEGEGTMEILIAGGSGFLGKQIIKAALTKGHKLAYLSRHEGKGDIFKD 
PRLTYIKGDITEADKIHLEDRTFDILIDCIGAIKPNQLDELNVKATQKAVALCHKNQIPK 
LVYISANSGYSAYIRSKRKAEQIIBCASGLDYLFVRPGLMYGEERPLSIFQAKCIKLFSHL 
PFLGIWQKVFPTKWIVAEAIVTTLRTKPTQKILSIEELNNK 

SEQ ID NO. 6621 

STRAIN CJB110 frame: 1 

TRHI KI S I LNLQNEGEGTME IL I AGGSGFLGKQI IKAALTKGHKVAYLSRHEGKGDI FKD 
PRLTYIRGDITEADKIHLEDRTFDILIDCIGAIKPNQLDELNVKATQKAVALCHKNQIPK 
LVYISANSGYSAYIKSKRKAEQIIKASGLDYLFVRPGLMYGEERPLSIFQAKCIKLFSHL 
PFLGIWQKVFPTKWIVAEAIVTTLRKKPTQKILSIEELNNK 

SEQ ID NO. 6622 

STRAIN JM9130013 frame: 1 

TRHIKISILNLQNEGEGTMEILIAGGSGFLGKQIIKAALTKGHKVAYLSRHEGKGDIFKD 
PRLTYIRGDITEADKIHLEDRTFDILIDCIGAIKPNQLDELNVKATQKAVALCHKNQIPK 
LVYISANSGYSAYIKSKRKAEQIIKASGLDYLFVRPGLMYGEERPLSIFQAKCIKLFSHL 
PFLGIWQKVFPTKWIVAEAIVTTLRKKPTQKILSIEELNNK 

SEQ ID NO. 6701 
STRAIN 090 

CAATAACAACATTTGAAAATAAAAAAGTTTTAGTCCTTGGTTTAGCACGA 
TCTGGAGAAGCCGCTGCACGTTTGTTAGCTAAGTTAGGAGCAATAGTGAC 
AGTTAATGATGGCAAACCATTTGATGAAAATCCAACAGCACAGTCTTTGT 
TGGAAGAGGGTATTAAAGTGGTTTGTGGTAGTCATCCTTTAGAATTGTTA 
GATGAGGATTTTTGTTACATGATTAAAAATCCAGGAATACCTTATAACAA 
TCCTATGGTCAAAAAAGCATTAGAAAAACAAATCCCTGTTTTGACTGAAG 
TGGAATTAGCATACTTAGTTTCAGAATCTCAGCTAATAGGTATTACAGGC 
TCTAACGGGAAAACGACAACGACAACGATGATTGCAGAAGTCTTAAATGC 
TGGAGGTCAGAGAGGTTTGTTAGCTGGGAATATCGGCTTTCCTGCTAGTG 
AAGTTGTTCAGGCTGCGGATGATAAAGATATTCTAGTTATGGAATTATCA 
AGTTTTCAGCTAATGGGAGTTAAGGAATTTCGTCCTCATATTGCAGTAAT 
TACTAATTTAATGCCAACTCATTTAGATTATCATGGGTCTTTTGAAGATT 
ATGTTGCTGCAAAATGGAATATCCAAAATCAAATGTCTTCATCTGATTTT 
TTGGTACTTAATTTTAATCAAGGTATTTCTAAAGAGTTAGcTAAAACTAC 
TAAAGCAACAATCGTTCCTTTCTCTACyACGGAAAAAGTTGATGGTGCTT 
ACGTACAAGACAAGCAACTTTTCTATAAAGGGGAGAATATTATGTTAGTA 
GATGACATTGGTGTCCCAGGAAGCCATAACGTAGAGAATGCTCTAGCAAC 
TATTGCGGTTGCTAAACTAGCTGGTATCAGTAATCAAGTTATTAGAGAAA 
CTTTAAGCAATTTTGGAGGTGTTAAACACCGCTTGCAATCACTCGGTAAG 
GTTCATGGTATTAGTTTCTATAACGACAGCAAGTCAACTAATATATTGGC 
AACTCAAAAAGCATTATCTGGCTTTGATAATACTAAAGTTATCCTAATTG 
CAGGAGGTCTTGATCGCGGTAATGAGTTTGATGAATTGATACCAGATATC 
ACTGGACTTAAACATATGGTTGTTTTAGGGGAATCGGCATCTCGAGTAAA 
ACGTGCTGCACAAAAAGCAGGAGTAACTTATAGCGATGCTTTAGATGTTA 
GAGATGCGGTACATAAAGCTTATGAGGTGGCACAACAGGGCGATGTTATC 
TTGCTAAGTCCTGCAAATGCATCATGGGACATGTATAAGAATTTCGAAGT 
CCGTGGTGATGAATTCATTGATACtTTCGAAAGTCTTAGAGGAGAG 

SEQ ID NO. 6702 
STRAIN A909 

CAATAACAACATTTGAAAATAAAAAAGTTTTAGTCCTTGGTTTAGCACGA 
TCTGGAGAAGCTGCTGCACGTTTGTTAGCTAAGTTAGGAGCAATAGTGAC 
AGTTAATGATGGCAAACCATTTGATGAAAATCCAACAGCACAGTCTTTGT 
TGGAAGAGGGTATTAAAGTGGTTTGTGGTAGTCATCCTTTAGAATTGTTA 
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GATGAGGATTTTTGTTACATGATTAAAAATCCAGGAATACCTTATAACAA 
TCCTATGGTCAAAAAAGCATTAGAAAAACAAATCCCTGTTTTGACTGAAG 
TGGAATTAGCATACTTAGTTTCAGAATCTCAGCTAATAGGTATTACAGGC 
TCTAACGGGAAAACGACAACGACAACGATGATTGCAGAAGTCTTAAATGC 
TGGAGGTCAGAGAGGTTTGTTAGCTGGGAATATCGGCTTTCCTGCTAGTG 
AAGTTGTTCAGGCTGCGAATGATAAAGATACTCTAGTTATGGAATTATCA 
AGTTTTCAGCTAATGGGAGTTAAGGAATTTCGTCCTCATATTGCAGTAAT 
TACTAATTTAATGCCAACTCATTTAGATTATCATGGGTCTTTTGAAGATT 
ATGTTGCTGCAAAATGGAATATCCAAAATCAAATGTCTTCATCTGATTTT 
TTGGTACTTAATTTTAATCAAGGTATTTCTAAAGAGTTAGCTAAAACTAC 
TAAAGCaACAATCGTTCCTTTCTCTACTACGGAAAAAGTTGATGGTGCTT 
ACGTACAAGACAAGCAACTTTTCTATAAAGGGGAGAATATTATGTCAGTA 
GATGACATTGGTGTCCCAGGAAGCCATAACGTAnAGAATGCTCTAGCAAC 
TATTGCGGTTGCTAAACTGGCTGGTATCAGTAATCAAGTTATTAgAGAAA 
CTTTAAGCAATTTTGGAGGtGTTAAACACCGCTTGCAATCACTCGGTAAG 
GTTCATGGTATTAGTTTCTATAACGACAGCAAGTCAACTAATATATTGGC 
AACTCAAAAAGCATTATCTGGCTTTGATAATACTAAAGTTATCCTAATTG 
CAGGAGGTCTTGATCGCGGTAATGAGTTTGATGAATTGATACCAGATATC 
ACTGGACTTAAACATATGGTTGTTTTAGGGGAATCGGCATCTCGAGTAAA 
ACGTGCTGCACAAAAAGCAGGAGTAACTTATAGCGATGCTTTAGATGTTA 
GAGATGCGGTACATAAAGCTTATGAGGTGGCACAACAGGGCGATGTTATC 
TTGCTAAGTCCTGCAAATGCATCATGGGACATGTATAAGAATTTCGAAGT 
CCGTGGTGATGAATTCATTGATACTTTCGAAAGTCTTAGAGGAGAG 

SEQ ID NO. 6703 
STRAIN H36B 

GGACGAGTAATGAAAACAATAACAACATTT GAAAAT 

AAAAAAGTTTTAGTCCTTGGTTTAGCACGATCTGGAGAAGCTGCTGCACG 
TTTGTTAGCTAAGTTAGGAGCAATAGTGACAGTTAATGATGGCAAACCAT 
TTGATGAAAATCCAACAGCACAGTCTTTGTTGGAAGAGGGTATTAAAGTG 
GTTTGTGGTAGTCATCCTTTAGAATTGTTAGATGAGGATTTTTGTTACAT 
GATTAAAAATCCAGGAATACCTTATAACAATCCTATGGTCAAAAAAGCAT 
TAGAAAAACAAATCCCTGTTTTGACTGAAGTGGAATTAGCATACTTAGTT 
TCAGAATCTCAGCTAATAGGTATTACAGGCTCTAACGGGAAAACGACAAC 
GACAACGATGATTGCAGAAGTCTTAAATGCTGGAGGTCAGAGAGGTTTGT 
TAGCTGGGAATATCGGCTTTCCTGCTAGTGAAGTTGTTCAGGCTGCGAAT 
GATAAAGATACTCTAGTTATGGAATTATCAAGTTTTCAGCTAATGGGAGT 
TAAGGAATTTCGTCCTCATATTGCAGTAATTACTAATTTAATGCCAACTC 
ATTTAGATTATCATGGGTCTTTTGAAGATTATGTTGCTGCAAAATGGAAT 
ATCCAAAATCAAATGTCTTCATCTGATTTTTTGGTACTTAATTTTAATCA 
AGGTATTTCTAAAGAGTTAGCTAAAACTACTAAAGCAACAATCGTTCCTT 
TCTCTACTACGGAAAAAGTTGATGGTGCTTACGTACAAGACAAGCAACTT 
TTCTATAAAGGGGAGAATATTATGTCAGTAGATGACATTGGTGTCCCAGG 
AAGCCATAACGTAGAGAATGCTCTAGCAACTATTGCGGTTGCTAAACTGG 
CTGGTATCAGTAATCAAGTTATTAGAGAAACTTTAAGCAATTTTGGAGGT 
GTTAAACACCGCTTGCAATCACTCGGTAAGGTTCATGGTATTAGTTTCTA 
TAACGACAGCAAG 

SEQ ID NO. 6704 
STRAIN 18RS21 

GGACGAGTAATGAAAACAATAACAACATTTG 

AAAATAAAAAAGTTTTAGTCCTTGGTTTAGCACGATCTGGAGAAGCTGCT 
GCACGTTTGTTAGCTAAGTTAGGAGCAATAGTGACAGTTAATGATGGCAA 
ACCATTTGATGAAAATCCAACAGCACAGTCTTTGTTGGAAGAGGGTATTA 
AAGTGGTTTGTGGTAGTCATCCTTTAGAATTGTTAGATGAGGATTTTTGT 
TACATGATTAAAAATCCAGGAATACCTTATAACAATCCTATGGTCAAAAA 
AGCATTAGAAAAACAAATCCCTGTTTTGACTGAAGTGGAATTAGCATACT 
TAGTTTCAGAATCTCAGCTAATAGGTATTACAGGCTCTAACGGGAAAACG 
ACAACGACAACGATGATTGCAGAAGTCTTAAATGCTGGAGGTCAGAGAGG 
TTTGTTAGCTGGGAATATCGGCTTTCCTGCTAGTGAAGTTGTTCAGGCTG 
CGAATGATAAAGATACTCTAGTTATGGAATTATCAAGTTTTCAGCTAATG 
GGAGTTAAGGAATTTCGTCCTCATATTGCAGTAATTACTAATTTAATGCC 
AACTCATTTAGATTATC^TGGGTCTTTTGAAGATTATGTTGCTGCAAAAT 
GGAATATCCAAAATCAAATGTCTTCATCTGATTTTTTGGTACTTAATTTT 
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AATCAAGGTATTTCTAAAGAGTTAGCTAAAACTACTAAAGCAACAATCGT 
TCCTTTCTCTACTACGGAAAAAGTTGATGGTGCTTACGTACAAGACAAGC 
AACTTTTCTATAAAGGGGAGAATATTATGTCAGTAGATGACATTGGTGTC 
CCAGGAAGCCATAACGTAGAGAATGCTCTAGCAACTATTGCGGTTGCTAA 
ACTGGCTGGTATCAGTAATCAAGTTATTAGAGAAACTTTAAGCAATTTTG 
GAGGTGTTAAACACCGCTTGCAATCACTCGGTAAGGTTCATGGTATTAGT 
TTCTATAACGACAGCAAGTCAACTAATATATTGGCAACTCAAAAAGCATT 
ATCTGGCTTTGATAATACTAAAGTTATCCTAATTGCAGGAGGTCTTGATC 
GCGGTAATGAGTTTGATGAATTGATACCAGATATCACTGGACTTAAACAT 
ATGGTTGTTTTAGGGGAATCGGCATCTCGAGTAAAACGTGCTGCACAAAA 
AGCAGGAGTAACTTATAGCGATGCTTTAGATGTTAGAGATGCGGTACATA 
AAGCTTATGAGGTGGCACAACAGGGCGATGTTATCTTGCTAAGTCCTGCA 
AATGCATCATGGGACATGTATAAGAATTTCGAAGTCCGTGGTGATGAATT 
CATTGATACTTTCGAAAGTCTTAGAGGAGAG 

SEQ ID NO. 6705 
STRAIN M732 

GGACGAGTAATGAAAACAATAACAACATTTGAAA 

ATAAAAAAGTTTTAGTCCTTGGTTTAGCACGATCTGGAGAAGCCGCTGCA 
CGTTTGTTAGCTAAGTTAGGAGCAATAGTGACAGTTAATGATGGCAAACC 
ATTTGATGAAAATCCAACAGCACAGTCTTTGTTGGAAGAGGGTATTAAAG 
TGGTTTGTGGTAGTCATCCTTTAGAATTGTTAGATGAGGATTTTTGTTAC 
ATGATTAAAAATCCAGGAATACCTTATAACAATCCTATGGTCAAAAAAGC 
ATTAGAAAAACAAATCCCTGTTTTGACTGAAGTGGAATTAGCATACTTAG 
TTTCAGAATCTCAGCTAATAGGTATTACAGGCTCTAACGGGAAAACGACA 
ACGACAACGATGATTGCAGAAGTCTTAAATGCTGGAGGTCAGAGAGGTTT 
GTTAGCTGGGAATATCGGCTTTCCTGCTAGTGAAGTTGTTCAGGCTGCGG 
aTGATAAAGATATTCTAGTTATGGAATTATCAAGTTTTCAGCTAATGGGA 
GTTAAGGAATTTCGTCCTCATATTGCAGTAATTACTAATTTAATGCCAAC 
TCAtTTAGATTATCATGGGTCTTTTGAAGATTATGtTGCTGCAAAATGGA 
ATATCCAAAATCAAATGTCTTCATCTGATTTTTTGGTACTTAATTTTAAT 
CAAGGTATTTCTAAAGAGTTAGCTAAAACTACTAAAGCAACAaTCGTTCC 
TTTCTCTACTACGGAAAAAGTTGATGGTGCTTACGTACAAGACAAGCAAC 
TTTTCTATAAAGGGGAGAATATTATGTCAGTAGATGACATTGGTGTCCCA 
GGAAGCCATAACGTAGAGAATGCTCTAGCAACTATTGCGGTTGCTAAACT 
AGCTGGTATCAGTAATCAAGTTATTAGAGAAACTTTAAGCAATTTTGGAG 
GTGTTAAACACCGCTTGCAATCACTCGGTAAGGTTCATGGTATTAGTTTC 
TATAACGACAGCAAGTCAACTAATATATTGGCAACTCAAAAAGCATTATC 
TGGCTTTGATAATACTAAAGTTATCCTAATTGCAGGAGGTCTTGATCGCG 
GTAATGAGTTTGATGAATTGATACCAGATATCACTGGACTTAAACATATG 
GTTGTTTTAGGGGAATCGGCATCTCGAGTAAAACGTGCTGCACAAAAAGC 
AGGAGTAACTTATAGCGATGCTTTAGATGTTAGAGATGCGGTACATAAAG 
CTTATGAGGTGGCACAACAGGGCGATGTTATCTTGCTAAGTCCTGCAAAT 
GCATCATGGGACATGTATAAGAATTTCGAAGTCCGTGGTGATGAATTCAT 
TGATACTTTCGAAAGTCTTAGAGGAGAG 

SEQ ID NO. €706 
STRAIN COH1 

GGACGAGTAATGAAAACAATAACAACATTTGA 

AAATAAAAAAGTTTTAGTCCTTGGTTTAGCACGATCTGGAGAAGCCGCTG 
CACGTTTGTTAGCTAAGTTAGGAGCAATAGTGACAGTTAATGATGGCAAA 
CCATTTGATGAAAATCCAACAGCACAGTCTTTGTTGGAAGAGGGTATTAA 
AGTGGTTTGTGGTAGTCATCCTTTAGAATTGTTAGATGAGGATTTTTGTT 
ACATGATTAAAAATCCAGGAATACCTTATAACAATCCTATGGTCAAAAAA 
GCATTAGAAAAACAAATCCCTGTTTTGACTGAAGTGGAATTAGCATACTT 
AGTTTCAGAATCTCAGCTAATAGGTATTACAGGCTCTAACGGGAAAACGA 
CAACGACAACGATGATTGCAGAAGTCTTAAATGCTGGAGGTCAGAGAGGT 
TTGTTAGCTGGGAATATCGGCTTTCCTGCTAGTGAAGTTGTTCAGGCTGC 
GGaTGATAAAGATATTCTAGTTATGGAATTATCAAGTTTTCAGCTAATGG 
GAGTTAAGGAATTTCGTCCTCATATTGCAGTAATTACTAATTTAATGCCA 
ACTCATTTAGATTATCATGGGTCTTTTGAAGATTATGTTGCTGCAAAATG 
GAATATCCAAAATCAAATGTCTTCATCTGATTTTTTGGTACTTAATTTTA 
ATCAAGGTATTTCTAAAGAGTTAGCTAAAACTACTAAAGCAaCAATCGTT 
CCTTTCTCTACTACGGAAAAAGTTGATGGTGCTTACGTACAAGACAAGCA 



275 



WO 2004/018646 



PCT/US2003/026827 



SEQUENCE LISTING 



ACTTTTCTATAAAGGGGAGAATATTATGTCAGTAGATGACATTGGTGTCC 
CAGGAAGCCATAACGTAGAGAATGCTCTAGCAACTATTGCGGTTGCTAAA 
CTAGCTGGTATCAGTAATCAAGTTATTAGAGAAACTTTAAGCAATTTTGG 
AGGTGTTAAACACCGCTTGCAATCACTCGGTAAGGTTCATGGTATTAGTT 
TCTATAACGACAGCAAGTCAACTAATATATTGGCAACTCAAAAAGCATTA 
TCTGGCTTTGATAATACTAAAGTTATCCTAATTGCAGGAGGTCTTGATCG 
CGGTAATGAGTTTGATGAATTGATACCAGATATCACTGGACTTAAACATA 
TGGTTGTTTTAGGGGAATCGGCATCTCGAGTAAAACGTGCTGCACAAAAA 
GCAGGAGTAACTTATAGCGATGCTTTAGATGTTAGAGATGCGGTACATAA 
AGCTTATGAGGTGGCACAACAGGGCGATGTTATCTTGCTAAGTCCTGCAA 
ATGCATCATGGGACATGTATAAGAATTTCGAAGTCCGTGGTGATGAATTC 
ATTGATACTTTCGAAA 

SEQ ID NO. 6707 
STRAIN M781 

GGACGAGTAATGAAAACAATAACAACATT 

TGAAAATAAAAAAGTTTTAGTCCTTGGTTTAGCACGATCTGGAGAAGCCG 
CTGCACGTTTGTTAGCTAAGTTAGGAGCAATAGTGACAGTTAATGATGGC 
AAACCATTTGATGAAAATCCAACAGCACAGTCTTTGTTGGAAGAGGGTAT 
TAAAGTGGTTTGTGGTAGTCATCCTTTAGAATTGTTAGATGAGGATTTTT 
GTTACATGATTAAAAATCCAGGAATACCTTATAACAATCCTATGGTCAAA 
AAAGCATTAGAAAAACAAATCCCTGTTTTGACTGAAGTGGAATTAGCATA 
CTTAGTTTCAGAATCTCAGCTAATAGGTATTACAGGCTCTAACGGGAAAA 
CGACAACGACAACGATGATTGCAGAAGTCTTAAATGCTGGAGGTCAGAGA 
GGTTTGTTAGCTGGGAATATCGGCTTTCCTGCTAGTGAAGTTGTTCAGGC 
TGCGGATGATAAAGATATTCTAGTTATGGAATTATCAAGTTTTCAGCTAA 
TGGGAGTTAAGGAATTTCGTCCTCATATTGCAGTAATTACTAATTTAATG 
CCAACTCATTTAGATTATCATGGGTCTTTTGAAGATTATGTTGCTGCAAA 
ATGGAATATCCAAAATCAAATGTCTTCATCTGATTTTTTGGTACTTAATT 
TTAATCAAGGTATTTCTAAAGAGTTAGCTAAAACTACTAAAGCAaCAATC 
GTTCCTTTCTCTACTACGGAAAAAGTTGATGGTGCTTACGTACAAGACAA 
GCAACTTTTCTATAAAGGGGAGAATATTATGTCAGTAGATGACATTGGTG 
TCCCAGGAAGCCATAACGTAGAGAATGCTCTAGCAACTATTGCGGTTGCT 
AAACTAGCTGGTATCAGTAATCAAGTTATTAGAGAAACTTTAAGCAATTT 
TGGAGGTGTTAAACACCGCTTGCAATCACTCGGTAAGGTTCATGGTATTA 
GTTTCTATAACGACAGCAAGTCAACTAATATATTGGCAACTCAAAAAGCA 
TTATCTGGCTTTGATAATACTAAAGTTATCCTAATTGCAGGAGGTCTTGA 
TCGCGGTAATGAGTTTGATGAATTGATACCAGATATCACTGGACTTAAAC 
ATATGGTTGTTTTAgGGGAATCGGCATCTCGAGTAAAACGTGCTGCACAA 
AAAGCAGGAGTaACTTATAGCGATGCTTTAGATGTTAGAGATGCGGTACA 
TAAAGCTTATGAGGTGGCACAACAGGGCGATGTTATCTTGCTAAGTCCTG 
CAAATGCATCATGGGACATGTATAAGAATTTCGAAGTCCGTGGTGATGAA 
TTCATTGATACTTTCGAAAGTCTTAGAGGAGAG 

SEQ ID NO. 6708 
STRAIN CJB110 

GGACGAGTAATGAAAACAATAACAACATTTGA 

AAATAAAAAAGTTTTAGTCCTTGGTTTAGCACGATCTGGAGAAGCCGCTG 
CACGTTTGTTAGCTAAGTTAGGAGCAATAGTGACAGTTAATGATGGCAAA 
CCATTTGATGAAAATCCAACAGCACAGTCTTTGTTGGAAGAGGGTATTAA 
AGTGGTTTGTGGTAGTCATCCTTTAGAATTGTTAGATGAGGATTTTTGTT 
ACATGATTAAAAATCCAGGAATACCTTATAACAATCCTATGGTCAAAAAA 
GCATTAGAAAAACAAATCCCTGTTTTGACTGAAGTGGAATTAGCATACTT 
AGTTTCAGAATCTCAGCTAATAGGTATTACAGGCTCTAACGGGAAAACGA 
CAACGACAACGATGATTGCAGAAGTCTTAAATGCTGGAGGTCAGAGAGGT 
TTGTTAGCTGGGAATATCGGCTTTCCTGCTAGTGAAGTTGTTCAGGCTGC 
GGATGATAAAGATATTCTAGTTATGGAATTATCAAGTTTTCAGCTAATGG 
GAGTTAAGGAATTTCGTCCTCATATTGCAGTAATTACTAATTTAATGCCA 
ACTCATTTAGATTATCATGGGTCTTTTGAAGAATATGTTGCTGCAAAATG 
GAATATCCAAAATCAAATGTCTTCATCTGATTTTTTGGTACTTAATTTTA 
ATCAAGGTATTTCTAAAGAGTTAGCTAAAACTACTAAAGCAACAATCGTT 
CCTTTCTCTACTACGGAAAAAGTTGATGGTGCTTACGTACAAGACAAGCA 
ACTTTTCTATAAAGGGGAGAATATTATGTTAGTAGATGACATTGGTGTCC 
CAGGAAGCCATAACGTAGAGAATGCTCTAGCAACTATTGCGGTTGCTAAA 
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CTAGCTGGTATCAGTAATCAAGTTATTAGAGAAACTTTAAGCAATTTTGG 
AGGTGTTAAACACCGCTTGCAATCACTCGGTAAGGTTCATGGTATTAGTT 
TCTATAATGACAGCAAGTCAACTAATATATTGGCAACTCAAAAAGCATTA 
TCTGGCTTTGATAATACTAAAGTTATCCTAATTGCAGGAGGTCTTGATCG 
CGGTAATGAGTTTGATGAATTGATACCAGATATCACTGGACTTAAACATA 
TGGTTGTTTTAGGGGAATCGGCATCTCGAGTAAAACGTGCTGCACAAAAA 
GCAGGAGTAACTTATAGCGATGCTTTAGATGTTAGAGATGCGGTACATAA 
AGCTTATGAGGTGGCACAACAGGGCGATGTTATCTTGCTAAGTCCTGCAA 
ATGCATCATGGGACATGTATAAGAATTTCGAAGTCCGTGGTGATGAATTC 
ATTGATACTTTCGAAAGTCTTAGAGGAGAG 

SEQ XD NO. 6709 
STRAIN 1169NT 

CAATAACAACATTTGAAAATAAAAAAGTTTTAGTCCTTGGTTTAGCACGA 
TCTGGAGAAGCCGCTGCACGTTTGTTAGCTAAGTTAGGAGCAATAGTGAC 
AGTTAATGATGGCAAACCATTTGATGAAAATCCAACAGCACAGTCTTTGT 
TGGAAGAGGGTATTAAAGTGGTTTGTGGTAGTCATCCTTTAGAATTGTTA 
GATGAGGATTTTTGTTACATGATTAAAAATCCAGGAATACCTTATAACAA 
TCCTATGGTCAAAAAAGCATTAGAAAAACAAATCCCTGTTTTGACTGAAG 
TGGAATTAGCATACTTAGTTTCAGAATCTCAGCTAATAGGTATTACAGGC 
TCTAACGGGAAAACGACAACGACAACGATGATTGCAGAAGTCTTGAATGC 
TGGAGGTCAGAGAGGTTTGTTAGCTGGGAATATCGGCTTTCCTGCTAGTG 
AAGTTGTTCAGGCTGCGGATGATAAAGATACTCTAGTTATGGAATTATCA 
AGTTTTCAGCTAATGGGAGTTAAGGAATTTCGTCCTCATATTGCAGTAAT 
TACTAATTTAATGCCAACTCATTTAGATTATCATGGGTCTTTTGAAGAtT 
ATGtTGCTGCAAAATGGAATATCCAAAATCAAATGTCTTCATCTGATTTT 
TTGGTACTTAATTTTAATCAAGGTATTTCTAAAGAGTTAGcTAAAACTAC 
TAAAGCAACAATCGTTCCTTTCTCTACTACGGAAAAAGTTGATGGTGCTT 
ACGTACAAGACAAGCAACTTTTCTATAAAGGGGAGAATATTATGTCAGTA 
GACGACATTGGTGTCCCAGGAAGCCATAACGTAGAGAATGCTCTAGCAAC 
TATTGCGGTTGCTAAACTAGCTGGTATCAGTAATCAAGTTATTAGAGAAA 
CTTTAAGCAATTTTGGAGGTGTTAAACACCGCTTGCAATCACTCGGTAAG 
GTTCATGGTATTAGTTTCTATAACGACAGTAAGTCAACTAATATATTGGC 
AACTCAAAAAGCATTATCTGGCTTTGATAATACTAAAGTTATCCTAATTG 
CAGGAGGTCTTGATCGCGGTAATGAGTTTGATGAATTGATACCAGATATC 
ACTGGACTTAAGCATATGGTTGTTTTAGGGGAATCGGCATCTCGAGTAAA 
ACGTGCTGCACAAAAAGCAGGAGTAACTTATAGCAATGCTTTAgATGTTA 
GAgATGCgGTACATAAAGCTTATGAGGTGGCACAACAGGGCGATGTTATC 
TTGTTmAGTcCTGCGAATGCATCATGGGACATGTATAAGAATTTCGAAGT 
CCGTGGTGATGAATTCATTGATACTTTCG 

SEQ XD NO. 6710 

STRAIN OM9130013 

GGACGAGTAATGAAAACAATAACAACA 

TTTGAAAATAAAAAAGTTTTAGTCCTTGGTTTAGCACGATCTGGAGAAGC 
TGCTGCACGTTTGTTAGCTAAGTTAGGAGCAATAGTGACAGTTAATGATG 
GCAAACCATTTGATGAAAATCCAACAGCACAGTCTTTGTTGGAAGAGGGT 
ATTAAAGTGGTTTGTGGTAGTCATCCTTTAGAATTGtTAGATGAGGATTT 
TTGTTACATGATTaAAAATCCAGGAATACCTTATAACAATCCTATGGTCA 
AAAAAGCATTAGAAAAACAAATCCCTGTTTTGACTGAAGTGGAATTAGCA 
TACTTAGTTTCAGAATCTCAGCTAATAGGTATTACAGGCTCTAACGGGAA 
AACGACAACGACAACGATGATTGCAGAAGTCTTAAATGCTGGAGGTCAGA 
GAGGTTTGTTAGCTGGGAATATCGGCTTTCCTGCTAGTGAAGTTGTTCAG 
GCTGCGAATGATAAAGATACTCTAGTTATGGAATTATCAAGTTTTCAGCT 
AATGGGAGTTAAGGAATTTCGTCCTCATATTGCAGTAATTACTAATTTAA 
TGCCAACTCATTTAGATTATCATGGGTCTTTTGAAGATTATGTTGCTGCA 
AAATGGAATATCCAAAATCAAATGTCTTCATCTGATTTTTTGGTACTTAA 
TTTTAATCAAGGTATTTCTAAAGAGTTAGCTAAAACTACTAAAGCaACAA 
TCGTTCCTTTCTCTACTACGGAAAAAGTTGATGGTGCTTACGTACAAGAC 
AAGCAACTTTTCTATAAAGGGGAGAATATTATGTCAGTAGATGACATTGG 
TGTCCCAGGAAGCCATAACGTAGAGAATGCTCTAGCAACTATTGCGGTTG 
CTAAACTGGCTGGTATCAGTAATCAAGTTATTAGAGAAACTTTAAGCAAT 
TTTGGAGGTGTTAAACACCGCTTGCAATCACTCGGTAAGGTTCATGGTAT 
TAGtTTCTATAACGACAGCAAGTCAACTAATATATTGGCAACTCAAAAAG 
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C^TTATCTGGCTTTGATAATACTAAAGTTATCCTAATTGCAGGAGGTCTT 
GATCGCAGTAATGAGTTTGATGAATTGATACCAGATATCACTGGACTTAA 
ACATATGGTTGTTTTAGGGGAATCGGCATCTCGAGTAAAACGTGCTGCAC 
AAAAAGCAGGAGTAACTTATAGCGATGCTTTAGATGTTAGAGATGCGGTA 
CATAAAGCTTATGAGGTGGCACAACAGGGCGATGTTATCTTGCTAAGTCC 
TGCAAATGCATCATGGGACATGTATAAGAATTTCGAAGTCCGTGGTGATG 
AATTCATTGATACtTTCGAAAGTCTTAGAGGAGAG 

SEQ ID NO. 6710 

STRAIN 2603 

ggacgagtaatgaaaacaataacaacatttgaaaataaaaaagttttagt 
ccttggtttagcacgatctggagaagctgctgcacgtttgttagctaagt 
taggagcaatagtgacagttaatgatggcaaaccatttgatgaaaatcca 
acagcacagtctttgttggaagagggtattaaagtggtttgtggtagtca 
tcctttagaattgttagatgaggatttttgttacatgattaaaaatccag 
gaataccttataacaatcctatggtcaaaaaagcattagaaaaacaaatc 
cctgttttgactgaagtggaattagcatacttagtttcagaatctcagct 
aataggtattacaggctctaacgggaaaacgacaacgacaacgatgattg 
cagaagtcttaaatgctggaggtcagagaggtttgttagctgggaatatc 
ggctttcctgctagtgaajgttgttcaggctgcgaatgataaagatactct 
agttatggaattatcaagttttcagctaatgggagttaaggaatttcgtc 
ctcatattgcagtaattactaatttaatgccaactcatttagattatcat 
gggtcttttgaagattatgttgctgcaaaatggaatatccaaaatcaaat 
gtcttcatctgattttttggtacttaattttaatcaaggtatttctaaag 
agttagctaaaactactaaagcaacaatcgttcctttctctactacggaa 
aaagttgatggtgcttacgtacaagacaagcaacttttctataaagggga 
gaatattatgtcagtagatgacattggtgtcccaggaagccataacgtag 
agaatgctctagcaactattgcggttgctaaactggctggtatcagtaat 
caagttattagagaaactttaagcaattttggaggtgttaaacaccgctt 
gcaatcactcggtaaggttcatggtattagtttctataacgacagcaagt 
caactaatatattggcaactcaaaaagcattatctggctttgataatact 
aaagttatcctaattgcaggaggtcttgatcgcggtaatgagtttgatga 
attgataccagatatcactggacttaaacatatggttgttttaggggaat 
cggcatctcgagtaaaacgtgctgcacaaaaagcaggagtaacttatagc 
gatgctttagatgttagagatgcggtacataaagcttatgaggtggcaca 
acagggcgatgttatcttgctaagtcctgcaaatgcatcatgggacatgt 
ataagaatttcgaagtccgtggtgatgaattcattgatactttcgaaagt 
cttagaggagag 

SEQ ID NO. 6711 

STRAIN 090 frame: 3 

ITTFENKKVLVLGLARSGEAAARLLAKLGAIVTVNDGKPFDENPTAQSLLEEGIBCVVCGS 
HPLELLDEDFCYMIKN PG I PYNN PMVKKALEKQI PVLTEVELAYLVSE SQLIGITGSNGK 
TTTTTMI AEVLNAGGQRGLLAGN I GFPASE WQAADDKDILVMELS S FQLMGVKE FRPHI 
AVITNLMPTHLDYHGSFEDYVAAKWNIQNQMSSSDFLVLNFNQGISKELAKTTKATIVPF 
STTEKVDGAYVQDKQLFYKGENIMLVDDIGVPGSHNVENALATIAVAKLAGISNQVIRET 
LSNFGGVKHRLQSLGKVHGISFYNDSKSTNILATQKALSGFDNTKVILIAGGLDRGNEFD 
ELI P DI TGLKHMWLGE S AS RVKRAAQKAGVT Y S DALD VRDAVHKAYEVAQQGDV I LLS P 
AN AS WDMYKN FEVRGDE FI DT FE S LRGE 

SEQ ID NO. 6712 

STRAIN A909 frame: 3 

ITT FENKKVLVLGLARSGEAAARLLAKLGAI VTVN DGK P FDEN PTAQ S LLEEG I KWCGS 
HPLELLDEDFCYMIKNPGIPYNNPMVKKALEKQIPVLTEVELAYLVSESQLIGITGSNGK 
TTTTTMIAEVLNAGGQRGLLAGNIGFPASEWQAANDKDTLVMELSSFQLMGVKE FRPHI 
AVITNI^PTHLDYHGSFEDYVAAKWNIQNQMSSSDFLVLNFNQGISKELAKTTKATIVPF 
STTEKVDGAYVQDKQLFYKGENIMSVDDIGVPGSHNVXNALATIAVAKLAGISNQVIRET 
LSNFGGVKHRLQSLGKVHGISFYNDSKSTNILATQKALSGFDNTKVILIAGGLDRGNEFD 
ELI PDITGLKHMWLGESASRVKRAAQKAGVT YSDALDVRDAVHKAYEVAQQGDVI LLS P 
ANASWDMYKNFEVRGDEFI DT FES LRGE 

SEQ ID NO. 6713 

STRAIN H36B frame: 1 

GRVMKTITT FENKKVLVLGLARSGEAAARLLAKLGAI VTVNDGKPFDENPTAQSLLEEGI 
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KWCGSHPLELLDEDFCYMIKNPGIPYNNPMVKKALEKQIPVLTEVELAYLVSESQLIGI 
TGSNGKTTTTTMIAEVLNAGGQRGLLAGNIGFPASEWQAANDKDTLVMELSSFQLMGVK 
EroPHIAVITNLMPTHLDYHGSFEDW7^AKWNIQNQMSSSDFLVLNFNQGISKELAKTTK 
ATIVPFSTTEKVDGAWQDKQLFYKGENIMSVDDIGVPGSHNVENALATIAVAKLAGISN 
QVIRETLSNFGGVKHRLQSLGKVHGISFYNDSK \ 

SEQ ID NO. 6714 

STRAIN 18RS21 frame: 1 

GRVMKT ITT FENKKVLVLGLARSGEAAARLLAKLGAIVTVNDGKPFDENPTAQS LLEEGI 
KWCGSHPLELLDEDFCYMIKNPGIPYNNPMVKKALEKQIPVLTEVELAYLVSESQLIGI 
TGSNGKTTTTTMIAEVLNAGGQRGLLAGNIGFPASEWQAANDKDTLVMELSSFQLMGVK 
EFRPHIAVITNLMPTHLDYHGSFEDYVAAKWNIQNQMSSSDFLVLNFNQGISKELAKTTK 
ATIVPFSTTEKVDGAYVQDKQLFYKGENIMSVDDIGVPGSHNVENALATIAVAKLAGISN 
QVIRETLSNFGGVKHRLQSLGKVHGISFYNDSKSTNILATQKALSGFDNTKVILIAGGLD 
RGNE FDE LI P DI TGLKHMWLGE S AS RVKRAAQKAGVT Y S DALDVRDAVHKAYE VAQQGD 
VILLSPANASWDMYKNFEVRGDEFIDTFESLRGE 

SEQ ID NO. 6715 

STRAIN M732 frame: 1 

GRVMKT I TT FENKKVL VLGLARS GEAAARLLAKLGAI VTVN DGKP FDEN PT AQS LLEEGI 
KWCGSHPLELLDEDFCYMIKNPGIPYNNPMVKKALEKQIPVLTEVELAYLVSESQLIGI 
TGSNGKTTTTTMIAEVLNAGGQRGLLAGNIGFPASEWQAADDKDILVMELSSFQLMGVK 
EFRPHIAVITNLMPTHLDYHGSFEDYVAAKWNIQNQMSSSDFLVLNFNQGISKELAKTTK 
ATIVPFSTTEKVDGAYVQDKQLFYKGENIMSVDDIGVPGSHNVENALATIAVAKLAGISN 
QVIRETLSNFGGVKHRLQSLGKVHGISFYNDSKSTNILATQKALSGFDNTKVILIAGGLD 
RGNE FDEL I PDITGLKHMWLGESAS RVKRAAQKAGVT YS DALDVRDAVHKAYEVAQQGD 
VILLSPANASWDMYKNFEVRGDEFIDTFESLRGE 

SEQ ID NO. 6716 

STRAIN COH1 frame: 1 

GRVMKTITTFENKKVLVLGIARSGEAAARLLAKLGAIVTVNDGKPFDENPTAQSLLEEGI 
KWCGSHPLELLDEDFCYMIKNPGIPYNNPMVKKALEKQIPVLTEVELAYLVSESQLIGI 
TGSNGKTTTTTMIAEVLNAGGQRGLLAGNIGFPASEWQAADDKDILVMELSSFQLMGVK 
EFRPHIAVITNLMPTHLDYHGSFEDYVAAKWNIQNQMSSSDFLVLNFNQGISKELAKTTK 
ATIVPFSTTEKVDGAYVQDKQLFYKGENIMSVDDIGVPGSHNVENALATIAVAKLAGISN 
QVIRETLSNFGGVKHRLQSLGKVHGISFYNDSKSTNILATQKALSGFDNTKVILIAGGLD 
RGNE FDEL I PDITGLKHMWLGESASRVKRAAQKAGVTYS DALDVRDAVHKAYEVAQQGD 
VI LLS PANAS WDMYKN FE VRGDE FI DT FE 

SEQ ID NO. 6717 

STRAIN M781 frame: 1 

GRVMKTITTFENKKVLVLGLARSGEAAARLLAKLGAIVTVNDGKPFDENPTAQSLLEEGI 
KWCGSHPLELLDEDFCYMIKNPGIPYNNPMVKKALEKQIPVLTEVELAYLVSESQLIGI 
TGSNGKTTTTTMIAEVLNAGGQRGLLAGNIGFPASEVVQAADDKDILVMELSSFQLMGVK 
EFRPHIAVITNLMPTHLDYHGSFEDYVAAKWNIQNQMSSSDFLVLNFNQGISKELAKTTK 
ATIVPFSTTEKVDGAYVQDKQLFYKGENIMSVDDIGVPGSHNVENALATIAVAKLAGISN 
QVIRETLSN FGGVKHRLQSLGKVHGI S FYNDSKSTN I LATQKALSGFDNTKVILI AGGLD 
RGNEFDELIPDITGLKHMWLGESASRVKRAAQKAGVTYSDALDVRDAVHKAYEVAQQGD 
VILLSPANASWDMYKNFEVRGDEFIDTFESLRGE 

SEQ ID NO. 6718 

STRAIN CJB110 frame: 1 

GRVMKT ITT FENKKVLVLG LARS GEAAARLLAKLGAI VTVN DGKPFDENPTAQS LLEEGI 
KVVCGSHPLELLDEDFCYMIKNPGIPYNNPMVKKALEKQIPVLTEVELAYLVSESQLIGI 
TGSNGKTTTTTMIAEVLNAGGQRGLLAGNIGFPASEWQAADDKDILVMELSSFQLMGVK 
EFRPHIAVITNLMPTHLDYHGSFEEYVAAKWNIQNQMSSSDFLVLNFNQGISKELAKTTK 
ATIVPFSTTEKVDGAYVQDKQLFYKGENIMLVDDIGVPGS HNVENALATIAVAKLAGI SN 
QVIRETLSNFGGVKHRLQSLGKVHGIS FYNDSKSTN I LATQKALSGFDNTKVILI AGGLD 
RGNE FDELI PDITGLKHMWLGESASRVKRAAQKAGVTYS DALDVRDAVHKAYEVAQQGD 
VI LLS PAN ASWDMYKN FE VRGDE FI DT FE S LRGE 

SEQ ID NO. 6719 

STRAIN 1169NT frame: 3 

ITTFENKKVLVLGLARSGEAAARLLAKLGAIVTVNDGKPFDENPTAQSLLEEGIKVVCGS 
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HPLELLDEDFCYMIKNPGIPYNNPMVKKALEKQIPVLTEVELAYLVSESQLIGITGSNGK 
TTTTTMIAEVLNAGGQRGLLAGNIGFPASEWQAADDKDTLVMELSSFQIoMGVKEFRPHI 
AVITNIiMPTHLDYHGSFEDYVAAKWNIQNQMSSSDFLVLNFNQGISKELAKTTKATIVPF 
STTEKVDGAYVQDKQLFYKGENIMSVDDIGVPGSHNVENALATIAVAKLAGISNQVIRET 
LSNFGGVKHRLQSLGKVHGISFYNDSKSTNILATQKALSGFDNTKVILIAGGLDRGNEFD 
ELIPDITGLKHMWLGESASRVKRAAQKAGVTYSNALDVRDAVHKAYEVAQQGDVILXSP 
ANASWDMYKNFEVRGDEFIDTF 

SEQ ID NO. 6720 

STRAIN JM9130013 frame: 1 

GRVMKTITTFENKKVLVLGLARSGEAAARLLAKLGAIVTVNDGKPFDENPTAQSLLEEGI 
KVVCGSHPLELLDEDFCYMIKNPGIPYNNPMVKKALEKQIPVLTEVELAYLVSESQLIGI 
TGSNGKTTTTTMIAEVLNAGGQRGLLAGNI GFPASEWQAANDKDTLVMELS S FQLMGVK 
EFRPHIAVITNLMPTHLDYHGS FEDYVAAKWNIQNQMSSSDFLVLNFNQGISKELAKTTK 
ATIVPFSTTEKVDGAYVQDKQLFYKGENIMSVDDIGVPGSHNVENALATIAVAKLAGISN 
QVIRETLSNFGGVKHRLQSLGKVHGISFYNDSKSTNILATQKALSGFDNTKVILIAGGLD 
RSNEFDELIPDITGLKHMWLGESASRVKRAAQKAGVTYSDALDVRDAVHKAYEVAQQGD 
VILLSPANASWDMYKNFEVRGDEFIDTFESLRGE 

SEQ ID NO. 6721 

STRAIN 2603 frame: 1 

GRVMKT ITT FENKKVLVLGLARSGEAAARLLAKLG AI VT VN DGKP FDEN PT AQS LLEEG I 
KWCGSHPLELLDEDFCYMIKNPGIPYNNPMVKKALEKQIPVLTEVELAYLVSESQLIGI 
TGSNGKTTTTTMIAEVLNAGGQRGLLAGN I GFPASEVVQAANDKDTLVMELSS FQLMGVK 
EFRPHIAVITNLMPTHLDYHGSFEDYVA7VKWNIQNQMSSSDFLVLNFNQGISKELAKTTK 
ATIVPFSTTEKVDGAYVQDKQLFYKGENIMSVDDIGVPGSHNVENALATIAVAKLAGISN 
QVIRETLSNFGGVKHRLQSLGKVHGISFYNDSKSTNILATQJCALSGFDNTKVILIAGGLD 
RGNEFDELIPDITGLKHMVVLGESASRVKRAAQKAGVTYSDALDVRDAVHKAYEVAQQGD 
VILLSPANASWDMYKNFEVRGDEFI DTFESLRGE 

SEQ ID NO. 6801 
STRAIN 2603 

ATGGCTAAAGAGAGGGTAGATGTTCTTGCCTATAAACAGGGACTTTTTGATACACGAGAG 
CAAGCGAAACGTGGTGTTATGGCAGGAATGGTGATTAACGTTATCAATGGAGAACGTTAT 
GATAAACCAGGTGAAAAGGTTGCAGACGATACTGAATTAAAACTAAAAGGTGAAAAACTA 
AAATATGTTAGTAGAGGTGGATTGAAATTAGAAAAAGCTTTACAAGTTTTTGAAATTTCA 
GTTGCAGATAAGCTAACTATAGATATTGGCGCCTCTACGGGTGGTTTTACTGATGTTATG 
CTACAATCAGGAGCGCGTTTAGTTTACGCAGTAGATGTAGGAACAAATCAATTAGTTTGG 
AAGTTACGTCAGGATCATCGTGTTCGTTCTATGGAACAATATAATTTTAGGTATGCCCAA 
AAAGAAGATTTCAAGGAGGGACTGCCTGAATTTGCATCGATAGATGTCTCATTTATCTCT 
CTTAATTTGATTTTACCAGCTCTAAAAGAAATTTTAGTGGATGGTGGACAAGTAGTGGCA 
TTAATTAAACCACAATTTGAAGCAGGTCGTGAGCAAATTGGTAAAAATGGTATTGTCAAA 
GACAAGTTGGTTCATGAAAAGGTTTTGACAACAGTGACCAATTTCACGAAAGATTATGGA 
TATACGGTTAAACATCTTGATTTTTCGCCCATTCAAGGTGGACATGGAAATATTGAGTTT 
TTAATGCATTTGCAAAAGTGTCAAGATCCACAAAATCTTGTGCTTGACCAAATACAAGAT 
GTTATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 

SEQ ID NO. 6802 

STRAIN 090 

GCTAAAGAGAGGGTAGATGTTCTTGCCT 

ATAAACAGGGACTTTTTGATACACGAGAGCAAGCGAAACGTGGTGTTATG 
GCAGGAATGGTGATTAACGTTATCAATGGAGAACGTTATGATAAACCAGG 
TGAAAAGGTTGCAGACGATACTGAATTAAAACTAAAAGGTGAAAAACTAA 
AATATGTTAGTAGAGGTGGATTGAAATTAGAAAAAGCTTTACAAGTTTTT 
GAAATTTCAGTTGCAGATAAGCTAACTATAGATATTGGCGCCTCTACGGG 
TGGTTTTACTGATGTTATGCTACAATCAGGAGCGCGTTTAGTTTACGCAG 
TAGATGTAGGAACAAATCAATTAGTTTGGAAGTTACGTCAGGATCATCGT 
GTTCGTTCTATGGAACAATATAATTTTAGGTATGCCCAAAAAGAAGATTT 
CAAGGAGGGACTGCCTGAATTTGCATCGATAGATGTCTCATTTATCTCTC 
TTAATTTGATTTTACCAGCTCTAAAAGAAATTTTAGTGGATGGTGGACAA 
GTAGTGGCATTAATTAAACCACAATTTGAAGCAGGTCGTGAGCAAATTGG 
TAAAAATGGTATTGTCAAAGACAAGTTGGTTCATGAAAAGGTTTTGACAA 
CAGTGACCAATTTCACGAAAGATTATGGATATACGGTTAAACATCTTGAT 
TTTTCGCCCATTCAAGGTGGACATGGAAATATTGAGTTTTTAATGCATTT 
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GCAAAAGTGTCAAGATCCACAAAATCTTGTGCTTGACC^AATACAAGATG 
TTATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 

SEQ ID NO. 6803 

STRAIN A909 

GCTAAAGAGAGGGTAGATGTTCTTGCCTA 

TAAACAGGGACTTTTTGATACACGAGAGCAAGCGAAACGTGGTGTTATGG 
CAGGAATGGTGATTAACGTTATCAATGGAGAACGTTATGATAAACCAGGT 
GAAAAGGTTGCAGACGATACTGAATTAAAACTAAAAGGTGAAAAACTAAA 
ATATGTTAGTAGAGGTGGATTGAAATTAGAAAAAGCTTTACAAGTTTTTG 
AAATTTCAGTTGCAGATAAGCTAACTATAGATATTGGCGCCTCTACGGGT 
GGTTTTACTGATGTTATGCTACAATCAGGAGCGCGTTTAGTTTACGCAGT 
AGATGTAGGAACAAATCAATTAGTTTGGAAGTTACGTCAGGATCATCGTG 
TTCGTTCTATGGAACAATATAATTTTAGGTATGCCCAAAAAGAAGATTTC 
AAGGAGGGACTGCCTGAATTTGCATCGATAGATGTCTCATTTATCTCTCT 
TAATTTGATTTTACCAGCTCTAAAAGAAATTTTAGTGGATGGTGGACAAG 
TAGTGGCATTAATTAAACCACAATTTGAAGCAGGTCGTGAGCAAATTGGT 
AAAAATGGTATTGTCAAAGACAAGTTGGTTCATGAAAAGGTTTTGACAAC 
AGTGACCAATTTCACGAAAGATTATGGATATACGGTTAAACATCTTGATT 
TTTCGCCCATTCAAGGTGGACATGGAAATATTGAGTTTTTAATGCATTTG 
CAAAAGTGTCAAGATCCACAAAATCTTGTGCTTGACCAAATACAAGATGT 
TATAGAAAAAGCACATAAGGAATTTAAGAAAXATGAAGAAGAG 

SEQ ID NO. 6804 

STRAIN H36B 

GCTAAAGAGAGGGTAGATGTTCTTGCCTATAAACAGG 

GACTTTTTGATACACGAGAGCAAGCGAAACGTGGTGTTATGGCAGGAATG 

GTGATTAACGTTATCAATGGAGAACGTTATGATAAACCAGGTGAAAAGGT 

TGCAGACGATACTGAATTAAAACTAAAAGGTGAAAAACTAAAATATGTTA 

GTAGAGGTGGATTGAAATTAGAAAAAGCTTTACAAGTTTTTGAAATTTCA 

GTTGCAGATAAGCTAACTATAGATATTGGCGCCTCTACGGGTGGTTTTAC 

TGATGTTATGCTACAATCAGGAGCGCGTTTAGTTTACGCAGTAGATGTAG 

GAACAAATCAATTAGTTTGGAAGTTACGTCAGGATCATCGTGTTCGTTCT 

ATGGAACAATATAATTTTAGGTATGCCCAAAAAGAAGATTTCAAGGAGGG 

ACTGCCTGAAT TTGCATCGATAGATGT CTCATTTATCTCTCTTAATTTGA 

TTTTACCAGCTCTAAAAGAAATTTTAGTGGATGGTGGACAAGTAGTGGCA 

TTAATTAAACCACAATTTGAAGCAGGTCGTGAGCAAATTGGTAAAAATGG 

TATTGTCAAAGACAAGTTGGTTCATGAAAAGGTTTTGACAACAGTGACCA 

ATTTCACGAAAGATTATGGATATACGGTTAAACATCTTGATTTTTCGCCC 

ATTCAAGGTGGACATGGAAATATTGAGTTTTTAATGCATTTGCAAAAGTG 

TCAAGATCCACAAAATCTTGTGCTTGACCAAATACAAGATGTTATAGAAA 

AAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 

SEQ ID NO. 6805 

STRAIN 18RS21 

GCTAAAGAGAGGGTAGATGTTCTTGCCTA 

TAAACAGGGACTTTTTGATACACGAGAGCAAGCGAAACGTGGTGTTATGG 
CAGGAATGGTGATTAACGTTATCAATGGAGAACGTTATGATAAACCAGGT 
GAAAAGGTTGCAGACGATACTGAATTAAAACTAAAAGGTGAAAAACTAAA 
ATATGTTAGTAGAGGTGGATTGAAATTAGAAAAAGCTTTACAAGTTTTTG 
AAATTTCAGTTGCAGATAAGCTAACTATAGATATTGGCGCCTCTACGGGT 
GGTTTTACTGATGTTATGCTACAATCAGGAGCGCGTTTAGTTTACGCAGT 
AGATGTAGGAACAAATCAATTAGTTTGGAAGTTACGTCAGGATCATCGTG 
TTCGTTCTATGGAACAATATAATTTTAGGTATGCCCAAAAAGAAGATTTC 
AAGGAGGGACTGCCTGAATTTGCATCGATAGATGTCTCATTTATCTCTCT 
TAATTTGATTTTACCAGCTCTAAAAGAAATTTTAGTGGATGGTGGACAAG 
TAGTGGCATTAATTAAACCACAATTTGAAGCAGGTCGTGAGCAAATTGGT 
AAAAATGGTATTGTCAAAGACAAGTTGGTTCATGAAAAGGTTTTGACAAC 
AGTGACCAATTTCACGAAAGATTATGGATATACGGTTAAACATCTTGATT 
TTTCGCCCATTCAAGGTGGACATGGAAATATTGAGTTTTTAATGCATTTG 
CAAAAGTGTCAAGATCCACAAAATCTTGTGCTTGACCAAATACAAGATGT 
TATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 

SEQ ID NO. 6806 
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STRAIN M732 

GCTAAAGAGAGGGTAGATGTTCTTGCCTA 

TAAACAGGGACTTTTTGATACACGAGAGCAAGCGAAACGTGGTGTTATGG 
CAGGACTGGTGATTAACGTTATCAATGGAGAACGTTATGATAAACCAGGC 
GAAAAGGTTGCAGACGATACTGAATTAAAACTAAAAGGTGAAAAACTAAA 
ATATGTTAGTAGAGGTGGATTGAAATTAGAAAAAGCTTTACAAGTTTTTG 
AAATTTCAGTTGCAGATAAGCTAACTATAGATATTGGCGCCTCTACGGGT 
GGTTTTACTGATGTTATGCTACAATCAGGAGCGCGTTTAGTTTACGCAGT 
AGATGTAGGAACAAATCAATTAGTTTGGAAGTTACGTCAGGATCATCGTG 
TTCGTTCTATGGAACAATATAATTTTAGGTATGCCCAAAAAGAAGATTTC 
AAGGAGGGACTGCCTGAATTTGCATCGATAGATGTCTCATTTATCTCTCT 
TAATTTGATTTTACCAGCTCTAAAAGAAATTTTAGTGGATGGTGGACAAG 
TAGTGGCATTAATTAAACCACAATTTGAAGCAGGTCGTGAGCAAATTGGT 
AAAAATGGTATTGTCAAAGACAAGTTGGTTCATGAAAAGGTTTTGACAAC 
AGTGACCAATTTCACGAAAGATTATGGATATACGGTTAAACATCTTGATT 
TTTCGCCCGTTCAAGGTGGACATGGAAATATTGAGTTTTTAATGCATTTG 
CAAAAGTGTCAAGATCCACAAAATCTTGTGCTTGACCAAATACAAGATGT 
TATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 

SEQ XD NO. 6807 

STRAIN COH1 

GCTAAAGAGAGGGTAGATGTTCTTGCCT 

ATAAACAGGGACTTTTTGATACACGAGAGCAAGCGAAACGTGGTGTTATG 
GCAGGACTGGTGATTAACGTTATCAATGGAGAACGTTATGATAAACCAGG 
CGAAAAGGTTGCAGACGATACTGAATTAAAACTAAAAGGTGAAAAACTAA 
AATATGTTAGTAGAGGTGGATTGAAATTAGAAAAAGCTTTACAAGTTTTT 
GAAATTTCAGTTGCAGATAAGCTAACTATAGATATTGGCGCCTCTACGGG 
TGGTTTTACTGATGTTATGCTACAATCAGGAGCGCGTTTAGTTTACGCAG 
TAGATGTAGGAACAAATCAATTAGTTTGGAAGTTACGTCAGGATCATCGT 
GTTCGTTCTATGGAACAATATAATTTTAGGTATGCCCAAAAAGAAGATTT 
CAAGGAGGGACTGCCTGAATTTGCATCGATAGATGTCTCATTTATCTCTC 
TT AAT TT G AT TT T AC CAGCT CT AAAAGAAAT TT T AGT GG ATGGTGGAC AA 
GTAGTGGCATTAATTAAACCACAATTTGAAGCAGGTCGTGAGCAAATTGG 
TAAAAATGGTATTGTCAAAGACAAGTTGGTTCATGAAAAGGTTTTGACAA 
CAGTGACCAATTTCACGAAAGATTATGGATATACGGTTAAACATCTTGAT 
TTTTCGCCCGTTCAAGGTGGACATGGAAATATTGAGTTTTTAATGCATTT 
GCAAAAGTGT CAAGATCCACAAAAT CTTGTGCTTGACCAAATAC AAGATG 
TTATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 

SEQ ID NO. 6808 

STRAIN M781 

GCTAAAGAGAGGGTAGATGTTCTTGCCT 

ATAAACAGGGACTTTTTGATACACGAGAGCAAGCGAAACGTGGTGTTATG 
GCAGGACTGGTGATTAACGTTATCAATGGAGAACGTTATGATAAACCAGG 
CGAAAAGGTTGCAGACGATACTGAATTAAAACTAAAAGGTGAAAAACTAA 
AATATGTTAGTAGAGGTGGATTGAAATTAGAAAAAGCTTTACAAGTTTTT 
GAAATTTCAGTTGCAGATAAGCTAACTATAGATATTGGCGCCTCTACGGG 
TGGTTTTACTGATGTTATGCTACAATCAGGAGCGCGTTTAGTTTACGCAG 
TAGATGTAGGAACAAATCAATTAGTTTGGAAGTTACGTCAGGATCATCGT 
GTTCGTTCTATGGAACAATATAATTTTAGGTATGCCCAAAAAGAAGATTT 
CAAGGAGGGACTGCCTGAATTTGCATCGATAGATGTCTCATTTATCTCTC 
TTAATTTGATTTTACCAGCTCTAAAAGAAATTTTAGTGGATGGTGGACAA 
GTAGTGGCATTAATTAAACCACAATTTGAAGCAGGTCGTGAGCAAATTGG 
TAAAAATGGTATTGTCAAAGACAAGTTGGTTCATGAAAAGGTTTTGACAA 
CAGTGACCAATTTCACGAAAGATTATGGATATACGGTTAAACATCTTGAT 
TTTTCGCCCGTTCAAGGTGGACATGGAAATATTGAGTTTTTAATGCATTT 
GCAAAAGTGTCAAGATCCACAAAATCTTGTGCTTGACCAAATACAAGATG 
TTATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 

SEQ ID NO. 6809 

STRAIN CJB110 

GCTAAAGAGAGGGTAGATGTTCTTGCCTA 

TAAACAGGGACTTTTTGATACACGAGAGCAAGCGAAACGTGGTGTTATGG 
CAGGAATGGTGATTAACGTTATCAATGGAGAACGTTATGATAAACCAGGT 
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GAAAAGGTTGCAGACGATACTGAATTAAAACTAAAAGGTGAAAAACTAAA 
ATATGTTAGTAGAGGTGGATTGAAATTAGAAAAAGCTTTACAAGTTTTTG 
AAATTTCAGTTGCAGATAAGCTAACTATAGATATTGGCGCCTCTACGGGT 
GGTTTTACTGATGTTATGCTACAATCAGGAGCGCGTTTAGTTTACGCAGT 
AGATGTAGGAACAAATCAATTAGTTTGGAAGTTACGTCAGGATCATCGTG 
TTCGTTCTATGGAACAATATAATTTTAGGTATGCCCAAAAAGAAGATTTC 
AAGGAGGGACTGCCTGAATTTGCATCGATAGATGTCTCATTTATCTCTCT 
TAATTTGATTTTACCAGCTCTAAAAGAAATTTTAGTGGATGGTGGACAAG 
TAGTGGCATTAATTAAACCACAATTTGAAGCAGGTCGTGAGCAAATTGGT 
AAAAATGGTATTGTCAAAGACAAGTTGGTTCATGAAAAGGTTTTGACAAC 
AGTGACCAATTTCACGAAAGATTATGGATATACGGTTAAACATCTTGATT 
TTTCGCCCATTCAAGGTGGACATGGAAATATTGAGTTTTTAATGCATTTG 
CAAAAGTGTCAAGATCCACAAAATCTTGTGCTTGACCAAATACAAGATGT 
TATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 

SEQ ID NO. 6810 

STRAIN 1169NT 

GCTAAAGAGAGGGTAGATGTTCTTGCCTA 

TAAACAGGGACTTTTTGATACACGAGAGCAAGCGAAACGTGGTGTTATGG 

CAGGACTGGTGATTAACGTTATCAATGGAGAACGTTATGATAAACCAGGC 

GAAAAGGTTGCAGACGATACTGAATTAAAACTAAAAGGTGAAAAACTAAA 

ATATGTTAGTAGAGGTGGATTGAAATTAGAAAAAGCTTTACAAGTTTTTG" 

AAATTTCAGTTGCAGAl?AAGCTAACTATAGATATTGGCGCCTCTACGGGT 

GGTTTTACTGATGTTATGCTACAATCAGGAGCGCGTTTAGTTTACGCAGT 

AGATGTAGGAACAAATCAATTAGTTTGGAAGTTACGTCAGGATCATCGTG 

TTCGTTCTATGGAACAATATAATTTTAGGTATGCCCAAAAAGAAGATTTC 

AAGGAGGGACTGCCTGAATTTGCATCGATAGATGTCTCATTTATCTCTCT 

TAATTTGATTTTGCCAGCTCTAAAAGAAATTTTAGTGGATGGTGGACAAG 

TAGTGGCATTAATTAAACCACAATTTGAAGCAGGTCGTGAGCAAATTGGT 

AAAAATGGTATTGTCAAAGACAAGTTGGTTCATGAAAAGGTTTTGACAAC 

AGT GACC AAT TT CACG AAAGATT ATGGAT AT ACG GT T AAACAT CTT G AT T 

TTTCGCCCATTCAAGGTGGACATGGAAATATTGAGTTTTTAATGCATTTG 

CAAAAGTGTCAAGATCCACAAAATCTTGTGCTTGACCAAATACAAGATGT 

TATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 

SEQ ID NO. 6811 

STRAIN JM9130013 
GCTAAAGAGAGGGTAGATGTTCTTGCCTA 

TAAACAGGGACTTTTTGATACACGAGAGCAAGCGAAACGTGGTGTTATGG 
CAGGAATGGTGATTAACGTTATCAATGGAGAACGTTATGATAAACCAGGT 
GAAAAGGTTGCAGACGATACTGAATTAAAACTAAAAGGTGAAAAACTAAA 
ATATGTTAGTAGAGGTGGATTGAAATTAGAAAAAGCTTTACAAGTTTTTG 
AAATTTCAGTTGCAGATAAGCTAACTATAGATATTGGCGCCTCTACGGGT 
GGTTTTACTGATGTTATGCTACAATCAGGAGCGCGTTTAGTTTACGCAGT 
AGATGTAGGAACAAATCAATTAGTTTGGAAGTTACGTCAGGATCATCGTG 
TT CGTTCT ATGGAACAAT AT AATTTTAGGT ATGCCCAAAAAGAAGATTT C 
AAGGAGGGACTGCCTGAATTTGCATCGATAGATGTCTCATTTATCTCTCT 
TAATTTGATTTTACCAGCTCTAAAAGAAATTTTAGTGGATGGTGGACAAG 
TAGTGGCATTAATTAAACCACAATTTGAAGCAGGTCGTGAGCAAATTGGT 
AAAAATGGTATTGTCAAAGACAAG^TGGTTCATGAAAAGGTTTTGACAAC 
AGTGACCAATTTCACGAAAGATTATGGATATACGGTTAAACATCTTGATT 
TTTCGCCCATTCAAGGTGGACATGGAAATATTGAGTTTTTAATGCATTTG 
CAAAAGTGTCAAGATCCACAAAATCTTGTGCTTGACCAAATACAAGATGT 
TATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 

SEQ ID NO. 6812 
STRAIN 2603 frame: 1 

MAKERVDVLAYKQGLFDTREQAKRGVMAGMVINVINGERYDKPGEKVADDTELKIiKGEKLK 
YVSRGGLKLEKALQVFEISVADKLTIDIGASTGGFTDVMLQSGARLVYAVDVGTNQLVWK 
LRQDHRVRSMEQYN FRYAQECE DFKEGLPE FAS I DVS FI S LNLILPALKE I LV DGGQ\A^AL 
IKPQFEAGREQIGECNGIVKDKLVHEKVLTTVTNFTKDYGYTVKHLDFSPIQGGHGNIEFL 
MHLQKCQDPQNLVLDQIQDVIEKAHKEFKKNEEE 

SEQ ID NO. 6813 
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STRAIN 090 frame: 1 

AKERVDVLAYKQGLFDTREQAKRGVMAGMVINVINGERYDKPGEKVADDTELKLKGEKLK 
YVSRGGI^EKALQVFEISVADKLTIDIGASTGGFTDVMLQSGARLVYAVDVGTNQLVWK 
LRQDHRVRSMEQYN FRYAQKEDFKEGLPEFASIDVSFISLNLILPALKEILVDGGQWAL 
IKPQFEAGREQIGKNGIVKDKLVHEKVLTTVTNFTKDYGYTVKHLDFSPIQGGHGNIEFL 
MHLQKCQDPQNLVLDQIQDVIEKAHKEFKKNEEE 

SEQ XD NO. 6814 

STRAIN A909 frame: 1 

AKERVDVLAYKQGLFDTREQAKRGVMAGMVINVINGERYDKPGEKVADDTELKLKGEKLK 
YVSRGGLKLEKALQVFEISVADKLTIDIGASTGGFTDVMLQSGARLVYAVDVGTNQLVWK 
LRQDHRVRSMEQYN FRYAQKEDFKEGLPEFASIDVSFISLNLILPALKEILVDGGQWAL 
IKPQFEAGREQIGKNGIVKDKLVHEKVLTTVTNFTKDYGYTVKHLDFSPIQGGHGNIEFL 
MHLQKCQDPQNLVLDQIQDVIEKAHKEFKKNEEE 

SEQ ID NO. 6815 

STRAIN 18RS21 frame: 1 

AKERVDVLAYKQGLFDTREQAKRGVMAGMVINVINGERYDKPGEKVADDTELKLKGEKLK 
YVSRGGLKLEKALQVFE I SVADKLT I D I GASTGG FTDVMLQSGARLVYAVDVGTNQLVWK 
LRQDHRVRSMEQYN FRYAQKE DFKEGLPE FAS I DVS FI SLNLILPALKEILVDGGQWAL 
ifCPQFEAGREQIGKNGiVKDKLVHEKVLTTVTNFTKDYGYTVKHLDFSPIQGGHGNIEFL 
^MHLQKCQDPQNLVLDQIQDVIEKAHKEFKKNEEE 

SEQ ID NO. 6816 

STRAIN M732 frame: 1 

AKERVDVLAYKQGLFDTREQAKRGVMAGLVINVINGERYDKPGEBCVADDTELKLKGEKLK 
YVSRGGLKLEKALQVFEISVADKLTIDIGASTGGFTDVMLQSGARLVYAVDVGTNQLVWK 
LRQDHRVRSMEQYN FRYAQKE D FKEGLPE FAS I DVS FI S LNL I LPALKE ILVDGGQWAL 
IKPQFEAGREQIGKNGIVKDKLVHEKVLTTVTNFTKDYGYTVKHLDFSPVQGGHGNIEFL 
MHLQKCQDPQNLVLDQIQDVIEKAHKEFKKNEEE 

SEQ ID NO. 6817 

STRAIN COH1 frame: 1 

AKERVDVLAYKQGLFDTREQAKRGVMAGLVINVINGERYDKPGEKVADDTELKLKGEKLK 
YVSRGGLKLEKALQVFEI SVADKLT I DIGASTGG FTDVMLQSGARLVYAVDVGTNQLVWK 
LRQDHRVRSMEQYN FRYAQKE D FKEGLPE FAS I DVS FI S LN L I LPALKE I LVDGGQWAL 
IKPQFEAGREQIGKNGIVKDKLVHEKVLTTVTNFTKDYGYTVKHLDFSPVQGGHGNIEFL 
MHLQKCQDPQNLVLDQIQDVIEKAHKEFKKNEEE 

SEQ ID NO. 6818 

STRAIN M781 frame: 1 

AKERVDVLAYKQGLFDTREQAKRGVMAGLVINVINGERYDKPGEKVADDTELKLKGEKLK 
YV S RGGLKLEKALQVFE I SVADKLT I D I GASTGG FT DVMLQSG ARLVY AVD VGTNQLVWK 
LRQDHRVRSMEQYN FRYAQKEDFKEGLPE FAS I DVS FI SLNLILPALKEILVDGGQWAL 
IKPQFEAGREQIGKNGIVKDKLVHEKVLTTVTNFTKDYGYTVKHLDFSPVQGGHGNIEFL 
MHLQKCQDPQNLVLDQIQDVIEKAHKEFKKNEEE 

SEQ ID NO. 6819 

STRAIN CJB110 frame: 1 

AKERVDVLAYKQGLFDTREQAKRGVMAGMVINVINGERYDKPGEKVADDTELKLKGEKLK 
YVSRGGLKLEKALQVFEISVADKLTIDIGASTGG FTDVMLQSGARLVYAVDVGTNQLVWK 
LRQDHRVRSMEQYN FRYAQKE DFKEGLPE FAS I DVS FISLNLI LPALKE ILVDGGQWAL 
IKPQFEAGREQIGKNGIVKDKLVHEKVLTTVTNFTKDYGYTVKHLDFSPIQGGHGNIEFL 
MHLQKCQDPQNLVLDQIQDVIEKAHKEFKKNEEE 

SEQ ID NO. 6820 

STRAIN 1169NT frame: 1 

AKERVDVLAYKQGLFDTREQAKRGVMAGLVINVINGERYDKPGEKVADDTELKLKGEKLK 
YVS RGGLKLEKALQVFE I SVADKLT I DI GASTGG FT DVMLQSG ARLVY AVD VGTNQLVWK 
LRQDHRVRSMEQYN FRYAQKE DFKEGLPE FAS I DVS FISLNLI LPALKE ILVDGGQWAL 
IKPQFEAGREQIGKNGIVKDKLVHEKVLTTVTNFTKDYGYTVKHLDFSPIQGGHGNIEFL 
MHLQKCQDPQNLVLDQIQDVIEKAHKEFKKNEEE 

SEQ ID NO. 6821 



284 



WO 2004/018646 



PCT/US2003/026827 



SEQUENCE LISTING 



STRAIN JM9130013 frame: 1 

AKERVDVTAYKQGLFDTREQAKRGVMAGMVINVINGERYDKPGEKVADDTELKLKGEK^ 
YVSRGGLKLEKALQVFE I S VADKLT I D IGAS TGG FT DVMLQS GARLVYAVDVGTNQLVWK 
LRQDHRVRSMEQYNFRYAQKEDFKEGLPEFAS I DVS FI SLNLILPALKEI LVDGGQWAL 
IKPQFEAGREQIGKNGIVKDKLVHEKVLTTVTNFTKDYGYTVKHLDFSPIQGGHGNIEFL 
MHLQKCQDPQNLVLDQIQDVIEKAHKEFKKNEEE 
\ 

SEQ ID NO. €822 

STRAIN H36B frame: 1 

AKERVDVLAYKQGLFDTREQAKRGVMAGMVINVINGERYDKPGEKVADDTELKLKGEKLK 
YVSRGGLKLEKALQVFE I S VADKLT I DIGASTGG FT DVMLQS GARLVYAVDVGTNQLVWK 
LRQDHRVRSMEQYNFRYAQKEDFKEGLPEFASIDVS FI SLNLILPALKEI LVDGGQWAL 
IKPQFEAGREQIGKNGIVKDKLVHEKVLTTVTNFTKDYGYTVKHLDFSPIQGGHGNIEFL 
MHLQKCQDPQNLVLDQIQDVIEKAHKEFKKNEEE 

SEQ ID NO. 6901 
STRAIN 2603 

ATGAATAAAAAGGTACTATTGACATCGACAATGGCAGCTTCGCTATTATCAGTCGCAAGT 
GTTCAAGCACAAGAAACAGATACGACGTGGACAGCACGTACTGTTTCAGAGGTAAAGGCT 
GATTTGGTAAAGCAAGACAATAAATCATCATATACTGTGAAATATGGTGATACACTAAGC 
GTTATTTCAGAAGCAATGTCAATTi^TAJGAATGTCTTAGa^AAATAAATAACATTGCA 
GATATCAATCTTATTTATCCTGAGACAACACTGACAGTAACTTACGATCAGAAGAGTCAT 
ACTGCCACTTCAATGAAAATAGAAACACCAGCAACAAATGCTGCTGGTCAAACAACAGCT 
ACTGTGGATTTGAAAACCAATCAAGTTTCTGTTGCAGACCAAAAAGTTTCTCTCAATACA 
ATTTCGGAAGGTATGACACCAGAAGCAGCAACAACGATTGTTTCGCCAATGAAGACATAT 
TCTTCTGCGCCAGCTTTGAAATCAAAAGAAGTATTAGCACAAGAGCAAGCTGTTAGTCAA 
GCAGCAGCTAATGAACAGGTATCACCAGCTCCTGTGAAGTCGATTACTTCAGAAGTTCCA 
GCAGCTAAAGAGGAAGTTAAACCAACTCAGACGTCAGTCAGTCAGTCAACAACAGTATCA 
CCAGCTTCTGTTGCCGCTGAAACACCAGCTCCAGTAGCTAAAGTAGCACCGGTAAGAACT 
GTAGCAGCCCCTAGAGTGGCAAGTGTTAAAGTAGTCACTCCTAAAGTAGAAACTGGTGCA 
TCACCAGAGCATGTATCAGCTCCAGCAGTTCCTGTGACTACGACTTCACCAGCTACAGAC 
AGTAAGTTACAAGCGACTGAAGTTAAGAGCGTTCCGGTAGCACAAAAAGCTCCAACAGCA 
ACACCGGTAGCACAACCAGCTTCAACAACAAATGCAGTAGCTGCACATCCTGAAAATGCA 
GGGCTCCAACCTCATGTTGCAGCTTATAAAGAAAAAGTAGCGTCAACTTATGGAGTTAAT 
GAATTCAGTACATACCGTGCGGGAGATCCAGGTGATCATGGTAAAGGTTTAGCAGTTGAC 
TTTATTGTAGGTACTAATCAAGCACTTGGTAATAAAGTTGCACAGTACTCTACACAAAAT 
ATGGCAGCAAATAACATTTCATATGTTATCTGGCAACAAAAGTTTTACTCAAATACAAAC 
AGTATTTATGGACCTGCTAATACTTGGAATGCAATGCCAGATCGTGGTGGCGTTACTGCC 
AACCACTATGACCACGTTCACGTATCATTTAACAAATAATATAAAAAAGGAAGCTATTTG 
GCTTCTTTTTTATATGCCTTGAATAGACTTTCAAGGTTCTTATATAATTTTTATTA 

SEQ ID NO. 6902 

STRAIN 090 

TGAGACAACACTGACAGTAACTTACGATCAGAAGAGTCATACTGCCACTT 

CAATGAAAATAGAAACACCAGCAACAAATGCTGCTGGTCAAACACCAGCT 

ACTGTGGATTTGAAAACCAATCAAGTTTCTGTTGCAGACCAAAAAGTTTC 

TCTCAATACAATTTCGGAAGGTATGACACCAGAAGCAGCAACAACGATTG ' 

TTTCGCCAATGAAGACATATTCTTCTGCGCCAGCTTTGAAATCAAAAGAA 

GTATTAGCACAAGAGCAAGCTGTTAGTCAAGCAGCAGCTAATGAACAGGT 

ATCAACAGCTCCTGTGAAGTCGATTACTTCAGAAGTTCCAGCAGCTAAAG 

AGGAAGTTAAACCAACTCAGACGTCAGTCAGTCAGTCAACAACAGTATCA 

CCAGCTTCTGTTGCCGCTGAAACACCAGCTCCAGTAGCTAAAGTAGCACC 

GGTAAGAACTGTAGCAGCCCCTAGAGTGGCAAGTGTTAAAGTAGTCACTC 

CTAAAGTAGAAACTGGTGCATCACCAGAGCATGTATCAGCTCCAGCAGTT 

CCTGTGACTACGACTTCAACAGCTACAGACAGTAAGTTACAAGCGACTGA 

AGTTAAGAGCGTTCCGGTAGCACAAAAAGCTCCAACAGCAACACCGGTAG 

CACAACCAGCTTCAACAACAAATGCAGTAGCTGCACATCCTGAAAATGCA 

GGGCTCCAACCTCATGTTGCAGCTTATAAAGAAAAAGTAGCGTCAACTTA 

TGGAGTTAATGAATTCAGTACATACCGTGCAGGTGATCCAGGTGATCATG 

GTAAAGGTTTAGCAGTCGACTTTATTGTAGGTAAAAACCAAGCACTTGGT 

AATGAAGTTGCACAGTACTCTACACAAAATATGGCAGCAAATAACATTTC 

ATATGTTATcTGGCAACAAAAGTTTTACTCAAATACAAATAGTATTTATG 

GACCTGCTAATACTTGGAATGCAATGCCAGATCGTGGTGGCGTTACTGCC 

AACCATTATGACCATGTTCACGTATCATTTAACAAATAATATAAAAAAGG 
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AAGCTATTTGGCTTCTTTTTTATATGCCTTGAATAGACTTTCAAGGTTCT 
TATATAATTTTTATTA 

SEQ ID NO. 6903 

STRAIN A909 

CTGATTTGGTAAAGCAAGACAATAAATCATCATATACTGTGAA 

ATATGGTGATACACTAAGCGTTATTTCAGAAGCAATGTCAATTGATATGA 

ATGTCTTAGCAAAAATTAATAACATTGCAGATATCAATCTTATTTATCcT 

GAGACAACACTGaCAGTAACTTACGATCAGAAGAGTCATACTGCTACTTC 

AATGAAAATAGAAACACCAGCAACAAATGCTGCTGGTCAAACAaCAGcTA 

CTGTCGATTTGAAAACCAATCAAGTTTCTGTTGCAGACCAAAAAGTTTCT 

CTCAATACAATTTCGGAAGGTATGACACCAGAAGCAGCAACAACGATTGT 

TTCGCCAATGAAGACATATTCTTcTGCGCCAGCTTTGAAATCAAAAGAAG 

TATTAgCACAAGGGCaAGCTGTTAGTCAAGCAGCAGCTAATGAACAGGTA 

TCAcCAGCTcCTGTGAAGTCGATTACTTCAGAAGTTCCAgCAGCTAAAGA 

GGAAGTTAAACCAaCTCAgACGTCAgTCAGTCAGTCAACAACAGTATCAC 

CAgCTTCTGTTGCCGCTGAAACACCAGCTCCAgTAGCTAAaGTAGCACCG 

GTAAGAACTGTAGCAGCCCCTAGAGTGGCAAGTGTTAAAGTAGTCACTCC 

TAAAGTAGAAACTGGTGCATCACCAGAGCATGTATCAGCTCCAGCAGTTC 

CTGTGACTACGACTTCAACAGCTACAGACAGTAAGTTACAAGCGACTGAA 

GTTAAGAGCGTTCCGGTAGCACAAAAAGCTCCAACAGCAACACCGGTAGC 

ACAACCAGCTTCAACAACAAATGCAGTAGCTGCACATCCTGAAAATGCAA 

GGCTCCAACCTCATGTTGCAGCTTATAAAGAAAAAGTAGCGTCAACTTAT 

GGAGTTAATGAATTcAGTACATACCGTGCGGGAGATCCAGGTGATCATGG 

TAAAGGTTTAGCAGTTGACTTTATTGTAgGTAAAAACCAAGCACTTGGTA 

ATGAAGTTGCACAGTACTCTACACAAAATATGGCAGCaAATAACATTTCA 

TATGTTATCTGGCAACAAAAGTTTTACTCAAAT a CAAATAGTATTTATGG 

ACcTGCTAATACTTGGAATGCAATGCCAGATCGTGGTGGCGTTAcTGCCA 

ACCa CT AT GACC ACGTT CACGT AT C ATT T AAC AAAT aAT AT AAAAAAGGA 

AGCTaTTTGGCTTCTTTTTTATATGCCTTGCATAGACtTTCAAGGTTCTT 

ATATAATTTTTATTA 

SEQ ID NO. 6904 

STRAIN H36B 

CTGATTTGGTAAAGCAAGACAATAAATCATCATATAcTGTGAAATA 

TGGTGATACAcTAAGCGTTATTTCAGAAGCAATGTCaATTGATATGAATG 

TCTTAGCAAAAATTAATAACATTGCAGATATCAATCTTATTTATCcTGAG 

ACAACaCTGaC AGTAaCTT ACGAT CAGAAGAGTCAT ACTGCTACTT CAAT 

GAAAATAGAAACACCAGCAACAAATGCTGCTGGTCAAACAACAGCTACTG 

TCGATTTGAAAACCAATCAAGTTTCTGTTGCAGACCAAAAAGTTTCTCTC 

AATACAATTTCGGAAGGTATGACACCAGAAGCAGCAACAACGATTGTTTC 

GCCAATGAAGACATATTCTTCTGCGCCAGCTTTGAAATCAAAAGAAGTAT 

TAGCACAAGGGCAAGCTGTTAGTCAAGCAGCAGCTAATGAACAGGTATCA 

CCAGCTCCTGTGAAGTCGATTACTTCAGAAGTTCCAGCAGCTAAAGAGGA 

AGTTAAACCAACTCAGACGTCAGTCAGTCAGTCAACAACAGTATCACCAG 

CTTcTGTTGCCGCTGAAACACCAGCTCCAGTAGcTAAAGTAGCACCGGTA 

AGAACTGTAGCAGCCCcTAGAGTGGCAAGTGTTAAAGTAGTCACTCcTAA 

AGTAGAAACTGGTGCATCACCAGAGCATGTATCAGCTCCAGCAGTTCCTG 

TGACTACGACTTCAACAGCTACAGACAGTAAGTTACAAGCGACTGAAGTT 

AAGAGCGTTCCGGTAGCACAAAAAGCTCCAACAGCAACACCGGTAGCACA 

ACCAGCTTCAACAACAAATGCAGTAGCTGCACATCCTGAAAATGCAAGGC 

TCCAACCTCATGTTGCAGCTTATAAAGAAAAAGTAGCGTCAACTTATGGA 

GTTAATGAATTCAGTACATACCGTGCGGGAGATCCAGGTGATCATGGTAA 

AGGTTTAGCAGTTGACTTTATTGTAGGTAAAAACCAAGCACTTGGTAATG 

AAGTTGCACAGTACTCTACACAAAAtaTGGCAGCAAATAACATTTCATAT 

GTTATCTGGCaACAAAAGTTTTACTCAAATACAAATAGTATTTATGGACC 

TGCTAATACTTGGAATGCAATGCCAgATCGTGGTGGCGTTACTGCCAACC 

ACTATGACCACGTTCACGTATCATTTAACAAATAATATAAAAAAGGAAGC 

TATTTGGCTTCTTTTTTATATGCCTTGCATAGACtTTCAAGGTTCTTATA 

TAATTTTTATTA 

SEQ ID NO. 6905 
STRAIN 18RS21 
CTGATTTGGTAAAGCAAGACAAT 
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AAATCATCATATACTGTGAAATATGGTGATACAcTAAGcGTTATTTCAGA 
AGCAATGTCAATTGATATGAATGTCTTAGCAAAAaTAAATAACATTGCAG 
ATATCAATCTTATTTATCcTGAGACAACaCTGaCAGTAACTTACGATCAG 
AAGAGTCATACTGCCaCTTCAATGAAAATAGAAACACCAGCAaCAAATGC 
TGCTGGTCAaACAaCAGCTACTGTGGATTTGAAAACCAATCAaGTTTCTG 
TTGCAGACCAAAAAGTTTCTCTCAATACAATTTCGGAAGGTATGACACCA 
GAAGCAGCAACAACGATTGTTTCGCCAATGAAGACaTATTCTTcTGCGCC 
AGCTTTGAAaTCAAAAGAAGTATTAGCACAAGAGCAAGCTGTTAGTCAAG 
CAGCAGCTAATGAACAGGTATCACCAGCTCCTGTGAAGTCGATTACTTCA 
GAAGTTCCAGCAGCTAAAGAGGAAGTTAAACCAACTCAGACGTCAGTCAG 
TCAGTCAACAACAGTATCACCAGCTTCTGTTGCCGCTGAAACACCAGCTC 
CAGTAGCTAAAGTAGCACCGGTAAGAACTGTAGCAGCCCCTAGAGTGGCA 
AGTGTTAAAGTAGTCACTCCTAAAGTAGAAACTGGTGCATCACCAGAGCA 
TGTATCAGCTCCAGCAGTTCCTGTGACTACGACTTCACCAGCTACAGACA 
GTAAGTTACAAGCGACTGAAGTTAAGAGCGTTCCGGTAGCACAAAAAGCT 
CCAACAGCAACACCGGTAGCACAACCAGCTTCAACAACAAATGCAGTAGC 
TGCACATCCTGAAAATGCAGGGCTCCAACCTCATGTTGCAGCTTATAAAG 
AAAAAGTAGCGTCAACTTATGGAGTTAATGAATTCAGTACATACCGTGCG 
GGAGATCCAGGTGATCATGGTAAAGGTTTAGCAGTTGACTTTATTGTAGG 
TACTAATCAAGCACTTGGTAATAAAGTTGCACAGTACTcTACACAAAATA 
TGGCAGCAAATA^CATTTCATATGTTATCTGGCAACAAAAGTTTTACTCA 
AATACAAACAGTATTTATGGACCTGCTAATACTTGGAATGCAATGCCAGA 
TCGTGGTGGCGTTACTGCCAACCACTATGACCACGTTCACGTATCATTTiC 
ACAAATAATATAAAAAAGGAAGCTATTTGGCTTCTTTTTTATATGCCTTG 
AATAGACTTTCAAGGTTCTTATATAATTTTTATTA 

SEQ ZD NO. 6906 

STRAIN COH1 
CTGATTT 

GGTAAAGCAAGACAATAAATCATCATATACTGTGAAATATGGTGATACAC 
TAAGCGTTATTTCAGAAGCAATGTCAATTGATATGAATGTCTTAGCAAAA 
ATTAATAACATTGCAGATATCAATCTTATTTATCCTGAGACAACACTGAC 
AGTAACTTACGATCAGAAGAGTCATACTGCCACTTCAATGAAAATAGAAA 
CACCAGCAACAAATGCTGCTGGTCAAACAACAGcTACTGTCGATTTGAAA 
ACCAATCAAGTTTTTGTTGCAGACCAAAAAGTTTcTCTCAATACAATTTC 
GGAAGGTATGACACCAGaaGCAGCAACAACGATTGTTTCGCCAATGAAGA 
CaTATTCTTCTGCGCCAGCTTTGAAATCAAAAGAAGTATTAGCACAAGAG 
CAAGCTGTTAGTCAAGTAGCAGCTAAT GAACAGGTAT CACCAGCTCCTGT 
GAAGTCGATTACTTCAGAAGTTCCAGCAGCTAAAGAGGAAGTTAAACCAA 
CTCAGACGTCAGTCAGTCAGTTAACAACAGTATCACCAGCTTCTGTTGCC 
GCTGAAACACCAGCTCCAGTAGCTAAAGTAGCACCGGTAAGAACTGTAGC 
AGCCCCTAGAGTGGCAAGTGcTAAAGTAGTCACTCcTAAAGTAGAAACTG 
GTGCATCACCAGAGCATGTATCAGCTCCAGCAGTTCCTGTGACTACGACT 
TCACCAGCTACAGACAGTAAGTTACAAGCGACTGAAGTTAAGAGCGTTCC 
GGTAGCACAAAAAGCTCCAACAGCAACACCGGTAGCACAACCAGCTTCT^A 
CAACAAATGCAGTAGCTGCACATCCTGAAAATGCAGGGCTCCAACCTCAT 
GTTGCAGCTTATAAAGAAAAAGTAGCGTCAACTTATGGAGTTAATGAATT 
CAGTACATACCGTGCGGGAGATCCAGGTGATCATGGTAAAGGTTTAGCAG 
TTGACTTTATTGTAGGTAAAAACCAAGCACTTGGTAATGAAGTTGCACAG 
TaCTCTACACAAAATATGGCAGCAAATAACATTTCATATGTTATCTGGCA 
ACAAAAGTTTTATTCAAATACAAATAGTATTTATGGACCTGCTAATACTT 
GGAATGCAATGCCAGATCGTGGTGGCGTTACTGCCAACCACTATGACCAC 
GTTCACGTATCATTTAACAAATAATATAAAAAAGGAAGCTATTTGGCTTC 
TTTTTTATATGCCTTGAATAGACTTTCAAGGTTCTTATATAATTTTTATT 
A 

SEQ ID NO. 6907 

STRAIN M732 

CTGATTTGGTAAAGCAAGACAATAAATCATCATATACTGTGAAATATGGT 
GATACAnTAAGCGTTATTTCAGAAGCAATGTCAATTGATATGAATGTCTT 
AGCAAAAATTAATAACATTGCAGATATCAATCTTATTTATCCTGAGACAA 
CACTGACAGTAACTTACGATCAGAAGAGTCAtACTGCCACTTCAATGAAA 
ATAGAAACACCAGCAACAAATGCTGCTGGTCAAACAACAGCTACTGTcGA 
TTTGAAAACCAATCAAGTTTTTGTTGCAGACCAAAAAGTTTCTCTCAATA 
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CAATTTCGGAAGGTATGACACCAGAAGCAGCAACAACGATTGTTTCGCCA 
ATGAAGACATATTCTTCTGCGCCAGCTTTGAAATCAAAAGAAGTATTAGC 
ACAAGAGCAAGCTGTTAGTCAAGTAGCAGCTAATGAACAGGTATCACCAG 
CTCCTGTGAAGTCGATTACTTCAGAAGTTCCAGCAGCTAAAGAGGAAGTT 
AAACCAACTCAGACGTCAGTCAGTCAGTTAACAACAGTATCACCAGCTTC 
TGTTGCCGCTGAAACACCAGCTCCAGTAGCTAAAGTAGCACCGGTAAGAA 
CTGTAGCAGCCCCTAGAGTGGCAAGTGCTAAAGTAGTCACTCCTAAAGTA 
GAAACTGGTGCATCACCAGAGCATGTATCAGCTCCAGCAGTTCCTGTGAC 
TACGACTTCACCAGCTACAGACAGTAAGTTACAAGCGACTGAAGTTAAGA 
GCGTTCCGGTAGCACAAAAAGCTCCAACAGCAaCACCGGTAGCACAACCA 
GCTTCAACAACAAATGCAGTAGCTGCACATCCTGAAAATGCAGGGCTCCA 
ACCTCATGTTGCAGCTTATAAAGAAAAAGTAGCGTCAACTTATGGAGTTA 
ATGAATTCAGTACATACCGTGCGGGAGATCCAGGTGATCATGGTAAAGGT 
TTAGCAGTTGACTTTAttgtaggtaaaaaccAAGCACTTGGTAATGAAGT 
TGCACAGTACTcTACACAAAATATGGCAGCAAATAACATTTCATATGTTA 
TCTGGCAACAAAAGTTTTATTCAAATACAAATAGTATTTATGGACCTGCT 
AATACTTGGAATGCAATGCCAGATCGTGGTGGCGTTACTGCCAACCACTA 
TGACCACGTTCACGTATCATTTAACAAATAATATAAAAAAGGAAGCTATT 
TGGCTTCTTTTTTATATGCCTTGAATAGACTTTCAAGGTTCTTATATAAT 
TTTTATTA 

SEQ ID NO. 6908 

STRAIN M781 

CTGATTTGGTAAAGCAAGACAATAAATCATCATATACTGTGAAATATGGT 
GATACACTAAGCGTTATTTCAGAAGCAATGTCAATTGATATGAATGTCTT 
AGCAAAAATTAATAACATTGCAGATATCAATCTTATTTATCCTGAGACAA 
CACTGACAGTAACTTACGATCAGAAGAGTCATACTGCCACTTCAATGAAA 
ATAGAAACACCAGCAACAAATGCTGCTGGTCAAACAACAGCTACTGTCGA 
TTTGAAAACCAATCAAGTTTTTGTTGCAGACCAAAAAGTTTCTCTCAATA 
CAATTTCGGAAGGTATGACACCAGAAGCAGCAACAACGATTGTTTCGCCA 
ATGAAGACATATTCTTCTGCGCCAGCTTTGAAATCAAAAGAAGTATTAGC 
ACAAGAGCAAGCTGTTAGTCAAGTAGCAGCTAATGAACAGGTATCACCAG 
CTCCTGTGAAGTCGATTACTTCAGAAGTTCCAGCAGCTAAAGAGGAAGTT 
AAACCAACTCAGACGTCAGTCAGTCAGTTAACAACAGTATCACCAGCTTC 
TGTTGCCGCTGAAACACCAGCTCCAGTAGCTAAAGTAGCACCGGTAAGAA 
CTGTAGCAGCCCCTAGAGTGGCAAGTGCTAAAGTAGTCACTCCTAAAGTA 
GAAACTGGTGCATCACCAGAGCATGTATCAGCTCCAGCAGTTCCTGTGAC 
TACGACTTCACCAGCTACAGACAGTaaGTTACAAGCGACTGTVAGTTAAGA 
GCGTTCCGGTAGCACAAAAAGCTCCAACAGCAACACCGGTAGCACAACCA 
GCTTCAACAACAAATGCAGTAGCTGCACATCCTGAAAATGCAGGGCTCCA 
ACCTCATGTTGCAGCTTATAAAGAAAAAGTAGCGTCAACTTATGGAGTTA 
ATGAATTCAGTACATACCGTGCGGGAGATCCAGGTGATCATGGTAAAGGT 
TTAGCAGTTGACTTTATTGTAGGTAAAAACCAAGCACTTGGTAATGAAGT 
TGCACAGTACTCTACACAAAATATGGCAGCAAATAACATTTCATATGTTA 
TCTGGCAACAAAAGTTTTATTCAAATACAAATAGTATTTATGGACCTGCT 
AATACTTGGAATGCAATGCCAGATCGTGGTGGCGTTACTGCCAACCACTA 
TGACCACGTTCACGTATCATTTAACAAATAATATAAAAAAGGAAGCTaTT 
TGGCTTCTTTTTTATATGCCTTGAATAgACTTTCAAGGTTCTTATATAAT 
TTTTATTA 

SEQ ID NO. 6909 

STRAIN CJB110 

CTGATTTGGTAAAGCAAGACAATAAATCATCATATACTGTGAAA 

TATGGTGATACACTAAGCGTTATTTCAGAAGCAATGTCAATTGATATGAA 

TGTCTTAGCAAAAATTAATAACATTGCAGATATCAATCTTATTTATCCTG 

AGACAACACTGACAGTAACTTACGATCAGAAGAGTCATACTGCCACTTCA 

ATGAAAATAGAAACACCAGCAACAAATGCTGCTGGTCAAACACCAGCTAC 

TGTGGATTTGAAAACCAATCAAGTTTcTGTTGGAGACCAAAAAGTTTCTC 

TCAATACAATTTCGGAAGGTATGACACCAGAAGCAGCAACAACGATTGTT 

TCGCCAATGAAGACATATTCTTCTGCGCCAGCTTTGAAATCAAAAGAAGT 

ATTAGCACAAGAGCAAGCTGTTAGTCAAGCAGCAGCTAATGAACAGGTAT 

CAACAGCTCCTGTGAAGTCGATTACTTCAGAAGTTCCAGCAGCTAAAGAG 

GAAGTTAAACCAACTCAGACGTCAGTCAGTCAGTCAACAACAGTATCACC 

AgCTTCTGTTGCCGCTGAAACACCAGCTCCAGTAGCTAAAGTAGCACCGG 
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TAAgAACTGTAGCAGCCCCTAGAGTGGCAAGTGTTAAAGTAGTCACTCCT 
AAAGTAGAAACTGGTGCATCACCAGAGCATGTATCAGCTCCAGCAGTTCC 
TGTGACTACGACTTCAACAGcTACAGACAGTaAGTTaCAAGCGACTGAAG 
TTAAGAGCGTTCCGGTAGCACAAAAAGCTCCAACAGCAACACCGGTAGCA 
CAACCAGCTTCAACAACAAATGCAGTAGCTGCACATCCTGAAAATGCAGG 
GCTCCAACCTCATGTTGCAGCTTATaAAGAAAAAGTAGCGTCAACTTATG 
GAGTTAATGAATTCAGTACATaCCGTGCAGGTGATCCAgGTGATCATGGT 
AAAGGTTTAGCAGTcGACTTTATTGTAgGTAAAAACCAAGCACTTGGTAA 
TGAAGTTGCACAGTACTCTACACAAAATATGGCAGCAAATAACATTTCAT 
ATGTTATCTGGCAACAAAAGTTTTACTCAAATACAAATAGTATTTATGGA 
CCTGCTAATACTTGGAATGCAATGCCAGATCGTGGTGGCGTTACTGCCAA 
CCATTATGACCATGTTCACGTATCATTTAACAAATAATATAAAAAAGGAA 
GCTATTTGGCTTCTTTTTTATATGCCTTGAATAGACtTTCAAGGTTCTTA 
TATAATTTTTATTA 

SEQ ID NO. 6910 

STRAIN 1169NT 
CTGATTTG 

GTAAAGCAAGACAATAAATCATCATATACTGTGAAATATGGTGATACACT 
AAGCGTTATTTCAGAAGCAATGTCAATTGATATGAATGTCTTAGCAAAAA 
TTAATAACATTGCAGATATCAATCTTATTTATCcTGAGACAACACTGACA 
GTAACTTACGATCAgAAGAGTCATACTGCCACTTCAATGAAAATAGAAAC 
ACCAGCAACAAATGCTGCTGGTCAAACAACAGCTACTGTGGATTTGAAAA 
CCAATCAAGTTTCTGTTGCAGACCAAAAAGTTTCTCTCAATACAATTTCG 
GAAGGTATGACACCAGAAGCAgCAACAACGATTGTTTCGCCAATGAAGAC 
ATATTCTTCTGCGCCAGCTTTg7U\ATCAAAAGAAGTATTAGCACAAGAGC 
AAGCTGTTAGTCAAGCAGCAGCTAATGAACAGGTATCACCAGCTCCTGTG 
AAGTCGATTACTTCAgAAGTTCCAgCAGCTAAAGAGGAAGTTAGACCAaC 
TcAGACGTCAGTCAGTCAGTCAACAACAGTATCACCAgCTTCTGTTGCCG 
CTGAAACACCAGCTCCAGTAGCTAAAGTAGCACCGGTAAGAACTGTAGCA 
GCCCCAGCCCCTAGAGTGGCAAGTGCTAAAGTAGTCACTCCTAAAGTAGA 
AAcTGGTGCATCACCAGAGCATGTACCAGCTCCAGCAGTTcCTGTGACTA 
cGACTTCAACAGCTACaGACAaTaAGTTACAAGCGACTGAAGTTAAgAGC 
GtTCCGGTgGCACAAAAAGCTCCAACAGCAACACCGGTaGCACAACCAGC 
TT cAACAACAAATGCAGTAGcTGCACAT CCTGAAAATGCAGGACTCCAAC 
CTCATGTTGCAGCTTATAAAGAAAAAGTAGCGTCAACTTATGGAGTTAAT 
GAATTCAGTACATaCCGTGCGGGAGATCCAGGTGATCATGGTAAAGGTTT 
AGCAGTTGACTTTATTGTagGTAAAAACCAAGCACTTGGTAATGAAGTTG 
CACAGTACTCTACACAAAATATGGCAGCAAATAACATTTCATATGTTATC 
TGGCAACAAAAGTTTTACTCAAATACAAATAGTATTTATGGACCTGCTAA 
TACTTGGAATGCAATGCCAGATCGTGGTGGCGTTACTGCCAACCACTATG 
ACCACGTTCACGTATCATTTAACAAATAATATAAAAAAGGAAGCTATTTG 
GCTTCTTTTTTATATGCCTTGAATAGACTTTCAAGGtTCTTATATAATTT 
TTATTA 

SEQ ID NO, 6911 

STRAIN JM9130013 

CTGATTTGGTAAAGCAAGACAATAAATCATCATATACT 

GTGAAATATGGTGATACACTAAGCGTTATTTCAGAAGCAATGTCAATTGA 

TATGAATGTCTTAGCAAAAATAAATAACATTGCAGATATCAATCTTATTT 

ATCcTGAGACAACACTGACAGTAACTTACGATCAGAAGAGTCATACTGCC 

ACTTCAATGAAAATAGAAACACCAGCAACAAATGCTGCT.GGTCAAACAAC 

AGCTACTGTGGATTTGAAAACCAATCAAGTTTCTGTTGCAGACCAAAAAG 

TTTCTCTCAATACAATTTCGGAAGGTATGACACCAGAAGCAGCAACAACG 

ATTGTTTCGCCAATGAAGACAT ATT CTT CTGCGCCAGCTTTGAAATCAAA 

AGAAGTATTAGCACAAGAGCAAGCTGTTAGTCAAGCAGCAGCTAATGAAC 

AGGTATCACCAGCTCCTGTGAAGTCGATTACTTCAGAAGTTCCAGCAGCT 

AAAGAGGAAGTTAAACCAACTCAGACGTCAGTCAGTCAGTCAACAACAGT 

ATCACCAgCTTCTGTTGCCGCTGAAACACCAGCTCCAGTAGCTAAAGTAG 

CACCGGTAAGAACTGTAGCAGCCCCTAgAGTGGCAAGTGTTAAAGTAGTC 

ACTCCTAAAGTAGAAACTGGTGCATCACCAGAGCATGTATCAGCTCCAGC 

AGTTCCTGTGACTACGACTTCACCAGCTACAGaCAGTAAGTTACAAGCGA 

cTGAAGTTAAGAGCGTTCCGGTAGCACAAAAAGCTCCAACAGCAACACCG 

GTAGCaCAACCAGCTTCAACAACAAATGCAGTAGCTGCACATCCTGAAAA 
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TGCAGGGCTCO^ACCTCATGTTGCAGCTTATAAAGAAAAAGTAGCGTCAA 
CTTATGGAGTTAATGAATTCAGTACATACCGTGCGGGAGATCCAgGTGAT 
CATGGTAAAGGTTTAGCAGTTGACTTTATTGTAGGTACTAATCAAGCACT 
TGGTAATAAAGTTGCACAGTACTCTACACAAAATATGGCAGCAAATAACA 
TTTCATATGTTATCTGGCAACAAAAGTTTTACTCAAATACAAACAGTATT 
TATGGACCTGCTAATACTTGGAATGCAATGCCAGATCGTGGTGGCGTTAC 
TGCCAACCACTATGACCACGTTCACGTATCATTTAACAAATAATATAAAA 
AAGGAAGCTATTTGGCTTCTTTTTTATATGCCTTGAATAGACTTTCAAGG 
TTCTTATATAATTTTTATTA 

SEQ ID NO. 6912 
STRAIN 2603 frame: 1 

MNKKVLLTSTMAASLLSVASVQAQETDTTWTARTVSEVKADLVKQDNKSSYTVKYGDTLS 
VISEAMSIDMNVLAKINNIADINLIYPETTLTVTYDQKSHTATSMKIETPATNAAGQTTA 
TVDLKTNQVSVADQKVSLNTISEGMTPEAATTIVSPMKTYSSAPALKSKEVLAQEQAVSQ 
AAANEQVSPAPVKSITSEVPAAKEEVKPTQTSVSQSTTVSPASVAAETPAPVAKVAPVRT 
VAAPRVAS VKWT PBCVETGAS PEHVS APAVPVTTT S PAT DS KLQATEVKS V PVAQKAPTA 
TPVAQPASTTNAVAAHPENAGLQPHVAAYKEKVASTYGVNEFSTYRAGDPGDHGKGLAVD 
FI VGTNQALGNKVAQYSTQNMAANN I S YVIWQQKFYSNTNS I YG PANTWNAMP DRGGVTA 
NHYDHVHVSFNK.YKKGSYLA5FLYALNRLSRFLYNFY 

SEQ ID NO . 6913 

STRAIN 090 frame: 2 

ETTLTVTYDQKSHTATSMKIETPATNAAGQTPATVDLKTNQVSVADQKVSLNT I SEGMT P 
EAATTIVSPMKTYSSAPALKSKEVLAQEQAVSQAAANEQVSTAPVKSITSEVPAAKEEVK 
PTQTSVSQSTTVS PASVAAET PAPVAKVAPVRTVAAPRVAS VKWTPKVETGAS PEHVS A 
PAVPVTTTSTATDSKLQATEVKSVPVAQKAPTATPVAQPASTTNAVAAHPENAGLQPHVA 
AYKEKVASTYGVNEFSTYRAGDPGDHGKGLAVDFIVGKNQALGNEVAQYSTQNMAANNIS 
YVIWQQKFYSNTNS I YGPANTWNAMPDRGGVTANHYDHVHVS FNK . YKKGS YLAS FLYAL 
NRLSRFLYNFY 

SEQ ID NO. 6914 

STRAIN A909 frame: 3 

DLVKQDNKSSYTVKYGDTLSVISEAMSIDMNVLAKINNIADINLIYPETTLTVTYDQKSH 
TAT SMKIET PATNAAGQTTATVDLKTNQVSVADQKVSLNTI SEGMTPEAATT IVS PMKTY 
SSAPALKSKEVLAQGQAVSQAAANEQVSPAPVKSITSEVPAAKEEVKPTQTSVSQSTTVS 
PASVAAET PAPVAKVAPVRTVAAPRVAS VKWT PKVETGAS PEHVS APAVPVTTT STAT D 
SKLQATEVKSVPVAQKAPTAT PVAQPASTTNAVAAH PENARLQPHVAAYBCEKVAS T YGVN 
EFSTYRAGDPGDHGKGLAVDFIVGKNQALGNEVAQYSTQNMAANNISYVIWQQKFYSNTN 
SI YGPANTWNAMPDRGGVTANHYDHVHVS FNK . YKKGSYLASFLYALHRLSRFLYNFY 

SEQ ID NO. 6915 

STRAIN H36B frame: 3 

DLVKQDNKSSYTVKYGDTLSVISEAMSIDMNVLAKINNIADINLIYPETTLTVTYDQKSH 
TATSMKIETPATNAAGQTTATVDLKTNQVSVADQKVSLNTI SEGMTPEAATT IVS PMKTY 
SSAPALKSKEVLAQGQAVSQAAANEQVSPAPVKSITSEVPAAKEEVKPTQTSVSQSTTVS 
PAS VAAETPAPVAKVAPVRTVAAPRVAS VKWT PKVETGAS PEHVSAPAV PVTTT S TAT D 
SKLQATEVKSVPVAQKAPTAT PVAQPASTTNAVAAHPENARLQPHVAAYiCEKVAST YGVN 
EFSTYRAGDPGDHGKGLAVDFIVGKNQALGNEVAQYSTQNMAANNISYVIWQQKFYSNTN 
SI YGPANTWNAMPDRGGVTANHYDHVHVS FNK . YKKGSYLASFLYALHRLSRFLYNFY 

SEQ ID NO. 6916 

STRAIN 18RS21 frame: 3 

DLVKQDNKSSYTVKYGDTLSVISEAMSIDMNVLAKINNIADINLIYPETTLTVTYDQKSH 
TAT SMKIETPATNAAGQTTATVDLKTNQVSVADQECVSLNT I SEGMTPEAATT IVS PMKTY 
SSAPALKSKEVLAQEQAVSQAAANEQVS PAPVKSITSEVPAAKEEVKPTQTSVSQSTTVS 
PASVAAET PAPVAKVAPVRTVAAPRVAS VKWTPKVETGAS PEHVSAPAV PVTTT S PATD 
SKLQATEVKSVPVAQKAPTATPVAQPASTTNAVAAHPENAGLQPHVAAYKEKVASTYGVN 
EFSTYRAGDPGDHGKGLAVDFIVGTNQALGNKVAQYSTQNMAANNISYVIWQQKFYSNTN 
SI YGPANTWNAMPDRGGVTANHYDHVHVS FNK . YKKGS YLAS FLY ALNRLSRFLYNET 

SEQ ID NO. 6917 

STRAIN M732 frame: 3 

DLVKQDNKSSYTVKYGDTXSVISEAMSIDMNVLAKINNIADINLIYPETTLTVTYDQKSH 
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TAT SMKIET PATNAAGQTTAT V DLKTNQVFVADQKVS LNT I S EGMT PEAATT IVS PMKT Y 
SSAPALKSKEVLAQEQAVSQVAANEQVSPAPVKSITSEVPAAKEEVKPTQTSVSQLTTVS 
PAS VAAET PAPVAKVAPVRT VAAPRVAS AKWT PKVETGAS PEHVS APAV PVTTT S PAT D 
SKLQATEVKSVPVAQKAPTASPVAQPASTTNAVAAHPENAGLQPHVAAYKEKVASTYGVN 
EFSTYRAGDPGDHGKGLAVDFIVGKNQALGNEVAQYSTQNMAANNISYVIWQQKFYSNTN 
SIYGPANTWNAMPDRGGVTANHYDHVHVSFNK . YKKGSYLASFLYALNRLSRFLYNFY 

SEQ ID NO. 6918 

STRAIN COH1 frame: 3 

DLVKQDNKSSYTVKYGDTLSVISEAMSIDMNVLAKINNIADINLIYPETTLTVTYDQKSH 
TAT SMKIET PATNAAGQTTAT VDLKTNQVFVADQKVS LNT I SEGMT PEAATT IVS PMKTY 
S S APALKSKEVLAQEQAVSQVAANEQVS PAPVKS ITSEVPAAKEEVKPTQT S VSQLTTVS 
PAS VAAET PAPVAKVAPVRT VAAPRVAS AKWT PKVETGAS PEHVS APAV PVTTT S PAT D 
SKLQATEVKSVPVAQKAPTATPVAQPASTTNAVAAHPENAGLQPHVAAYKEKVASTYGVN 
EFSTYRAGDPGDHGKGLAVDFIVGKNQALGNEVAQYSTQNMAANNISYVIWQQKFYSNTN 
S I YG PANTWNAMP DRGGVTANHYDHVHVS FNK . YKKGSYLASFLYALNRLSRFLYNFY 

SEQ XD NO. 6919 
STRAIN M781 frame: 3 

DLVKQDNKS SYTVKYGDTLS VI SEAMS I DMNVLAKINNIADINLI YPETTLTVT YDQKSH 
TAT SMKIET PATNAAGQTTAT VDLKTNQVFVADQKVS LNT I SEGMT PEAATT IVS PMKTY 
SSAPALKSKEVLAQEQAVSQVAANEQVS PAPVKS ITSEVPAAKEEVKPTQTSVSQLTTVS 
PAS VAAETPAPVAKVAP^RTVAAPRVAS AKWT PKVETGAS PEHVSAPAVPVTTT S PATD 
SKLQATEVKSVPVAQKAPTATPVAQPASTTNAVAAHPENAGLQPHVAAYKEKVASTYGVN 
EFSTYRAGDPGDHGKGLAVDFIVGKNQALGNEVAQYSTQNMAANNISYVIWQQKFYSNTN 
S I YG PANTWNAMPDRGGVT ANHYDHVHVS FNK . YKKGSYLASFLYALNRLSRFLYNFY 

SEQ ID NO. 6920 

STRAIN CJB110 frame: 3 

DLVKQDNKSSYTVKYGDTLSVISEAMSIDMNVLAKINNIADINLIYPETTLTVTYDQKSH 
TAT SMKIET PATNAAGQTPATVDLKTNQVSVADQKVS LNT I SEGMT PEAATTIVS PMKTY 
SSAPALKSKEVLAQEQAVSQAAANEQVSTAPVKSITSEVPAAKEEVKPTQTSVSQSTTVS 
PASVAAETPAPVAKVAPVRTVAAPRVASVKWTPKVETGAS PEHVSAPAVPVTTT STATD 
S KLQATE VKS VPVAQKAPT AT PVAQ PASTTNAVAAH PENAGLQPHVAAYKEKVAS T YGVN 
EFSTYRAGDPGDHGKGLAVDFIVGKNQALGNEVAQYSTQNMAANNISYVIWQQKFYSNTN 
S I YG PANTWNAMPDRGGVT ANHYDHVHVS FNK . YKKGSYLASFLYALNRLSRFLYNFY 

SEQ ID NO. 6921 

STRAIN 116 9NT frame: 3 

DLVKQDNKSSYTVKYGDTLSVISEAMSIDMNVLAKINNIADINLIYPETTLTVTYDQKSH 
TATSMKIET PATNAAGQTTAT VDLKTNQVSVADQKVS LNT I SEGMT PEAATT IVS PMKTY 
SSAPALKSKEVLAQEQAVSQAAANEQVS PAPVKS ITS EVPAAKEEVRPTQTSVSQSTTVS 
PAS VAAET PAPVAKVAPVRTVAAPAPRVASAKWT PKVETGAS PEHV PAPAVP VTTT STA 
T DNKLQATEVKS VPVAQKAPT AT P VAQ PASTTNAVAAH PENAGLQPHVAAYKEKVASTYG 
VNEFSTYRAGDPGDHGKGLAVDFIVGKNQALGNEVAQYSTQNMAANNISYVIWQQKFYSN 
TNS I YGPANTWNAMPDRGGVT ANHYDHVHVS FNK . YKKGSYLASFLYALNRLSRFLYNFY 

SEQ ID NO. 6922 

STRAIN JM9130013 frame: 3 

DLVKQDNKS SYTVKYGDTLS VI SEAMS I DMNVLAKINNIADINLI YPETTLTVT YDQKSH 
TAT SMKIET PATNAAGQTTAT VDLKTNQVSVADQKVS LNT I SEGMT PEAATT IVS PMKTY 
SSAPALKSKEVLAQEQAVSQAAANEQVS PAPVKS ITSEVPAAKEEVKPTQTSVSQSTTVS 
PAS VAAET PAPVAKVAPVRTVAAPRVAS VKWT PKVETGAS PEHVS APAV PVTTT S PATD 
S KLQATEVKSV PVAQKAPT AT PVAQ PASTTNAVAAH PENAGLQPHVAAYKEKVAST YGVN 
EFSTYRAGDPGDHGKGLAVDFIVGTNQALGNKVAQYSTQNMAANNISYVIWQQKFYSNTN 
S I YGPANTWNAMPDRGGVT ANHYDHVHVS FNK . YKKGSYLASFLYALNRLSRFLYNFY 

SEQ ID. NO. 7001 
STRAIN 2603 

ATGGGAGGGAAAATGAATCAAGAAGTCTTACTACAAATGATGAGAGCCACTATTCCTC 

GTGATAGAGCCTTGCTTGAGGCATTTTTATATTACCAAGCAGAGCATTTTGATGAGGAGT 

GGGATAGTCTTATTCATCAGTTTATGACCAATAGGCAAGAAATAAATAAGTCTGTTCAAG 

TACTTCACTTTGAGACAGATGTTTCAGCTTTTGTCCAGGCTAGTCCTTATGATACTGCTC 

ATGATCTATTGACCTATACACAAGTTTTCGGCCAAAGTGGTCTTCAAAAACTAGATAAAC 
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TATCGCCGTCTGAAAAAAACTTGGTGATAGAAGTGGCCTTGTTCAATCTGGCCACTCGTT 

TTCAATTATTGGATTCCAATGGACACTACCAAACCATATCGCCGGATTCACTCTTACAAA 

AGAGTAGGGGAGCTAATTTGGTCAATGTGTATCGTGTGGCTAATAATTTAGCGGATCGTA 

TTAGTCGAGATATTGAACAGTTTCTCTTAACTTACGAGCCTGAGCTTGAAACTAGAGCTG 

ATGAAACTGTTCTAGAAAATGAAGAAACTGTTGATGAGCACAAAACAAGTGTTCATCAAG 

CAATATCTTTTCGAGAAGAGGGCTCTCTGGTTATTGCTAGTTTGGATGTAGATTTGTCTC 

AACTAGATGTTCAAATAGG7U\AAACCAGTCATCTGCCAGCTTATGAAGAGTTATCCTTAC 

GACGTAAATTTGAGATTCTAACATATTTTGACCAAATTCGAAATGAACGTTCCAAAGTCC 

CAAGTTTTAGACGAGGTGATTTTGACACAGAGATGGAAATGACACCAGTCTTTGATGGCG 

AGGAATTACTTACTTATCTCGAAGCTGATGGCAGTCCCTATGAGCTGAAACGAACGCTGA 

CTACAGTCGAAGAAAAGGAATTAGAAAAAATTGGACAAGCCATTAGGATAGAAAATCAAG 

AAAAATTGACTCAGCTAGGGATTGATTTATCTCAGTTTGACCCAGACCGAGTCGGTATTT 

TATTGGATGCAGCAGGTCGTTTTCGTTTAAAAAATGCAGACCTTGCTTTACTAGGTGGTT 

ATCCCAAAGCCTCGGTAACTCAACTAGCCCTTGCGACAGAACTACTCCAAATGGGACTAA 

GTCATGAAAAGGTTGAATTTTTCTTTGGTAGCCAGCTTTCCATTGAAGAGCTGCGACAAG 

TTGCCTACGCCTTTTTATACCAAGAACTCAGCAGAGAAGATGCGGAGCAATTTGAAAAAG 

ATAAAGGTAATCAGCCAGATTTAACTCTCAGAGATTGGAAAAGCAAGCTAGAGAAAGCTG 

AGGGAAAAGAAGTAGTTGATGAAGAATTCGCGGAAAATCCACTGGTTCAGAGAGTATTGG 

ACACTTATCCTCTGGGGTCATTGGTTTCCTATAAGGGACAGGACTTTGAGGTCATGTCGG 

TCAGCGATGCTCGATTGAACGGTTTGATTCGGATTGAGTTAGTCAATGACTTTT CGGAT A 

TC^TTGAACAAAATCC^GTTCTSTATGtQAGGA 

ATCAGCCAAAGGCACaAAcViACAAACAGA 

TCTCATTTCTGGAAGAGGAGCCAGTTCAGAGTATTGGACTATTGGAACCAGATGATTCAG 

AAAATGGTCATAACGATACTGATCTTGAAGAAACAGATAATCAAATTCCTGAAGAGGAAG 

TCGTCGAAACAATTCCAGAGATTCCAGTAACGGACTTTTATTTTCCAGAAGATTTGACGG 

ACTTTTATCCTAAGACTGCTAGAGATAAGGTTGAGACAAACATTGTGGCCATTCGTTTGG 

TAAAAAATCTAGAAGTAGAGCACCGCAATGCTTCACCAAGTGAACAAGAACTCCTTGCCA 

AGTATGTAGGCTGGGGTGGACTAGCCAATGAATTTTTTGATGACTATAATCCAAAATTTT 

CTAAGGAACGAGAAGAACTGAAGAGCCTAGTCACAGATAAAGAGTATTCGGATATGAAAC 

AGTCCTCCCTGACAGCCTATTACACAGACCCATCCCTGATCCGTCAGATGTGGGATAAGT 

TGGAAAGAGATGGCTTTACAGGTGGCAAAATCCTAGATCCTTCCATGGGAACAGGGAATT 

TCTTTGCGGCTATGCCAAAACACTTAAGAGAAAAGAGTGAGTTGTATGGCGTAGAGTTAG 

ATACTATTACAGGAGCTATTGCCAAACACCTTCATCCCAATAGTCATATTGAAATTAAGG 

GATTTGAGACGGTGGCTTTTAACGACAATAGTTTTGATTTGGTGATTTCAAATGTGCCCT 

TTGCCAATATACGAATTGCGGATAATAGGTACGATAGGCCTTACATGATTCATGACTACT 

TTGTCAAT^AAGTCACTTGATTTGCTTCATGATGGTGGACAAGTAGCGATTATCTCTTCCA 

CAGGAACTATGGATAAGCGAACAGAAAACATCTTACAAGATATTCGTGAGACAACTGAAT 

TTCTTGGTGGGGTTCGACTGCCTGACTCTGCCTTTAAGGCCATTGCAGGAACGAGTGTCA 

CAACGGATATGTTATTCTTCCAGAAACACTTAGACAAGGGATATGTGGCAGACGATTTAG 

CCTTTTCAGGTTCCATTCGCTATGACAAGGATAGTCGCATTTGGCTCAATCCTTATTTTG 

ATGGAGAATACAATAGCCAGGTGCTAGGAACCTACGAGGTCAGGAATTTTAACGGAGGAA 

CACTTTCTGTTAAGGGGACTAGTGATGACTTGATTGCAAGTGTTGAAACAGCTCTAAATC 

ACGTTAAGGCCCCAAGAGAGATTGATAGAAATGAGGTCATCATTAACCCAGATGTGTTGA 

CCAAACAAGTCAATGATACCTCCATTCCAGCTGAAATGAGGGAAAATCTAGGTCAGTACA 

GTTTTGGTTATCAGGGGTCTACAGTTTACTATCGAGATAACAAAGGCATTCGAGTCGGAA 

CCAAGACGGAAGAAATCAGTTACTATGTCGATGAAGAGGGC7VACTTCAAAGCATGGGACA 

CCAAACATTCTCAAAAGCAGATTGATCGCTTTAATGCCTTAGAAGTGACTGATAACACTG 

CTCTGGATGTCTATGTGACCGATGATGCAGCCAAACGTGGTCAGTTTAAGGGGTATTATA 

AAAAGACAGTTTTCTATGAAGCTCCATTGTCTTATAAAGAAGTGGCACGTATCAAAGGAA 

TGGTCGATATTCGCAATGCCTACCAAGAAGTTATTGCCATTCAACGCTATTATGACTATG 

ATAAGGAGACCTTTAACCACTTGTTAGGCAAACTCAATCGTACCTATGATAGCTTTGTCA 

AACACTATGGGTATTTGAATAGTGCTGTGAACCGCAATCTTTTTGATAGTGATGATAAGT 

ATTCGCTTCTTGCTAGTTTGGAAGATGAAAGTCTGGATCCAAGTGGAAAGTCTGTTATCT 

ATACTAAATCCCTTGCCTTTGAGAAGGCTCTAQTGCGTCCTGAAAAAGAGGTTAAAAAGG 

TGCATACTGCCCTTGATGCCTTAAATTCGAGCTTGGCTGACGGACGAGGTGTTGATTTCG 

CTTATATGATGTCTATCTATCAGGTTGAATCGCAGATGACCTTGATTGAGGAGTTAGGCG 

ACCTCATTATGCCTGATCCTGAGAAGTATTTGAATGGAGAATTGACCTATGTTTCTCGCC 

AAGACT.TTCTTTCAGGGGATGTCGTCACTAAGTTAGAAGTGGTAGATCTATTCGTCAAAC 

AAGACAATCAGGACTTTAACTGGTCACATTATGCGGGACTTCTAGAAGCTATCAAACCAG 

CCCGTATTACTTTGGCAGACATTGATTATCGAATCGGTTCACGCTGGATTCCTCTGGCTG 

TTTATGGAAAATTTGCCCAAGAAACCTTTATGGGGAAAGCCTATGAACTGTCAGACCAAG 

AAGTAGCGACAGTCCTAGAAGTCAGTCCCATTGACGGGGTTATCACTTACCAATCTAAGT 

TTGCCTACACCTATTCCAACGCAACGGATAGGAGTTTAGGTGTCCCTGCTTCACGCTATG 

ATAGTGGTCGAAAAATCTTTGAAAATCTCCTGAATTCCAATCAACCAACCATCACAAAAC 
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AAGTTGTCGAAGGGGATAAGAAAAAGAATGTGACGGATGTAGAGAAAAO^CGGTCCTGC 
GTGCCAAGGAAACACACCTACAAGAACTCTTTCAAGGTTTTGTAGCAAAGTATCCAGAAG 
TCCAACAAATGATTGAAGACACCTATAATAGGCTCTACAATCGTACGGTATC7\AAGTCCT 
ATGATGGTAGTCATTTAACCATTGATGGACTTGCTCAGAATATCTCCTTACGTCCTCACC 
AAAAGAATGCCATTCAACGAATTGTCGAGGAAAAACGTGCTCTACTAGCTCATGAAGTTG 
GTTCAGGTAAAACACTTACCATGCTTGGGGCAGGATTCAAACTGAAAGAACTCGGAATGG 
TACATAAACCACTTTATGTGGTGCCGTCTAGTCTGACTGCTCAGTTTGGTCAAGAAATCA 
TGAAATTTTTCCCTACCAAGAAAGTCTATGTGACTACTAAGAAAGACTTTGCCAAAGCCA 
AACGCAAGCAGTTTGTGTCCCGTATTATTACAGGGGACTATGATGCCATTGTCATTGGGG 
ATTCACAATTTGAGAAGATACCGATGAGTCGTGAAAAACAGGTCACCTATATCAATGACA 
AACTTGAGCAACTCCGAGAAATCAAGCTAGGAAGTGACAGTGATTACACGGTGAAAGAAG 
CGGAACGTTCGATTAAGGGATTAGAACACCAGTTGGAAGAACTCCAAAAACTAGAGCGAG 
ATACCTTTATTGAGTTTGAAAACCTTGGAATTGATTTTCTTTTTGTGGATGAGGCTCATC 
ACTTCAAGAATATCCGTCCAATCACTGGACTTGGGAATGTAGCTGGAATCACCAACACAA 
CTTCTAAAAAGAACGTGGATATGGAGATGAAGGTGAGACAAGTACAGGCAGAGCATGGAG 
ATAGAAATGTCGTTTTTGCGACAGGAACACCAGTTTCTAACTCTATTAGTGAACTTTTCA 
CCATGATGGATTACATTCAACCTGATGTCTTGGAACGATACCTGGTATCAAATTTTGACT 
CCTGGGTTGGGGCTTTTGGGAATATCGAAAACTCCATGGAACTAGCCCCGACAGGAGATA 
AGTACCAACCCAAGAAACGGTTCAAGAAATTTGTCAACCTTCCTGAACTCATGCGAATCT 
ACAAGGAAACTGCCGATATTCAGACCTCAGACATGCTTGATTTACCAGTACCGGAAGCTA 
AGATTATTGCGGTGGAAAGCGAGTTAACGCAAGCTCAGAAATACTATTTGGAAGAGCTGG 
TAAAGTOTTC^gAcGCTATCAAGTCAGGTAGTGTTG^ 

AAATCACAGGAGAAGCCAGAAAACTAGCTATTGATATGCGGTTGATTGACCCTACTTACT 
CCTT AT CGGATAATCAGAAAATCCTT CAAGTAGTCGATAATGTCGAGCGGATTTACCGTG 
ATGGAGCTGGAGACAAAGCCACTCAGATGATTTTCTCAGATATTGGAACCCCTAAAAGTA 
AGGAAGAAGGGTTTGATGTCTACAATGAACTTAAGGACTTGTTTGTCGATCGAGGGATAC 
CAAAAGAAGAAATTGCCTTTGTCCATGATGCCAATACTGATGAGAAGAAAAACTCTCTGT 
CACGCAAGGTCAATAGTGGAGAAGTACGGATTCTCATGGCTTCTACGGAAAAAGGGGGAA 
CAGGATTAAACGTCCAATCTCGCATGAAAGCTGTCCACTATTTAGACGTTCCCTGGAGGC 
CCTCAGACATTGTCCAGCGAAATGGACGACTAATTCGACAAGGAAACATGCACCAGGAGG 
TAGATATTTATCACTATATTACTAAAGGGAGCTTTGACAATTACCTCTGGCAGACGCAGG 
AGAATAAGCTAAAGTATATCACCCAGATAATGACCTCAAAAGATCCTGTGAGATCAGCTG 
AAGACATTGATGAACAAACCATGACCGCCTCAGACTTTAAGGCATTGGCAACTGGGAACC 
CTTATCTCAAACTCAAAATGGAGTTGGAAAATGAACTGACAGTTTTAGAGAATCAAAAAC 
GAGCCTTTAATCGCTCCAAAGACGAGTATCGCCATACCATTTCCTATAGCGAGAAGCACC 
TCCCTATTATGGAAAAACGGTTGAGTCAATATGATAAAGATATTGCCCAATCTTTGGCAA 
CCAAGTCGCAAGATTTTGTCATGCGATTTGACAATCAAGCAATGGATAATCGTGCTGAAG 
CTGGGGACTATCTGCGAAAACTCATTACCTATAACCGCTCAGAGACCAAGGAAGTCAGGA 
CACTTGCCAGCTTTAGAGGATTTGATTTAAAAATGACTACACGAGGTGCTAGTGAGCCCT 
TACCAGAAACCATTTCTTTAATGATTGTAGGTGATAACCAGTATACTGTCGCCCTTGATT 
TGAAATCAGACGTGGGAACCATTCAACGGATTAGTAATGCCATTGACCATATTATAGATG 
ACCAAGAAAAGACGCAAGAGCTGGTAAAGGATTTAAAAGATAAGCTACGAGTAGCCAAAG 
TAGAAGTTGATAAAGTCTTTCCAAAGGAAGAGGACTATCAGCTTGTAAAGGCTAAGTATG 
ATGTTTTAGCTCCCTTGGTTGAAAAAGAAGCAGAGATTGAAGAGATAGATGCAGCTTTGG 
CCAAGTTTAGTGAAGATACAACACCCCAAAAGAAGCAACAAATAGCACTCGAGATA 

SEQ ID. NO. 7002 

STRAIN H36B 

GGAGGGAAAATGAATCAAGAAGT CTTACT ACAAATGAT 

GAGAGCCACTATTCCTCGTGATAGAGCCTTGCTTGAGGCATTTTTATATT 

ACCAAGCAGAGCATTTTGATGAGGAGTGGGATAGTCTTATTCATCAGTTT 

ATGACCAATAGGCAAGAAATAAATAAGTCTGTTCAAGTACTTCACTTTGA 

GACAGATGTTTCAGCTTTTGTCCAGGCTAGTCCTTATGATACTGCTCATG 

ATCTATTGACCTATACACAAGTTTTCGGCCAAAGTGGTCTTCAAAAACTA 

GATAAACTATCGCCGTCTGAAAAAAACTTGGTGATAGAAGTGGCCTTGTT 

CAATCTGGCCACTCGTTTTCAATTATTGGATTCCAATGGACACTACCAAA 

CCATATCGCCGGATTCACTCTTACAAAAGAGTAGGGGAGCTAATTTGGTC 

AATGTGTATCGTGTGGCTAATAATTTAGCGGATCGTATTAGTCGAGATAT 

TGAACAGTTTCTCTTAACTTACGAGCCTGAGCTTGAAACTAGAGCTGATG 

AAACTGTTCTAGAAAATGAAGAAACTGTTGATGAGCACAAAACAAGTGTT 

CATCAAGCAATATCTTTTCGAGAAGAGGGCTCTCTGGTTATTGCTAGTTT 

GGATGTAGATTTGTCTCAACTAGATGTTCAAATAGGAAAAACCAGTCATC 

TGCCAGCTTATGAAGAGTTAT CCTTACGACGTAAATTTGAGATT CTAACA 

TATTTTGACCAAATTCGAAATGAACGTTCCAAAGTCCCAAGTTTTAGACG 
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AGGTGATTTTGACACAGAGATGGAAATGACACCAGTCTTTGATGGCGAGG 

AATTACTTACTTATCTCGAAGCTGATGGCAGTCCCTATGAGCTGAAACGA 

ACGCTGACTACAGTCGAAGAAAAGGAATTAGAAAAAATTGGACAAGCCAT 

TAGGATAGAAAATCAAGAAAAATTGACTCAGCTAsGkATTGrTTTATCTC 

AGTTTGACCCAGACCGAGTCGGTATTTTATTGkATGCAGCAGGTCGTyyT 

CGTTTAwAwAATGCAGACCTTGCTTCACTAGGTGGTTATCCCAAAGCCTC 

GGTAACTCAACTAGCCCTTGCGACAGAACTACTCCAAATGGGACTAAGTC 

ATGAAAAGGTTGAATTTTTCTTTGGTAGCCAGCTTTCCATTGAAGAGCTG 

CGACAAGTTGCCTACGCCTTTTTACACCAAGAACTCAGCAGAGAAGATGC 

GGAGCAATTTGAAAAAGATAAAGGTAATCAGCCAGATTTAACTCTCAGAG 

ATTGGAAAAGCAAGCTAGAGAAAGCTGAGGGAAAAGAAGTAGTTGATGAA 

GAATTCGCGGAAAATCCACTGGTTCAGAGAGTATTGGACACTTATCCTCT 

GGGGTCATTGGTTTCCTATAAGGGACAGGACTTTGAGGTCATGTCGGTCA 

GCGATGCTCGAtTGAACGGTTTGATTCGGATTGAGTTAGTCAATGACTTT 

TCGGATATCATTGAACAAAATCCAGTTCTTTATGTGAGGACCTGGGAAGA 

AGTCAGTCAGGCACTTCATCAGCCAAAGGCAGAACCACAAACAGAGTTAG 

AAGAAGCGGACCAAGAATTAAACCTATTCTCATTTCTGGAAGAGGAGCTA 

GTTCAGAGTATTGGACTATTGGAACCAGATGATTCAGAAAATGGTCATAA 

CGATACTGATCTTGAAGAAACAGATAATCAAATTCCTGAAGAGGAAGTCG 

TCGAAACAATTCCAGAGATTCCAGTAACGGACTTTTATTTTCCAGAAGAT 

TTGACGGACTTTTATCCTAAGACTGCTAGAGATAAGGTTGAGACAAACAT 

'TGTGGCCATTCGTTTGGTAAAAAATCTAGAAGTAGAGCACCGCAATGCTT 

CACCAAGTGAACAAGAACTCCTTGCCAAGTATGTAGGCTGGGGTGGACTA 

GCCAATGAATTTTTTGATGACTATAATCCAAAATTTTCTAAGGAACGAGA 

AGAACTGAAGAGCCTAGTCACAGATAAAGAGTATTCGGATATGAAACAGT 

CCTCCCTGACAGCCTATTACACAGACCCATCCCTGATCCGTCAGATGTGG 

GATAAGTTGGAAAGAGATGGCTTTACAGGTGGCAAAATCCTAGATCCTTC 

CATGGGAACAGGGAATTTCTTTGCGGCTATGCCAAAACACTTAAGAGAAA 

AGAGTGAGTTGTATGGCGTAGAGTTAGATACTATTACAGGAGCTATTGCC 

AAACACCTTCATCCCAATAGTCATATTGAAATTAAGGGATTTGAGACGGT 

GGCTTTTAACGACAATAGTTTTGATTTGGTGATTTCAAATGTGCCCTTTG 

CCAATATACGAATTGCGGATAATAGGTACGATAGGCCTTACATGATTCAT 

GACTACTTTGTCAAAAAGTCACTTGATTTGCTTCATGATGGTGGACAAGT 

AGCGATTATCTCTTCCACAGGAACTATGGATAAGCGAACAGAAAACATCT 

TACAAGATATTCGTGAGACAACTGAATTTCTTGGTGGGGTTCGACTGCCT 

GACTCTGCCTTTAAGGCCATTGCAGGAACGAGTGTCACAACGGATATGTT 

ATTCTTCCAGAAACACTTAGACAAGGGATATGTGGCAGACGATTTAGCCT 

TTTCAGGTTCCATTCGCTATGACAAGGATAGTCGCATTTGGCTCAATCCT 

TATTTTGATGGAGAATACAATAGCCAGGTGCTAGGAACCTACGAGGTCAG 

GAATTTTAACGGAGGAACACTTTCTGTTAAGGGGACTAGTGATGACTTGA 

TTGCAAGTGTTGAAACAGCTCTAAATCACGTTAAGGCCCCAAGAGAGATT 

GATAGAAATGAGGTCATCATTAACCCAGATGTGTTGACCAAACAAGTCAA 

TGATACCTCCATTCCAGCTGAAATGAGGGAAAATCTAGGTCAGTACAGTT 

TTGGTTATCAGGGGTCTACAGTTTACTATCGAGATAACAAAGGCATTCGA 

GTCGGAACCAAGACGGAAGAAATCAGTTACTATGTCGATGAAGAG 

SEQ ID. NO. 7003 

STRAIN 18RS21 

GnAGGGAAAATGAATCAAGAAGTCTTACTACAAATGATGAGA 

GCCACTATTCCTCGTGATAGAGCCTTGCTTGAGGCATTTTTATATTACCA 

AGCAGAGCATTTTGATGAGGAGTGGGATAGTCTTATTCATCAGTTTATGA 

CCAATAGGCAAGAAATAAATAAGTCTGTTCAAGTACTTCACTTTGAGACA 

GATGTTTCAGCTTTTGTCCAGGCTAGTCCTTATGATACTGCTCATGATCT 

ATTGACCTATACACAAGTTTTCGGCCAAAGTGGTCTTCAAAAACTAGATA 

AACTATCGCCGTCTGAAAAAAACTTGGTGATAGAAGTGGCCTTGTTCAAT 

CTGGCCACTCGTTTTCAATTATTGGATTCCAATGGACACTACCAAACCAT 

ATCGCCGGATTCACTCTTACaAAAGAGTAGGGGAGCTAATTTGGTCAATG 

TGTATCGTGTGGCTAATAATTTAGCGGATCGTATTAGTCGAGATATTGAA 

CAGTTTCTCTTAACTTACGAGCCTGAGCTTGAAACTAGAGCTGATGAAAC 

TGTTCTAGAAAATGAAGAAACTGTTGATGAGCACAAAACAAGTGTTCATC 

AAGCAATATCTTTTCGAGAAGAGGGCTCTCTGGTTATTGCTAGTTTGGAT 

GTAGATTTGTCTCAACTAGATGTTCAAATAGGAAAAACCAGTCATCTGCC 

AGCTTATGAAGAGTTATCCTTACGACGTAAATTTGAGATTCTAACATATT 

TTGACCAAATTCGAAATGAACGTTCCAAAGTCCCAAGTTTTAGACGAGGT 
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GATTTTGAGACAGAGATGGAAATGACACCAGTCTTTGATGGCGAGGAATT 

ACTTACTTATCTCGAAGCTGATGGCAGTCCCTATGAGCTGAAACGAACGC 

TGACTACAGtcGAAGAAAAGGAATTAGAAAAAATTGGACAAGCCATTAGG 

ATAGAAAATCAAGAAAAATTGACTCAGCTAGGGATTGATTTATCTCAGTT 

TGACCCAGACCGAGTCGGTATTTTATTGGATGCAGCAGGTCGTTTTCGTT 

TAAAAAATGCAGACCTTGCTTTACTAGGTGGTTATCCCAAAGCCTCGGTA 

ACTCAACTAGCCCTTGCGACAGAACTACTCCAAATGGGACTAAGTCATGA 

AAAGGTTGAATTTTTCTTTGGTAGCCAGCTTTCCATTGAAGAGCTGCGAC 

AAGTTGCCTACGCCTTTTTACACCAAGAACTCAGCAGAGAAGATGCGGAG 

CAATTTGAAAAAGATAAAGGTAATCAGCCAGATTTAACTCTCAGAGATTG 

GAAAAGCAAGCTAGAGAAAGCTGAGGGAAAAGAAGTAGTTGATGAAGAAT 

TCGCGGAAAATCCACTGGTTCAGAGAGTATTGGACACTTATCCTCTGGGG 

TCATTGGTTTCCTATAAGGGACAGGACTTTGAGGTCATGTCGGTCAGCGA 

TGCTCGATTGAACGGTTTGATTCGGATTGAGTTAGTCAATGACTTTTCGg 

ATATCATTGAACAAAATCCAGTTCtTTAtGTGAGGACCTGGGAAGAAGTC 

AGTCAGGCACTTCATCAGCCAAAGGCAGAACCACAAACAGAGTTAGAAGA 

AGCGGACCAAGAATTAAACCTATTCTCATTTCTGGAAGAGGAGCCAGTTC 

AGAGTATTGGACTATTGGAACCAGaTGATTCAGAAAATGGTCATAACGAT 

ACTGATCTTGAAGAAACAGATAATCAAATTCCTGAAGAGGAAGTCGTCGA 

AACAATTCCAGAGATTCCAGTAACGGACTTTTATTTTCCAGAAGATTTGA 

CGGACTTTTATCCTAAGACTGCTAGAGATAAGGTTGAGACAAACATTGTG 

GCCATTCGTTTGGTAAAAAATCTAGAAGTAGAGCACCGGAATGCTTGACC 

AAGTGAACAAGAACTCCTTGCCAAGTATGTAGGC*TGGGGTGGACTAGCCA 

ATGAATTTTTTGATGACTATAATCCAAAATTTTCTAAGGaACGAGAAGAA 

CTGAAGAGCCTAGTCACAGATAAAGAGTATTCGGATATGAAACAGTCCTC 

CCTGACAGCCTATTACACAGACCCATCCCTGATCCGTCAGATGTGGGATA 

AGTTGGAAAGAGATGGCTTTACAGGTGGCAAAATCCTAGATCCTTCCATG 

GGAACAGGGAATTTCTTTGCGGCTATGCCAAAACACTTAAGAGAAAAGAG 

TGAGTTGTATGGCGTAGAGTTAGATACTATTACAGGAGCTATTGCCAAAC 

ACCTT C AT CCCAAT AGT CAT ATTG AAATT AAGGGATTTGAGACGGT G GCT 

TTTAACGACAATAGTTTTGATTTGGTGATTTCAAATGTGCCCTTTGCCAA 

TATACGAATTGCGGATAATAGGTACGATAGGCCTTACATGATTCATGACT 

ACTTTGTCAAAAAGTCACTTGATTTGCTTCATGATGGTGGACAAGTAGCG 

ATTATCTCTTCCACAGGAACTATGGATAAGCGAACAGAAAACATCTTACA 

AGATATTCGTGAGACAACTGAATTTCTTGGTGGGGTTCGACTGCCTGACT 

CTGCCTTTAAGGCCATTGCAGGAACGAGTGTCACAACGGATATGTTATTC 

TTCCAGAAACACTTAGACAAGGGATATGTGGCAGACGATTTAGCCTTTTC 

AGGTTCCATTCGCTATGACAAGGATAGTCGCATTTGGCTCAATCCTTATT 

TTGATGGAGAATACAATAGCCAGGTGCTAGGAACCTACGAGGTCAGGAAT 

TTTAACGGAGGAACACTTT CTGTTAAGGGGACTAGTGAT GACTTGATTGC 

AAGTGTTGAAACAGCTCTAAATCACGTTAAGGCCCCAAGAGAGATTGATA 

GAAATGAGGTCATCATTAACCCAGATGTGTTGACCAAACAAGTCAATGAT 

ACCTCCATTCCAGCTGAAATGAGGGAAAATCTAGGTCAGTACAGTTTTGG 

TTATCAGGGGTCTACAGTTTACTATCGAGATAACAAAGGCATTCGAGTCG 

GAACCAAGACGGAAGAAATCAGTTACTATGTCGATGAAGAG 



SEQ ID. NO. 7004 
STRAIN H36B frame: 1 

GGKMNQEVLLQMMRAT I PRDRALLE AFLY YQAEH FDEEWD S L IHQFMTNRQE INKS VQVL ■ 

HFETDVSAFVQASPYDTAHDLLTYTQVFGQSGLQKLDKLSPSEKNLVIEVALFNLATRFQ 

LLDSNGHYQTISPDSLLQKSRGANLVNVYRVANNLADRISRDIEQFLLTYEPELETRADE 

TVLENEETVDEHBCTSVHQAISFREEGSLVIASLDVDLSQLDVQIGKTSHLPAYEELSLRR 

KFEILTYFDQIRNERSKVPSFRRGDFDTEMEMTPVFDGEELLTYLEADGSPYELKRTLTT 

VEEKELEKIGQAIRIENQEKLTQLXIXLSQFDPDRVGILLXAAGRXRLXNADLASLGGYP 

KASVTQLALATELLQMGLSHEBCVEFFFGSQLSIEELRQVAYAFLHQELSREDAEQFEKDK 

GNQPDLTLRDWKSKLEKAEGKEWDEEFAENPLVQRVLDTYPLGSLVSYKGQDFEVMSVS 

DARLNGLIRIELVNDFSDIIEQNPVLYVRTWEEVSQALHQPKAEPQTELEEADQELNLFS 

FLEEELVQSIGLLEPDDSENGHNDTDLEETDNQIPEEEWETIPEIPVTDFYFPEDLTDF 

YPKTARDKVETNIVAIRLVKNLEVEHRNASPSEQELLAKYVGWGGLANEFFDDYNPKFSK 

EREELKSLVTDKEYSDMKQSSLTAYYTDPSLIRQMWDKLERDGFTGGKILDPSMGTGNFF 

AAMPKHLREKSELYGVELDTITGAIAKHLHPNSHIEIKGFETVAFNDNSFDLVISNVPFA 

NIRIADNRYDRPYMIHDYFVKKSLDLLHDGGQVAIISSTGTMDKRTENILQDIRETTEFL 

GGVRLPDSAFKAIAGTSVTTDMLFFQKHLDKGYVADDLAFSGSIRYDKDSRIWLNPYFDG 

EYNSQVLGTYEVRNFNGGTLSVKGTSDDLIASVETALNHVJCAPREIDRNEVIINPDVLTK 
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QVNDT SI PAEMRENLGQYS FGYQGSTVYYRDNKGIRVGTKTEE IS YYVDEE 

SBQ ID. NO. 7005 

STRAIN 18RS21 frame: 1 

XGKMNQE VLLQMMRAT I PRDRALLEAFLYYQAEH FDEEW DS LIHQFMTNRQE INKS VQVL 
HFETDVSAFVQASPYDTAHDLLTYTQVFGQSGLQKLDKLSPSEKNLVIEVALFNLATRFQ 
LLDSNGHYQTISPDSLLQKSRGANLVNVYRVANNLADRISRDIEQFLLTYEPELETRADE 
TVLENEETVDEHKTSVHQAISFREEGSLVIASLDVDLSQLDVQIGKTSHLPAYEELSLRR 
KFEILTYFDQIRNERSKVPSFRRGDFDTEMEMTPVFDGEELLTYLEADGSPYELKRTLTT 
VEEKELEKIGQAIRIENQEKLTQLGIDLSQFDPDRVGILLDAAGRFRLKNADLALLGGYP 
KASVTQLALATELLQMGLSHEKVEFFFGSQLSIEELRQVAYAFLHQELSREDAEQFEKDK 
GNQPDLTLRDWKSKLEKAEGKEWDEEFAENPLVQRVLDTYPLGSLVSYKGQDFEVMSVS 
DARLNGLIRIELVNDFSDIIEQNPVLYVRTWEEVSQALHQPKAEPQTELEEADQELNLFS 
FLEEEPVQSIGLLEPDDSENGHNDTDLEETDNQIPEEEWETIPEIPVTDFYFPEDLTDF 
YPKTARDKVETN I VAIRLVKNLEVEHRNAS P SEQELLAKYVGWGGLANE FFDD YN PKFSK 
EREELKSLVTDKEYSDMKQSSLTAYYTDPSLIRQMWDKLERDGFTGGKILDPSMGTGNFF 
AAMPKHLREKSELYGVELDTITGAIAKHLHPNSHIEIKGFETVAFNDNSFDLVISNVPFA 
NIRIADNRYDRPYMIHDYFVKKSLDLLHDGGQVAIISSTGTMDKRTENILQDIRETTEFL 
GGVRLPDSAFKAIAGTSVTTDMLFFQKHLDKGYVADDLAFSGSIRYDKDSRIWLNPYFDG 
EYNS QVLGT YEVRNFNGGTLS VKGT S DDL I AS VETALNHVKAPRE I DRNEVI IN P DVLTK 
QVNDT S I PAEMRENLGQYS FGYQGSTVYYRDNKGIRVGTKTEE 1 3 YYVDEE 

SEQ ID. NO. 7006 

STRAIN 2603 frame: 1 

GGKMNQEVLLQMMRAT I PRDRALLEAFLYYQAEHFDEEWDSLI HQFMTNRQE INKS VQVL 
HFETDVSAFVQASPYDTAHDLLTYTQVFGQSGLQKLDKLSPSEKNLVIEVALFNLATRFQ 
LLDSNGHYQTISPDSLLQKSRGANLVNVYRVANNLADRISRDIEQFLLTYEPELETRADE 
TVLENEETVDEHBCTSVHQAISFREEGSLVIASLDVDLSQLDVQIGKTSHLPAYEELSLRR 
KFEILTYFDQIRNERSKVPSFRRGDFDTEMEMTPVFDGEELLTYLEADGSPYELKRTLTT 
VEEKELEKIGQAIRIENQEKLTQLGIDLSQFDPDRVGILLDAAGRFRLKNADLALLGGYP 
KASVTQLALATELLQMGLSHEKVEFFFGSQLSIEELRQVAYAFLYQELSREDAEQFEKDK 
GNQPDLTLRDWKSKLEKAEGKEWDEEFAENPLVQRVLDTYPLGSLVSYKGQDFEVMSVS 
DARLNGLIRIELVNDFSDIIEQNPVLYVRTWEEVSQALHQPKAEPQTELEEADQELNLFS 
FLEEEPVQSIGLLEPDDSENGHNDTDLEETDNQIPEEEWETIPEIPVTDFYFPEDLTDF 
YPKTARDKVETN IVAIRLVKNLEVEHRNAS PS EQELLAKYVGWGGLANE FFDD YN PKFSK 
EREELKSLVTDKEYSDMKQSSLTAYYTDPSLIRQMWDKLERDGFTGGKILDPSMGTGNFF 
AAMPKHLREKSELYGVELDTITGAIAKHLHPNSHIEIKGFETVAFNDNSFDLVISNVPFA 
NIRIADNRYDRPYMIHDYFVKKSLDLLHDGGQVAIISSTGTMDKRTENILQDIRETTEFL 
GGVRLPDSAFKAIAGTSVTTDMLFFQKHLDKGYVADDLAFSGSIRYDKDSRIWLNPYFDG 
EYNSQVLGTYEVRNFNGGTLSVKGTSDDLIASVETALNHVKAPREI DRNEVI INPDVLTK 
QVNDT S I PAEMRENLGQYS FGYQGSTVYYRDNKGIRVGTKTEE I S YYVDEE 

SEQ ID NO. 7101 
STRAIN 2603 

ATGAAAAAGAAAATTATTTTGAAAAGTAGTGTTCTTGGTTTAGTCGCTGGGACTTCTATT 
ATGTTCTCAAGCGTGTTCGCGGACCAAGTCGGTGTCCAAGTTATAGGCGTCAATGACTTT 
CATGGTGCACTTGACAATACTGGAACAGCAAATATGCCTGATGGAAAAGTTGCTAATGCT 
GGTACTGCTGCTCAATTAGATGCTTATATGGATGACGCTCAAAAAGATTTCAAACAAACT 
AACCCTAATGGTGAAAGCATTAGGGTTCAAGCAGGCGATATGGTTGGAGCAAGTCCAGCC 
AACTCTGGGCTTCTTCAAGATGAACCAACTGTCAAAAATTTTAATGCAATGAATGTTGAG 
TATGGCACATTGGGTAACCATGAATTTGATGAAGGGTTGGCAGAATATAATCGTATCGTT 
ACTGGTAAAGCCCCTGCTCCAGATTCTAATATTAATAATATTACGAAATCATACCCACAT 
GAAGCTGCAAAACAAGAAATTGTAGTGGCAAATGTTATTGATAAAGTTAACAAACAAATT 
CCTTACAATTGGAAGCCTTACGCTATTAAAAATATTCCTGTAAATAACAAAAGTGTGAAC 
GTTGGCTTTATCGGGATTGTCACCAAAGACATCCCAAACCTTGTCTTACGTAAAAATTAT 
GAACAATATGAATTTTTAGATGAAGCTGAAACAATCGTTAAATACGCCAAAGAATTACAA 
GCTAAAAATGTCAAAGCTATTGTAGTTCTCGCACATGTACCTGCAACAAGTAAAAATGAT 
ATTGCTGAAGGTGAAGCAGCAGAAATGATGAAAAAAGTCAATCAACTCTTCCCTGAAAAT 
AGCGTAGATATTGTCTTTGCTGGACACAATCATCAATATACAAATGGTCTTGTTGGTAAA 
ACTCGTATTGTACAAGCGCTCTCTCAAGGAAAAGCCTATGCTGATGTACGTGGTGTCTTA 
GATACTGATACACAAGATTTCATTGAGACCCCTTCAGCTAAAGTAATTGCAGTTGCTCCT 
GGTAAAAAAACAGGTAGTGCCGATATTCAAGCCATTGTTGACCAAGCTAATACTATCGTT 
AAACAAGTAACAGAAGCTAAAATTGGTACTGCCGAGGTAAGTGTCATGATTACGCGTTCT 
GTTGATCAAGATAATGTTAGTCCGGTAGGCAGCCTCATCACAGAGGCTCAACTAGCAATT 
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GCTCGAAAAAGCTGGCCAGATATCGATTTTGCCATGACAAATAATGGTGGCATTCGTGCT 
GACTTACTCATCAAACCAGATGGAACAATCACCTGGGGAGCTGCACAAGCAGTTCAACCT 
TTTGGTAATATCTTACAAGTCGTCGAAATTACTGGTAGAGATCTTTATAAAGCACTCAAC 
GAACAATACGACCAAAAACAAAATTTCTTCCTTCAAATAGCTGGTCTGCGATACACTTAC 
ACAGATAATAAAGAGGGCGGGGAAGAAACACCATTTAAAGTTGTAAAAGCTTATAAATCA 
AATGGTGAGGAAATCAATCCTGATGCAAAATACAAATTAGTTATCAATGACTTTTTATTC 
GGTGGTGGTGATGGCTTTGCAAGCTTCAGAAATGCCAAACTTCTAGGAGCCATTAACCCC 
GATACAGAGGTATTTATGGCCTATATCACTGATTTAGAAAAAGCTGGTAAAAAAGTGAGC 
GTTCCAAATAATAAACCTAAAATCTATGTCACTATGAAGATGGTTAATGAAACTATTACA 
CAAAATGATGGTACACATAGCATTATTAAGAAACTTTATTTAGATCGACAAGGAAATATT 
GTAGCACAAGAGATTGTATCAGACACTTTAAACCAAACAAAATCAAAATCTACAAAAATC 
AACCCTGTAACTACAATTCACAAAAAACAATTACACCAATTTACAGCTATTAACCCTATG 
AGAAATTATGGCAAACCATCAAACTCCACTACTGTAAAATCAAAACAATTACCAAAAACA 
AACTCTGAATATGGACAATCATTCCTTATGTCTGTCTTTGGTGTTGGACTTATAGGAATT 
GCTTTAAATACAAAGAAAAAACATATGAAA 



SEQ XD NO. 7102 

STRAIN 090 

AAGTCGGTGT CCAAGTTATAGGCGT CAATGACTTT CATGGTGCACTTGAC 

AATACTGGAACAGCAAATATGCCTGACGGAAAAGTTACTAATGCTGGCAC 

TGCTGCTCAATTAGATGCTTATATGGATGATGCTCAAAAAGATTTCAAAC 

AAACTAACCCTAATGGTGAAAGCATTAGAGTTCAAGCTGGTGATATGGTT 

GGAGCAAGTCCAGCTAACTCAGGGCTTCTTCAAGATGAACCAACCGTTAA 

AACATTTAATGCAATGAATGTTGAGTATGGCACATTAGGTAACCATGAAT 

TTGATGAAGGTTTGGCAGAATACAATCGTATCGTTACTGGAAAGGCCCCT 

GCT CCAGATTCTAATATAAATAATATTACGAAAT CATACCCAC ACGAAGC 

TGCAAAACAAGAAATTGTAGTGGCAAACGTTATTGATAAAGTTAACAAAC 

AAATCCCTTACAATTGGAAACCTTACGCTATTAAAAATATTCCTGTAAAT 

AACAAAAGTGTGAACGTTGGCTTTATCGGAATCGTTACCAAAGACATCCC 

AAACCTTGTCTTACGTAAAAATTATGAACAATATGAATTTTTAGATGAAG 

CTGAAACAATCGTTAAATACGCCAAAGAATTACAAGCTAAAAATGTCAAG 

GCTATTGTAGTCCTTGCTCATGTACCTGCAACAAGCAAGGATGATATTGC 

TGAAGGTGAAGCAGCAGAAATGATGAAAAAAGTCAATCAACTCTTCCCTG 

AAAATAGCGTAGATATTGTCTTTGCTGGACACAATCATCAATATACAAAT 

GGTCTTGTTGGTAAAACTCGCATTGTACAAGCGCTCTCTCAAGGAAAAGC 

CTATGCTGACGTACGTGGTGTCCTAGATACTGATACACAAGATTTCATTG 

AAACCCCTTCAGCTAAAGTAGTTGCAGTTGCTCCTGGTAAAAAAACAGGT 

AGTGCCGATATTCAAGCCATTGTTGACCAAGCTAATACTATCGTTAAACA 

AGTAACAGAAGCTAAAATTGGTACTGCCGAGGTAAGTGGCATGATTACGC 

GTTCTGTTGAT CAAGATAATGTTAGT CCAGTAGGCAGCCTCATCACAGAG 

GCTCAACTAGCAATTGCTCGAAAAAGCTGGCCAGATATCGATTTTGCCAT 

GACAAATAATGGTGGCATTCGTGCTGACTTACTCATCAAACCAGATGGAA 

CAATCACCTGGGGAGCTGCACAAGCAGTTCAACCTTTTGGTAATATCTTA 

CAAGTCGTCGAAATTACTGGTAGAGATCTTTATAAAGCACTCAACGAACA 

ATACGACCAAAAACAAAATTT CTTCCTT CAAATAGCTGGTCTGCGATACA 

CTTACACAGATAATAAAGAGGGCGGAGAAGAAACACCATTTAAAGTTGTA 

AAAGCTTATAAATCAAATGGTGAAGAAATCAATCCTGATGCAAAATACAA 

ATTAGTTATCAATGACTTTTTATTCGGTGGTGGTGATGGCTTTGCAAGCT 

TCAGAAATGCCAAACTTCTAGGAGCCATTAATCCCGATACAGAGGTATTT 

ATGGCCTATATCACTGATTTAGAAAAAGCTGGTAAAAAAGTGAGCGTTCC 

AAATAATAAACCTAAAATCTATGTCACTATGAAGATGGTTAATGAAACTA 

TTACACAAAATGATGGTACACATAGCATTATTAAGAAACTTTATTTAGAT 

CGACAAGGAAATATTGTAGCACAAGAGATTGTATCAGACACTTTAAACCA 

AACAAAATCAAAATCTACAAAAATCAACCCTGTAACTACAATTCACAAAA 

AACAATTACACCAATTTACAGCTATTAACCCTATGAGAAATTATGGCAAA 

CCATCAAACTCCACTACTGTAAAATCAAAACAA 



SEQ ID NO. 7103 
STRAIN A909 

GCGTCAATGACTTTCATGGTGCaCTTGACAATACTGGAACAGCAAATATG 
CCTGACGGAAAAGTTACTAATGCTGGCACTGCTGCTCAATTAGATGCTTA 
TATGGATGATGCTCAAAAAGATTTCAAACAAACTAACCCTAATGGTGAAA 
GCATTAGAGTTCAAGCTGGTGATATGGTTGGAGCAAGTCCAGCTAACTCA 
GGGCTTCTTCAAGATGAACCAACCGTTAAAACATTTAATGCAATGAATGT 
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TGAGTATGGCACATTAGGTAACCATGAATTTGATGAAGGTTTGGCAGAAT 
ACAATCGTATCGTTACTGGAAAGGCCCCTGCTCCaGaTTCTAATATAAAT 
AATATTACGAAATCATACCCACACGAAGCTGCAAAACAAGAAATTGTAGT 
GGCAAACGTTATTGATAAAGTTAACAAACAAATCCCTTACAATTGGAAAC 
CTTACACTATTAAAAATATTCCTGTAAATAACAAAAGTGTGAACGTTGGC 
TTTATCGGAATCGTTACCAAAGACATCCCAAACCTTGTCTTACGTAAAAA 
TTATGAACAATATGAATTTTTAGATGAAGCTGAAACAATCGTTAAATACG 
CCAAAGAATTACAAGCTAAAAATGTCAAGGCTATTGTAGTCCTTGCTCAT 
GTACCTGCAACAAGCAAGGATGATATTGCTGAAGGTGAAGCAGCAGAAAT 
GATGAAAAAAGTCAATCAACTCTTCCCTGAAAATAGCGTAGATATTGTCT 
TTGCTGGACACAATCATCAATATACAAATGGTCTTGTTGGTAAAACTCGT 
ATTGTACAAGCGCTCTCTCAAGGAAAAGCCTATGCTGATGTACGTGGTGT 
CCTAGATACTGATACACAAGATTTCATTGAAACCCCTTCAGCTAAAGTAA 
TTGCAGTTGCTCCTGGTAAAAAAACAGGTAGTGCCGATATTCAAGCCATT 
GTTGACCAAGCTAATACTATCGTTAAACAAGTAACAGAAGCTAAAATTGG 
TACTGCCGAGGTAAGTGGCATGATTACGCGTTCTGTTGATCAAGATAATG 
TTAGT CCGGTAGGCAGCCTCATCAGAGAGGCTCAACTAGCAATTGCT CGA 
AAAAGCTGGCCAGATATCGATTTTGCCATGACAAATAATGGTGGCATTCG 
TGCTGACTTACTCATCAAACCAGATGGAACAATCACCTGGGGAGCTGCAC 
AAGCAGTTCAACCTTTTGGTAATATCTTACAAGTCGTCGAAATTACTGGT 
AGAGATCTTTATAAAGCACTCAACGAACAATACGACCAAAAACAAAATTT 
CTTCCTTCAAATAGCT(MTCTGCGATACACTTAGAC|IGATAATAAAGAGG 
GCGGGGAAGAAACACCATTTAAAGTTGTAAAAGCTTATAAATCAAATGGT 
GAGGAAATCAATCCTGATGCAAAATACAAATTAGTTATCAATGACTTTTT 
ATTCGGTGGTGGTGATGGCTTTGCAAGCTTCAGAAATGCCAAACTTCTAG 
GAGCCATTAATCCCGATACAGAGGTATTTATGGCCTATATCACTGATTTA 
GAAAAAGCTGGTAAAAAAGTGAGCGTTCCAAATAATAAACCTAAAATCTA 
TGTCACTATGAAGATGGTTAATGAAACTATTACACAAAATGATGGTACAT 
ATAGCATTATTAAGAAACTTTATTTAGATCGACAAGGAAATATTGTAGCA 
CAAGAGATTGTATCAGACACTTTAAACCAAACAAAATCAAAATCTACAAA 
AATCAACCCTGTAACTACAATTCACAAAAAACAATTACACCAATTTACAG 
CTATTAACCCTATGAGAAATTATGGCAAACCATCAAACTCCACTACTGTA 
AAATCAAAACAA 

SEQ ID NO. 7104 

STRAIN H36B 

CCAAGTCGGTGTCCAAGTTATAGGCGTCAATGACTTTCATGGTGCACTTG 

ACAATACTGGAACAGCAAATATGCCTGACGGAAAAGTTACTAATGCTGGC 

ACTGCTGCTCAATTAGATGCTTATATGGATGATGCTCAAAAAGATTTCAA 

ACAAACTAACCCTAATGGTGAAAGCATTAGAGTTCAAGCTGGTGATATGG 

TTGGAGCAAGTCCAGCTAACTCAGGGCTTCTTCAAGATGAACCAACCGTT 

AAAACATTTAATGCAATGAATGTTGAGTATGGCACATTAGGTAACCATGA 

ATTTGATGAAGGTTTGGCAGAATACAATCGTATCGTTACTGGAAAGGCCC 

CTGCTCCAGATTCTAATATAAATAATATTACGAAATCATACCCACACGAA 

GCTGCAAAACAAGAAATTGTAGTGGCAAACGTTATTGATAAAGTTAACAA 

ACAAATCCCTTACAATTGGAAACCTTACACTATTAAAAATATTCCTGTAA 

ATAACAAAAGTGTGAACGTTGGCTTTATCGGAATCGTTACCAAAGACATC 

CCAAACCTTGTCTTACGTAAAAATTATGAACAATATGAATTTTTAGATGA 

AGCTGAAACAATCGTTAAATACGCCAAAGAATTACAAGCTAAAAATGTCA 

AGGCTATTGTAGTCCTTGCITCATGTACCTGCAACAAGCAAGGATGATATT 

GCTGAAGGTGAAGCAGCAGAAATGATGAAAAAAGTCAATCAACTCTTCCC 

TGAAAATAGCGTAGATATTGTCTTTGCTGGACACAATCATCAATATACAA 

ATGGTCTTGTTGGTAAAACTCGTATTGTACAAGCGCTCTCTCAAGGAAAA 

GCCTATGCTGATGTACGTGGTGTCCTAGATACTGATACACAAGATTTCAT 

TGAAACCCCTTCAGCTAAAGTAATTGCAGTTGCTCCTGGTAAAAAAACAG 

GTAGTGCCGATATTCAAGCCATTGTTGACCAAGCTAATACTATCGTTAAA 

CAAGTAACAGAAGCTAAAATTGGTACTGCCGAGGTAAGTGGCATGATTAC 

GCGTTCTGTTGATCAAGATAATGTTAGTCCGGTAGGCAGCCTCATCACAG 

AGGCTCAACTAGCAATTGCTCGAAAAAGCTGGCCAGATATCGATTTTGCC 

ATGACA71ATAATGGTGGCATTCGTGCTGACTTACTCATCAAACCAGATGG 

AACAATCACCTGGGGAGCTGCACAAGCAGTTCAACCTTTTGGTAATATCT 

TACAAGTCGTCGAAATTACTGGTAGAGATCTTTATAAAGCACTCAACGAA 

CAATACGACCAAAAACAA7VATTTCTTCCTTCAAATAGCTGGTCTGCGATA 

CACTTACACAGATAATAAAGAGGGCGGGGAAGAAACACCATTTAAAGTTG 
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TAAAAGCTTATAAATCAAATGGTGAGGAAATCAATCCTGATGCAAAATAC 
AAATTAGTTATCAATGACTTTTTATTCGGTGGTGGTGATGGCTTTGCAAG 
CTTCAGAAATGCCAAACTTCTAGGAGCCATTAATCCCGATACAGAGGTAT 
TTATGGCCTATATCACTGATTTAGAAAAAGCTGGTAAAAAAGTGAGCGTT 
CCAAATAATAAACCTAAAATCTATGTCACTATGAAGATGGTTAATGAAAC 
TATTACACAAAATGATGGTACATATAGCATTATTAAGAAACTTTATTTAG 
ATCGACAAGGAAATATTGTAGCACAAGAGATTGTATCAGACACTTTAAAC 
CAAACAAAATCAAAATCTACAAAAATCAACCCTGTAACTACAATTCACAA 
AAAACAATTACACCAATTTACAGCTATTAACCCTATGAGAAATTATGGCA 
AACCATCAAACTCCACTACTGTAAAATCAAA 

SEQ ID NO. 7105 

STRAIN 18RS21 

GACCAAGTCGGTGTCCAAGTTATAGGCGTCAATGACTTTC 

ATGGTGCACTTGACAATACTGGAACAGCAAATATGCCTGACGGAAAAGTT 

AnTAATGCTGGCACTGCTGCTCAATTAGATGCTTATATGGATGATGCTCA 

AAAAGATTTCAAACAAACTAACCCTAATGGTGAAAGCATTAGAGTTCAAG 

CTGGTGATATGGTTGGAGCAAGTCCAGCTAACTCAGGGCTTCTTCAAGAT 

GAACCAACCGTTAAAACATTTAATGCAATGAATGTTGAGTATGGCACATT 

AGGTAACCATGAATTTGATGAAGGTTTGGCAGAATACAATCGTATCGTTA 

QTGGAAAGGCCCCTGCTCCAGATTCTAAi'ATAAATAATATTACGAAATCA 

TACCCACACGAAGCTGCAAAACAA<3AAATTGTAGTGGCAAACGTTATTGA 

TAAAGTTAACAAACAAATCCCTTACAATTGGAAACCTTACACTATTAAAA 

ATATTCCTGTAAATAACAAAAGTGTGAACGTTGGCTTTATCGGAATCGTT 

ACCAAAGACATCCCAAACCTTGTCTTACGTAAAAATTATGAACAATATGA 

ATTTTTAGATGAAGCTGAAACAATCGTTAAATACGCCAAAGAATTACAAG 

CTAAAAATGTCAAGGCTATTGTAGTCCTTGCTCATGTACCTGCAACAAGC 

AAGGATGATATTGCTGAAGGTGAAGCAGCAGAAATGATGAAAAAAGTCAA 

T C AACT CT T CCCT GAAAATAGCGT AG AT AT T GT GT TT GCT GG AC ACAAT C 

ATCAATATACAAATGGTCTTGTTGGTAAAACTCGTATTGTACAAGCGCTC 

TCT CAAGGAAAAGCCTATGCTGATGTACGTGGTGT CCTAGAT ACTGATAC 

ACAAGATTTCATTGAAACCCCTTCAGCTAAAGTAATTGCAGTTGCTCCTG 

GTAAAAAAACAGGTAGTGCCGATATTCAAGCCATTGTTGACCAAGCTAAT 

ACTATCGTTAAACAAGTAACAGAAGCTAAAATTGGTACTGCCGAGGTAAG 

TGGCATGATTACGCGTTCTGTTGATCAAGATAATGTTAGTCCGGTAGGCA 

GCCTCATCACAGAGGCTCAACTAGCAATTGCTCGAAAAAGCTGGCCAGAT 

ATCGATTTTGCCATGACAAATAATGGTGGCATTCGTGCTGACTTACTCAT 

CAAACCAGATGGAACAATCACCTGGGGAGCTGCACAAGCAGTTCAACCTT 

TTGGTAATATCTTACAAGTCGTCGAAATTACTGGTAGAGATCTTTATAAA 

GCACTCAACGAACAATACGACCAAAAACAAAATTTCTTCCTTCAAATAGC 

TGGTCTGCGATACACTTACACAGATAATAAAGAGGGCGGGGAAGAAACAC 

CATTTAAAGTTGTAAAAGCTTATAAATCAAATGGTGAGGAAATCAATCCT 

GATGCAAAATACAAATTAGTTATCAATGACTTTTTATTCGGTGGTGGTGA 

TGGCTTTGCAAGCTTCAGAAATGCCAAACTTCTAGGAGCCATTAATCCCG 

ATACAGAGGTATTTATGGCCTATATCACTGATTTAGAAAAAGCTGGTAAA 

AAAGTGAGCGTTCCAAATAATAAACCTAAAATCTATGTCACTATGAAGAT 

GGTTAATGAAACTATTACACAAAATGATGGTACATATAGCATTATTAAGA 

AACTTTATTTAGATCGACAAGGAAATATTGTAGCACAAGAGATTGTATCA 

GACACTTTAAACCAAACAAAATCAAAATCTACAAAAATCAACCCTGTAAC 

TACAATTCACAAAAAACAATTACACCAATTTACAGCTATTAACCCTATGA 

GAAATTATGGCAAACCATCAAACTCCACTACTGTAAAATCAAAA 

SEQ ID NO. 7106 

STRAIN M732 

ACCAAGTCGGTGTCCAAGTTATAGGCGTCAATGACTTTCATGGTGCACTT 
GACAATACTGGAACAGCAAATATGCCTGACGGAAAAGTTACTAATGCTGG 
CACTGCTGCTCAATTAGATGCTTATATGGATGATGCTCAAAAAGATTTCA 
AACAAACTAACCCTAATGGTGAAAGCATTAGAGTTCAAGCTGGTGATATG 
GTTGGAGCAAGTCCAGCTAACTCAGGGCTTCTTCAAGATGAACCAACCGT 
TAAAACATTTAATGCAATGAATGTTGAGTATGGCACATTAGGTAACCATG 
AATTTGATGAAGGTTTGGCAGAATACAATCGTATCGTTACTGGAAAGGCC 
CCTGCTCCAGATTCTAATATAAATAATATTACGAAATCATACCCACACGA 
AGCTGCAAAACAAGAAATTGTAGTGGCAAACGTTATTGATAAAGTTAACA 
AACAAATCCCTTACAATTGGAAACCTTACACTATTAAAAATATTCCTGTA 
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AATAACAAAAGTGTGAACGTTGGCTTTATCGGAATCGTTACCAAAGACAT 
CCCAAACCTTGTCTTACGTAAAAATTATGAACAATATGAATTTTTAGATG 
AAGCTGAAACAATCGTTAAATACGCCAAAGAATTACAAGCTAAAAATGTC 
AAGGCTATTGTAGTCCTTGCTCATGTACCTGCAACAAGCAAGGATGATAT 
TGCTGAAGGTGAAGCAGCAGAAATGATGAAAAAAGTCAATCAACTCTTCC 
CTGAAAATAGCGTAGATATTGTCTTTGCTGGACACAATCATCAATATACA 
AATGGTCTTGTTGGTAAAACTCGTATTGTACAAGCGCTCTCTCAAGGAAA 
AGCCTATGCTGATGTACGTGGTGTCCTAGATACTGATACACAAGATTTCA 
TTGAAACCCCTTCAGCTAAAGTAATTGCAGTTGCTCCTGGTAT^AAAAACA 
GGTAGTGCCGATATTCAAGCCATTGTTGACCAAGCTAATACTATCGTTAA 
ACAAGTAACAGAAGCTAAAATTGGTACTGCCGAGGTAAGTGGCATGATTA 
CGCGTTCTGTTGATCAAGATAATGTTAGTCCGGTAGGCAGCCTCATCACA 
GAGGCTCAACTAGCAATTGCTCGAAAAAGCTGGCCAGATATCGATTTTGC 
CATGACAAATAATGGTGGCATTCGTGCTGACTTACTCATCAAACCAGATG 
GAACAATCACCTGGGGAGCTGCACAAGCAGTTCAACCTTTTGGTAATATC 
TTACAAGTCGTCGAAATTACTGGTAGAGATCTTTATAAAGCACTCAACGA 
ACAATACGACCAAAAACAAAATTTCTTCCTTCAAATAGCTGGTCTGCGAT 
ACACTTACACAGATAATAAAGAGGGCGGGGAAGAAACACCATTTAAAGTT 
GTAAAAGCTTATAAATCAAATGGTGAGGAAATCAATCCTGATGCAAAATA 
CAAATTAGTTATCAATGACTTTTTATTCGGTGGTGGTGATGGCTTTGCAA 
GCTTCAGAAATGCCAAACTTCTAGGAGCCATTAATCCCGATACAGAGGTA 
TTTATGGCCTATATCACTGATTTAGAAAAAGCTGGTAAAAAAGTGAGCAT 
TCCAAATAATAAACCTAAAATCTATGTCACTATGAAGATGGTTAATGAAA 
CTATTACACAAAATGATGGTACATATAGCATTATTAAGAAACTTTATTTA 
GATCGACAAGGAAATATTGTAGCACAAGAGATTGTATCAGACACTTTAAA 
CCAAACAAAATCAAAATCTACAAAAATCAACCCTGTAACTACAATTCACA 
AAAAACAATTACACCAATTTACAGCTATTAACCCTATGAGAAATTATGGC 
AAACCATCAAACTCCACTACTGTAAAATCAAAACAA 

SEQ XD NO. 7107 

STRAIN COH1 

.ACCAAGTCGGTGTCCAAGTTATAGGCGTCAATGACTTTCATGGTGCACTT 
GACAATACTGGAACAGCAAATATGCCTGACGGAAAAGTTACTAATGCTGG 
CACTGCTGCTCAATTAGATGCTTATATGGATGATGCTCAAAAAGATTTCA 
AACAAACTAACCCTAATGGTGAAAGCATTAGAGTTCAAGCTGGTGATATG 
GTTGGAGCAAGTCCAGCTAACTCAGGGCTTCTTCAAGATGAACCAACCGT 
TAAAACATTTAATGCAATGAATGTTGAGTATGGCACATTAGGTAACCATG 
AATTTGATGAAGGTTTGGCAGAATACAATCGTATCGTTACTGGAAAGGCC 
CCTGCTCCAGATTCTAATATAAATAATATTACGAAATCATACCCACACGA 
AGCTGCAAAACAAGAAATTGTAGTGGCAAACGTTATTGATAAAGTTAACA 
AACAAATCCCTTACAATTGGAAACCTTACACTATTAAAAATATTCCTGTA 
AATAACAAAAGTGTGAACGTTGGCTTTATCGGAATCGTTACCAAAGACAT 
CCCAAACCTTGtCTTACGTAAAMTTATGAACAATATGAATTTTTAGATG 
AAGCTGAAACAATCGTTAAATACGCCAAAGAATTACAAGCTAAAAATGTC 
AAGGCTATTGTAGTCCTTGCTCATGTACCTGCAACAAGCAAGGATGATAT 
TGCTGAAGGTGAAGCAGCAGAAATGATGAAAAAAGTCAATCAACTCTTCC 
CTGAAAATAGCGTAGATATTGTCTTTGCTGGACACAATCATCAATATACA 
AATGGTCTTGTTGGTAAAACTCGTATTGTACAAGCGCTCTCTCAAGGAAA 
AGCCTATGCTGATGTACGTGGTGTCCTAGATACTGATACACAAGATTTCA 
TTGT^AACCCCTTCAGCTAAAGTAATTGCAGTTGCTCCTGGTAAAAAAACA 
GGTAGTGCCGATATTCAAGCCATTGtTGACCAAGCTAATACTATCGTTAA 
ACAAGTAACAGAAGCTAAAATTGGTACTGCCGAGGTAAGTGGCATGATTA 
CGCGTTCTGTTGATCAAGATAATGTTAGTCCGGTAGGCAGCCTCATCACA 
GAGGCTCAACTAGCAATTGCTCGAAAAAGCTGGCCAGATATCGATTTTGC 
CATGACAAATAATGGTGGCATTCGTGCTGACTTACTCATCAAACCAGATG 
GAACAATCACCTGGGGAGCTGCACAAGCAGTTCAACCTTTTGGTAATATC 
TTACAAGTCGTCGAAATTACTGGTAGAGATCTTTATAAAGCACTCAACGA 
ACAATACGACCAAAAACAAAATTTCTTCCTTCAAATAGCTGGTCTGCGAT 
ACACTTACACAGATAATAAAGAGGGCGGGGAAGAAACACCATTTAAAGTT 
GTAAAAGCTTATAAATCAAATGGTGAGGAAATCAATCCTGATGCAAAATA 
CAAATTAGTTATCAATGACTTTTTATTCGGTGGTGGTGATGGCTTTGCAA 
GCTTCAGAAATGCCAAACTTCTAGGAGCCATTAATCCCGATACAGAGGTA 
TTTATGGCCTATATCACTGATTTAGAAAAAGCTGGTAAAAAAGTGAGCAT 
TCCAAATAATAAACCTAAAATCTATGTCACTATGAAGATGGTTAATGAAA 
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CTATTACACAAAATGATGGTACATATAGCATTATTAAGAAACTTTATTTA 
GATCGACAAGGAAATATTGTAGCACAAGAGATTGTATCAGACACTTTAAA 
CCAAACAAAATCAAAATCTACAAAAATCAACCCTGTAACTACAATTCACA 
AAAAACAATTACACCAATTTACAGCTATTAACCCTATGAGAAATTATGGC 
AAACCATCAAACTCCACTACTGTAAAATCAAA 

SEQ XD NO. 7108 

STRAIN M781 

CAAGTCGGTGTCCAAGTTATAGGCGTCAATGACTTTCATGGTGCACTTGA 
CAATACTGGAACAGCAAATATGCCTGACGGAAAAGTTACTAATGCTGGCA 
CTGCTGCTCAATTAGATGCTTATATGGATGATGCTCAAAAAGATTTCAAA 
CAAACTAACCCTAATGGTGAAAGCATTAGAGTTCAAGCTGGTGATATGGT 
TGGAGCAAGTCCAGCTAACTCAGGGCTTCTTCAAGATGAACCAACCGTTA 
AAACATTTAATGCAATGAATGTTGAGTATGGCACATTAGGTAACCATGAA 
TTTGATGAAGGTTTGGCAGAATACAATCGTATCGTTACTGGAAAGGCCCC 
TGCTCCAGATTCTAATATAAATAATATTACGAAATCATACCCACACGAAG 
CTGCAAAACAAGAAATTGTAGTGGCAAACGTTATTGATAAAGTTAACAAA 
CAAATCCCTTACAATTGGAAACCTTACACTATTAAAAATATTCCTGTAAA 
TAACAAAAGTGTGAACGTTGGCTTTATCGGAATCGTTACCAAAGACATCC 
CAAACCTTGTCTTACGTAAAAATTATGAACAATATGAATTTTTAGATGAA 
GCTGAAACAATCGTTAAATACGCCAAAGAATTACAAGCTAAAAATGTCAA 
GGCTATTGTACTCCTTGCTCATGTACCTGCAACAAGCAAGGATGATATTG 
CTGAAGGTGAAGCAGCAGAAATGATGAAAAAAGTCAAtCAACTCTTCCCT 
GAAAATAGCGTAGATATTGTCTTTGCTGGACACAATCATCAATATACAAA 
TGGTCTTGTTGGTAAAACTCGTATTGTACAAGCGCTCTCTCAAGGAAAAG 
CCTATGCTGATGTACGTGGTGTCCTAGATACTGATACACAAGATTTCATT 
GAAACCCCTTCAGCTAAAGTAATTGCAGTTGCTCCTGGTAAAAAAACAGG 
TAGTGCCGATATTCAAGCCATTGtTGACCAAGCTAATACTATCGTTAAAC 
AAGTAACAGAAGCTAAAATTGGTACTGCCGAGGTAAGTGGCATGATTACG 
CGTTCTGTTGATCAAGATAATGTTAGTCCGGTAGGCAGCCTCATCACAGA 
GGCTCAACTAGCAATTGCTCGAAAAAGCTGGCCAGATATCGATTTTGCCA 
TGACAAATAATGGTGGCATTCGTGCTGAGTTACTCATCAAACCAGATGGA 
ACAATCACCTGGGGAGCTGCACAAGCAGTTCAACCTTTTGGTAATATCTT 
ACAAGTCGTCGAAATTACTGGTAGAGATCTTTATAAAGCACTCAACGAAC 
AATACGACCAAAAACAAAATTTCTTCCTTCAAATAGCTGGTCTGCGATAC 
ACTTACACAGATAATAAAGAGGGCGGGGAAGAAACACCATTTAAAGTTGT 
AAAAGCTTATAAATCAAATGGTGAGGAAATCAATCCTGATGCAAAATACA 
AATTAGTTATCAATGACTTTTTATTCGGTGGTGGTGATGGCTTTGCAAGC 
TTCAGAAATGCCAAACTTCTAGGAGCCATTAATCCCGATACAGAgGTATT 
TATGGCCTATATCACTGATTTAGAAAAAGCTGGTAAAAAAGTGAGCATTC 
CAAATAATAAACCTAAAATCTATGTCACTATGAAGATGGTTAATGAAACT 
ATTACACAAAATGATGGTACATATAGCATTATTAAGAAACTTTATTTAGA 
TCGACAAGGAAATATTGTAGCA'CAAGAGATTGTATCAGACACTTTAAACC 
AAACAAAATCAAAATCTACAAAAATCAACCCTGTAACTACAATTCACAAA 
AAACAATTACACCAATTTACAGCTATTAACCCTATGAGAAATTATGGCAA 
ACCATCAAACTCCACTACTGTAAAATCAAA 

SEQ ZD NO. 7109 
STRAIN CJB110 

GACCAAGTCGGTGTCCAAGTTATAGGCGTCAATGACTTTCATGGTGC 

ACTTGACAATACTGGAACAGCAAATATGCCTGACGGAAAAGTTACTAATG 

CTGGCACTGCTGCTCAATTAGATGCTTATATGGATGATGCTCAAAAAGAT 

TT CAAACAAACTAACCCTAATGGTGAAAGCATT AGAGTT CAAGCTGGTGA 

TATGGTTGGAGCAAGTCCAGCTAACTCAGGGCTTCTTCAAGATGAACCAA 

CCGTTAAAACATTTAATGCAATGAATGTTGAGTATGGCACATTAGGTAAC 

CATGAATTTGATGAAGGTTTGGCAGAATACAATCGTATCGTTACTGGAAA 

GGCCCCTGCTCCAGATTcTAATATAAATAATATTACGAAATCATACCCAC 

ACGAAGCTGCAAAACAAGAAATTGTAGTGGCAAACGTTATTGATAAAGTT 

AACAAACAAATCCCTTACAATTGGAAACCTTACGCTATTAAAAATATTCC 

TGTAAATAACAAAAGTGTGAACGTTGGCTTTATCGGAATCGTTACCAAAG 

ACATCCCAAACCTTGTCTTACGTAAAAATTATGAACAATATGAATTTTTA 

GATGAAGCTGAT^ACAATCGTTAAATACGCCAAAGAATTACAAGCTAAAAA 

TGTCAAGGCTATTGTAGTCCTTGCTCATGTACCTGCAACAAGCAAGGATG 

ATATTGCTGAAGGTGAAGCAGCAGAAATGATGAAAAAAGTCAATCAACTC 



301 



WO 2004/018646 



PCT7US2003/026827 



SEQUENCE LISTING 



TTCCCTGAAAATAGCGTAGATATTGTCTTTGCTGGACACAATCATCAATA 

TACAAATGGTCTTGTTGGTAAAACTCGCATTGTACAAGCGCTCTCTCAAG 

GAAAAGCCTATGCTGACGTACGTGGTGTCCTAGATACTGATACACAAGAT 

TTCATTGAAACCCCTTCAGCTAAAGTAGTTGCAGTTGCTCCTGGTAAAAA 

AACAGGTAGTGCCGATATTCAAGCCATTGTTGACCAAGCTAATACTATCG 

TTAAACAAGTAACAGAAGCTAAAATTGGTACTGCCGAGGTAAGTGGCATG 

ATTACGCGTTCTGTTGATCAAGATAATGTTAGTCCAGTAGGCAGCCTCAT 

CACAGAGGCTCAACTAGCAATTGCTCGAAAAAGCTGGCCAGATATCGATT 

TTGCCATGACAAATAATGGTGGCATTCGTGCTGACTTACTCATCAAACCA 

GATGGAACAATCACCTGGGGAGCTGCACAAGCAGTTCAACCTTTTGGTAA 

TATCTTACAAGTCGTCGAAATTACTGGTAGAGATCTTTATAAAGCACTCA 

ACGAACAATACGACCAAAAACAAAATTTCTTCCTTCAAATAGCTGGTCTG 

CGATACACTTACACAGATAATAAAGAGGGCGGAGAAGAAACACCATTTAA 

AGTTGTAAAAGCTTATAAATCAAATGGTGAAGAAATCAATCCTGATGCAA 

AATACAAATTAGTTATCAATGACTTTTTATTCGGTGGTGGTGATGGCTTT 

GCAAGCTTCAGAAATGCCAAACTTCTAGGAGCCATTAATCCCGATACAGA 

GGTATTTATGGCCTATATCACTGATTTAGAAAAAGCTGGTAAAAAAGTGA 

GCGTTCCAAATAATAAACCTAAAATCTATGTCACTATGAAGATGGTTAAT 

GAAACTATTACACAAAATGATGGTACACATAGCATTATTAAGAAACTTTA 

TTTAGATCGACAAGGAAATATTGTAGCACAAGAGATTGTATCAGACACTT 

TAAACCAAACAAAATCAAAATCTACAAAAATCAACGCTGTAACTACAATT-. 

CACAAAAAACAATTACACCAATT'WVCAGCTATTAACCCTATGAGAAATTA - ' 

TGGCAAACCATCAAACTCCACTACTGTAAAATCA 

SEQ ID NO. 7110 

STRAIN 1169NT 

CAAGTCGGTGTCCAAGTTATAGGCGTCAATGACTTTCATGGTGCACTTGA 
CAATACTGGAACAGCAAATATGCCTGATGGAAAAGTTGCTAATGCTGGTA 
CTGCTGCTCAATTAGATGCTTATATGGATGACGCTCAAAAAGATTTCAAA 
CAAACTAACCCTAATGGTGAAAGCATTAGGGTTCAAGCAGGCGATATGGT 
TGGAGCAAGTCCAGCCAACTCTGGGCTTCTTCAAGATGAACCAACTGTCA 
AAAATTTTAATGCAATGAATGTTGAGTATGGCACATTGGGTAACCATGAA 
TTTGATGAAGGGTTGGCAGAATATAATCGTATCGTTACTGGTAAAGCCCC 
TGCTCCAGATTCTAATATTAATAATATTACGAAATCATACCCACATGAAG 
CTGCAAAACAAGAAATTGTAGTGGCAAATGTTATTGATAAAGTTAACAAA 
CAAATTCCTTACAATTGGAAGCCTTACGCTATTAAAAATATTCCTGTAAA 
TAACAAAAGTGTGAACGTTGGCTTTATCGGGATTGTCACCAAAGACATCC 
CAAACCTTGTCTTACGTAAAAATTATGAACAATATGAATTTTTAGATGAA 
GCTGAAACAATCGTTAAATACGCCAAAGAATTACAAGCTAAAAATGTCAA 
AGCTATTGTAGtTCTCGCACATGTACCTGCAACAAGTAAAAATGATATTG 
CTGAAGGTGAAGCAGCAGAAATGATGAAAAAAGTCAATCAACTCTTCCCT 
GAAAATAGCGTAGATATTGTCTTTGCTGGACACAATCATCAATATACAAA 
TGGTCTTGTTGGTAAAACTCGTATTGTACAAGCGCTCTCTCAAGGAAAAG 
CCTATGCTGATGTACGTGGTGTCTTAGATACTGATACACAAGATTTCATT 
GAGACCCCTTCAGCTAAAGTAATTGCAGTTGCTCCTGGTAAAAAAACAGG 
TAGTGCCGATATTCAAGCCATTGTTGACCAAGCTAATACTATCGTTAAAC 
AAGTAACAGAAGCTAAAATTGGTACTGCCGAGGTAAGTGTCATGATTACG 
CGTTCTGTTGATCAAGATAATGTTAGTCCGGTAGGCAGCCTCATCACAGA 
GGCTCAACTAGCAATTGCTCGAAAAAGCTGGCCAGATATCGATTTTGCCA 
TGACAAATAATGGTGGCATTCGTGCTGACTTACTCATCAAACCAGATGGA 
ACAATCACCTGGGGAGCTGCACAAGCAGTTCAACCTTTTGGTAATATCTT 
ACAAGTCGTCGAAATTACTGGTAGAGATCTTTATAAAGCACTCAACGAAC 
AATACGACCAAAAACAAAATTTCTTCCTTCAAATAGCTGGTCTGCGATAC 
ACTTACACAGATAATAAAGAGGGCGGGGAAGAAACACCATTTAAAGTTGT 
AAAAGCTTATAAATCAAATGGTGAGGAAATCAATCCTGATGCAAAATACA 
AATTAGTTATCAATGACTTTTTATTCGGTGGTGGTGATGGCTTTGCAAGC 
TTCAGAAATGCCAAACTTCTAGGAGCCATTAACCCCGATACAGAGGTATT 
TATGGCCTATATCACTGATTTAGAAAAAGCTGGTAAAAAAGTGAGCGTTC 
CAAATAATAAACCTAAAATCTATGTCACTATGAAGATGGTTAATGAAACT 
ATTACACAAAATGATGGTACACATAGCATTATTAAGAAACTTTATTTAGA 
TCGACAAGGAAATATTGTAGCACAAGAGATTGTATCAGACACTTTAAACC 
AAACAAAATCAAAATCTACAAAAATCAACCCTGTAACTACAATTCACAAA 
AAACAATTACACCAATTTACAGCTATTAACCCTATGAGAAATTATGGCAA 
ACCATCAAACTCCACTACTGTAAAATCAAA 
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SEQ XD NO. 7111 

STRAIN JM9130013 

CGGTGTCCAAGTTATAGGCGTCAATGACTTTCATGGTGCACTTGACAATA 
CTGGAACAGCAAATATGCCTGACGGAAAAGTTACTAATGCTGGCACTGCT 
GCTCAATTAGATGCTTATATGGATGATGCTCAAAAAGATTTCAAACAAAC 
TAACCCTAATGGTGAAAGCATTAGAGTTCAAGCTGGTGATATGGTTGGAG 
CAAGTCCAGCTAACTCAGGGCTTCTTCAAGATGAACCAACCGTTAAAACA 
.TTTAATGCAATGAATGTTGAGTATGGCACATTAGGTAACCATGAATTTGA 
TGAAGGTTTGGCAGAATACAATCGTATCGTTACTGGAAAGGCCCCTGCTC 
CAGATTcTAATATAAATAATATTACGAAATCATACCCACACGAAGCTGCA 
AAACAAGAAATTGTAGTGGCAAACGTTATTGATAAAGTTAACAAACAAAT 
CCCTTACAATTGGAAACCTTACACTATTAAAAATATTCCTGTAAATAACA 
AAAGTGTGAACGTTGGCTTTATCGGAATCGTTACCAAAGACATCCCAAAC 
CTTGTCTTACGTAAAAATTATGAACAATATGAATTTTTAGATGAAGCTGA 
AACAATCGTTAAATACGCCAAAGAATTACAAGCTAAAAATGTCAAGGCTA 
TTGTAGTCCTTGCTCATGTACCTGCAACAAGCAAGGATGATATTGCTGAA 
GGTGAAGCAGCAGAAATGATGAAAAAAGTCAATCAACTCTTCCCTGAAAA 
TAGCGTAGATATTGTCTTTGCTGGACACAATCATCAATATACAAATGGTC . 
TTGTTGGTAAAACTCGTATTGTACAAGCGCTCTCTCAAGGAAAAGCCTAT 
„ GCTGATGTACGTGGTGTCCTAGATACTGATACACAAGATTTCATTGAAAC 
CCCTTCAGCTAAAGTAATTGCAGTTGCTCCTGGTAAAAAAACAGGTAGTG 
CCGATATTCAAGCCATTGTTGACCAAGQTAATACTATCGTTAAACjiAGTA 
ACAGAAGCTAAAATTGGTACTGCCGAGGTAAGTGGCATGATTACGCGTTC 
TGTTGATCAAGATAATGTTAGTCCGGTAGGCAGCCTCATCACAGAGGCTC 
AACTAGCAATTGCTCGAAAAAGCTGGCCAGATATCGATTTTGCCATGACA 
AATAATGGTGGCATTCGTGCTGACTTACTCATCAAACCAGATGGAACAAT 
CACCTGGGGAGCTGCACAAGCAGTTCAACCTTTTGGTAATATCTTACAAG 
TCGTCGAAATTACTGGTAGAGATCTTTATAAAGCACTCAACGAACAATAC 
GACCAAAAACAAAATTTCTTCCTTCAAATAGCTGGTCTGCGATACACTTA 
CACAGATAATAAAGAGGGCGGGGAAGAAACACCATTTAAAGTTGTAAAAG 
CTTATAAATCAAATGGTGAGGAAATCAATCCTGATGCAAAATACAAATTA 
GTTATCAATGACTTTTTATTCGGTGGTGGTGATGGCTTTGCAAGCTTCAG 
AAATGCCAAACTTCTAGGAGCCATTAATCCCGATACAGAGGTATTTATGG 
CCTATATCACTGATTTAGAAAAAGCTGGTAAAAAAGTGAGCGTTCCAAAT 
AATAAACCTAAAATCTATGTCACTATGAAGATGGTTAATGAAACTATTAC 
ACAAAATGATGGTACATATAGCATTATTGAGAAACTTTATTTAGATCGAC 
AAGGAAATATTGTAGCACAAGAGATTGTATCAGACACTTTAAACCAAACA 
AAATCAAAATCTACAAAAATCAACCCTGTAACTACAATTCACAAAAAACA 
ATTACACCAATTTACAGCTATTAACCCTATGAGAAATTATGGCAAACCAT 
CAAACTCCACTACTGTAAAATCAAAA 



SEQ ID NO. 7112 

STRAIN 2603 frame: 1 

MKKKIILKSSVLGLVAGTSIMFSSVFADQVGVQVIGVNDFHGALDNTGTANMPDGKVANA 
GTAAQLDAYMDDAQKDFKQTN PNGE S IRVQAG DMVGAS PANSGLLQDE PT VKN FNAMN VE 
YGTLGNHEFDEGLAEYNRIVTGKAPAPDSNINNITKSYPHEAAKQEIWANVIDKVNKQI 
PYNWKPYAIKNIPVNNKSVNVGFIGIVTKDIPNLVLRKNYEQYEFLDEAETIVKYAKELQ 
AKNVKAIWLAHVPATSKNDIAEGEAAEMMKKVNQLFPENSVDIVFAGHNHQYTNGLVGK 
TRIVQALSQGKAYADVRGVLDTDTQDFIETPSAKVIAVAPGKKTGSADIQAIVDQANTIV 
KQVTEAKIGTAEVSVMITRSVDQDNVSPVGSLITEAQLAIARKSWPDIDFAMTNNGGIRA 
DLLIKPDGTITWGAAQAVQPFGNILQWEITGRDLYKALNEQYDQKQNFFLQIAGLRYTY 
TDNKEGGEETPFKWKAYKSNGEEINPDAKYKLVINDFLFGGGDGFASFRNAKLLGAINP 
DTEVFMAYITDLEKAGKKVSVPNNKPKIYVTMKMVNETITQNDGTHSIIKKLYLDRQGNI 
VAQEIVSDTLNQTKSKSTKINPVTTIHKKQLHQFTAINPMRNYGKPSNSTTVKSKQLPKT 
NSEYGQSFLMSVFGVGLIGIALNTKKKHMK 

SEQ XD NO. 7113 

STRAIN 090 frame: 3 

VGVQVIGVNDFHGALDNTGTANMPDGKVTNAGTAAQLDAYMDDAQKDFKQTNPNGESIRV 
QAG DMVGAS PAN SGLLQDEPTVKT FN AMNVEYGTLGNHEFDEGLAEYNRIVTGECAPAPDS 
NINNITKSYPHEAAKQEI WANVIDKVNKQI PYNWKPYAIKNI PVNNKSVNVGFIGIVTK 
DIPNLVLRKNYEQYEFLDEAETIVKYAKELQAKNVKAIWLAHVPATSKDDIAEGEAAEM 
MKKVNQLFPENSVDIVFAGHNHQYTNGLVGKTRIVQALSQGKAYADVRGVLDTDTQDFIE 
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TPSAKWAVAPGKKTGSADIQAIVDQANTIVKQVTEAKIGTAEVSGMITRSVDQDNVSPV 
GSLITEAQLAIARKSWPDIDFAMTNNGGIRADLLIKPDGTITWGAAQAVQPFGNILQVVE 
ITGRDLYKALNEQYDQKQNFFLQIAGLRYTYTDNKEGGEETPFKWKAYKSNGEEINPDA 
BCYKLVINDFLFGGGDGFASFRNAKLLGAINPDTEVFMAYITDLEKAGKKVSVPNNKPKIY 
VTMKMVNETITONDGTHSIIKKLYLDRQGNIVAQEIVSDTLNQTKSKSTKINPVTTIHKK 
QLHQFTAINPMRNYGKPSNSTTVKSKQ 

SEQ ID NO. 7114 

STRAIN A9C9 frame: 3 

VNDFHGALDNTGTANMPDGKVTNAGTAAQLDAYMDDAQKD FKQTNPNGE S IRVQAGDMVG 
ASPANSGLLQDEPTVKTFNAMNVEYGTLGNHEFDEGLAEYNRIVTGKAPAPDSNINNITK 
SYPHEAAKQEIWANVIDKVNKQIPYNWKPYTIKNIPVNNKSVNVGFIGIVTKDIPNLVL 
RKNYEQYEFLDEMTIVKYAKELQAKNVKAIVVLAHVPATSKDDIAEGEAAEMMKKVNQL 
FPENSVDIVFAGHNHQYTNGLVGKTRIVQALSQGKAYADVRGVLDTDTQDFIETPSAKVI 
AVAPGKKTGSADIQAIVDQANTIVKQVTEAKIGTAEVSGMITRSVDQDNVS PVGSLITEA 
QLAIARKSWPDIDFAMTNNGGIRADLLIKPDGTITWGAAQAVQPFGNILQVVEITGRDLY 
KALNEQYDQKQN FFLQI AGLRYT YT DNKEGGEET P FKWKAYKSNGEE INPDAKYKLVTN 
DFLFGGGDGFAS FRNAKXLGAINPDTEVFMAYITDLEKAGKKVSVPNNKPKIYVTMKMVN 
ETITQNDGTYSIIKKLYLDRQGNIVAQEIVSDTLNQTKSKSTKINPVTTIHKKQLHQFTA 
INPMRNYGKPSNSTTVKSKQ 

SEQ ID NO. 7115 

*" STRAIN H36B 'frame: 2 
QVGVQVIGVNDFHGALDNTGTANMPDGKVTNAGTAAQLDAYMDDAQKDFKQTNPNGESIR 
VQAGDMVGASPANSGLLQDEPTVKTFNAMNVEYGTLGNHEFDEGLAEYNRIVTGKAPAPD 
SNINNITKSYPHEAAKQEIWANVIDKVNKQIPYNWKPYTIKNIPVNNKSVNVGFIGIVT 
KDIPNLVLRKNYEQYEFLDEAETIVKYAKELQAKNVKAIVVLAHVPATSKDDIAEGEAAE 
MMKKVNQLFPENSVDIVFAGHNHQYTNGLVGKTRIVQALSQGKAYADVRGVLDTDTQDFI 
ETPSAKVIAVAPGKKTGSADIQAIVDQANTIVKQVTEAKIGTAEVSGMITRSVDQDNVSP 
VGSLITEAQLAIARKSWPDIDFAMTNNGGIRADLLIKPDGTITWGAAQAVQPFGNILQW 
EITGRDLYKALNEQYDQKQNFFLQIAGLRYTYTDNKEGGEETPFKVVKAYKSNGEEINPD 
ABCYKLVIN DFLFGGGDGFAS FRNAKLLGAINP DTE VBHAY I TDLEKAGKKVSVPNNKPKI 
YVTMKMVNETITQNDGTYSIIKKLYLDRQGNIVAQEIVSDTLNQTKSKSTKINPVTTIHK 
KQLHQFTAINPMRNYGKPSNSTTVKS 

SEQ ID NO. 7116 

STRAIN 18RS21 frame: 1 

DQVGVQVIGVNDFHGALDNTGTANMPDGKVXNAGTAAQLDAYMDDAQKDFKQTNPNGESI 
RVQ AGDMVG AS PAN S GLLQDE PT VKT FNAMNVE YGT LGN HE FDEGLAE YNR I VTGKAP AP 
DSNINNITKSYPHEAAKQEIVVANVIDKVNKQIPYNWKPYTIKNIPVNNKSVNVGFIGIV 
TKDI PNLVLRKN YEQYEFLDEAET I VKYAKELQAKNVKAI WLAHVPAT SKDDI AEGEAA 
EMMKKVNQLFPENSVDIVFAGHNHQYTNGLVGKTRIVQALSQGKAYADVRGVLDTDTQDF 
IETPSAKVIAVAPGKKTGSADIQAIVDQANTIVKQVTEAKIGTAEVSGMITRSVDQDNVS 
PVGSLITEAQLAIARKSWPDIDFAMTNNGGIRADLLIKPDGTITWGAAQAVQPFGNILQV 
VEITGRDLYKALNEQYDQKQNFFLQIAGLRYTYTDNKEGGEETPFKVVKAYKSNGEEINP 
DAKYKLVINDFLFGGGDGFASFRNAKLLGAINPDTEVFMAYITDLEKAGKKVSVPNNKPK 
I YVTMKMVNETITQNDGTYS I IKKLYLDRQGN I VAQE I VS DTLNQTKSKSTKIN PVTT IH 
KKQLHQFTAINPMRNYGKPSNSTTVKSK 

SEQ ID NO. 7117 

STRAIN M732 frame: 3 

QVGVQVI GVNDFHGALDNTGTANMP DGKVTNAGT AAQLDAYMDDAQKD FKQTN PNGE S IR 
VQAGDMVGASPANSGLLQDEPTVKT FN AMNVE YGT LGNHE FDEGLAE YNRIVTGKAPAPD 
SNINNITKSYPHEAAKQEIWANVIDKVNKQIPYNWKPYTIKNIPVNNKSVNVGFIGIVT 
KDIPNLVLRKNYEQYEFLDEAETIVKYAKELQAKNVKAIWLAHVPATSKDDIAEGEAAE 
MMKKVNQLFPENSVDIVFAGHNHQYTNGLVGKTRIVQALSQGKAYADVRGVLDTDTQDFI 
ETPSAKVIAVAPGKKTGSADIQAIVDQANTIVKQVTEAKIGTAEVSGMITRSVDQDNVSP 
VGSLITEAQLAIARKSWPDIDFAMTNNGGIRADLLIKPDGTITWGAAQAVQPFGNILQW 
E ITGRDLYKALNEQYDQKQN FFLQI AGLRYT YT DNKEGGEET P FKWKAYKSNGEE I N P D 
AKYKLVINDFLFGGGDGFASFRNAKLLGAINPDTEVFMAYITDLEKAGKKVSIPNNKPKI 
YVTMKMVNETITQNDGTYSIIKKLYLDRQGNIVAQEIVSDTLNQTKSKSTKINPVTTIHK 
KQLHQFTAINPMRNYGKPSNSTTVKSKQ 

SEQ ID NO. 7118 
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STRAIN COH1 frame: 3 

QVGVQVIGVND FHGALDNTGT ANMPDGKVTNAGTAAQLDAYMD DAQKDFKQTN PNGES I R 
VQAGDMVGAS PAN SGLLQDE PTVKT FNAMNVE YGT LGNHE FDEGLAE YNRI VTGKAPAP D 
SNINNITKSYPHEAAKQEI WANVI DKVNKQIPYNWKPYTIKNI PVNNKSVNVGFIGI VT 
KDIPNLVLRKNYEQYEFLDEAETIVKYAKELQT^KNVKAIVVLAHVPATSKDDIAEGEAAE 
MMKKVNQLFPENSVDIVFAGHNHQYTNGLVGKTRIVQALSQGKAYADVRGVLDTDTQDFI 
ETPSAKVIAVAPGKKTGSADIQAIVDQANTIVKQVTEAKIGTAEVSGMITRSVDQDNVSP 
VGSLITEAQLAIARKSWPDIDFAMTNNGGIRADLLIKPDGTITWGAAQAVQPFGNILQW 
EITGRDLYKALNEQYDQKQNFFLQIAGLRYTYTDNKEGGEETPFKVVKAYKSNGEEINPD 
AKYKLVINDFLFGGGDGFASFRNAKLLGAINPDTEVFMAYITDLEKAGKKVSIPNNKPKI 
YVTMKMVNETITQNDGTYSIIKKLYLDRQGNIVAQEIVSDTLNQTKSKSTKINPVTTIHK 
KQLHQFTAINPMRNYGKPSNSTTVKS 

SEQ ID NO. 7119 

STRAIN M781 frame: 1 

QVGVQVIGVN DFHGAL DNTGTANMP DGKVTNAGTAAQLDAYMDDAQKD FKQTN PNGES IR 
VQAGDMVGAS PAN SGLLQDE PTVKT FNAMNVE YGTLGNHE FDEGLAE YNRI VTGKAPAPD 
SN INN ITKSYPHEAAKQEIW/^NVI DKVNKQIPYNWKPYTIKNI PVNNKSVNVGFIGI VT 
KDIPNLVLRKNYEQYEFLDEAETIVKYAKELQAKNVKAIVVLAHVPATSKDDIAEGEAAE 
MMKKVNQLFPENSVDIVFAGHNHQYTOGLVGKTRIVQALSQGKAYADVRGVLDTDTQDFI 
ETPSAKVIAVAPGKKTGS^ADIQAIVDQANTIVKQVTEAKIGTAEVSGMITRSVDQDNVSP 
VGSLITEAQLAIARKSWPDIDFAMTNNGGIRADLLIKPffGTITWGAAQAVQPFGNILQVV. 
EITGRDLYKALNEQYDQKQNFFLQIAGLRYTYTDNKEGGEETPFKWKAYKSNGEEINPD 
AKYKLVINDFLFGGGDGFASFRNAKLLGAINPDTEVFMAYITDLEKAGBCKVSIPNNKPKi 
- YVTMKMVNETITQNDGTYSIIKKLYLDRQGNIVAQEIVSDTLNQTKSKSTKINPVTTIHK 
KQLHQFTAINPMRNYGKPSNSTTVKS 

SEQ ID NO. 7120 

STRAIN CJB110 frame: 1 

DQVGVQVIGVNDFHGALDNTGTANMPDGKVTNAGTAAQLDAYMDDAQKDFKQTNPNGESI 
RVQAGDMVGAS PANSGLLQDE PTVKT FNAMNVE YGTLGNHE FDEGLAE YNRI VTGKAPAP 
DSNINNITKSYPHEAAKQEIWANVIDKVNKQIPYNWKPYAIKNI PVNNKSVNVGFIGI V 
TKDIPNLVLRKNYEQYEFLDEAETIVKYAKELQAKNVKAIWLAHVPATSKDDIAEGEAA 
EMMKKVNQLFPENSVDIVFAGHNHQYTNGLVGKTRIVQALSQGKAYADVRGVLDTDTQDF 
IETPSAKWAVAPGKKTGSADIQAIVDQANTIVKQVTEAKIGTAEVSGMITRSVDQDNVS 
PVGSLITEAQLAIARKSWPDIDFAMTNNGGIRADLLIKPDGTITWGAAQAVQPFGNILQV 
VEITGRDLYKALNEQYDQKQNFFLQIAGLRYTYTDNKEGGEETPFKWKAYKSNGEEINP 
DAKYKLVINDFLFGGGDGFASFRNAKLLGAINPDTEVFMAYITDLEKAGKKVSVPNNKPK 
IYVTMKMVNETITQNDGTHSIIKKLYLDRQGNIVAQEIVSDTLNQTKSKSTKINPVTTIH 
KKQLHQFTAINPMRNYGKPSNSTTVKS 

SEQ ID NO. 7121 

STRAIN 1169NT frame: 1 

QVGVQVIGVND FHGALDNTGT ANMPDGKVANAGTAAQLDAYMDDAQKDFKQTN PNGES IR 
VQAGDMVGAS PANSGLLQDE PTVKNFNAMNVEYGTLGNHE FDEGLAE YNRI VTGKAPAPD 
SNINNITKSYPHEAAKQEIWANVIDKVNKQIPYNWKPYAIKNIPVNNKSVNVGFIGIVT 
KDIPNLVLRKNYEQYEFLDEAETIVKYAKELQAKNVKAIWIAHVPATSKNDIAEGEAAE 
MMKKVNQLFPENSVDIVFAGHNHQYTNGLVGKTRIVQALSQGKAYADVRGVLDTDTQDFI 
ETPSAKVIAVAPGKKTGSADIQAIVDQANTIVKQVTEAKIGTAEVSVMITRSVDQDNVSP 
VGSLITEAQLAIARKSWPDIDFAMTNNGGIRADLLIKPDGTITWGAAQAVQPFGNILQW 
EITGRDLYKALNEQYDQKQNFFLQIAGLRYTYTDNKEGGEETPFKWKAYKSNGEEINPD 
AKYKLVINDFLFGGGDGFASFRNAKLLGAINPDTEVFMAYITDLEKAGKKVSVPNNKPKI 
YVTMKMVNETITQNDGTHSIIKKLYLDRQGNIVAQEIVSDTLNQTKSKSTKINPVTTIHK 
KQLHQFTAINPMRNYGKPSNSTTVKS 

SEQ ID NO. 7122 

STRAIN JM9130013 frame: 2 

GVQVIGVNDFHGALDNTGTANMPDGKVTNAGTAAQLDAYMDDAQKDFKQTNPNGESIRVQ 
AG DMVGAS PAN SGLLQDE PTVKT FNAMNVE YGTLGNHE FDEGLAE YNRI VTGKAPAP DSN 
INN ITKS YPHEAAKQE I WANVI DKVNKQI P YNWKPYT IKNI PVNNKS VNVGFIGIVTKD 
IPNLVLRKNYEQYEFLDEAETIVKYAKELQAKNVKAIVVLAHVPATSKDDIAEGEAAEMM 
KKVNQLFPENSVDIVFAGHNHQYTNGLVGKTRIVQALSQGKAYADVRGVLDTDTQDFIET 
PSAKVIAVAPGKKTGSADIQAIVDQANTIVKQVTEAKIGTAEVSGMITRSVDQDNVSPVG 
SLITEAQLAIARKSWPDIDFAMTNNGGIRADLLIKPDGTITWGAAQAVQPFGNILQWEI 
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TGRDLYKALNEQYDQKQNFFLQIAGLRYTYTDNKEGGEETPFKWKAYKSNGEEINPDAK 
YKLVINDFLFGGGDGFASFRNABCLLGAINPDTEVFMAYITDLEKAGKKVSVPNNKPKIYV 
TMKMVNETITQNDGTYSIIEBCLYLDRQGNIVAQEIVSDTLNQTKSKSTKINPVTTIHKKQ 
LRQFTAINPMRNYGKPSNSTTVKSK 

SEQ ID NO. 7201 
STRAIN 2603 

ATGAATAAACGCGTT^AAAATCGTTGCAACACTTGGTCCTGCGGTTGAATTCCGTGGTG 

GTAAGAAGTTTGGTGAGTCTGGATACTGGGGTGAAAGCCTTGACGTAGAAGCTTCAGCAG 

AAAAAATTGCTCAATTGATTAAAGAAGGTGCTAACGTTTTCCGTTTCAACTTCTCACATG 

GAGATCATGCTGAGCAAGGAGCTCGTATGGCTACTGTTCGTAAAGCAGAAGAGATTGCAG 

GACAAAAAGTTGGCTTCCTCCTTGATACTAAAGGACCTGAAATTCGTACAGAACTTTTTG 

AAGATGGTGCAGATTTCCATTCATATACAACAGGTACAAAATTACGTGTTGCTACTAAGC 

AAGGTATCAAATCAACTCCAGAAGTGATTGCATTGAATGTTGCTGGTGGACTTGACATCT 

TTGATGACGTTGAAGTTGGTAAGCAAATCCTTGTTGATGATGGTAAACTAGGTCTTACTG 

TGTTTGCAAAAGATAAAGACACTCGTGAATTTGAAGTAGTTGTTGAGAATGATGGCCTTA 

TTGGTAAACAAAAAGGTGTAAACATCCCTTATACTAAAATTCCTTTCCCAGCACTTGCAG 

AACGCGATAATGCTGATATCCGTTTTGGACTTGAGCAAGGACTTAACTTTATTGCTATCT 

CATTTGTACGTACTGCTAAAGATGTTAATGAAGTTCGTGCTATTTGTGAAGAAACTGGsm 

ATGGACACGTTAAGTTGTTTGCTAAAATTGAAAATCAACAAGGTATCGATAATATTGATG 

AGATTATCGAAGCAGCAGATGGTATTATGATTGCTCGTGGTGATATGGGTATCGAAGTTC 

CATTTGAAATGGTTCCAGTTTACCAAAAAATGATGATTACTAAAGTTAATGCAGCTGGTA 

AAGCAGTTATTACAGCAACAAATATGCTTgAAACAATGACTGATAAACCACGTGCGACTC 

GTTCAGAAGTATCTGATGTCTTCAATGGTGTTATTGATGGTACTGAtGCTACAATGCTTT 

CAGGTGAGTCAGCTAATGGTAAATACCCAGTTGAGTCAGTTCGTACAATGGCTACTATTG 

ATAAAAATGCTCAAACATTACTCAATGAGTATGGTCGCTTAGACTCATCTGCATTCCCAC 

GTAATAACAAAACTGATGTTATTGCATGTGCGGTTAAAGATGCAACACACTCAATGGATA 

TCAAACTTGTTGTAACAATTACTGAAACAGGTAATACAGCTCGTGCCATTTCTAAATTCC 

GTCCAGATGCAGACATTTTGGCTGTTACATTTGATGAAAAAGTACAACGTTCATTGATGA 

TTAACTGGGGTGTTATCCCTGTCCTTGCAGACAAACCAGCATCTACAGATGATATGTTTG 

AGGTTGCAGAACGTGTAGCACTTGAAGCAGGATTTGTTGAATCAGGCGATAATATCGTTA 

TCGTTGCAGGTGTTCCTGTAGGTACAGGTGGAACTAACACAATGCGTGTTCGTACTGTTA 

AA 

SEQ ID NO. 7202 
STRAIN 090 

AATAAACGCGTAAAAATCGTTGCAACACT 

TGGTCCTGCGGTAGAATTCCGTGGTGGTAAGAAGTTTGGTGAGTCTGGAT 

ACTGGGGTGAAAGCCTTGACGTAGAAGCTTCAGCAGAAAAAATTGCTCAA 

TTGATTAAAGAAGGTGCTAACGTTTTCCGTTTCAACTTCTCACATGGAGA 

TCATGCTGAGCAAGGAGCTCGTATGGCTACTGTTCGTAAAGCAGAAGAGA 

TTGCAGGACAAAAAGTTGGCTTCCTCCTTGATACTAAAGGACCTGAAATT 

CGTACAGAACTTTTTGAAGATGGTTCAGATTTCCATTCATATACAACAGG 

TACAGAATTACGTGTTGCTACTAAGCAAGGTATCAAATCAACTCCAGAAG 

TGATTGCATTGAATGTTGCTGGTGGACTTGACATCTTTGATGACGTTGAA 

GTTGGTAAGCAAATCCTTGTTGATGATGGTAAACTAGGTCTTACTGTGTT 

TGCAAAAGATAAAGACACTCgTGAATTTGAAGTAGTTGTTGAGAATGATG 

GCCTTATTGGTAAACAaaaaGGTGTAT^ACATCCCTTATACTAaAATTCCT 

TTCCCAgCACTTGCAGAACGCGATAATGCTGATATCCGTTTTGGACTTGA 

GCAAGGACTTAACTTTATTGCTATCTCATTTGTACGTACTGCTAAAGATG 

TTAATGAAGTTCGTGCTATTTGTGAAGAAACTGGCAATGGACATGTTAAG 

TTGTTTGCTAAAATTGAAAATCAACAAGGTATCGATAATATTGATGAGAT 

TATCGAAGCAGCAGATGGTATTATGATTGCTCGTGGTGATATGGGTATCG 

AAGTTCCATTTGAAATGGTTCCAGTTTACCAAAAAATGATCATTACTAAA 

GTTAATGCAGCTGGTAAAGCAGTTATTACAGCAACAAATATGCTTGAAAC 

AATGACTGATAAACCACGTGCGACTCGTTCAGAAGTATCTGATGTCTTCA 

ATGCTGTTATTGATGGTACTGATGCTACAATGCTTTCAGGTGAGTCAGCT 

AATGGTAAATACCCAGTTGAGTCAGTTCGTACAATGGCTACTATTGATAA 

AAATGCTCAAACATTACTCAATGAGTATGGTCGCTTAGACTCATCTGCAT 

TCCCACGTAATAACAAAACTGATGTTATTGCATCTGCGGTTAAAGATGCA 

ACACACTCAATGGATATCAAACTTGTTGTGACAATTACTGAAACAGGTAA 

TACAGCTCGTGCCATTTCTAAATTCCGTCCAGATGCAGACATTTTGGCTG 

TTACATTTGATGAAAAAGTACAACGTTCATTGATGATTAACTGGGGTGTT 

ATCCCTGTCCTTGCAGACAAACCAGCATCTACAGATGATATGTTTGAGGT 
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TGCAGAACGTGTAGCACTTGAAGCAGGACTTGTTGAATCAGGCGATAATA 
TCGTTATCGTTGCAGGTGTTCCTGTAGGTACAGGTGGAACTAACACAATG 
CGTGTTCGTACTGTTAAA 

SEQ ID NO. 7203 

STRAIN A909 

AATAAACGCGTAAAAATCGTTGCAACACTT GGTC 

CTGCGGTTGAATTCCGTGGTGGTAAGAAGTTTGGTGAGTCTGGATACTGG 
GGTGAAAGCCTTGACGTAGAAGCTTCAGCAGAAAAAATTGCTCAATTGAT 
TAAAGAAGGTGCTAACGTTTTCCGTTTCAACTTCTCACATGGAGATCATG 
CTGAGCAAGGAGCTCGTATGGCTACTGTTCGTAAAGCAGAAGAGATTGCA 
GGACAAAAAGTTGGCTTCCTCCTTGATACTAAAGGACCTGAAATTCGTAC 
AGAACTTTTTGAAGATGGTGCAGATTTCCATTCATATACAACAGGTACAA 
AATTACGTGTTGCTACTAAGCAAGGTATCAAATCAACTCCAGAAGTGATT 
GCATTGAATGTTGCTGGTGGACTTGACATCTTTGATGACGTTGAAGTTGG 
TAAGCAAATCCTTGTTGATGATGGTAAACTAGGTCTTACTGTGTTTGCAA 
AAGATAAAGACACTCGTGAATTTGAAGTAGTTGTTGAGAATGATGGCCTT 
ATTGGTAAACAAAAAGGTGTAAACATCCCTTATACTAAAATTCCTTTCCC 
AGCACTTGCAGAACGCGATAATGCTGATATCCGTTTTGGACTTGAGCAAG 
GACTTAACTTTATTGCTATCTCATTTGTACGTACTGCTAAAgATGTTAAT 
GAAGTTCGTGCTATTTGTGAAGAAACTGGCAATGGACACGTTAAGTTGTT t 
TGCTAAAATTGAAAATCAACAAGGTATCGATAATATTGATGAGATTATCG ' 
AAGCAGCAGATGGTATTATGATTGCTCGTGGTGATATGGGTATCGAAGTT 
. CCAT TTGAAATGGTTCCAGTTTACCAAAAAATGATCATTACTAAAGTTAA 
TGCAGCTGGTAAAGCAGTTATTACAGCAAGAAATATGCTTGAAACAATGA 
CTGATAAACCACGTGCGACTCGTTCAGAAGTATCTGATGTCTTCAATGCT 
GTTATTGATGGTACTGATGCTACAATGCTTTCAGGTGAGTCAGCTAATGG' 
TAAATACCCAGTTGAGTCAGTTCGTACAATGGCTACTATTGATAAAAATG 
CTCAAACATTACTCAATGAGTATGGTCGCTTAGACTCATCTGCATTCCCA 
CGTAATAACAAAACTGATGTTATTGCATCTGCGGTTAAAGATGCAACACA 
CTCAATGGATATGAAACTTGTTGTAACAATTACTGAAACAGGTAATACAG 
CTCGTGCCATTTCTAAATTCCGTCCAGATGCAGACATTTTGGCTGTTACA 
TTTGATGAAAAAGTACAACGTTCATTGATGATTAACTGGGGTGTTATCCC 
TGTCCTTGCAGACAAACCAGCATCTACAGATGATATGTTTGAGGTTGCAG 
AACGTGTAGCACTTGAAGCAGGATTTGTTGAATCAGGCGATAATATCGTT 
ATCGTTGCAGGTGTTCCTGTAGGTACAGGTGGAACTAACACAATGCGTGT 
TCGTACTGTTAAA 

SEQ ID NO. 7204 

STRAIN H36B 

AATAAACGCGTAAAAATCGTTGCAAC 

ACTTGGTCCTGCGGTTGAATTCCGTGGTGGTAAGAAGTTTGGTGAGTCTG 

GATACTGGGGTGAAAGCCTTGACGTAGAAGCTTCAGCAGAAAAAATTGCT 

CAATTGATTAAAGAAGGTGCTAACGTTTTCCGTTTCAACTTCTCACATGG 

AGATCATGCTGAGCAAGGAGCTCGTATGGCTACTGTTCGTAAAGCAGAAG 

AGATTGCAGGACAAAAAGTTGGCTTCCTCCTTGATACTAAAGGACCTGAA 

ATTCGTACAGAACTTTTTGAAGATGGTGCAGATTTCCATTCATATACAAC 

AGGTACAAAATTACGTGTTGCTACTAAGCAAGGTATCAAATCAACTCCAG 

AAGTGATTGCATTGAATGTTGCTGGTGGACTTGACATCTTTGATGACGTT 

GAAGTTGGTAAGCAAATCCTTGTTGATGATGGTAAACTAGGTCTTACTGT 

GTTTGCAAAAGATAAAGACACTCGTGAATTTGAAGTAGTTGTTGAGAATG 

ATGGCCTTATTGGTAAACAAAAAGGTGTAAACATCCCTTATACTAAAATT 

CCTTTCCCAGCACTTGCAGAACGCGATAATGCTGATATCCGTTTTGGACT 

TGAGCAAGGACTTAACTTTATTGCTATCTCATTTGTACGTACTGCTAAAG 

ATGTTAATGAAGTTCGTGCTATTTGTGAAGAAACTGGCAATGGACACGTT 

AAGTTGTTTGCTAAAATTGAAAATCAACAAGGTATCGATAATATTGATGA 

GATTATCGAAGCAGCAGATGGTATTATGATTGCTCGTGGTGATATGGGTA 

TCGAAGTTCCATTTGAAATGGTTCCAGTTTACCAAAAAATGATCATTACT 

AAAGTTAATGCAGCTGGTAAAGCAGTTATTACAGCAACAAATATGCTTGA 

AACAATGAcTGATAAACCACGTGCGACTCGTTCAGAAGTATCTGATGTCT 

TCAATGCTGTTATTGATGGTACTGATGCTACAATGCTTTCAGGTGAGTCA 

GCTAATGGTAAATACCCAGTTGAGTCAGTTCGTACAATGGCTACTATTGA 

TAAAAATGCTCAAACATTACTCAATGAGTATGGTCGCTTAGACTCATCTG 

CATTCCCACGTAATAACAAAACTGATGTTATTGCATCTGCGGTTAAAGAT 
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GCAACACACTCAATGGATATCAAACTTGTTGTAACAATTACTGaAACAGG 
TAATACAGCTCGTGCCATTTCTAAATTCCGTCCAGATGCAGACATTTTGG 
CTGTTACATTTGATGAAAAAGTACAACGTTCATTGATGATTAACTGGGGT 
GTTATCCCTGTCCTTGCAGACAAACCAGCATCTACAGATGATATGTTTGA 
GGTTGCAGAACGTGTAGCACTTGAAGCAGGATTTGTTGAATCAGGCGATA 
ATATCGTTATCGTTGCAGGTGTTCCTGTAgGTACAGGTGGAACTAACACA 
ATGCGTGTTCGTACTGTTAAA 

SEQ ID NO. 7205 

STRAIN 18RS21 

AATAAACGCGTAAAAATCGTTGCAAC 

ACTTGGTCCTGCGGTTGAATTCCGTGGTGGTAAGAAGTTTGGTGAGTCTG 
GATACTGGGGTGAAAGCCTTGACGTAgAAGCTTCAGCAGAAAAAATTGCT 
CAATTGATTAAAGAAGGTGCTAACGTTTTCCGTTTCAACTTCTCACATGG 
AGATCATGCTGAGCAAGGAGCTCGTATGGCTACTGTTCGTAAAGCAGAAG 
AGATTGCAGGACAAAAAGTTGGCTTCCTCCTTGATACTAAAGGACCTGAA 
ATTCGTACAGAACTTTTTGAAGATGGTGCAGATTTCCATTCATATACAAC 
AGGTACAAAATTACGTGTTGCTACTAAGCAAGGTATCAAATCAACTCCAG 
AAGTGATTGCATTGAATGTTGCTGGTGGACTTGACATCTTTGATGACGTT 
GAAGTTGGTAAGCAAATCCTTGTTGATGATGGTAAACTAGGTCTTACTGT 
GTTTGCAAAAGATAAAGACACTCGTGAATTTGAAGTAGTTGTTGAGAATG 
'♦ATGGCCTTAT^GGTAAACAAAAAGGTGTAJ^CATCCCTTATACTAAAATT 
CCTTTCCCAGCACTTGCAGAACGCGATAATGCTGATATCCGTTTTGGACT 
TGAGCAAGGACTTAACTTTATTGCTATCTCATTtGTACGTACTGCTAAAG 
ATGTTAATGAAGTTCGTGCTATTTGTGAAGAAACTGGCAATGGACACGTT 
AAGTTGTTTGCTAAAATTGAAAATCAACAAGGTATCGATAATATTGATGA 
GATTATCGAAGCAGCAGATGGTATTATGATTGCTCGTGGTGATATGGGTA 
TCGAAGTTCCATTTGAAATGGTTCCAGTTTACCAAAAAATGATCATTACT 
AAAGTT AATGC AG CTGGT AAAG C AGT TAT T AC AGC AACAAAT ATGCTT GA 
AAC AATG a CTG ATAAACC ACGTGCG ACTCGT T C AGAAGT AT CTGAT GT CT 
T C AAT G CT GT T ATTG AT GGT ACTGATGCT ACAAT GCT TT CAGGT GAGT CA 
GCTAATGGTAAATACCCAGTTGAGTCAGTTCGTACAATGGCTACTATTGA 
TAAAAATG CTCAAACAT TACT C AAT G AGT ATGGT CGCTT AGACTC AT CTG 
CATTCCCACGTAATAACAAAACTGATGTTATTGCATCTGCGGTTAAAGAT 
GCAACACACTCAATGGATATCAAACTTGTTGTAACAATTACTGAAACAGG 
TAATACAGCTCGTGCCATTTCTAAATTCCGTCCAGATGCAGACATTTTGG 
CTGTTACATTTGATGAAAAAGTACAACGTTCATTGATGATTAACTGGGGT 
GTTATCCCTGTCCTTGCAGACAAACCAGCATCTACAGATGATATGTTTGA 
GGTTGCAGAACGTGTAgCACTTGAAGCAGGATTTGTTGAATCAGGCGATA 
ATATCGTTATCGTTGCAGGTGTTCCTGTAgGTACAGGTGGAACTAACACA 
ATGCGTGTTCGTACTGTTAAA 

SEQ ID NO. 7206 

STRAIN M732 

AATAAACGCGTAAAAATCGTTGCAAC 

ACTTGGTCCTGCGGTAGAATTCCGTGGTGGTAAGAAGTTTGGTGAGTCTG 
GATACTGGGGTGAAAGCCTTGACGTAGAAGCTTCAGCAGAAAAAATTGCT 
CAATTGATTAAAGAAGGTGCTAACGTTTTCCGTTTCAACTTCTCACATGG 
AGATCATGCTGAGCAAGGAGCTCGTATGGCTACTGTTCGTAAAGCAGAAG 
AGATTGCAGGACAAAAAGTTGGCTTCCTCCTTGATACTAAAGGACCTGAA 
ATTCGTACAGAACTTTTTGAAGATGGTGCAGATTTCCATTCATATACAAC 
AGGTACAAAATTACGTGTTGCTACTAAGCAAGGTATCAAATCAACTCCAG 
AAGTGATTGCATTGAATGTTGCTGGTGGACTTGACATCTTTGATGACGTT 
GAAGTTGGTAAGCAAATCCTTGTTGATGATGGTAAACTAGGTCTTACTGT 
GTTTGCAAAAGATAAAGACACTCGTGAATTTGAAGTAGTTGTTGAGAATG 
ATGGCCTTATTGGTAAACAAAAAGGTGTAAACATCCCTTATACTAAAATT 
CCTTTCCCAGCACTTGCAGAACGCGATAATGCTGATATCCGTTTTGGACT 
TGAGCAAGGACTTAACTTTATTGCTATCTCATTTGTACGTACTGCTAAAG 
ATGTTAATGAAGTTCGTGCTATTTGTGAAGAAACTGGCAATGGACACGTT 
AAGTTGTTTGCTAAAATTGAAAATCAACAAGGTATCGATAATATTGATGA 
GATTATCGAAGCAGCAGATGGTATTATGATTGCTCGTGGTGATATGGGTA 
TCGAAGTTCCATTTGAAATGGTTCCAGTTTACCAAAAAATGATCATTACT 
AAAGTT AATGCAGCTGGTAAAGCAGTTATTACAGCAACAAATATGCTTGA 
AACAATGACTGATAAACCACGTGCGACTCGTTCAGAAGTATCTGATGTCT 
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TCAATGCTGTTATTGATGGTACTGATGCTACAATGCTTTCAGGTGAGTCA 
GCTAATGGTAAATACCCAGTTGAGTCAGTTCGTACAATGGCTACTATTGA 
TAAAAATGCTCAAACATTACTCAATGAGTATGGTCGCTTAGACTCATCTG 
CATTCCCACGTAATAACAAAACTGATGTTATTGCATCTGCGGTTAAAGAT 
GCAACACACTCAATGGATATCAAACTTGTTGTAACAATTACTGAAACAGG 
TAATACAGCTCGTGCCATTTCTAAATTCCGTCCAGATGCAGACATTTTGG 
CTGTTACATTTGATGAAAAAGTACAACGTTCATTGATGATTAACTGGGGT 
GTTATCCCTGTCCTTGCAGACAAACCAGCATCTACAGATGATATGTTTGA 
GGTTGCAGAACGTGTAgCACTTGAAGCAGGACTTGTTGAATCAGGCGATA 
ATATCGTTATCGTTGCAGGTGTTCCTGTAGGTACAGGTGGAACTAACACA 
ATGCGTGTTCGTACTGTTAAA 

SEQ ID NO. 7207 

STRAIN COH1 

AATAAACGCGTAAAAATCGTTGCAAC 

ACTTGGTCCTGCGGTAGAATTCCGTGGTGGTAAGAAGTTTGGTGAGTCTG 

GATACTGGGGTGAAAGCCTTGACGTAGAAGCTTCAGCAGAAAAAATTGCT 

CAATTGATTAAAGAAGGTGCTAACGTTTTCCGTTTCAACTTCTCACATGG 

AGATCATGCTGAGCAAGGAGCTCGTATGGCTACTGTTCGTAAAGCAGAAG 

AGATTGCAGGACAAAAAGTTGGCTTCCTCCTTGATACTAAAGGACCTGAA 

ATTCGTACAGAACTTTTTGAAGATGGTGCAGATTTCCATTCATATACAAC 

AGGTACAAAATTACGTGTTGCTACTAAGCAAGGTATCAAATCAACTCCAG 

AAGTGATTGCATTGAATGTTGCTGGTGGACTTGACATCTTTGATGACGTT 

GAAGTTGGTi^GCAAATCCTTGTTGATGATGGTAAACTAGGTCTTACTGT 

GTTTGCAAAAGATAAAGACACTCGTGAATTTGAAGTAGTTGTTGAGAATG 

ATGGCCTTAtTGGTAAACAAAAAGGTGTAAACATCCCTTATACTAAAATT" 

CCTTTCCCAGCACTTGCAGAACGCGATAATGCTGATATCCGTTTTGgACT 

TGAGCAAGGACTTAACTTTATTGCTATCTCATTTGTACGTACTGCTAAAG 

ATGTTAATGAAGTTCGTGCTATTTGTGAAGAAACTGGCAATGGACACGTT 

AAGTTGTTTGCTAAAATTGAAAATCAACAAGGTATCGATAATATTGATGA 

GATTATCGAAGCAGCAGATGGTATTATGATTGCTCGTGGTGATATGGGTA 

TCGAAGTTCCATTTGAAATGGTTCCAGTTTACCAAAAAATGATCATTACT 

AAAGTTAATGCAGCTGGTAAAGCAGTTATTACAGCAACAAATATGCTTGA 

AACAATGACTGATAAACCACGTGCGACTCGTTCAGaAGTATCTGATGTCT 

TCAATGCTGTTATTGATGGTACTGATGCTACAATGCTtTCAGGTGAGTCA 

GCTAATGGTAAATACCCAGTTGAGTCAGTTCGTACAATGGCTACTATTGA 

TAAAAATGCTCAAACATTACTCAATGAGTATGGTCGcTTAGACTCATCTG 

CATTCCCACGTAATAACAAAACTGATGTTATTGCATCTGCGGTTAAAGAT 

GCAACACACTCAATGGATATCAAACTTGTTGTAACAATTACTGAAACAGG 

TAATACAGCTCGTGCCATTTCTAAATTCCGTCCAGATGCAGACATTTTGG 

CTGTTACATTTGATGAAAAAGTACAACGTTCATTGATGATTAACTGGGGT 

GTTATCCCTGTCCTTGCAGACAAACCAGCATCTACAGATGATATGTTTGA 

GGTTGCAGAACGTGTAGCACTTGAAGCAGGACTTGTTGAATCAGGCGATA 

ATATCGTTATCGTTGCAGGTGTTCCTGTAGGTACAGGTGGAACTAACACA 

ATGCGTGTTCGTACTGTTAAA 

SEQ ID NO. 7208 

STRAIN M781 

AATAAACGCGTAAAAATCGTTGCAAC 

ACTTGGTCCTGCGGTAGAATTCCGTGGTGGTAAGAAGTTTGGTGAGTCTG 
GATACTGGGGTGAAAGCCTTGACGTAGAAGCTTCAGCAGAAAAAATTGCT 
CAATTGATTAAAGAAGGTGCTAACGTTTTCCGTTTCAACTTCTCACATGG 
AGATCATGCTGAGCAAGGAGCTCGTATGGCTACTGTTCGTAAAGCAGAAG 
AGATTGCAGGACAAAAAGTTGGCTTCCTCCTTGATACTAAAGGACCTGAA 
ATT CGTACAGAACTTTTTGAAGATGGTGC AGATTTCCATT C ATATACAAC 
AGGTACAAAATTACGTGTTGCTACTAAGCAAGGTATCAAATCAACTCCAG 
AAGTGATTGCATTGAATGTTGCTGGTGGACTTGACATCTTTGATGACGTT 
GAAGTTGGTAAGCAAATCCTTGTTGATGATGGTAAACTAGGTCTTACTGT 
GTTTGCAAAAGATAAAGACACTCGTGAATTTGAAGTAGTTGTTGAGAATG 
ATGGCCTTATTGgTAAACAAAAAGGTGTAAACATCCCTTATACTAAAATT 
CCTTTCCCAGCACTTGCAGaaCGCGATAATGCTGATATCCGTTTTGGACT 
TGAGCAAGGACTTAACTTTATTGCTATCTCATTTGTACGTACTGCTAAAG 
ATGTTAATGAAGTTCGTGCTATTTGTGAAGAAACTGGCAATGGACACGTT 
AAGTTGTTTGCTAAAATTGAAAATCAACAAGGTATCGATAATATTGATGA 
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GATTATCGAAGCAGCAGATGGTATTATGATTGCTCGTGGTGATATGGGTA 
TCGAAGTTCCATTTGAAATGGTTCCAGTTTACCAAAAAATGATCATTACT 
AAAGTTAATGCAGCTGGTAAAGCAGTTATTACAGCAACAAATATGCTTGA 
AACAATGACTGATAAACCACGTGCGACTCGTTCAGAAGTATCTGATGTCT 
TCAATGCTGTTATTGATGGTACTGATGCTACAATGCTTTCAGGTGAGTCA 
GCTAATGGTAAATACCCAGTTGAGTCAGTTCGTACAATGGCTACTATTGA 
TAAAAATGCTCAAACATTACTCAATGAGTATGGTCGCTTAGACTCATCTG 
CATTCCCACGTAATAACAAAACTGATGTTATTGCATCTGCGGTTAAAGAT 
GCAACACACTCAATGGATATCAAACTTGTTGTAACAATTACTGAAACAGG 
TAATACAGCTCGTGCCATTTCTAAGTTCCGTCCAGATGCAGACATTTTGG 
CTGTTACATTTGATGAAAAAGTACAACGTTCATTGATGATTAACTGGGGT 
GTTATCCCTGTCCTTGCAGACAAACCAGCATCTACAGATGATATGTTTGA 
GGTTGCAGAACGTGTAGCACTTGAAGCAGGACTTGTTGAATCAGGCGATA 
ATATCGTTATCGTTGCAGGTGTTCCTGTAGGTACAGGTGGAACTAACACA 
ATGCGTGTTCGTACTGTTAAA 

SEQ ID NO. 7209 

STRAIN CJB110 

AATAAACGCGTAAAAATCGTTGCAAC 

ACTTGGTCCTGCGGTTGAATTCCGTGGTGGTAAGAAGTTTGGTGAGTCTG 

GATACTGGGGTGAAAGCCTTGACGTAgAAGCTTCAGCAGAAAAAATTGCT 

CAATTGATTAAAGAAGGTGCTAACGTTTTCCGTTTCAACTTCTCACATGG 

AGATCATGCTGAGCAAGGAGCTCGTATGGCTACTGTTCGTAAAGCAGAAG 

AGATTGCAGGACAAAAAGTTGGCTTCCTCCTTGATACTAAAGGACCTGAA 

ATTCGTACAGAACTTTTTGAAGATGGTGCAGATTTCCATTCATATACAAC 

AGGTACAAAATTACGTGTTGCTACTAAGCAAGGTATCAAATCAACTCCAG 

AAGTGATTGCATTGAATGTTGCTGGTGGACTTGACATCTTTGATGACGTT 

GAAGTTGGTAAGCAAATCCTTGTTGATGATGGTAAACTAGGTCTTACTGT 

GTTTGCAAAAGATAAAGACACTCGTGAATTTGAAGTAGTTGTTGAGAATG 

ATGGCCTTAtTGGTAAACAAAAAGGTGTAAACATCCCTTATACTAAAATT 

CCTTTCCCAGCACTTGCAGAACGCGATAATGCTGATATCCGTTTTGGACT 

TGAACAAGGACTTAACTTTATTGCTATCTCATTTGTACGTACTGCTAAAG 

ATGTTAATGAAGTTCGTGCTATTTGTGAAGAAACTGGCAATGGACACGTT 

AAGTTGTTTGCTAAAATTGAAAATCAACAAGGTATCGATAATATTGATGA 

GATTATCGAAGCAGCAGATGGTATTATGATTGCTCGTGGTGATATGGGTA 

TCGAAGTTCCATTTGAAATGGTTCCAGTTTACCAAAAAATGATCATTACT 

AAAGTTAATGCAGCTGGTAAAGCAGTTATTACAGCAACAAATATGCTTGA 

AACAATGACTGATAAACCACGTGCGACTCGTTCAGAAGTATCTGATGTCT 

TCAATGCTGTTATTGATGGTACTGATGCTACAATGCTTTCAGGTGAGTCA 

GCTAATGGTAAATACCCAGTTGAGTCAGTTCGTACAATGGCTACTATTGA 

TAAAAATGCTCAAACATTACTCAATGAGTATGGTCGCTTAGACTCATCTG 

CATTCCCACGTAATAACAAAACTGATGTTATTGCATCTGCGGTTAAAGAT 

GCAACACACTCAATGGATATCAAACTTGTTGTAACAATTACTGAAACAGG 

TAATACAGCTCGTGCCATTTCTAAATTCCGTCCAGATGCAGACATTTTGG 

CTGTTACATTTGATGAAAAAGTACAACGTTCATTGATGATTAACTGGGGT 

GTTATCCCTGTCCTTGCAGACAAACCAGCATCTACAGATGATATGTTTGA 

GGTTGCAGAACGTGTAGCACTTGAAGCAGGATTTGTTGAATCAGGCGATA 

ATATCGtTATCGTTGCAGGTGTTCCTGTAGGTACAGGTGGAACTAACACA 

ATGCGTGTTCGTACTGTTAAA 

SEQ ID NO. 7210 

STRAIN 1169NT 

AATAAACGCGTAAAAATCGTTGCAAC 

ACTTGGTCCTGCGGTAGAATTCCGTGGTGGTAAGAAGTTTGGTGAGTCTG 
GATACTGGGGTGAAAGCCTTGACGTAGAAGCTTCAGCAGAAAAAATTGCT 
CAATTGATT AAAGAAGGTGCT7VACGTTTT CCGTTT CAACTT CTCACATGG 
AGATCATGCTGAGCAAGGAGCTCGTATGGCTACTGTTCGTAAAGCAGAAG 
AGATTGCAGGACAAAAAGTTGGCTTCCTCCTTGATACTAAAGGACCTGAA 
ATTCGTACAGAACTTTTTGAAGATGGTGCAGATTTCCATTCATATACAAC 
AGGTACAAAATTACGTGTTGCTACTAAGCAAGGTAT CAAATC AACT CCAG 
AAGTGATTGCATTGAATGTTGCTGGTGGACTTGACATCTTTGATGACGTT 
GAAGTTGGTAAGCAAATCCTTGTTGATGATGGTAAACTAGGTCTTACTGT 
GTTTGCAAAAGATAAAGACACTCGTGAATTTGAAGTAGTTGTTGAGAATG 
ATGGCCTTATTGGTAAACAAAAAGGTGTAAACATCCCTTATACTAAAATT 
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CCTTTCCCAGCACTTGCAGAACGCGATAATGCTGATATCCGTTTTGGACT 
TGAGCAAGGACTTAACTTTATTGCTATCTCATTTGTACGTACTGCTAAAG 
ATGTTAATGAAGTTCGTGCTATTTGTGAAGAAACTGGCAATGGACACGTT 
AAGTTGTTTGcTAAAATTGAAAATCAaCAAGGTATCGATAATATTGATGA 
GATTATCGAAGCAGCAGATGGTATTATGATTGCTCGTGGTGATATGGGTA 
TCGAAGTTCCATTTGAAATGGTTCCAGTTTACCAAAaAATGATCATTACT 
AaAGTTAATGCAGCTGGTAAAGCAGTTATTACAGCAACAAATATGCTTGA 
AACAATGACTGATAAACCACGTGCGACTCGTTCAGAAGTATCTGATGTCT 
TCAATGCTGTTATTGATGGTACTGATGCTACAATGCTTTCAGGTGAGTCA 
GCTAATGGTAAATACCCAGTTGAGTCAGTTCGTACAATGGCTACTATTGA 
TAAAAATGCTCAAACAttACTCAATGAGTATGGTCGTTTAGACTCATCTG 
CATTCCCACGTAATAACAAAACTGATGTTATTGCATCTGCGGTTAAAGAT 
GCAACACACTCAATGGATATCAAACTTGTTGTAACAATTACTGAAACAGG 
TAATACAGCTCGTGCCATTTCTAAATTCCGTCCAGATGCAGACATTTTGG 
CTGTTACATTTGATGAAAAAGTACAACGTTCATTGATGATTAACTGGGGT 
GTTATCCCTGTCCTTGCAGACAAACCAGCATCTACAGATGATATGTTTGA 
GGTTGCAGAACGTGTAGCACTTGAAGCAGGACTTGTTGAATCAGGCGATA 
ATATCGTTATCGTTGCAGGTGTTCCTGTAGGTACAGGTGGAACTAACACA 
ATGCGTGTTCGTACTGTTAAA 

SEQ ID NO. 7211 

STRAIN JM9130013 
AATAAACGCGTAAAAATCGTTGCAAC 

ACTTGGTCCTGCGGTAGAATTCCGTGGTGGTAAGAAGTTTGGTGAGTCTG 
GATACTGGGGTGAAAGCCTTGACGTAGAAGCTTCAGCAGAAAAAATTGCT 
CAATTGATTAAAGAAGGTGCTAACGTTTTCCGTTTCAACTTCTCACATGG 
AGATCATGCTGAGCAAGGAGCTCGTATGGCTACTGTTCGTAAAGCAGAAG 
AGATTGCAGGACAAAAAGTTGGCTTCCTCCTTGATACTAAAGGACCTGAA 
ATTCGTACAGAACTTTTTGAAGATGGTTCAGATTTCCATTCATATACAAC 
AGGTACAAAATTACGTGTTGCTACTAAGCAAGGTATCAAATCAACTCCAG 
AAGTGATTGCATTGAATGTTGCTGGTGGACTTGACATCTTTGATGACGTT 
GAAGTTGGTAAGCAAATCCTTGTTGATGATGGTAAACTAGGTCTTACTGT 
GTTTGCAAAAGATAAAGACACTCGTGAATTTGAAGTAGTTGTTGAGAATG 
ATGGCCTTATTGGTAAACAAAAAGGTGTAAACATCCCTTATACTAAAATT 
CCTTTCCCAGCACTTGCAGAACGCGATAATGCTGATATCCGTTTTGGACT 
TGAGCAAGGACTTAACTTTATTGCTATCTCATTTGTACGTACTGCTAAAG 
ATGTTAATGAAGTTCGTGCTATTTGTGAAGAAACTGGCAATGGACATGTT 
AAGTTGTTTGCTAAAATTGaAAATCAaCAAGGTATCGATAATATTGATGA 
GATTATCGAAGCAGCAGATGGTATTATGATTGCTCGTGGTGATATGGGTA 
TCGAAGTTCCATTTGAAATGGTTCCAGTTTACCAAAAAATGATCATTACT 
AAAGTTAATGCAGCTGGTAAAGCAGTTAttACAGCAACAAATATGCTTGA 
AACAATGACTGATAAACCACGTGCGACTCGTTCAGAAGTATCTGATGTCT 
TCAATGCTGTTATTGATGGTACTGATGCTACAATGCTTTCAGGTGAGTCA 
GCTAATGGTAAATACCCAGTTGAGTCAGTTCGTACAATGGCTACTATTGA 
TAAAAATGCTCAAACATTACTCAATGAGTATGGTCGCTTAGACTCATCTG 
CATTCCCACGTAATAaCAAAACTGATGTTATTGCATCTGCGGTTAAAGAT 
GCAACACACTCAATGGATATCAAACTTGTTGTGACAATTACTGAAACAGG 
TAATACAGCTCGTGCCATTTCTAAATTCCGTCCAGATGCAGACATTTTGG 
CTGTTACATTTGATGAAAAAGTACAACGTTCATTGATGATTAACTGGGGT 
GTTATCCCTGTCCTTGCAGACAAACCAGCATCTACAGATGATATGTTTGA 
GGTTGCAGAACGTGTAgcACTTGAAGCAGGACTTGTTGAATCAGGCGATA 
ATATCGTTATCGTTGCAGGTGTTCCTGTAGGTACAGGTGGAACTAACACA 
ATGCGTGTTCGTACTGTTAAA 



SEQ ID NO. 7212 
STRAIN 2603 frame: 1 

MNKRVKIVATLGPAVEFRGGKKFGESGYWGESLDVEASAEKIAQLIKEGANVFRFNFSHG 
DHAEQGARMATVRKAEEIAGQKVGFLLDTKGPEIRTELFEDGADFHSYTTGTKLRVATKQ 
GIKSTPEVIALNVAGGLDIFDDVEVGKQILVDDGKLGLTVFAKDKDTREFEVWENDGLI 
GKQKGVNIPYTKIPFPALAERDNADIRFGLEQGLNFIAISFVRTAKDVNEVRAICEETGX 
GHVKLFAKIENQQGIDNIDEIIEAADGIMIARGDMGIEVPFEMVPVYQKMIITKVNAAGK 
AVITATNMLETMTDKPRATRSEVSDVFNAVIDGTDATMLSGESANGKYPVESVRTMATID 
KNAQTLLNEYGRLDSSAFPRNNKTDVIASAVKDATHSMDIKLWTITETGNTARAISKFR 
PDADILAVTFDEKVQRSLMINWGVIPVLADKPASTDDMFEVAERVALEAGFVESGDNIVI 
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VAGVPVGTGGTNTMRVRTVK 

SEQ ID NO. 7213 

STRAIN 090 frame: 1 

NKRVKIVATLGPAVEFRGGKKFGESGYWGESLDVEASAEKIAQLIKEGANVFRFNFSHGD 
HAEQGARMATVRKAEE I AGQKVGFLLDTKGPEIRTELFEDGS DFHS YTTGTELRVATKQG 
IKSTPEVIALNVAGGLDIFDDVEVGKQILVDDGKLGLTVFAKDKDTREFEVVVENDGLIG 
KQKGVNI PYTKI PFPALAERDNADIRFGLEQGLNFIAI S FVRTAKDVNEVRAICEETGNG 
HVKLFAKIENQQGIDNIDEIIEAADGIMIARGDMGIEVPFEMVPVYQKMIITKVNAAGKA 
VITATNMLETMTDKPRATRSEVSDVFNAVIDGTDATMLSGESANGKYPVESVRTMATIDK 
NAQTLLNEYGRLDSSAFPRNNKTDVIASAVKDATHSMDIKLVVTITETGNTARAISKFRP 
DADILAVTFDEKVQRSLMINWGVIPVLADKPASTDDMFEVAERVALEAGLVESGDNIVIV 
AGVPVGTGGTNTMRVRTVK 

SEQ ID NO. 7214 

STRAIN A909 frame: 1 

NKRVKIVATLGPAVEFRGGKKFGESGYWGESLDVEASAEKIAQLIKEGANVFRFNFSHGD 
HAEQGARMATVRKAEEIAGQKVGFLLDTKGPEIRTELFEDGADFHSYTTGTKLRVATKQG 
IKSTPEVIALNVAGGLDIFDDVEVGKQILVDDGKLGLWFAKDKDTREFEVVVENDGLIG 
KQKGVNI PYTKI PFPALAERDNADIRFGLEQGLNFIAIS FVRTAKDVNEVRAICEETGNG 
HVKLFAKIEN*QQGI DNI DE IIEAADGIMI ARGDMG IEVPFEMVPVYQKMI ITKVNAAGKA 
VIT ATNMLETMTDKPRATRSE VS DV-FNAVI DGT DATMLSGE SANGKY PVE SVRTMAT I DK 
NAQTLLNEYGRLDSSAFPRNNOTDVIASAVKDATHSMDIBCLVVTITETGNTARAISKFRP 
DADILAVTFDEKVQRSLMINWGVIPVLADKPASTDDMFEVAERVALEAG'FVESGDNIVIV. 
AGVPVGTGGTNTMRVRTVK 

SEQ ID NO. 7215 

STRAIN H36B frame: 1 

NKRVKIVATLGPAVEFRGGKKFGESGYWGESLDVEASAEKIAQLIKEGANVFRFNFSHGD 
HAEQGARMATVRKAEEIAGQKVGFLLDTKGPEIRTELFEDGADFHSYTTGTKLRVATKQG 
IKSTPEVIALNVAGGLDIFDDVEVGKQILVDDGKLGLTVFAKDKDTREFEVWENDGLIG 
KQKGVN I PYTKIPFPAIiAERDNAD I RFGLEQGLNFIAIS FVRTAKDVNEVRAICEETGNG 
HVKLFAKI EN QQGIDN IDE IIEAADGIMI ARGDMG IEVPFEMVPVYQKMI ITKVNAAGKA 
VI TATNMLETMT DKPRATRSE VS DVFNAV I DGT DATMLS GE SANGKYPVE SVRTMAT I DK 
NAQTLLNEYGRLDSSAFPRNNKTDVIASAVKDATHSMDIKLWTITETGNTARAISKFRP 
DADILAVTFDEKVQRSLMINWGVIPVIiADKPASTDDMFEVAERVALEAGFVESGDNIVIV 
AGVPVGTGGTNTMRVRTVK 

SEQ ID NO. 7216 

STRAIN 18RS21 frame: 1 

NKRVKIVATLGPAVEFRGGKKFGESGYWGESLDVEASAEKIAQLIKEGANVFRFNFSHGD 
HAEQGARMATVRKAEE I AGQKVG FLLDTKGPE I RTELFE DGADFHSYTTGTKLRVATKQG 
IKSTPEVIALNVAGGLDIFDDVEVGKQILVDDGKLGLTVFAKDKDTREFEVWENDGLIG 
KQKGVNIPYTKIPFPALAERDNADIRFGLEQGLNFIAIS FVRTAKDVNEVRAICEETGNG 
HVKLFAKIENQQGI DNI DEIIEAADGIMIARGDMGIEVPFEMVPVYQKMI ITKVNAAGKA 
VITATNMLETMTDKPRATRSEVSDVFNAVIDGTDATMLSGESANGKYPVESVRTMATIDK 
NAQTLLNE YGRLDS SAFPRNNKT DVI AS AVKDATHSMDIKLWT ITETGNTARAI SKE*RP 
DADILAVTFDEKVQRSLMINWGVIPVLADKPASTDDMFEVAERVALEAGFVESGDNIVIV 
AGVPVGTGGTNTMRVRTVK 

SEQ ID NO. 7217 

STRAIN M732 frame: 1 

NKRVKIVATLGPAVEFRGGKKFGESGYWGESLDVEASAEKIAQLIKEGANVFRFNFSHGD 
HAEQGARMATVRKAEEIAGQKVGFLLDTKGPEIRTELFE DGADFHSYTTGTKLRVATKQG 
IKSTPEVIALNVAGGLDIFDDVEVGKQILVDDGKLGLTVFAKDKDTREFEVWENDGLIG 
KQKGVN I PYTKI P FPALAERDNADIRFGLEQGLN FI AI S FVRTAKDVNE VRAI CEETGNG 
HVKLFAKI EN QQGIDN I DEI I EiAADGIMIARGDMGIEVPFEMVPVYQKM I ITKVNAAGKA 
VITATNMLETMTDKPRATRSEVSDVFNAVIDGTDATMLSGESANGKYPVESVRTMATIDK 
NAQTLLNE YGRLDS SAFPRNNKT DVI AS AVKDATHSMDIKLWT I TETGNTARAISKFRP 
DADILAVTFDEKVQRSLMINWGVIPVLADKPASTDDMFEVAERVALEAGLVESGDNIVIV 
AGVPVGTGGTNTMRVRTVK 

SEQ ID NO. 7218 

STRAIN COH1 frame: 1 
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NKRVKIVATLGPAVEFRGGKKFGESGYWGESLDVEASAEKIAQLIKEGANVFRFNFSHGD 
HAEQGARMATVRKAEEIAGQKVGFLLDTKGPEIRTELFEDGADFHSYTTGTKLRVATKQG 
IKSTPEVIALNVAGGLDIFDDVEVGKQILVDDGKLGLTVFAKDKDTREFEVVVENDGLIG 
KQKGVNI PYTKI PFPALAERDNADIRFGLEQGLNFIAIS FVRTAKDVNEVRAI CEETGNG 
HVKLFAKIENQQGIDNIDEIIEAADGIMIARGDMGIEVPFEMVPVYQKMIITKVNAAGKA 
VIT ATNMLETMTDKPRATRS EVS DVFNAVI DGT DATMLS GE SANGKYPVESVRTMAT I DK 
NAQTLLNEYGRLDS SAFPRNNKTDVIASAVKDATHSMDIKLWTITETGNTARAI SKFRP 
DADI LAVT FDEKVQRS LMINWGVI PVLADKPASTDDMFEVAERVALEAGLVE S GDN IVI V 
AGVPVGTGGTNTMRVRTVK 



SEQ ID NO. 7219 

STRAIN M781 frame: 1 

NKRVKIVATLGPAVEFRGGKKFGESGYWGESLDVEASAEKIAQLIKEGANVFRFNFSHGD 
HAEQGARMATVRKAEE I AGQKVG FLLDTKGPE IRTELFE DGADFHS YTTGTKLRVATKQG 
IKSTPEVIALNVAGGLDIFDDVEVGKQILVDDGKLGLTVFAKDKDTREFEVWENDGLIG 
KQKGVN I PYTKI PFPALAERDNADIRFGLEQGLN FI AI S FVRTAKDVNEVRAI CEETGNG 
HVKLFAKIENQQGIDNIDEIIEAADGIMIARGDMGIEVPFEMVPVYQKMIITKVNAAGKA 
VITATNMLETMT DKPRATRSEVS DVFNAVI DGT DATMLSGE SANGKYPVESVRTMAT I DK 
NAQTLLNEYGRLDS SAFPRNNKTDVIASAVKDATHSMDIKLWTITETGNTARAI SKFRP 
DAD I LAVT FDEKVQRS LMINWGVI PVLADKPAST DDMFE VAERVALEAGLVE SGDN I VI V 
AGV PVGTGGTNTMRVRT VlC 

SEQ if) NO. 7220 

STRAIN CJB110 frame: 1 . 

NKRVKIVATLGPAVEFRGGKKFGESGYWGESLDVEASAEKIAQLIKEGANVFRFNFSHGD 
HAEQGARMATVRKAEE I AGQKVG FLLDTKGPEIRTELFEDGADFHSYTTGTKLRVATKQG 
IKSTPEVIALNVAGGLDIFDDVEVGKQILVDDGKLGLTVFAKDKDTREFEVWENDGLIG 
KQKGVNI PYTKI PFPALAERDNADIRFGLEQGLNFIAI S FVRTAKDVNEVRAI CEETGNG 
HVKLFAKIENQQGIDNIDEIIEAADGIMIARGDMGIEVPFEMVPVYQKMIITKVNAAGKA 
VITATNMLETMT DKPRATRSEVS DVFNAVI DGT DATMLSGE SANGKYPVESVRTMAT I DK 
NAQTLLNEYGRLDS SAFPRNNKTDVIASAVKDATHSMDIKLWTITETGNTARAI SKFRP 
DADILAVTFDEKVQRSLMINWGVIPVLADKPASTDDMFEVAERVALEAGFVESGDNIVIV 
AGVPVGTGGTNTMRVRTVK 

SEQ ID NO. 7221 
STRAIN 1169NT frame: 1 

NKRVKIVATLGPAVEFRGGKKFGESGYWGESLDVEASAEKIAQLIKEGANVFRFNFSHGD 
HAEQGARMATVRKAEE I AGQKVG FLLDTKGPEIRTELFEDGADFHSYTTGTKLRVATKQG 
IKSTPEVIALNVAGGLDIFDDVEVGKQILVDDGKLGLTVFAKDKDTREFEVWENDGLIG 
KQKGVN I PYTKI PFPALAERDNADIRFGLEQGLN FI AI S FVRTAKDVNEVRAI CEETGNG 
HVKLFAKIENQQGIDNIDEIIEAADGIMIARGDMGIEVPFEMVPVYQKMIITKVNAAGKA 
VITATNMLETMTDKPRATRSEVSDVFNAVIDGTDATMLSGESANGKYPVESVRTMATIDK 
NAQTLLNEYGRLDSSAFPRNNKTDVIASAVKDATHSMDIKLWTITETGNTARAI SKFRP 
DAD I LAVT FDEKVQRS LMINWGV I PVIiADKPAST DDMFE VAERVALEAGLVE SGDN I VI V 
AGVPVGTGGTNTMRVRTVK 

SEQ ID NO. 7222 

STRAIN JM9130013 frame: 1 

NKRVKIVATLGPAVEFRGGKKFGESGYWGESLDVEASAEKIAQLIKEGANVFRFNFSHGD 
HAEQGARMATVRKAEE IAGQKVGFLLDTKGPEIRTELFEDGSDFHSYTTGTKLRVATKQG 
IKSTPEVIALNVAGGLDIFDDVEVGKQILVDDGKLGLTVFAKDKDTREFEVWENDGLIG 
KQKGVNI PYTKI PFPALAERDNADIRFGLEQGLNFIAI SFVRTAKDVNEVRAICEETGNG 
HVKLFAKIENQQGIDNIDEIIEAADGIMIARGDMGIEVPFEMVPVYQKMIITKVNAAGKA 
VITATNMIjETMT DKPRATRSEVS DVFNAVI DGT DATMLSGESANGBCYPVESVRTMAT I DK 
NAQTLLNEYGRLDSSAFPRNNKTDVIASAVKDATHSMDIKLWTITETGNTARAI SKFRP 
DADI LAVT FDEKVQRS LMINWGVI PVLADKPASTDDMFEVAERVALEAGLVE SGDN I VI V 
AGVPVGTGGTNTMRVRTVK 



SEQ ID NO. 7301 
STRAIN 2603 

TTGTCTGCTATAATAGACAAAAAGGTGGTGATATTTATGTATTTAGCATTAATCGGTGAT 
ATCATTAATTCAAAACAGATACTTGAACGTGAAACTTTCCAACAGTCTTTTCAGCAACTA 
ATGACCGAACTATCTGATGTATATGGTGAAGAGCTGATTTCTCCATTCACTATTACAGCT 
GGTGATGAATTTCAAGCTTTATTGAAACCATCAAAAAAGGTATTTCAAATTATTGACCAT 
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ATTCAACTAGCTCTAAAACCTGTTAATGTAAGGTTCGGCCTCGGTACAGGAAACATTATA 
ACATCCATCAATTCAAATGAAAGTATCGGTGCTGATGGTCCTGCCTACTGGCATGCTCGC 
TCAGCTATTAATCATATACATGATAAAAATGATTATGGAACAGTTCAAGTAGCTATTTGC 
CTTGATGATGAAGACCAAAACCTTGAATTAACACTAAATAGTCTCATTTCAGCTGGTGAT 
TTTATCAAGTCAAAATGGACTACAAACCATTTTCAAATGCTTGAGCACTTAATACTTCAA 
GATAATTATCAAGAACAATTTCAACATCAAAAGTTAGCCCAACTGGAAAATATTGAACCT 
AGTGCGCTGACTAAACGCCTTAAAGCAAGCGGTCTGAAGATTTACTTAAGAACGAGAACA 
CAGGCAGCCGATCTATTAGTTAAAAGTTGCACTCAAACTAAAGGGGGAAGCTATGATTTC 

SEQ XD NO. 7302 

STRAIN 090 

TCTGCTATAATAGACAAAAAGGTGGTGATATTTATGTATTT 
AGCATTAATCGGTGATATCATTAATTCAAAACAGATACTTGAACGTGAAA 
CTTTCCAACAGTCTTTTCAGCAAcTAATGACCGAACTATcTGATGTATAT 
GGTGAAGAGCTGATTTCTCCATTCACTATTACAGCTGGTGATGAATTTCA 
AGCTTTATTGAAACCATCAAAAAAGGTATTTCAAATTATTGACCATATTC 
AACTAGCTCTAAAACCTGTTAATGTAAGGTTCGGCCTCGGtACAGGAAAC 
ATTATAACATCCATCAATTTAAATGAAAGTATCGGTGCTGATGGTCCTGC 
CTACTGGCATGCTCGCTCAGCTATTAATCATATACATGATAAAAATGATT 
ATGGAACAGTTCAAGTAGGTATTTGCCTTGATGATGAAGACCAAAACCTT 
GAATTAACACTAAATAGTCTCATTTCAGCTGGTteATTTTATCAAGTCAAA 
ATGGACTACAAACXIATTTTCAAATGCTTGAGCACTTAATACTTCAAGATA 
ATTATCAAGAACAATTTCAACATCAAAAGTTAGCCCAACTGGAAAATATT 
r GAACCTAGTGCGCTGACTAAACGCCTTAAAGCAAGCGGTCTGAAGATT.TA 
GTTAAGAACGAGAACACAGGCAGCCGATCTATTAGTTAAAAGTTGCACTC 
AAACTAAAGGGGGAAGCTATGATTTC 

SEQ ID NO. 7303 

STRAIN A909 

TCTGCTATAATAGACAAAAAGGTGGTGATATTTATGTAT 

TTAGCATTAATCGGTGATATCATTAATTCAAAACAGATACTTGAACGTGA 

AACTTT CCAACAGTCTTTTCAGCAACTAATGACCGAACTAT CTGATGT AT 

ATGGTGAAGAGCTGATTTCTCCATTCACTATTACAGCTGGTGATGAATTT 

CAAGCTTTATTGAAACCATCAAAAAAGGTATTTCAAATTATTGACCATAT 

TCAACTAGCTCTAAAACCTGTTAATGTAAGGTTCGGCCTCGGTACAGGAA 

ACATTATAACATCCATCAATTCAAATGAAAGTATCGGTGCTGATGGTCCT 

GCCTACTGGCATGCTCGCTCAGCTATTAATCATATACATGATAAAAATGA 

TTATGGAACAGTTCAAGTAGCTATTTGCCTTGATGATGAAGACCAAAACC 

TTGAATTAACACTAAATAGTCTCATTTCAGCTGGTGATTTTATCAAGTCA 

AAATGGACTACAAACCATTTTCAAATGCTTGAGCACTTAATACTTCAAGA 

TAATTATCAAGAACAATTTCAACATCAAAAGTTAGCCCAACTGGAAAATA 

TTGAACCTAGTGCGCTGACTAAACGCCTTAAAGCAAGCGGTCTGAAGATT 

TACTTAAGAACGAGAACACAGGCAGCCGATCTATTAGTTAAAAGTTGCAC 

TCAAACTAAAGGGGGAAGCTATGATTTC 

SEQ ID NO. 7304 

STRAIN H36B 

TCTGCTATAATAGACAAAAAGGTGGTGATATTT 

ATGTATTTAGCATTAATCGGTGATATCATTAATTCAAAACAGATACTTGA 
ACGTGAAACTTTCCAACAGTCTTTTCAGCAACTAATGACCGAACTATCTG 
ATGTATATGGTGAAGAGCTGATTTCTCCATTCACTATTACAGCTGGTGAT 
GAATTTCAAGCTTTATTGAAACCATCAAAAAAGGTATTTCAAATTATTGA 
CCATATTCAACTAGCTCTAAAACCTGTTAATGTAAGGTTCGGCCTCGGTA 
CAGGAAACATTATAACATCCATCAATTCAAATGAAAGTATCGGTGCTGAT 
GGTCCTGCCTACTGGCATGCTCGCTCAGCTATTAATCATATACATGATAA 
AAATGATTATGGAACAGTTCAAGTAGCTATTTGCCTTGATGATGAAGACC 
AAAACCTTGAATTAACACTAAATAGTCTCATTTCAGCTGGTGATTTTATC 
AAGTCAAAATGGACTACAAACCATTTTCAAATGCTTGAGCACTTAATACT 
TCAAGATAATTATCAAGAACAATTTCAACATCAAAAGTTAGCCCAACTGG 
AAAATATTGAACCTAGTGCGCTGACTAAACGCCTTAAAGCAAGCGGTCTG 
AAGATTTACTTAAGAACGAGAACACAGGCAGCCGATCTATTAGTTAAAAG 
TTGCACTCAAACTAAAGGGGGAAGCTATGATTTC 

SEQ XD NO. 7305 
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STRAIN 18RS21 

TCTGCTATAATAGACAAAAAGGTGGTGATATTT 

ATGTATTTAGCATTAATCGGTGATATCATTAATTCAAAACAGATACTTGA 
ACGTGAAACTTTCCAACAGTCTTTTCAGCAACTAATGACCGAACTATCTG 
ATGTATATGGTGAAGAGCTGATTTCTCCATTCACTATTACAGCTGGTGAT 
GAATTTCAAGCTTTATTGAAACCATCAAAAAAGGTATTTCAAATTATTGA 
CCATATTCAACTAGCTCTAAAACCTGTTAATGTAAGGTTCGGCCTCGGTA 
CAGGAAACATTATAACATCCATCAATTCAAATGAAAGTATCGGTGCTGAT 
GGTCCTGCCTACTGGCATGCTCGCTCAGCTATTAATCATATACATGATAA 
AAATGATTATGGAACAGTTCAAGTAGCTATTTGCCTTGATGATGAAGACC 
AAAACCTTGAATTAACACTAAATAGTCTCATTTCAGCTGGTGATTTTATC 
AAGTCAAAATGGACTACAAACCATTTTCAAATGCTTGAGCACTTAATACT 
TCAAGATAATT ATCAAGAACAATTT CAACAT CAAAAGTTAGCCCAACTGG 
AAAATATTGAACCTAGTGCGCTGACTAAACGCCTTAAAGCAAGCGGTCTG 
AAGATTTACTTAAGAACGAGAACACAGGCAGCCGATCTATTAGTTAAAAG 
TTGCACTCAAACTAAAGGGGGAAGCTATGATTTC 

SEQ ID NO. 7306 

STRAIN M732 

TCTGCTATAATAGACAAAAAGGTGGTGATATT 

TATGTATTTAGCATTAATCGGTGATATCATTAATTCAAAACAGATACTTG. 
AACGTGAAACTTTCCAACAGTCTTTTCAGCAACTAATGACCGAACTATCT 
GATGTATATGGTGAAGAGCTGATTTCTCCATTCACTATTACAGCTGG^GA 
TGAATTTCAAGCTTTATTGAAACaATCAAAAAAGGTATTTCAAATTATTG 
ACCATATTCAACTAGCTCTAAAACCTGTTAATGTAAGGTTCGGCCTCGGT 
ACAGGAAACATTATAACATCCATCAATTCAAATGAAAGTATCGGTGCTGA 
TGGTCCTGCCTACTGGCATGCTCGCTCAGCTATTAATCATATACATGATA 
AAAATGATTATGGAACAGTTCAAGTAGCTATTTGCCTTGATGATGAAGAC 
CAAAACCTTGAATTAACACTAAATAGTCTCATTTCAGCTGGTGATTTTAT 
CAAGTCAAAATGGACTACAAACCATTTTCAAATGCTTGAGCACTTAATAC 
TTCAAGATAATTATCAAGAACAATTTCAACATCAAAAGTTAGCCCAACTG 
GAAAATATTGAACCTAGTGCGCTGACTAAACGCCTTAAAGCAAGCGGTCT 
GAAGATTTACTTAAGAACGAGAACACAGGCAGCCGATCTATTAGTTAAAA 
GTTGCACTCAAACTAAAGGGGGAAGCTATGATTTC 

SEQ ID NO. 7307 

STRAIN COH1 

TCTGCTATAATAGACAAAAAGGTGGTGATATT 

TATGTATTTAGCATTAATCGGTGATATCATTAATTCAAAACAGATACTTG 
AACGTGAAACTTTCCAACAGTCTTTTCAGCAACTAATGACCGAACTATCT 
GATGTATATGGTGAAGAGCTGATTTCTCCATTCACTATTACAGCTGGTGA 
TGAATTTCAAGCTTTATTGAAACaATCAAAAAAGGTATTTCAAATTATTG 
ACCATATTCAACTAGCTCTAAAACCTGTTAATGTAAGGTTCGGCCTCGGT 
ACAGGAAACATTATAACATCCATCAATTCAAATGAAAGTATCGGTGCTGA 
TGGTCCTGCCTACTGGCATGCTCGCTCAGCTATTAATCATATACATGATA 
AAAATGATTATGGAACAGTTCAAGTAGCTATTTGCCTTGATGATGAAGAC 
CAAAACCTTGAATTAACACTAAATAGTCTCATTTCAGCTGGTGATTTTAT 
CAAGTCAAAATGGACTACAAACCATTTTCA/^ATGCTTGAGCACTTAATAC 
TTCAAGATAATTATCAAGAACAATTTCAACATCAAAAGTTAGCCCAACTG 
GAAAATATTGAACCTAGTGCGCTGACTAAACGCCTTAAAGCAAGCGGTCT 
GAAGATTTACTTAAGAACGAGAACACAGGCAGCCGATCTATTAGTTAAAA 
GTTGCACTCAAACTAAAGGGGGAAGCTATGATTTC 

SEQ ID NO. 7308 

STRAIN M781 

TCTGCTATAATAGACAAAAAGGTGGTGATATTT 

ATGTATTTAGCATTAATCGGTGATATCATTAATTCAAAACAGATACTTGA 
ACGTGAAACTTTCCAACAGTCTTTTCAGCAACTAATGACCGAACTATCTG 
ATGTATATGGTGAAGAGCTGATTTCTCCATTCACTATTACAGCTGGTGAT 
GAATTTCAAGCTTTATTGAAACAATCAAAAAAGGTATTTCAAATTATTGA 
CCATATTCAACTAGCTCTAAAACCTGTTAATGTAAGGTTCGGCCTCGGTA 
CAGGAAACATTATAAC ATCCAT CAATTCAAATGAAAGT AT CGGTGCTGAT 
GGTCCTGCCTACTGGCATGCTCGCTCAGCTATTAATCATATACATGATAA 
AAATGATTATGGAACAGTTCAAGTAGCTATTTGCCTTGATGATGAAGACC 
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AAAACCTTGAATTAACACTAAATAGTCTCATTTCAGCTGGTGATTTTATC 
AAGTCAAAATGGACTACAAACCATTTTCAAATGCTTGAGCACTTAATACT 
TCAAGATAATTATCAAGAACAATTTCAACATCAAAAGTTAGCCCAACTGG 
AAAATATTGAACCTAGTGCGCTGACTAAACGCCTTAAAGCAAGCGGTCTG 
AAGATTTACTTAAGAACGAGAACACAGGCAGCCGATCTATTAGTTAAAAG 
TTGCACTCAAACTAAAGGGGGAAGCTATGATTTC 

SEQ XD NO. 7309 

STRAIN CJB110 

TCTGCTATAATAGACAAAAAGGTGGTGGTA 

TTTATGTATTTAGCATTAATCGGTGATATCATTAATTCAAAACAGATACT 

TGAACGTGAAACTTTCCAACAGTCTTTTCAGCAACTAATGACCGAACTAT 

CTGATGTATATGGTGAAGAGCTGATTTCTCTATTCACTATTACAGCTGGT 

GATGAATTTCAAGCTTTATTGAAACCATCAAAAAAGGTATTTCAAATTAT 

TGACCATATTCAACTAGCTCTAAAACCTGTTAATGTAAGGTTCGGCCTCG 

GTACAGGAAACATTATAACATCCATCAATTCAAATGAAAGTATCGGTGCT 

GATGGTCCTGCCTACTGGCATGCTCGCTCAGCTATTAATCATATACATGA 

TAAAAATGATTATGGAACAGTTCAAGTAGCTATTTGCCTTGATGATGAAG 

ACCAAAACCTTGAATTAACACTAAATAGTCTCATTTCAGGTGGTGATTTT 

ATCAAGTCAAAATGGACTACTAAGCATTTTCAMVTGCTTGAGCACTTAAT 

ACTTCAAGATAATTATCAAGAACAATTTCAACATCAAAAGTTAGCCCAAC • 

TGGA7^AATATTGAACCTAGTGCGCTGACTAAACGCCTTAAAGCAAGCGGT ' 

CTGAAGATTTACTTAAGAACG^GAACACAGGCAGCCGATCTATTAGTTAA 

AAGTTGCACTCAAACTAAAGGGGGAAGCTATGATTTc 

SEQ XD MO. 7310 

STRAIN JM9130013 

TCTGCTATAATAGACAAAAAGGTGGTGATATTT 

ATGTATTTAGCATTAATCGGTGATATCATTAATTCAAAACAGATACTTGA 
ACGTGAAACTTTCCAACAGTCTTTTCAGCAACTAATGACCGAACTATCTG 
ATGTATATGGTGAAGAGCTGATTTCTCCATTCACTATTACAGCTGGTGAT 
GAATTTCAAGCTTTATTGAAACCATCAAAAAAGGTATTTCAAATTATTGA 
CCATATTCAACTAGCTCTAAAACCTGTTAATGTAAGGTTCGGCCTCGGTA 
CAGGAAACATTATAACATCCATCAATTCAAATGAAAGTATCGGTGCTGAT 
GGTCCTGCCTACTGGCATGCTCGCTCAGCTATTAATCATATACATGATAA 
AAATGATTATGGAACAGTTCAAGTAGCTATTTGCCTTGATGATGAAGACC 
AAAACCTTGAATTAACACTAAATAGTCTCATTTCAGCTGGTGATTTTATC 
AAGTCAAAATGGACTACAAACCATTTTCAAATGCTTGAGCACTTAATACT 
TCAAGATAATTATCAAGAACAATTTCAACATCAAAAGTTAGCCCAACTGG 
AAAATATTGAACCTAGTGCGCTGACTAAACGCCTTAAAGCAAGCGGTCTG 
AAGATTTACTTAAGAACGAGAACACAGGCAGCCGATCTATTAGTTAAAAG 
TTGCACTCAAACTAAAGGGGGAAGCTATGATTTC 

SEQ ID NO. 7311 
STRAIN 2603 frame: 1 

LSAIIDKKWITOYLALIGDIINSKQILERETFQQSFQQLMTELSDVYGEELISPFTITA 
GDEFQALLKPSKKVFQIIDHIQLALKPVNVRFGLGTGNIITSINSNESIGADGPAYWHAR 
SAINHIHDKNDYGTVQVAICLDDEDQNLELTLNSLISAGDFIKSKWTTNHFQMLEHLILQ 
DNYQEQFQHQKLAQLENIEPSALTKRLKASGLKIYLRTRTQAADLLVKSCTQTKGGSYDF 

SEQ ID NO. 7312 

STRAIN 090 frame: 1 

SAIIDKKWIFMYLALIGDIINSKQILERETFQQSFQQLMTELSDVYGEELISPFTITAG 
DE FQALLKPSKKVFQI I DHIQLALKPVNVRFGLGTGNI ITS INLNES IGADG PAYWHARS 
AINHIHDKNDYGTVQVAICLDDEDQNLELTLNSLISAGDFIKSKWTTNHFQMLEHLILQD 
NYQEQFQHQKLAQLENIEPSALTKRLKASGLKIYLRTRTQAADLLVKSCTQTKGGSYDF 

SEQ ID NO. 7313 
STRAIN A909 frame: 1 

SAIIDKKVVIFMYLALIGDIINSKQILERETFQQSFQQLMTELSDVYGEELISPFTITAG 
DEFQALLKPSKKVFQIIDHIQLALKPVNVRFGLGTGNIITSINSNESIGADGPAYWHARS 
AINHIHDKNDYGTVQVAICLDDEDQNLELTLNSLISAQDFIKSKWTTNHFQMLEHLILQD 
NYQEQFQHQKLAQLENIEPSALTKRLKASGLKIYLRTRTQAADLLVKSCTQTKGGSYDF 
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SEQ ID NO. 7314 

STRAIN H36B frame: 1 

SAIIDKKWIFMYIALIGDIINSKQILERETFQQSFQQLMTELSDVYGEELISPFTITAG 
DEFQALLKPSKKVFQIIDHIQLALKPVNVRFGLGTGNIITSINSNESIGADGPAYWHARS 
AINHIHDKNDYGTVQVAICLDDEDQNLELTLNSLISAGDFIKSKWTTNHFQMLEHLILQD 
NYQEQFQHQKLAQLENIEPSALTKRLKASGLKIYLRTRTQAADLLVKSCTQTKGGSYDF 

SEQ ID NO. 7315 

STRAIN 18RS21 frame: 1 

SAIIDKKWIFMYLALIGDIINSKQILERETFQQSFQQLMTELSDVYGEELISPFTITAG 
DEFQALLKPSKKVFQIIDHIQLALKPVNVRFGLGTGNIITSINSNESIGADGPAYWHARS 
AINHIHDKNDYGTVQVAICLDDEDQNLELTLNSLISAGDFIKSKWTTNHFQMLEHLILQD 
NYQEQFQHQKLAQLENIEPSALTKRLKASGLKIYLRTRTQAADLLVKSCTQTKGGSYDF 

SEQ ID NO. 7316 

STRAIN M732 frame: 1 

SAIIDKKVVIFMYLALIGDIINSKQILERETFQQSFQQLMTELSDVYGEELISPFTITAG 
DEFQALUCQSKKVFQIIDHIQLALKPVNVRFGLGTGNIITSINSNESIGADGPAYWHARS 
AINHIHDKNDYGTVQVAICLDDEDQNLELTLNSLISAGDFIKSKWTTNHFQMLEHLILQD 
NYQEQFQHQKLAQLENIEPSALTKRLKASGLKIYLRTRTQAADLLVKSCTQTKGGSYDF 

SEQ ID NO. 7317 

STRAIN COH1 frame: 1 

SAIIDKKWIFMYLALIGDIINSKQILERETFQQSFQQLMTELSDVYGEELISPFTITAG 
DE FQALLKQSKKVFQI I DHIQLALKPVNVRFGLGTGN I ITS INSNE S I GADG PAYWHARS 
AINHIHDKNDYGTVQVAICLDDEDQNLELTLNSLISAGDFIKSKWTTNHFQMLEHLILQD 
NYQEQFQHQKLAQLENIEPSALTKRLKASGLKIYLRTRTQAADLLVKSCTQTKGGSYDF 

SEQ ID NO. 7318 

STRAIN M781 frame: 1 

SAIIDKKWiraYLALIGDIINSKQILERETFQQSFQQLMTELSDVYGEELISPFTITAG 
DEFQALLKQSKKVFQIIDHIQLALKPVNVRFGLGTGNIITSINSNESIGADGPAYWHARS 
AINHIHDKNDYGTVQVAICLDDEDQNLELTLNSLISAGDFIKSKWTTNHFQMLEHLILQD 
NYQEQFQHQKLAQLENIEPSALTKRLKASGLKIYLRTRTQAADLLVKSCTQTKGGSYDF 

SEQ ID NO. 7319 

STRAIN CJB110 frame: 1 

SAIIDKKVVVFMYLALIGDIINSKQILERETFQQSFQQLMTELSDVYGEELISLFTITAG 
DEFQALLKPSKKVFQI I DHIQLALKPVNVRFGLGTGN I ITS IN SNESIGADGPAYWHARS 
AINHIHDKNDYGTVQVAICLDDEDQNLELTLNSLISAGDFIKSKWTTNHFQMLEHLILQD 
NYQEQFQHQKLAQLENIEPSALTKRLKASGLKIYLRTRTQAADLLVKSCTQTKGGSYDF 

SEQ ID NO. 7320 

STRAIN OM9130013 frame: 1 

SAIIDKKWIFMYLALIGDIINSKQILERETFQQSFQQLMTELSDVYGEELISPFTITAG 
DEFQALIiKPSKKVFQIIDHIQLALKPVNVRFGLGTGNIITSIN SNESIGADGPAYWHARS 
AINHIHDKNDYGTVQVAICLDDEDQNLELTLNSLISAGDFIKSKWTTNHFQMLEHLILQD 
NYQEQFQHQKLAQLENIEPSALTKRLKASGLKIYLRTRTQAADLLVKSCTQTKGGSYDF 

SEQ ID NO. 7401 
STRAIN 2603 

ATGGAAATGCAAGTTCAAAAAAGTTTTAAATCAAATATACATTACGGAACACTCTAT 

CTAGTCCCAACTCCAATTGGTAATCTAGATGATATGACTTTTCGTGCCATTAGGATTTTA 

AGAGAAGTTGATTTTATTTGTGCAGAGGATACACGAAATACGGGACTTTTACTCAAGCAC 

TTTGATATTACTACTAAACAAATTAGTTTTCACGAACACAATGCTTACGATAAAATCTCT 

GGGTTAATTGATTTGTTAAAAGAAGGGAAATCTTTAGCCCAAGTATCTGATGCAGGAATG 

CCCTCTATTTCTGACCCAGGACATGACCTTGTCAAGGCTGCTATTGAAGGGGATATCCCA 

GTTGTATCTATACCAGGAGCTAGCGCTGGTATTACTGCTCTCATCGCTTCAGGTTTAGCT 

CCACAACCTCATATTTTTTATGGCTTCTTACCTCGTAAGAAAGGTCAACAAATAACTTTC 

TTTGAAACAAAGCAAGATTACCCTGAAACACT^AATCTTTTATGAGTCACCGTTTCGAGTC 

TCTGATACGCTAAAACACATGAAAGAGATTTACGGAGATCGCCAAGTTGTTTTAGTACGC 

GAATTGACGAAACTCTATGAAGAGTATCAAAGAGGAACCATTAGTCAACTTTTAGAGCAT 

ATTGAAAAGGTCCCTCTCAAAGGTGAATGCTTAATTATTGTTGATGGTAAGAGAGATACC 

GAGCGAGTGAAAGACAGTAGCCAACAAGATCCACTAGTATTAGTAAAAGAATATATCGCT 
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AATGGTGATAAAACTAATCAAGCGATAAAAAAAGTAGCAAAAGAATTTAATCTCAATAGA 
CAAGAACTCTATGCTAGTTTCCATGATTTA 

SEQ ID NO. 7402 
STRAIN 090 

GAAATGCAAGTTCAAAAAAGTTTTAAATCAAATACACATTACGGGACACT 
CTATCTAGTCCCAACTCCAATTGGTAATCTAGATGATATGACTTTTCGTG 
CCATTAGGATTTTAAGAGAAGTTGATTTTATTTGTGCAGAGGATACACGA 
AATACGGGACTTTTACTCAAGCACTTTGATATTACTACTAAACAAATTAG 
TTTTCACGAACACAATGCTTACGATAAAATCTCTGGGTTAATTGATTTGT 
T AAAAGAAGGGAGAT CTTTAGCCCAAGTAT CTGATGCAGGAATGCCCTCT 
ATTTCTGACCCAGgACATGACCTTGTCAAGGCTGCTATTGAAGGGGGGAT 
CCCGGTCGTATCTATACCAGGAGCTAGCGCTGGTATTACTGCTCTCATCG 
CTTCAGGTTTAGCTCCACAACCTCATATTTTTTATGGCTTCTTACCGCGT 
AAGAAAGGTCAACAAATAACTTTTTTTGAAACAAAGAAAGATTACCCTGa 
AACACAAATCTTTTATGAGTCACCGtTTCGAGTCTcTGATACGCTAAAAC 
ACATGAAAGAGATTTACGGAGATCGCCAAGTTGTTTTAGTACGCGAATTG 
ACGAAaCTCTATGAAGAGTATCAAAGAGGAACCATTAGTCAACTTTTAGG 
GCATATTGAAAAAGTCCCTCTCAAAGGTGAATGCTTAATTATTGTTGATG 
GTAAGAGAGATACCGAGCGAGTGAAAGACAGTAGCCAACAAGATCCACTA 
GTATTAGTAA 

. r • 

SEQ ID NO. . 7403 

STRAIN A909 . 

AGTTCAAAAAAGTTTTAAATCAAATATACATTACGGAACACTCTATCTAG 

TCCCAACTCCAATTGGTAATCTAGATGATATGACTTTTCGTGCCATTAGG 

ATTTTAAGAGAAGTTGATTTTATTTGTGCAGAGGATACACGAAATACGGG . 

ACTT TT ACT CAAGCACT TTGAT ATT ACT ACT AAAC AAATT AGTT T T CACG 

AACACAATGCTTACGATAAAATCTCTGGGTTAATTGATTTGTTAAAAGAA 

GGGAAATCTTTAGCCCAAGTATCTGATGCAGGAATGCCCTCTATTTCTGA 

CCCAGGACATGACCTTGTCAAGGCTGCTATTGAAGGGGATATCCCAGTTG 

TATCTATACCAGGAGCTAGCGCTGGTATTACTGCTCTCATCGCTTCAGGT 

TTAGCTCCACAACCTCATATTTTTTATGGCTTCTTACCACGTAAGAAAGG 

TCAACAAATAACTTTCTTTgAAACAAAGCAAGATTACCCTGAAACACAAA 

TCTTTTATGAGTCACCGTTTCGAGTCTCtGATACGCTAAAACACATGAAA 

GAGATTTACGGAGATCGCCAAGTTGTTTTAGTACGCGAATTGACGAAACT 

CTATGAAGAGTATCAAAGAGGAACCATTAGTCAACTTTTAGAGCATATTG 

AAAAGGTCCCTCTCAAAGGTGAATGCTTAATTATTGTTGATGGTAAGAGA 

GATACCGAGCGAGTGAAAGACAGTAGCCAACAAGATCCACTAGTATTAGT 

AA 

SEQ ID NO. 7404 

STRAIN H36B 

GAAATGCAAGTTCAAAAAAGTTTTAAATCAAATACACATT 

ACGGGACACTCTATCTAGTCCCAACTCCAATTGGTAATCTAGATGATATG 

ACTTTTCGTGCCATTAGGATTTTAAGAgAAGTTGATTTTATTTGTGCAGA 

GGATACACGAAATACGGGACTTTTACTCAAGCACTTTGATATTACTACTA 

AACAAATTAGTTTTCACGAACACAATGCTTATGATAAAATCTCTGGGTTA 

ATTGATTTGTTAAAAGAAGGGAGATCTTTAGCCCAAGTATCTGATGCAGG 

AATGCCCTCTATTTCTGACCCAGGACATGACCTTGTCAAGGCTGCTATTG 

AAGGGGATATCCCGGTCGTATCTATACCAGGAGCTAGCGCTGGTATTACT 

GCTCTCATCGCTTCAGGTTTAGCTCCACAACCTCATATTTTTTATGGCTT 

CTTACCGCGTAAGCAAGGTCAACAAATAACTTTTTTTGAAACAAAGAAAG 

ATTACCCTGAAACACAAATCTTTTATGAGTCACCGtTTCGAGTCTCTGAT 

ACGCTAAAACACATGAAAGAGATTTATGGAGATCGCCAAGTTGTTTTAGT 

ACGCGAATTGACGAAACTCTATGAAGAGTATCAAAGAGGAACCATTAGTC 

AACTTTTAGGGCATATTGAAAAGGTCCCTCTCAAAGGTGAATGCTTAATT 

ATTGTTGATGGTAAGAGAGATACTGAGCGAGTGAAAGACAGTAGCCAACA 

AG AT CCACT AGT ATT AGTAA 

SEQ ID NO. 7405 

STRAIN 18RS21 

GAAATGCAAGTTCAAAAAAGTTTTAAAT C AAATAT ACATT 
ACGGAACACTCTATCTAGTCCCAACTCCAATTGGTAATCTAgATGATATG 



318 



WO 2004/018646 



PCT/US2003/026827 



SEQUENCE LISTING 



ACTTTtCGTGCCATTAGGATTTTAAGAGAAGTTGATTTTATTTGTGCAGA 
GgATACACGAAATACGGGACTTTTACTCAAGCACTTTGATATTACTACTA 
AACAAATTAGTTTTCACGAACACAATGCTTACGATAAAATCTCTGGGTTA 
ATTGATTTGTTAAAAGAAGGGAAATCTTTAGCCCAAGTATCTGATGCAGG 
AATGCCCTCTATTTCTGACCCAGGACATGACCTTGTCAAGGCTGCTATTG 
AAGGGGATATCCCAGTTGTATCTATACCAGGAGCTAGCGCTGGTATTACT 
GCTCTCATCGCTTCAGGTTTAGCTCCACAACCTCATATTTTTTATGGCTT 
CTTACCACGTAAGAAAGGTCAACAAATAACTTTCtTTGAAACAAAGCAAG 
ATTACCCTGAAACACAAATCTTTTATGAGTCACCGtTTCGAGTCTCTGAT 
ACGCTAAAACACATGAAAGAGATTTACGGAGATCGCCAAGTTGTTTTAGT 
ACGCGAATTGACGAAACTCTATGAAGAGTATCAAAGAGGAACCATTAGTC 
AACTTTTAGAGCATATTGAAAAGGTCCCTCTCAAAGGTGAATGCTTAATT 
ATTGTTGATGGTAAGAGAGATACCGAGCGAGTGAAAGACAGTAGCCAACA 
AGATCCACTAGTATTAGTAA 

SEQ ID NO. 7406 

STRAIN M732 

GAAATGCAAGTTCAAAAAAGTTTTAAATCAAAT 

ATACATTACGGAACACTCTATCTAGTCCCAACTCCAATTGGTAATCTAGA 
TGATATGACTTTTCGTGCCATTAGGATTTTAAGAGAAGTTGATTTTATTT 
* GTGCAGAGGATAC^CGAAATACGGGACTTTTACTCAAGCACTTTGATATT 
ACTACTAAACAAATTAGTTTTCACGAACACAATGCTTACGATAAAATCTC 
TGGGTTAATTGATTTGTTAAAAGAAGGGAAATCTTTAGCCCAAGTATCTG 
ATGCAGGAATGCCCTCTATTTCTGACCCAGGACATGACCTTGTCAAGGCT 
GCTATTGAA^GGGATATCCCAGTTGTATCTATACCAGGAGCTAGCGCTGG 
TATTACTGCTCTCATCGCTTCAGGTTTAGCTCCACAACCTGATATTTTTT 
ATGGCTTCTTACGACGTAAGAAAGGTCAACAAATAACTTTCTTTGAAACA 
AAGCAAGATTACCCTGAAACACAAATCTTTTATGAGTCACCGtTTCGAGT 
CTCTGATACGCTAAAACACATGAAAGAGATTTACGGAGATCGCCAAGTTG 
TTTTAGTACGCGAATTGACGAAACTCTATGAAGAGTATCAAAGAGGAACC 
. ATTAGTCAACTTTTAGAGCATATTGAAAAGGTCCCTCTCAAAGGTGAATG 
CTTAATTATTGTTGATGGTAAGAGAGATACCGAGCGAGTGAAAGACAGTA 
GCCAACAAGATCCACTAGTATTAGTAA 

SEQ ID NO. 7407 

STRAIN COH1 

GAAATGCAAGTTCAAAAAAGTTTTaAATCAAATATACATTAC 

GGAACACTCTATCTAGTCCCAACTCCAATTGGTAATCTAGATGATATGAC 

TTTTCGTGCCATTAGGATTTTAAGAGAAGTTGATTTTATTTGTGCAGAGG 

ATACACGAAATACGGGAcTTTTACTCAAGCACTT.TGATATTACTACTAAA 

CAAATTAGTTTTCACGAACACAATGCTTACGATAAAAT CT CTGGGTTAAT 

TGATTTGTTAAAAGAAGGGAAATCTTTAGCCCAAGTATCTGATGCAGGAA 

TGCCCTCTATTTCTGACCCAGGACATGACCTTGTCAAGGCTGCTATTGAA 

GGGGATATCCCAGTTGTATCTATACCAGGAGCTAGCGCTGGTATTACTGC 

TCTCATCGCTTCAGGTTTAGCTCCACAACCTCATATTTTTTATGGCTTCT 

TACCACGTAAGAAAGGTCAACAAATAACTTTCTTTGAAACAAAGCAAGAT 

TACCCTGAAACACAAATCTTTTATGAGTCACCGtTTCGAGTCTCTGATAC 

GCTAAAACACATGAAAGAGATTTACGGAGATCGCCAAGTTGTTTTAGTAC 

GCGAATTGACGAAACTCTATGAAGAGTATCAAAGAGGAACCATTAGTCAA 

CTTTTAGAGCATATTGAAAAGGTCCCTCTCAAAGGTGAATGCTTAATTAT 

TGTTGATGGTAAGAGAGATACCGAGCGAGTGAAAGACAGTAGCCAACAAG 

ATCCACTAGTATTAGTAA 

SEQ ID NO. 7408 

STRAIN M781 

AAATGCAAGTTCAAAAAAGTTTTAAATCAAATATACATTACGGAACACTC 
TATCTAGTCCCAACTCCAATTGGTAATCTAGATGATATGACTTTTCGTGC 
CATTAGGATTTTAAGAGAAGTTGATTTTATTTGTGCAGAGGATACACGAA 
ATACGGgACTTTTACTCAAGCACTTTGATATTACTACTAAACAAATTAGT 
TTTCACG71ACACAATGCTTACGATAAAATCTCTGGGTTAATTGATTTGTT 
AAAAGAAGGGAAATCTTTAGCCCAAGTATCTGATGCAGGAATGCCCTcTA 
TTTCTGACCCAGGACATGACCTTGTCAAGGCTGCTATTGAAGGGGATATC 
CCAGTTGTATCTATACCAGGAGCTAGCGCTGGTATTACTGCTCTCATCGC 
TTCAGGTTTAGCTCCACAACCTCATATTTTTTATGGCTTCTTACCACGTA 
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AGAAAGGTCAACAAATAACTTTCTTTGAAACAAAGCAAGATTACCCTGAA 

ACACAAATCTTTTATGAGTCACCGTTTCGAGTcTcTGATACGCTAAAACA 

CATGAAAGAGATTTACGGAGATCGCCAAGTTGTTTTAGTACGCGAATTGA 

CGAAACTCTATGAAGAGTATCAAAGAGGAACCATTAGTCAACTTTTAGAG 

CATATTGAAAAGGTCCCTCTCAAAGGTGAATGCTTAATTATTGTTGATGG 

TAAGAGAGATACCGAGCGAGTGAAAGACAGTAGCCAACAAGATCCACTAG 

TATTAGTAA 

A 

SEQ ID NO. 7409 

STRAIN CJB110 

GAAATGCAAGTTCAAAAAAGTTTTAAATCAAATACACATTACGGGACAC 

TCTATCTAGTCCCAACTCCAATTGGTAATCTAGATGATATGACTTTTCGT 

GCCATTAGGATTTTAAGAGAAGTTGATTTTATTTGTGCAGAGGATACACG 

AAATACGGGACTTTTACTCAAGCACTTTGATATTACTACTAAACAAATTA 

GTTTTCACGAACACAATGCTTACGATAAAATCTCTGGGTTAATTGATTTG 

TTAAAAGAAGGGAGATCTTTAGCCCAAGTATCTGATGCAGGAATGCCCTC 

TATTTCTGACCCAGGACATGACCTTGTCAAGGCTGCTATTGAAGGGGGGA 

TCCCGGTCGTATCTATACCAGGAGCTAGCGCTGGTATTACTGCTCTCATC 

GCTTCAGGTTTAGCTCCACAACCTCATATTTTTTATGGCTTCTTACCGCG 

TAAGAAAGGTCAACAAATAACTTTtTTTGAAACAAAGAAAGATTACCCTG 

AAACACAAATCTtTTATGAGTCACCGtTTcGAGTCTCTGATACGCTAAAA 

CACATGAAAGAGATTTACGGAGATCGCCAAGTTGTTTTAGTACGCGAATT 

GACGAAACTCTATGAAGAGTATCAAAGAGGAAGCATTAGTCAACTTTTAG 

GGCATATTGAAAAAGTCCCTCTCAAAGGTGAATGCTTAATTATTGTTGAT 

GGTAAGAGAGATACCGAGCGAGTGAAAGACAGTAGCCAACAAGATCCACT 

AGTATTAGTAA 

SEQ ID NO. 7410 

STRAIN 1169NT 

TGCAAGTTCAAAAAAGTTTTAAATCAAATACACATTATGGGACACTCTAT 
CTAGTCCCAACTCCAATTGGTAATCTAGATGATATGACTTTTCGTGCCAT 
TAGGATTTTAAGAgAAGTTGaTTTTATTTGTGCAGAGGATACACGAAATA 
CGGGACTTTTACTCAAGCACTTTGATaTTACTACTAAACAAATTAGtTTT 
cACGAACACAATGCTTACGATAAAATCTCTGGGTTAATTGATTtGTTAAA 
AGAAGGGAAATCTTTAGCCCAAGTATCTGATGCAGGAATGCCCTCTATTT 
CTGACCCAGGACATGACCTTGTCAAGGCTGCTATTGAAGGGGATATCCCA 
GTTGTATCTATACCAGGAGCTAGCGCTGGTATTACTGCTCTCATCGCTTC 
AGGTTTAGCTCCACAACCTCATATTTTTTATGGCTTCTTACCACGTAAGA 
AAGGTCAACAAATAACTTTTTTTGAAACAAAGCAAGATTATCCTGAAACA 
CAAATCTTTTATGAGTCACCGtTTCGAGTCTCTGATACGCTAAAACACAT 
GAAAGAGATTTACGGAGATCGCCAAGTTGTTTTAGTACGCGAATTGACgA 
AACTCTATGAAGAGTATCAAAGAGGAACCATTaGTCAACTTTTAGAGCAT 
ATTGAAAAGGTCCCTCTCAAAGGTGAATGCTTAATTATTGtTGATGGTAA 
GAGAGAtaCCGAGCGAGTGAAAGACAGTAGCCAACAAGATCCACTAGTAT 
' TAGTAA 

SEQ ID NO. 7411 

STRAIN JM9130013 

GAAATGCAAGTTCAAAAAAGTTTTAAATCAAATACACATTACGGGA 

CACTCTATCTAGTCCCAACTCCAATTGGTAATCTAgATGATATGACTTTT 

CGTGCCATTAGGATTTTAAGAGAAGTTGATTTTATTTGTGCAGAGGATAC 

ACGAAATACGGGACTTTTACTCAAGCACTTTGATATTACTACTAAACAAA 

TTAGTTTTCACGAACACAATGCTTATGATAAAATCTCTGGGTTAATTGAT 

TTGTTAAAAGAAGGGAGATCTTTAGCCCAAGTATCTGATGCAGGAATGCC 

CTCTATTTCTGACCCAGGACATGACCTTGTCAAGGCtGCTATTGAAGGGG 

ATATCCCGGTCGTATCTATACCAGGAGCTAGCGCTGGTATTACTGCTCTC 

ATCGCTTCAGGTTTAGCTCCACAACCTCATATTTTTTATGGCTTCTTACC 

GCGTAAGCAAGGTCAACAAATAACtTTTTTTGAAACAAAGAAAGATTACC 

CTGAAACACAAATCTTTTATGAGTCACCGTTTCGAGTCTCTGATACGCTA 

AAACACATGAAAGAGATTTATGGAGATCGCCAAGTTGTTTTAGTACGCGA 

ATTGACGAAACTCTATGAAGAGTATCAAaGAGGAACCATTAGTCAACTTT 

TAGGGCATATTGaAAAGGTCCCTCTCAAAGGTGAATGCTTAATTATTGTT 

GATGGTAAGAGAGATACTGAGCGAGTGAAAGACAGTAGCCAACAAGATCC 
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AGTAGTATTAGTAA 

SEQ ID NO. 7412 
STRAIN 2603 frame: 1 

MEMQVQKSFKSNIHYGTLYLVPTPIGNLDDMTFRAIRILREVDFICAEDTRNTGLLLKHF 
DITTKQI S FHEHNAYDKISGLI DLLKEGKSLAQVS DAGMPS I S DPGHDLVKAAIEGDI PV 
VS I PGASAGITALIASGLAPQPHI FYGFLPRKKGQQIT FFETKQDYPETQI FYES PFRVS 
DTLKHMKEIYGDRQWLVRELTKLYEEYQRGTISQLLEHIEKVPLKGECLIIVDGKRDTE 
RVKDS SQQDPLVLVKE YIANGDKTNQAIKKVAKE FNLNRQELYAS FHDL 

SEQ ID NO. 7413 

STRAIN 090 frame: 1 

EMQVQKSFKSNTHYGTLYLVPTPIGNLDDMTFRAIRILREVDFICAEDTRNTGLLLKHFD 
ITTKQISFHEHNAYDKISGLIDLLKEGRSLAQVSDAGMPSISDPGHDLVKAAIEGGIPW 
SIPGASAGITALIASGLAPQPHIFYGFLPRKKGQQITFFETKKDYPETQIFYESPFRVSD 
TLKHMKEIYGDRQWLVRELTKLYEEYQRGTISQLLGHIEKVPLKGECLIIVDGKRDTER 
VKDSSQQDPLVLV 

SEQ ID NO. 7414 

STRAIN A909 frame: 2 

VQKSFKSNIHYGTLYLVPTPIGNLDDMTFRAIRILREVDFICAEDTRNTGLLLKHFDITT 
KQI S FHEHNAYDKI SGLI DLLKEGKSLAQVS DAGMPS I S DPGHDLVKAAIEGDI PVVS I P 
GAS AGITALIASGLAPQ PHI FYGFLPRKKGQQIT FFETKQDYPETQI FYES PFRVS^TLK 
HMKEIYGDRQWLVRELTKLYEEYQRGTISQLLEHIEKVPLKGECLI'IVDGKRDTERVKD' 
SSQQDPLVLV 

SEQ ID NO. 7415 

STRAIN H36B frame: 1 

EMQVQKSFKSNTHYGTLYLVPTPIGNLDDMTFRAIRILREVDFICAEDTRNTGLLLKHFD 
ITTKQIS FHEHNAYDKISGLI DLLKEGRSLAQVS DAGMPS IS DPGHDLVKAAIEGDI PW 
SIPGASAGITALIASGLAPQPHIFYGFLPRKQGQQITFFETKKDYPETQIFYESPFRVSD 
TLKHMKEIYGDRQWLVRELTKLYEEYQRGTISQLLGHIEKVPLKGECLIIVDGKRDTER 
VKDSSQQDPLVLV 

SEQ ID NO. 7416 

STRAIN 18RS21 frame: 1 

EMQVQKS FKSN I HYGT LYLVPT P IGNLDDMT FRAI RI LRE VD FI CAE DTRNTGLLLKHFD 
ITTKQIS FHEHNAYDKI SGLI DLLKEGKSLAQVS DAGMPS I SDPGHDLVKAAIEGDIPW 
SI PGASAGITALIASGLAPQPHI FYGFLPRKKGQQIT FFETKQDYPETQI FYES PFRVS D 
TLKHMKEIYGDRQWLVRELTKLYEEYQRGTISQLLEHIEKVPLKGECLIIVDGKRDTER 
VKDSSQQDPLVLV 

SEQ ID NO. 7417 

STRAIN M732 frame: 1 

EMQVQKS FKSNIHYGTLYLVPTPIGNLDDMTFRAIRILREVDFICAE DTRNTGLLLKHFD 
ITTKQIS FHEHNAYDKI SGLI DLLKEGKS LAQVS DAGMPS I S DPGHDLVKAAIEGDI PW 
SI PGASAGITALIASGLAPQPHI FYGFLPRKKGQQIT FFETKQDYPETQI FYES PFRVS D 
TLKHMKEIYGDRQWLVRELTKLYEEYQRGTISQLLEHIEKVPLKGECLIIVDGKRDTER 
VKDSSQQDPLVLV 

SEQ ID NO. 7418 

STRAIN COH1 frame: 1 

EMQVQKS FKSN I HYGTLYLVPTP IGNLDDMT FRAI RILREVDFI CAE DTRNTGLLLKHFD 
ITTKQI S FHEHNAYDKI SGLI DLLKEGKS LAQVS DAGMPS I S DPGHDLVKAAIEGDI PW 
S I PGASAGI TALI ASGLAPQPHI FYGFLPRKKGQQIT FFETKQD Y PETQI FYE S P FRVS D 
TLKHMKEIYGDRQWLVRELTKLYEEYQRGTISQLLEHIEKVPLKGECLIIVDGKRDTER 
VKDSSQQDPLVLV 

SEQ ID NO. 7419 
STRAIN M781 frame: 3 

MQVQKS FKSN IHYGTLYLVPTPIGNLDDMTFRAIRILREVDFI CAE DTRNTGLLLKHFDI 
TTKQI S FHEHNAYDKI SGLI DLLKEGKSLAQVS DAGMPS I S DPGHDLVKAAIEGDI P WS 
I PGASAGI TALI ASGLAPQPHI FYGFLPRKKGQQIT FFETKQDYPETQI FYE SP FRVS DT 
LKHMKEIYGDRQWLVRELTKLYEEYQRGTISQLLEHIEKVPLKGECLIIVDGKRDTERV 
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KDSSQQDPLVLV 

SEQ ID NO. 7420 

STRAIN CJB110 frame: 1 

EMQVQKSFKSNTHYGTLYLVPTPIGNLDDMTFRAIRILREVDFICAEDTRNTGLLLKHFD 
ITTKQISFHEHNAYDKISGLIDLLKEGRSLAQVSDAGMPSISDPGHDLVKAAIEGGIPVV 
SIPGASAGITALIASGLAPQPHIFYGFLPRKKGQQITFFETKKDYPETQIFYESPFRVSD 
TLKHMKEIYGDRQVVLVRELTKLYEEYQRGTI SQLLGHIEKVPLKGECLI IVDGKRDTER 
VKDS SQQDPLVLV 

SEQ ID NO. 7421 

STRAIN 1169NT frame: 3 

QVQKSFKSNTHYGTLYLVPTPIGNLDDMTFRAIRILREVDFICAEDTRNTGLLLKHFDIT 
TKQI S FHEHNAYDKI SGLI DLLKEGKSLAQVS DAGMPS I S DPGHDLVKAAIEGDI PWS I 
PGASAGITALIASGLAPQPHIFYGFLPRKKGQQITFFETKQDYPETQIFYESPFRVSDTL 
KHMKEIYGDRQWLVRELTKLYEEYQRGTISQLLEHIEKVPLKGECLIIVDGKRDTERVK 
DS SQQDPLVLV 

SEQ ID NO. 7422 

STRAIN JM9130013 frame: 1 

51MQVQKSFKSNTfrY*GTLYLVPTPIGNLDDMTFRAIRILREVDFICAEDTRNTGLLLKHFD • 
ITTKQI S FHEHNAYdKI SGLI DLLKEGRSLAQVS DAGMPS I S DPGHDLVKAAIEGDI PW 
SIPGASAGITALIASGLAPQPHIFYGFLPRKQGQQITFFETKKDYPETQIFYESPFRVSD 
TLKHMKEIYGDRQVVLVRELTKLYEEYQRGTI SQLLGHIEKVPLKGECLI IVDGKRDTER 
VKDSSQQDPWLV 

SEQ ID NO. 7501 
STRAIN 2603 

ATGAGCGTATATGTTAGTGGAATAGGAATTATT 

TCTTCTTTGGGAAAGAATTATAGCGAGCATAAACAGCATCTCTTCGACTTAAAAGAAGGA 
ATTTCTAAACATTTATATAAAAATGACGACTCTATTTTAGAATCTTATACAGGAAGCATA 
ACTAGTGACCCAGAGGTTCCTGAGCAATACAAAGATGAGACACGTAATTTTAAATTTGCT 
TTTACCGCTTTTGAAGAGGCTCTTGCTTCTTCAGGTGTTAATTTAAAAGCTTATCATAAT 
ATTGCTGTGTGTTTAGGGACCTCACTTGGGGGAAAGAGTGCTGGTCAAAATGCCTTGTAT 
CAATTTGAAGAAGGAGAGCGTCAAGTAGATGCTAGTTTATTAGAAAAAGCATCTGTTTAC 
CATATTGCTGATGAATTGATGGCTTATCATGATATTGTGGGAGCTTCGTATGTTATTTCA 
ACCGCCTGTTCTGCAAGTAATAATGCCGTAATATTAGGAACACAATTACTTCAAGATGGC 
GATTGTGATTTAGCTATTTGTGGTGGCTGTGATGAGTTAAGTGATATTTCTTTAGCAGGC 
TTCACATCACTAGGAGCTATTAATACAGAAATGGCATGTCAGCCCTATTCTTCTGGAAAA 
GGAATCAATTTGGGTGAGGGCGCTGGTTTTGTTGTTCTTGTCAAAGATCAGTCCTTAGCT 
AAATATGGAAAAATTATCGGTGGTCTTATTACTTCAGATGGTTATCATATAACAGCACCT 
AAGCCAACAGGTGAAGGGGCGGCACAGATTGCAAAGCAGCTAGTGACTCAAGCAGGTATT 
GACTACAGTGAGATTGACTATATTAACGGTCACGGTACAGGTACTCAAGCTAATGATAAA 
ATGGAAAAAAATATGTATGGTAAGTTTTTCCCGACAACGACATTGATCAGCAGTACCAAG 
GGGCAAACGGGTCATACTCTAGGGGCTGCAGGTATTATCGAATTGATTAATTGTTTAGCG 
GCAATAGAGGAACAGACTGTACCAGCAACTAAAAATGAGATTGGGATAGAAGGTTTTCCA 
GAAAATTTTGTCTATCATCAAAAGAGAGAATACCCAATAAGAAATGCTTTAAATTTTTCG 
TTTGCTTTTGGTGGAAATAATAGTGGTGTCTTATTGTCATCTTTAGATTCACCTCTAGAA 
ACATTACCTGCTAGAGAAAATCTTAAAATGGCTATCTTATCATCTGTTGCTTCCATTTCT 
AAGAATGAATCACTTTCTATAACCTATGAAAAAGTTGCTAGTAATTTCAACGACTTTGAA 
GCATTACGCTTTAAAGGGGCTAGACCACCCAAAACTGTCAACCCAGCACAATTTAGGAAA 
ATGGATGATTTTTCCAAAATGGTTGCCGTAACAACAGCTCAAGCACTAATAGAAAGCAAT 
ATTAATCTAAAAAAACAAGATACTTCAAAAGTAGGAATTGTATTTACAACACTTTCTGGA 
CCAGTTGAGGTTGTTGAAGGTATTGAAAAGCAAATCACAACAGAAGGATATGCACATGTT 
TCTGCTTCACGATTCCCGTTTACAGTAATGAATGCAGCAGCTGGTATGCTTTCTATCATT 
TTTAAAATAACAGGTCCTTTATCTGTCATTTCGACAAATAGTGGAGCGCTTGATGGTATA 
CAATATGCCAAGGAAATGATGCGTAACGATAATCTAGACTATGTGATTCTTGTTTCTGCT 
AATCAGTGGACAGACATGAGTTTTATGTGGTGGCAACAATTAAACTATGATAGTCAAATG 
TTTGTCGGTTCTGATTATTGTTCAGCACAAGTCCTCTCTCGTCAAGCATTGGATAATTCT 
CCTATAATATTAGGTAGTAAACAATTAAAATATAGCCATAAAACATTCACAGATGTGATG 
ACTATTTTTGATGCTGCGCTTCAAAATTTATTATCAGACTTAGGACTAACCATAAAAGAT 
ATCAAAGGTTTCGTTTGGAATGAGCGGAAGAAGGCAGTTAGTTCAGATTATGATTTCTTA 
GCGAACTTGTCTGAGTATTATAATATGCCAAACCTTGCTTCTGGTCAGTTTGGATTTTCA 
TCTAATGGTGCTGGTGAAGAACTGGACTATACTGTTAATGAAAGTATAGAAAAGGGCTAT 
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TATTTAGTCCTATCTTATTCGATCTTCGGTGGTATCTCTTTTGCTATTATTGJAAAAAAGG 

SEQ ID NO. 7502 

STRAIN 090 

ATGTTAGTGGAATAGGAATTATTTCTTCTTTGGGAAAGaATTAT 
AGCGAGCATAAACAGCAT CTCTTCGACTTAAAAGAAGGAATTT CTAAACA 
TTTATATAAAAATCACGACTCTATTTTAGAATCTTATACAGGAAGCATAA 
CTAGTGACCCAGAGGTTCCTGAGCAATACAAAGATGAGACACGTT^ATTTT 
AAATTTGCTTTTACCGCTTTTGAAGAGGCTCTTGCTTCTTCAGGTGTTAA 
TTTAAAAGCTTATCATAATATTGCTGTGTGTTTAGGGACCTCACTTGGGG 
GAAAGAGTGCTGGTCAAAATGCCTTGTATCAATTTGAAGAAGGAGAGCGT 
CAAGTAGATGCTAGTTTATTAGAAAAAGCATCTGTTTACCATATTGCTGA 
TGAATTGATGGCTTATCATGATATTGTGGGAGCTTCGTATGTTATTTCAA 
CCGCCTGTTCTGCAAGTAATAATGCCGTAATATTAGGAACACAATTACTT 
CAAGATGGCGATTGTGATTTAGCTATTTGTGGTGGCTGTGATGAGTTAAG 
TGATATTTCTTTAGCAGGCTTCACATCACTAGGAGCTATTAATACAGAAA 
TGGCATGTCAGCCCTATTCTTCTGGAAAAGGAATCAATTTGGGTGAGGGC 
GCTGGTTTTGTTGTTCTTGTCAAAGATCAGTCCTTAGCTAAATATGGAAA 
AATTATCGGTGGTCTTATTACTTCAGATGGTTATCATATAACAGCACCTA 
m AGCCAACAGGTGAAGGGGCGGCACAGATTGCAAAGCAGCTAGTGACTCAA 
GCAGGTATTGACTACAGTGAGATTGACTATATTAACGGTCACGGTACAGG 
* TACTCAAGCTAATGATAAAATGGAAAAAAATATGTATGGTAAGTTTTTCC 
CGACi^CGACATT^TCAGCAGTACCT^GGGGCAAACGGGTCATACTCTA 
GGGGCTGCAGGTATTATCGAATTGATTAATTGTTTAGCGGCAATAGAGGA 
ACAGACTGTACCAGCAACTAAAAATGAGATTGGGATAGAAGGTTTTCCAG 
AAAATTTTGTCTATCATCAAAAGAGAGAATACCCAATAAGAAATGCTTTA 
AATTTTTCGTTTGCTTTTGGTGGAAATAATAGTGGTATCTTATTGTCATC 
TTTAGATTCACCTCTAGAAACATTACCTGCTAGAGAAAATCTTAAAATGG 
CTATCTTATCATCTGTTGCTTCCATTTCTAAGAATGAATCACTTTCTATA 
ACCTATGAAAAAGTTGCTAGTAATTTCAACGACTTTGAAGCATTACGCTT 
TAAAGGGGCTAGACCACCCAAAACTGTCAACCCAGCACAATTTAGGAAAA 
TGGATGATTTTTCCAAAATGGTTGCCGTAACAACAGCTCAAGCACTAATA 
GAAAGCAATATTAATCTAAAAAAACAAGATACTTCAAAAGTAGGAATTGT 
ATTTACAACACTTTCTGGACCAGTTGAGGTTGTTGAAGGTATTGAAAAGC 
AAATCACAACAGAAGGATATGCACATGTTTCTGCTTCACGATTCCCGTTT 
ACAGTAATGAATGCAGCAGCTGGTATGCTTTCTATCATTTTTAAAATAAC 
AGGTCCTTTATCTGTCATTTCGACAAATAGTGGAGCGCTTGATGGTATAC 
AATATGCCAAGGAAATGATGCGTAACGATAATCTAGACTATGTGATTCTT 
GTTTCTGCTAATCAGTGGACAGACATGAGTTTTATGTGGTGGCAACAATT 
AAACTATGATAGTCAAATGTTTGTCGGTTCTGATTATTGTTCAGCACAAG 
TCCTCTCTCGTCAAGCATTGGATAATTCTCCTATAATATTAGGTAGTAAA 
CAATTAAAATATAGCCATAAAACATTCACAGATGTGATGACTATTTTTGA 
TGCTGCGCTTCAAAATTTATTATCAGACTTAGGACTAACCATAAAAGATA 
TCAAAGGTTTCGTTTGGAATGAGCGGAAGAAGGCAGTTAGTTCAGATTAT 
GATTTCTTAGCGAACTTGTCTGAGTATTATAATATGCCAAACCTTGCTTC 
TGGTCAGTTTGGATTTTCATCTAATGGTGCTGGTGAAGAACTGGACTATA 
CTGTTAATGAAAGTATAGAAAAGGGCTATTATTTAGTCCTATCTTATTCG 
ATCTTTGGTGGTATCTCTTTTGCTATTATTGAAAAAAGG 

SEQ ID NO. 7503 
STRAIN A909 

ATGTTAGTGGAATAGGAATTATTTCTTCTTTGGGAAAGAATT 

ATAGCGAGCATAAACAGCATCTCTTCGACTTAAAAGAAGGAATTTCTAAA 

CATTTATATAAAAATCACGACTCTATTTTAGAATCTTATACAGGAAGCAT 

AACTAGTGACCCAGAGGTTCCTGAGCAATACAAAGATGAGACACGTAATT 

TTAAATTTGCTTTTACCGCTTTTGAAGAGGCTCTTGCTTCTTCAGGTGTT 

AATTTAAAAGCTTATCATAATATTGCTGTGTGTTTAGGGACCTCACTTGG 

GGGAAAGAGTGCTGGTCAAAATGCCTTGTATCAATTTGAAGAAGGAGAGC 

GTCAAGTAGATGCTAGTTTATTAGAAAAAGCATCTGTTTACCATATTGCT 

GATGAATTGATGGCTTATCATGATATTGTGGGAGCTTCGTATGTTATTTC 

AACCGCCTGTTCTGCAAGTAATAATGCCGTAATATTAGGAACACAATTAC 

TTCAAGATGGCGATTGTGATTTAGCTATTTGTGGTGGCTGTGATGAGTTA 

AGTGATATTTCTTTAGCAGGCTTCACATCACTAGGAGCTATTAATACAGA 

AATGGCATGTCAGCCCTATTCTTCTGGAAAAGGAATCAATTTGGGTGAGG 
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GCGCTGGTTTTGTTGTTCTTGTCAAAGATCAGTCCTTAGCTAAATATGGA 

AAAATTATCGGTGGTCTTATTACTTCAGATGGTTATCATATAACAGCACC 

TAAGCCAACAGGTGAAGGGGCGGCACAGATTGCAAAGCAGCTAGTGACTC 

AAGCAGGTATTGACTACAGTGAGATTGACTATATTAACGGTCACGGTACA 

GGTACTCAAGCTAATGATAAAATGGAAAAAAATATGTATGGTAAGTTTTT 

CCCGACAACGACATTGATCAGCAGTACCAAGGGGCAAACGGGTCATACTC 

TAGGGGCTGCAGGTATTATCGAATTGATTAATTGTTTAGCGGCAATAGAG 

GAACAGACTGTACCAGCAACTAAAAATGAGATTGGGATAGAAGGTTTTCC 

AGAAAATTTTGTCTATCATCAAAAGAGAGAATACCCAATAAGAAATGCTT 

TAAATTTTTCGTTTGCTTTTGGTGGAAATAATAGTGGTGTCTTATTGTCA 

TCTTTAGATTCACCTCTAGAAACATTACCTGCTAGAGAAAATCTTAAAAT 

GGCTATCTTATCATCTGTTGCTTCCATTTCTAAGAATGAATCACTTTCTA 

TAACCTATGAAAAAGTTGCTAGTAATTTCAACGACTTTGAAGCATTACGC 

TT TAAAGGGGCTAGACCACCCAAAACTGT CAACCCAGCACAATTTAGGAA 

AATGGATGATTTTTCCAAAATGGTTGCCGTAACAACAGCTCAAGCACTAA 

TAGAAAGCAATATTAATCTAAAAAAACAAGATACTTCAAAAGTAGGAATT 

GTATTTACAACACTTTCTGGACCAGTTGAGGTTGTTGAAGGTATTGAAAA 

GCAAATCACAACAGAAGGATATGCACATGTTTCTGCTTCACGATTCCCGT 

TTACAGTAATGAATGCAGCAGCTGGTATGCTTTCTATCATTTTTAAAATA 

ACAGGTCCTTTATCTGTCATTTCGAC^AATAGTGGAGCGCTTGATGGTAT. 

ACAATATGCGAAGGAAATGATGCGTAACGATAATCTAGACTATGTGATTC 

TTGTTTCTGCTAATCAGTGGACAGACATGAGTTTTATGTGGTGGCAACAA 

TTAAACTATGATAGTCAAATGTTTG'JCGGTTCTGATTATTGTTCAGCACA 

agtcctctctcgtcaagcatt^ggataAttctcctataatattaggtagta 

AACAATTAAAATATAGCCATAAAACATTCACAGATGTGATGACTATTTTT 

gatgctgcgcttcaaaatttattatcagacttaggactaaccataaaaga' 
tatcaaaggtttcgtttggaatgagcggaagaaggcagttagttcagatt 

ATGATTTCTTAGCGAACTTGTCTGAGTATTATAATATGCCAAACCTTGCT 
TCTGGTCAGTTTGGATTTTCATCTAATGGTGCTGGTGAAGAACTGGACTA 
TACTGTTAATGAAAGTATAGAAAAGGGCTATTATTTAGTCCTATCTTATT 
CGATCTTCGGTGGTATCTCTTTTGCTATTATTGAAAAAAGG 

SBQ ID NO. 7504 

STRAIN H36B 

ATGTTAGTGGAATAGGAATTATTTCTTCTTTGGGAAAGAATTATAGCGA 

GCATAAACAGCATCTCTTCGACTTAAAAGAAGGAATTTCTAAACATTTAT 

ATAAAAATCACGACTCTATTTTAGAATCTTATACAGGAAGCATAACTAGT 

GACCCAGAGGTTCCTGAGCAATACAAAGATGAGACACGTAATTTTAAATT 

TGCTTTTACCGCTTTTGAAGAGGCTCTTGCTTCTTCAGGTGTTAATTTAA 

AAGCTTATCATAATATTGCTGTGTGTTTAGGGACCTCACTTGGGGGAAAG 

AGTGCTGGTCAAAATGCCTTGTATCAATTTGAAGAAGGAGAGCGTCAAGT 

AGATGCTAGTTTATTAGAAAAAGCATCTGTTTACCATATTGCTGATGAAT 

TGATGGCTTATCATGATATTGTGGGAGCTTCGTATGTTATTTCAACCGCC 

TGTTCTGCAAGTAATAATGCCGTAATATTAGGAACACAATTACTTCAAGA 

TGGCGATTGTGATTTAGCTATTTGTGGTGGCTGTGATGAGTTAAGTGATA 

TTTCTTTAGCAGGCTTCACATCACTAGGAGCTATTAATACAGAAATGGCA 

TGTCAGCCCTATTCTTCTGGAAAAGGAATCAATTTGGGTGAGGGCGCTGG 

TTTTGTTGTTCTTGTCAAAGATCAGTCCTTAGCTAAATATGGAAAAATTA 

TCGGTGGTCTTATTACTTCAGATGGTTATCATATAACAGCACCTAAGCCA 

ACAGGTGAAGGGGCGGCACAGATTGCAAAGCAGCTAGTGACTCAAGCAGG 

TATTGACTACAGTGAGATTGACTATATTAACGGTCACGGTACAGGTACTC 

AAGCTAATGATAAAATGGAAAAAAATATGTATGGTAAGTTTTTCCCGACA 

ACGACATTGATCAGCAGTACCAAGGGGCAAACGGGTCATACTCTAGGGGC 

TGCAGGTATTATCGAATTGATTAATTGTTTAGCGGCAATAGAGGAACAGA 

CTGTACCAGCAACTAAAAATGAGATTGGGATAGAAGGTTTTCCAGAAAAT 

TTTGTCTATCATCAAAAGAGAGAATACCCAATAAGAAATGCTTTAAATTT 

TTCGTTTGCTTTTGGTGGAAATAATAGTGGTGTCTTATTGTCATCTTTAG 

ATTCACCTCTAGAAACATTACCTGCTAGAGAAAATCTTAA^TGGCTATC 

TTATCATCTGTTGCTTCCATTTCTAAGAATGAATCACTTTCTATAACCTA 

TGAAAAAGTTGCTAGTAATTTCAACGACTTTGAAGCATTACGCTTTAAAG 

GGGCTAGACCACCCAAAACTGTCAACCCAGCACAATTTAGGAAAATGGAT 

GATTTTTCCAAAATGGTTGCCGTAACAACAGCTCAAGCACTAATAGAAAG 

CAATATTAATCTAAAAAAACAAGATACTTCAAAAGTAGGAATTGTATTTA 

CAACACTTTCTGGACCAGTTGAGGTTGTTGAAGGTATTGAAAAGCAAATC 
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ACAACAGAAGGATATGCACATGTTTCTGCTTCACGATTCCCGTTTACAGT 
AATGAATGCAGCAGCTGGTATGCTTTCTATCATTTTTAAAATAACAGGTC 
CTTTATCTGTCATTTCGACAAATAGTGGAGCGCTTGATGGTATACAATAT 
GCCAAGGAAATGATGCGTAACGATAATCTAGACTATGTGATTCTTGTTTC 
TGCTAATCAGTGGACAGACATGAGTTTTATGTGGTGGCAACAATTAAACT 
ATGATAGTCAAATGTTTGTCGGTTCTGATTATTGTTCAGCACAAGTCCTC 
TCTCGTCAAGCATTGGATAATTCTCCTATAATATTAGGTAGTAAACAATT 
AAAATATAGCCATAAAACATTCACAGATGTGATGACTATTTTTGATGCTG 
CGCTTCAAAATTTATTATCAGACTTAGGACTAACCATAAAAGATATCAAA 
GGTTTCGTTTGGAATGAGCGGAAGAAGGCAGTTAGTTCAGATTATGATTT 
CTTAGCGAACTTGTCTGAGTATTATAATATGCCAAACCTTGCTTCTGGTC 
AGTTTGGATTTTCATCTAATGGTGCTGGTGAAGAACTGGACTATACTGTT 
AATGAAAGTATAGAAAAGGGCTATTATTTAGTCCTATCTTATTCGATCTT 
CGGTGGTATCTCTTTTGCTATTATTGAAAAAAGG 

SEQ ID NO. 7505 

STRAIN 18RS21 

ATGTTAGTGGAATAGGAATTATTTCTTCTTTGGGAAAGAATTATAGC . * 

GAGCATAAACAGCATCTCTTCGACTTAAAAGAAGGAATTTCTAAACATTT 

ATATAAAAATCACGACTCTATTTTAGAATCTTATACAGGAAGCATAACTA 

GTGACCCAGAGGTTCCTGAGCAATACAAAGATGAGACACGTAATTTTAAA " 

TTTGCTTTTACCGCTTTTGAAGAGGCTCTTGCTTCTTCAGGTGTTAATTT 

AAAAGCTTATC^TAATATTGCTGTGTGTTTAGGGACCTCACTTGGGGfeAA ** 

AGAGTGCTGGTCA^yVAtGCCTTGTATCAATTTGAAGAAGGAGAGCGTCAA 

GTAGATGCTAGTTTATTAGAAAAAGCATCTGTTTACCATATTGCTGATGA 

ATTGATGGCTTATCATGATATTGTGGGAGCTTCGTATGTTATTTCAACCG 

CCTGTTCTGCAAGTAATAATGCCGTAATATTAGGAACACAATTACTTCAA 

GATGGCGATTGTGATTTAGCTATTTGTGGTGGCTGTGATGAGTTAAGTGA 

TATTTCTTTAGCAGGCTTCACATCACTAGGAGCTATTAATACAGAAATGG 

CATGTCAGCCCTATTCTTCTGGAAAAGGAATCAATTTGGGTGAGGGCGCT 

GGTTTTGTTGTTCTTGTCAAAGATCAGTCCTTAGCTAAATATGGAAAAAT 

TATCGGTGGTCTTATTACTTCAGATGGTTATCATATAACAGCACCTAAGC 

CAACAGGTGAAGGGGCGGCACAGATTGCAAAGCAGCTAGTGACTCAAGCA ' 

GGTATTGACTACAGTGAGATTGACTATATTAACGGTCACGGTACAGGTAC 

TCAAGCTAATGATAAAATGGAAAAAAATATGTATGGTAAGTTTTTCCCGA 

CAACGACATTGATCAGCAGTACCAAGGGGCAAACGGGTCATACTCTAGGG 

GCTGCAGGTATTATCGAATTGATTAATTGTTTAGCGGCAATAGAGGAACA 

GACTGTACCAGCAACTAAAAATGAGATTGGGATAGAAGGTTTTCCAGAAA 

ATTTTGTCTATCATCAAAAGAGAGAATACCCAATAAGAAATGCTTTAAAT 

TTTTCGTTTGCTTTTGGTGGAAATAATAGTGGTGTCTTATTGTCATCTTT 

AGATTCACCTCTAGAAACATTACCTGCTAGAGAAAATCTTAAAATGGCTA 

TCTTATCATCTGTTGCTTCCATTTCTAAGAATGAATCACTTTCTATAACC 

TATGAAAAAGTTGCTAGTAATTTCAACGACTTTGAAGCATTACGCTTTAA 

AGGGGCTAGACCACCCAAAACTGTCAACCCAGCACAATTTAGGAi\AATGG 

ATGATTTTTCCAAAATGGTTGCCGTAACAACAGCTCAAGCACTAATAGAA 

AGCAATATTAATCTAAAAAAACAAGATACTTCAAAAGTAGGAATTGTATT 

TACAACACTTTCTGGACCAGTTGAGGTTGTTGAAGGTATTGAAAAGCAAA 

TCACAACAGAAGGATATGCACATGTTTCTGCTTCACGATTCCCGTTTACA 

GTAATGAATGCAGCAGCTGGTATGCTTTCTATCATTTTTAAAATAACAGG 

TCCTTTATCTGTCATTTCGACAAATAGTGGAGCGCTTGATGGTATACAAT 

ATGCCAAGGAAATGATGCGTAACGATAATCTAGACTATGTGATTCTTGTT 

TCTGCTAATCAGTGGACAGACATGAGTTTTATGTGGTGGCAACAATTAAA 

CTATGATAGTCAAATGTTTGTCGGTTCTGATTATTGTTCAGCACAAGTCC 

TCTCTCGTCAAGCATTGGATAATTCTCCTATAATATTAGGTAGTAAACAA 

TTAAAATATAGCCATAAAACATTCACAGATGTGATGACTATTTTTGATGC 

TGCGCTTCAAAATTTATTATCAGACTTAGGACTAACCATAAAAGATATCA 

AAGGTTTCGTTTGGAATGAGCGGAAGAAGGCAGTTAGTTCAGATTATGAT 

TTCTTAGCGAACTTGTCTGAGTATTATAATATGCCAAACCTTGCTTCTGG 

TCAGTTTGGATTTTCATCTAATGGTGCTGGTGAAGAACTGGACTATACTG 

TTAATGAAAGTATAGAAAAGGGCTATTATTTAGTCCTATCTTATTCGATC 

TTCGGTGGTATCTCTTTTGCTATTATTGAAAAAAGG 

SEQ ID NO. 7506 

STRAIN M732 
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ATGTTAGTGGAATAGGAATTATTTCTTCTTTGGGAAAGAATTATAG 

CGAGCATAAACAGCATCTCTTCGACTTAAAAGAAGGAATTTCTAAACATT 

TATATAAAAATCACGACTCTATTTTAGAATCTTATACAGGAAGCATAACT 

AGTGACCCAGAGGTTCCTGAGCAATACAAAGATGAGACACGTAATTTTAA 

ATTTGCTTTTACCGCTTTTGAAGAGGCTCTTGCTTCTTCAGGTGTTAATT 

TAAAAGCTTATCATAATATTGCTGTGTGTTTAGGGACCTCACTTGGGGGA 

AAGAGTGCTGGTCAAAATGCCTTGTATCAATTTGAAGAAGGAGAGCGTCA 

AGTAGATGCTAGTTTATTAGAAAAAGCATCTGTTTACCATATTGCTGATG 

AATTGATGGCTTATCATGATATTGTGGGAGCTTCGTATGTTATTTCAACC 

GCCTGTTCTGCAAGTAATAATGCCGTAATATTAGGAACACAATTACTTCA 

AGATGGCGATTGTGATTTAGCTATTTGTGGTGGCTGTGATGAGTTAAGTG 

ATATTTCTTTAGCAGGCTTCACATCACTAGGAGCTATTAATACAGAAATG 

GCATGTCAGCCCTATTCTTCTGGAAAAGGAATCAATTTGGGTGAGGGCGC 

TGGTTTTGTTGTTCTTGTCAAAGATCAGTCCTTAGCTAAATATGGAAAAA * 

TTATCGGTGGTCTTATTACTTCAGATGGTTATCATATAACAGCACCTAAG 

CCAACAGGTGAAGGGGCGGCACAGATTGCAAAGCAGCTAGTGACTCAAGC 

AGGTATTGACTACAGTGAGATTGACTATATTAACGGTCACGGTACAGGTA 

CTCAAGCTAATGATAAAATGGAAAAAAATATGTATGGTAAGTTTTTCCCG 

ACAACGACATTGATCAGCAGTACCAAGGGGCAAACGGGTCATACTCTAGG 

GGCTGCAGGTATTATCGAATTGATTAATTGTTTAGCGGCAATAGAGGAAC 

AGACTGTACCAGCAACTA7VAAATGAGATTGGGATAGAAGGTTTTCCAGAA 

AATTTTGTCTATCATCAAAAGAGAGAATACCCAATAAGAAATGCTTTAAA 

TTTTTCGTTTGCTTTTGGTGGAAATAATAGTGGTGTCTTATTGTCATCTT 

TAGATTCACCTCTAGAAACATTACCT.GCTAGAGAAAATCTTAAAATGGCT . 

ATCTTATCATCTGTTGCTTCCATTTC^AAGAATGAATCACTTTCTATAAC 

CTATGAAAAAGTTGCTAGTAATTTCAACGACTTTGAAGCATTACGCTTTA 

AAGGGGCTAGACCACCCAAAACTGTCAACCCAGCACAATTTAGGAAAATG 

GATGATTTTTCCAAAATGGTTGCCGTAACAACAGCTCAAGCACTAATAGA 

AAGC AAT AT T AATCT AAAAAAAC AAGAT ACTTC AAAAGT AGGAAT TGT AT 

TTACAACACTTTCTGGACCAGTTGAGGTTGTTGAAGGTATTGAAAAGCAA 

ATCACAACAGAAGGATATGCACATGTTTCTGCTTCACGATTCCCGTTTAC 

AGTAATGAATGCAGCAGCTGGTATGCTTTCTATCATTTTTAAAATAACAG 

GTCCTTTATCTGTCATTTCGACAAATAGTGGAGCGCTTGATGGTATACAA 

TATGCCAAGGAAATGATGCGTAACGATAATCTAGACTATGTGATTCTTGT 

TTCTGCTAATCAGTGGACAGACATGAGTTTTATGTGGTGGCAACAATTAA . 

ACTATGATAGTCAAATGTTTGTCGGTTCTGATTATTGTTCAGCACAAGTC 

CTCTCTCGTCAAGCATTGGATAATTCTCCTATAATATTAGGTAGTAAACA 

ATTAAAATATAGCCATAAAACATTCACAGATGTGATGACTATTTTTGATG 

CTGCGCTTCAAAATTTATTATCAGACTTAGGACTAACCATAAAAGATATC 

AAAGGTTTCGTTTGGAATGAGCGGAAGAAGGCAGTTAGTTCAGATTATGA 

TTTCTTAGCGAACTTGTCTGAGTATTATAATATGCCAAACCTTGCTTCTG 

GTCAGTTTGGATTTTCATCTAATGGTGCTGGTGAAGAACTGGACTAtaCT 

GTTAATGAAAGTATAGAAAAGGGCTATTATTTAGTCCTATCTTATTCGAT 

CTTCGGTGGTATCTCTTTTGCTATTATTGAAAAAAGG 

SEQ ID NO. 7507 

STRAIN COH1 

ATGTTAGTGGAATAGGAATTATTTCTTCTTTGGGAAAGAATTATAGC 

GAGCATAAACAGCATCTCTTCGACTTAAAAGAAGGAATTTCTAAACATTT 

ATATAAAAATCACGACTCTATTTTAGAATCTTATACAGGAAGCATAACTA 

GTGACCCAGAGGTTCCTGAGCAATACAAAGATGAGACACGTAATTTTAAA 

TTTGCTTTTACCGCTTTTGAAGAGGCTCTTGCTTCTTCAGGTGTTAATTT 

AAAAGCTTATCATAATATTGCTGTGTGTTTAGGGACCTCACTTGGGGGAA 

AGAGTGCTGGTCAAAATGCCTTGTATCAATTTGAAGAAGGAGAGCGTCAA 

GTAGATGCTAGTTTATTAGAAAAAGCATCTGTTTACCATATTGCTGATGA 

ATTGATGGCTTATCATGATATTGTGGGAGCTTCGTATGTTATTTCAACCG 

CCTGTTCTGCAAGTAATAATGCCGTAATATTAGGAACACAATTACTTCAA 

GATGGCGATTGTGATTTAGCTATTTGTGGTGGCTGTGATGAGTTAAGTGA 

TATTTCTTTAGCAGGCTTCACATCACTAGGAGCTATTAATACAGAAATGG 

CATGTCAGCCCTATTCTTCTGGAAAAGGAATCAATTTGGGTGAGGGCGCT 

GGTTTTGTTGTTCTTGTCAAAGATCAGTCCTTAGCTAAATATGGAAAAAT 

TATCGGTGGTCTTATTACTTCAGATGGTTATCATATAACAGCACCTAAGC 

CAACAGGTGAAGGGGCGGCACAGATTGCAAAGCAGCTAGTGACTCAAGCA 

GGTATTGACTACAGTGAGATTGACTATATTAACGGTCACGGTACAGGTAC 
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TCAAGCTAATGATAAAATGGAAAAAAATATGTATGGTAAGTTTTTCCCGA 
CAACGACATTGATCAGCAGTACCAAGGGGCAAACGGGTCATACTCTAGGG 
GCTGCAGGTATTATCGAATTGATTAATTGTTTAGCGGCAATAGAGGAACA 
GACTGTACCAGCAACTAAAAATGAGATTGGGATAGAAGGTTTTCCAGAAA 
ATTTTGTCTATCATCAAAAGAGAGAATACCCAATAAGAAATGCTTTAAAT 
TTTTCGTTTGCTTTTGGTGGAAATAATAGTGGTGTCTTATTGTCATCTTT 
AGATTCACCTCTAGAAACATTACCTGCTAGAGAAAATCTTAAAATGGCTA 
TCTTATCATCTGTTGCTTCCATTTCTAAGAATGAATCACTTTCTATAACC 
TATGAAAAAGTTGCTAGTAATTTCAACGACTTTGAAGCATTACGCTTTAA 
AGGGGCTAGACCACCCAAAACTGTCAACCCAGCACAATTTAGGAAAATGG 
ATGATTTTTCCAAAATGGTTGCCGTAACAACAGCTCAAGCACTAATAGAA 
AGCAATATTAATCTAAAAAAACAAGATACTTCAAAAGTAGGAATTGTATT 
TACAACACTTTCTGGACCAGTTGAGGTTGTTGAAGGTATTGAAAAGCAAA 
TCACAACAGAAGGATATGCACATGTTTCTGCTTCACGATTCCCGTTTACA 
GTAATGAATGCAGCAGCTGGTATGCTTTCTATCATTTTTAAAATAACAGG 
TCCTTTATCTGTCATTTCGACAAATAGTGGAGCGCTTGATGGTATACAAT 
ATGCCAAGGAAATGATGCGTAACGATAATCTAGACTATGTGATTCTTGTT 
TCTGCTAATCAGTGGACAGACATGAGTTTTATGTGGTGGCAAQAATTAAA 
CTATGATAGTCAAATGTTTGTCGGTTCTGATTATTGTTCAGCACAAGTCC 
TCTCTCGTCAAGCATTGGATAATTCTCCTATAATATTAGGTAGTAAACAA 
TTAAAATATAGCCATAAAACATTCACAGATGTGATGACTATTTTTGATGC 

. TGCGCTTCAAAATTTATTATCAGACTTAGGACTAACCATAAAAGATATCA 
ftAGGTTTCGTTTGGAATGAGCGCy^AGAAGGCAGTTAGTTCAGATTAyGAT 

t TTCTTAGCGAACTTGTCTGAGTATTATAATATGCCAAACCTTGCTTCTGG 
TCAGTTTGGATTTTCATCTAATGGTGCTGGTGAAGAACTGGACTATACTG 
TTAATGAAAGTATAGAAAAGGGCTATTATTTAGTCCT-ATCTTATTCGATC 
TTCGGTGGTATCTCTTTTGCTATTATTGAAAAAAGG 

SEQ ID NO. 7508 

STRAIN M781 

ATGTTAGTGGAATAGGAATTATTTCTTCTTTGGGAAAGAATTATAGC 

GAGCATAAACAGCATCTCTTCGACTTAAAAGAAGGAATTTCTAAACATTT 

ATATAAAAATCACGACTCTATTTTAGAATCTTATACAGGAAGCATAACTA 

GTGACCCAGAGGTTCCTGAGCAATACAAAGATGAGACACGTAATTTTAAA 

TTTGCTTTTACCGCTTTTGAAGAGGCTCTTGCTTCTTCAGGTGTTAATTT 

AAAAGCTTATCATAATATTGCTGTGTGTTTAGGGACCTCACTTGGGGGAA 

AGAGTGCTGGTCAAAATGCCTTGTATCAATTTGAAGAAGGAGAGCGTCAA 

GTAGATGCTAGTTTATTAGAAAAAGCATCTGTTTACCATATTGCTGATGA 

ATTGATGGCTTATCATGATATTGTGGGAGCTTCGTATGTTATTTCAACCG 

CCTGTTCTGCAAGTAATAATGCCGTAATATTAGGAACACAATTACTTCAA 

GATGGCGATTGTGATTTAGCTATTTGTGGTGGCTGTGATGAGTTAAGTGA 

TATTTCTTTAGCAGGCTTCACATCACTAGGAGCTATTAATACAGAAATGG 

CATGTCAGCCCTATTCTTCTGGAAAAGGAATCAATTTGGGTGAGGGCGCT 

GGTTTTGTTGTTCTTGTCAAAGATCAGTCCTTAGCTAAATATGGAAAAAT 

TATCGGTGGTCTTATTACTTCAGATGGTTATCATATAACAGCACCTAAGC 

CAACAGGTGAAGGGGCGGCACAGATTGCAAAGCAGCTAGTGACTCAAGCA 

GGTATTGACTACAGTGAGATTGACTATATTAATGGTCACGGTACAGGTAC 

TCAAGCTAATGATAAAATGGAAAAAAATATGTATGGTAAGTTTTTCCCGA 

CAACGACATTGATCAGCAGTACCAAGGGGCAAACGGGTCATACTCTAGGG 

GCTGCAGGTATTATCGAATTGATTAATTGTTTAGCGGCAATAGAGGAACA 

GACTGTACCAGCAACTAAAAATGAGATTGGGATAGAAGGTTTTCCAGAAA 

ATTTTGTCTATCATCAAAAGAGAGAATACCCAATAAGAAATGCTTTAAAT 

TTTTCGTTTGCTTTTGGTGGAAATAATAGTGGTATCTTATTGTCATCTTT 

AGATTCACCTCTAGAAACATTACCTGCTAGAGAAAATCTTAAAATGGCTA 

TCTTATCATCTGTTGCTTCCATTTCTAAGAATGAATCACTTTCTATAACC 

TATGAAAAAGTTGCTAGTAATTTCAACGACTTTGAAGCATTACGCTTTAA 

AGGGGCTAGACCACCCAAAACTGTCAACCCAGCACAATTTAGGAAAATGG 

ATGATTTTTCCAAAATGGTTGCCGTAACAACAGCTCAAGCACTAATAGAA 

AGCAATATTAATCTAAAAAAACAAGATACTTCAAAAGTAGGAATTGTATT 

TACAACACTTTCTGGACCAGTTGAGGTTGTTGAAGGTATTGAAAAGCAAA 

TCACAACAGAAGGATATGCACATGTTTCTGCTTCACGATTCCCGTTTACA 

GTAATGAATGCAGCAGCTGGTATGCTTTCTATCATTTTTAAAATAACAGG 

TCCTTTATCTGTCATTTCGACAAATAGTGGAGCGCTTGATGGTATACAAT 

ATGCCAAGGAAATGATGCGTAACGATAATCTAGACTATGTGATTCTTGTT 
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TCTGCTAATCAGTGGACAGACATGAGTTTTATGTGGTGGCAACAATTAAA 
CTATGATAGTCAAATGTTTGTCGGTTCTGATTATTGTTCAGCACAAGTCC 
TCTCTCGTCAAGCATTGGATAATTCTCCTATAATATTAGGTAGTAAACAA 
TTAAAATATAGCCATAAAACATTCACAGATGTGATGACTATTTTTGATGC 
TGCGCTTCAAAATTTATTATCAGACTTAGGACTAACCATAAAAGATATCA 
AAGGTTTCGTTTGGAATGAGCGGAAGAAGGCAGTTAGTTCAGATTATGAT 
TTCTTAGCGAACTTGTCTGAGTATTATAATATGCCAAACCTTGCTTCTGG 
TCAGTTTGGATTTTCATCTAATGGTGCTGGTGAAGAACTGGACTATACTG 
TTAATGAAAGTATAGAAAAGGGCTATTATTTAGTCCTATCTTATTCGATC 
TTTGGTGGTATCTCTTTTGCTATTATTGAAAAAAGG 

SEQ ID NO. 7509 

STRAIN CJB110 

ATGTTAGTGGAATAGGAATTATTTCTTCTTTGGGAAAGAATTATAGC 
GAGCATAAACAGCATCTCTTCGACTTAAAAGAAGGAATTTCTAAACATTT 
ATATAAAAATCACGACTCTATTTTAGAATCTTATACAGGAAGCATAACTA 
GTGACCCAGAGGTTCCTGAGCAATACAAAGATGAGACACGTAATTTTAAA 
TTTGCTTTTACCGCTTTTGAAGAGGCTCTTGCTTCTTCAGGTGTTAATTT 
AAAAGCTTATCATAATATTGCTGTGTGTTTAGGGACCTCACTTGGGGGAA 
AGAGTGCTGGTCAAAATGCCTTGTATCAATTTGAAGAAGGAGAGCGTCAA 
GTAGATGCTAGTTTATTAGAAAAAGCATCTGTTTACCATATTGCTGATGA 
♦ATTGATGG^TTATCATGATATTGTGGGAGCTTCGTATGTTATTTCAACCG 
CCTGTTCTGCAAGTAATAATGCCGTAATATTAGGAACACAATTACTTCAA 
GATGGCGATTGT£ATTTAGCTATTTGTGGTGGCTGTGATGAGTTAAGTGA 
TATTTCTTTAGCii^CTTC^CATCACTAGGAGCTATTAATACAGAAATGG 
CATGTCAGCCCTATTCTTCTGGAAAAGGAATCAATTTGGGTGAGGGCGCT 
GGTTTTGTTGTTCTTGTCAAAGATCAGTCCTTAGCTAAATATGGAAAAAT 
TATCGGTGGTCTTATTACTTCAGATGGTTATCATATAACAGCACCTAAGC 
CAACAGGTGAAGGGGCGGCACAGATTGCAAAGCAGCTAGTGACTCAAGCA 
GGTATTGACTACAGTGAGATTGACTATATTAATGGTCACGGTACAGGTAC 
TCAAGCTAATGATAAAATGGAAAAAAATATGTATGGTAAGTTTTTCCCGA 
CAACGACATTGATCAGCAGTACCAAGGGGCAAACGGGTCATACTCTAGGG 
GCTGCAGGTATTATCGAATTGATTAATTGTTTAGCGGCAATAGAGGAACA 
GACTGTACCAGCAACTAAAAATGAGATTGGGATAGAAGGTTTTCCAGAAA 
ATTTTGTCTATCATCAAAAGAGAGAATACCCAATAAGAAATGCTTTAAAT 
TTTTCGTTTGCTTTTGGTGGAAATAATAGTGGTATCTTATTGTCATCTTT 
AGATTCACCTCTAGAAACATTACCTGCTAGAGAAAATCTTAAAATGGCTA 
TCTTATCATCTGTTGCTTCCATTTCTAAGAATGAATCACTTTCTATAACC 
TATGAAAAAGTTGCTAGTAATTTCAACGACTTTGAAGCATTACGCTTTAA 
AGGGGCTAGACCACCCAAAACTGTCAACCCAGCACAATTTAGGAAAATGG 
ATGATTTTTCCAAAATGGTTGCCGTAACAACAGCTCAAGCACTAATAGAA 
AGCAATATTAATCTAAAAAAACAAGATACTTCAAAAGTAGGAATTGTATT 
TACAACACTTTCTGGACCAGTTGAGGTTGTTGAAGGTATTGAAAAGCAAA 
TCACAACAGAAGGATATGCACATGTTTCTGCTTCACGATTCCCGTTTACA 
GTAATGAATGCAGCAGCTGGTATGCTTTCTATCATTTTTAAAATAACAGG 
TCCTTTATCTGTCATTTCGACAAATAGTGGAGCGCTTGATGGTATACAAT 
ATGCCAAGGAAATGATGCGTAACGATAATCTAGACTATGTGATTCTTGTT 
TCTGCTAATCAGTGGACAGACATGAGTTTTATGTGGTGGCAACAATTAAA 
CTATGATAGTCAAATGTTTGTCGGTTCTGATTATTGTTCAGCACAAGTCC 
TCTCTCGTCAAGCATTGGATAATTCTCCTATAATATTAGGTAGTAAACAA 
TTAAAATATAGCCATAAAACATTCACAGATGTGATGACTATTTTTGATGC 
TGCGCTTCAAAATTTATTATCAGACTTAGGACTAACCATAAAAGATATCA 
AAGGTTTCGTTTGGAATGAGCGGAAGAAGGCAGTTAGTTCAGATTATGAT 
TTCTTAGCGAACTTGTCTGAGTATTATAATATGCCAAACCTTGCTTCTGG 
TCAGTTTGGATTTTCATCTAATGGTGCTGGTGAAGAACTGGACTATACTG 
TTAATGAAAGTATAGAAAAGGGCTATTATTTAGTCCTATCTTATTCGATC 
TTTGGTGGTATCTCTTTTGCTATTATTGAAAAAAGG 

SEQ ID NO. 7510 

STRAIN 1169NT 

ATGTTAGTGGAATAGGAATTATTTCTTCTTTGGGAAAGAATTATAG 
CGAGCATAAACAGCATCTCTTCGACTTAAAAGAAGGAATTTCTAAACATT 
TATATAAAAATCACGACTCTATTTTAGAATCTTATACAGGAAGCATAACT 
AGTGACCCAGAGGTTCCTGAGCAATACAAAGATGAGACACGTAATTTTAA 



328 



WO 2004/018646 



PCT/US2003/026827 



SEQUENCE LISTING 



ATTTGCTTTTACCGCTTTTGAAGAGGCTCTTGCTTCTTCAGGTGTTAATT 
TAAAAGCTTATCATAATATTGCTGTGTGTTTAGGGACCTCACTTGGGGGA 
AAGAGTGCTGGTCAAAATGCCTTGTATCAATTTGAAGAAGGAGAGCGTCA 
AGTAGATGCTAGTTTATTAGAAAAAGCATCTGTTTACCATATTGCTGATG 
AATTGATGGCTTATCATGATATTGTGGGAGCTTCGTATGTTATTTCAACC 
GCCTGTTCTGCAAGTAATAATGCCGTAATATTAGGAACACAATTACTTCA 
AGATGGCGATTGTGATTTAGCTATTTGTGGTGGCTGTGATGAGTTAAGTG 
ATATTTCTTTAGCAGGCTTCACATCACTAGGAGCTATTAATACAGAAATG 
GCATGTCAGCCCTATTCTTCTGGAAAAGGAATCAATTTGGGTGAGGGCGC 
TGGTTTTGTTGTTCTTGTCAAAGATCAGTCCTTAGCTAAATATGGAAAAA 
TTATCGGTGGTCTTATTACTTCAGATGGTTATCATATAACAGCACCTAAG 
CCAACAGGTGAAGGGGCGGCACAGATTGCAAAGCAGCTAGTGACTCAAGC 
AGGTATTGACTACAGTGAGATTGACTATATTAACGGTCACGGTACAGGTA 
CTCAAGCTAATGATAAAATGGAAAAAAATATGTATGGTAAGTTTTTCCCG 
ACAACGACATTGATCAGCAGTACCAAGGGGCAAACGGGTCATACTCTAGG 
GGCTGCAGGTATTATCGAATTGATTAATTGTTTAGCGGCAATAGAGGAAC 
AGACTGTACCAGCAACTAAAAATGAGATTGGGATAGAAGGTTTTCCAGAA 
AATTTTGTCTATCATCAAAAGAGAGAATACCCAATAAGAAATGCTTTAAA 
TTTTTCGTTTGCTTTTGGTGGAAATAATAGTGGTATCTTATTGTCATCTT 
TAGATTCACCTCTAGAAACATTACCTGCTAGAGAAAATCTTAAAATGGCT 
ATCTTATCATCTGTTGCTTCCATTTCTAAGAATGAATCACTTTCTATAAC 
CTATGAAAAAGTTGCTAGTAATTTCAACGACTTTGAAGCATTACGCTTTA 

aaggggctagaccaccx:aaaactgtcaacccagcacaatttaggaaaatg 

• GATGATTTTTCCAAAATGGTTGCCGTAACAACAGCTCAAGCACTAATAGA 
AAGCAATATTAATCTAAAAAAAPAAGATACTTCAAAAGTAGGAATTGTAT 
TTACAACACTTTCTGGACCAGTTGAGGTTGTTGAAGGTATTGAAAAGCAA 
ATCACAACAGAAGGATATGCACATGTTTCTGCTTCACGATTCCCGTTTAC 
AGTAATGAATGCAGCAGCTGGTATGCTTTCTATCATTTTTAAAATAACAG 
GTCCTTTATCTGTCATTTCGACAAATAGTGGAGCGCTTGATGGTATACAA 
TATGCCAAGGAAATGATGCGTAACGATAATCTAGACTATGTGATTCTTGT 
TTCTGCTAATCAGTGGACAGACATGAGTT TT ATGTGGT GGCAACAATTAA 
ACTATGATAGTCAAATGTTTGTCGGTTCTGATTATTGTTCAGCACAAGTC 
CTCTCTCGTCAAGCATTGGATAATTCTCCTATAATATTAGGTAGTAAACA 
ATTAAAATATAGCCATAAAACATTCACAGATGTGATGACTATTTTTGATG 
CTGCGCTTCAAAATTTATTATCAGACTTAGGACTAACCATAAAAGATATC 
AAAGGTTTCGTTTGGAATGAGCGGAAGAAGGCAGTTAGTTCAGATTATGA 
TTTCTTAGCGAACTTGTCTGAGTATTATAATATGCCAAACCTTGCTTCTG 
GTCAGTTTGGATTTTCATCTAATGGTGCTGGTGAAGAACTGGACTATACT 
GTTAATGAAAGTATAGAAAAGGGCTATTATTTAGTCCTATCTTATTCGAT 
CTTTGGTGGTATCTCTTTTGCTATTATTGAAAAAAGG 

SEQ ID NO. 7511 

STRAIN JM9130013 

ATGTTAGTGGAATAGGAATTATTTCTTCTTTGGGAAAGAATTATAGCGAG 
CATAAACAGCATCTCTTCGACTTAAAAGAAGGAATTTCTAAACATTTATA 
TAAAAATCACGACTCTATTTTAGAATCTTATACAGGAAGCATAACTAGTG 
ACCCAGAGGTTCCTGAGCAATACAAAGATGAGACACGTAATTTTA^ATTT 
GCTTTTACCGCTTTTGAAGAGGCTCTTGCTTCTTCAGGTGTTAATTTAAA 
AGCTTATCATAATATTGCTGTGTGTTTAGGGACCTCACTTGGGGGAAAGA 
GTGCTGGTCAAAATGCCTTGTATCAATTTGAAGAAGGAGAGCGTCAAGTA 
GATGCTAGTTTATTAGAAAAAGCATCTGTTTACCATATTGCTGATGAATT 
GATGGCTTATCATGATATTGTGGGAGCTTCGTATGTTATTTCAACCGCCT 
GTTCTGCAAGTAATAATGCCGTAATATTAGGAACACAATTACTTCAAGAT 
GGCGATTGTGATTTAGCTATTTGTGGTGGCTGTGATGAGTTAAGTGATAT 
TTCTTTAGCAGGCTTCACATCACTAGGAGCTATTAATACAGAAATGGCAT 
GTCAGCCCTATTCTTCTGGAAAAGGAATCAATTTGGGTGAGGGCGCTGGT 
TTTGTTGTTCTTGTCAAAGATCAGTCCTTAGCTAAATATGGAAAAATTAT 
CGGTGGTCTTATTACTTCAGATGGTTATCATATAACAGCACCTAAGCCAA 
CAGGTGAAGGGGCGGCACAGATTGCAAAGCAGCTAGTGACTCAAGCAGGT 
ATTGACTACAGTGAGATTGACTATATTAACGGTCACGGTACAGGTACTCA 
AGCTAATGATAAAATGGAAAAAAATATGTATGGTAAGTTTTTCCCGACAA 
CGACATTGATCAGCAGTACCAAGGGGCAAACGGGTCATACTCTAGGGGCT 
GCAGGTATTATCGAATTGATTAATTGTTTAGCGGCAATAGAGGAACAGAC 
TGTACCAGCAACTAAAAATGAGATTGGGATAGAAGGTTTTCCAGAAAATT 
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TTGTCTATCATCAAAAGAGAGAATACCCAATAAGAAATGCTTTAAATTTT 
TCGTTTGCTTTTGGTGGAAATAATAGTGGTGTCTTATTGTCATCTTTAGA 
TTCACCTCTAGAAACATTACCTGCTAGAGAAAATCTTAAAATGGCTATCT 
TATCATCTGTTGCTTCCATTTCTAAGAATGAATCACTTTCTATAACCTAT 
GAAAAAGTTGCTAGTAATTTCAACGACTTTGAAGCATTACGCTTTAAAGG 
GGCTAGACCACCCAAAACTGTCAACCCAGCACAATTTAGGAAAATGGATG 
ATTTTTCCAAAATGGTTGCCGTAACAACAGCTCAAGCACTAATAGAAAGC 
AATATTAATCTAAAAAAACAAGATACTTCAAAAGTAGGAATTGTATTTAC 
AACACTTTCTGGACCAGTTGAGGTTGTTGAAGGTATTGAAAAGCAAATCA 
CAACAGAAGGATATGCACATGTTTCTGCTTCACGATTCCCGTTTACAGTA 
ATGAATGCAGCAGCTGGTATGCTTTCTATCATTTTTAAAATAACAGGTCC 
TTTATCTGTCATTTCGACAAATAGTGGAGCGCTTGATGGTATACAATATG 
CCAAGGAAATGATGCGTAACGATAATCTAGACTATGTGATTCTTGTTTCT 
GCTAATCAGTGGACAGACATGAGTTTTATGTGGTGGCAACAATTAAACTA 
TGATAGTCAAATGTTTGTCGGTTCTGATTATTGTTCAGCACAAGTCCTCT 
CTCGTCAAGCATTGGATAATTCTCCTATAATATTAGGTAGTAAACAATTA 
AAATATAGCCATAAAACATTCACAGATGTGATGACTATTTTTGATGCTGC 
GCTTCAAAATTTATTATCAGACTTAGGACTAACCATAAAAGATATCAAAG 
GTTTCGTTTGGAATGAGCGGAAGAAGGCAGTTAGTTCAGATTATGATTTC 
TTAGCGAACTTGTCTGAGTATTATAATATGCCAAACCTTGCTTCTGGTCA 
GTTTGGATTTTCATCTAATGGTGCTGGTGAAGAACTGGACTATACTGTTA 
ATGAAAGTATAGAAAAGGGCTATTATTTAGTCCTATCTTATTCGATCTTC 
GGTGGTATCTCTTTTGCTATTATTGAAAAAAGG 

SEQ ID NO. 7512 
STRAIN 2603 frame: 1 

MS\TfVSGIGIISSIX3KNYSEHKQHLFDLI^GISKHLYKNHDSILESYTGSITSDPEVPEQ 
YKDETRNFKFAFTAFEEALASSGVNLKAYHNIAVCLGTSLGGKSAGQNALYQFEEGERQV 
DASLLEKASVYHIADELMAYHDIVGASYVISTACSASNNAVILGTQLLQDGDCDLAICGG 
CDELSDISLAGFTSLGAINTEMACQPY'SSGKGINLGEGAGFWLVKDQSLAKYGKIIGGL 
ITSDGYHITAPKPTGEGAAQIAKQLVTQAGIDYSEIDYINGHGTGTQANDKMEKNMYGKF 
FPTTTLISSTKGQTGHTLGAAGIIELINCLAAIEEQTVPATKNEIGIEGFPENFVYHQKR 
EYPIRNALNFSFAFGGNNSGVLLSSLDSPLETLPARENLKMAILSSVASISKNESLSITY 
EKVASNFNDFEALRFKGARPPKTWPAQFRKMDDFSKMVAVTTAQALIESNINLKKQDTS 
KVGIVFTTLSGPVEWEGIEKQITTEGYAHVSASRFPFTVMNAAAGMLSIIFKITGPLSV 
ISTNSGALDGIQYAKEMMRNDNLDYVILVSANQWTDMSFMWWQQLNYDSQMFVGSDYCSA 
QVLSRQALDNSPIILGSKQLKYSHKTFTDVMTIFDAALQNLLSDLGLTIKDIKGFVWNER 
KKAVSSDYDFLANLSEYYNMPNLASGQFGFSSNGAGEELDYTVNESIEKGYYLVLSYSIF 
GGISFAIIEKR 

SEQ ID NO. 7513 

STRAIN 090 frame: 3 

VSGIGIISSLGKNYSEHKQHLFDLKEGISKHLYKNHDSILESYTGSITSDPEVPEQYKDE 
TRNFKFAFTAFEEALASSGVNLKAYHNIAVCLGTSLGGKSAGQNALYQFEEGERQVDASL 
LEKASVYHIADELMAYHDIVGASYVISTACSASNNAVILGTQLLQDGDCDLAICGGCDEL 
SDISLAGFTSLGAINTEMACQPYSSGKGINLGEGAGFWLVKDQSLAKYGKIIGGLITSD 
G YH I T APKPTGEGAAQ I AKQLVTQAG I D Y SE I DY INGHGTGTQANDKMEKNMYGKFFPTT 
TLISSTKGQTGHTLGAAGIIELINCLAAIEEQTVPATKNEIGIEGFPENFVYHQKREYPI 
RNALNFSFAFGGNNSGILLSSLDSPLETLPARENLKMAILSSVASISKNESLSITYEKVA 
SN FNDFEALR FKGARP PKTVN PAQFRKM D D FSKMVAVTTAQALIESNINLKKQDTSKVGI 
VFTTLSGPVEWEGIEKQITTEGYAHVSASRFPFTVMNAAAGMLSIIFKITGPLSVISTN 
SGALDGIQYAKEMMRNDNLDYVILVSANQWTDMSFMWWQQLNYDSQMFVGSDYCSAQVLS 
RQALDNS P 1 1 LGSKQLKY S HKT FT DVMT I FDAALQNLL S DLGLT I KDI KG FVWNERKKAV 
SSDYDFLANLSEYYNMPNLASGQFGFSSNGAGEELDYTVNESIEKGYYLVLSYSIFGGIS 
FAIIEKR 

SEQ ID NO. 7514 

STRAIN A909 frame: 3 

VSGIGIISSLGKNYSEHKQHLFDLKEGISKHLYKNHDSILESYTGSITSDPEVPEQYKDE 
TRNFKFAFTAFEEALASSGVNLKAYHNIAVCLGTSLGGKSAGQNALYQFEEGERQVDASL 
LEKASVYHIADELMAYHDIVGASYVISTACSASNNAVILGTQLLQDGDCDLAICGGCDEL 
SDISLAGFTSLGAINTEMACQPYSSGKGINLGEGAGFWLVKDQSLAKYGKIIGGLITSD 
GYHITAPKPTGEGAAQIAKQLVTQAGIDYSEIDYINGHGTGTQANDKMEKNMYGKFFPTT 
TLISSTKGQTGHTLGAAGIIELINCLAAIEEQTVPATKNEIGIEGFPENFVYHQKREYPI 
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RNALNFSFATOGtmSGVLLSSLDSPLETLPARENLIO^AILSSVASISKNESLSITYEKVA 
SNFNDFEALRFKGARPPKTVNPAQHTIKMDDFSKMVAVTTAQALIESNINLKKQDTSKVGI 
VFTfTLSGPVEWEGlEKQITTEGYAHVSASRFPFTVMNAAAGMLSIIFKITGPLSVISTN 
SGALDGIQYAKEMMRNDNLDYVILVSANQWTDMSFMWWQQLNYDSQMFVGSDYCSAQVLS 
RQALDNSPIILGSKQLKYSHKTFTDVMTIFDAALQNLLSDLGLTIKDIKGFVWNERKKAV 
SSDYDFLANLSEYYNMPNLASGQFGFSSNGAGEELDYTVNESIEKGYYLVLSYSIFGGIS 
FAIIEKR 

SEQ ID NO. 75X5 

STRAIN H36B frame: 3 

VSGIGIISSLGKNYSEHKQHLFDLKEGISKHLYKNHDSILESYTGSITSDPEVPEQYKDE 
TRNFKFAFTAFEEALASSGVNLKAYHNIAVCLGTSLGGKSAGQNALYQFEEGERQVDASL 
LEKASVYHIADELMAYHDIVGASYVISTACSASNNAVILGTQLLQDGDCDLAICGGCDEL 
SDISLAGFTSLGAINTEMACQPYSSGKGINLGEGAGFWLVKDQSLAKYGKIIGGLITSD 
GYHITAPKPTGEGAAQIAKQLVTQAGIDYSEIDYINGHGTGTQANDKMEKNMYGKFFPTT 
TLISSTKGQTGHTLGAAGIIELINCLAAIEEQWPATKNEIGIEGFPENFVYHQKREYPI 
RNALNFSFAFGGNNSGVLLSSLDSPLETLPARENLKMAILSSVASISKNESLSITYEKVA 
SNFNDFEALRFKGARPPKTVNPAQFRKMDDFSKMVAVTTAQALIESNINLKKQDTSKVGI 
VFTTLSGPVE WEG IEKQI TTEG YAHVS ASRFP FT VMNAAAGMLS 1 1 FKITGPLS VI STN 
SGALDGIQYAKEMMRNDNLDYVILVSANQWTDMSFMWWQQLNYDSQMFVGSDYCSAQVLS 
RQALDNSPIILGSKQLKYSHKTFTDVMTIFDAALQNLLSDLGLTIKDIKGFVWNERKKAV 
SSDYDFLANLSEYYNMPNLASGQFGFSSNGAGEELDYTVNESIEKGYYLVLSYSIFGGIS 
• FAIIEKR * 

SEQ ID NO. 7516 

STRAIN 18RS21 frame: 3 

VSGIGIISSLGKNYSEHKQHLFDLKEGISKHLYKNHDSILESYTGSITSDPEVPEQYKDE 
TRNFKFAFTAFEEALASSGVNLKAYHNIAVCLGTSLGGKSAGQNALYQFEEGERQVDASL 
LEKASVYHIADELMAYHDIVGASYVISTACSASNNAVILGTQLLQDGDCDLAICGGCDEL 
SDISLAGFTSLGAINTEMACQPYSSGKGINLGEGAGFWLVKDQSLAKYGKIIGGLITSD 
GYHITAPKPTGEGAAQIAKQLVTQAGIDYSEIDYINGHGTGTQANDKMEKNMYGKFFPTT 
TLISSTKGQTGHTLGAAGIIELINCLAAIEEQTVPATKNEIGIEGFPENFVYHQKREYPI 
RNALNFSFAFGGNNSGVLLSSLDSPLETLPARENLKMAILSSVASISKNESLSITYEKVA 
SNFNDFEALRFKGARPPKTVNPAQFRKMDDFSKMVAVTTAQALIESNINLKKQDTSKVGI 
VFTTLSGPVE WEG IEKQI TTEG YAHVS ASRFP FTVMNAAAGMLS 1 1 FKITGPLS VI STN 
SGALDGIQYAKEMMRNDNLDYVILVSANQWTDMSFMWWQQLNYDSQMFVGSDYCSAQVLS 
RQALDNSPI I LGSKQLKYSHKT FT DVMTI FDAALQNLLS DLGLT IKDIKG FVWNERKKAV 
SSDYDFLANLSEYYNMPNLASGQFGFSSNGAGEELDYTVNESIEKGYYLVLSYSIFGGIS 
FAIIEKR 

SEQ ID NO. 7517 

STRAIN M732 frame: 3 

VSGIGIISSLGKNYSEHKQHLFDLKEGISKHLYBCNHDSILESYTGSITSDPEVPEQYKDE 
TRNFKFAFTAFEEALAS SGVNLKAYHN I AVCLGT S LGGKS AGQNALYQFEEGERQVDAS L 
LEKASVYHIADELMAYHDIVGASYVISTACSASNNAVILGTQLLQDGDCDLAICGGCDEL 
SDISLAGFTSLGAINTEMACQPYSSGKGINLGEGAGFWLVKDQSLAKYGKIIGGLITSD 
GYHITAPKPTGEGAAQIAKQLVTQAGIDYSEIDYINGHGTGTQANDKMEKNMYGKFFPTT 
TLISSTKGQTGHTLGAAGIIELINCLAAIEEQTVPATKNEIGIEGFPENFVYHQKREYPI 
RNALNFSFAFGGNNSGVLLSSLDSPLETLPARENLKMAILSSVASISKNESLSITYEKVA 
SNFNDFEALRFKGARPPKTVNPAQFRKMDDFSKMVAVTTAQALIESNINLKKQDTSKVGI 
VFTTLSGPVEVVEG IEKQI TTEG YAHVS ASRFPFTVMNAAAGMLS 1 1 FKITGPLS VI STN 
SGALDGIQYAKEMMRNDNLDYVILVSANQWTDMSFMWWQQLNYDSQMFVGSDYCSAQVLS 
RQALDNSPI ILGSKQLKYSHKTFTDVMTI FDAALQNLLS DLGLT-IKDIKGFVWNERKKAV 
SSDYDFLANLSEYYNMPNLASGQFGFSSNGAGEELDYTVNESIEKGYYLVLSYSIFGGIS 
FAIIEKR 

SEQ ID NO. 7518 

STRAIN COH1 frame: 3 

VSGIGIISSLGKNYSEHKQHLFDLKEGISKHLYKNHDSILESYTGSITSDPEVPEQYKDE 
TRNFKFAFTAFEEALAS SGVNLKAYHN IAVCLGTS LGGKS AGQNALYQFEEGERQVDASL 
LEKASVYHIADELMAYHDIVGASYVISTACSASNNAVILGTQLLQDGDCDLAICGGCDEL 
SDISLAGFTSLGAINTEMACQPYSSGKGINLGEGAGFWLVKDQSLAKYGKIIGGLITSD 
GYHITAPKPTGEGAAQIAKQLVTQAGIDYSEIDYINGHGTGTQANDKMEKNMYGKFFPTT 
TLISSTKGQTGHTLGAAGIIELINCLAAIEEQTVPATKNEIGIEGFPENFVYHQKREYPI 
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RNALNFSFAFGGNNSGVLLSSLDSPLETLPARENLKMAILSSVASISKNESLSITYEKVA 
SN FN DFEALRFKGARP PKT VNPAQFRKMDD FSKMVAVTTAQAL IESN INLKKQDTSKVGI 
VFTTLSGPVEWEGIEKQITTEGYAHVSASRFPFTVMNAAAGMLSIIFKITGPLSVISTN 
SGALDGIQYAKEMMRNDNLDYVILVSANQWTDMSET5WWQQLNYDSQMFVGSDYCSAQVLS 
RQALDNSPIILGSKQLKYSHKTFTDVMTIFDAALQNLLSDLGLTIKDIKGFVWNERKKAV 
SSDYDFLANLSEYYNMPNLASGQFGFSSNGAGEELDYTVNESIEKGYYLVLSYSIFGGIS 
FAIIEKR 

SEQ ID NO. 7519 

STRAIN M781 frame: 3 

VSGIGIISSLGKNYSEHKQHLFDLKEGISKHLYKNHDSILESYTGSITSDPEVPEQYKDE 

TRNFKFAFTAFEEALASSGVNLKAYHNIAVCLGTSLGGKSAGQNALYQFEEGERQVDASL 

LEKASVYHIADELMAYHDIVGASYVISTACSASNNAVILGTQLLQDGDCDLAICGGCDEL 

SDISIAGFTSLGAINTEMACQPYSSGKGINLGEGAGFVVLVKDQSLAKYGKIIGGLITSD 

GYHITAPKPTGEGAAQIAKQLVTQAGIDYSEIDYINGHGTGTQANDKMEKNMYGKFFPTT 

TLISSTKGQTGHTLGAAGIIELINCLAAIEEQTVPATKNEIGIEGFPENFVYHQKREYPI 

RNALNFSFAFGGNNSGILLSSLDSPLETLPARENLKMAILSSVASISKNESLSITYEKVA 

SNFNDB^^FKGARPPKTVNPAQFRKMDDFSKMVAVTTAQALIESNINLKKQDTSKVGI 

VFTTLSGPVEVVEGIEKQITTEGYAHVSASRFPFTVMNAAAGMLSIIFKITGPLSVISTM 

SGALDGIQYAKEMMRNDNLDYVILVSANQWTDMSFMWWQQLNYDSQMFVGSDYCSAQVLS 

RQALDNSPIILGSKQLKYSHKTFTDVMTIFDAALQNLLSDLGLTIKDIKGFVWNERKKAV 

SSDYDFI^IjSEYYNMPNLASGQTOFSSNGAGEELDYTViraSIEKGYYLVL^YSI^ 

FAIIEKR ' 

SEQ ID NO. 7520 ' 
STRAIN CJB110 frame: 3 " ' 

VSGIGIISSLGKNYSEHKQHLFDLKEGISKHLYKNHDSILESYTGSITSDPEVPEQYKDE 
TRNFKFAFTAFEEALASSGVNLKAYHNIAVCLGTSLGGKSAGQNALYQFEEGERQVDASL 
LEKASVYHIADELMAYHDIVGASYVISTACSASNNAVILGTQLLQDGDCDLAICGGCDEL 
SDISLAGFTSLGAINTEMACQPYSSGKGINLGEGAGFWLVKDQSLAKYGKIIGGLITSD 
GYHITAPKPTGEGAAQIAKQLVTQAGIDYSEIDYINGHGTGTQANDKMEKNMYGKFFPTT 
TLISSTKGQTGHTLGAAGIIELINCLAAIEEQTVPATKNEIGIEGFPENFVYHQKREYPI 
RNALNFSFAFGGNNSGILLSSLDSPLETLPARENLKMAILSSVASISKNESLSITYEKVA 
SNFNDFEALRFKGARPPKTVNPAQFRKMDDFSKMVAVTTAQALIESNINLKKQDTSKVGI 
VFTTLSGPVEWEGIEKQITTEGYAHVSASRFPFTVMNAAAGMLSIIFKITGPLSVISTN 
SGALDGIQYAKEMMRNDNLDYVILVSANQWTDMSFMWWQQLNYDSQMFVGSDYCSAQVLS 
RQALDNSPIILGSKQLKYSHKTFTDVMTIFDAALQNLLSDLGLTIKDIKGFVWNERKKAV 
SSDYDFLANLSEYYNMPNLASGQFGFSSNGAGEELDYTVNESIEKGYYLVLSYSIFGGIS 
FAIIEKR 

SEQ ZD NO. 7521 

STRAIN 1169NT frame: 3 

VSGIGIISSLGKNYSEHKQHLFDLKEGISKHLYKNHDSILESYTGSITSDPEVPEQYKDE 
TRN FKFAFTAFEEALAS SGVNLKAYHN IAVCLGT S LGGKS AGQNALYQFEEGERQVDAS L 
LEKASVYHIADELMAYHDIVGASYVISTACSASNNAVILGTQLLQDGDCDLAICGGCDEL 
SDISLAGFTSLGAINTEMACQPYSSGKGINLGEGAGFWLVKDQSLAKYGKIIGGLITSD 
GYHITAPKPTGEGAAQIAKQLVTQAGIDYSEIDYINGHGTGTQANDKMEKNMYGKFFPTT 
TLISSTKGQTGHTLGAAGIIELINCLAAIEEQTVPATKNEIGIEGFPENFVYHQKREYPI 
RNALNFSFAFGGNNSGILLSSLDSPLETLPARENLKMAILSSVASISKNESLSITYEKVA 
SNFNDFEALRFKGARPPKTVNPAQFRKMDDFSKMVAVTTAQALIESNINLKKQDTSKVGI 
VFTTLSGPVEWEGIEKQITTEGYAHVSASRFPFTVMNAAAGMLSIIFKITGPLSVISTN 
SGALDGIQYAKEMMRNDNLDYVILVSANQWTDMSFMWWQQLNYDSQMFVGSDYCSAQVLS 
RQALDNSPIILGSKQLKYSHKTFTDVMTIFDAALQNLLSDLGLTIKDIKGFVWNERKKAV 
SSDYDFLANLSEYYNMPNLASGQFGFSSNGAGEELDYTVNESIEKGYYLVLSYSIFGGIS 
FAIIEKR 

SEQ XD NO. 7522 

STRAIN JM9130013 frame: 3 

VSGIGIISSLGKNYSEHKQHLFDLKEGISKHLYKNHDSILESYTGSITSDPEVPEQYKDE 
TRN FKFAFTAFEEALAS SGVNLKAYHN I AVCLGTS LGGKS AGQNALYQFEEGERQVDASL 
LEKASVYHIADELMAYHDIVGASYVISTACSASNNAVILGTQLLQDGDCDLAICGGCDEL 
SDISLAGFTSLGAINTEMACQPYSSGKGINLGEGAGFWLVKDQSLAKYGKIIGGLITSD 
GYHITAPKPTGEGAAQI AKQLVTQAGI DYSEI DYINGHGTGTQANDKMEKNMYGKFFPTT 
TLISSTKGQTGHTLGAAGIIELINCLAAIEEQTVPATKNEIGIEGFPENFVYHQKREYPI 
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RNALNFSFAFGGNNSGVLLSSLDSPLETLPARENIiKMAILSSVASISKNESLSITYEBCVA 
SNFNDFEALRFKGARPPKTVNPAQFRKMDDFSKMVAVTTAQALIESNINLKKQDTSKVGI 
VFTTLSGPVEWEGIEKQITTEGYAHVSASRFPFTVMNAAAGMLSIIFKITGPLSVISTN 
SGALDGIQYAKEMMRN DNLD YV ILVS ANQWT DMS FMWWQQLN YDS QMFVGS DYC SAQVLS 
RQALDNSPIILGSKQLKYSHKTFTDVMTIFDAALQNLLSDLGLTIKDIKGFVWNERKKAV 
S S DYDFLANLSE YYNMPNLASGQFGFS SNGAGEELDYTVNES IEKGYYLVLSYS I FGGI S 
FAIIEKR 

SEQ ID NO. 7601 
STRAIN 2603 

ATGAAAAAAGTCATCGATTTAAAAAAACTACAAAT^AGCATATGCCTCAGAAACCGTTTTA 
AATAATATTAATTTGGAGGTGTTTAAAGGCGAAATAATTGGATTAATAGGACCCTCTGGA 
GCAGGGAAATCTACCTTGATTAAAACTATGCTTGGCATGGAAAAAGCAGATAAGGGAACA 
GCTCTTGTTCTTGATACTCAAATGCCAGATCGTAATATTTTAAATCAAATTGGCTATATG 
GCTCAATCTGATGCCTTATACGAGTCTTTAACTGGCTTAGAAAATTTATTATTCTTTGGA 
AAAATGAAAGGTATTCAAAAAACTGAATTAAAACAGCAGATAACTCATATTTCTAAAGTA 
GTAGATCTAGAAAACCAACTTGATAAATTTGTCTCAGGTTACTCAGGAGGTATGAAAAGA 
CGGCTTTCTCTAGCCATCGCCCTACTTGGAAACCCCACAGTTTTAATCCTAGATGAACCT 
ACCGTTGGAATTGATCCATCCTTGAGGAGAAAAATCTGGCAAGAGCTAATTAATATTAAG 
GATGAAGGACATTCTATCTTTATTACAACCCACGTTATGGATGAAGCAGAATTAACAAGT 
AAGGTTGCACTACTATTACGTGGAAACATTATTGCCTTTGATAC'f'CCATTACATTTAAAA 
AAACAATTTAATGTGAGTACTATTGAGGWIGTTTTCTTAAAAGCTGAAGGAGAA 

SEQ ID NO. 7602 4 

STRAIN 090 ^ " 

ATTTAAAAAAACTACAAAAAGCATATGCCTCAGAAACTGTTTTAAATAAT 

ATTAATTTGGAGGTGTTTAAAGGCGAAATAATTGGATTAATAGGACCCTC 

TGGAGCAGGGAAATCTACCTTGATTAAAACTATGCTTGGCATGGAAAAAG 

CAGATAAGGGAACAGCTCTTGTTCTTGATACTCAAATGCCAGATCGTAAT 

ATTTTAAATCAAATTGGCTATATGGCTCAATCTGATGCCTTATACGAATC 

TTTAACTGCCTTAGAAaATTTATTATTCTTTGGAAAAATGAAAGGTATTC 

AAAAAACTGAATTAAAACAGCAGATAACTCATATTTcTAAAGTAGTAGAT 

CTAGAAAACCAACTTGATAAATTTGTCTCAGGTTACTCAGGAGGTATGAA 

AAGACGGCTTTCTCTAGCCATCGCCCTACTTGGAAACCCCACAGTTTTAA 

TCCTAGATGAACCTACCGTTGGAATTGATCCATCCTTGAGGAGAAAAATC 

TGGCAAGAGCTAATTAATATTAaGGATGAAGGACGTTCTATCTTTATTAC 

AACCCACGTTATGGATGAAGCAGAATTAACAAGTAAGGTTGCACTACTAT 

TACGTGGAAACATTATTGCCTTTGATACTCCATTACATTTAAAAAAACAA 

TTTAATGTGAGTACTATtGAGGAAGTTTTCTTAAAAGCTGAAGGAGAA 

SEQ ID NO. 7603 

STRAIN A909 ( 

AAAAAAGTCATCGATTTAAAAAAACTACAAAAAGCATATGCCTCA 

GAAACCGTTTTAAATAATATTAATTTGGAGGTGTTTAAAGGCGAAATAAT 

TGGATTAATAGGACCCTCTGGAGCAGGGAAATCTACCTTGATTAAAACTA 

TGCTTGGCATGGAAAAAGCAGATAAGGGAACAGCTCTTGTTCTTGATACT 

CAAATGCCAGATCATAATATTTTAAATCAAATTGGCTATATGGCTCAATC 

TGATGCCTTATACGAGTCTTTAACTGGCTTAGAAAATTTATTATTCTTTG 

GAAAAATGAAAGGTATTCAAAAAACTGAATTAAAACAGCAGATAACTCAT 

ATTTCTAAAGTAGTAGATCTAGAAAACCAACTTGATAAATTTGTCTCAGG 

TTACTCAGGAGGTATGAAAAGACGGCTTTCTCTAGCCATCGCCCTACTTG 

GAAACCCCACAGTTTTAATCCTAGATGAACCTACCGTTGGAATTGATCCA 

TCCTTGAGGAGAAAAATCTGGCAAGAGCTAATTAATATTAAGGATGAAGG 

ACGTTCTATCTTTATTACAACCCACGTTATGGATGAAGCAGAATTAACAA 

GTAAGGTTGCACTACTATTACGTGGAAACATTATTGCCTTTGATACTCCA 

TTACATTTAAAAAAACAATTTAATGTGAGTACTATTGAGGAAGTTTTCTT 

AAAAGCTGAAGGAGAA 

SEQ ID NO. 7604 

STRAIN H36B 

AAAAAAGTCATTGATTTAAAAAAACTACAAAAAGCATATGCC 
TCAGAAACCGTTTTAAATAATATTAATTTGGAGGTGTTTAAAGGCGAAAT 
AATTGGATTAATAGGACCCTCTGGAGCAGGGAAATCTACCTTGATTAAAA 
CTATGCTTGGCATGGAAAAAGCAGATAAGGGAaCAGCTCTTGTTCTTGAT 
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ACTCAAATGCCAGATCGTAATATTTTAAATCAAATTGGCTATATGGCTCA 
ATCTGATGCCTTATACGAGTCTTTAACTGGCTTAGAAAATTTATTATTCT 
TTGGAAAAATGAAAGGTATTCAAAAAACTGAATTAAAACAGCAGATAACT 
CATATTTCTAAAGTAGTAGATCTAGAAAACCAACTTGATAAATTTGTCTC 
AGGTTACTCAGGAGGTATGAAAAGACGGCTTTCTCTAGCCATCGCCCTAC 
TTGGAAACCCCACAGTTTTAATCCTAGATGAACCTACCGTTGGAATTGAT 
CCATCCTTGAGGAGAAAAATCTGGCAAGAGCTAATTAATATTAAGGATGA 
AGGACGTTCTATCTTTATTACAACCCACGTTATGGATGAAGCAGAATTAA 
CAAGTAAGGTTGCACTACTATTACGTGGAAACATTATTGCCTTTGATACT 
CCATTACATTTAAAAAAACAATTTAAT'GTGAGTACTATTGAGGAAGTTTT 
CTTAAAAGCTGAAGGAGAA 

SEQ ID NO. 7605 

STRAIN 18RS21 

GATTTAAAAAAACTACAAAAAGCATATGCCTCAGAAACCGTTTTAAATAA 

TATTAATTTGGAGGTGTTTAAAGGCGAAATAATTGGATTAATAGGACCCT 

CTGGAGCAGGGAAATCTACcTTGATTAAAACTATGCTTGGCATGGAAAAA 

GCAGATAAGGGAACAGCTCTTGTTCTTGATACTCAAATGCCAGATCGTAA 

TATTTTAAATCAAATTGGCTATATGGCTCAATcTGATGCCTTATACGAGT 

CTTTAACTGGCTTAGAAAATTTATTATTCTTTGGAAAAATGAAAGGTATT 

CAAAAAACTGAATTAAAACAGCAGATAACTCATATTTCTAAAGTAGTAGA 

TCTAGAAAACCAACTTGATAAATTTGTCTCAGGTTACTCAGGAGGTATGA 

AAAGACGGCTTTCTcTAGCCATCGCCCTACTTGGAAACCCCACAGTTTTA. 

ATCCTAGATGAACCTACCGTTGGAATTGATCCATCGTTGAGGAGAAAAAT 

CTGGCAAGAGCTAATTAATATTAaGGATGAAGGACATTCTATCTTTATTA 

CAACCCACGTTATGGATGAAGCAGAATTAACAAGTAAGGTTGCACTACTA 

TTACGTGGAAACATTATTGCCTTTGATACTCCATTACATTTAAAAAAACA 

ATTTAATGTGAGTACTATTGAGGAAGTTTTCTTAAAAGCTGAAGGAGAA 

SEQ ID NO. 7606 

STRAIN M732 

AAAAAAGTCATCGATTTAAAAAAACTACAAAAAGCATACGCCTCA 

GAAACTGTTTTAAATAATATTAATTTGGAGGTGTTTAAAGGAGAAATAAT 

TGGATTAATAGGACCCTCTGGAGCAGGGAAATCTACCTTGATTAAAACTA 

TGCTTGGCATGGAAAAAGCAGATAAGGGAACAGCTCTTGTTCTTGATACT 

CAAATGCCAGATCGTAATATTTTAAATCAAATTGGCTATATGGCTCAATC 

TGATGCCTTACACGAGTCTTTAACTGGCTTAGAAAATTTATTATTCTTTG 

GAAAAATGAAAGGTATTCAAAAAACTGAATTAAAACAGCAGATAACTCAT 

ATTTCTAAAGTAGTAGATCTAGAAAACCAACTTGATAAATTTGTCTCAGG 

TTACTCAGGAGGTATGAAAAGACGGCTTTCTCTAGCCATCGCCCTACTTG 

GAAACCCCACAGTTTTAATCCTAGATGAACCTACCGTTGGAATTGATCCA 

TCCTTGAGGAGAAAAATCTGGCAAGAGCTAATTAATATTAAGGATGAAGG 

ACGTTCTATCTTTATTACAACCCACGTTATGGATGAAGCAGAATTAACAA 

GTAAGGTTGCACTACTATTACGTGGAAACATTATTGCCTTTGATACTCCA 

TTACATTTAAAAAAACAATTTAATGTGAGTACTATTGAGGAAGTTTTCTT 

AAAAGCTGAAGGAGAA 

SEQ ID NO. 7607 

STRAIN COH1 

AAAAAAGTCATCGATTTAAAAAAACTACAAAAAGCATACGCCTCAGAA 

ACTGTTTTAAATAATATTAATTTGGAGGTGTTTAAAGGAGAAATAATTGG 

ATTAATAGGACCCTCTGGAGCAGGGAAATCTACCTTGATTAAAACTATGC 

TTGGCATGGAAAAAGCAGATAAGGGAACAGCTCTTGTTCTTGATACTCAA 

ATGCCAGATCGTAATATTTTAAATCAAATTGGCTATATGGCTCAATCTGA 

TGCCTTACACGAGTCTTTAACTGGCTTAGAAAATTTATTATTCTTTGGAA 

AAATGAAAGGTATTCAAAAAACTGAATTAAAACAGCAGATAACTCATATT 

TCTAAAGTAGTAGATCTAGAAAACCAACTTGATAAATTTGTCTCAGGTTA 

CTCAGGAGGTATGAAAAGACGGCTTTCTCTAGCCATCGCCCTACTTGGAA 

ACCCCACAGTTTTAATCCTAGATGAACCTACCGTTGGAATTGATCCATCC 

TTGAGGAGAAAAATCTGGCAAGAGCTAATTAATATTAAGGATGAAGGACG 

TTCTATCTTTATTACAACCCACGTTATGGATGAAGCAGAATTAACAAGTA 

AGGTTGCACTACTATTACGTGGAAACATTATTGCCTTTGATACTCCATTA 

CATTTAAAAAAACAATTTAATGTGAGTACTATTGAGGAAG 
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SEQ ZD NO. 7608 

STRAIN M781 

AAAAAAGTCATCGATTTAAAAAAACTACAAAAAGCATAC 

GCCTCAGAAACTGTTTTAAATAATATTAATTTGGAGGTGTTTAAAGGAGA 

AATAATTGGATTAATAGGACCCTCTGGAGCAGGGAAATCTACCTTGATTA 

AAACTATGCTTGGCATGGAAAAAGCAGATAAGGGAACAGCTCTTGTTCTT 

GATACTCAAATGCCAGATCGTAATATTTTAAATCAAATTGGCTATATGGC 

TCAATCTGATGCCTTACACGAGTCTTTAACTGGCTTAGAAAATTTATTAT 

TCTTTGGAAAAATGAAAGGTATTCAAAAAACTGAATTAAAACAGCAGATA 

ACTCATATTTCTAAAGTAGTAGATCTAGAAAACCAACTTGATAAATTTGT 

CTCAGGTTACTCAGGAGGTATGAAAAGACGGCTTTCTCTAGCCATCGCCC 

TACTTGGAAACCCCACAGTTTTAATCCTAGATGAACCTACCGTTGGAATT 

GATCCATCCTTGAGGAGAAAAATCTGGCAAGAGCTAATTAATATTAAGGA 

TGAAGGACGTTCTATCTTTATTACAACCCACGTTATGGATGAAGCAGAAT 

TAACAAGTAAGGTTGCAGTACTATTACGTGGAAACATTATTGCCTTTGAT 

ACTCCATTACATTTAAAAAAACAATTTAATGTGAGTACTATTGAGGAAGT 

TTTCTTAAAAGCTGAAGGAGAA 

SEQ XD NO. 7609 

STRAIN CJB110 

AAAAAAGTCATCGATTTA^AAAAACTACAAAAAGCATATG 

cctcagat^actgttttaaataatattaatttggagStgtttaaaggcgaa 
ataattggattaataggaccctctggagcagggaaatctaccttgattaa 
aactatgcttggcatggaaaaagcagataagggaacagct'cttgttcttg 
atactcaaatgccagatcgtaatattttaaatcaaattggctatatggqt 
caatctgatgccttatacgaatctttaactgccttagaaaatttattatt 
ctttggaaaaatgaaaggtattcaaaaaactgaattaaaacagcagataa 
ctcatatttctaaagtagtagatctagaaaaccaacttgataaatttgtc 
tcaggttactcaggaggtatgaaaagacggctttctctagccatcgccct 
acttggaaaccccacagttttaatcctagatgaacctaccgttggaattg 
atccatccttgaggagaaaaatctggcaagagctaattaatattaaggat 
gaaggacgttctatctttattacaacccacgttatggatgaagcagaatt 

AACAAGTAAGGTTGCACTACTATTACGTGGAAACATTATTGCCTTTGATA 
CTCCATTACATTTAAAAAAACAATTTAATGTGAGTACTATTGAGGAAGTT 
TTCTTAAAAGCTGAAGGAGAA 

SEQ ID NO. 76X0 

STRAIN 1169NT 

AAAAAAGTCATCGATTTAAAAAAACTACAAAAAGCATAC 

GCCTCAGAAACTGTTTTAAATAATATTAATTTGGAGGTGTTTAAAGGCGA 

AATAATTGGATTAATAGGACCCTCTGGAGCAGGGAAATCTACCTTGATTA 

AAACTATGCTTGGCATGGAAAAAGCAGATAAGGGAACAGCTCTTGTTCTT 

GATACTCAAATGCCAGATCGTAATATTTTAAATCAAATTGGCTATATGGC 

TCAATCTGATGCCTTATACGAATCTTTAACTGCCTTAGAAAATTTATTAT 

TCTTTGGAAAAATGAAAGGTATTCAAAAAACTGAATTAAAACAGCAGATA 

ACTCATATTTCTAAAGTAGTAGATCTAGAAAACCAACTTGATAAATTTGT 

CTCAGGTTACTCAGGAGGTATGAAAAGACGGCTTTCTCTAGCCATCGCCC 

TACTTGGAAACCCCACAGTTTTAATCCTAGATGAACCTACCGTTGGAATT 

GATCCATCCTTGAGGAGAAAAATCTGGCAAGAGCTAATTAATATTAAGGA 

TGAAGGACGTTCTATCTTTATTACAACCCACGTTATGGATGAAGCAGAAT 

TAACAAGTAAGGTTGCACTACTATTACGTGGAAACATTATTGCCTTTGAT 

ACTCCATTACATTTAAAAAAACAATTTAATGTGAGTACTATTGAGGAAGT 

TTTCTTAAAAGCTGAAGGAGAA 

SEQ ID NO. 7611 

STRAIN JM9130013 

AAAAAAGTC AT CGATTT AAAAAAACT ACAAAAAGC AT ATGCC 

TCAGAAACCGTTTTAAATAATATTAATTTGGAGGTGTTTAAAGGCGAAAT 

AATTGGATTAATAGGACCCTCTGGAGCAGGGAAATCTACCTTGATTAAAA 

CTATGCTTGGCATGGAAAAAGCAGATAAGGGAACAGCTCTTGTTCTTGAT 

ACTCAAATGCCAGATCGTAATATTTTAAATCAAATTGGCTATATGGCTCA 

ATCTGATGCCTTATACGAGTCTTTAACTGGCTTAGAAAATTTATTATTCT 

TTGGAAAAATGAAAGGTATTCAAAAAACTGAATTAAAACAGCAGATAACT 

CATATTTCTAAAGTAGTAGATCTAGAAAACCAACTTGATAAATTTGTCTC 
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AGGTTACTCAGGAGGTATGAAAAGACGGCTTTCTCTAGCCATCGCCCTAC 
TTGGAAACCCCACAGTTTTAATCCTAGATGAACCTACCGTTGGAATTGAT 
CCATCCTTGAGGAGAAAAATCTGGCAAGAGCTAATTAATATTAAGGATGA 
AGGACGTTCTATCTTTATTACAACCCACGTTATGGATGAAGCAGAATTAA 
CAAGTAAGGTTGCACTACTATTACGTGGAAACATTATTGCCTTTGATACT 
CCATTACATTTAAAAAAACAATTTAATGTGAGTACTATTGAGGAAGTTTT 
CTTAAAAGCTGAAGGAGAA 

SEQ ID NO. 7612 
STRAIN 2603 frame: 1 

KKVIDLKKLQKAYASETVLNNINLEVFKGEIIGLIGPSGAGKSTLIKTMLGMEKADKGTA 
LVLDTQMPDRNILNQIGYMAQSDALYESLTGLENLLFFGKMKGIQKTELKQQITHISKVV 
DLENQLDKFVSGYSGGMKRRLSLAIALLGNPTVLILDEPTVGIDPSLRRKIWQELINIKD 
EGHSIFITTHVMDEAELTSKVALLLRGNIIAFDTPLHLKKQFNV 

SEQ ID NO. 7613 

STRAIN 090 frame: 3 

LKKLQKAYASETVLNNINLE VFKGE I IGLIGPSGAGKSTLIKTMLGMEKADKGT ALVLDT 
QMPDRNILNQIGYMAQSDALYESLTALENLLFFGKMKGIQKTELKQQITHISKWDLENQ 
LDKFVSGYSGGMKRRLSLAIALLGNPTVLILDEPTVGIDPSLRRKIWQELINIKDEGRSI 
FITTHVMDEAELTSKVALLLRGNIIAFDTPLHLKKQFNV 

' SEQ ID NO. 7614 

STRAIN A909 frame: 1 . " - 

■iGKVI DLKKLQKAYASETVLNNINLEVFKGEI IGLIGPSGAGKSTLIKTMLGMEKADKQTA 
LVLDTQMPDHNILNQIGYMAQSDAL¥ESLTGLENLLFFGKMKGIQKTELKQQITHISKVV 
. DLENQLDKFVSGYSGGMKRRLSLAIALLGNPTVLILDEPTVGIDPSLRRKIWQELINIKD 
EGRS I FITTHVMDEAELTSKVALLLRGNI I AFDTPLHLKKQFNV 

SEQ ID NO. 7615 

STRAIN H36B frame: 1 

KKVIDLKKLQKAYASETVLNNINLEVFKGEIIGLIGPSGAGKSTLIKTMLGMEKADKGTA 
LVLDTQMPDRNILNQIGYMAQSDALYESLTGLENLLFFGKMKGIQKTELKQQITHISKVV 
DLENQLDKFVSGYSGGMKRRLSLAIALLGNPTVLILDEPTVGIDPSLRRKIWQELINIKD 
EGRS I FITTHVMDEAELTSKVALLLRGNI I AFDTPLHLKKQFNV 

SEQ ID NO. 7616 

STRAIN 18RS21 frame: 1 

DLKKLQKAYASETVLNNINLEVFKGEIIGLIGPSGAGKSTLIKTMLGMEKADKGTALVLD 
TQMPDRNILNQIGYMAQSDALYESLTGLENLLFFGKMKGIQKTELKQQITHISKWDLEN 
QLDKFVSGYSGGMKRRLSLAIALLGNPTVLILDEPTVGIDPSLRRKIWQELINIKDEGHS 
I FITTHVMDEAELTSKVALLLRGNI I AFDTPLHLKKQFNV 

SEQ ID NO. 7617 

STRAIN M732 frame: 1 

KKVIDLKKLQKAYASETVLNNINLEVFKGEIIGLIGPSGAGKSTLIKTMLGMEKADKGTA 
LVLDTQMPDRNILNQIGYMAQSDALHESLTGLENLLFFGKMKGIQKTELKQQITHISKW 
DLENQLDKFVSGYSGGMKRRLSLAIALLGNPTVLILDEPTVGIDPSLRRKIWQELINIKD 
EGRS I FITTHVMDEAELTSKVALLLRGNI I AFDTPLHLKKQFNV 

SEQ ID NO. 7618 

STRAIN COH1 frame: 1 

KKVIDLKKLQKAYASETVLNNINLEVFKGEIIGLIGPSGAGKSTLIKTMLGMEKADKGTA 
LVLDTQMPDRNILNQIGYMAQSDALHESLTGLENLLFFGKMKGIQKTELKQQITHISKW 
DLENQLDKFVSGYSGGMKRRLSLAIALLGNPTVLILDEPTVGIDPSLRRKIWQELINIKD 
EGRS I FITTHVMDEAELTSECVALLLRGN 1 1 AFDTPLHLKKQFNV * 

SEQ ID NO. 7619 

STRAIN M781 frame: 1 

KKVIDLKKLQKAYASETVLNNINLEVFKGEIIGLIGPSGAGKSTLIKTMLGMEKADKGTA 
LVLDTQMPDRNILNQIGYMAQSDALHESLTGLENLLFFGKMKGIQKTELKQQITHISKW 
DLENQLDKFVSGYSGGMKRRLSLAIALLGNPTVLILDEPTVGIDPSLRRKIWQELINIKD 
EGRS I FITTHVMDEAELTSKVALLLRGNI I AFDTPLHLKKQFNV 
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SEQ ID NO. 7620 

STRAIN CJB110 frame: 1 

KKVIDLKKLQKAYASETVLNNINLEVFKGEIIGLIGPSGAGKSTLIKTMLGMEKADKGTA 
LVLDTQMPDRNILNQIGYMAQSDALYESLTALENLLFFGKMKGIQKTELKQQITHISKVV 
DLENQLDKFVSGYSGGMKRRLSLAIALLGNPTVLILDEPTVGIDPSLRRKIWQELINIKD 
EGRSIFITTHVMDEAELTSKVALLLRGNIIAFDTPLHLKKQFNV 

SEQ ID NO. 7621 

STRAIN 1169NT frame: 1 

KKVIDLBCKLQKAYASETVXiNNINLEVFKGEIIGLIGPSGAGKSTLIKTMLGMEKADKGTA 
LVLDTQMPDRNILNQIGYMAQSDALYESLTALENLLFFGKMKGIQKTELKQQITHISKW 
DLENQLDKFVSGYSGGMKRRLSLAIALLGNPTVLILDEPTVGIDPSLRRKIWQELINIKD 
EGRSIFITTHVMDEAELTSKVALLLRGNIIAFDTPLHLKKQFNV 

SEQ ID NO. 7622 

STRAIN JM9130013 frame: 1 

KKVIDLKKLQKAYASETVLNNINLEVFKGEIIG^iIGPSGAGKSTLIKTMLGMEKADKGTA 
LVLDTQMPDRNILNQIGYMAQSDALYESLTGLENLLFFGKMKGIQKTELKQQITHISKW 
DLENQLDKFVSGYSGGMKRRLSLAIALLGNPTVLILDEPTVGIDPSLRRKIWQELINIKD 
EGRSIFITTHVMDEAELTSKVALLLRGNIIAFDTPLHLKKQFNV 

*SEQ ID NO. 7701 
STRAIN 2603 

TTGCCTATGTTGTCTGTTG(3TTTAGTTTTAGAGGGTGGCGGAATGAGAGGTCTTTATACT 
GCTGGAGTTTTAGATGCTTTTCTAGATGCAGGAATAAAAATAGATGGTATCGTATCTGTC 
TCTGCTGGTGCATTGTfTGGTGTTAATl'TTGTATCTAGACAACGAGAGAGGGCTTTGCGA 
TACAATAAAAAGTATTTATCCCACCCTAAATATATGAGTCTAAGGTCATGGTTTCGAACA 
GGGAATTTTGTTAATAAAGATTTCACCTATTATGAAGTTCCTATGAAATTGGATGTATTT 
GACGATGAAGCATTTAAAAAATCAAGTATTGATTTTTACGTAGTTGCTACAGAGATGACA 
TCTGGTAAACCTGAATATTTTAAAATTGATAGTGTTTTTGAACAAATGGAAATTTTACGT 
GCTAGTTCAGCATTACCAGTAGTCTCAAAGATGGTTGATTGGCAGGGGAAAAAGTACTTA 
GATGGTGGTTTATCTGATAGTATTCCCGTTGATTTTGCCCGTGGTTTAGGATTTGACAAG 
TTGATTGTTGTGATGACTAGGCCGCTCAATTATCAGAAAAAGCCTTCAAGTGGACGATTG 
TATAAAACTCTGTATAGGAAATATCCTAATTTTGTAAAGACAGCCTCGAATCGGTACCAA 
CAGTATAATAATAGTCTTGAAAAGGTCATGAGCCTTGAAAAAACAGGCGATCTATTTGCA 
ATTAGACCGAGTAAGAGCTTGGTTATTGGCCGCTTAGAGAAGAATCCGGATAAACTTGAT 
AGTATTTATCAGCTTGGTATGAAAGATGCTAAAAGTGTGATGCCTGAGCTGAATAGTTAT 
CTAATGAAA 

SEQ ID NO. 7702 
STRAIN 090 

CCTATGTTGTCTGTTGGTTTAGTTTTAG 

AGGGTGGCGGAATGAGAGGTCTTTATACTGCTGGAGTTTTAGATGCTTTT 
CTAGATGCAGGAATAAAAATAGATGGTATCGTATCTGTCTCTGCTGGTGC 
ATTGTTTGGTGTTAATTTTGTATCTAGACAACGAGAGAGGGCTTTGCGAT 
ACAATAAAAAGTATTTATCCCACCCTAAATATATGAGTCTAAGGTCATGG 
TTTCGAACAGGGAATTTTGTTAATAAAGATTTCACCTATTATGAAGTTCC 
TATGAAATTGGATGTATTTGACGATGAAGCATTTAAAAAATCAAGTATTG 
ATTTTTACGTAGTTGCTACAGAGATGACATCTGGTAAACCTGAATATTTT 
AAAATTGATAGTGTTTTTGAACAAATGGAAATTTTACGTGCTAGTTCAGC 
ATTACCAGTAGTCTCAAAGATGGTTGATTGGCAGGGGAAAAAGTACTTAG 
ATGGTGGTTTATCTGATAGTATTCCCGTTGATTTTGCCCGTGGTTTAGGA 
TTTGACAAGTTGATTGTTGTGATGACTAGGCCGCTCAATTATCAGAAAAA 
GCCTTCAAGTGGACGATTGTATAAAACTCTGTATAGGAAATATCCTAATT 
TTGTAAAGACAGCCTCGAATCGGTACCAACAGTATAATAATAGTCTTGAA 
AAGGTCATGAGCCTTGAAAAAACAGGCGATCTATTTGCAATTAGACCGAG 
TAAGAGCTTGGTTATTGGCCGCTTAGAGAAGAATCCGGATAAACTTGATA 
GTATTTATCAGCTTGGTATGAAAGATGCTAAAAGTGTGATGCCTGAGCTG 
AATAGTTATCTAATGAAA 

1 

SEQ ID NO. 7703 
STRAIN A909 

CCTATGTTGTCTGTTGGTTTAGTTTTAGAG 

GGTGGCGGAATGAGAGGTCTTTATACTGCTGGAGTTTTAGATGCTTTTCT 
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AGATGCAGGAATAAAAGTAGATGGTATCATATCTGTCTCTGCTGGTGCAT 
TGTTTGGTGTTAATTTTGTATCTAGACAACGAGAGAGGGCTTTGCGATAC 
AATAAAAAGTATTTATCCCACCCTAAATATATGAGTCTAAGGTCATGGCT 
TCGAACAGGGAATTTTGTTAATAAAGATTTCACCTATTATGAAGTTCCTA 
TGAAATTGGATGTATTTGACGATGAAGCATTTAAAAAATCAAGTATTGAT 
TTTTACGCAGTTGCTACAGAGATGACATCTGGTAAACCTGAGTATTTTAA 
AATTGATAGTGTTTTTGAACAAATGGAAATTTTACGTGCTAGTTCAGCAT 
TACCAGTAGTCTCAAAGATGGTTGTTTGGCAGGGGAAAAAGTACTTAGAT 
GGTGGTTTATCTGATAGTATTCCCGTTGATTTTGCCCGTGGTTTAGGATT 
TGACAAGTTGATTGTTGTGATGACTAGGCCGCTCAATTATCAGAAAAAGC 
CTTCAAGTGGACGATTGTATAAAACTCTGTATAGGAAATATCCTAATTTT 
GTAAAGACAGCCTCGAACCGGTACCAACAGTATAATAATAGCCTTGAAAA 
GGTCATGAGCCTTGAAAAAACAGGCGATCTATTTGCAATTAGACCAAGTA 
AGAGCTTGGTTATTGGCCGCTTAGAGAAGAATCCGGATAAACTTGATAGT 
ATTTATCAGCTTGGTATGAAAGATGCTAAAAGTGGGATGCCTGAGCTGAA 
TAGTTATCTAATGAAA 

SEQ ID NO. 7704 

STRAIN H36B 

CCTATGTTGTCTGTTGGTTTAGTTTTAG 

AGGGTGGCGGAATGAGAGGTC^TTTATACTGCTGGAGTTTTAGATGCTTTT 
CTAGATGCAGGAATAAAAGTAGATGGTATCATATCTGTCTCTGCTGGTGC 
ATTGTTTGGTGTTAATTTTGTATCTAGACAACGAGAGAGGGCTTTGCGAT 
ACAATAAAAAGTATTTATCCCACCCTAAATATATGAGTCTAAGGTCATGG 
CTTCGAACAGGGAATTTTGTTAATAAAGATTTCACCTATTATGAAGTTCC 
TATGAAATTGGATGTATTTGACGATGAAGCATTTAAAAAATCAAGTATTG 
ATTTTTACGCAGTTGCTACAGAGATGACATCTGGTAAACCTGAGTATTTT 
AAAATTGATAGTGTTTTTGAACAAATGGAAATTTTACGTGCTAGTTCAGC 
ATTACCAGTAGTCTCAAAGATGGTTGTTTGGCAGGGGAAAAAGTACTTAG 
ATGGTGGTTTATCTGATAGTATTCCCGTTGATTTTGCCCGTGGTTTAGGA 
TTTGACAAGTTGATTGTTGTGATGACTAGGCCGCTCAATTATCAGAAAAA 
GCCTTCAAGTGGACGATTGTATAAAACTCTGTATAGGAAATATCCTAATT 
TTGTAAAGACAGCCTCGAACCGGTACCAACAGTATAATAATAGCCTTGAA 
AAGGTCATGAGCCTTGAAAAAACAGGCGATCTATTTGCAATTAGACCAAG 
TAAGAGCTTGGTTATTGGCCGCTTAGAGAAGAATCCGGATAAACTTGATA 
GTATTTATCAGCTTGGTATGAAAGATGCTAAAAGTGGGATGCCTGAGCTG 
AATAGTTATCTAATGAAA 

SEQ ID NO. 7705 

STRAIN 18RS21 

CCTATGTTGTCTGTTGGTTTAGTTTTAGAGG 

GTGGCGGAATGAGAGGTCTTTATACTGCTGGAGTTTTAGATGCTTTTCTA 
GATGCAGGAATAAAAATAGATGGTATCGTATCTGTCTCTGCTGGTGCATT 
GTTTGGTGTTAATTTTGTATCTAGACAACGAGAGAGGGCTTTGCGATACA 
ATAAAAAGTATTTATCCCACCCTAAATATATGAGTCTAAGGTCATGGTTT 
CGAACAGGGAATTTTGTTAATAAAGATTTCACCTATTATGAAGTTCCTAT 
GAAATTGGATGTATTTGACGATGAAGCATTTAAAAAATCAAGTATTGATT 
TTTACGTAGTTGCTACAGAGATGACATCTGGTAAACCTGAATATTTTAAA 
ATTGATAGTGTTTTTGAACAAATGGAAATTTTACGTGCTAGTTCAGCATT 
ACCAGTAGTCTCAAAGATGGTTGATTGGCAGGGGAAAAAGTACTTAGATG 
GTGGTTTATCTGATAGTATTCCCGTTGATTTTGCCCGTGGTTTAGGATTT 
GACAAGTTGATTGTTGTGATGACTAGGCCGCTCAATTATCAGAAAAAGCC 
TTCAAGTGGACGATTGTATAAAACTCTGTATAGGAAATATCCTAATTTTG 
TAAAGACAGCCTCGAATCGGTACCAACAGTATAATAATAGTCTTGAAAAG 
GTCATGAGCCTTGAAAAAACAGGCGATCTATTTGCAATTAGACCGAGTAA 
GAGCTTGGTTATTGGCCGCTTAGAGAAGAATCCGGATAAACTTGATAGTA 
TTTATCAGCTTGGTATGAAAGATGCTAAAAGTGTGATGCCTGAGCTGAAT 
AGTTATCTAATGAAA 

SEQ ID NO. 7706 

STRAIN M732 

CCTATGTTGTCTGTTGGTTTAGTTTTAGA 

GGGTGGCGGAATGAGAGGTCTTTATACTGCTGGAGTTTTAGATGCTTTTC 
TAGATGCAGGAATAAAAATAGATGGTATCGTATCTGTCTCTGCGGGTGCA 
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TTGTTTGGTGTTAATTTTGTATCTAGACAACGAGAGAGGGCTTTGCGATA 
CAATAAAAAGTATTTATCCCACCCTGAATATATGAGTCTAAGATCATGGC 
TTCGAACAGGGAATTTTGTTAATAAAGATTTCACCTATTATGAAGTTCCT 
ATGAAATTGGATGTATTTGACGATGAAGCATTTAAAAAATCAAGTATTGA 
TTTTTACGTAGTTGCTACAGAGATGACATCTGGTAAACCTGAATATTTTA 
AAATTGATAGTGTTTTTGAACAAATGGAAATTTTACGTGCTAGTTCAGCA 
TTACCAGTAGTCTCAAAGATGGTTGATTGGCAGGGGAAAAAGTACTTAGA 
TGGTGGTTTATCTGATAGTATTCCCGTTGATTTTGCCCGTGGTTTAGGAT 
TTGACAAGTTGATTGTTGTGATGACTAGGCCGCTCAATTATCAGAAAAAG 
CCTTCAAGTGGACGATTGTATAAAACTCTGTATAGGAAATATCCTAATTT 
TGTAAAGACAGCCTCGAATCGGTACCAACAGTATAATAATAGTCTTGAAA 
AGGTCATGAGCCTTGAAAAAACAGGCGATCTATTTGCAATTAGACCGAGT 
AAGAGCTTGGTTATTGGCCGCTTAGAGAAGAATCCGGATAAACTTGATAG 
TATTTATCAGCTTGGTATGAAATATGCTAAAAGTGTGATGCCTGAGCTGA 
ATAGTTATCTAATGAAA 

SEQ ID MO. 7707 

STRAIN COH1 

CCTATGTTGTCTGTTGGTTTAGTTTTA 

GAGGGTGGCGGAATGAGAGC5TCTTTATACTGCTGGAGTTTTAGATGCTTT 

TCTAGATGCAGGAATAAAAATAGATGGTATCGTATCTGTCTCTGCGGGTG 

CATTGTTTGGTGTTAATTTTGTATCTAGACAACGAGAGAGGGCTTTGCC^ 

TACAATAAAAAGTATTTATCCCACCCTGAATATATGAGTCTAAGATCATG 

GCTTCGAACAGGGAATTTTGTTAATAAAGATTTCACCTATTATGAAGTTC 

CTATGAAATTGGATGTATTTGACGATGAAGCATTTAAAAAATCAAGTATT 

GATTTTTACGTAGTTGCTACAGAGATGACATCTGGTAAACCTGAATATTT 

TAAAATTGATAGTGTTTTTGAACAAATGGAAATTTTACGTGCTAGTTCAG ' 

CATTACCAGTAGTCTCAAAGATGGTTGATTGGCAGGGGAAAAAGTACTTA 

GATGGTGGTTTATCTGATAGTATTCCCGTTGATTTTGCCCGTGGTTTAGG 

ATTTGACAAGTTGATTGTTGTGATGACTAGGCCGCTCAATTATCAGAAAA 

AGCCTTCAAGTGGACGATTGTATAAAACTCTGTATAGGAAATATCCTAAT 

TTTGTAAAGACAGCCTCGAATCGGTACCAACAGTATAATAATAGTCTTGA 

AAAGGTCATGAGCCTTGAAAAAACAGGCGATCTATTTGCAATTAGACCGA 

GTAAGAGCTTGGTTATTGGCCGCTTAGAGAAGAATCCGGATAAACTTGAT 

AGTATTTATCAGCTTGGTATGAAATATGCTAAAAGTGTGATGCCTGAGCT 

GAATAGTTATCTAATGAAA 

SEQ ID NO. 7708 

STRAIN M781 

CCTATGTTGTCTGTTGGTTTAGTTTTAG 

AGGGTGGCGGAATGAGAGGTCTTTATACTGCTGGAGTTTTAGATGCTTTT 
CTAGATGCAGGAATAAAAATAGATGGTATCGTATCTGTCTCTGCGGGTGC 
ATTGTTTGGTGTTAATTTTGTATCTAGACAACGAGAGAGGGCTTTGCGAT 
ACAATAAAAAGTATTTATCCCACCCTGAATATATGAGTCTAAGATCATGG 
CTTCGAACAGGGAATTTTGTTAATAAAGATTTCACCTATTATGAAGTTCC 
TATGAAATTGGATGTATTTGACGATGAAGCATTTAAAAAATCAAGTATTG 
ATTTTTACGTAGTTGCTACAGAGATGACATCTGGTAAACCTGAATATTTT 
AAAATTGATAGTGTTTTTGAACAAATGGAAATTTTACGTGCTAGTTCAGC 
ATTACCAGTAGTCTCAAAGATGGTTGATTGGCAGGGGAAAAAGTACTTAG 
ATGGTGGTTTATCTGATAGTATTCCCGTTGATTTTGCCCGTGGTTTAGGA 
TTTGACAAGTTGATTGTTGTGATGACTAGGCCGCTCAATTATCAGAAAAA 
GCCTTCAAGTGGACGATTGTATAAAACTCTGTATAGGAAATATCCTAATT 
TTGTAAAGACAGCCTCGAATCGGTACCAACAGTATAATAATAGTCTTGAA 
AAGGTCATGAGCCTTGAAAAAACAGGCGATCTATTTGCAATTAGACCGAG 
TAAGAGCTTGGTTATTGGCCGCTTAGAGAAGAATCCGGATAAACTTGATA 
GTATTTATCAGCTTGGTATGAAATATGCTAAAAGTGTGATGCCTGAGCTG 
AATAGTTATCTAATGAAA 

SEQ ID NO. 7709 

STRAIN CJB110 

CCTATGTTGTCTGTTGGTTTAGTTTTA 

GAGGGTGGCGGAATGAGAGGTCTTTATACTGCTGGAGTTTTAGATGCTTT 
TCTAGATGCAGGAATAAAAATAGATGGTATCGTATCTGTCTCTGCTGGTG 
CATTGTTTGGTGTTAATTTTGTATCTAGACAACGAGAGAGGGCTTTGCGA 
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TACAATAAAAAGTATTTATCCCACCCTAAATATATGAGTCTAAGGTCATG 
GTTTCGAACAGGGAATTTTGTTAATAAAGATTTCACCTATTATGAAGTTC 
CTATGAAATTGGATGTATTTGACGATGAAGCATTTAAAAAATCAAGTATT 
GATTTTTACGTAGTTGCTACAGAGATGACATCTGGTAAACCTGAATATTT 
TAAAATTGATAGTGTTTTTGAACAAATGGAAATTTTACGTGCTAGTTCAG 
CATTACCAGTAGTCTCAAAGATGGTTGATTGGCAGGGGAAAAAGTACTTA 
GATGGTGGTTTATCTGATAGTATTCCCGTTGATTTTGCCCGTGGTTTAGG 
ATTTGACAAGTTGATTGTTGTGATGACTAGGCCGCTCAATTATCAGAAAA 
AGCCTTCAAGTGGACGATTGTATAAAACTCTGTATAGGAAATATCCTAAT 
TTTGTAAAGACAGCCTCGAATGGGTACCAACAGTATAATAATAGTCTTGA 
AAAGGTCATGAGCCTTGAAAAAACAGGCGATCTATTTGCAATTAGACCGA 
GTAAGAGCTTGGTTATTGGCCGCTTAGAGAAGAATCCGGATAAACTTGAT 
AGTATTTATCAGCTTGGTATGAAAGATGCTAAAAGTGTGATGCCTGAGCT 
GAATAGTTATCTAATGAAA 

SEQ ID NO. 7710 

STRAIN 1169NT 

CCTATGTTGTCTGTTGGTTTAGTTTTAGAGGGTG 

GCGGAATGAGAGGTCTTTATACTGCTGQAGTTTTAGATGCTTTTCTAGAT 
GCAGGAATAAAAATAGATGGTATCGTATCTGTCTCTGCGGGTGCATTGTT 
TGGTGTTAATTTTGTATCTAGACAACGAGAGAGGGCTTTGCGATACAATA 
AAAAGTATTTATCCCACCCTAAATATATGAGTCTAAGATCATGGCTTCGA 
ACAGGGAATTTTGTTAATAAAGATTTCACCTATTATGAAGTTCCTATGAA 
ATTGGATGTATTTGACGATGAAGCATTTAAAAAATCAAGTATTGATTTTT 
ACGCAGTTGCTACAGAGATGACATCTGGTAAACCTGAATATTTTAAAATT 
GATAGTGTCTTTGAACAAATGGAAATTTTACGTGCTAGTTCAGCATTACC 
AGTAGTCTCAAAGATGGTTGATTGGCAGGGGAAAAAGTACTTAGATGGTG 
GTTTATCTGATAGTATCCCCGTTGATTTTGCCCGTGGTTTAGGATTTGAC 
AAGTTGATTGTTGTGATGACTAGGCCGCTCAATTATCAGAAAAAGCCTTC 
AAGTGGACGATTGTATAAAACTCTGTATAGGAAATATCCTAATTTTGTAA 
AGACAGCCTCGAATCGGTACCAACAGTATAATAATAGCCTTGAAAAGGTC 
ATGAGCCTTGAAAAAACAGGCGATCTATTTGCAATTAGGCCGAGTAAAAG 
CTTGGTTATTGTCCGCTTAGAGAAGAATCCGGATAAACTTGATAGTATTT 
ATCAGCTTGGTATGAAAGATGCTAAAAGTGTGATGCCTGAGCTGAATAGT 
TATCTAATGAAA 

SEQ ID NO. 7711 

STRAIN JM9130013 
CCTATGTTGTCTGTTGGTTTAGTTTTAGAG 

GGTGGCGGAATGAGAGGTCTTTATACTGCTGGAGTTTTAGATGCTTTTCT 
AGATGCAGGAATAAAAGTAGATGGTATCATATCTGTCTCTGCTGGTGCAT 
TGTTTGGTGTTAATTTTGTATCTAGACAACGAGAGAGGGCTTTGCGATAC 
AATAAAAAGTATTTATCCCACCCTAAATATATGAGTCTAAGGTCATGGCT 
TCGAACAGGGAATTTTGTTAATAAAGATTTCACCTATTATGAAGTTCCTA 
TGAAATTGGATGTATTTGACGATGAAGCATTTAAAAAATCAAGTATTGAT 
TTTTACGCAGTTGCTACAGAGATGACATCTGGTAAACCTGAGTATTTTAA 
AATTGATAGTGTTTTTGAACAAATGGAAATTTTACGTGCTAGTTCAGCAT 
T ACCAGTAGT CT CAAAGATGGTTGTTTGGCAGGGGAAAAAGT ACTTAGAT 
GGTGGTTTATCTGATAGTATTCCCGTTGATTTTGCCCGTGGTTTAGGATT 
TGACAAGTTGATTGTTGTGATGACTAGGCCGCTCAATTATCAGAAAAAGC 
CTTCAAGTGGACGATTGTATAAAACTCTGTATAGGAAATATCCTAATTTT 
GTAAAGACAGCCTCGAACCGGTACCAACAGTATAATAATAGCCTTGAAAA 
GGTCATGAGCCTTGAAAAAACAGGCGATCTATTTGCAATTAGACCAAGTA 
AGAGCTTGGTTATTGGCCGCTTAGAGAAGAATCCGGATAAACTTGATAGT 
ATTTATCAGCTTGGTATGAAAGATGCTAAAAGTGGGATGCCTGAGCTGAA 
TAGTTATCTAATGAAA 

SEQ ID NO. 7712 
STRAIN 2603 frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFLDAGIKIDGIVSVSAGALFGVNFVSRQRERALRY 
NKKYLSHPBCYMSLRSWETITGNEWKDFTYYEVPMKLDVFDDEAFKKSSIDFYVVATEMTS 
GKPEYFKIDSVFEQMEILRASSALPWSKMVDWQGKKYLDGGLSDSIPVDFARGLGFDKL 
IVVMTRPLNYQKKPSSGRLYKTLYRKYPNEVKTASNRYQQYNNSLEKVMSLEKTGDLFAI 
RPSKSLVIGRLEKNPDKLDSIYQLGMKDAKSVMPELNSYLMK 
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SEQ ID NO. 7713 

STRAIN 090 frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFLDAGIKIDGIVSVSAGALFGVNFVSRQRERALRY 
NKKYLSHPKYMSLRSWE^TGNFTOKDFTYYEVPMKLDVFDDEAFICKSSIDFYWATEMTS 
GKPEYFKIDSVFEQMEILRASSALPWSKMVDWQGKKYLDGGLSDSIPVDFARGLGFDKL 
IVVMTRPLNYQKKPSSGRLYKTLYRKYPNFVKTASNRYQQYNNSLEKVMSLEKTGDLFAI 
RPSKSLVIGRLEBCNPDKLDSIYQLGMKDAKSVMPELNSYLMK 

SEQ ID NO. 7714 

STRAIN A909 frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFLDAGIKVDGIISVSAGALFGVNFVSRQRERALRY 
NKKYLSHPKYMSLRSWLRTGNFVNKDFTYYEVPMKLDVFDDEAFKKSSIDFYAVATEMTS 
GKPEYFKI DSVFEQME I LRAS S ALP WSKMWWQGKKYL DGGLSDS I PVDFARGLGFDKL 
IVVMTRPLNYQKKPSSGRLYKTLYRKYPNFVKTASNRYQQYNNSLEKVMSLEKTGDLFAI 
RPSKSLVIGRLEKNPDKLDSIYQLGMKDAKSGMPELNSYLMK 

» 

SEQ ID NO. 7715 

STRAIN H36B frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFLI5AGIKVDGIISVSAGALFGVNFVSRQRERALRY 
NKKYLSHPKYMSLRS WLRTGN FVNKDFT Y YEVPMKLDVFDDEAFKKS S I D FYAVATEMT S 
GKPEYFKI DSVFEQME I LRAS SALPVVSKMVVWQGKKYLDGGLSDS I PVDFARGLGFDKL 
IVVMTRPLNYQKKPSSGRLYKTLYRKYPNFVKTASNRYQQYNNSLEKVMSLEKTGDLFAI 
RPSKSLVIGRLEKNPDKLDSIYQLGMKDAKSGMPELNSYLMK . 

SEQ ID NO. 7716 

STRAIN 18RS21 frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFLDAGIKIDGIVSVSAGALFGVNFVSRQRERALRY 
NKKYLSHPKYMSLRSWFRTGNFVNKDFTYYEVPMKLDVFDDEAFKKSSIDFYVVATEMTS 
GKPEYFKI DSVFEQME I LRAS SALPWSKMVDWQGKKYLDGGLSDS I PVDFARGLGFDKL 
I WMTRPLNYQKKPS S GRLYKT LYRKYPN FVKTASNRYQQYNN S LEKVMS LEKTGDL FAI 
RPSKSLVIGRLEKNPDKLDSIYQLGMKDAKSVMPELNSYLMK 

SEQ ID NO. 7717 

STRAIN M732 frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFLDAGIKIDGIVSVSAGALFGVNFVSRQRERALRY 
NKKYLSHPEYMSLRSWLRTGN FVNKDFT YYEVPMKLDVFDDEAFKKSSIDFYWATEMTS 
GKPEYFKI DSVFEQME I LRAS SALPWSKMVDWQGKKYLDGGLSDSI PVDFARGLGFDKL 
IVVMTRPLNYQKKPSSGRLYTCTLYRKYPNFVKTASNRYQQYNNS LEKVMS LEKTGDLFAI 
RPSKSLVIGRLEKNPDKLDSIYQLGMKYAKSVMPELNSYLMK 

SEQ ID NO. 7718 

STRAIN COH1 frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFLDAGIKIDGIVSVSAGALFGVNFVSRQRERALRY 
NKKYLSHPEYMSLRS WLRTGN FVNKDFT YYEVPMKLDVFDDEAFKKSS I DFYVVATEMTS 
GKPEYFKI DSVE^IQMEILRAS S ALP WSKMVDWQGKKYL DGGLS DS I PVDFARGLGFDKL 
IVVMTRPLNYQKKPSSGRLYKTLYRKYPNFVKTASNRYQQYNNS LEKVMS LEKTGDLFAI 
RPSKSLVIGRLEKNPDKLDSIYQLGMKYAKSVMPELNSYLMK 

SEQ ID NO. 7719 

STRAIN M781 frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFLDAGIKIDGIVSVSAGALFGVNFVSRQRERALRY 
NKKYLSHPE YMS LRS WLRTGNFVNKD FT YYEVPMKLDVFDDEAFKKS SID FYWATEMT S 
GKPEYFKI DSVFEQMEI LRAS SALPWSKMVDWQGKKYLDGGLSDSI PVDFARGLGFDKL 
IWMTRPLNYQKKPSSGRLYKTLYRKYPNFVKTASNRYQQYNNS LEKVMS LEKTGDL FAI 
RPSKSLVIGRLEKNPDKLDSIYQLGMKYAKSVMPELNSYLMK 

SEQ ID NO. 7720 

STRAIN CJB110 frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFLDAGIKIDGIVSVSAGALFGVN FVSRQRERALRY 
NKKYLSHPKYMSLRSWFRTGNFVNKDFTYYEVPMKLDVFDDEAFECKSSIDFYVVATEMTS 
GK PE Y FKI DSVFEQME I LRAS SALPWSKMVDWQGKKYL DGGLS DS I PVDFARGLGFDKL 
I WMTRPLNYQKKPS S GRLYKT LYRKYPN FVKTASNR YQQYNNS LEKVMS LEKTGDLFAI 
RPSKS LVIGRLEKN PDKLDS I YQLGMKDAKS VMPELN S YLMK 
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SEQ ID NO. 7721 

STRAIN JM9130013 frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFLDAGIKVDGIISVSAGALFGVNEVSRQREEUUjRY 
NKKYLSHPKYMSLRSWLRTGNFVNKDFTYYEVPMKLDVFDDEAFKKSSIDFYAVATEMTS 
GKPEYFKIDSVFEQMEILRASSALPWSKMWWQGKKYLDGGLSDSIPVDFARGLGFDKL 
IVVMTRPLNYQKKPSSGRLYKTLYRKYPNFVKTASNRYQQYNNSLEBCVMSLEKTGDLFAI 
RPSKSLVIGRLEKNPDKLDSIYQLGMKDAKSGMPELNSYLMK 

SEQ ID NO. 7722 

STRAIN 1169NT frame: 1 

PMLS VGLVLEGGGMRGL YTAGVLDAFLDAG IKI DG IV SVSAGALFGVN FVSRQRERALRY 
NKKYLSHPKYMSLRSWLRTGNFVNKDFTYYEVPMKLDVFDDEAFKKSSIDFYAVATEMTS 
GKPEYFKIDSVFEQMEILRASSALPWSKMVDWQGKKYLDGGLSDSIPVDFARGLGFDKL 
IWMTRPLNYQKKPSSGRLYKTLYRKYPNFVKTASNRYQQYNNSLEKVMSLEKTGDLFAI 
RPSKSLVIVRLEKNPDKLDSIYQLGMKDAKSVMPELNSYLMK 

SEQ ID NO. 7801 
STRAIN 2603 

ATGAAAGTTTTAGTAGTTGATGATGAACCAGTTGCACGTAACGAATTAATTTACCTTCTT 
AATAAGTATGATTCTAACCTCGTTATAGCAGAGGCGCATGATATGGCTACTGCATTAGCT 
ATTTTACTTAGAGAAACTTTTGATGTAGCACTGTTAGATATCCATCTCAGAGATGATTCT 
GGGTTGCAATTAGCAGAGTATATCAATAAAATGCCCAAACCACCATTATTGATATTTGCG 
ACTGCTTATGATCAATATGCTATTCAGGCTTTTGAGCATGATGCGCGTGATTATTTG^A 
AAACCCTATGATTTTGATAGGCTAAAGCAAGCTATGGATAGAGTAAAAGGAGCGCTAAGT 
ACATCTACAATTATAGAGAGCGTAACTTCCGGTCCTCTCTTCAAGCAACAGTATCCATTG 
ACAGTAGAAGATCGAATCTATCTGGTGTCGGCGGATGATATCCTTTTGATTGAAGCTATG 
CAAGGAAAACTGATTATACAAACACCTGATAAAAATTATGAAATTGATGGCTCTCTACAA 
CAATGGCAAGATAAACTACCATCATCTCAATTTGTACGGGTACATCGCTCTTACATTGTG 
AACATTAATGCTATTAAAACGATTGAACCTTGGTTTAACCAAACACTTCAGTTACACCTT 
TGTAATAAAATAACAGTTCCTGTTAGCAGAGCAAATGTAAAACCCCTAAAACAAATGTTA 
GGCATATCTACC 

SEQ ID NO. 7802 

STRAIN 090 

AAAGTTTTAGTAGTTGATGATGAACCAGTTGCACGTAA 

CGAATTAATTTACCTTCTTAATAAGTATGATTCTAACCTCGTTATAGCAG 

AGGCGCATGATATGGCTACTGCATTAGCTATTTTACTTAGAGAAACTTTT 

GATGTAGCACTGTTAGATATCCATCTCAGAGATGATTCTGGGTTGCAATT 

AGCAGAGTATATCAATAAAATGCCCAAACCACCATTATTGATATTTGCGA 

CTGCTTATGATCAATATGCTATT CAGGCTTT TGAGCATGATGCGCGTGAT 

TATTTGTTAAAACCCTATGATTTTGATAGGCTAAAGCAAGCTATGGATAG 

AGTAAAAGGAGCGCTAAGTACAT CTACAATTATAGAGAGCGT AACTTCCG . 

GTCCTCTCTTCAAGCAACAGTATCCATTGACAGTAGAAGATCGAATCTAT 

CTGGTGTCGGCGGATGATATCCTTTTGATTGAAGCTATGCAAGGAAAACT 

GATTATACAAACACCTGATAAAAATTATGAAATTGATGGCTCTCTACAAC 

AATGGCAAGATAAACTACCATCATCTCAATTTGTACGGGTACATCGCTCT 

TACATTGTGAACATTAATGCTATTAAAACGATTGAACCTTGGTTTAACCA 

AACACTTCAGTTACACCTTTGTAATAAAATAACAGTTCCTGTTAGCAGAG 

CAAATGTAAAACCCCTAAAACAAATGTTAGGCATATCTACC 

SEQ ID NO. 7803 

STRAIN A909 

AAAGTTTTAGTAGTTGATGATGAACCAGTTGCACGTAAC 

GAATTAATTTACCTTCTTAATAAGTATGATTCTAACCTCGTTATAGCAGA 

GGCGCATGATATGGCTACTGCATTAGCTATTTTACTTAGAGAAACTTTTG 

ATGTAGCACTGTTAGATATCCATCTCAGAGATGATTCTGGGTTGCAATTA 

GCAGAGTATATCAATAAAATGCCCAAACCACCATTATTGATATTCGCGAC 

TGCTTATGATCAATATGCTATTCAAGCTTTTGAGCATGATGCGCGTGATT 

ATTTGTTAAAACCCTATGAGTTTGATAGGCTAAAGCAAGCTATGGATAGA 

GTAAAAGGAGCGCTAAGTACATCTACAATTATAGAGAGCGTAACTTCCGG 

CCCTCTCTTCAAGCAACAGTATCCATTGACAGTAGAAGATCGAATCTATC 

TGGTGTCGGCGGATGATATCCTTTTGATTGAAGCTATGCAAGGAAAACTG 

ATTATACAAACACCTGATAAAAATTATGAAATTGATGGCTCTCTACAACA 
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ATGGCAAGATAAACTACCATCATCTCAATTTGTACGGGTGCACCGCTCTT 
ACATTGTGAATATTAATGCTATTAAAACGATTGAACCTTGGTTTAACCAA 
ACACTTCAGTTACACCTTTGTAATAAAATAACAGTTCCTGTTAGCAGAGC 
AAATGTAAAACCCCTAAAACAAATGTTAGGCATATCTACC 

SEQ ID NO. 7804 

STRAIN H36B 

AAAGTTTTAGTAGTTGATGATGAACCAGTTGCACGT 

AACGAATTAATTTACCTTCTTAATAAGTATGATTCTAACCTCGTTATAGC 

AGAGGCGCATGATATGGCTACTGCATTAGCTATTTTACTTAGAGAAACTT 

TTGATGTAGCACTGTTAGATATCCATCTCAGAGATGATTCTGGGTTGCAA 

TTAGCAGAGTATATCAATAAAATGCCCAAACCACCATTATTGATATTCGC 

GACTGCTTATGATCAATATGCTATTCAAGCTTTTGAGCATGATGCGCGTG 

ATTATTTGTTAAAACCCTATGAGTTTGATAGGCTAAAGCAAGCTATGGAT 

AGAGTAAAAGGAGCGCTAAGTACATCTACAATTATAGAGAGCGTAACTTC . 

CGGCCCTCTCTTCAAGCAACAGTATCCATTGACAGTAGAAGATCGAATCT 

ATCTGGTGTCGGCGGATGATATCCTTTTGATTGAAGCTATGCAAGG$AAA 

CTGATTATACAAACACCTGATAAAAATTATGAAATTGATGGCTCTCTACA 

ACAATGGCAAGATAAACTACCATCATCTCAATTTGTACGGGTGCACCGCT 

CTTACATTGTGAATATTAATGCTATTAAAACGATTGAACCTTGGTTTAAC 

CAAACACTTCAGTTACACCTTTGTAATAAAATAACAGTTCCTGTTAGCAG 

AGCAAATGTAAAACCCQTAAAACAAATGTTAGGCATATCTACC 

SEQ ID NO. 7805 

STRAIN 18RS21 

AAAGTTTTAGTAGTTGATGATGAACCAGTTGCACGTAAC 

GAATTAATTTACCTTCTTAATAAGTATGATTCTAACCTCGTTATAGCAGA * 

GGCGCATGATATGGCTACTGCATTAGCTATTTTACTTAGAGAAACTTTTG 

ATGTAGCACTGTTAGATATCCATCTCAGAGATGATTCTGGGTTGCAATTA 

GCAGAGTATATCAATAAAATGCCCAAACCACCATTATTGATATTTGCGAC 

TGCTTATGATCAATATGCTATTCAGGCTTTTGAGCATGATGCGCGTGATT 

ATTTGTTAAAACCCTATGATTTTGATAGGCTAAAGCAAGCTATGGATAGA 

GTAAAAGGAGCGCTAAGTACATCTACAATTATAGAGAGCGTAACTTCCGG 

TCCTCTCTTCAAGCAACAGTATCCATTGACAGTAGAAGATCGAATCTATC 

TGGTGTCGGCGGATGATATCCTTTTGATTGAAGCTATGCAAGGAAAACTG 

ATTATACAAACACCTGATAAAAATTATGAAATTGATGGCTCTCTACAACA 

ATGGCAAGATAAACTACCATCATCTCAATTTGTACGGGTACATCGCTCTT 

ACATTGTGAACATTAATGCTATTAAAACGATTGAACCTTGGTTTAACCAA 

ACACTTCAGTTACACCTTTGTAATAAAATAACAGTTCCTGTTAGCAGAGC 

AAATGTAAAACCCCTAAAACAAATGTTAGGCATATCTACC 

SEQ ID NO. 7806 

STRAIN M732 

AAAGTTTTAGTAGTTGATGATGAACCAGTT 

GCACGTAACGAATTAATTTACCTTCTTAATAAGTATGATTCTAACCTCGT 
TATAGCAGAGGCGCATGATATGGCTACTGCATTAGCTATTTTACTTAGAG 
AAACTTTTGATGTAGCACTGTTAGATATCCATCTCAGAGATGATTCTGGG 
TTGCAATTAGCAGAGTATATCAATAAAATGCCCAAACCACCATTATTGAT 
ATTCGCGACTGCTTATGATCAATATGCTATTCAGGCTTTTGAGCAGGATG 
CGCGTGATTATTTGTTAAAACCCTATGAGTTTGATAGGTTAAAGCAAGCT 
ATGGATAGAGTAAAAGGAGCGCTAAGTACATCTACAATTATAGAGAGCGT 
AGCTTCCGGTCCTCTCTTCAAGCAACAGTATCCATTGACAGTAGAAGATC 
GAATCTATCTGGTGTCGGCGGATGATATCCTTTTGATTGAAGCTATGCAA 
GGAAAACTGATTATACAAACACCTGATAAAAATTATGAAATTGATGGCTC 
TCTACAACAATGGCAAGATAAACTACCATCATCTCAATTTGTACGGGTAC 
ATCGCTCTTACATTGTGAATATTAATGCTATTAAAACGATTGAACCTTGG 
TTTAACCAAACACTTCAGTTACACCTTTGTAATAAAATAACAGTTCCTGT 
TAGCAGAGCAAATGTAAAACCCCTAAAACAAATGTTAGGCATATCTACC 

SEQ ID NO. 7807 

STRAIN COH1 

AAAGTTTTAGTAGTTGATGATGAACCAGTTGCACGTA 

ACGAATTAATTTACCTTCTTAATAAGTATGATTCTAACCTCGTTATAGCA 

GAGGCGCATGATATGGCTACTGCATTAGCTATTTTACTTAGAGAAACTTT 
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TGATGTAGCACTGTTAGATATCCATCTCAGAGATGATTCTGGGTTGCAAT 
TAGCAGAGTATATCAATAAAATGCCCAAACCACCATTATTGATATTCGCG 
ACTGCTTATGATCAATATGCTATTCAGGCTTTTGAGCAGGATGCGCGTGA 
TTATTTGTTAAAACCCTATGAGTTTGATAGGTTAAAGCAAGCTATGGATA 
GAGTAAAAGGAGCGCTAAGTACATCTACAATTATAGAGAGCGTAGCTTCC 
GGTCCTCTCTTCAAGCAACAGTATCCATTGACAGTAGAAGATCGAATCTA 
TCTGGTGTCGGCGGATGATATCCTTTTGATTGAAGCTATGCAAGGAAAAC 
TGATTATACAAACACCTGATAAAAATTATGAAATTGATGGCTCTCTACAA 
CAATGGCAAGATAAACTACCATCATCTCAATTTGTACGGGTACATCGCTC 
TTACATTGTGAATATTAATGCTATTAAAACGATTGAACCTTGGTTTAACC 
AAACACTTCAGTTACACCTTTGTAATAAAATAACAGTTCCTGTTAGCAGA 
GCAAATGTAAAACCCCTAAAACAAATGTTAGGCATATCTACC 

SEQ ID NO. 7808 

STRAIN M781 

AAAGTTTTAGTAGTTGATGATGAACCAGTTGCACGTAAC 

GAATTAATTTACCTTCTTAATAAGTATGATTCTAACCTCGTTATAGCAGA 

GGCGCATGATATGGCTACTGCATTAGCTATTTTACTTAGAGAAACTTTTG 

ATGTAGCACTGTTAGATATCCATCTCAGAGATGATTCTGGGTTGCAATTA 

GGAGAGTATATCAATAAAATGCCCAAACCACCATTATTGATATTCGCGAC 

TGCTTATGATCAATATGCTATTCAGGCTTTTGAGCAGGATGCGCGTGATT 

ATTTGTTAAAACCCTATGAGTT'TGATAGGTTAAAGypAAGCTATGGATAGA 

GTAAAAGGAGCGCTAAGTACATCTACAATTATAGAGAGCGTAGCTTCCGG 

TCCTCTCTTCAAGCAACAGTATCCATTGACAGTAGAAGATCGAATCTATC 

TGGTGTCGGCGGATGATATCCTTTTGATTGAAGCTATGCAAGGAAAACTG 

ATTATACAAACACCTGATAAAAATTATGAAATTGATGGCTCTCTACAACA 

ATGGCAAGATAAACTACCATCATCTCAATTTGTACGGGTACATCGCTCTT 

ACATTGTGAATATTAATGCTATTAAAACGATTGAACCTTGGTTTAACCAA 

AC ACT T CAGTT AC ACCTT TGT AAT AAAAT AAC AGTT CCTGTT AGC AGAG C 

AAATGTAAAACCCCTAAAACAAATGTTAGGCATATCTACC 

SEQ ID NO. 7809 

STRAIN CJB110 

CTTAATAAGTATGATTCTAACCTCGTTATAGCAGAGGCGCATGATATGGC 
TACTGCATTAGCTATTTTACTTAGAGAAACTTTTGATGTAGCACTGTTAG 
ATATCCATCTCAGAGATGATTCTGGGTTGCAATTAGCAGAGTATATCAAT 
AAAATGCCCAAACCACCATTATTGATATTCGCGACTGCTTATGATCAATA 
TGCTATTCAAGCTTTTGAGCATGATGCGCGTGATTATTTGTTAAAACCCT 
ATGAGTTTGATAGGCTAAAGCAAGnTATGGATAGAGTAAAAGGAGCGCTA 
AGTACATCTACAATTATAGAGAGCGTAACTTCCGGCCCTCTCTTCAAGCA 
ACAGTATCCATTGACAGTAGAAGATnGAATCTATCTGGTGTCGGCGGATG 
ATATCCTTTTGATTGAAGCTATGCAAGGAAAACTGATTATACAAACACCT 
GATAAAAATTATGAAATTGATGGCTCTCTACAACAATGGCAAGATAAACT 
ACCATCATCTCAATTTGTACGGGTGCACCGCTCTTACATTGTGAATATTA 
ATGCTATTAAAACGATTGAACCTTGGTTTAACCAAACACTTCAGTTACAC 
CTTTGTAATAAAATAACAGTTCCTGTTAGCAGAGCAAATGTAAAACCCCT 
AAAACAAATGTTAGG 

SEQ ID NO. 7810 

STRAIN 1169NT 

AAAGTTTTAGTAGTTGATGATGAACCAG 

TTGCACGTAACGAATTAATTTATCTTCTTAATAAGTATGATTCTAACCTC 
GTTATAGCAGAGGCGCATGATATAGCTACTGCATTAGCTATTTTACTTAG 
AGAAACTTTTGATGTAGCACTGTTAGATATCCATCTCAGAGATGATTCTG 
GGTTGCAATTAGCAGAGTATATCAATAAAATGCCCAAACCACCATTATTG 
ATATTCGCGACTGCTTATGATCAATATGCTATTCAGGCTTTTGAGCATGA 
TGCGCGTGATTATTTGTTAAAACCCTATGAGTTTGATAGGCTAAAGCAAG 
CTATGGATAGAGTAAAAGGAGCGCTAAGTACATCTACAATTATAGAGAGC 
GTAACTTCCGGCCCTCTCTTCAAGCAACAGTATCCATTGACAGTAGAAGA 
TCGAATCTATCTGGTGTCGGCGGATGATATCCTTTTGATTGAAGCTATGC 
AAGGAAAACTGATTATACAAACACCTGATAAAAATTATGAAATTGATGGC 
TCTCTACAACAATGGCAAGATAAACTACCATCATCTCAATTTGTACGGGT 
GCACCGCTCTTACATTGTGAATATTAATGCTATTAAAACGATTGAACCTT 
GGTTTAACCAAACACTTCAGTTACACCTTTGTAATAAAATAACAGTTCCT 
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GTTAGCAGAGCAAATGTAAAACCCCTAAAACAAATGTTAGGCATATCTAC 

C . 

SEQ ID NO. 7811 

STRAIN JM9130013 
AAAGTTTTAGTAGTTGATGATGAACCAGT 

TGCACGTAACGAATTAATTTACCTTCTTAATAAGTATGATTCTAACCTCG 

TTATAGCAGAGGCGCATGATATGGCTACTGCATTAGCTATTTTACTTAGA 

GAAACTTTTGATGTAGCACTGTTAGATATCCATCTCAGAGATGATTCTGG 

GTTGCAATTAGCAGAGTATATCAATAAAATGCCCAAACCACCATTATTGA 

TATTCGCGACTGCTTATGATCAATATGCTATTCAAGCTTTTGAGCATGAT 

GCGCGTGATTATTTGTTAAAACCCTATGAGTTTGATAGGCTAAAGCAAGC 

TATGGATAGAGTAAAAGGAGCGCTAAGTACATCTACAATTATAGAGAGCG 

TAACTTCCGGCCCTCTCTTCAAGCAACAGTATCCATTGACAGTAGAAGAT 

CGAATCTATCTGGTGTCGGCGGATGATATCCTTTTGATTGAAGCTATGCA 

AGGAAAACTGATTATACAAACACCTGATAAAAATTATGAAATTGATGGCT 

CTCTACAACAATGGCAAGATAAACTACCATCATCTCAATTTGTACGGGTG 

CACCGCTCTTACATTGTGAATATTAATGCTATTAAAACGATTGAACCTTG ' 

GTTTAACCAAACACTTCAGTTACACCTTTGTAATAAAATAACAGTTCCTG 

TTAGCAGAGCAAATGTAAAACCCCTAAAACAAATGTTAGGCATATCTACC 

SEQ ID rib. 7812 * 
STRAIN 2603 frame: X 

KVLWDDEPVARNELIYLLNKYDSNLVIAEAHDMATALAILLRETFDVALLDIHLRDDSG 
LQLAEYINKMPKPPLLIFATAYDQYAiQAFEHDARDYL^ 

STIIESVTSGPLETCQQYPLTVEDRIYLVSADDILLiEAMQGkLliQTPDKNYEIDGSLQQ* 
WQDKLPSSQFVRVHRSYIVNINAIKTIEPWFNQTLQLHLCNKITVPVSRANVKPLKQMLG 
1ST 

SEQ ID NO. 7813 

STRAIN 090 frame: 1 

KVLWDDEPVARNELIYLLNKYDSNLVIAEAHDMATALAILLRETFDVALLDIHLRDDSG 
LQLAEYINKMPKPPLLIFATAYDQYAIQAFEHDARDYLLKPYDFDRLKQAMDRVKGALST 
STIIESVTSGPLFKQQYPLTVEDRIYLVSADDILLIEAMQGKLIIQTPDKNYEIDGSLQQ 
WQDKLPSSQFVRVHRSYIVNINAIKTIEPWFNQTLQLHLCNKITVPVSRANVKPLKQMLG 
1ST 

SEQ ID NO. 7814 

STRAIN A909 frame: 1 

KVLWDDEPVARNELIYLLNKYDSNLVIAEAHDMATALAILLRETFDVALLDIHLRDDSG 
LQLAEYINKMPKPPLLIFATAYDQYAIQAFEHDARDYLLKPYEFDRLKQAMDRVKGALST 
STIIESVTSGPLFKQQYPLTVEDRIYLVSADDILLIEAMQGKLIIQTPDKNYEIDGSLQQ 
WQDKLPSSQFVRVHRSYIVNINAIKTIEPWFNQTLQLHLCNKITVPVSRANVKPLKQMLG 
1ST 

SEQ ID NO. 7815 

STRAIN H36B frame: 1 

KVLWDDEPVARNELIYLLNKYDSNLVIAEAHDMATALAILLRETFDVALLDIHLRDDSG 
LQLAEYINKMPKPPLLIFATAYDQYAIQAFEHDARDYLLKPYEFDRLKQAMDRVKGALST 
STIIESVTSGPLFKQQYPLTVEDRIYLVSADDILLIEAMQGKLIIQTPDKNYEIDGSLQQ 
WQDKLPSSQFVRVHRSYIVNINAIKTIEPWFNQTLQLHLCNKITVPVSRANVKPLKQMLG 
1ST 

SEQ ID NO. 7816 

STRAIN 18RS21 frame: 1 

KVLWDDEPVARNELIYLLNKYDSNLVIAEAHDMATALAILLRETFDVALLDIHLRDDSG 
LQLAEYINKMPKPPLLIFATAYDQYAIQAFEHDARDYLLKPYDFDRLKQAMDRVKGALST 
STIIESVTSGPLFKQQYPLTVEDRIYLVSADDILLIEAMQGKLIIQTPDKNYEIDGSLQQ 
WQDKLPSSQFVRVHRSYIVNINAIKTIEPWFNQTLQLHLCNKITVPVSRANVKPLK^LG 
1ST 

SEQ ID NO. 7817 

STRAIN M732 frame: 1 

KVLWDDEPVARNELIYLLNKYDSNLVIAEAHDMATALAILLRETFDVALLDIHLRDDSG 
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LQLAEYINKMPKPPLLIFATAYDQYAIQAFEQDARDYLLKPYEFDRLKQAMDRVKGALST 
STIIESVASGPLFKQQYPLTVEDRIYLVSADDILLIEAMQGKLIIQTPDKNYEIDGSLQQ 
WQDKLPSSQFVRVHRSYIVNINAIKTIEPWFNQTLQLHLCNKITVPVSRANVKPLKQMLG 
1ST 

SEQ 3D NO. 7818 

STRAIN COH1 frame: 1 

KVLVVDDEPVARNELIYLLNKYDSNLVIAEAHDMATALAILLRETFDVALLDIHLRDDSG 
LQIiAEYINKMPKPPLLIFATAYDQYAIQAFEQDARDYLLKPYEFDRLKQAMDRVKGALST 
STIIESVASGPLFKQQYPLTVEDRIYLVSADDILLIEAMQGKLIIQTPDKNYEIDGSLQQ 
WQDKLPSSQFVRVHRSYIVNINAIKTIEPWFNQTLQLHLCNKITVPVSRANVKPLKQMLG 
1ST 

SEQ ID NO. 7819 

STRAIN M781 frame: 1 

KVLWDDEPVARNELIYLLNKYDSNLVIAEAHDMATALAILLRETFDVALLDIHLRDDSG 
LQLAEYINKMPKPPLLIFATAYDQYAIQAFEQDARDYLLKPYEFDRLKQAMDRVKGALST 
STIIESVASGPLFKQQYPLTVEDRIYLVSADDILLIEAMQGKLIIQTPDKNYEIDGSLQQ 
WQDKLPSSQFVRVHRSYIWINAIKTIEPWFNQTLQLHLCNKITVPVSRANVKPLKQMLG 
1ST . 

SEQ ID NO. 7820 * 

STRAIN CJB11Q frame ^ 1 

I^NKYDSNLVIAEAHDMATALAILLRETFDVALLDIHLRDDSGLQLAEYINKMPKPPLLIF 
ATAYDQYAIQAFEHDARDYLLKPYEFDRLKQXMDRVKGALSTSTIIESVTSGPLFKQQYP 
LTVEDXIYLVSADDILLIEAMQGKLIIQTPDKNYEIDGSLQQWQDKLPSSQFVRVPiRSYI 
VNINAIKTIEPWFNQTLQLHLCNKITVPVSRANVKPLKQML 

SEQ ID NO. 7821 

STRAIN 1169NT frame: 1 

KVLWDDEPVARNELIYLLNKYDSNLVIAEAHDIATALAILLRETFDVALLDIHLRDDSG 
LQLAEYINKMPKPPLLIFATAYDQYAIQAFEHDARDYLLKPYEFDRLKQAMDRVKGALST 
STIIESVTSGPLFKQQYPLTVEDRIYLVSADDILLIEAMQGKLIIQTPDKNYEIDGSLQQ 
WQDKLPSSQFVRVHRSYIVNINAIKTIEPWFNQTLQLHLCNKITVPVSRANVKPLKQMLG 
1ST 

SEQ ID NO. 7822 

STRAIN JM9130013 frame: 1 

KVL W D DE P VARNE L I YLLNKY D SN LVI AEAH DMAT ALAI LLRET FD V ALL D IHLRDDSG 
LQLAEYINKMPKPPLLIFATAYDQYAIQAFEHDARDYLLKPYEFDRLKQAMDRVKGALST 
STIIESVTSGPLFKQQYPLTVEDRIYLVSADDILLIEAMQGKLIIQTPDKNYEIDGSLQQ 
WQDKLPSSQFVRVHRSYIVNINAIKTIEPWFNQTLQLHLCNKITVPVSRANVKPLKQMLG 
1ST 

SEQ ID NO. 7901 
STRAIN 2603 

ATGGGAATTGAATTTAAAAATGTAAGTTATACCTATCAAGCCGGCACTCCTTTTGAAGGG 
CGTGCCCTTTTTGACGTCAATCTGAAAATTGAAGATGCTTCCTATACCGCGTTCATTGGG 
CACACAGGTTCTGGAAAATCAACTATTATGCAACTTTTGAATGGTTTACATATTCCTACA 
AAAGGTGAGGTAATTGTCGATGATTTTTCTATTAAAGCAGGGGACAAGAACAAAGAAATC 
AAATTTATAAGGCAAAAAGTTGGTTTAGTTTTTCAATTTCCAGAAAGTCAGCTTTTTGAA 
GAGACAGTTTTAAAGGATGTTGCTTTTGGACCACAAAATTTTGGTATTTCTCAGATTGAA 
GCTGAAAGGCTGGCTGAAGAAAAATTAAGGTTAGTTGGTATCAGTGAGGATTTATTCGAT 
AAAAATCCATTTGAACTTTCTGGAGGGCAGATGAGGCGGGTTGCTATAGCTGGTATTTTA 
GCGATGGAACCCAAAGTACTAGTACTGGATGAGCCAACAGCTGGACTTGATCCTAAGGGA 
AGAAAAGAATTAATGACTCTTTTTAAAAATCTTCATAAAAAAGGAATGACTATCGTCTTA 
GTGACTCACTTAATGGACGATGTAGCGGATTATGCTGACTATGTGTATGTTTTAGAAGCA 
GGGAAAGTAACCTTATCAGGACAACCAAAACAGATTTTTCAAGAAGTAGAACTTTTAGAA 
AGTAAACAATTAGGAGTTCCCAAAATCACCAAGTTTGCTCAAAGACTATCTCATAAGGGA 
TTAAATTTACCTAGTTTACCAATTACTATTAACGAATTTGTGGAGGCTATTAAGCATGGA 

SEQ ID NO. 7902 
STRAIN 090 

GGAATTGAATTTAAAAATGTAAGTTATACCTATCAAGCC 
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GGCACTCCTTTTGAAGGGCGTGCCCTTTTTGACGTCAATCTGAAAATTGA 
AGATGCTTCCTATACCGCGTTCATTGGGCAC^CAGGTTCTGGAAAATCAA 
CTATTATGCAACTTTTGAATGGTTTACATATTCCTACAAAAGGTGAGGTA 
ATTGTCGATGATTTTTCTATTAAAGCAGGGGACAAGAACAAAGAAATCAA 
ATTTATAAGGCAAAAAGTTGGTTTAGTTTTTCAATTTCCAGAAAGTCAGC 
TTTTTGAAGAGACAGTTTTAAAGGATGTTGCTTTTGGACCACAAAATTTT 
GGTATTTCTCAGATTGAAGCTGAAAGGCTGGCTGAAGAAAAATTAAGGTT 
AGTTGGTATCAGTGAGGATTTATTCGATAAAAATCCATTTGAACTTTCTG 
GAGGGCAGATGAGGCGGGTTGCTATAGCTGGTATTTTAGCGATGGAACCC 
AAAGTACTAGTACTGGATGAGCCAACAGCTGGACTTGATCCTAAGGGAAG 
AAAAGAATTAATGACTCTTTTTAAAAATCTTCATAAAAAAGGAATGACTA 
TCGTCTTAGTGACTCACTTAATGGACGATGTAGCGGATTATGCTGACTAT 
GTGTATGTTTTAGAAGCAGGGAAAGTAACCTTATCAGGACAACCAAAACA 
GATTTTTCAAGAAGTAGAACTTTTAGAAAGTAAACAATTAGGAGTTCCCA 
AAATCACCAAGTTTGCTCAAAGACTATCTCATAAGGGATTAAATTTACCT 
AGTTTACCAATTACTATTAACGAATTTGTGGAGGCTATTAAGCATGGA 

SEQ ID NO. 7903 

STRAIN A909 

ggaattgaatttaaaaatgtaagttatacctatcaa 
gccggcactccttttgaagggcgtgccctttttgacgjcaatctgaaaat 
' tgmgatgcttcctataccgcgttcattgggcacacaggttctggaaaat 
caactatta'fgcaacttttgaatggtttacatattcctacaaaaggtgag 
gtaattgtcgatgatttttctattaaagctfggggacaagaacaaagaaat 
caaatttataaggcaaaaagttggtttagtttttcaat|tccagaaagtc 
agctttttgaagagacagttttaaaagatgttgcttttggaccacaaaat 
tttggtatttctcagattgaagctgaaaggctggctgaagaaaaattaag 
gtt agttggtat cagtgaggat ttatt cgat aaaaat ccatt tgaacttt 
ctggagggcagatgaggcgggttgctatagctggtattttagcgatggaa 
cccaaagtactagtactagatgagccaacagctggacttgatcctaaggg 
aagaaaagaat taatgact ct tt tt aaaaat ct t cat aaaaaaggaatg a 
ctatcgtcttagtgactcacttaatggacgatgtagcggattatgctgac 
tatgtgtatgttttagaagcagggaaagtaaccttatcaggacaaccaaa 
gcagatttttcaagaagtagaacttttagaaagtaaacaattaggagttc 
ccaaaatcaccaagtttgctcaaaggctatctcataagggattaaattta 
cctagtttaccaattactattaacgaatttgtggaggctattaagcatgg 

A 

SEQ ID NO. 7904 

STRAIN H3 6B 

GGAATTGAATTTAAAAATGTAAGTTATAC 

CTATCAAGCCGGCACTCCTTTTGAAGGGCGTGCCCTTTTTGACGTCAATC 
TGAAAATTGAAGATGCTTCCTATACCGCGTTCATTGGGCACACAGGTTCT 
GGAAAATCAACTATTATGCAACTTTTGAATGGTTTACATATTCCTACAAA 
AGGTGAGGTAATTGTCGATGATTTTTCTATTAAAGCAGGGGACAAGAACA 
AAGAAATCAAATTTATAAGGCAAAAAGTTGGTTTAGTTTTTCAATTTCCA 
GAAAGTCAGCTTTTTGAAGAGACAGTTTTAAAAGATGTTGCTTTTGGACC 
ACAAAATTTTGGTATTTCTCAGATTGAAGCTGAAAGGCTGGCTGAAGAAA 
AATTAAGGTTAGTTGGTATCAGTGAGGATTTATTCGATAAAAATCCATTT 
GAACTTTCTGGAGGGCAGATGAGGCGGGTTGCTATAGCTGGTATTTTAGC 
GATGGAACCCAAAGTACTAGTACTAGATGAGCCAACAGCTGGACTTGATC 
CTAAGGGAAGAAAAGAATTAATGACTCTTTTTAAAAATCTTCATAAAAAA 
GGAATGACTATCGTCTTAGTGACTCACTTAATGGACGATGTAGCGGATTA 
TGCTGACTATGTGTATGTTTTAGAAGCAGGGAAAGTAACCTTATCAGGAC 
AACCAAAGCAGATTTTTCAAGAAGTAGAACTTTTAGAAAGTAAACAATTA 
GGAGTTCCCAAAATCACCAAGTTTGCTCAAAGGCTATCTCATAAGGGATT 
AAATTTACCTAGTTTACCAATTACTATTAACGAATTTGTGGAGGCTATTA 
AGCATGGA 

SEQ ID NO. 7905 

STRAIN 18RS21 

GGAATTGAATTTAAAAATGTAAGTTATAC 

CTATCAAGCCGGCACTCCTTTTGAAGGGCGTGCCCTTTTTGACGTCAATC 
TGAAAATTGAAGATGCTTCCTATACCGCGTTCATTGGGCACACAGGTTCT 
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GGAAAATCAACTATTATGCAACTTTTGAATGGTTTACATATTCCTACAAA 
AGGTGAGGTAATTGTCGATGATTTTTCTATTAAAGCAGGGGACAAGAACA 
AAGAAATCAAATTTATAAGGCAAAAAGTTGGTTTAGTTTTTCAATTTCCA 
GAAAGTCAGCTTTTTGAAGAGACAGTTTTAAAGGATGTTGCTTTTGGACC 
ACAAAATTTTGGTATTTCTCAGATTGAAGCTGAAAGGCTGGCTGAAGAAA 
AATTAAGGTTAGTTGGTATCAGTGAGGATTTATTCGATAAAAATCCATTT 
GAACTTTCTGGAGGGCAGATGAGGCGGGTTGCTATAGCTGGTATTTTAGC 
GATGGAACCCAAAGTACTAGTACTGGATGAGCCAACAGCTGGACTTGATC 
CTAAGGGAAGAAAAGAATTAATGACTCTTTTTAAAAATCTTCATAAAAAA 
GGAATGACTATCGTCTTAGTGACTCACTTAATGGACGATGTAGCGGATTA 
TGCTGACTATGTGTATGTTTTAGAAGCAGGGAAAGTAACCTTATCAGGAC 
AACCAAAACAGATTTTTCAAGAAGTAGAACTTTTAGAAAGTAAACAATTA 
GGAGTTCCCAAAATCACCAAGTTTGCTCAAAGACTATCTCATAAGGGATT 
AAATTTACCTAGTTTACCAATTACTATTAACGAATTTGTGGAGGCTATTA 
AGCATGGA 

SEQ ID NO. 7906 

STRAIN M732 

GGAATTGAATTTAAAAATGTAAGTTATAC 

CTATCAAGCCGGCACTCCTTTTGAAGGGCGTGCCCTTTTTGACGTCAATC 
TGAAAATTGAAGATGTTTCCJATACCGCXSTTCATTGGGCACACAGGTTCT 
GGAAAATCAACTATTATGCAACTT^TQAATGGTTTA^ATATTCCTACAAA 
AGGTGAGGTAATTGTCGATGATTTTTCTATTAAAGCAGGGGACAAGAACA 
AAGAAATCAAATTTATAAGGCAAAAAGTTGGTTTAGTTTTTCAATTTCCA 
GAAAGTCAGCTTTTTGAAGAGACAGTTTTAAAGGATGTTGCTTTTGGACC 
ACAAAATTTTGGTATTTCTCAGATTGAAGCTGAAAGGGTGGCTGAAGAAA 
AATTAAGGTTAGTTGGTATCAGTGAGGATTTATTCGATAAAAATCCATTT 
GAACTTTCTGGAGGGCAGATGAGGCGGGTTGCTATAGCTGGTATTTTAGC 
GATGGAACCCAAAGTACTAGTACTGGATGAGCCAACAGCTGGACTTGATC 
CTAAGGGAAGAAAAGAATTAATGACTCTTTTTAAAAATCTTCATAAAAAA 
GGAATGACTATCGTCTTAGTGACTCACTTAATGGACGATGTAGCGGATTA 
TGCTGACTATGTGTATGTTTTAGAAGCAGGGAAAGTAACCTTATCAGGAC 
AACCAAAACAGATTTTTCAAGAAGTAGAACTTTTAGAAAGTAAACAATTA 
GGAGTTCCCAAAATCACCAAGTTTGCTCAAAGACTATCTCATAAGGGATT 
AAATTTACCTAGTTTACCAATTACTATTAACGAATTTGTGGAGGCTATTA 
AGCATGGA 

SEQ ID NO. 7907 

STRAIN COH1 

GGAATTGAATTTAAAAATGTAAGTTATACCTATCAAGCC 

GGCACTCCTTTTGAAGGGCGTGCCCTTTTTGACGTCAATCTGAAAATTGA 

AGATGTTTCCTATACCGCGTTCATTGGGCACACAGGTTCTGGAAAATCAA 

CTATTATGCAACTTTTGAATGGTTTACATATTCCTACAAAAGGTGAGGTA 

ATTGTCGATGATTTTTCTATTAAAGCAGGGGACAAGAACAAAGAAATCAA 

ATTTATAAGGCAAAAAGTTGGTTTAGTTTTTCAATTTCCAGAAAGTCAGC 

TTTTTGAAGAGACAGTTTTAAAGGATGTTGCTTTTGGACCACAAAATTTT 

GGTATTTCTCAGATTGAAGCTGAAAGGCTGGCTGAAGAAAAATTAAGGTT 

AGTTGGTATCAGTGAGGATTTATTCGATAAAAATCCATTTGAACTTTCTG 

GAGGGCAGATGAGGCGGGTTGCTATAGCTGGTATTTTAGCGATGGAACCC 

AAAGTACTAGTACTGGATGAGCCAACAGCTGGACTTGATCCTAAGGGAAG 

AAAAGAATTAATGACTCTTTTTAAAAATCTTCATAAAAAAGGAATGACTA 

TCGTCTTAGTGACTCACTTAATGGACGATGTAGCGGATTATGCTGACTAT 

GTGTATGTTTTAGAAGCAGGGAAAGTAACCTTATCAGGACAACCAAAACA 

GATTTTTCAAGAAGTAGAACTTTTAGAAAGTAAACAATTAGGAGTTCCCA 

AAATCACCAAGTTTGCTCAAAGACTATCTCATAAGGGATTAAATTTACCT 

AGTTTACCAATTACTATTAACGAATTTGTGGAGGCTATTAAGCATGGA 

SEQ ID NO. 7908 

STRAIN M781 

GGAATTGAATTTAAAAATGTAAGTTATAC 

CTATCAAGCCGGCACTCCTTTTGAAGGGCGTGCCCTTTTTGACGTCAATC 
TGAAAATTGAAGATGTTTCCTATACCGCGTTCATTGGGCACACAGGTTCT 
GGAAAATCAACTATTATGCAACTTTTGAATGGTTTACATATTCCTACAAA 
AGGTGAGGTAATTGTCGATGATTTTTCTATTAAAGCAGGGGACAAGAACA 
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AAGAAATCAAATTTATAAGGCAAAAAGTTGGTTTAGTTTTTCAATTTCCA 
GAAAGTCAGCTTTTTGAAGAGACAGTTTTAAAGGATGTTGCTTTTGGACC 
ACAAAATTTTGGTATTTCTCAGATTGAAGCTGAAAGGCTGGCTGAAGAAA 
AATTAAGGTTAGTTGGTATCAGTGAGGATTTATTCGATAAAAATCCATTT 
GAACTTTCTGGAGGGCAGATGAGGCGGGTTGCTATAGCTGGTATTTTAGC 
GATGGAACCCAAAGTACTAGTACTGGATGAGCCAACAGCTGGACTTGATC 
CTAAGGGAAGAAAAGAATTAATGACTCTTTTTAAAAATCTTCATAAAAAA 
GGAATGACTATCGTCTTAGTGACTCACTTAATGGACGATGTAGCGGATTA 
TGCTGACTATGTGTATGTTTTAGAAGCAGGGAAAGTAACCTTATCAGGAC 
AACCAAAACAGATTTTTCAAGAAGTAGAACTTTTAGAAAGTAAACAATTA 
GGAGTTCCCAAAATCACCAAGTTTGCTCAAAGACTATCTCATAAGGGATT 
AAATTTACCTAGTTTACCAATTACTATTAACGAATTTGTGGAGGCTATTA 
AGCATGGA 

SEQ ID NO. 7909 

strain cjb110 

ggaattgaatttaaaaatgtaagttatac 

ctatcaagccggcactccttttgaagggcgtgccctttttgacgtdaatc 

tgaaaattgaagatgcttcctataccgcgttcattgggcacaCaggttct 

ggaaaatcaactattatgcaacttttgaatggtttac.atattcctacaaa 

aggtgaggtaattgtcgatgatttttctattaaagcaggggacaagaaca 

aagaaatcaaatttataaggcaaaaagttggtttagtttttcaatttcca 

gaaagtcagctttttgaagagacagttttaa^fgatgttgcttttggacc 

acaaaatfttggtatttctcagattgaagctgaaaggctggctgaagaaa 

aattaaggttagttggtatcagtgaggatttattcgataaaaatccattt 

gaactttctggagggcagatgaggcgggttgctatagctggtattttagc 

gatggaacccaaagtactagtactggatgagccaAcagctggacttgatc 

ctaagggaagaaaagaattaatgactctttttaaaaatcttcataaaaaa 

ggaatgactatcgtcttagtgactcacttaatggacgatgtagcggatta . 

tgctgactatgtgtatgttttagaagcagggaaagtaaccttatcaggac 

aaccaaaacagatttttcaagaagtagaacttttagaaagtaaacaatta 

ggagttcccaaaatcaccaagtttgctcaaagactatctcataagggatt 

aaatttacctagtttaccaattactattaacgaatttgtggaggctatta 

agcatgga 

SEQ ID NO. 7910 

STRAIN 1169NT 
GGAATTGAATTTAAAAATGTAA 

GTTATACCTATCAAGCCGGCACTCCTTTTGAAGGGCGTGCCCTTTTTGAC 
GTCAATCTGAAAATTGAAGATGCTTCCTATACCGCGTTCATTGGGCACAC 
AGGTTCTGGAAAATCAACTATTATGCAACTTTTGAATGGTTTACATATTC 
CTACAAAAGGTGAGGTAATTGTCGATGATTTTTCTATTAAAGCAGGGGAC 
AAGAACAAAGAAATCAAATTTATAAGGCAAAAAGTTGGTTTAGTTTTTCA 
ATTTCCAGAAAGTCAGCTTTTTGAAGAGACAGTTTTAAAGGATGTTGCTT 
TTGGACCACAAAATTTTGGTATTTCTCAGATTGAAGCTGAAAGGCTGGCT 
GAAGAAAAATTAAGGTTAGTTGGTATCAGTGAGGATTTATTCGATAAAAA 
TCCATTTGAACTTTCTGGAGGGCAGATGAGGCGGGTTGCTATAGCTGGTA 
TTTTAGCGATGGAACCCAAAGTACTAGTACTGGATGAGCCAACAGCTGGA 
CTTGATCCTAAGGGAAGAAAAGAATTAATGACTCTTTTTAAAAATCTTCA 
TAAAAAAGGAATGACTATCGTCTTAGTGACTCACTTAATGGACGATGTAG 
CGGATTATGCTGACTATGTGTATGTTTTAGAAGCAGGGAAAGTAACCTTA 
TCAGGACAACCAAAACAGATTTTTCAAGAAGTAGAACTTTTAGAAAGTAA 
ACAATTAGGAGTTCCCAAAATCACCAAGTTTGCTCAAAGACTATCTCATA 
AGGGATTAAATTTACCTAGTTTACCAATTACTATTAACGAATTTGTGGAG 
GCTATTAAGCATGGA 

SEQ ID NO. 7911 

STRAIN JM9130013 
GGAATTGAATTTAAAAATGTAAGTT 

ATACCTATCAAGCCGGCACTCCTTTTGAAGGGCGTGCCCTTTTTGACGTT 
AATCTGAAAATTGAAGATGCTTCCTATACCGCATTCATTGGGCACACAGG 
TTCTGGAAAATCAACTATTATGCAACTTTTGAATGGTTTACATATTCCTA 
CAAAAGGTGAGGTAATTGTCGATGATTTTTCTATTAAAGCAGGGGACAAG 
AACAAAGAAATCAAATTTATAAGGCAAAAAGTTGGTTTAGTTTTTCAATT 
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TCCAGAAAGTCAGCTTTTTGAAGAGACAGTTTTAAAGGATGTTGCTTTTG 
GACCACAAAATTTTGGTATTTCTCAGATTGAAGCTGAAAGGCTGGCTGAA 
GAAAAATTAAGGTTAGTTGGTATTAGTGAGGATTTATTCGATAAAAATCC 
ATTTGAACTTTCTGGAGGGCAGATGAGGCGGGTTGCTATAGCTGGTATTT 
TAGCGATGGAACCCAAAGTACTAGTACTGGATGAGCCAACAGCTGGACTT 
GATCCTAAGGGAAGAAAAGAATTAATGACTCTTTTTAAAAAT CTTCATAA 
AAAAGGAATGACTATCGTCTTAGTGACTCACTTAATGGACGATGTAGCGG 
ATTATGCTGACTATGTGTATGTTTTAGAAGCAGGGAAAGTAACCTTATCA 
GGACAACCAAAACAGATTTTTCAAGAAGTAGAACTTTTAGAAAGTAAACA 
ATTAGGAGTTCCCAAAATCACCAAGTTTGCTCAAAGACTATCTCATAAGG 
GATTAAATTTACCTAGTTTACCAATTACTATTAACGAATTTGTGGAGGCT 
ATTAAGCATGGA 

SEQ XD NO. 7912 
STRAIN 2603 frame: 1 

MGIEFKNVSYTYQAGTPFEGRALFDVNLKIEDASYTAFIGHTGSGKSTIMQLLNGLHIPTK 

GEVIVDDFSIKAGDKNKEIKFIRQKVGLVFQFPESQLFEEiTVLKDVAFGPQNFGISQIEA 

ERLAEEKLRLVGISEDLFDIO^PFELSGGQMRRVAIAGILAMEPKVLVLDEPTAGLDPKGR 

KELMTLFKNLHKKGMTIVLVTHLMDDVADYADYVYVLEAGKVTLSGQPKQIFQEVELLfeS 

KQLGVPKITKFAQRLSHKC^JLPSLPITINEFVEAIKHG 

SEQ ID NO. 7913 

STRAIN 090 'frame: 1 

GIEFKNVSYTYQAGTPFEGRALFDVNLKIEDASYTAFIGHTGSGKSTIMQLLNGLHIPTK 
GEVIVDDFSIKAGDKNKEIKFIRQKVGLVFQFPESQLFEETVLKDVAFGPQNFGISQIEA. 
" ERLAEEKLRLVGISEDLFDKNPFELSGGQiyKRVAIAGILAMEPKVLVLDEPTAGLDPKGR 
KEmTLFKNIJiKKGMTIVLVTHLMDDVADYADYVWLEAGKVTLSGQPKQIFQEVELLES 
KQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAIKHG 

SEQ XD NO. 7914 

. STRAIN 090 frame: 1 
GIEFKNVSYTYQAGTPFEGRALFDVNLKIEDASYTAFIGHTGSGKSTIMQLLNGLHIPTK 
GEVIVDDFSIKAGDKNKEIKFIRQKVGLVFQFPESQLFEETVLKDVAFGPQNFGISQIEA 
ERLAEEKLRLVGISEDLFDKNPFELSGGQMRRVAIAGILAMEPKVLVLDEPTAGLDPKGR 
KELMTLFKNLHKKGMTIVLVTHLMDDVADYADYVYVLEAGKVTLSGQPKQIFQEVELLES 
KQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAIBCHG 

SEQ XD NO. 7915 

. STRAIN H36B frame: 1 

GIEFKNVSYTYQAGTPFEGRALFDVNLKIEDASYTAFIGHTGSGKSTIMQLLNGLHIPTK 
GEVIVDDFSIKAGDKNKEIKFIRQKVGLVFQFPESQLFEETVLKDVAFGPQNFGISQIEA 
ERLAEEKLRLVGISEDLFDKNPFELSGGQMRRVAIAGILAMEPBCVLVLDEPTAGLDPKGR 
KEmTLFKNLHKKGMTIVLVTHI^DDVADYADYVYVLEAGKVTLSGQPKQIFQEVELLES 
KQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAIKHG 

SEQ XD NO. 7916 

STRAIN 18RS21 frame: 1 

GIEFKNVSYTYQAGTPFEGRALFDVNLKIEDASYTAFIGHTGSGKSTIMQLLNGLHIPTK 
GEVIVDDFSIKAGDKNKEIKFIRQKVGLVFQFPESQLFEETVLKDVAFGPQNFGISQIEA 
ERLAEEKLRLVGISEDLFDKNPFELSGGQMRRVAIAGILAMEPKVLVLDEPTAGLDPKGR 
KEI^TLFKNLHKKGMTIVLVTHLMDDVADYADYVYVLEAGKVTLSGQPKQIFQEVELLES 
KQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAIKHG 

SEQ ID NO. 7917 

STRAIN M732 frame: 1 

GIEFBCNVSYTYQAGTPFEGRALFDVNLKIEDVSYTAFIGHTGSGKSTIMQLLNGLHIPTK 
GEVIVDDFSIKAGDKNKEIKFIRQKVGLVFQFPESQLFEETVLKDVAFGPQNFGISQIEA 
ERLAEEKLRLVGISEDLFDKNPFELSGGQMRRVAIAGILAMEPECVLVLDEPTAGLDPKGR 
KELMTLFKNLHKKGMTIVLVTHLMDDVADYADYVYVLEAGKVTLSGQPKQIFQEVELLES 
KQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAIKHG 

SEQ ID NO. 7918 

STRAIN COH1 frame: 1 

GIEFKNVSYTYQAGTPFEGRALFDVNLKIEDVSYTAFIGHTGSGKSTIMQLLNGLHIPTK 
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GEVIVDDFSIKAGDKNKEIKFIRQKVGLVFQFPESQLFEETVLKDVAFGPQNFGISQIEA 
ERLAEEKLRLVGISEDLFDKNPFELSGGQMRRVAIAGILAMEPKVLVLDEPTAGLDPKGR 
KELMTLFKNLHKKGMT I VLVTHLMD DVADYAD YVYVLEAGKVT LS GQPKQI FQEVE LLE S 
KQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAIKHG 

SEQ ID NO. 7919 

STRAIN M781 frame: 1 

GIEFKNVSYTYQAGTPFEGRALFDVNLKIEDVSYTAFIGHTGSGKSTIMQLLNGLHIPTK 
GEVIVDDFSIKAGDKNKEIKFIRQKVGLVFQFPESQLFEETVLKDVAFGPQNFGISQIEA 
ERLAEEKLRLVGISEDLFDKNPFELSGGQMRRVAIAGILAMEPKVLVLDEPTAGLDPKGR 
KELMTLFKNLHKKGMTIVLVTHLMDDVADYADYVYVLEAGBCVTLSGQPKQIFQEVELLES 
KQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAIKHG 

SEQ ID NO. 7920 

STRAIN CJB110 frame: 1 

GIEFBCNVSYTYQAGTPFEGRALFDVNLKIEDASYTAFIGHTGSGKSTIMQLLNGLHIPTK 
GEVIVDDFSIKAGDKNKEIKFIRQKVGLVFQFPESQLFEETVLKDVAFGPQNFGISQIEA 
ERLAEEKLRLVGISEDLFDKNPFELSGGQMRRVAIAGILAMEPKVLVLDEPTAGLDPKGR 
KELMTLFKNLHKKGMTIVLVTHI^DDVADYADYVYVLEAGKVTLSGQPKQIFQEVELLES 
KQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAIKHG ■ " 

SEQ ID NO. 7921 

STRAIN 1169NT frame: 1 

GIEFKNVSYTYQAGTPFEGRALFDVNLKIEDASYTAFIGHTGSGKSTIMQLLNGLHIPTK 
GEVIVDDFSIKAGDKNKEIKFIRQKVGLV^QFPESQLFEETVLKDVAFGPQNFGISQIEA 
ERLAEEKLRLVGISEDLFDKNPFELSGGQMRRVAIAGILAMEPKVLVLDEPTAGLDPKGR 
KELMTLFKNLHKKGMT IVLVTHLMDDVADYADYVYVLEAGKVTLSGQPKQIFQEVELLES 
KQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAIKHG 

SEQ ID NO. 7922 

STRAIN JM9130013 frame: 1 

GIEFKNVSYTYQAGTPFEGRALFDVNLKIEDASYTAFIGHTGSGKSTIMQLLNGLHIPTK 
GEVIVDDFSIKAGDKNKEIKFIRQKVGLVFQFPESQLFEETVLKDVAFGPQNFGISQIEA 
ERLAEEKLRLVGISEDLFDKNPFELSGGQMRRVAIAGILAMEPKVLVLDEPTAGLDPKGR 
KELMTLFKNLHKKGMTIVLVTHUyiDDVADYADYVYVLEAGKVTLSGQPKQIFQEVELLES 
KQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAIKHG 

SEQ ID NO. 8001 
STRAIN 2603 

GTGAACCACTTACTTAACCTCAGTAAAGAAAATATAGCTAAAATAGATTTTGACTTTCTT 
AATGAGGCACTTAATGCAAATATTCGTTTGAAAGAATTAGTAGATGAACTAAAAATTTCA 
AAAGAACTGGACAGTAAAGGTTGGTCCAAAAAAGACTCTCGAACGATAAAAATCTTGTAC 
GATGGCCTTATCAATAAACATATAGTTTCCCTAGATCGTGCAGATTATAACATTATCCAA 
GTCATTCCATTTGCTAATGTACATGTACTACTGTTTTTAATACCAGAAAGGGAGAATTCT 
AAAAATTATAGAATATACAACTACAGTGATTATGAAATGGAGTTAATCAATGAGGATAGG 
CAACAATTTTCAAAATATGAAACAGTTGATTTAGACCAATTGATACTTGTTGATATTTTT 
AATATTGATGACTACATTTCATCATATTTAACAATA 

SEQ ID NO. 8002 
STRAIN H36B 
* AACCACTTACTTAACCTCAGTAAAGAAAATATAGCT 
AAAATAGATTTTGACTTTCTTAATGAGGCACTTAATGCAAATATTCGTTT 
GAAAGAATTAGTAGATGAACTAAAAATTTCAAAAGAACTGGACAGTAAAG 
GTTGGTCCAAAAAAGACTCTCGAACGATAAAAATCTTGTACGATGGCCTT 
ATCAATAAACATATAGTTTCCCTAGATCGTGCAGATTATAACATTATCCA 
AGTCATTCCATTTGCTAATGTACATGTACTACTGTTTTTAATACCAGAAA 
GGGAGAATTCTAAAAATTATAgAATATACAACTACAGTGATTATGAAATG 
GAGTTAATCAATGAGGATAGGCAACAATTTTCAAAATATGAAACAGTTGA 
TTTAGACCAATTGATACTTGTTGATATTTTTAATATTGATGACTACATTT 
CATCATATTTAACAATA 

SEQ ID NO. 8003 
STRAIN 18RS21 

AACCACTTACTTAACCTCAGTAAAGAAAATATAG 
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CTAAAATAGATTTTGACTTTCTTAATGAGGCACTTAATGCAAATATTCGT 
TTGAAAGAATTAGTAGATGAACTAAAAATTTCAAAAGAACTGGACAGTAA 
AGGTTGGTCCAAAAAAGACTCTCGAACGATAAAAATCTTGTACGATGGCC 
TTATCAATAAACATATAGTTTCCCTAGATCGTGCAGATTATAACATTATC 
CAAGTCATTCCATTTGCTAATGTACATGTACTACTGTTTTTAATACCAGA 
AAGGGAGAATTCTAAAAATTATAGAATATACAACTACAGTGATTATGAAA 
TGGAGTTAATCAATGAGGATAGGCAACAATTTTCAAAATATGAAACAGTT 
GATTTAGACCAATTGATACTTGTTGATATTTTTAATATTGATGACTACAT 
TTCATCATATTTAACAATA 

SEQ ID NO. 8004 
STRAIN 2603 frame: 1 

VNHLLNLSKEN I AKI DFDFLNE ALNANIRLKELVDELKI SKELDSKGWS KKDSRT IKI LY 
DGLINKHIVSLDRADYNIIQVIPFANVHVLLFLIPERENSKNYRIYNYSDYEMELINEDR 
QQFSKYETVDLDQLILVDIFNIDDYISSYLTI 

SEQ ID NO. 8005 

STRAIN H36B frame: 1 

NHLLNLSKENIAKIDFDFLNEALNANIRLKELVDELKISKELDSKGWSKKDSRTIKILYD 
GLINKHIVSLDRADYNI IQVI PFANVHVLLFLI PERENSK^YRI YNYS DYEMELINEDRQ 
QFS KYETVDLDQLI LVDI FNI DDYI S S YLTI 

SEQ ID NO. 8006 

STRAIN 18RS21 frame: 1 ".. 

NHLLNLSKENIAKIDFDFLNEALNANIRLKELVDELKISKELDSKGWSKKDSRTIKILYD 
GLINKHIVSLDR7VDYNIIQVIPFANVHVLLFLIPERENSKNYRIYNYSDYEMELINEDRQ 
QFSKYETVDLDQLILVDI FNI DDYISS YLTI 

SEQ ID NO. 8101 
STRAIN 090 

AGCAAGCCTAATGTTGTTCAGTTAAA 

TAATCAATATATTAACGATGAGAATCTAAAAAAACGTTACGAAGCTGAGG 
AGTTACGCCGAAAAAATCGTTTAATGGGTTGGGTTCTTATTTTTGTCATG 
CTTTTATTTATTTTACCCACTTATAATTTAGTTAAGAGTTACAGAACTTT 
ACAAGAACGTCGT CAAGAAGTTGTAAAATTAACGAAAGACTAT CAGACAT 
TAACTAATAGAACTGAGAACCAGAAGTTGCTAGCAAAACAACTAAAAAAT 
CCAGATTACGTTCAAAAATATGCTCGAGCTAAGTATTATTTCTCTAAGAC 
CGGCGAAATGATTTACCCATTACCAGACCTTTTACCAAAA 

SEQ ID NO. 8102 

STRAIN A909 

AGCAAGCCTAATGTTGTTCAGTTAAATAAT C AATA 

TATTAACGATGAGAATCTAAAAAAACGTTACGAAGCTGAGGAGTTACGCCGAAAAAATCG 
TTTAATGGGTTGGGTTCTTATTTTTGTCATGCTtttATTTATTTTACCCACTTATAATTT 
AGTTAAGAGTTACAGAACTTTACAAGAACGTCGTCAAGAAGTTGTAAAATTAACGAAAGA 
CTATCAGACATTAACTAATAGAACTGAGAACCAGAAGTTACTAGCAAAACAACTAAAAAA 
TCCAGATTACGTTCAAAAATATGCTCGAGCTAAGTATTATTTCTCTAAGACCGGCGAAAT 
GATTTACCCATTACCAGACCT 

SEQ ID NO. 8103 
STRAIN H36B 

AGCAAGCCTAATGTTGTTCAGTTAAA 

TAATCAATATATTAACGATGAGAATCTAAAAAAACGTTACGAAGCTGAGG 
AGTTACGCCGAAAAAATCGTTTAATGGGTTGGGTTCTTATTTTTGTCATG 
CTTTTATTTATTTTACCCACTTATAATTTAGTTAAGAGTTACAGAACTTT 
ACAAGAACGTCGT CAAGAAGTTGTAAAATTAACGAAAGACTAT CAGACAT 
TAACTAATAGAACTGAGAACCAGAAGTTACTAGCAAAACAACTAAAAAAT 
CCAGATTACGTTCAAAAATATGCTCGAGCTAAGTATTATTTCTCTAAGAC 
CGGCGAAATGATTTACCCATTACCAGACCtTTTACCAAAA 

SEQ ID NO. 8104 

STRAIN 18RS21 

AGCAAGCCTAATGTTGTTCAGTTAAATAATCAATATATTAACGATGAGAATCTAAAAAAA 
CGTTACGAAGCTGAGGAGTTACGCCGAAAAAATCGTTTAATGGGTTGGGTTCTTATTTTT 
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GTCATGCTTTTATTTATTTTACCCACTTATAATTTAGTTAAGAGTTACAGAACTTTAC^A 
GAACGTCGTCAAGAAGTTGTAAAATTAACGAAAGACTATCAGACATTAACTAATAGAACT 
GAGAACCAGAAGTTGCTAGCAAAACAACTAAAAAATCCAGATTACGTTCAAAAATATGCT 
CGAGCTAAGTATTATTTCTCTAAGACCGGCGAAATGATTTACCCATTACCAGACCTTTTA 
CCAAAA 

SEQ ID MO. 8105 
STRAIN M732 

AGCAAGCCTAATGTTGTTCAGTTAAA 

TAATCAATATATTAACGATGAGAATCTAAAAAAACGTTACGAAGCTGAGG 
AGTTACGCCGAAAAAATCGTTTAATGGGTTGGGTTCTTATTTTTGTCATG 
CTTTTATTTATTTTACCCACTTATAATTTAGTTAAGAGTTACAGAACTTT 
ACAAGAACGTCGTCAAGAAGTTGTAAAATTAACGAAAGACTATCAGACAT 
TAACTAATAGAACTGAGAACCAGAAGTTACTAGCAAAACAACTAAAAAAT 
CCAGATTACGTTCAAAAATATGCTCGAGCGAAGTATTATTTCTCTAAGAC 
CGGCGAAATGATTTACCCATTACCAGACCtTTTACCAAAA 

SEQ ID HO. 8106 
•STRAIN COH1 

AGCAAGCCTAATGTTGTTCAGTTAAATAATC 

AATATATTAACGATGAGAATCTAAAAAAACGTTACGAAGCTGAGGAGTTA 
CGCCGAAAAAATCGTTTAATGGGTTGGGTTCTTATTTTTGTCATGCTttt 
ATTTATTTTACCCACTTATAATTTAGTTAAGAGTTACAGAACTTTACAAG 
" AACGTCGTCAAGAAGTTGTAAAATTAACGAAAGACTAT CAGACATTAACT 
AATAGAACTGAGAACCAGAAGTTACTAGCAAAACAACTAAAAAATCCAGA 
TTACGTTCAAAAATATGCTCGAGCGAAGTATTATTTCTCTAAGACCGGCG 
AAATGATTTACCCATTACCAGACCTTTTACCAAAA 

SEQ ID NO. 8107 
STRAIN M781 
. AGCaAGCCTAATGTTGTTCAGTT 
AAATAATCAATATaTTAACGATGAGAATCTAAAAAAACGTTACGAAGCTG 
AGGAGTTACGCCGAAAAAATCGTTTAATGGGTTGGGTTCTTATTTTTGTC 
ATGCTTTTATTTATTTTACCCACTTATAATTTAGTTAAGAGTTACAGAAC 
TTTACAAGAACGTCGTCAAGAAGTTGTAAAATTAACGAAAGACTATCAGA 
CATTAACTAATAGAACTGAGAACCAGAAGTTACTAGCAAAACAACTAAAA 
AATCCAGATTACGTTCAAAAATATGCTCGAGCGAAGTATTATTTCTCTAA 
GACCGGCGAAATGATTTACCCATTACCAGACCtTTTACCAAAA 

SEQ ID NO. 8108 
STRAIN CJB110 

AGCAAGCCTAATGTTGTTCAGTT AAATAATC 

AATATATTAACGATGAGAATCTAAAAAAACGTTACGAAGCTGAGGAGTTA 
CGCCGAAAAAATCGTTTAATGGGTTGGGTTCTTATTTTTGTCATGCTttt 
ATTTATTTTACCCACTTATAATTTAGTTAAGAGTTACAGAACTTTACAAG 
AACGTCGTCAAGAAGTTGTAAAATTAACGAAAGACTATCAGACATTAACT 
AATAGAACTGAGAACCAGAAGTTGCTAGCAAAACAACTAAAAAATCCAGA 
TTACGTTCAAAAATATGCTCGAGCTAAGTATTATTTCTCTAAGACCGGCG 
AAATGATTTACCCATTACCAGACCtTTTACCAAAA 

SEQ ID NO. 8109 
STRAIN 1169NT 

AGCAAGCCTAATGTTGTTCAGTTAAA 

TAATCAATATATTAACGATGAGAATCTAAAAAAACGTTACGAAGCTGAGG 
AGTTACGCCGAAAAAATCGTTTAATGGGTTGGGTTCTTATTTTTGTCATG 
CTTTTATTTATTTTACCCACTTATAATTTAGTTAAGAGTTACAGAACTTT 
ACAAGAACGTCGTCAAGAAGTTGTAAAATTAACGAAAGACTATCAGACAT 
TAACTAATAGAACTGAGAACCAGAAGTTACTAGCAAAACAACTAAAAAAT 
CCAGATTACGTTCAAAAATATGCTCGAGCTAAGTATTATTTCTCTAAGAC 
CGGCGAAATGATTTACCCATTACCAGACCtTTTACCAAAA 

SEQ ID NO. 8110 

STRAIN JM9130013 

AGCaAGCCTAATGTTGTTCAGTTAAA 
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TAATCAATATATTAACGATGAGAATCTAAAAAAACGTTACGAAGCTGAGG 
AGTTACGCCGAAAAAATCGTTTAATGGGTTGGGTTCTTATTTTTGTCATG 
CTTTTATTTATTTTACCCACTTATAATTTAGTTAAGAGTTACAGAACTTT 
ACAAGAACGTCGTCAAGAAGTTGTAAAATTAACGAAAGACTATCAGACAT 
TAACTAATAGAACTGAGAACCAGAAGTTACTAGCAAAACAACTAAAAAAT 
CCAGATTACGTTCAAAAATATGCTCGAGCGAAGTATTATTTCTCTAAGAC 
TGGCGAAATGATTTACCCATTACCAGACCtTTTACCAAAA 

SEQ ID NO. 8111 
STRAIN 2603 

agcaagcctaatgttgttcagttaaataatcaatatattaacgatgagaa 
tctaaaaaaacgttacgaagctgaggagttacgccgaaaaaatcgtttaa 
tgggttgggttcttatttttgtcatgcttttatttattttacccacttat 
aatttagttaagagttacagaactttacaagaacgtcgtcaagaagttgt 
aaaattaacgaaagactatcagacattaactaatagaactgagaaccaga 
agttgctagcaaaacaactaaaaaatccagattacgttcaaaaatatgct 
cgagctaagtattatttctctaagaccggcgaaatgatttacc.cattacc 
agaccttttaccaaaa 

SEQ ID NO. 8112 
STRAIN 090 ■ 

SKPNWQLNNQYINDENLKKRYEAEELRRKNRLMGWVLIFVMLLFILPTYNL 
VKSYRTLQERRQEVVKLTKDYQTLTNRTENQKLLAKQLKNPDYVQKYARAKYYFSKTGEM 
IYPLPDLLPK y 

SEQ ID NO. 8113 

STRAIN A909 

SKPNWQLNNQYINDENLKKRYEAEELRRKNRLMGWVLIFVMLLFILPTYNL 

VKSYRTLQERRQEVVKLTKDYQTLTNRTENQKLLAKQLKNPDYVQKYARAKYYFSKTGEM 

IYPLPD 

SEQ ID NO. 8114 

STRAIN H36B 

SKPNWQLNNQYINDENLKKRYEAEELRRKNRLMGWVLIFVMLLFILPTYNL 

VKSYRTLQERRQEWKLTKDYQTLTNRTENQKLLAKQLBCNPDYVQKYARAKYYFSKTGEM 

IYPLPDLLPK 

SEQ ID NO. 8115 

STRAIN 18RS21 

SKPNWQLNNQYINDENLKKRYEAEELRRKNRLMGWVLIFVMLLFILPTYNLVKSYRTLQ 
ERRQEVVKLTKDYQTLTNRTENQKLLAKQLKNPDYVQKYARAKYYFSKTGEMIYPLPDLL 
PK 

SEQ ID NO. 8116 

STRAIN M732 

SKPNWQLNNQYINDENLKKRYEAEELRRKNRLMGWVLIFVMLLFILPTYNL 

VKSYRTLQERRQEWKLTKDYQTLTNRTENQKLLAKQLKNPDYVQBCYARAKYYFSKTGEM 

IYPLPDLLPK 

SEQ ID NO. 8117 

STRAIN COH1 

SKPNWQLNNQYINDENLKKRYEAEELRRKNRLMGWVLIFVMLLFILPTYNLVK 

SYRTLQERRQEWKLTKDYQTLTNRTENQKLLAKQLKNPDYVQKYARAKYYFSKTGEMIY 

PLPDLLPK 

SEQ ID NO. 8118 

STRAIN M781 

SKPNWQLNNQYINDENLKKRYEAEELRRKNRLMGWVLIFVMLLFILPTYN 

LVKSYRTLQERRQEVVKLTKDYQTLTNRTENQKLLAKQLKNPDYVQKYARAKYYFSKTGE 

MIYPLPDLLPK 

SEQ ID NO. 8119 

STRAIN CJB110 

SKPNVVQLNNQYINDENLKKRYEAEELRRKNRLMGWVLIFVMLLFILPTYNLVK 
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SYRTLQERRQEVVKLTKDYQTLTNRTENQKLLAKQLKNPDYVQKYARAKYYFSKTGEMIY 
PLPDLLPK 

SEQ ZD NO. 8120 

STRAIN 1169NT 

SKPNWQLNNQYINDENLKKRYEAEELRRKNRLMGWVLIFVMLLFILPTYNL 

VKSYRTLQERRQEWKLTKDYQTLTNRTENQKLLAKQLKNPDYVQKYARAKYYFSKTGEM 

IYPLPDLLPK 

SEQ ID NO. 8121 

STRAIN JM9130013 

SKPNWQLNNQYINDENLKKRYEAEELRRKNRLMGWVLIFVMLLFILPTYNL 

VKSYRTLQERRQEWKLTKDYQTLTNRTENQKLLAKQLKNPDYVQKYARAKYYFSKTGEM 

IYPLPDLLPK 

SEQ ID NO. 8122 

STRAIN 2603 

SKPNWQLNNQYINDENLKI^YEAEELRRKNRLMGWVLIFVMLLFILPTYNLVKSYRTLQ 
ERRQEWKLTKDYQTLTNRTENQKLLAKQLKNPDYVQKYARAKYYFSKTGEMIYFLPDLL 
PK * * 

SEQ XD NO. 8201 
STRAIN 2603 

ATGAAAAATTTATTGTTAAAATGTAAGGATAAGAAGGTTAAAGCATTTACACTTTTAGAA 
TGTTTGGTAGCATTGGTTACAATCACAGGAGCTTTACTAGTTTATCAAGGACTGACAAAA 
TTGTTGGCTCAACAGATAGTAGTGATGTCTTCTTCCAGTCAGTCTGAATGGGTGTTATTA 
AcTCAGCAACTAAATGCAGAATTTGAAGGCGCTCATCTGGAATATTTAAGACAGAACAAA 
CTTTATTTACGTAAGCAAGATAAGATTGTAACCTTTGGCAAATCTAATAAAGATGATTTC 
CGTAAGACAGGTTATGATGGTCGAGGTTATCAACCAATGGTTTATGGGTTAGACAATTGT 
CAAATGAGTCAGACCAAAAGTATGGTAAAACTTGTTTTTTATTTTAAGGACGGGTTAAAA 
AGGACATTTTACTATGATTTTAAAGAAGAAACTTAA 

SEQ ID NO. 8202 

STRAIN 090 

AATTCGAAGGCGCTCACTTGGAATATTTAAGACAGAACAAACTTTATTTA 
CGTAAGCAAGATAAGATTGTAACCTTTGGCAAATCTAATAAAGATGATTT 
CCGTAAGACAGGTTATGATGGTCGAGGTTATCAACCAATGGTTTATGGGT 
TAGACAATTGTCAAATGAGTCAAACCAAAAGTATGGTAAAACTTGTTTTT 
TATTTTAAGGACGGGTTAAAAAGGACATTTTACTATGATTTTAAAGAAGA 
AACT 

SEQ ID NO. 8203 

STRAIN A909 

CAGAATTTGAAGGCGCTCATCTGGAATATTTAAGACAGAACAAACTTTAT 
TTACGTAAGCAAGATAAGATTGTAACCTTTGGCAAATCTAATAAAGATGA 
TTTCCGTAAGACAGGTTATGATGGTCGAGGTTATCAACCAATGGTTTATG 
GGTTAGACAATTGTCAAATGAGTCAGACCAAAAGTATGGTAAAACTTGTT 
TTTTATTTTAAGGACGGGTTAAAAAGGACATTTTACTATGATTTTAAAGA 
AGAAACT 

SEQ ID NO. 8204 

STRAIN H36B 

ATGCAGAATTTGAAGGCGCTCATCTGGAATATTTAAGACAGAACAAACTT 
TATTTACGTAAGCAAGATAAGATTGTAACCTTTGGCAAATCTAATAAAGA 
TGATTTCCGTAAGACAGGTTATGATGGTCGAGGTTATCAACCAATGGTTT 
ATGGGTTAGACAATTGTCAAATGAGTCAGACCAAAAGTATGGTAAAACTT 
GTTTTTTATTTTAAGGACGGGTTAAAAAGGACATTTTACTATGATTTTAA 
AGAAGAAACT 

SEQ ID NO. 8205 

STRAIN 18RS21 

AGAATTTGAAGGCGCTCATCTGGAATATTTAAGACAGAACAAACTTTATT 
TACGTAAGCAAGATAAGATTGTAACCTTTGGCAAATCTAATAAAGATGAT 
TTCCGTAAGACAGGTTATGATGGTCGAGGTTATCAACCAATGGTTTATGG 
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GTTAGACAATTGTCAAATGAGTCAGACCAAAAGTATGGTAAAACTTGTTT 
TTTATTTTAAGGACGGGTTAAAAAGGACATTTTACTATGATTTTAAAGAA 
GAAACT 

SEQ ID NO. 8206 

STRAIN M732 

CAGAATTCGAAGGCGCTCACTTGGAATATTTAAGACAGAACAAACTTTAT 
TTACGTAAGCAAGATAAGATTGTAACCTTTGGCAAATCTAATAAAGATGA 
TTTCCGTAAGACAGGTTATAATGGTCGAGGTTATCAACCAATGGTTTATG 
GGTTAGACAATTGTCAAATGAGTCAGACCAAAAGTATGGTAAAACTTGTT 
TTTTATTTTAAGGACGGGTTAAAAAGGACATTTTACTATGATTTTAAAGA 
AGAAACT 

SEQ ID NO. 8207 

STRAIN COM 

GAATTCGAAGGCGCTCACTTGGAATATTTAAGACAGAACAAACTTTATTT 
ACGTAAGCAAGATAAGATTGTAACCTTTGGCAAATCTAATAAAGATGATT 
TCCGTAAGACAGGTTATAATGGTCGAGGTTATCAACCAATGGTTTATGGG 
TTAGACAATTGTCAAATGAGTCAGACCAAAAGTATGGTAAAACTTGTTTT 
TTATTTTAAGGACGGGTTAAAAAGGACATTTTACTATGATTTTAAAGAAG 
AAACT 

SEQ ID NO. 8208 ' B 

STRAIN M781 

AGAATTCGAAGGCGCTCACTTGGAATATTTAAGACAGAACAAACTTTATT 
TACGTAAGCAAGATAAGATTGTAACCTTTGGCAAATCTAATAAAGATGAT 
TTCCGTAAGACAGGTTATAATGGTCGAGGTTATCAACCAATGGTTTATGG 
GTTAGACAATTGTCAAATGAGTCAGACCAAAAGTATGGTAAAACTTGTTT 
TTTATTTTAAGGACGGGTTAAAAAGGACATTTTACTATGATTTTAAAGAA 
GAAACT 

SEQ ID NO. 8209 

STRAIN CJB110 

GAATTCGAAGGCGCTCACTTGGAATATTTAAGACAGAACAAACTTTATTT 
ACGTAAGCAAGATAAGATTGTAACCTTTGGCAAATCTAATAAAGATGATT 
TCCGTAAGACAGGTTATGATGGTCGAGGTTATCAACCAATGGTTTATGGG 
TTAGACAATTGTCAAATGAGTCAAACCAAAAGTATGGTAAAACTTGTTTT 
TTATTTTAAGGACGGGTTAAAAAGGACATTTTACTATGATTTTAAAGAAG 
AAACT 

SEQ ID NO. 8210 
STRAIN 1169NT 

TCGAAGGCGCTCACTTGGAATATTTAAGACAGAACAAACTTTATTTACGT 
AAGCAAGATAAGATTGTAACCTTTGGCAAATCTAATAAAGATGATTTTCG 
TAAGACAGGTTATGATGGTCGAGGTTATCAACCAATGGTTTATGGGTTAG 
ACAATTGTCAAATGAGTCAAACCAAAAGTATGGTAAAACTTGTTTTTTAT 
TTTAAGGACGGGTTAAAAAGGACATTTTACTATGATTTTAAAGAAGAAAC 
T 

SEQ ID NO. 8211 

STRAIN JM9130013 

TGCAGAATTTGAAGGCGCTCATCTGGAATATTTAAGACAGAACAAACTTT 
ATTTACGTAAGCAAGATAAGATTGTAACCTTTGGCAAATCTAATAAAGAT 
GATTTCCGTAAGACAGGTTATGATGGTCGAGGTTATCAACCAATGGTTTA 
TGGGTTAGACAATTGTCAAATGAGTCAGACCAAAAGTATGGTAAAACTTG 
TTTTTTATTTTAAGGACGGGTTAAAAAGGACATTTTACTATGATTTTAAA 
GAAGAAACT 

SEQ ID NO. 8212 

STRAIN 2603 frame: 1 

MKN LLLKCKDKKVKAFTLLECLVALVT ITGALLV YQGLT KLLAQQI WMS S S SQS EWVLL 
TQQLNAEFEGAHLEYLRQNKLYLRKQDKIVTFGKSNKDDFRKTGYDGRGYQPMVYGLDNC 
QMSQTKSMVKLVFYFKDGLKRTFYYDFKEET . 
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SEQ ID NO. 8213 

STRAIN 090 frame: 3 

FEGAHLEYLRQNKLYLRKQDKIVTFGKSNKDDFRKTGYDGRGYQPMVYGLDNCQMSQTKS 
MVKLVFYFKDGLKRTFYYDFKEET 

SEQ ID NO. 8214 

STRAIN A909 frame: 3 

EFEGAHLEYLRQNKLYLRKQDKIVTFGKSNKDDFRKTGYDGRGYQPMVYGLDNCQMSQTK 
SMVKLVFYFKDGLKRTFYYDFKEET 

SEQ ID NO. 8215 

STRAIN H36B frame: 3 

AEFEGAHLEYLRQNKLYLRKQDKIVTFGKSNKDDFRKTGYDGRGYQPMVYGLDNCQMSQT 
KSMVKLVFYFKDGLKRTFYYDFKEET 

SEQ ID NO. 8216 

STRAIN 18RS21 frame: 2 

EFEGAHLEYLRQNKLYLRICQDKIVTFGKSNKDDFRKTGYDGRGYQPMVYGLDNCQMSQTK 
SMVKLVFYFKDGLKRTFYYDFKEET 

SEQ ID NO. 8217 ' 

STRAIN M732 frame: 3 

EFEGAHLEYLRQNKLYLRKQDKIVTFGKSNKDDFRKTGYNGRGYQPMVYGLDNCQMSQTK 
SMVKLVFYFKDGLKRTFYYDFKEET .... 

SEQ ID NO. 8218 

STRAIN COH1 frame: 1 

EFEGAHLEYLRQNKLYLRKQDKIVTFGKSNKDDFRKTGYNGRGYQPMVYGLDNCQMSQTK 
SMVKLVFYFKDGLKRTFYYDFKEET 

SEQ ID NO. 8219 

STRAIN M781 frame: 2 

EFEGAHLEYLRQNKLYLRKQDKIVTFGKSNKDDFRKTGYNGRGYQPMVYGLDNCQMSQTK 
SMVKLVFYFKDGLKRTFYYDFKEET 

SEQ ID NO. 8220 

STRAIN CJB110 frame: 1 

EFEGAHLEYLRQNKLYLRKQDKIVTFGKSNKDDFRKTGYDGRGYQPMVYGLDNCQMSQTK 
SMVKLVFYFKDGLKRTFYYDFKEET 

SEQ ID NO. 8221 

STRAIN 1169NT frame: 3 

EGAHLEYLRQNKLYLRKQDKIVTFGKSNKDDFRKTGYDGRGYQPMVYGLDNCQMSQTKSM 
VKLVFYFKDGLKRTFYYDFKEET 

SEQ ID NO. 8222 

STRAIN JM9130013 frame: 2 

AEFEGAHLEYLRQNKLYLRKQDKIVTFGKSNKDDFRKTGYDGRGYQPMVYGLDNCQMSQT 
KSMVKLVFYFKDGLKRT FYYDFKEET 

SEQ ID NO< 8301 
STRAIN 2603 

atgaaaaagattcgattatcaaagtttattaaaatgattgttgttattttgtttttaatt 
agtgtagcagctagtttttattttttccacgttgcccaagttcgagatgataaatccttt 
atttcaaatggtcaacgtaagcctggaaactctttatatgcttatgataaatcctttgat 
aagctattaaagcaaaaaatagaaatgacaaaccaaaatataaagcaagttgcttggtat 
gttcctgctgttaagaaaactcataagacagctgttgtcgttcatggttttgcgaatagc 
aaagagaatatgaaggcatatggttggctgtttcataagttaggatacaatgttcttatg 
cctgacaatattgcacatggtgaaagtcatgggcagttgataggctatggctggaacgac 
cgcgagaacattatcaaatggacagaaatgatagttgataagaatccatcaagccaaatt 
actttatttggtgtttcaatgggtggagcaacagtcatgatggctagtggtgaaaaatta 
cctagtcaggttgttaatatcattgaagattgcggttattctagtgtttgggatgaatta 
aaatttcaggctaaagagatgtatggtttaccagccttcccactcttatatgaagtttca 
acaatttctaaaatcagagcaggtttttcgtatggacaagcaagtagtgtcgaacaattg 
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aaaaagaataatttaccagccctctttattcatggtgataaggataattttgttccaaca 
agtatggtttatgacaactataaagctacagcaggtaagaaagagctttatattgtaaaa 
ggggcaaaacatgcgaaatcttttgaaacagagccagaaaaatatgagaaacgtatctct 
agttttttgaaaaaatatgaaaaa 

SEQ ID NO. 8302 
STRAIN 090 

GCTAGTTTTTATTTTTTCCACGTTGCCCAAGTTCG 

AGATGATAAATCCTTTATTTCAAATGGTCAACGTAAGCCTGGAAACTCTT 
TATATGCTTATGATAAATCCTTTGATAAGCTATTAAAGCAAAAAATAGAA 
ATGACAAACCAAAATATAAAGCAAGTTGCTTGGTATGTTCCTGCTGCTAA 
GAAAACTCATAAGACAGCTGTTGTCGTTCATGGTTTTGCGAATAgCAAAG 
AGAATATGAAGGCATATGGTTGGCTGTTTCATAAGTTAGGATACAATGTT 
cTTAT(3CCTGACAATATTGCACATGGtGAAAGTCATGGGCAGTTGATAGG 
CTATGGCTGGAACGACCGCGAGAACATTATCaAATGGACAGAAATGATAG 
TTGATAAGAATCCATCAAGCCAAATTACTTtaTTTGGTGTTTCAATGGGT 
GGAGCAACAGTCATGATGGCTAGTGGTGAAAAATTACCTAGTCAGGTTGT . 
TAATATCATTGAAGATTGCGGTTATTCTAGTGTTTGGGATGAATTAAAAT 
TTCAGGCTAAAGAGATGTATGGTTTACCAGCCTTCCCACTCTTATATGAA 
GTTTCAACAATTTCTAAAATCAGAGCAGGTTTTTCGTATGGACAAGCAAG 
TAGTGTCGAACAATTGAAAAAGAATAATTTACCAGCCCTCTTTATTCATG 
GTGATAAGGATAATTTTGTTCGAACAAGTATGGTTTATGACAACTATAAA 
# GCTACAGCAGGTAAGAAAGAGCTTTATATTGTAAAAGGGGCAAAACATGC 
GAAATCTTTTGAAACAGAGCCAGAAAAATATGAGAAACGTATCTCTAGTT 
TTTTGAAAAAATATGAAAAA 

SEQ ID NO. 8303 
STRAIN A909 

AATCCTTTATTTCAAATGGTCAACGTAAGCCTGGAAACTCTTTATATGCT 
TATGATAAATCCTTTGATAAGCTATTAAAGCAAAAAATAGAAATGACAAA 
CCAAAATATAAAGCAAGTTGCTTGGTATGTTCCTGCTGCTAAGAAAACTC 
ATAAGACAGCTGTTGTCGTTCATGGTTTTGCGAATAGCAAAGAGAATATG 
AAGGCATATGGTTGGCTGTTTCATAAGTTAGGATACAATGTTCTTATGCC 
TGACAACATTGCACATGGTGAAAGTCATGGGCAGTTGATAGGCTATGGCT 
GGAACGACCGCGAGAACATTATCAAATGGACAGAAATGATAGTTGATAAG 
AATTCATCAAGCCAAATTACTTTATTTGGTGTTTCAATGGGTGGAGCAAC 
AGTCATGATGGCTAGTGGTGAAAAATTACCTAGTCAGGTTGTTAATATCA 
TTGAAGAtTGCGGTTATTCTGGTGTTTGGGATGAATTAAAATTTCAGGCT 
AAAGAGATGTATGGTTTACCAGCCTTCCCACTCTTATATGAAGTTTCAAC 
AATTTCTAAAATCAGAGCAGGTTTTTCGTATGGACAAgCAAGTAGTGTCG 
AACAATTGAAAAAGAATAATTTACCAGCCCTCTTTATTCATGGTGATAAG 
GATAATTTTGTTCCAACAaGTATGGTTTATGACAACTATAAAGCTACAGC 
AGGTAAGAAAGAGCTTTATATTGTAAAAGGGGCAAAACATGCGAAATCTT 
TTGAAaCAGAGCCAGAAAAATATGAGAAACGTATCTCTAGTTTTTTGAAA 
AAATATGAAAAA 

SEQ ID NO. 8304 

STRAIN H36B 

AGTTTTTATTTTTTCCACGTTGCCCAAGTTCGAGATGATAAATCCTTTAT 
TTCAAATGGTCAACGTAAGCCTGGAAACTCTTTATATGCTTATGATAAAT 
CCTTTGATAAGCTATTAAAGCAAAAAATAGAAATGACAAACCAAAATATA 
AAGCAAGTTGCTTGGTATGTTCCTGCTGCTAAGAAAACTCATAAGACAGC 
TGTTGTCGTTCATGGTTTTGCGAATAGCAAAGAGAATATGAAGGCATATG 
GTTGGCTGTTTCATAAGTTAGGATACAATGTTcTTATGCCTGACAACATT 
GCACATGGTGAAAGTCATGGGCAGTTGATAGGCTATGGCTGGAACGACCG 
CGAGAACATTATCAAATGGACAGAAATGATAGTTGATAAGAATTCATCAA 
GCCAAATTACTTTATTTGGTGTTTCAATGGGTGGAGCAACAGTCATGATG 
GCTAGTGGTGAAAAATTACCTAGTCAGGTTGTTAATATCATTGAAGATTG 
CGGTTATTCtGGTGTTTGGGATGAATTAAAATTTCAGGCTAAAGAGATGT 
ATGGTTTACCAGCCTTCCCACTCTTATATGAAGTTTCAACAATTTCTAAA 
ATCAGAGCAGGTTTTTCGTATGGACAAgCAAGTAGTGTCGAACAATTGAA 
AAAGAATAATTTACCAGCCCTCTTTATTCATGGTGATAAGGATAATTTTG 
TTCCAACAAGTATGGTTTATGACAACTATAAAGCTACAGCAGGTAAGAAA 
GAGCTTTATATTGTAAAAGGGGCAAAACATGCGAAATCTTTTGAAACAGA 
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GCCAGAAAAATATGAGAAACGTATCTCTAGTTTTTTGAAAAAaTATgAAA 
AA 

SEQ ID NO. 8305 

STRAIN 18RS21 

GCTAGTTTTTATTTTTTCCACGTTGCCCAAGTTCGA 

GATGATAAATCCTTTATTTCAAATGGTCAACGTAAGCCTGGAAACTCTTT 

ATATGCTTATGATAAATCCTTTGATAAGCTATTAAAGCAAAAAATAGAAA 

TGACAAACCAAAATATAAAGCAAGTTGCTTGGTATGTTCCTGCTGTTAAG 

AAAACTCATAAGACAGCTGTTGTCGTTCATGGTTTTGCGAATAGCAAAGA 

GAATATGAAGGCATATGGTTGGCTGTTTCATAAGTTAGGATACAATGTTC 

TTATGCCTGACAATATTGCACATGGTGAAAGTCATGGGCAGTTGATAGGC 

TATGGCTGGAACGACCGCGAGAACATTATCAAATGGACAGAAATGATAGT 

TGATAAGAATCCATCAAGCCAAATTACTTTATTTGGTGTTTCAATGGGTG 

GAGCAACAGTCATGATGGCTAGTGGTGAAAAATTACCTAGTCAGGTTGTT 

AATATCATTGAAGATTGCGGTTATTcTAGTGTTTGGGATgAATTAAAATT 

TCAGGCTAAAGAGATGTATGGTTTACCAGCCTTCCCACTCTTATATGAAG 

TTTCAACAATTTCTAAAATCAGAGCAGGTTTTTCG^PATGGACAAgCAAGT 

AGTGTCGAACAATTGAAAAAGAATAATTTACCAGCCCTC^TTATTfcATGG 

TGATAAGGATAATTTTGTTCCAACAAGTATGGTTTATGACAACTATAAAG 

CTACAGCAGGTAAGAAAGAGCTTTATATTGTAAAAGGGGCAAAACATGCG 

AAATCTTTTGAAaCAGAGCCAGAAAAATATGAGAAACGTATCTCTAGTTT 

TTTGAAAAAATATGAAAAA 

•m 

SEQ ID NO. 8306 

STRAIN M732 

GCTAGTTTTTATTTTTTCCACGTTGCCCAAGTTCGA 

GATGATAAATCCTTTATTT CAAATGGTCAACGTAAGCCTGGAAACT CTTT 

AT ATGCTT ATGATAAAT CCTTT GATAAGCTAT T AAAGC AAAAAATAGAAA 

TGACAAACCAAAATATAAAGCAAGTTGCTTGGTATGTTCCTGCTGCTAAG 

AAAACTCATAAGACAGTTGTTGTCGTTCATGGTTTTGCGAATAGCAAAGA 

GAATATGAAGGCATATGGTTGGCTGTTTCATAAGTTAGGATACAATGTTC 

TTATGCCTGACAACATTGCACATGGTGAAAGTCATGGGCAGTTGATAGGC 

TATGGCTGGAACGACCGCGAGAACATTATCAAATGGACAGAAATGATAGT 

GGATAAGAATCCATCAAGCCAAATTaCTTTATTTGGTGTTTCAATGGGTG 

GAGCAACAGTCATGATGGCTAGTGGTGAAAAATTACCTAGTCAGGTTGTT 

AATATCATTGAAGATTGTGGTTATTCTAGTGTTTGGGATGAATTAAAATT 

TCAGGCTAAAGAGATGTATGGTTTACCAGCCTTCCCACTCTTATATGAAG 

TTTCAACAATTTCTAAAATCAGAGCAGGTTTTTCGTATGGACAAgCAAGT 

AGTGTCGAACAATTGAAAAAGAATAATTTACCAGCCCTcTTTATTCATGG 

TGATAAGGATAATTTTGTTCCAACAAGTATGGTTTATGACAACTATAAAG 

CTACAGCAGGTAAGAAAGAGCTTTATATTGTAAAAGGGGCAAAACATGCG 

AAATCTTTTGAAACAGAGCCAGAAAAATATGAGAAACGTATCTCTAGTTT 

TTTGAAAAAATATGAAAAA 

SEQ ID NO. 8307 

STRAIN COH1 

GCTAGTTTTTATTTTTTCCACGTTGCCCAAGTTC 

GAGATGATAAATCCTTTATTTCAAATGGTCAACGTAAGCCTGGAAACTCT 
TTATATGCTTATGATAAATCCTTTGATAAGCTATTAAAGCAAAAAATAGA 
AATGaCAAACCAAAATATAAAGCAAGTTGCTTGGTATGTTCCTGCTGCTA 
AGAAAACTCATAAGACAGTTGTTGTCGTTCATGGTTTTGCGAATAGCAAA 
GAGAATATGAAGGCATATGGTTGGCTGTTTCATAAGTTAGGATACAATGT 
TCTTATGCCTGACAACATTGCACATGGTGAAAGTCATGGGCAGTTGATAG 
GCTATGGCTGGAACGACCGCGAGAACATTATCAAATGGACAGAAATGATA 
GTGGATAAGAATCCATCAAGCCAAATTACTTTATTTGGTGTTTCAATGGG 
TGGAGCAACAGTCATGATGGCTAGTGGTGAAAAATTACCTAGTCAGGTTG 
TTAATATCATTGAAGATTGTGGTTATTcTAGTGTTTGGGATgAATTAAAA 
TTTCAGGCTAAAGAGATGTATGGTTTACCAGCCTTCCCACTCTTATATGA 
AGTTTCAACAATTTCTAAAATCAGAGCAGGTTTTTCGTATGGACAAGCAA 
GTAGTGTCGAACAATTGAAAAAGAATAATTTACCAGCCCTcTTTATTCAT 
GGTGATAAGGATAATTTTGTTCCAACAaGTATGGTTTATGACAACTATAA 
AGCTACAGCAGGTAAGAAAGAGCTTTATATTGTAAAAGGGGCAAAACATG 
CGAAATCTTTTGAAaCAGAGCCAGAAAAATATGAGAAACGTATCTCTAGT 
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TTTTTGAAAAAATATGAAAAA 

SEQ ID NO. 8308 

STRAIN M781 

GCTAGTTTTTATTTTTTCCACGTTGCCCAAGTTCG 

AGATGATAAATCCTTTATTTCAAATGGTCAACGTAAGCCTGGAAACTCTT 
TATATGCTTATGATAAATCCTTTGATAAGCTATTAAAGCAAAAAATAGAA 
ATGACAAACCT^AAATATAAAGCAAGTTGCTTGGTATGTTCCTGCTGCTAA 
GAAAACTCATAAGACAGTTGTTGTCGTTCATGGTTTTGCGAATAGCAAAG 
AGAATATGAAGGCATATGGTTGGCTGTTTCATAAGTTAGGATACAATGTT 
CTTATGCCTGACAACATTGCACATGGTGAAAGTCATGGGCAGTTGATAGG 
CTATGGCTGGAACGACCGCGAGAACATTATCAAATGGACAGAAATGATAG 
TGGATAAGAATCCATCAAGCCAAATTaCTTTATTTGGTGTTTCAATGGGT 
GGAGCAACAGTCATGATGGCTAGTGGTGAAAAATTACCTAGTCAGGTTGT 
TAATATCATTGAAGATTGTGGTTATTcTAGTGTTTGGGATgAATTAAAAT 
TTCAGGcTAAAGAGATGTATGGTTTACCAGCCTTCCCACTcTTATATGaA 
GTTTCAacAATTTcTAAAATcAgAGCAGGTTTTTCGTATGGACaAgCAAG 
TAgTGTCGAACAATtGAAAAAGAATAATTTACCAGCCCTcTTTATTCATG 
GTGATAAGGATAATTTTGTTCCAACAaGTATGGTTTATGaCAaCTATAAA 
GCTACAGCAGGTAAGAAAGAGCTTTATATTGTAAAAGGGGCAAAACATGC 
GAAATCTTTTGAAaCAGAGCCAGAaaAATATGAGAAACGTATCTCTAGTT 
TTTTfcAAAAAATATGAAAAA 

SEQ ZD NO. 8309 

STRAIN CJB110 

GCTAGTTTTTATTTTTTCCACGTTGCCCAAGTTCGAG 

ATGATAAATCCTTTATTTCAAATGGTCAACGTAAGCCTGGAAACTCTTTA 

TATGCTTATGATAAATCCTTTGATAAGCTATTAAAGCAAAAAATAGAAAT 

GACAAACCAAAATATAAAGCAAGTTGCTTGGTATGTTCCTGCTGCTAAGA 

AAACTCATAAGACAGCTGTTGTCGTTCATGGTTTTGCGAATAGCAAAGAG 

AATATGAAGGCATATGGTTGGCTGTTTCATAAGTTAGGATACAATGTTcT 

TATGCCTGACAATATTGCACATGGTGAAAGTCATGGGCAGTTGATAGGCT 

ATGGCTGGAACGACCGCGAGAACATTATCAAATGGACAGAAATGATAGTT 

GATAAGAATCCATCAAGCCAAATTACTTTATTTGGTGTTTCAATGGGTGG 

AGCAACAGTCATGATGGCTAGTGGTGAAAAATTACCTAGTCAGGTTGTTA 

ATATCATTGAAGATTGCGGTTATTcTAGTGTTTGGGATgAATTAAAATTT 

CAGGCTAAAGAGATGTATGGTTTACCAGCCTTCCCACTCTTATATGAAGT 

TTCAACAATTTCTAAAATCAGAGCAGGTTTTTCGTATGGACAAgCAAGTA 

gTGTCGAACAATTGAAAAAGAATAATTTACCAGCCCTcTTTATTCATGGT 

GATAAGGATAATTTTGTTCCAACAAGTATGGTTTATGACAACTATAAAGC 

TACAGCAGGTAAGAAAGAGCTTTATATTGTAAAAGGGGCAAAACATGCGA 

AATCTTTTGAAACAGAGCCAGAAAAATATGAGAAACGTATCTCTAGTTTT 

TTGAAAAAATATGAAAAA 

SEQ ID NO. 8310 

STRAIN 1169NT , 
GCTAGTTTTTATTTTTTCCACGTTGCCCAAGTTCGA 

GATGATAAATCCTTTATTTCAAATGGTCAACGTAAGCCTGGAAACTCTTT 
ATATGCTTATGATAAATCCTTTGATAAGCTATTAAAGCAAAAAATAGAAA 
TGACAAACCaAAATATAAAGCAAGTTGCTTGGTATGTTCCTGCTGCTAAG 
AAAACTCATAAGACAGCTGTTGTCGTTCATGGTTTTGCGAAtAGCAAAGA 
gAATATGAAGGCATATGGTTGGCTGTTTCATAAGTTAGGATACAATGTTc 
TTATACCTGACAATATTGCACATGGTGAAAGTCATGGGCAGTTGATAGGC 
TATGGCTGGAACGACCGCGAGAACATTATCAAATGGACAGAAATGATAGT 
TGATAAGAATCCATCAAGCCAAATTACTTTATTTGGTGTTTCAATGGGTG 
GAGCAACAGTCATGATGGCTAGTGGTGAAAAATTACCTAGTCAGGTTGTT 
AATATCATTGAAGATTgCGGTTATTcTAGTGTTTGGGATgAATTAAAATT 
TCAGGCTAaAGAGATGTATGGTTTaCCAGCCTTCCCACTcTTATATGAAG 
TTTCAACAATTTCTAAAATCAGAGCAGGTTTTTCGTATGGACAAGCAAGT 
AGTGTAGAACAATTGAAAAAGAATAATTTACCAGCCCTCTTTATTCATGG 
TGATAAGGATAATTTTGTTCCAACAAGTATGGTTTATGACAACTATAAAG 
CTACAGCAGGTAAGAAAGAGCTTTATATTGTAAAAGGGGCAAAACATGCG 

AAATCTTTTGAAaCAGAGCCAGAAAAATATGAGAAACGTATCTCTAGTTT 
TTTGAAAAAATATGAAAAA 
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SEQ ID NO. 8311 

STRAIN JM9130013 

GCTAGTTTTTATTTTTTCCACGTTGCCCAA<3TTCG 

AGATGATAAATCCTTTATTTCAAATGGTCAACGTAAGCCTGGAAACTCTT 

TATATGCTTATGATAAATCCTTTGATAAGCTATTAAAGCAAAAAATAGAA 

ATGaCAAACCAAAATATAAAGCAAGTTGCTTGGTATGTTCCTGCTGTTAA 

GAAAACTCATAAGACAGCTGTTGTCGTTCATGGTTTTGCGAATAGCAAAG 

AGAATATGAAGGCATATGGTTGGCTGTTTCATAAGTTAGGATACAATGTT 

CTTATGCCTGACAATATTGCACATGGTGAAAGTCATGGGCAGTTGATAGG 

CTATGGCTGGAACGACCGCGAGAACATTATCaAATGGACAGAAATGATAG 

TTGATAAGAATCCATCAAGCCAAATTaCTTTATTTGGTGTTTCAATGGGT 

GGAGCAACAGTCATGATGGCTAGTGGTGAAAAATTACCTAGTCAGGTTGT 

TAATATCATTGAAGATTGCGGTTATTcTAGTGTTTGGGATgAATTAAAAT 

TTCAGGCTAAAGAGATGTATGGTTTACCAGCCTTCCCACTCTTATATGAA 

GTTTCAACAATTTCTAAAATCAGAGCAGGTTTTTCGTATGGACAAGCAAG 

TAGTGTCGAACAATTGAAAAAGAATAATTTACCAGCCCTCTTTATTCATG 

GTGATAAGGATT^ATTTTGTTCCAACAAGTATGGTTTATGACAACTATAAA 

GCTACAGCAGGTAAGAAAGAGCTTTATATTGTAAAAGGGGCAAAACATGC 

GAAATCTTTTGAAACAGAGCCAGAAAAATATGAGAAACGTATCTCTAGT'T . * 

TTTTGAAAAAATATGAAAAA 

SEQ ID NO. 8312 
STRAIN 2603 frame: 1 

MKKIRLSKFIKMIVVILFLISVAASFYFFHVAQVRDDKSFISNGQRKPGNSLYAYDKSFD 
KLLKQKIEMTNQN IKQVAWYV PAVKKTHKTAVVVHG FANS KENMKAYGWL FHKLGYNVLM 
PDNIAHGESHGQLIGYGWNDRENIIKWTEMIVDKNPSSQITLFGVSMGGATVMMASGEKL 
PSQWNI IEDCGYS S VWDELKFQAKEMYGLPAFPLLYEVS T I S KI RAGFS YGQAS SVEQL 
KKNNLPALFIHGDKDNFVPTSMVYDNYKATAGKKELYIVKGAKHAK'SFETEPEKYEKRIS 
SFLKKYEK 

SEQ ID NO. 8313 

STRAIN 090 frame: 1 

AS FYFFHVAQVRDDKS FI SNGQRKPGNSLYAYDKS FDKLLKQKIEMTNQNIKQVAWYVPA 
AKKTHKTAVWHGFANSKENMKAYGWLFHKLGYNVLMPDNIAHGESHGQLIGYGWNDREN 
IIKWTEMIVDKNPSSQITLFGVSMGGATVMMASGEKLPSQWNIIEDCGYSSVWDELKFQ 
AKEMYGLPAFPLLYEVSTISKIRAGFSYGQASSVEQLKKNNLPALFIHGDKDNFVPTSMV 
YDNYKATAGKKELYIVKGAKHAKSFETEPEKYEKRISSFLKKYEK 

SEQ ID NO. 8314 

STRAIN A909 frame: 3 

S FI SNGQRKPGNSLYAYDKS FDKLLKQKIEMTNQN IKQVAWYVPAAKKTHKTAVWHGFA 
NSKENMKAYGWLFHKLGYNVLMPDNIAHGESHGQLIGYGWNDRENIIKWTEMIVDKNSSS 
QITLFGVSMGGATVMMASGEKLPSQWNIIEDCGYSGVWDELKFQAKEMYGLPAFPLLYE 
VSTISKIRAGFSYGQAS SVEQLKKNNLPALFIHGDKDNFVPTSMVYDNYKATAGKKELYI 
VKGAKHAKS FETEPEKYEKRI SS FLKKYEK 

SEQ ID NO. 8315 

STRAIN H36B frame: 1 

S FYFFHVAQVRDDKS FI SNGQRKPGNSLYAYDKS FDKLLKQKIEMTNQN I KQVAWYVPAA 
KKTHKTAVWHGFANSKENMKAYGWLFHKLGYNVLMPDNIAHGESHGQLIGYGWNDRENI 
IKWTEMIVDKNSSSQITLFGVSMGGATVMMASGEKLPSQVVNIIEDCGYSGVWDELKFQA 
KEMYGLPAFPLLYEVSTISKIRAGFS YGQAS SVEQLKKNNLPALFIHGDKDNFVPTSMVY 
DNYKATAGKKELY I VKGAKHAKS FETEPEKYEKRISSFLKKYEK 

SEQ ID NO. 8316 

STRAIN 18RS21 frame: 1 

AS FYFFHVAQVRDDKS FI SNGQRKPGNSLYAYDKS FDKLLKQKIEMTNQNIKQVAWYVPA 
VKKTHKTAVWHGFANS KENMKAYGWL FHKLGYNVLMPDN I AHGESHGQL I GYGWNDREN 
IIKWTEMIVDKNPSSQITLFGVSMGGATVMMASGEKLPSQWNIIEDCGYSSVWDELKFQ 
AKEMYGLPAFPLLYEVSTISKIRAGFSYGQASSVEQLKKNNLPALFIHGDKDNFVPTSMV 
YDNYKATAGKKELY I VKGAKHAKS FETEPEKYEKRISSFLKKYEK 

SEQ ID NO. 8317 
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STRAIN M732 frame: 1 

AS FYFFHVAQVRD DKS FI SNGQRK PGNSL YAYDKS FDKLLKQKIEMTNQN IKQVAW YVPA 
AKKTHKTVVWHGFANSKENMKAYGWLFHKLGYNVLMPDNIAHGESHGQLIGYGWNDREN 
IIKWTEMIVDKNPSSQITLFGVSMGGATVMMASGEKLPSQVVNIIEDCGYSSVWDELKFQ 
AKEMYGLPAFPLLYEVSTISKIRAGFSYGQASSVEQLKKNNLPALFIHGDKDNFVPTSMV 
YDNYKATAGKKELYIVKGAKHAKS FETE PEKYEKRI S S FLKKYEK 

SEQ ID NO. 8318 

STRAIN COH1 frame: 1 

AS FYFFHVAQVRD DKS FI SNGQRKPGNS L YAYDKS FDKLLKQKIEMTNQN I KQVAWYV PA 
AKKTHKTVVVVHGFANSKENMKAYGWLFHKLGYNVLMPDNIAHGESHGQLIGYGWNDREN 
IIKWTEMIVDKNPSSQITLFGVSMGGATVMMASGEKLPSQWNIIEDCGYSSVWDELKFQ 
AKEMYGLPAFPLLYEVSTISKIRAGFSYGQASSVEQLKKNNLPALFIHGDKDNFVPTSMV 
YDNYKATAGKKELYIVKGAKHAKS FETE PEKYEKRI SS FLKKYEK 

SEQ ID NO. 8319 

STRAIN M781 frame: 1 

AS FYFFHVAQVRDDKS FI SNGQRKPGNS L YAYDKS FDKLLKQKIEMTNQN I KQVAWYV PA 
AKKTHKTVVVVHGFANSKENMi^YGWLFHKLGYNVLMPDNIAHGESHGQLIGYGWNDREN 
IIKWTEMIVDKNPSSQITLFGVSMGC^TVMMASGEiq^PSQVVNIIEDCGYSSVWDELKFQ 
AKEMYGLPAFPXiLYEVSTISKIRAGFSYGQASSVEQLKKNNLPALFIHGDI^DNFVPTSMV 
YDNYKATAGKKELYI VKGAKHAKS FETEPEKYEKRI S S FLKKYEK 

SEQ ID NO. 8320 

STRAIN CJB110 framej 1 

AS FYFFHVAQVRDDKS FI SNGQRKPGNS L YAYDKS FDKLLKQKIEMTNQNIKQVAWYVPA 
AKKTHKTAVWHGFl^SBCENMICAYGWLFHKLGYNVLMPD^IAHGESHGQLIGYGWNDREN 
IIKWTEMIVDKNPSSQITLFGVSMGGATVMMASGEKLPSQVVNIIEDCGYSSVWDELKFQ' 
AKEMYGLPAFPLLYEVSTISKIRAGFSYGQASSVEQLKKNNLPALFIHGDKDNFVPTSMV 
YDNYKATAGKKELYIVKGAKHAKS FETE PEKYEKRI S S FLKKYEK 

SEQ 3D NO. 8321 

STRAIN 1169NT frame: 1 

AS FYFFHVAQVRDDKS FI SNGQRKPGNS L YAYDKS FDKLLKQKIEMTNQNIKQVAWYVPA 
AKKTHKTAVWHGFANSKENMKAYGWLFHICLGYNVLIPDNIAHGESHGQLIGYGWNDREN 
IIKWTEMIVDKNPSSQITLFGVSMGGATVMMASGEKLPSQWNIIEDCGYSSVWDELKFQ 
AKEMYGL PAFPLLYEVSTI SKI RAGFS YGQAS SVEQLKKNNLPALFIHGDKDNFVPTSMV 
YDNYKATAGKKELYIVKGAKHAKS FETE PEKYEKRI S S FLKKYEK 

SEQ ID NO. 8322 

STRAIN JM9130013 frame: 1 

AS FYFFHVAQVRDDKS FI SNGQRKPGNS LYAYDKS FDKLLKQKIEMTNQNIKQVAWYVPA 
VKKTHKTAVVVHGFANSKENMKAYGWLFHKLGYNVLMPDNIAHGESHGQLIGYGWNDREN 
IIKWTEMIVDKNPSSQITLFGVSMGGATVMMASGEKLPSQWNIIEDCGYSSVWDELKFQ 
AKEMYGLPAFPLLYEVSTISKIRAGFSYGQASSVEQLKKNNLPALFIHGDKDNFVPTSMV 
YDN YKATAGKKELY I VKGAKHAKS FETE PEKYEKRI S S FLKKYEK 

SEQ XD NO. 8401 
STRAIN 2603 

ATGATGAAAGTTTTAGCCTTTGATACTTCAAGCAAAGCACTATCAGTGGCTGTACTAAAC 
AATATGGAATGTTTAGCGACTGTCACTATCAATATCAAAAAGAATCATAGCATTAATTTG 
ATGCCAGCCATTGATTTTTTAATGCAATCAATTGATTTAGAACCTCAAGATTTGGACCGT 
ATCGTAGTAGCAGAGGGTCCAGGATCTTATACGGGCTTACGTGTAGCTGTTGCTACAGCA 
AAAATGCTAGCTTATACGCTTAAGATTGACTTAGTTGGAGTATCTAGCCTGTACGCTTTA 
ACAAATGGATTTTCAGAAAATGATTTATTGGTACCACTTATAGATGCACGACGTAATAAT 
GTTTATGTTGGTTTCTATCAAAATGGTGATACTGTTAAACCAGACTGTCACACTTCTCTT 
GAAGAAGTCTTACAAGAGGTGGGGAATAAAGCCAATGTTCATTTTGTCGGAGAGGTTGCA 
GCATTTTTTGATCAGATTAAGAAAGCCTTACCACATGCTAAAATTACAGAAACTTTACCT 
TGTGCAGTAGCAATTGGGCGCAAAGGACAAAAAATGAAAAGCGTTAATGTAGATGCGTTT 
GTTCCACGATACTTAAAACGTGTTGAAGCTGAGGAAAATTGGTTAAAAAACCACTGTGAA 
ACGAATACAGAAGAATATATTAAGAGAGTT 

SEQ XD NO. 8402 

STRAIN 090 
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AAAGTTTTAGCCTTTGATACTTCAAGCAAAGCACTATCAGTGGCTGTACT 
AAACAATATGGAATGTTTAGCGACTGTCACTaTCAATATCAAAAAGAATC 
ATAGCATTAATTTGATGCCAGCCATTGATTTTTTAATGCAATCAATTGAT 
TTAGAACCTCAAGATTTGGACCGTATCGTAGTGGCAGAGGGTCCAGGATC 
TTATACGGGCTTACGTGTAGCTGTTGCTACAGCAAAAATGCTAGCTTATA 
CGCTTAAGATTGACTTAGTTGGAGTATCTAGCCTGTACGCTTTAACAAAT 
GGATTTTCAGAAAATGATTTGTTGGTACCACTTATAGATGCACGACGTAA 
CAATGTTTATGTTGGTTTCTATCAAAATGGTGATACTGTTAAACCAgACT 
GTCACACTTCTCTTGAAGAAGTCTTAC7VAGAGGTGGGGAATAAAGCCAAT 
GTTCATTTTGTCGGAGAGGTTGCAGCATTTTTTGATCAGATTAAgAAAGC 
CTTACCACATGCTAAAATTACAGA7\ACTTTACCTTGTGCAGTGGCAATTG 
GGCGCAAAGGACAAAAAATGGAAAGCGTTAATGTAGATGCGTTTGTTCCA 
CGATACTTAAAACGAGTTGAAGCTGAGGAAAATTGGTTAAAAAACCACTG 
TGAAACGAAT 

SEQ ID NO. 8403 

STRAIN A909 

AAAGTTTTAGCCTTTGATACTTCAAGCAAAGCACTATCAG 
TGGCTGTACTAAACAATATGGAATGTTTAGCGACTGTCACTATCAATATC 
AAAAAGAATCATAGCATTAATTTGATGCCAGCCATTGATTTTTTAATGCA 
ATCAATTGATTTAGAACCTCAAGATTTGGACCGTATCGTAGTAGCAGAGG 

gtccaggatcttatacgggcttacgtgtagctgttgctacagcaaaaatg" 

CTAGCTTATACGCTTAAGATTGACTTAGTTGGAGTATCTAGCCTGTACGC 
TTTAACAAATGGATTTTCAGAAAATGATTTATTGGTACCACTTATAGATG 
CACGACGTAACAATGTTTATGTTGGTTTCTATCAAAATGGAGATACTGTT. 
AAACCAGACTGTCACACTTCTCTTGAAGAAGTCTTACAAGAGGTGGGGAA 
TAAAGCCAATGTTCATTTTGTCGGAgAGGTTGCAgCATTTGTTGACCAGA 
tTAAgAAAGTTTTACCACATGCTAAAATTACAGAAACTTTACCTTGTGCA 
GtGGCAATTGGGCGCAAAGGACAAAAAATGAAAAGGGTTAATGTAGATGC 
GTTTGTTCCACGATACTTAAAACGTGTTGAAGCTGAGGAAAATTGGTTAA 
GAAACCACTGTGAAACGAAT 

SEQ XD NO. 8404 

STRAIN H36B 

AAAGTTTTAGCCTTTGATACTTCAAGCAAAGCACTATCA 

GTGGCTGTACTAAACAATATGGAATGTTTAGCGACTGTCACTATCAATAT 

CAAAAAGAATCATAGCATTAATTTGATGCCAGCCATTGATTTTTTAATGC 

AATCAATTGATTTAGAACCTCAAGATTTGGACCGTATCGTAGTAGCAGAG 

GGTCCAGGATCTTATACGGGCTTACGTGTAGCTGTTGCTACAGCAAAAAT 

GCTAGCTTATACGCTTAAGATTGACTTAGTTGGAGTATCTAGCCTGTACG 

CTTTAACAAATGGATTTTCAGAAAATGATTTATTGGTACCACTTATAGAT 

GCACGACGTAACAATGTTTATGTTGGTTTCTATCAAAATGGAGATACTGT 

TAAACCAGACTGTCACACTTCTCTTGAAGAAGTCTTACAAGAGGTGGGGA 

ATAAAGCCAATGTTCATTTTGTCGGAGAGGTTGCAGCATTTGTTGACCAG 

ATTAAGAAAGTTTTACCACATGCTAAAATTACAGAAACTTTACCTTGTGC 

AGTGGCAATTGGGCGCAAAGGACAAAAAATGAAAAGCGTTAATGTAGATG 

CGTTTGTTCCACGATACTTAAAACGTGTTGAAGCTGAGGAAAATTGGTTA 

AGAAACCACTGTGAAACGAATACAGAAGAATATATTAAGAGAGTT 

SEQ ID NO. 8405 

STRAIN 18RS21 

AAAGTTTTAGCCTTTGATACTTCAAGCAAAGCACTATCA 

GTGGCTGTACTAAACAATATGGAATGTTTAGCGACTGTCACTATCAATAT 

CAAAAAGAATCATAGCATTAATTTGATGCCAGCCATTGATTTTTTAATGC 

AATCAATTGATTTAGAACCTCAAGATTTGGACCGTATCGTAGTAGCAGAG 

GGTCCAGGATCTTATACGGGCTTACGTGTAGCTGTTGCTACAGCAAAAAT 

GCTAGCTTATACGCTTAAGATTGACTTAGTTGGAGTATCTAGCCTGTACG 

CTTTAACAAATGGATTTTCAGAAAATGATTTATTGGTACCACTTATAGAT 

GCACGACGTAATAATGTTTATGTTGGTTTCTATCAAAATGGTGATACTGT 

TAAACCAGACTGTCACACTTCTCTTGAAGAAGTCTTACAAGAGGTGGGGA 

ATAAAGCCAATGTTCATTTTGTCGGAGAGGtTGCAGCATTTTTTGATCAg 

ATTAAgAAAGCCTTACCACATGCTAAAATTACAGAAACTTTACCTTGTGC 

AGTAGCAATTGGGCGCAAAGGACAAAAAATGAAAAGCGTTAATGTAGATG 

CGTTTGTTCCACGATACTTAAAACGTGTTGAAGCTGAGGAAAATTGGTTA 
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AAAAACCACTGTGAAACGAATACAGAAGAATATATTAAGAGAGTT 

SEQ ID NO. 8406 

STRAIN M732 

AAAGTTTTAGCCTTTGATACTTCAAGCAAAGCACTATCA 

GTGGCTGTACTAAACAATATGGAATGTTTAGCGACTGTCACTATCAATAT 

CAAAAAGAATCATAGCATTAATTTGATGCCAGCCATTGATTTTTTAATGC 

AATCAATTGATTTAGAACCTCAAGATTTGGACCGTATCGTAGTAGCAGAG 

GGTCCAGGATCTTATACGGGCTTACGTGTAGCTGTTGCTACAGCAAAAAT 

GCTAGCTTATACGCTTAAGATTGACTTAGTTGGAGTATCTAGCCTGTACG 

CTTTAACAAATGGATTTTCAGAAAATGATTTATTGGTACCACTTATAGAT 

GCACGACGTAACAATGTTTATGTTGGTTTCTATCAAAATGGTGATACTGT 

TAAACCAGACTGTCACACTTCTCTTGAAGAAGTCTTACAAGAGGTGGGGA 

ATAAAGCCAATGTTCATTTTGTCGGAGAGGTTGCAGCATTTTTTGATCAG 

ATTAAGAAAGCCTTACCACATGCTAAAATTACAGAAACTTTACCTTGTGC 

AGTAGCAATTGGGCGCAAAGGACAAAAAATGAAAAGCGTTAATGTAGAnn 

CGTTTGTTCCACGATACTTAAAACGTGTTGAAGCTGAGGAAAATTGGTTA 

AAAAACCACTGTGAAACGAATACAGAAGAATATATTAAGAGAGTT 

SEQ ID NO. 8407 

STRAIN COH1 v . m m m 

AAAGTTTTAGCCTTTGATACTTCAAGCAAAGCAC ' * * 

TATCAGTGGCTGTACTAAACAATATGGAATGTTTAGCGACTGTCACTATC 

AATATCAAAAAGAATCATAGCATTAATTTGATGCCAGCCATTGATTTTTT 

AATGCAATCAATTGATTTAGAACCTCAAGATTTGGACCGTATCGTAGTAG 

CAGAGGGTCCAGGATCTTATACGGGCTTACGTGTAGCTGTTGCTACAGCA 

AAAATGCTAGCTTATACGCTTAAGATTGACTTAGTTGGAGTATCTAGCCT 

GTACGCTTTAACAAATGGATTTTCAGAAAATGATTTATTGGTACCACTTA 

TAGATGCACGACGTAACAATGTTTATGTTGGTTTCTATCAAAATGGTGAT 

ACTGTTAAACCAGACTGTCACACTTCTCTTGAAGAAGTCTTACAAGAGGT 

GGGGAATAAAGCCAATGTTCATTTTGTCGGAGAGGTTGCAGCATTTTTTG 

ATCAGATTAAGAAAGCCTTACCACATGCTAAAATTACAGAAACTTTACCT 

TGTGCAGTAGCAATTGGGCGCAAAGGACAAAAAATGAAAAGCGTTAATGT 

AGATGCGTTTGTTCCACGATACTTAAAACGTGTTGAAGCTGAGGAAAATT 

GGTTAAAAAACCACTGTGAAACGAATACAGAAGAATATATTAAGAGAGTT 

SEQ ID NO. 8408 

STRAIN M781 

AAAGTTTTAGCCTTTGATACTTCAAGCAAAGCACTA 

TCAGTGGCTGTACTAAACAATATGGAATGTTTAGCGACTGTCACTATCAA 
TATCAAAAAGAATCATAGCATTAATTTGATGCCAGCCATTGATTTTTTAA 
TGCAATCAATTGATTTAGAACCTCAAGATTTGGACCGTATCGTAGTATCA 
GAGGGTCCAGGATCTTATACGGGCTTACGTGTAGCTGTTGCTACAGCAAA 
AATGCTAGCTTATACGCTTAAGATTGACTTAGTTGGAGTATCTAGCCTGT 
ACGCTTTAACAAATGGATTTTCAGAAAATGATTTATTGGTACCACTTATA 
GATGCACGACGTAACAATGTTTATGTTGGTTTCTATCAAAATGGTGATAC 
TGTTAAACCAGACTGTCACACTTCTCTTGAAGAAGTCTTACAAGAGGTGG 
GGAATAAAGCCAATGTTCATTTTGTCGGAGAGGTTGCAGCATTTTTTGAT 
CAGATTAAGAAAGCCTTACCACATGCTAAAATTACAGAAACTTTACCTTG 
TGCAGTAGCAATTGGGCGCAAAGGACAAAAAATGAAAAGCGTTAATGTAG 
ATGCGTTTGTTCCACGATACTTAAAACGTGTTGAAGCTGAGGAAAATTGG 
TTAAAAAACCACTGTGAAACGAATACAGAAGAATATATTAAGAGAGTT 

SEQ ID NO. 8409 

STRAIN CJB110 

AAAGTTTTAGCCTTTGATACTTCAAGCAAAGCACTATCA 

GTGGCTGtaCTAAACAATATGGAATGTTTAGCGACTGTCACTATCAATAT 

CAAAAAGAATCATAGCATTAATTTGATGCCAGCCATTGATTTTTTAATGC 

AATCAATTGATTTAGAACCTCAAGATTTGGACCGTATCGTAGTGGCAGAG 

GGTCCAGGATCTTATACGGGCTTACGTGTAGCTGTTGCTACAGCAAAAAT 

GCTAGCTTATACGCTTAAGATTGACTTAGTTGGAGTATCTAGCCTGTACG 

CTTTAACAAATGGATTTTCAGAAAATGATTTGTTGGTACCACTTATAGAT 

GCACGACGTAACAATGTTTATGTTGGTTTCTATCAAAATGGTGATACTGT 

TAAACCAGACTGTCACACTTCTCTTGAAGAAGTCTTACAAGAGGTGGGGA 
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ATAAAGCCAATGTTCATTTTGTCGGAGAGGTTGCAGCATTTTTtgATCAG 
ATTAAGAAAGCCTTACCACATGCTAAAATTACAGAAACTTTACCTTGTGC 
AGTGGCAATTGGGCGCAAAGGACAAAAAATGGAAAGCGTTAATGTAgATG 
CGTTTGTTCCACGATACTTAAAACGAGTTGAAGCTGAGGAAAATTGGTTA 
AAAAACCACTGTGAAACGAATACAGAAGAATATATTAAGAGAGTT 

SEQ ID NO. 8410 

STRAIN 1169NT 

AAAGTTTTAGCCTTTGATACTTCAAGCAAAGCACTATCA 
GTGGCTGTACTAAACAATATGGAATGTTTAGCGACTGTCACTATCAATAT 
CAAAAAGAATCATAGCATTAATTTGATGCCAGCCaTTGATTTTTTAATGC 
AATCAATTGATTTAGAACCTCAAGATTTGGACCGTATCGTAGTAGCAGAG 
GGTCCAGGATCTTATACGGGCTTACGTGTAGCTGTTGCTACAGCAAAAAT 
GCTAGCTTATACGCTTAAGATTGACTTAGTTGGAGTATCTAGCCTGTACG 
CTTTAACAAATGGATTTTCAGAAAATGATTTATTGGTACCACTTATAGAT 
GCACGACGTAACAATGTTTATGTTGGTTTCTATCAAAATGGTGATACTGT 
TAAACCAGACTGTCACACTTCTCTTGAAGAAGTCTTACAAGAGGTGGGGA 
ATAAAGCCAAT^TTCATTTTGTCGGAgAGGTTGCAGCATTTGTTGACCAG 
ATTAAGAAAGCTTTACCACAtGCTAAAATTACAGAAACTTTACCTTGTGC 
AGTGGCAATTGGGCGCAAAGGACAAAAAATGGAAAGCGTTAATGTAgATG 
CGTTTGTTCCACGATACTTAAAACGTGTTGAAGCTGAgGAAAATTGGTTA 
. AAAAACCACTGTGAAACGAATACAGAAGAATATATTAAGAGAGTT 

SEQ ID NO. 8411 

STRAIN* JM913OO0.3 

AAAGTTTTAGCCTTTGATACTTCAAGCAAAGCACTATCA 

GTGGCTGTACTAAACAATATGGAATGTTTAGCGACTGTCACTATCAATAT 

CAAAAAGAATCATAGCATTAATTTGATGCCAGCCATTGATTTTTTAATGC 

AATCAATTGATTTAGAACCTCAAGATTTGGACCGTATCGTAGTAGCAGAG 

GGTCCAGGATCTTATACGGGCTTACGTGTAGCTGTTGCTACAGCAAAAAT 

gCT AGCT T AT ACGCT T AAGATTGACTT AGT T GGAGTATCT AGCCT GT ACG 

CTTTAACAAATGGATTTTCAGAAAATGATTTATTGGTACCACTTATAGAT 

GCACGACGTAACAATGTTTATGTTGGTTTCTATCAAAATGGAGATACTGT 

TAAACCAGACTGTCACACTTCTCTTGAAGAAGTCTTACAAGAGGTGGGGA 

ATAAAGCCAATGTTCATTTTGTCGGAGAGGTTGCAGCATTTGTTGACCAG 

ATTAAGAAAGTTTTACCACATGCTAAAATTACAGAAACTTTACCTTGTGC 

AGTGGCAATTGGGCGCAAAGGACAAAAAATGAAAAGCGTTAATGTAGATG 

CGTTTGTTCCACGATACTTAAAACGTGTTGAAGCTGAGGAAAATTGGTTA 

AGAAACCACTGTGAAACGAATACAGAAGAATATATTAAGAGAGTT 

SEQ ID NO. 8412 
STRAIN 2603 frame: 1 

MMKVLAFDTSSKALSVAVLNNMECLATVTINIKKNHSINLMPAIDFLMQSIDLEPQDLDR 
IWAEGPGSYTGLRVAVATAKMLAYTLKIDLVGVSSLYALTNGFSENDLLVPLIDARRNN 
VYVGFYQNGDTVKPDCHTSLEEVLQEVGNKANVHFVGEVAAFFDQIKKALPHAKITETLP 
CAVAIGRKGQKMKSVNVDAFVPRYLKRVEAEENWLKNHCETNTEEYIKRV 

SEQ ID NO. 8413 

STRAIN 090 frame: 1 

KVLAFDTS SKALS VAVLNNMECLAT VT IN IKKNHS INLMPAI DFLMQS I DLE PQDLDRI V 
VAEG PGS YTGLRVAVATAKMLAYTLK I DLVGVS S LYALTNGFSEN DLLVPL I DARRNNVY 
VGFYQNGDTVKPDCHTSLEEVLQEVGNKANVHFVGEVAAFFDQIKKALPHAKITETLPCA 
VAIGRKGQKMESVNVDAFVPRYLKRVEAEENWLKNHCETN 

SEQ ID NO. 8414 

STRAIN A909 frame: 1 

KVLAFDTSSKALSVAVLNNMECLATVT IN IKKNHS INLMPAI DFLMQS I DLE PQDLDRI V 
VAEGPGS YTGLRVAVATAKMLAYTLKI DLVGVSSLYALTNGFSENDLLVPLI DARRNNVY 
VGFYQNGDTVKPDCHTSLEEVLQEVGNKANVHFVGEVAAFVDQIKKVLPHAKITETLPCA 
VAIGRKGQKMKSVNVDAFVPRYLKRVEAEENWLRNHCETN 

SEQ ID NO. 8415 

STRAIN H36B frame: 1 

KVXAFDTSSKALSVAVLNNMECLATVTINIKKNHSINLMPAIDFLMQSIDLEPQDLDRIV 
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VAEGPGSYTGLRVAVATAKMIAYTLKIDLVGVSSLYALTNGFSENDLLVPLIDARRNNVY 
VGFYQNGDTVKPDCHTSLEEVLQEVGNKANVHFVGEVAAFVDQIKKVLPHAKITETLPCA 
VAIGRKGQKMKSVNVDAFVPRYLKRVEAEENWLRNHCETNTEEYIKRV 

SEQ IB NO. 8416 

STRAIN 18RS21 frame: 1 

KVLAFDTS SKALS VAVLNNMECLATVTINIKKNHS INLMPAI D FLMQS I DLEPQDLDRI V 
VAEGPGS YTGLRVAVATAKMLAYTLKI DLVGVS SLYALTNGFSENDLLVPLIDARRNNVY 
VGFYQNGDTVKPDCHTSLEEVLQEVGNKANVHFVGEVAAFFDQIKKALPHAKITETLPCA 
VAIGRKGQKMKSVNVDAFVPRYLKRVEAEENWLKNHCETNTEEYIKRV 

SEQ ID NO. 8417 

STRAIN M732 frame: 1 

KVLAPDTS SKALS VAVLNNMECIATVT INIKKNHS INLMP 

VAEGPGSYTGLRVAVATAKMLAYTLK I DLVGVS SLYALTNGFSENDLLVPLIDARRNNVY 
VGFYQNGDTVKPDCHTSLEEVLQEVGNKANVHFVGEVAAFFDQIKKALPHAKITETLPCA 
VAIGRKGQKMKSVNVXXFVPRYLKRVEAEENWLKNHCETNTEEYIKRV 

SEQ ID NO. 8418 

STRAIN COH1 frame: 1 

BCVLAFDTSSKALSVAVLNNlffiCLATVTINIBOCNHSINLM 

vaegpgs ytglrvavatakmlaytlki dlvgvs s lyaltngfsen dllvpli darrnnvy 
vgeHtqngdtvkpdchtsleevlqevgnkanvhfvgevaaffdqikkalphakitetlpca 
vaigrkgqkmksvnvdafvprylkrveaeenwlknhcetnteeyikrv 

, .. « 

SEQ ID NO. 8419 

STRAIN M781 frame:' 1 

KVLAFDTSSKALS VAVLNNMECLAT VT INIKKNHS INLMPAI DFLMQS I DLE PQDLDRI V 
VSEGPGSYTGLRVAVATAKMLAYTLKIDLVGVSSLYALTNGFSENDLLVPLIDARRNNVY 
VGFYQNGDTVKPDCHTSLEEVLQEVGNKANVHFVGEVAAFFDQIKKALPHAKITETLPCA 
VAIGRKGQKMKSVNVDAFVPRYLKRVEAEENWLKNHCETNTEEYIKRV 

SEQ ID NO. 8420 

STRAIN CJB110 frame: 1 

KVLAFDTS SKALS VAVLNNMECLATVTINIKKNHS INLMPAI DFLMQS I DLE PQDLDRIV 
VAEGPGSYTGLRVAVATAKMLAYTLKIDLVGVS SLYALTNGFSENDLLVPLIDARRNNVY 
VGFYQNGDTVKPDCHTSLEEVLQEVGNKANVHFVGEVAAFFDQIKKALPHAKITETLPCA 
VAI GRKGQKME S VNVD AFVPRYLKRVE AEENWLKNHCETNTEE Y IKRV 

SEQ ID NO. 8421 

STRAIN 1169NT frame: 1 

KVLAFDTSSKALSVAVLNNMECLATVT INIKKNHS INLMPAI DFLMQS I DLE PQDLDRIV 
VAEG PGS YTGLRVAVATAKMLAYTLKI DLVGVS S LYALTNG FSEN DLLVP LI DARRNNVY 
VGFYQNGDTVKPDCHTSLEEVLQEVGNKANVHFVGEVAAFVDQIKKALPHAKITETLPCA 
VAIGRKGQKMESVNVDAFVPRYLKRVEAEENWLKNHCETNTEEYIKRV 

SEQ ID NO. 8422 

STRAIN JM9130013 frame: 1 

KVLAFDTSSKALS VAVLNNMECLATVTINIKKNHS INLMPAI D FLMQS I DLE PQDLDRIV 
VAEGPGS YTGLRVAVATAKMLAYTLKI DLVGVS S LYALTNG FSEN DLLVPLI DARRNNVY 
VGFYQNGDTVKPDCHTSLEEVLQEVGNKANVHFVGEVAAFVDQIKKVLPHAKITETLPCA 
VAIGRKGQKMKSVNVDAFVPRYLKRVEAEENWLRNHCETNTEEYIKRV 

SEQ ID NO. 8501 
STRAIN 2603 

atgagtaaacgacaaaatttaggaattagtaaaaaaggagcaattatatcagggctctca 
gtggcactaattgtagtaataggtggctttttatgggtacaatctcaacctaataagagt 
gcagtaaaaactaactacaaagtttttaatgttagagaaggaagtgtttcgtcctcaact 
cttttgacaggaaaagctaaggctaatcaagaacagtatgtgtattttgatgctaataaa 
ggtaatcgagcaactgtcacagttaaagtgggtgataaaatcacagctggtcagcagtta 
gttcaatatgatacaacaactgcacaagcagcctacgacactgctaatcgtcaattaaat 
aaagtagcgcgtcagattaataatctaaagacaacaggaagtcttccagctatggaatca 
agtgatcaatcttcttcatcatcacaaggacaagggactcaatcgactagtggtgcgacg 
aatcgtctacagcaaaattatcaaagtcaagctaatgcttcatacaaccaacaacttcaa 
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gatttgaatgatgcttatgcagatgcacaggcagaagtaaataaagcacaaaaagcattg 
aatgatactgttattacaagtgacgtatcagggacagttgttgaagttaatagtgatatt 
gatccagcttcaaaaactagtcaagtacttgtccatgtagcaactgaaggtaaactccaa 
gtacaaggaacgatgagtgagtatgatttggctaatgttaaaaaagaccaggctgttaaa 
ataaaatctaaggtctatcctgacaaggaatgggaaggtaaaatttcatatatctcaaat 
tatccagaagcagaagcaaacaacaatgactctaataacggctctagtgctgtaaattat 
aaatataaagtagatattactagccctctcgatgcattaaaacaaggttttaccgtatca 
gttgaagtagttaatggagataagcaccttattgtccctacaagttctgtgataaacaaa 
gataataaacactttgtttgggtatacaatgattctaatcgtaaaatttccaaagttgaa 
gtcaaaattggtaaagctgatgctaagacacaagaaattttatcaggtttgaaagcagga 
caaatcgtggttactaatccaagtaaaaccttcaaggatgggcaaaaaattgataatatt 
gaatcaatcgatcttaactctaataagaaatcagaggtgaaa 

SBQ ID NO. 8502 

STRAIN 090 . 

TTTTTATGGGTACAATCTCAACCTAATAAGAGTGCAGTAAAAACTAACTA 

CAAAGTTTTTAATGTTAGAGAAGGAAGTGTTTCGTCCTCAACTCTTTTGA " 

CAGGAAAAGCTAAGGCTAATCAAGAACAGTATGTGTATTTTGATGCTAAT 

AAACGTAATCGAGCAACTGTCACAGTTAAAGTGGGTGATAAAATCACAGC 

TGGTCAGCAGTTAGTTCAATATGATACAACAACTGCACAAGCAGCCTACG 

ACACTGCTAATCGTCAATTAAATAAAGTAGCGCGTCAGATTAATAA'T CTA 

AAGACAACAGGAAGTCTTCCAGCTATGGAATTAAGTGATCAATCTTCTTC 

ATCATCACAAGGACAAGGGACTCAATCGACTAGTGGTGCGACGAATCGTC 

TACAGCAAAATTATCAAAGTCAAGCTAATGCTTCATACAACCAACAACTT 

CAAGATTTGAATGATGCTTATGCAGATGCACAGGCAGAAGTAAATAAAGC 

ACAAAASiGGATTGAATGATACTGTTATTACAAGTGACGTATCAGGGACAG 

TTGTTGAAGTTAATAGTGATATTGATCCAGCTTCAAAAACTAGTCAAGTA 

CTTGTCCATGTAGCAACTGAAGGTAAACTCCAAGTACAAGGAACGATGAG * 

TGAGTATGATTTGGCTAATGTTAAAAAAGACCAGGCTGTTAAAATAAAAT 

CTAAGGTCTATCCTGACAAGGAATGGGAAGGTAAAATTTCATATATCTCA 

AATTATCCAGAAGCAGAAGCAAACAACAATGACTCTAATAACGGCTCTAG 

TGCTGTAAATTATAAATATAAAGTAGATATTACTAGCCCTCTCGATGCAT 

TAAAACAAGGTTTTACCGTATCAGTTGAAGTAGTTAATGGAGATAAGCAC 

CTTATTGTCCCTACAAGTTCTGTGATAAACAAAGATAATAAACACTTTGT 

TTGGGTATACAATGATTCTAATCGTAAAATTTCCAAAGTTGAAGTCAAAA 

TTGGTAAAGCTGATGCTAAGACACAAGAAATTTTATCAGGTTTGAAAGCA 

GGACAAATCGTGGTTACTAATCCAAGTAAAACCTTCAAGGATGGGCAAAA 

AATTGATAATATTGAATCAATCGATCTTAACT CTAATAAGAAATCAGAGG 

SEQ ID NO. 8503 

STRAIN A909 

TTTTTATGGGTACAATCTCAACCTAATAAGAGTGCAGTAAAAACTAA 

CTACAAAGTTTTTAATGTTAGAGAAGGAAGTGTTTCGTCCTCAACTCTTT 

TGACAGGAAAAGCTAAGGCTAATCAAGAACAGTATGTGTATTTTGATGCT 

AATAAAGGTAATCGAGCAACTGTTACAGTTAAAGTGGGTGATAAAATCAC 

AGCTGGTCAGCAGTTAGTTCAATATGATACAACAACTGCACAAGCAGCCT 

ACGACACTGCTAATCGTCAATTAAATAAAGTAGCGCGTCAGATTAATAAT 

CTAAAGACAACAGGAAGTCTTCCAGCTATGGAATCAAGTGATCAATCTTC 

AT CATCATCACAAGGACAAGGGGCTCAAT CGACTAGTGGTGCGACGAATC 

GTCTACAGCAAAATTATCAAAGTCAAGCTAATGCTTCATACAACCAACAA 

CTTCAAGATTTGAATGATGCTTATGCAGATGCACAGGCAGAAGTAAATAA 

AGCACAAAAAGCATTGAATGATACTGTTATTACAAGTGACGTATCAGGGA 

CAGTTGTTGAAGTTAATAGTGATATTGATCCAGCTTCAAAAACTAGTCAA 

GTACTTGTCCATGTAGCAACTGAGGGTAAACTCCAAGTACAAGGAACGAT 

GAGTGAGTATGATTTGGCTAATGTTAAAAAAGACCAGTCTGTTAAAATAA 

AATCTAAGGTCTATCCTGACAAGGAATGGGAAGGTAAAATTTCATATATC 

TCAAATTATCCAGAAGCAGAAGCAAACAACAATGACTCTAATAACGGCTC 

TAGTGCTGTAAATTATAAATATAAAGTAGATATTACTAGCCCTCTCGATG 

CATTAAAACAAGGTTTTACTGTATCAGTTGAAGTAGTTAATGGAGATAAG 

CACCTTATTGTTCCTACAAGTTCTGTGACAAACAAAGATAATAAACACTT 

TGTTTGGGTATACAATGATTCTAATCGTAAAATTTCCAAAGTTGAAGTCA 

AAATTGGTAAAGCTGATGCTAAGACACAAGAAATTTTATCAGGTTTGAAA 

GCAGGACAAATCGTGGTTACTAATCCAAGCAAAACTTTCAAGGATGGGCA 

AAAAATTGATAATATTGAATCAATAGATCTTAAGTCTAATAAGAAATCAG 
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AGGTGAAA 

SEQ ID NO. 8504 

strain h36b 

tttttatgggtacaatctcaacctaataagagtgcagtaaaaactaatta 

caaagtttttaatgttagagaaggaagtgtttcgtcctcaactcttttga 

caggaaaagctaaggctaatcaagaacagtatgtgtattttgatgctaat 

aagggtaatcgagcaactgttacagttaaagtgggtgataaaatcacagc 

tggtcagcagttagttcaatatgatacaacaactgcacaagcagcctacg 

acactgctaatcgtcaattaaataaagtagcgcgtcagattaataatcta 

aagacaacaggaagtcttccagctatggaat caagtgatcaat cttcatc 

atcatcacaaggacaagggactcaatcgactagtggtgcgacgaatcgtc 

tacagcaaaattatcaaagtcaagctaatgcttcatacaaccaacaactt 

caagatttgaatgatgcttatgcagatgcacaggcagaagtaaataaagc 

acaaaaagcattgaatgatactgttattacaagtgacgtatcagggacag 

tt.gttgaagttaatagtgatattgatccagcttcaaaaactagtcaagta 

cttgtccatgtagcaactgaaggtaaactccaagtacaaggaacgatgag 

tgagtatgatttggctaatgtaaaaaaagaccaggctgttaaaataaa&t 

ctaaggtctatcctgacaaggaatgggaaggtaaaatttcatatatctca 

aattatccagaagcagaagcaaacaacaatgactctaataacggctctag 

tgctgtaaattataaatataaagtagatattactagccctctcgatgcat 

-taaaacaaggttttactgtatcagttgaagtagttaatqgagataa6cac 

cttattgttcctacaagttctgtgacaaacaaagataataaacactttgt 

ttgggtatacaatgattctaatcgtaaaatttccaaagttgaagtcaaaa- 

ttggtaaagctgatgctaagacacaagaaattttatcaggtttgaaagca 

ggacaaatcgtagttactaatccaagtaaagctttcaaggatgggcaJvaa 

aattgataatattgaatcaatcgatcttaagtctaataagaaatcagagg 

TG 

SEQ ID NO. 8505 

STRAIN 18RS21 

TTTTTATGGGTACAATCTCAACCTAATAAGAGTGCAGTAAAAACTAACTA 
CAAAGTTTTTAATGTTAGAGAAGGAAGTGTTTCGTCCTCAACTCTTTTGA 
CAGGAAAAGCTAAGGCTAATCAAGAACAGTATGTGTATTTTGATGCTAAT 
AAAGGTAATCGAGCAACTGTCACAGTTAAAGTGGGTGATAAAATCACAGC 
TGGTCAGCAGTTAGTTCAATATGATACAACAACTGCACAAGCAGCCTACG 
ACACTGCTAATCGTCAATTAAATAAAGTAGCGCGTCAGATTAATAATCTA 
AAGACAACAGGAAGTCTTCCAGCTATGGAATCAAGTGATCAATCTTCTTC 
ATCATCACAAGGACAAGGGACTCAATCGACTAGTGGTGCGACGAATCGTC 
TACAGCAAAATTATCAAAGTCAAGCTAATGCTTCATACAACCAACAACTT 
CAAGATTTGAATGATGCTTATGCAGATGCACAGGCAGAAGTAAATAAAGC 
ACAAAAAGCATTGAATGATACTGTTATTACAAGTGACGTATCAGGGACAG 
TTGTTGAAGTTAATAGTGATATTGATCCAGCTTCAAAAACTAGTCAAGTA 
CTTGTCCATGTAGCAACTGAAGGTAAACTCCAAGTACAAGGAACGATGAG 
TGAGTATGATTTGGCTAATGTTAAAAAAGACCAGGCTGTTAAAATAAAAT 
CTAAGGTCTATCCTGACAAGGAATGGGAAGGTAAAATTTCATATATCTCA 
AATTATCCAGAAGCAGAAGCAAACAACAATGACTCTAATAACGGCTCTAG 
TGCTGTAAATTATAAATATAAAGTAGATATTACTAGCCCTCTCGATGCAT 
TAAAACAAGGTTTTACCGTATCAGTTGAAGTAGTTAATGGAGATAAGCAC 
CTTATTGTCCCTACAAGTTCTGTGATAAACAAAGATAATAAACACTTTGT 
TTGGGTATACAATGATTCTAATCGTAAAATTTCCAAAGTTGAAGTCAAAA 
TTGGTAAAGCTGATGCTAAGACACAAGAAATTTTATCAGGTTTGAAAGCA 
GGACAAATCGTGGTTACTAATCCAAGTAAAACCTTCAAGGATGGGCAAAA 
AATTGATAATATTGAATCAATCGATCTTAACTCTAATAAGAAATCAGAG 

SEQ ID NO. 8506 

STRAIN M732 

TTTTTATGGGTACAATCTCAACCTAATAAGAGTGCAGTAAAAACTAATTA 
CAAAGTTTTTAATGTTAGAGAAGGAAGTGTTTCGTCCTCAACTCTTTTGA 
CAGGAAAAGCTAAGGCTAATCAAGAACAGTATGTGTATTTTGATGCTAAT 
AAAGGTAATCGAGCAACTGTTACAGTTAAAGTGGGTGATAAAATCACAGC 
TGGTCAGCAGTTAGTTCAATATGATACAACAACTGCACAAGCAGCCTACG 
ACACTGCTAATCGTCAATTAAATAAAGTAGCGCGTCAGATTAATAATCTA 
AAGACAACAGGGAGTTTTCCAGCTATGGAATCAAGTGATCAATCTTCATC 
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ATC^TCACAAGGACAAGGGACTCAATCGACTAGTGGTGCGACGAATCGTC 
TACAGCAAAATTATCAAAGTCAAGCTAATGCTTCATACAACCAACAACTT 
CAAGATTTGAATGATGCTTATGCAGATGCACAGGCAGAAGTAAATAAAGC 
ACAAAAAGCATTGAATGATACTGTTATTACAAGTGACGTATCAGGGACAG 
TTGTTGAAGTTAATAGTGATATTGATCCAGCTTCAAAAACTAGTCAAGTA 
CTTGTCCATGTAGCAACTGAAGGTAAACTCCAAGTACAAGGAACGATGAG 
TGAGTATGATTTGGCTAATGTTAAAAAAGATCAGGCTGTTAAAATAAAAT 
CTAAGGTCTATCCTGACAAGGAATGGGAAGGTAAAATTTCATATATCTCA 
AATTATCCAGAAGCAGAAGCAAACAACAATGACTCTAATAACGGCTCTAG 
TGCTGTAAATTATAAATATAAAGTAGATATTACTAGCCCTCTCGATGCAT 
TAAAACAAGGTTTTACCGTATCAGTTGAAGTAGTTAATGGAGATAAGCAC 
CTTATTGTCCCTACAAGTTCTGTGATAAACAAAGATAATAAACACTTTGT 
TTGGGTATACAATGATTCTAATCGTAAAATTTCCAAAGTTGAAGTCAAAA 
TTGGTAAAGCTGATGCTAAGACACAAGAAATTTTATCAGGTTTGAAAGCA 
GGACAAATCGTGGTTACTAATCCAAGCAAAACTTTCAAGGATGGGCAAAA 
AATTGATAATATTGAATCAATCGATCTTAAGTCTAATAAGAAATCAGAGG 
TGAA 

SEQ XO NO.* 6507 
STRAIN COH1 

TTTTTATGGGTACAATCTCAACCTAATAAGAGTGCAGTAAAAAC 

TAATTACAAAGTTTTTAATGTTAGAGAAGGAAGTGTTTCGTCCTCAACTC 

TTTTGACAGGAAAAGCTAAGGCTAATCAAGAACAGTATGTGTATTTTGAT 

GCTAATAAAGGTAATCGAGCAACTGTTACAGTTAAAGTGGGTGATAAAAT 

CACAGCTGGTCAGCAGTTAGTTCAATATGATACAACAACTGCACAAGCAG 

CCTACGACACTGCTAATCGTCAATTAAATAAAGTAGCGCGTCAGATTAAT 

AATCTAAAGACAACAGGGAGTTTTCCAGCTATGGAATCAAGTGATCAATC 

TTCATCATCATCACAAGGACAAGGGACTCAATCGACTAGTGGTGCGACGA 

ATCGTCTACAGCAAAATTATCAAAGTCAAGCTAATGCTTCATACAACCAA 

CAACTTCAAGATTTGAATGATGCTTATGCAGATGCACAGGCAGAAGTAAA 

T AAAGCACAAAAAGC ATT GAATGAT ACT GT T AT T ACAAGTG ACGT AT C AG 

GGACAGTTGTTGAAGTTAATAGTGATATTGATCCAGCTTCAAAAACTAGT 

CAAGTACTTGTCCATGTAGCAACTGAAGGTAAACTCCAAGTACAAGGAAC 

GATGAGTGAGTATGATTTGGCTAATGTTAAAAAAGATCAGGCTGTTAAAA 

TAAAATCTAAGGTCTATCCTGACAAGGAATGGGAAGGTAAAATTTCATAT 

ATCTCAAATTATCCAGAAGCAGAAGCAAACAACAATGACTCTAATAACGG 

CTCTAGTGCTGTAAATTATAAATATAAAGTAGATATTACTAGCCCTCTCG 

ATGCATTAAAACAAGGTTTTACCGTATCAGTTGAAGTAGTTAATGGAGAT 

AAGCACCTTATTGTCCCTACAAGTTCTGTGATAAACAAAGATAATAAACA 

CTTTGTTTGGGTATACAATGATTCTAATCGTAAAATTTCCAAAGTTGAAG 

TCAAAATTGGTAAAGCTGATGCTAAGACACAAGAAATTTTATCAGGTTTG 

AAAGCAGGACAAATCGTGGTTACTAATCCAAGCAAAACTTTCAAGGATGG 

GCAAAAAATTGATAATATTGAATCAATCGATCTTAAGTCTAATAAGAAAT 

CAGAGGTGAA 

SEQ XD NO. 8507 

STRAIN M781 * 

TTTTTATGGGTACAATCTCAACCTAATAAGAGTGCAGTAAAAACTAATTA 
CAAAGTTTTTAATGTTAGAGAAGGAAGTGTTTCGTCCTCAACTCTTTTGA 
CAGGAAAAGCTAAGGCTAATCAAGAACAGTATGTGTATTTTGATGCTAAT 
AAAGGTAATCGAGCAACTGTTACAGTTAAAGTGGGTGATAAAATCACAGC 
TGGTCAGCAGTTAGTTCAATATGATACAACAACTGCACAAGCAGCCTACG 
ACACTGCTAATCGTCAATTAAATAAAGTAGCGCGTCAGATTAATAATCTA 
AAGACAACAGGGAGTTTTCCAGCTATGGAATCAAGTGATCAATCTTCATC 
ATCATCACAAGGACAAGGGACTCAATCGACTAGTGGTGCGACGAATCGTC 
TACAGCAAAATTATCAAAGTCAAGCTAATGCTTCATACAACCAACAACTT 
CAAGATTTGAATGATGCTTATGCAGATGCACAGGCAGAAGTAAATAAAGC 
ACAAAAAGCATTGAATGATACTGTTATTACAAGTGACGTATCAGGGACAG 
TTGTTGAAGTTAATAGTGATATTGATCCAGCTTCAAAAACTAGTCAAGTA 
CTTGTCCATGTAGCAACTGAAGGTAAACTCCAAGTACAAGGAACGATGAG 
TGAGTATGATTTGGCTAATGTTAAAAAAGATCAGGCTGTTAAAATAAAAT 
CTAAGGTCTATCCTGACAAGGAATGGGAAGGTAAAATTTCATATATCTCA 
AATTATCCAGAAGCAGAAGCAAACAACAATGACTCTAATAACGGCTCTAG 
TGCTGTAAATTATAAATATAAAGTAGATATTACTAGCCCTCTCGATGCAT 
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TAAAACAAGGTTTTACCGTATCAGTTGAAGTAGTTAATGGAGATAAGCAC 
CTTATTGTCCCTACAAGTTCTGTGATAAACAAAGATAATAAACACTTTGT 
TTGGGTATACAATGATTCTAATCGTAAAATTTCCAAAGTTGAAGTCAAAA 
TTGGTAAAGCTGATGCTAAGACACAAGAAATTTTATCAGGTTTGAAAGCA 
GGACAAATCGTGGTTACTAATCCAAGCAAAACTTTCAAGGATGGGCAAAA 
AATTGATAATATTGAATCAATCGATCTTAAGTCTAATAAGAAATCAGAGG 
TGAA 

SEQ ZD NO. 8508 

STRAIN CJB110 

TTTTTATGGGTACAATCTCAACCTAATAAGAGTGCAGTAAAAACTAACTA 

CAAAGTTTTTAATGTTAGAGAAGGAAGTGTTTCGTCCTCAACTCTTTTGA 

CAGGAAAAGCTAAGGCTAATCAAGAACAGTATGTGTATTTTGATGCTAAT 

AAAGGTAATCGAGCAACTGTCACAGTTAAAGTGGGTGATAAAATCACAGC 

TGGTCAGCAGTTAGTTCAATATGATACAACAACTGCACAAGCAGCCTACG 

ACACTGCTAATCGTCAATTAAATAAAGTAGCGCGTCAGATTAATAATCTA 

AAGACAACAGGAAGTCTTCCAGCTATGGAATTAAGTGATCAATCTTCTTC 

ATCATCACAAGGACAAGGGACTCAATCGACTAGTGGTGCGACGAATCGTC 

TACAGCAAAATTATCAAAGTCAAGCTAATGCT.TCATACAACCAACAACTT 

CAAGATTTGAATGATGCTTATQCAGATGCACAGGCAGAAGTAAATAAAGC ♦ 

ACAA^AAGCAT^GAATGATACTGTTATTACAAGTGACGTATCAGGGACAG 

TTGTTGAAGTTAATAGTGATATTGATCCAGCTTCAAAAACTAGTCAAGTA 

CTTGTCCATGTAGCAACTGAAGGTAAACTCCAAGTACAAGGA&CGATGAG 

TGAGTATGATTTGGCTAATGTTAAAAAAGACCAGGCTGTTAAAATAAAAT 

CTAAGGTCTATCCTGACAAGGAATGGGAAGGTAAAATTTCATA7ATGTCA 

AATTATCCAGAAGCAGAAGCAAACAACAATGACTCTAATAACGGCTCTAG 

TGpTGTAAATTATAAATATAAAGTAGATATTACTAGCCCTCTCGATGCAT 

TAAAACAAGGTTTTACCGTATCAGTTGAAGTAGTTAATGGAGATAAGCAC 

CTTATTGTCCCTACAAGTTCTGTGATAAACAAAGATAATAAACACTTTGT 

TTGGGTATACAATGATTCTAATCGTAAAATTTCCAAAGTTGAAGTCAAAA 

TTGGTAAAGCTGATGCTAAGACACAAGAAATTTTATCAGGTTTGAAAGCA 

GGACAAATCGTGGTTACTAATCCAAGTAAAACCTTCAAGGATGGGCAAAA 

AATTGATAATATTGAATCAATCGATCTTAACTCTAATAAGAAATCAGAGG 

TGA 

SEQ ID NO. 8509 

STRAIN 1169NT 

TTTTTATGGGTACAATCTCAACCTAATAAGAGTGCAGTAAAAACT 

AACTACAAAGTTTTTAATGTTAGAGAAGGAAGTGTTTCGTCCTCAACTCT 

TTTGACAGGAAAAGCTAAGGCTAATCAAGAACAGTATGTGTATTTTGATG 

CTAATAAAGGTAATCGAGCAACTGTCACAGTTAAAGTGGGTGATAAAATC 

ACAGCTGGTCAGCAGTTAGTTCAATATGATACAACAACTGCACAAGCAGC 

CTACGACACTGCTAATCGTCAATTAAATAAAGTAGCGCGTCAGATTAATA 

ATCTAAAGACAACAGGAAGTCTTCCAGCTATGGAATCAAGTGATCAATCT 

TCTTCATCATCACAAGGACAAGGGACTCAATCGACTAGTGGTGCGACGAA 

TCGTCTACAGCAAAATTATCAAAGTCAAGCTAATGCTTCATACAACCAAC 

AACTTCAAGATTTGAATGATGCTTATGCAGATGCACAGGCAGAAGTAAAT 

AAAGCACAAAAAGCATTGAATGATACTGTTATTACAAGTGACGTATCAGG 

GACAGTTGTTGAAGTTAATAGTGATATTGATCCAGCTTCAAAAACTAGTC 

AAGTACTTGTCCATGTAGCAACTGAAGGTAAACTCCAAGTACAAGGAACG 

ATGAGTGAGTATGATTTGGCTAATGTTAAAAAAGACCAGGCTGTTAAAAT 

AAAATCTAAGGTCTATCCTGACAAGGAATGGGAAGGTAAAATTTCATATA 

TCTCAAATTATCCAGAAGCAGAAGCAAACAACAATGACTCTAATAACGGC 

TCTAGTGCTGTAAATTATAAATATAAAGTAGATATTACT^GCCCTCTCGA 

TGCATTAAAACAAGGTTTTACCGTATCAGTTGAAGTAGTTAATGGAGATA 

AGCACCTTATTGTCCCTACAAGTTCTGTGATAAACAAAGATAATAAACAC 

TTTGTTTGGGTATACAATGATTCTAATCGTAAAATTTCCAAAGTTGAAGT 

CAAAATTGGTAAAGCTGATGCTAAGACACAAGAAATTTTATCAGGTTTGA 

AAGCAGGACAAATCGTGGTTACTAATCCAAGTAAAACCTTCAAGGATGGG 

CAAAAAATTGATAATATTGAATCAATCGATCTTAACTCTAATAAGAAATC 

AGAGGTGAA 

SEQ ID NO. 8510 

STRAIN JM9130013 



370 



WO 2004/018646 



SEQUENCE LISTING 



TTTTTATGGGTACAATCTCAACCTAATAAGAGTGCAGTAAAAACTAACTA 

CAAAGTTTTTAATGTTAGAGAAGGAAGTGTTTCGTCCTCAACTCTTTTGA 

CAGGAAAAGCTAAGGCTAATCAAGAACAGTATGTGTATTTTGATGCTAAT 

AAAGGTAATCGAGCAACTGTTACAGTTAAAGTGGGTGATAAAATCACAGC 

TGGTCAGCAGTTAGTTCAATATGATACAACAACTGCACAAGCAGCCTACG 

ACACTGCTAATCGTCAATTAAATAAAGTAGCGCGTCAGATTAATAATCTA 

AAGACAACAGGAAGTCTTCCAGCTATGGAATCAAGTGATCAATCTTCATC 

ATCATCACAAGGACAAGGGGCTCAATCGACTAGTGGTGCGACGAATCGTC 

TACAGCAAAATTATCAAAGTCAAGCTAATGCTTCATACAACCAACAACTT 

CAAGATTTGAATGATGCTTATGCAGATGCACAGGCAGAAGTAAATAAAGC 

ACAAAAAGCATTGAATGATACTGTTATTACAAGTGACGTATCAGGGACAG 

TTGTTGAAGTTAATAGTGATATTGATCCAGCTTCAAAAACTAGTCAAGTA 

CTTGTCCATGTAGCAACTGAGGGTAAACTCCAAGTACAAGGAACGATGAG 

TGAGTATGATTTGGCTAATGTTAAAAAAGACCAGTCTGTTAAAATAAAAT 

CTAAGGTCTATCCTGACAAGGAATGGGAAGGTAAAATTTCATATATCTCA 

AATTATCCAGAAGCAGAAGCAAACAACAATGACTCTAATAACGGCTCTAG 

TGCTGTAAATTATAAATATAAAGTAGATATTACTAGCCCTCTCGATGCAT 

TAAAACAAGGTTTTACTGTATCAGTTGAAGTAGTTAATGGAGATAAGCAC 

CTTATTGTTCCTACAAGTTCTGTGACAAACAAAGATAATAAACACTTTGT 

TTGGGTATACAATGATTCTAATCGTAAAATTTCCAAAGTTGAAGTCAAAA 

TTGGTAAAGCTGATGCTAAGACACAAGAAATTTTATCAGGTTTGAAAGCA 

GGACAAATCGTGGTTACTAATCCAAGCAAAACTTTCAAGGATGGGCAAAA ■ 

AATTGATAATATTGAATCAATAGATCTTAAGTCTAATAAGAAATCAGAGG ' 

TGAAA 

SEQ ID NO. 8511 
STRAIN 2603 frame: 1 

MSKRQNLGI SKKGAI I SGLS VAL I VVIGGFLWVQSQPNKSAVKTNYKVFNVREGS V S S ST 
LLTGKAKANQEQYVYFDANKGNRATVTVKVG DKI TAGQQLVQYDTTTAQAAYDTANRQLN 
KVARQINNLKTTGSLPAMESSDOSSSSSQGQGTQSTSGATNRLQQNYQSQANASYNQQLQ 
DLNDAYADAQAEVNKAQKALNDTVITS DVSGT WEVNSDIDPASKT SQVLVHVATEGKLQ 
VQGTMSE YDLANVKKDQAVKIKSKVY PDKEWEGKI S YI SNYPEAEANNN DSNNGS SAVNY 
KYKVDITSPLDALKQGFTVSVEVWGDKHLIVPTSSVINKDNKHFVWyNDSNRKISKVE 
VKIGKADAKTQEILSGLKAGQIWTNPSKTFKDGQKIDNIESIDLNSNKKSEVK 

SEQ ID NO. 8512 

STRAIN 090 frame: 1 

FLWQSQPNKSAVKTNYKVFNVREGSVSSSTLLTGKAKANQEQYVYFDANKGNRATVTVK 
VGDKITAGQQLVQYDTTTAQAAYDTANRQLNKVARQINNLKTTGSLPAMELSDQSSSSSQ 
GQGTQSTSGATNRLQQNYQSQANASYNQQLQDLNDAYADAQAEVNKAQKALNDTVITSDV 
SGTWEVNSDIDPASKTSQVLVHVATEGKLQVQGTMSEYDLANVKKDQAVKIKSKVYPDK 
EWEGKISYISNYPEAEANNNDSNNGSSAVNYKYKVDITSPLDALKQGFTVSVEWNGDKH 
LIVPTSSVINKDNKHFVWVYNDSNRKISKVEVKIGKADAKTQEILSGLKAGQIVVTNPSK 
TFKDGQKIDNIESIDLNSNKKSE 

SEQ ID NO. 8513 

STRAIN A909 frame: 1 

FLWVQSQPNKSAVKTNYKVFNVREGSVSSSTLLTGKAKANQEQYVYFDANKGNRATVTVK 
VGDKITAGQQLVQYDTTTAQAAYDTANRQLNKVARQINNLKTTGSLPAMESSDQSSSSSQ 
GQGAQSTSGATNRLQQN YQS QANAS YNQQLQDLN DAYADAQAEVNKAQKALN DT VIT S DV 
SGTVVEVNSDIDPASKTSQVLVHVATEGKLQVQGTMSEYDLANVKKDQSVKIKSBCVYPDK 
EWEGKISYISNYPEAEANNNDSNNGSSAVNYKYKVDITSPLDALKQGFTVSVEWNGDKH 
LIVPTSSVTNKDNKHFVWVYNDSNRKISKVEVKIGKADAKTQEILSGLKAGQIWTNPSK 
T FKDGQK I DN I E S I DLKSNKKS E VK 

SEQ ID NO. 8514 

STRAIN H36B frame: 1 

FLWVQSQPNKS AVKTNYKVFNVREGS VS S STLLTGKAKANQEQYVYFDANKGNRATVT VK 
VGDKITAGQQLVQYDTTTAQAAYDTANRQLNKVARQINNLKTTGSLPAMESSDQSSSSSQ 
GQGTQSTSGATNRLQQNYQSQANASYNQQLQDLNDAYADAQAEVNKAQKALNDTVITSDV 
SGTWEVNSDIDPASKTSQVLVHVATEGKLQVQGTMSEYDLANVECKDQAVKIKSKVYPDK 
EWEGKISYISNYPEAEANNNDSNNGSSAVNYKYKVDITSPLDALKQGFTVSVEVVNGDKH 
LIVPTSSVTNKDNKHFVWVYNDSNRKISKVEVKIGKADAKTQEILSGLKAGQIVVTNPSK 
AFKDGQKI DN IE S I DLKSNKKS E V 
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SEQ ID NO. 8515 

STRAIN 18RS21 frame: 1 

FLWVQSQPNKS AVKTNYKVFNVREGS VS S STLLTGKAKANQEQYVYFDANKGNRAT VTVK 
VGDKITAGQQLVQYDTTTAQAAYDTANRQLNKVARQINNLKTTGSLPAMESSDQSSSSSQ 
GQGTQSTSGATNRLQQNYQSQANASYNQQLQDLNDAYADAQAEVNKAQKALNDTVITSDV 
SGTVVEVNSDIDPASKTSQVLVHVATEGKLQVQGTMSEYDLANVKKDQAVKIKSKVYPDK 
EWEGKISYISNYPEAEANNNDSNNGSSAVNYKYKVDITSPLDALKQGFTVSVEWNGDKH 
LIVPTSSVINKDNKHFVWVYNDSNRKISKVEVKIGKADAKTQEILSGLKAGQIWTNPSK 
T FKDGQKI DN IE S I DLN SNKKS E 

SEQ ID NO. 8516 

STRAIN M732 frame: 1 

FLWVQSQPNKSAVKTNYKVFNVREGSVSSSTLLTGKAKANQEQYVYFDANKGNRATVTVK 
VGDKITAGQQLVQYDTTTAQAAYDTANRQLNKVARQINNLKTTGS FPAMES SDQS S S S SQ 
GQGTQSTSGATNRLQQNYQSQANASYNQQLQDLNDAYADAQAEVNKAQKALNDTVITSDV 
SGTVVEVNSDIDPASKTSQVLVHVATEGKLQVQGTMSEYDLANVKKDQAVKIKSKVYPDK 
EWEGKISYISNYPEAEANpJDSNNGSSAVNYKYKVDITSPLDALKQGFWSVEVVNGDKH 
LIVPTSSVINKDNKHF\WYNDSNRKIS£CVEVKIGKADAKTQEILSGLKAGQIVVTNPSK 
X FKDGQKI DN IE SI DLKSNKKSEV 

SEQ ID NO. 8517 

STRAIN COH1 frame: 1 

FLWVQSQPNKSAVKTNYKVFNVREGSVSSSTLLTGKAKANQEQYVYFDANKGNRATVTVK 
VGDKITAGQQLVQYDTTTAQAAYDTANRQLNKVARQI NNLKTTGS FPAMES S DQS SSSSQ 
GQGTQST SGATNRLQQN YQS QANAS YNQQLQDLN DAYADAQAEVNKAQKALNDTVI T S DV 
SGTWEVNS DI DPASKTSQVLVHVATEGKLQVQGTMSEYDIiANVKKDQAVKIKSKVYPDK 
EWEGKISYISNYPEAEANNNDSNNGSSAVNYKYKVDITSPLDALKQGFTVSVEVVNGDKH 
LIVPTSSVINKDNKHFVWVYNDSNRKISKVEVKIGKADAKTQEILSGLKAGQIVVTNPSK 
TFKDGQKIDNIE SI DLKSNKKSEV 

SEQ ID NO. 8518 

STRAIN M781 frame: 1 

FLWVQSQPNKS AVKTNYKVFNVREGS VS S STLLTGKAKANQEQYVY FDANKGNRATVTVK 
VGDKITAGQQLVQY DTTT AQAAYDTANRQLNKVARQINNLKTTGS FPAMES S DQS S S S SQ 
GQGTQST SGATNRLQQN YQS QANAS YNQQLQDLNDAYADAQAEVNKAQKALNDTVIT S DV 
S GTWE VNS DI D PASKT S QVLVHVATEGKLQ VQGTMSE YDLANVKKDQAVKIKS KVY P DK 
EWEGKISYISNYPEAEANNNDSNNGSSAVNYKYKVDITSPLDALKQGFTVSVEWNGDKH 
LIVPTSSVINKDNKHFVWVYNDSNRKISKVEVKIGKADAKTQEILSGLKAGQIVVTNPSK 
TFKDGQKIDNIES I DLKSNKKSEV 

SEQ ID NO. 8519 

STRAIN M781 frame: 1 

FLWQSQPNKSAVKTNYKVFNVREGSVSS STLLTGKAKANQEQYVY FDANKGNRATVTVK 
VGDKITAGQQLVQYDTTTAQAAYDTANRQLNKVARQINNLKTTGS FPAME SSDQSSSSSQ 
GQGTQSTSGATNRLQQNYQSQANASYNQQLQDLNDAYADAQAEVNKAQKALNDTVITSDV 
SGTWEVN S D I D PASKTS QVLVHVATEGKLQVQGTMSE YDLANVKKDQAVKIKS KVYP DK 
EWEGKISYISNYPEAEANNNDSNNGSSAVNYKYKVDITSPLDALKQGFTVSVEWNGDKH 
LIVPTSSVINKDNKHFVWVYNDSNRKISKVEVKIGKADAKTQEILSGLKAGQIVVTNPSK 
TFKDGQKIDNIES I DLKSNKKSEV 

SEQ ID NO. 8520 

STRAIN CJB110 frame: 1 

FLWVQSQPNKSAVKTNYKVFNVREGSVSSSTLLTGKAKANQEQYVY FDANKGNRATVTVK 
VGDKITAGQQLVQYDTTTAQAAYDTANRQLNKVARQINNLKTTGSLPAMELS DQS SSSSQ 
GQGTQST SGATNRLQQN YQS QAN AS YNQQLQDLN DAYADAQAEVNKAQKALN DT VI TSDV 
SGTVVEVNSDIDPASKTSQVLVHVATEGKLQVQGTMSE YDLANVKKDQAVKIKS KVY PDK 
EWEGKISYISNYPEAEANNNDSNNGSSAVNYKYKVDITSPLDALKQGFTVSVEWNGDKH 
LIVPTSSVINKDNKHFVWVYNDSNRKISKVEVKIGKADAKTQEILSGLKAGQIWTNPSK 
T FKDGQKI DN IES I DLN SNKKSEV 

SEQ ID NO. 8521 

STRAIN 1169NT frame: 1 

BTjWVQSQPNKSAVKTNYKVFNVREGSVSS STLLTGKAKANQEQYVYFDANKGNRAT VTVK 
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VGDKITAGQQLVQYDTTTAQAAYDTANRQLNKVARQINNLKTTGSLPAMESSDQSSSSSQ 
GQGTQSTSGATNRLQQNYQSQANASYNQQLQDLNDAYADAQAKVNKAQKALNDTVITSDV 
SGTWEVNSDIDPASKTSQVLVHVATEGKLQVQGTMSEYDLANVKKDQAVKIKSKVYPDK 
EWEGKISYISNYPEAEANNNDSNNGSSAVNYKYKVDITSPLDALKQGFTVSVEWNGDKH 
LIVPTSSVINKDNKHFVWVYNDSNRKISKVEVKIGKADAKTQEILSGLKAGQIWTNPSK 
T FKDGQKI DN I E S I DLN SNKKSE V 

SEQ ID NO. 8522 

STRAIN JM9130013 frame: 1 

FLWVQSQPNKSAVKTNYKVF^rVREGSVSSSTLLTGKAKANQEQYVYFDANKGNRATVTVK 
VGDKITAGQQLVQYDTTTAQAAYDTANRQLNKVARQINNLKTTGS LPAME SSDQSSSSSQ 
GQGAQSTSGATNRLQQNYQSQANASYNQQLQDLNDAYADAQAEVNKAQKALNDTVITSDV 
SGTVVEVNSDIDPASKTSQVLVHVATEGKLQVQGTMSEYDLANVKKDQSVKIKSKVYPDK 
EWEGKISYISNYPEAEANNNDSNNGSSAVNYKYKVDITSPLDALKQGFTVSVEVVNGDKH 
LIVPTSSVTNKDNKHFVWVYNDSNRKISKVEVKIGKADAKTQEILSGLKAGQIVVTNPSK 
T FKDGQKI DN I E S I DLKSNKKSE VK 

SEQ ID NO. 8601 
STRAIN 2603 

atgaaaaaaattggaattattgtcctcacactactgaccttctttttggtatcttgcgga 
caapaaactaaacaagaaagcactaaaacaactatttctaaaatgcctaaaattgaaggc 
ftcacctattatggaaaaattcctgaaaatccgaaaaaagtaattaattttacatattct 
tacactgggtatttattaaaactaggtgttaatgtttcaagttacagtttagacttagaa 
aaagatagccccgtttttggtaaacaactgaaagaagctaaaaaattaactgc'tgatgat 
acagaagctattgccgcacaaaaacctgatttaatcatggttttcgatcaagatccaaac 
atcaatactctgaaaaaaattgcaccaactttagttattaaatatggtgcacaaaattat 
ttagatatgatgccagccttggggaaagtattcggtaaagaaaaagaagctaatcagtgg 
gttagccaatggaaaactaaaactctcgctgtcaaaaaagatttacaccatatcttaaag 
cctaacactacttttactattatggatttttatgataaaaatatctatttatatggtaat 
aattttggacgcggtggagaactaatctatgattcactaggttatgctgccccagaaaaa 
gtcaaaaaagatgtctttaaaaaagggtggtttaccgtttcgcaagaagcaatcggtgat 
tacgttggagattatgcccttgttaatataaacaaaacgactaaaaaagcagcttcatca 
cttaaagaaagtgatgtctggaagaatttaccagctgtcaaaaaagggcacatcatagaa 
agtaactacgacgtgttttatttctctgaccctctatctttagaagctcaattaaaatca 
tttacaaaggctatcaaagaaaatacaaat 

SEQ ID NO. 8602 

STRAIN 090 

GAAGGCTTCACCTATTATGGAAAAATTCCTGAAAATCCGAAAAAAGTAAT 
TAATTTTACATATTCTTACACTGGGTATTTATTAAAACTAGGTGTTAATG 
TTTCAAGTTACAGTTTAGACTTAGAAAAAGATAGCCCCGTTTTTGGTAAg 
CAACTGAAAGAAGCTAAAAAATTAACTGCTGATGATACAGAAGCTATTGC 
CGCACAAAAACCTGATTTAATCATGGTTTTCGATCAAGATCCAAACATCA 
ATACTCTGAAAAAAATTGCACCAACTTTAGTTATTAAAtATGGTGCACAA 
AATTATTTAGATATGATGCCAGCCTTGGGGAAAGTATTCGGTAAAGAAAA 
AGAAGCTAATCAGTGGGTTAGCCAATGGAAAACTAAAACTCTCGCTGCCA 
AAAAAGATTTACACCATATCTTAAAGCCTAACACTACTTTTACTATTATG 
GATTTTTATGATAAAAATATCTATTTATATGGTAATAATTTTGGACGCGG 
tGGAGAACTAATCTATGATTCACTAGGTTATGCTGCCCCAgAAAAAGTCA 
AAAAAgATGTcTTTAAAAAAGGGTGGTTTACCGTTTCgCAAGAAGCAATC 
GGtGATTACGTTGGAGATTATGCCCTTGTTAATATAAACAAAACGACTAA 
AAAAGCAGCTTCatcACTTAAAGAAAGTGATGTCTGGAAGAATTTACCAG 
CTGTCaAAAAAGGGCACATCATAGAAAGTAacTACGACGTGTTTTATTTC 
TCTGACCCTCTATCTTTAGAAGCTCAATTAAAATCATTTACAAA 

SEQ ID NO. 8603 

STRAIN A909 

GAAGGCTTCACCTATTATGGAAAAATTCCTG 

AAAATCCGAAAAAAGTAATTAATTTTACATATTCTTACACTGGATATTTA 
TTAAAACTAGGAGTTAATGTTTCAAGTTACAGTTTAGACTTAGAAAAAGA 
TAgCCCCGTTTTTGGTAAaCAACTGAAAGGAGCTAAAAAATTAACTGCTG 
ATGATACAGAAGCTATTGCCGCACAAAAACCTGATTTAaTCATGGTTTTT 
GATCAAGATCCAAACATCAATACTCTGAAAAAAATTGCACCAACTTTAGT 
TATTAAATATGGTGCACAAAATTATTTAgATaTGATGCCAGCTTTGGGGA 
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AAGTATTCGGTAAAGAAAAAGAAGCTAATCAGTGGGTTAGCCAaTGGAAA 
ACTAAAACTCTCGCTGCCAAAAAAGATTTACACCATATCTTAAAACCTAA 
CACTACTTTTACCATTATGGATTTTTATGATAAAAATATCTATTTATATG 
GTAATAATTTTGGACGCGGTGGAGAACTAATCTATGATTCACTAGGTTAT 
GCTGCCCCAGAAAAAGTCAAAAAAGATGTCTTTAAAAAAGGGTGGTTTAC 
CGTTTCGCAAGAAGCAATCGGTgATTACGTTGGAGATTATGCCCTTGTTA 
ATATAAACAAAACGACTAAAAAAGCAGCTTCATCACTTAAAGAAAGTGAT 
GTCTGGAAGAATTTACCAGCTGTCAAAAAAGGGCACATCATAGAAAGTAA 
CTACGACGTGTTTTATTTCTCTGACCCTcTATCTTTAGAAGCTCAATTAA 
AATCATTTACAAA 

SEQ ID NO. 8604 

STRAIN H36B 

GAAGGCTTCACCTATTATGGAAAA 

ATTCCTGAAAATCCGAAAAAAGTAATTAATTTTACATATTCTTAC^CTGG 
ATATTTATTAAAACTAGGAGTTAATGTTTCAAGTTACAGTTTAGACTTAG 
AAAAAGATAgCCCCGTTTTTGGTAAgCAACTGAAAGGAGCTAAAAAATTA 
ACTGCTGATGATACAGAAGCTATTGCCGCACAAAAACCTGATTTAaTCAT 
GGTTTTTGATCAAgATCCAAACATCAATACTCTGAAAAAAATTGCACCAA 
CTTTAGTTATTAAATATGGTGCACAAAATTATTTAgATaTgATGCCAGCT 
TTGGGGAaAGTATTCGGTAAAGAAAAAGAAGCTAATCAGTGGGTTAGCCA 
ATGGAAAACTAAAACTCTCGCTGCCAAAAAAGATTTACACCATATCT'TAA 
GGCCTaACAcTACTTTTACTATTATAGAtTTTTATGATAAAAATATCTAT 
TTATATGGTAATAATTTTGGA£GCGGtGGAgAACTAATCTATGATtCACT 
AGGTTATGCTGCCCCAgAAAAAGTCAAAAAAgATGTCTTTAAAAAAGGGT 
GGTTTACCGTTTCgCAAGAAGCAATCGGTgATTACGTTGGAGATTATGCC 
CTTGTTAATATAAACAAAACGACTAAAAAAGCAGCTTCaTCACTTAAAGA 
AAGTGATGTTTGGAAGAATTTACCAGCTGTCAAAAAAGGGCACATCATAG 
AAAGTAACTACGACGTGTTTTATTTCTCTGACCCTCTATCTTTAGAAGCT 
CAATTAAAATCATTTACAAA 

SEQ ID NO. 8605 

STRAIN 18RS21 
GAAGGCTTCACCTATTATGGA 

AAAATTCCTGAAAATCCGAAAAAAGTAATTAATTTTACATATTCTTACAC 
TGGGTATTTATTAAAACTAGGTGTTAATGTTTCAAGTTACAGTTTAGACT 
TAGAAAAAGATAGCCCCGTTTTTGGTAAACAACTGAAAGAAGCTAAAAAA 
TTAACTGCTGATGATACAGAAGCTATTGCCGCACAAAAACCTGATTTAAT 
CATGGTTTTCGATCAAGATCCAAACATCAATACTCTGAAAAAAATTGCAC 
CAACTTTAGTTATTAAATATGGTGCACAAAATTATTTAgATaTGATGCCA 
GCCTTGGGGAAAGTATTCGGTAAAGAAAAAgAAGCTAATCAGTGGGTTAG 
CCAATGGAAAACTAAAACTCTCGCTGTCAAAAAAGATTTACACCATATCT 
TAAAGCCTAACACTACTTTTACTATTATGGATTTTTATGATAAAAATATC 
TATTTATATGGTAATAATTTTGGACGCGGTGGAGAACTAATCTATGATTC 
ACTAGGTTATGCTGCCCCAgAAAAAGTCAAAAAAgATGTCTTTAAAAAAG 
GGTGGTTTACCGTTTCGCAAGAAGCAATCGGTGATTACGTTGGAGATTAT 
GCCCTTGTTAATATAAACAAAACgACTAAAAAAGCAGCTTCATCACTTAA 
AGAAAGTGATGTCTGGAAGAATTTACCAGCTGTCAAAAAAGGGCACATCA 
TAGAAAGTAACTACGACGTGTTTTATTTCTCTGACCCTCTATCTTTAGAA 
GCTCAATTAAAATCATTTACAAA 

SEQ ID NO. 8606 

STRAIN M732 
GAAGGCTTCACCTATTATGG 

AAAAATTCCTGAAAATCCGAAAAAAGTAATTAATTTTACATATTCTTACA 
CTGGGTATTTATTAAAACTAGGTGTTAATGTTTCAAGTTACAGTTTAGAC 
TTAGAAAAAGATAGCCCCGTTTTTGGTAAGCAACTGAAAGAAGCTAAAAA 
ATTAACTGCTGATGATACAGAAGCTATTGCCGCACAAAAACCTGATTTAA 
TCATGGTTTTCGATCAAGATCCAAACATCAATACTCTGAAAAAAATTGCA 
CCAACTTTAGTTATTAAATATGGTGCACAAAATTATTTAgATATGATGCC 
AGCCTTGGGGAAAGTATTCGGTAAAGAAAAAGAAGCTAATCAGtGGGTTA 
GCCAATGGAAAACTAAAACTCTCGCTGCCAAAT^AAGATTTACACCATATC 
TTAAAGCCTAACACTACTTTTACTATTATGGATTTTTATGATAAAAATAT 
CTATTTATATGGTAATAATTTTGGACgCGGtGGAgAACTAATCTATGATT 
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CACTAGGTTATGCTGCCCCAGAAAAAGTCAAAAAAGATGTCTTTAAAAAA 
GGGTGGTTTACCGTTTCGCAAGAAGCAATCGGTGATTACGTTGGAGATTA 
TGCCCTTGTTAATATAAACAAAACGACTAAAAAAGCAGCTTCATCACTTA 
AAGAAAGTGATGTCTGGAAGAAtTTACCAGCTGTCAAAAAAGGGCACATC 
ATAGAAAGTAACTACGACGTGTTTTATTTCTCTGACCCTCTATCTTTAGA 
AGCTCAATTAAAATCATTTACAAA 

SEQ XD NO. 8607 

STRAIN COH1 
GAAGGCTTCACCTATTATG 

GAAAAATTCCTGAAAATCCGAAAAAAGTAATTAATTTTACATATTCTTAC 
ACTGGGTATTTATTAAAACTAGGTGTTAATGTTTCAAGTTACAGTTTAgA 
CTTAGAAAAAGATAGCCCCGTTTTTGGTAAGCAACTGAAAGAAGCTAAAA 
AATTAACTGCTGATGATACAGAAGCTATTGCCGCACAAAAACCTGATTTA 
ATCATGGTTTTCGATCAAGATCCAAACATCAATACTCTGAAAAAAATTGC 
ACCAACTTTAGTTATTAAATATGGTGCACAAAATTATTTAgATATGATGC 
CAGCCTTGGGGAAAGTaTTcGGTAAAGAAAAAGAAGCTAATCAGTGGGTT 
AGCCAATGGAAAACTAAAACTCTCGCTGCCAAAAAAGATTTACACCATAT 
CTTAAAGCCTAACACTACTTTTACTATTATGGATTTTTATGATAAAAATA 
. TCTATTTATATGGTAATAATTTTGGA(?GCGGTGGAGAACTAATCTATGAT 
•TCACTAGGTTATGCTGCCCCAGAAAAAGTCAAAAAAGATGTCTTTAAAAA 
AGGGTGGTTTACCGTTTGGCAAGAAGCAATCGGTGATTACGTTGGAGATT 
ATGCCCTTGTTAATATAAACAAAACGACTAAAAAAGCAGCTTCATCACTT 
AAAGAAAGTGATGTCTGGAAGAATTTACCAGCTGTCAAAAAAGGGCACAT 
CATAGAAAGTAACTACGACGTGTTTTATTTCTCTGACCCTCTATCTTTAG 
AAGCTCAATTAAAATCATTTACAAA 

SEQ ID NO. 8608 

STRAIN M781 
GAAGGCTTCACCTATTATGG 

AAAAATTCCTGAAAATCCGAAAAAAGTAATTAATTTTACATATTCTTACA 

CTGGGTATTTATTAAAACTAGGTGTTAATGTTTCAAGTTACAGTTTAGAC 

TTAgAAAAAGATAGCCCCGTTTTTGGTAAGCAACTGAAAGAAGCTAAAAA< 

ATT AACTGCT GATGATACAGAAGCT AT T GC CGC AC AAAAACCT GATTTAA 

TCATGGTTTTCGATCAAGATCCAAACATCAATACTCTGAAAAAAATTGCA 

CCAACTTTAGTTATTAAATATGGTGCACAAAATTATTTAgATATGATGCC 

AGCCTTGGGGAAAGTATTCGGtAAAGAAAAAGAAGCTAATCAGTGGGTTA 

GCCAATGGAAAACTAAAACTCTCGCTGCCAAAAAAGATTTACACCATATC 

TTAAAGCCTAACACTACTTTTACTATTATGGATTTTTATGATAAAAATAT 

CTATTTATATGGTAATAATTTTGGACGCGGTGGAGAACTAATCTATGATT 

CACTAGGTTATGCTGCCCCAGAAAAAGTCAAAAAAGATGTCTTTAAAAAA 

GGGTGGTTTACCGTTTCGCAAGAAGCAATCGGTGATTACGTTGGAGATTA 

TGCCCTTGTTAATATAAACAAAACGACTAAAAAAGCAGCTTCATCACTTA 

AAGAAAGTGATGTCTGGAAGAATTTACCAGCTGTCAAAAAAGGGCACATC 

ATAGAAAGTAACTACGACGTGTTTTATTTCTCTGACCCTCTATCTTTAGA 

AGCTCAATTAAAATCATTTACAAA 

SEQ ID NO. 8609 

STRAIN CJB110 
GAAGGCTTCACCTATTATGGA 

AAAATTCCTGAAAATCCGAAAAAAGTAATTAATTTTACATATTCTTACAC 
TGGGTATTTATTAAAACTAGGTGTTAATGTTTCAAGTTACAGTTTAGACT 
TAGAAAAAGATAGCCCCGTTTTTGGTAAGCAACTGAAAGAAGCTAAAAAA 
TTAACTGCTGATGATACAGAAGCTATTGCCGCACAAAAACCTGATTTAAT 
CATGGTTTTCGATCAAGATCCAAACATCAATACTCTGAAAAAAATTGCAC 
CAACTTTAGTTATTAAATATGGTGCACAAAATTATTTAgATATGATGCCA 
GCCTTGGGGAAAGTATTCGGTAAAGAAAAAGAAGCTAATCAGTGGGTTAG 
CCAATGGAAAACTAAAACTCTCGCTGCCAAAAAAGATTTACACCATATCT 
TAAAGCCTAACACTACTTTTACTATTATGGATTTTTATGATAAAAATATC 
TATTTATATGGTAATAATTTTGGACGCGGtGGAGAACTAATCTATGATTC 
ACTAGGTTATGCTGCCCCAGAAAAAGTCAAAAAAGATGTCTTTAAAAAAG 
GGTGGTTTACCGTTTCGCAAGAAGCAATCGGTGATTACGTTGGAGATTAT 
GCCCTTGTTAATATAAACAAAACGACTAAAAAAGCAGCTTCATCACTTAA 
AGAAAGTGATGTCTGGAAGAATTTACCAGCTGTCAAAAAAGGGCACATCA 
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TAGAAAGTAACTACGACGTGTTTTATTTCTCTGACCCTCTATCTTTAGAA 
GCTCAATTAAAATCATTTACAAA 

SEQ ID NO. 8610 

STRAIN 1169NT 

GAAGGCT TCACCTATTATGGAAAAATT 

CCTGAAAATCCGAAAAAAGTAATTAATTTTACATATTCTTACACTGGGTA 

TTTATTAAAACTAGGTGTTAATGTTTCAAGTTACAGTTTAGACTTAGAAA 

AAGATAGCCCCGTTTTTGGTAAGCAACTGAAAGAAGCTAAAAAATTAACT 

GCTGATGATACAGAAGCTATTGCCgcACAAaaACCTGATTTAATCATGGT 

TTTCGATCAAGATCCAAACATCAATACTCTGAAAAAAATTGCACCAACTT 

TAGTTATTAAATATGGTGCACAAAATTATTTAgATATGATGCCAGCCTTG 

GGGAAAGTATTCGGTAAAGAAAAAGaaGCTAATCAGTGGGTTAGCCAATG - 

GAAAACTAAAACTCTCGCTGCCAAAAAAGATTTACACCATATCTTAAAGC 

CTAACACTACTTTTACTATTATGGATTTTTATGATAAAAATATCTATTTA 

TATGGTAATAATTTTGGACGCGGTGGAGAACTAATCTATGATTCACTAGG 

TTATGCTGCCCCAgAAAAAGTCAAAAAAGATGTCTTTAAAAAAGGGTGGT 

TTACCGTTTCgC^AGAAGCAATCGGTGATTACGTTGGAGATTATGCCCTT 

gttaatataaacaaaacgactaaaaaagca&cttcatcacttaaagaaag 
tgatgtctggaagaatttaccagctgtcaaaaaagggcacatcatagaaa 
gtaactaggacgtgttttatttctctgaccx:tctatctttagaagctcaa 
ttaaaatcatttacaaa 

SEQ ID NO. 8611 

STRAIN JM9130013 * * - 

GAAGGCTTCACCTATTATG 

GAAAAATTCCTGAAAATCCGAAAAAAGTAATTAATTTTACATATTCTTAC 
ACTGGATATTTATTAAAACTAGGAGTTAATGTTTCAAGTTACAGTTTAGA 
CTTAGAAAAAGATAGCCCCGTTTTTGGTAAGCAACTGAAAGGAGCTAAAA 
AATTAACTGCTGATGATAGAGAAGCTATTGCCGCACAAAAACCTGATTTA 
ATCATGGTTTTTGATCAAGATCCAAACATCAATACTCTGAAAAAAATTGC 
ACCAACTTTAGTTATTAAATATGGTGCACAAAATTATTTAgATATGATGC 
CAGCTTTGGGGAAAGTATTCGGTAAAGAAAAAGAAGCTAATCAGTGGGTT 
AGCCAATGGAAAACTAAAACTCTCGCTGCCAAAAAAGATTTACACCATAT 
CTTAAAACCTAACACTACTTTTACCATTATGGATTTTTATGATAAAAATA 
TCTATTTATATGGTAATAATTTTGGACGCGGtGGAGAACTAATCTATGAT 
TCACTAGGTTATGCTGCCCCAgAAAAAGTCAAAAAAGATGTCTTTAAAAA 
AGGGTGGTTTACCGTTTCgCAAGAAGCAATCGGTGATTACGTTGGAGATT 
ATGCCCTTGTTAATATAAACAAAACGACTAAAAAAGCAGCTTCATCACTT 
AAAGAAAGTGATGTCTGGAAGAATTTACCAGCTGTCAAAAAAGGGCACAT 
CATAGAAAGTAACTACGACGTGTTTTATTTCTCTGACCCTCTATCTTTAG 
AAGCTCAATTAAAATCATTTACAAA 

SEQ ID NO. 8612 
STRAIN 2603 frame: 1 

MKKIGIIVLTLLTFFLVSCGQQTKQESTKTTISKMPKIEGFTYYGKIPENPKKVINFTYS 
YTGYLLKLGVNVSSYSLDLEKDSPVFGKQLKEAKKLTADDTEAIAAQKPDLIMVFDQDPN 
INTLKKIAPTLVIKYGAQNYLDMMPALGKVFGKEKEANQWVSQWKTKTLAVKKDLHHILK 
PNTTFTIMDFYDKNIYLYGNNFGRGGELIYDSLGYAAPEKVKKDVFKKGWFTVSQEAIGD 
YVGDYALVNINKTTKKAASSLKESDVWKNLPAVKKGHIIESNYDVFYFSDPLSLEAQLKS 
FTKAIKENTN 

SEQ ID NO. 8613 

STRAIN 090 frame: 1 

EGFTYYGKIPENPKKVINFTYSYTGYLLKLGVNVSSYSLDLEKDSPVFGKQLKEAKKLTA 
DDTEAIAAQKPDLIMVFDQDPNINTLKKIAPTLVIKYGAQNYLDMMPALGKVFGKEKEAN 
QWVSQWKTKTLAAKKDLHHILKPNTTFTIMDFYDKNIYLYGNNFGRGGELIYDSLGYAAP 
EKVKKDVFKKGWFT VSQEAIGDYVGDYALVN INKTTKKAAS S LKES DVWKNLPAVKKGHI 
IESNYDVFYFSDPLSLEAQLKSFT 

SEQ ID NO. 8614 

STRAIN A909 frame: 1 

EGFTYYGKIPENPKKVINFTYSYTGYLLKLGVNVSSYSLDLEKDSPVFGKQLKGAKKLTA 
DDTEAIAAQKPDLIMVFDQDPNINTLKKIAPTLVIKYGAQNYLDMMPALGKVFGKEKEAN 
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QWVSQWKTKTLAAKKDLHHILKPNTTFTIMDFYDKNIYLYGNNFGRGGELIYDSLGYAAP 
EKVKKDVFKKGWFTVSQEAIGDYVGDYALVNINKTTKKAASSLKESDWKNLPAVKKGHI 
IESNYDVFYFSDPLSLEAQLKSFT 

SEQ ID NO. 8615 

STRAIN H36B frame: 1 

EGFTYYGKI PENPKKVINFTYS YTGYLLKLGVNVS S YSLDLEKDS PVFGKQLKGAKKLTA 
DDTEAIAAQKPDLIMVFDQDPNINTLKKIAPTLVIKYGAQNYLDMMPALGKVFGKEKEAN 
QWVSQWKTKTLAAKKDLHHILRPNTTFTIIDFYDKNIYLYGNNFGRGGELIYDSLGYAAP 
EKVKKDVFKKGWFTVSQEAIGDYVGDYALVNINKTTKBCAASSLKESDVWKNLPAVBCKGHI 
IESNYDVFYFSDPLSLEAQLKSFT 

SEQ ID NO. 8616 

STRAIN 18RS21 frame: 1 

EGFTYYGKI PEN PKKVINFTYSYTGYLLKLGVNVSS YSLDLEKDS PVFGKQLKEAKKLTA 
DDTEAIAAQKPDLIMVFDQDPNINTLKKIAPTLVIKYGAQNYLDMMPALGKVFGKEKEAN 
QWSQWKTKTLAVKKDLHHILKPNTTFTIMDFYDKNIYLYGNNF<?RGGELIYDSLGYAAP 
EKVKKDVFKKGWE^VSQEAIGDYVGDYALVNINKTTKKAASSLKESDVWKNLPAVKKGHI * 
IESNYDVFYFSDPLSLEAQLKSFT 

SEQ ID NO. 8617 

STRAIN M732 frame: 1 

EGFTYYGKI PENPKKVINFTYS YTGYLLKLGVNVS S YSLDLEKDS PVFGKQLKEAKKLTA 
DDTEAIAAQKPDLIMVFDQDPNINTLKKIAPTLVIKYGAQNYLDMMPALGKVFGKEKEAN 
QWSQWKTKTLAAKKDLHHILKPNTTFTIMDFYDKNIYLYGNNBX3RGGELIYDSLGYAAP . 
EKVKKDVFKKGWFTVSQEAIGDYVGD YALVN INKTTKKAAS S LKE S DVWKNLPAVKKGHI 
IESNYDVFYFSDPLSLEAQLKSFT ~ 

SEQ ID NO. 8618 

STRAIN COH1 frame: 1 

EGFTYYGKI PENPKKVINFTYSYTGYLLKLGVNVSSYSLDLEKDS PVFGKQLKEAKKLTA 
DDTEAIAAQKPDLIMVFDQDPNINTLKKIAPTLVIKYGAQNYLDMMPALGKVFGKEKEAN 
QWVSQWKTKTLAAKKDLHHILKPNTTFTIMDFYDKNIYLYGNNFGRGGELIYDSLGYAAP 
EKVKKDVFKKGWFTVSQEAIGDYVGDYALVNINKTTKKAASSLKESDVWKNLPAVKKGHI 
IESNYDVFYFSDPLSLEAQLKSFT 

SEQ ID NO. 8619 

STRAIN M781 frame: 1 

EGFTYYGKIPENPKKVINFTYSYTGYLLKLGVNVSSYSLDLEKDSPVFGKQLKEABCKLTA 
DDTEAIAAQKPDLIMVFDQDPNINTLKKIAPTLVIKYGAQNYLDMMPALGKVFGKEKEAN 
QWVSQWKTKTLAAKKDLHHILKPNTTFTIMDFYDKNIYLYGNNFGRGGELIYDSLGYAAP 
EKVKKDVFKKGWFTVSQEAIGDYVGDYALVNINKTTKKAASSLKES DVWKNLPAVKKGHI 
IESNYDVFYFSDPLSLEAQLKSFT 

SEQ ID NO. 8620 

STRAIN CJB110 frame: 1 

EGFTYYGKIPENPKKVINFTYSYTGYLLKLGVNVSS YSLDLEKDS PVFGKQLKEAKKLTA 
DDTEAIAAQKPDLIMVFDQDPNINTLKKIAPTLVIKYGAQNYLDMMPALGKVFGKEKEAN 
QWVSQWKTKTLAAKKDLHHILKPNTTFTIMDFYDKNIYLYGNNFGRGGELIYDSLGYAAP 
EKVKKDVFKKGWFTVSQEAIGDYVGDYALVNINKTTKKAASSLKES DVWKNLPAVKKGHI 
IESNYDVFYFSDPLSLEAQLKSFT 

SEQ ID NO. 8621 

STRAIN 1169NT frame: 1 

EGFTYYGKI PEN PKKVINFTYSYTGYLLKLGVNVSS YSLDLEKDS PVFGKQLKEAKKLTA 
DDTEAIAAQKPDLIMVFDQDPNINTLKKIAPTLVIKYGAQNYLDMMPALGKVFGKEKEAN 
QWVSQWKTKTLAAKKDLHHILKPNTTFTIMDFYDKNIYLYGNNFGRGGELIYDSLGYAAP 
EKVKKDVFKKGWFTVSQEAIGDYVGDYALVNINKTTKKAASSLKES DVWKNLPAVKKGHI 
IESNYDVFYFSDPLSLEAQLKSFT 

SEQ ID NO. 8622 

STRAIN JM9130013 frame: 1 

EGFTYYGKI PEN PKKVINFTYSYTGYLLKLGVNVSS YSLDLEKDS PVFGKQLKGAKKLTA 
DDTEAIAAQKPDLIMVFDQDPNINTLKKIAPTLVIKYGAQNYLDMMPALGKVFGKEKEAN 
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QWVSQWKTKTLAAKKDLHHILKPNTTFTIMDFYDKNIYLYGNNFGRGGELIYDSLGYAAP 
EKVKKDVFKKGW FTVS QEAIGDYVGD YALVN INKTTKKAAS SLKE S DVWKNLPAVKKGH I 
IESNYDVFYFSDPLSLEAQLKSFT 

SEQ ID NO. 8701 
STRAIN 2603 

ATGAAATTATCGAAGAAGTTATTGTTTTCGGCTGCTGTT 

TTAACAATGGTGGCGGGGTCAACTGTTGAACCAGTAGCTCAGTTTGCGACTGGAATGAGT • 

ATTGTAAGAGCTGCAGAAGTGTCACAAGAACGCCCAGCGAAAACAACAGTAAATATCTAT 

AAATTACAAGCTGATAGTTATAAATCGGAAATTACTTCTAATGGTGGTATCGAGAATAAA 

GACGGCGAAGTAATATCTAACTATGCTAAACTTGGTGACAATGTAAAAGGTTTGCAAGGT 

GTACAGTTTAAACGTTATAAAGTCAAGACGGATATTTCTGTTGATGAATTGAAAAAATTG 

ACAACAGTTGAAGCAGCAGATGCAAAAGTTGGAACGATTCTTGAAGAAGGTGTCAGTCTA 

CCTCAAAAAACTAATGCTCAAGGTTTGGTCGTCGATGCTCTGGATTCAAAAAGTAATGTG 

AGATACTTGTATGTAGAAGATTTAAAGAATTCACCTTCAAACATTACCAAAGCTTATGCT 

GTACCGTTTGTGTTGGAATTACCAGTTGCTAACTCTACAGGTACAGGTTTCCTTTCTGAA 

ATTAATATTTACCCTAAAAACGTTGTAACTGATGAACCAAAAACAGATAAAGATGTTAAA 

AAATTAGGTCAGGACGATGCAGGTTATACGATTGGTGAAGAATTCAAATGGTTCTTGAAA 

TCTACAATCCCTGCCAATTTAGGTGACTATGAAAAATTTGAAATTACTGATAAATTTGCA 

GATGGCTTGACTTATAAATCTGTTGGAAAAATCAAGATTGGTTCGAAAACACTQAATAGA 

GATGAGCACTACACTATTGATGAACCAACAGTTGATAACCAAAATACATTAAAAATTACG 

TTTAAACCAGAGAAATTTA^GAAATTGCTGAGGTACTTAAAGGAATGACCCTTGTTAAA 

AATCAA^TGCTCTTGATAAAGCTACTGCAAATACAGATGATGCGGCATTTTTGGAAATT 

CCAGTTGC^TCAACTATTAATGAAA^GCAGTTTTAGGATIAAGCAATTGAAAATACTTTT 

GAACTTCAATATGACCATACTCCTGATAAAGCTGACAATCCAAAACCATCTAATCCTCCA 

AGAAAACCAGAAGTTCATACTGGTGGGAAACGATTTGTAAAGAAAGACTCAACAGAAACA 

CAAACACTAGGTGGTGCTGAGTTTGATTTGTTGGCTTCTGATGGGACAGCAGTAAAATGG 

ACAGATGCTCTTATTAAAGCGAATACTAATAAAAACTATATTGCTGGAGAAGCTGTTACT 

GGGCAACCAATCAAATTGAAATCACATACAGACGGTACGTTTGAGATTAAAGGTTTGGCT 

TATGCAGTTGATGCGAATGCAGAGGGTACAGCAGTAACTTACAAATTAAAAGAAACAAAA 

GCACCAGAAGGTTATGTAATCCCTGATAAAGAAATCGAGTTTACAGTATCACAAACATCT 

TATAATACAAAACCAACTGACATCACGGTTGATAGTGCTGATGCAACACCTGATACAATT 

AAAAACAACAAACGTCCTTCAATCCCTAATACTGGTGGTATTGGTACGGCTATCTTTGTC 

GCTATCGGTGCTGCGGTGATGGCTTTTGCTGTTAAGGGGATGAAGCGTCGTACAAAAGAT 

AAC 

SEQ ID NO. 8702 

STRAIN 090 

GCAGAAGTGTCACAAGAACGCCCAGCGAAAAC 

AGCAGTAAATATCTATAAATTACAAGCTGATAGTTATAAATCGGAAATTA 
CTTCTAATGGTGGTATCGAGAATAAAGACGGCGAAGTAATATCTAACTAT 
GCTAAACTTGGTGACAATGTAAAAGGTTTGCAAGGTGTACAGTTTAAACG 
TTATAAAGTCAAGACGGATATTTCTGTTGATGAATTGAAAAAATTGACAA 
CAGTTGAAGCAGCAGATGCAAAAGTTGGAACGATTCTTGAAGAAGGTGTC 
AGTCTACCTCAAAAAACTAATGCTCAAGGTTTGGTCGTCGATGCTCTGGA 
TTCAAAAAGTAATGTGAGATACTTGTATGTAGAAGATTTAAAGAATTCAC 
CTTCAAACATTACCAAAGCTTATGCTGTACCGTTTGTGTTGGAATTACCA 
GTTGCTAACTCTACAGGTACAGGTTTCCTTTcTGAAATTAATATTTACCC 
TAAAAACGTTGTAACTGATGAACCAAAAACAGATAAAGATGTT7UVAAAAT 
TAGGTCAGGACGATGCAGGTTATACGATTGGTGAAGAATTCAAATGGTTC 
TTGAAATCTACAATCCCTGCCAATTTAGGTGACTATGT^AAAATTTGAAAT 
TACTGATAAATTTGCAGATGGCTTGACTTATAAATCTGTTGGAAAAATCA 
AGATTGGTTCGAAAACACTGAATAGAGATGAGCACTACACTATTGATGAA 
CCAACAGTTGATAACCAAAATACATTAAAAATTACGTTTAAACCAGAGAA 
ATTTAAAGAAATTGCTGAGCTACTTAAAGGAATGACCCTTGTTAAAAATC 
AAGATGCTCTTGATAAAGCTACTGCAAATACAGATGATGCGGCATTTTTG 
GAAATT CCAGTTGCAT CAACT ATTAATGAAAAAGCAGTTTTAGGAAAAGC 
AATTGAAAATACTTTTGAACTTCAATATGACCATACTCCTGATAAAGCTG 
ACAATCCAAAACCATCTAATCCTCCAAGAAAACCAGAAGTTCATACTGGT 
GGGAAACGATTTGTAAAGAAAGACTCAACAGAAACACAAACACTAGGTGG 
TGCTGAGTTTGATTTGTTGGCTTCTGATGGGACAGCAGTAAAATGGACAG 
ATGCTCTTATTAAAGCGAATACTAATAAAAACTATATTGCTGGAGAAGCT 
GTTACTGGGCAACCAATCAAATTGAAATCACATACAGACGGTACGTTTGA 
GATTAAAGGTTTGGCTTATGCAGTTGATGCGAATGCAGAGGGTACAGCAG 
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TAACTTACAAATTAAAAGAAACAAAAGC^CCAGAAGGTTATGTAATCCCT 
GATAAAGAAATCGAGTTTACAGTATCACAAACATCTTATAATACAAAACC 
AACTGACATCACGGTTGATAGTGCTGATGCAACACCTGATACAATTAAAA 
ACAACAAACGTCCTTCA 

SEQ ID NO. 8703 

STRAIN A909 

GCAGAAGTGTCACAAGAACGCCCAGCGAA 

AACAACAGTAAATATCTATAAATTACAAGCTGATAGTTATAAATCGGAAA 
TTACTTCTAATGGTGGTATCGAGAATAAAGACGGCGAAGTAATATCTAAC 
TATGCTAAACTTGGTGACAATGTAAAAGGTTTGCAAGGTGTACAGTTTAA 
ACGTTATAAAGTCAAGACGGATATTTCTGTTGATGAATTGAAAAAATTGA 
CAACAGTTGAAGCAGCAGATGCAAAAGTTGGAACGATTCTTGAAGAAGGT 
GTCAGTCTACCTCAAAAAACTAATGCTCAAGGTTTGGTCGTCGATGCTCT 
GGATTCAAAAAGTAATGTGAGATACTTGTATGTAGAAGATTTAAAGAATT 
CACCTTCAAACATTACCAAAGCTTATGCTGTACCGTTTGTGTTGGAATTA 
CCAGTTGCTAACTCTACAGGTACAGGTTTCCTTTCTGAAATTAATATTTA 
CCCTAaaAACGTTGTAACTGATGAACCAAAA^CAGATAAAGATGTTAAAA 
AATTAGGTCAGGACGATGCAGGTTATACGATTGGTGAAGAATTCAAATGG 
TTCTTGAAATCTACAATCCCTGCCAATTTAGGTGACTATGAAAAATTTGA 
AATTACTGATAAATTTGCAGATGGCTTGACTTATAAATCTGTTGGAAAAA 
TCAAGATTGGTTCGAAAACACTGAATAGAGATGAGCACTACACTATTGAT 
GT^CCAACAGTTGATAACCAAAATACATTAAAAATTACGTTTAAACCAGA 
GAAATTTAAAGAAATTGCTGAGCTACTTAAAGGAATGACCCTTGTTAAAA 
ATC^AGATGCTCTTCATAAAGCTACTGCAAAfTACAGATGATGCGGCATTT 
TTGGAAATTCCAGTTGGATCAACTATTAATGAAAAAGCAGTTTTAGGAAA 
AGCAATTGAAAATACTTTTGAACTTCAATATGACCATACtCCTGATAAAG 
CTGACAATCCAAAACCATCTAATCCTCCAAGAAAACCAGAAGTTCATACT 
GGTGGGAAACGATTTGTAAAGAAAGACTCAACAGAAACACAAACACTAGG 
TGGTGCTGAGTTTGATTTGTTGGCTTCTGATGGGACAGCAGTAAAATGGA 
CAGATGCTCTTATTAAAGCGAATACTAATAAAAACTATATTGCTGGAGAA 
GCTGTTACTGGGCAACCAATCAAATTGAAATCACATACAGACGGTACGTT 
TGAGATTAAAGGTTTGGCTTATGCAGTTGATGCGAATGCAGAGGGTACAG 
CAGTAACTTACAAATTAAAAGAAACAAAAGCACCAGAAGGTTATGTAATC 
CCTGATAAAGAAATCGAGTTTACAGTATCACAAACATCTTATAATACAAA 
ACCAACTGACATCACGGTTGATAGTGCTGATGCAACACCTGATACAATTA 
AAAACAACAA 

SEQ ID NO. 8704 

STRAIN 18RS21 

GCAGAAGTGTCACAAGAACGCCCAGCGAAAAC 

AGCAGTAAATATCTATAAATTACAAGCTGATAGTTATAAATCGGAAATTA 
CTTCTAATGGTGGTATCGAGAATAAAGACGGCGAAGTAATATCTAACTAT 
GCTAAACTTGGTGACAATGTAAAAGGTTTGCAAGGTGTACAGTTTAAACG 
TTATAAAGTCAAGACGGATATTTCTGTTGATGAATTGAAAAAATTGACAA 
CAGTTGAAGCAGCAGATGCAAAAGTTGGAACGATTCTTGAAGAAGGTGTC 
AGTCTACCTCAAAAAACTAATGCTCAAGGTTTGGTCGTCGATGCTCTGGA 
TTCAAAAAGTAATGTGAGATACTTGTATGTAGAAGATTTAAAGAATTCAC 
CTTCAAACATTACCAAAGCTTATGCTGTACCGTTTGTGTTGGAATTACCA 
GTTGCTAACTCTACAGGTACAGGTTTCCTTTCTGAAATTAATATTTACCC 
TAAAAACGTTGTAACTGATGAACCAAAAACAGATAAAGATGTTAAATAAT 
TAGGTCAGGACGATGCAGGTTATACGATTGGTGAAGAATTCAAATGGTTC 
TTGAAATCTACAATCCCTGCCAATTTAGGTGACTATGAAAAATTTGAAAT 
TACTGATAAATTTGCAGATGGCTTGACTTATAAATCTGTTGGAAAAATCA 
AGATTGGTTCGAAAACACTGAATAGAGATGAGCACTACACTATTGATGAA 
CCAACAGTTGATAACCAAAATACATTAAAAATTACGTTTAAACCAgAGAA 
ATTTAAAGAAATTGCTGAGCTACTTAAAGGAATGACCCTTGTTAAAAATC 
AAGATGCTCTTGATAAAGCTACTGCAAATACAGATGATGCGGCATTTTTG 
GAAATTCCAGTTGCATCAACTATTAATGAAAAAGCAGTTTTAGGAAAAGC 
AATTGAAAATACTTTTGAACTTCAATATGACCATACTCCTGAtAAAGCtG 
ACAATCCAAAACCATCTAATCCTCCAAGAAAACCAGAAGTTCATACTGGT 
GGGAAACGATTTGTAAAGAAAGACTCAACAGAAACACAAACACTAGGTGG 
TGCTGAGTTTGATTTGTTGGCTTCTGATGGGACAGCAGTAAAATGGACAG 
ATGCTCTTATTAAAGCGAATACTAATAAAAACTATATTGCTGGAGAAGCT 
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GTTACTGGGCAACCAATCAAATTGAAATCACATACAGACGGTACGTTTGA 
GATTAAAGGTTTGGCTTATGCAGTTGATGCGAATGCAGAGGGTACAGCAG 
TAACTTACAAATTAAAAGAAACAAAAGCACCAGAAGGTTATGTAATCCCT 
GATAAAGAAATCGAGTTTACAGTATCACAAACATCTTATAATACAAAACC 
AACTGACATCACGGTTGATAGTGCTGATGCAACACCTGATACAATTAAAA 
ACAACAAACGTCCTTCA 

SEQ XD NO. 8705 

STRAIN M732 

GCAGAAGTGTCACAAGAACGCCCAGCGAAAACAACAGT 

AAATATCTATAAATTACAAGCTGATAGTTATAAATCGGAAATTACTTCTA 

ATGGTGGTATCGAGAATAAAGACGGCGAAGTAATATCTAACTATGCTAAA 

CTTGGTGACAATGTAAAAGGTTTGCAAGGTGTACAGTTTAAACGTTATAA 

AGTCAAGACGGATATTTCTGTTGATGAATTGAAAAAATTGACAACAGtTG 

AAGCAGCAGATGCAAAAGTTGGAACGATTCTTGAAGAAGGTGTCAGTCTA 

CCTCAAAAAACTAATGCTCAAGGTTTGGTCGTCGATGCTCTGGATTCAAA 

AAGTAATGTGAGATACTTGTATGTAGAAGATTTAAAGAATTCACCTTCAA 

ACATTACCAAAGCTTATGCTGTACCGTTTGTGTTGGAATTACCAGTTGCT 

AACTCTACAGGTACAGGTTTCCTTTCTGaAATTAATATTTACCCTAAAAA 

CGTTGTAACTGATGAACCAAAAACAGATAAAGATGTTAAAAAATTAGGTC 

AGGACGATGCAGGTTATACGATTGGTGAAGAATTCAAATGGTTCTTGAAA 

TCTACAATCCCTGCCAATTTAGGTGACTATGAAAAATTTGAAATTACTGA 

TAAATTTGCAGATGGCTTGACTTATAAATCTGTTGGAAAAATCAAGATTG 

GTTCGAAAACACTGAATAGAGATGAGCACTACACTATTGATGAACCAACA 

GTTGATAACCAAAATACATTAAAAATTACGTTTAAACCAGAGAAATTTAA 

AGAAATTGCTGAGCTACTTAAAGGAATGACCCTTGTTAAAAATCAAGATG 

CTCTTGATAAAGCTACTGCAAATACAGATGATGCGGCATTTTTGGAAATT 

CCAGTTGCATCAACTATTAATGAAAAAGCAGTTTTAGGAAAAGCAATTGA 

AAATACTTTTGAACTTCAATATGACCATACTCCTGATAAAGCTGACAATC 

CAAAACCATCTAATCCTCCAAGAAAACCAGAAGTTCATACTGGTGGGAAA 

CGATTTGTAAAGAAAGACTCAACAGAAACACAAACACTAGGTGGTGCTGA 

GTTTGATTTGTTGGCTTCTGATGGGACAGCAGTAAAATGGACAGATGCTC 

TTATTAAAGCGAATACTAATAAAAACTATATTGCTGGAGAAGCTGTTACT 

GGGCAACCAATCAAATTGAAATCACATACAGACGGTACGTTTGAGATTAA 

AGGTTTGGCTTATGCAGTTGATGCGAATGCAGAGGGTACAGCAGTAACTT 

ACAAATTAAAAGAAACAAAAGCACCAGAAGGTTATGTAATCCCTGATAAA 

GAAATCGAGTTTACAGTATCACAAACATCTTATAATACAAAACCAACTGA 

CATCACGGTTGATAGTGCTGATGCAACACCTGATACAATTAAAAACAACA 

AACGTCCTTCA 

SEQ ID HO. 8706 

STRAIN COH1 

GCAGAAGTGTCACAAGAACGCCCAGCGAAAAC 

AGCAGTAAATATCTATAAATTACAAGCTGATAGTTATAAATCGGAAATTA 
CTTnTAATGGTGGTATCGAGAATAAAGACGGCGAAGTAATATCTAACTAT 
GCTAAACTTGGTGACAATGTAAAAGGTTTGCAAGGTGTACAGTTTAAACG 
TTATAAAGTCAAGACGGATATTTCTGTTGATGAATTGAAAAAATTGACAA 
CAGTTGAAGCAGCAGATGCAAAAGTTGGAACGATTCTTGAAGAAGGTGTC 
AGTCTACCTCAAAAAACTAATGCTCAAGGTTTGGTCGTCGATGCTCTGGA 
TTCAAAAAGTAATGTGAGATACTTGTATGTAGAAGATTTAAAGAATTCAC 
CTTCAAACATTACCAAAGCTTATGCTGTACCGTTTGTGTTGGAATTACCA 
GTTGCTAACTCTACAGGTACAGGTTTCCTTTCTGAAATTAATATTTACCC 
TAAAAACGTTGTAACTGATGAACCAAAAACAGATAAAGATGTTAAAAAAT 
TAGGTCAGGACGATGCAGGTTATACGATTGGTGAAGAATTCAAATGGTTC 
TTGAAATCTACAATCCCTGCCAATTTAGGTGACTATGAAAAATTTGAAAT 
TACTGAT AAATTTGCAGATGGCTTGACTTATAAAT CTGTTGGAAAAAT CA 
AGATTGGTTCGAAAACACTGAATAGAGATGAGCACTACACTATTGATGAA 
CCAACAGTTGATAACCAAAATACATTAAAAATTACGTTTAAACCAGAGAA 
ATTTAAAGAAATTGCTGAGCTACTTAAAGGAATGACCCTTGTTAAAAATC 
AAGATGCTCTTGATAAAGCTACTGCAAATACAGATGATGCGGCATTTTTG 
GAAATTCCAGTTGCATCAACTATTAATGAAAAAGCAGTTTTAGGAAAAGC 
AATTGAAAATACTTTTGAACTTCAATATGACCATACTCCTGATAAAGCTG 
ACAATCCAAAACCATCTAATCCTCCAAGAAAACCAGAAGTTCATACTGGT 
GGGAAACGATTTGTAAAGAAAGACTCAACAGAAACACAAACACTAGGTGG 
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TGCTGAGTTTGATTTGTTGGCTTCTGATGGGACAGCAGTAAAATGGACAG 
ATGCTCTTATTAAAGCGAATACTAATAAAAACTATATTGCTGGAGAAGCT 
GTTACTGGGCAACCAATCAAATTGAAATCACATACAGACGGTACGTTTGA 
GATTAAAGGTTTGGCTTATGCAGTTGATGCGAATGCAGAGGGTACAGCAG 
TAACTTACAAATTAAAAGAAACAAAAGCACCAGAAGGTTATGTAATCCCT 
GATAAAGAAATCGAGTTTACAGTATCACAAACATCTTATAATACAAAACC 
AACTGACATCACGGTTGATAGTGCTGATGCAACACCTGATACAATTAAAA 
ACAACAAACGTCCTTCA 

SEQ ID NO. 8707 

STRAIN NT781 

GCAGAAGTGTCACAAGAACGCCCAGCGAAAACAG 

CAGTAAATATCTATAAATTACAAGCTGATAGTTATAAATCGGAAATTACT 
TCTAATGGTGGTATCGAGAATAAAGACGGCGAAGTAATATCTAACTATGC 
TAAACTTGGTGACAATGTAAAAGGTTTGCAAGGTGTACAGTTTAAACGTT 
ATAAAGTCAAGACGGATATTTCTGTTGATGAATTGAAAAAATTGACAACA 
GTTGAAGCAGCAGATGCAAAAGTTGGAACGATTCTTGAAGAAGGTGTCAG 
TCTACCT CAAAAAACTAATGCTCAAGGTTTGGT CGT CGATGCTCTGGATT 
CAAAAAGTAATGTGAGATACTTGTATGTAGAAGATTTAAAGAATTCAdCT 
TCAAACATTACCAAAGCTTATGCTGTACCGTTTGTGTTGGAATTACCAGT 
TGCTAACTCTAGAGGTAC^GGTTTCCTTT^ 



GGTCAGGACGATGCAGGTTATACGATTGGTGAAGAATTCAAATGGTTCTT 
GAAATCTACAATCCCTGCCAATTTAGGTGACTATGAAAAATTTGAAATTA 
CTGATAAATTTGCAGATGGCTTGACTTATAAATCTGTTGGAAAAATCAAG 
ATTGGTTCGAAAACACTGAATAGAGATGAGCACTACACTATTGATGAACC 
AACAGTTGATAACCAAAATACATTAAAAATTACGTTTAAACCAGAGAAAT 
TTAAAGAAATTGCTGAGCTACTTAi^GGAATGACCCTT(?rTAAAAATCAA 
GATGCTCTTGATAAAGCTACTGCAAATACAGATGATGCGGCATTTTTGGA 
AATTCCAGTTGCATCAACTATTAATGAAAAAGCAGTTTTAGGAAAAGCAA 
TTGAAAATACTTTTGAACTTCAATATGACCATACTCCTGATAAAGCTGAC 
AATCCAAAACCATCTAATCCTCCAAGAAAACCAGAAGTTCATACTGGTGG 
GAAACGATTTGTAAAGAAAGACTCAACAGAAACACAAACACTAGGTGGTG 
CTGAGTTTGATTTGTTGGCTTCTGATGGGACAGCAGTAAAATGGACAGAT 
GCTCTTATTAAAGCGAATACTAATAAAAACTATATTGCTGGAGAAGCTGT 
TACTGGGCAACCAATCAAATTGAAATCACATACAGACGGTACGTTTGAGA 
TTAAAGGTTTGGCTTATGCAGTTGATGCGAATGCAGAGGGTACAGCAGTA 
ACTTACAAATTAAAAGAAACAAAAGCACCAGAAGGTTATGTAATCCCTGA 
TAAAGAAATCGAGTTTACAGTATCACAAACATCTTATAATACAAAACCAA 
CTGACATCACGGTTGATAGTGCTGATGCAACACCTGATACAATTAAAAAC 
AACAAACGT 

SEQ ID NO. 8708 

STRAIN CJB110 

GCAGAAGTGTCACAAGAACGCCCAGCGAA 

AACAGCAGTAAATATCTATAAATTACAAGCTGATAGTTATAAATTGGAAA 
TTACTTCTAATGGTGGTATCGAGAATAAAGACGGCGAAGTAATATCTAAC 
TATGCTAAACTTGGTGACAATGTAAAAGGTTTGCAAGGTGTACAGTTTAA 
ACGTTATAAAGTCAAGACGGATATTTCTGTTGATGAATTGAAAAAATTGA 
CAACAGTTGAAGCAGCAGATGCAAAAGTTGGAACGATTCTTGAAGAAGGT 
GTCAGTCTACCTCAAAAAACTAATGCTCAAGGTTTGGTCGTCGATGCTCT 
GGATTCAAAAAGTAATGTGAGATACTTGTATGTAGAAGATTTAAAGAATT 
CACCTTCAAACATTACCAAAGCTTATGCTGTACCGTTTGTGTTGGAATTA 
CCAGTTGCTAACTCTACAGGTACAGGTTTCCTTTCTGAAATTAATATTTA 
CCCTAAAAACGTTGTAACTGATGAACCAAAAACAGATAAAGATGTTAAAA 
AATTAGGTCAGGACGATGCAGGTTATACGATTGGTGAAGAATTCAAATGG 
TTCTTGAAATCTACAATCCCTGCCAATTTAGGTGACTATGAAAAATTTGA 
AATTACTGATAAATTTGCAGATGGCTTGACTTATAAATCTGTTGGAAAAA 
TCAAGATTGGTTCGAAAACACTGAATAGAGATGAGCACTACACTATTGAT 
GAACCAACAGTTGATAACCAAAATACATTAAAAATTACGTTTAAACCAGA 
GAAATTTAAAGAAATTGCTGAGCTACTTAAAGGAATGACCCTTGTTAAAA 
ATCAAGATGCTCTTGATAAAGCTACTGCAAATACAGATGATGCGGCATTT 
TTGGAAATTCCAGTTGCATCAACTATTAATGAAAAAGCAGTTTTAGGAAA 
AGCAATTGAAAATACTTTTGAACTTCAATATGACCATACTCCTGATAAAG 
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CTGACAATcCAAAACC^TCTAATCCTCCAAGAAAACCAGAAGTTCATACT 
GGTGGGAAACGATTTGTAAAGAAAGACTCAACAGAAACACAAACACTAGG 
TGGTGCTGAGTTTGATTTGTTGGCTTCTGATGGGACAGCAGTAAAATGGA 
CAGATGCTCTTATTAAAGCGAATACTAATAAAAACTATATTGCTGGAGAA 
GCTGTTACTGGGCAACCAATCAAATTGAAATCACATACAGACGGTACGTT 
TGAGATTAAAGGTTTGGCTTATGCAGTTGATGCGAATGCAGAGGGTACAG 
CAGTAACTTACAAATTAAAAGAAACAAAAGCACCAGAAGGTTATGTAATC 
CCTGATAAAGAAATCGAGTTTACAGTATCACAAACATCTTATAATCCAAA 
ACCAACTGACATCACGGTTGATAGTGCTGATGCAACACCTGATACAATTA 
AAAACAACAAACGTCCTTCA 

SBQ ID NO. 8709 

strain jm9130013 

gcagaagtgt cacaagaacgcccagcgaaaacagcagta 

aatatctataaattacaagctgatagttataaatcggaaattacttctaa 

tggtggtatcgagaataaagacggcgaagtaatatctaactatgctaaac 

ttggtgacaatgtaaaaggtttgcaaggtgtacagtttaaacgttataaa 

gtcaagacggatatttctgttgatgaattgaaaaaattgacaacagttga 

agcagcagatgcaaaagttggaacgattcttgaagaaggtgtcagtctac 

ctcaaaaaactaatgctc^aggtttggtcgtcgatgctctg(3attcaaaa 

agtaatgtgagatacttgtatgtagaagatttaaAgaattcaccttcaaa 

CATTACCAAAGCTTATGCTGTACCGTTTGTGTTGGAATTACCAGTTGCTA 

actctacaggtacaggtttccJtttctgaaattaatatttaccctaaaaac 
gttgtaactgatgaaccaaaaacagataaagatgttaaaaaa'ftaggtca 
ggacgatgcaggttatacgattggtgaagaattcaaatggttcttgaaat 
ctacaatccctgccaatttaggtgactatgaaaaatttgaaattac'tgat 
aaatttgcagatggcttgacttataaatctgttggaaaaatcaagattgg 
ttcgaaaacactgaatagagatgagcactacactattgatgaaccaacag 
ttgataaccaaaat ac at t aaaaat t acgt t taaac c agagaaatt t aaa 
gaaattgctgagctacttaaaggaatgacccttgttaaaaatcaagatgc 
tcttgataaagctactgcaaatacagatgatgcggcatttttggaaattc 
cagttgcatcaactattaatgaaaaagcagttttaggaaaagcaattgaa 
aatacttttgaacttcaatatgaccatactcctgataaagctgacaatcc 
aaaaccatct aat cct ccaagaaaaccagaagtt catactggtgggaaac 
gatttgtaaagaaagactcaacagaaacacaaacactaggtggtgctgag 

TTTGATTTGTTGGCTTCTGATGGGACAGCAGTAAAATGGACAGATGCTCT 
TATTAAAGCGAATACTAATAAAAACTATATTGCTGGAGAAGCTGTTACTG 
GGCAACCAATCAAATTGAAATCACATACAGACGGTACGTTTGAGATTAAA 
GGTTTGGCTTATGCAGTTGATGCGAATGCAGAGGGTACAGCAGTAACTTA 
CAAATTAAAAGAAACAAAAGCACCAGAAGGTTATGTAATCCCTGATAAAG 
AAATCGAGTTTACAGTATCACAAACATCTTATAATACAAAACCAACTGAC 
ATCACGGTTGATAGTGCTGATGCAACACCTGATACAATTAAAAACAACAA 
ACGTCCTTCA ' 



SEQ ID NO. 8710 
STRAIN 2603 frame: 1 

MKLSKKLLFSAAVLTMVAGSTVEPVAQFATGMSIVRAAEVSQERPAKTTVNIYKLQADSY 
KSEITSNGGIENKDGEVI SNYAKLGDNVKGLQGVQFKRYKVKTDISVDELKKLTTVEAAD 
AKVGTILEEGVSLPQKTNAQGLWDALDSKSNVRYLYVEDLKNSPSNITKAYAVPFVLEL 
PVANSTGTGFLSEINIYPKNWTDEPKTDKDVKKLGQDDAGYTIGEEFKWFLKSTIPANL 
GDYEKFEITDKFADGLTYKSVGKIKIGSKTLNRDEHYTIDEPTVDNQNTLKITFKPEKFK 
EIAELLKGMTLVKNQDALDKATANTDDAAFLEIPVASTINEKAVLGKAIENTFELQYDHT 
PDKADNPKPSNPPRKPEVHTGGKRFVKKDSTETQTLGGAEFDLLASDGTAVKWTDALIKA 
NTNKNYIAGEAVTGQPIKLKSHTDGTFEIKGLAYAVDANAEGTAVTYKLKETKAPEGYVI 
PDKEIEFTVSQTSYNTKPTDITVDSADATPDTIKNNKRPSIPNTGGIGTAIFVAIGAAVM 
AFAVKGMKRRTKDN 



SEQ XD NO. 8711 

STRAIN 090 frame: 1 

AEVSQERPAKTAVNIYKLQADSYKSEITSNGGIENKDGEVISNYAKLGDNVKGLQGVQFK 
RYKVKTDISVDELKKLTTVE^ADAKVGTILEEGVSLPQKTNAQGLVVDALDSKSNVRYLY 
VEDLKNSPSNITKAYAVPFVLELPVANSTGTGFLSEINIYPKNWTDEPKTDKDVKKLGQ 
DDAGYTIGEEFKWFLKSTIPANLGDYEKFEITDKFADGLTYKSVGKIKIGSKTLNRDEHY 
TIDEPTVDNQNTLKITFKPEKFKEIAELLKGMTLVKNQDALDKATANTDDAAFLEIPVAS 
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TINEKAVLGKAIENTFELQYDHTPDKADNPKPSNPPRKPEVHTGGKRFVKKDSTETQTLG 
GAE FDLLAS DGTAVKWT DAL IKANTNKNYI AGEAVTGQP IKLKS HT DGT FE IKGLAYAVD 
ANAEGTAVTYKLKETKAPEGYVIPDKEIEFTVSQTSYNTKPTDITVDSADATPDTIKNNK 
RPS 

SEQ ZD NO. 8712 

STRAIN 18RS21 frame: 1 

AEVSQERPAKTAVNIYKLQADSYKSEITSNGGIENKDGEVISNYAKLGDNVKGLQGVQFK 
RYKVKTDISVDELKKLTTVEAADAKVGTILEEGVSLPQKTNAQGLWDALDSKSNVRYLY 
VEDLKNSPSNITKAYAVPFVLELPVANSTGTGFLSEINIYPKNWTDEPKTDKDVK . LGQ 
DDAGYTIGEEFKWFLKSTIPANLGDYEKFEITDKFADGLTYKSVGKIKIGSKTLNRDEHY 
T I DE PTVDNQNT LKI T FKPEKFKE I AELLKGMT LVKNQDAL DKATANTDDAAFLE I PVAS 
TINEKAVLGKAIENTFELQYDHTPDKADNPKPSNPPRKPEVHTGGKRFVKKDSTETQTLG 
GAE FDLLAS DGTAVKWT DAL IKANTNKNYI AGEAVTGQP IKLKS HTDGTFE IKGLAYAVD 
ANAEGTAVTYKLKETKAPEGYVIPDKEIEFTVSQTSYNTKPTDITVDSADATPDTIKNNK 
RPS 

SEQ ID NO. 8713 

STRAIN M732 frame: 1 

AEVSQERPAKTTVNIYKLQADSYKSEITSNGGIENKDGEVISNYAKLGDNVKGLQGVQFK 
RYKVKTDISVDELKKLTTVEAADAKVGTILEEGVSLPQKTNAQGLVVDALDSKSNVRYLY 
VEDLKNSPSNITKAYAVPFViELPVANSTGTGFLSEINIYPKNVVTDEPKTDKDVKKLGQ 
DDAGYTIGEEFlCWFLKSTIPANLGDYEKFEITDKFADGLTYKSVGKIKIGSKTLNRDEHY 
T I DEPTVDNQNTLKIT FKPEKFKE IAELLKGMT LVKNQDAL DKATANTDDAAFLE I PVAS 
TINEKAVLGKAIENTFELQYDHTPDKADNPKPSNPPRKPEVHTGGKRFVKKDSTETQTLG 
GAE FDLLAS DGTAVJCWTDALIKANTNKNYIAGEAVTGQPIKLKSHT DGT FEIKGLAYAVD 
ANAEGTAVTYKL^ETKAPEGYVIPDKEIEFTVSQTSYNTKPTDITVDSADATPDTIKNNK 
RPS 

SEQ ID NO. 8714 

STRAIN M781 frame: 1 

AEVSQERPAKTAVNIYKLQADSYKSEITSNGGIENKDGEVISNYAKLGDNVKGLQGVQFK 
RYKVKTDISVDELICKLTTVEAADAKVGTILEEGVSLPQKTNAQGLWDALDSKSNVRYLY 
VEDLKNSPSNITKAYAVPFVLELPVANSTGTGFLSEINIYPKNVVTDEPKTDKDVKKLGQ 
DDAGYTIGEEFKWFLKSTIPANLGDYEKFEITDKFADGLTYKSVGKIKIGSKTLNRDEHY 
T I DEPTVDNQNTLKIT FKPEKFKE I AELLKGMTLVKNQDALDKAT ANT DDAAFLE I PVAS 
TINEICAVLGKAIENTFELQYDHTPDKADNPKPSNPPRKPEVHTGGKRFVKKDSTETQTLG 
GAEFDLLASDGTAVKWTDALIKANTNKNYIAGEAVTGQPIKLKSHTDGT FEIKGLAYAVD 
ANAEGTAVTYKLKETKAPEGYVIPDKEIEFTVSQTSYNTKPTDITVDSADATPDTIKNNK 
R 

SEQ ID NO. 8715 

STRAIN COH1 frame: 1 

AEVSQERPAKTAVNIYKLQADSYKSEITXNGGIENKDGEVISNYAKLGDNVKGLQGVQFK 
RYKVKTDISVDELKKLTTVEAADAKVGTILEEGVSLPQKTNAQGLWDALDSKSNVRYLY 
VEDLKNSPSNITKAYAVPFVLELPVANSTGTGFLSEINIYPKNWTDEPKTDKDVKKLGQ 
DDAGYTIGEEFKWFLKSTIPANLGDYEKFEITDKFADGLTYKSVGKIKIGSKTLNRDEHY 
T I DEPTVDNQNTLKIT FKPEKFKE I AELLKGMTLVKNQDALDKAT ANT DDAAFLE I PVAS 
TINEKAVLGKAIENTFELQYDHTPDKADNPKPSNPPRKPEVHTGGKRFVKKDSTETQTLG 
GAEFDLLASDGTAVKWTDALIKANTNKNYIAGEAVTGQPIKLKSHTDGT FEIKGLAYAVD 
ANAEGTAVTYKLKETKAPEGYVIPDKEIEFTVSQTSYNTKPTDITVDSADATPDTIKNNK 
RPS 

SEQ ID NO. 8716 

STRAIN CJB110 frame: 1 

AEVSQERPAKTAVNIYKLQADSYKLEITSNGGIENKDGEVISNYAKLGDNVKGLQGVQFK 
RYKVKT D I S VDE LKKLTT VE AAD AKVGT I LEEG VS L PQKTN AQGL WDALDSKSN VRYL Y 
VEDLKNSPSNITKAYAVPFVLELPVANSTGTGFLSEINIYPKNWTDEPKTDKDVKKLGQ 
DDAGYTIGEEFKWFLKSTIPANLGDYEKFEITDKFADGLTYKSVGKIKIGSKTLNRDEHY 
T I DEPTVDNQNTLKIT FKPEKFKE I AELLKGMT LVKNQDAL DKATANTDDAAFLE I PVAS 
TINEKAVLGKAIENTFELQYDHTPDKADNPKPSNPPRKPEVHTGGKRFVKKDSTETQTLG 
GAEFDLLASDGTAVKWTDALIKANTNKNYIAGEAVTGQPIKLKSHTDGTFEIKGLAYAVD 
ANAEGTAVTYKLKETKAPEGYVIPDKEIEFTVSQTSYNPKPTDITVDSADATPDTIKNNK 
RPS 
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SEQ ID NO. 8717 

STRAIN JM9130013 frame: 1 

AEVSQERPAKTAVNIYKLQADSYKSEITSNGGIENKDGEVISNYAKLGDNVKGLQGVQFK 
RYKVKTDISVDELKKLTTVEAADAKVGTILEEGVSLPQKTNAQGLVVDALDSKSNVRYLY 
VEDLKNSPSNITKAYAVPFVLELPVANSTGTGFLSEINIYPKNWTDEPKTDKDVKKLGQ 
DDAGYTIGEEFKWFLKSTIPANLGDYEKFEITDKFADGLTYKSVGKIKIGSKTLNRDEHY 
TIDEPTVDNQNTLKITFKPEKFKEIAELLKGMTLVKNQDALDKATANTDDAAFLEIPVAS 
TINEKAVLGKAIENTFELQYDHTPDKADNPKPSNPPRKPEVHTGGKRFVKKDSTETQTLG 
GAEFDLLAS DGTAVKWT DAIiIKANTNKNYIAGEAVTGQPIKLKSHTDGT FE IKGLAYAVD 
ANAEGTAVTYKLKETKAPEGYVIPDKEIEFTVSQTSYNTKPTDITVDSADATPDTIKNNK 
RPS 

SEQ ID NO. 8718 

STRAIN A909 frame: 1 

AEVSQERPAKTTVNIYKLQADSYKSEITSNGGIENKDGEVISNYAKLGDNVKGLQGVQFK 
RYKVKTDISVDELKKLTTVEAADAKVGTILEEGVSLPQKTNAQGLVVDALDSKSNVRYLY 
VEDLKNSPSNITKAYAVPFVLELPVANSTGTGFLSEINIYPKNVVTDEPKTDKDVKKLGQ 
DDAGYTIGEEFKWFLKSTIPANLGDYEKFEITDKFADGLTYKSVGKIKIGSKTLNRDEHY 
TIDEPTVDNQNTLKITFKPEKFKEIAELLKGMTLVKNQDALDKATANTDDAAFLEIPVAS 
TINEKAVLGKAIENTFELQYDH^PDKADNPKPSNPPRKPEVHTGGKRFVKKDSTETQT-LG 
GAEFDLLAS DGTAVKWT DAL IKANTNKNYIAGEAVTGQPIKLKSHTDGTFE IKGLAYAVD 
ANAEGTAVTYKLKETKAPEGWIPdKEIEjBTVSQT^YNTKPTDITVDSADATPDTIKNN 

SEQ ID NO. 8801 
STRAIN 2603 

ATGGCTAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAGTTGTCTTAACGGAATGGCAA 
AAGCGTAACCTTGAATTTTTAAAAAAACGCAAAGAAGATGAAGAAGAACAAAAACGTATT 
AACGAAAAATTACGCTTAGATAAAAGAAGTAAATTAAATATTTCTTCTCCTGAAGAACCT 
CAAAATACTACTAAAATTAAGAAGCTTCATTTTCCAAAGATTTCAAGACCTAAGATTGAA 
AAGAAACAGAAAAAAGAAAAAAT AGT CAACAGCT TAGCC AAAACT AATCGCATTAGAACT 
GCACCTATATTTGTAGTAGCATTCCTAGTCATTTTAGTTTCfGTTTTCCTACTAACTCCT 
TTTAGTAAGCAAAAAACAATAACAGTTAGTGGAAATCAGCATACACCTGATGATATTTTG 
ATAGAGAAAACGAATATTCAAAAAAACGATTATTTCTTTTCTTTAATTTTTAAACATAAA 
GCTATTGAACAACGTTTAGCTGCAGAAGATGTATGGGTAAAAACAGCTCAGATGACTTAT 
CAATTTCCCAATAAGTTTCATATTCAAGTTCAAGAAAATAAGATTATTGCATATGCACAT 
ACAAAGCAAGGATATCAACCTGTCTTGGAAACTGGAAAAAAGGCTGATCCTGTAAATAGT 
TCAGAGCTACCAAAGCACTTCTTAACAATTAACCTTGATAAGGAAGATAGTATTAAGCTA 
TTAATTAAAGATTTAAAGGCTTTAGACCCTGATTTAATAAGTGAGATTCAGGTGATAAGT 
TTAGCTGATTCTAAAACGACACCTGACCTCCTGCTGTTAGATATGCACGATGGAAATAGT 
ATTAGAATACCATTATCTAAATTTAAAGAAAGACTTCCTTTTTACAAACAAATTAAGAAG 
AACCTTAAGGAACCTTCTATTGTTGATATGGAAGTGGGAGTTTACACAACAACAAATACC 
ATTGAATCAACCCCTGTTAAAGCAGAAGATACAAAAAATAAAT CAACTGAT AAAACACAA 
ACACAAAATGGTCAGGTTGCGGAAAATAGTCAAGGACAAACAAATAACTCAAATACTAAT 
CAACAAGGACAACAGATAGCAACAGAGCAGGCACCTAACCCTCAAAATGTTAAT 

SEQ ID NO. 8802 
STRAIN H36B 

CCTAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAGTT 

GTCTTAACGGAATGGCAAAAGCGTAACCTTGAATTTTTAAAAAAACGCAA 

AGAAGATGAAGAAGAACAAAAACGTATTAACGAAAAATTACGCTTAGATA 

AAAGAAGTAAATTAAATATTTCTTCTCCTGAAGAACCTCAAAATACTACT 

AAAATTAAGAAGCTTCATTTTCCAAAGATTTCAAGACCTAAGATTGAAAA 

GAAACAGAAAAAAGAAAAAATAGTCAACAGCTTAGCCAAAACTAATCGCA 

TTAGAACTGCACCTATATTTGTAGTAGCATTCCTAGTCATTTTAGTTTCC 

GTTTTCCTACTAACTCCTTTTAGTAAGCAAAAAACAATAACAGTTAGTGG 

AAATCAGCATACACCTGATGATATTTTGATAGAGAAAACGAATATTCAAA 

AAAACGATTATTTCTTTTCTTTAATTTTTAAACATAAAGCTATTGAACAA 

CGTTTAGCTGCAGAAGATGTATGGGTAAAAACAGCTCAGATGACTTATCA 

ATTTCCCAATAAGTTTCATATTCAAGTTCAAGAAAATAAGATTATTGCAT 

ATGCACATACAAAGCAAGGATATCAACCTGTCTTGGAAACTGGAAAAAAG 

GCTGATCCTGTAAATAGTTCAGAGCTACCAAAGCACTTCTTAACAATTAA 

CCTTGATAAGGAAGATAGTATTAAGCTATTAATTAAAGATTTAAAGGCTT 

TAGACCCTGATTTAATAAGTGAGATTCAGGTGATAAGTTTAGCTGATTCT 
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AAAACGACACCTGACCTCCTGCTGTTAGATATGCACGATGGAAATAGTAT 
TAGAATACCATTATCTAAATTTAAAGAAAGACTTCCTTTTTACAAACAAA 
TTAAGAAGAACCTTAAGGAACCTTCTATTGTTGATATGGAAGTGGGAGTT 
TACACAACAACAAATACCATTGAATCAACCCCTGTTAAAGCAGAAGATAC 
AAAAAATAAATCAACTGATAAAACACAAACACAAAATGGTCAGGTTGCGG 
T^AAATAGTCAAGGACAAACAAATAACTCAAATACTAATCAACAAGGACAA 
CAGATAGCAACAGAGCAGGCACCTAACCCTCAAAATGTTAAT 

SEQ XD NO. 8803 
STRAIN 18RS21 

CCTAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAGTT 
GTCTTAACGGAATGGCAAAAGCGTAACCTTGAATTTTTAAAAAAACGCAA 
AGAAGATGAAGAAGAACAAAAACGTATTAACGAAAAATTACGCTTAGATA 
AAAGAAGTAAATTAAATATTTCTTCTCCTGAAGAACCTCAAAATACTACT 
AAAATTAAGAAGCTTCATTTTCCAAAGATTTCAAGACCTAAGATTGAAAA 
GAAACAGAAAAAAGAAAAAATAGTCAACAGCTTAGCCAAAACTAATCGCA 
TTAGAACTGCACCTATATTTGTAGTAGCATTCCTAGTCATTTTAGTTTCC 
GTTTTCCTACTAACTCCTTTTAGTAAGCAAAAAACAATAACAGTTAGTGG 
AAATCAGCATACACCTGATGATATTTTGATAGAGAAAACGAATATTCAAA 
AAAACGATTATTTCTTTTCTTTAATTTTTA?tACATAAAC3CTATTGAACAA 
CGTTtAGCTGCAGAAGATGTATGGGTAAAAACAGCTCAGATGACTTATCA 
ATTTCCCAATAAGTTTCATATTCAAGTTCAAGAAAATAAGATTATTGCAT 
ATGCACATACAAAGCAAGGATATCAACCTGTCTTGGAAACTGGAAAAAAG 
. GCTGATCCTGTAAATAGTTCAGAGCTACCAAAGCACTTCTTAACAATTAA 
CCTTGATAAGGAAGATAGTATTAAGCTATTAATTAAAGATTTAAAGGCTT 
TAGACCCTGATTTAATAAGTGAGATTCAGGTGATAAGTTTAGCTGATTCT 
AAAACGACACCTGACCTCCTGCTGTTAGATATGGACGATGGAAATAGTAT 

tagaataccattatctaaatttaaAgaaagacttcctttttacaaacaaa 

TTAAGAAGAACCTTAAGGAACCTTCTATTGTTGATATGGAAGTGGGAGTT 
TACACAACAACAAATACCATTGAATCAACCCCTGTTAAAGCAGAAGATAC 
AAAAAATAAATCAACTGATAAAACACAAACACAAAATGGTCAGGTTGCGG 
AAAATAGTCAAGGACAAACAAATAACTCAAATACTAATCAACAAGGACAA 
CAGATAGCAACAGAGCAGGCACCTAACCCTCAAAATGTTAAT 

SEQ ID NO. 8804 
STRAIN M732 

CCTAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAG 

TTGTCTTAACGGAATGGCAAAAGCGTAACCTTGAATTTTTAAAAAAACGC 

AAAGAAGATGAAGAAGAACAAAAACGTATTAACGAAAAATTACGCTTAGA 

TAAAAGAAGTAAATTAAATATTTCTTCTCCTGAAGAACCTCAAAATACTA 

CTAAAATTAAGAAGCTTCATTTTCCAAAGATTTCAAAACCTAAGATTGAA 

AAGAAACAGAAAAAAGAAAAAATAGTCAACAGCTTAGCCAAAACTAATCG 

CATTAGAACTGCACCTATATTTGTAGTAGCATTCCTAGTCATTTTAGTTT 

CCGTTTTCCTACTAACTCCTTTTAGTAAGCAAAAAACAATAACAGTTAGT 

GGAAATCAGCATACACCTGATGATATTTTGATAGAAAAAACGAATATTCA 

AAAAAACGATTATTTCTTTTCTTTAATTTTTAAACATAAAGCTATTGAAC 

AACGTTTAGCTGCAGAAGATGTATGGGTAAAAACAGCTCAGATGACTTAT 

CAATTTCCCAATAAGTTTCATATTCAAGTTCAAGAAAATAAGATTATTGC 

ATATGCACATACAAAGCAAGGATATCAGCCTGTCTTGGAAACTGGAAAAA 

AGGCTGATCCTGTAAATAGTTCAGAGCTACCAAAGCACTTCTTAACAATT 

AACCTTGATAAGGAAGATAGTATTAAGCTATTAATTAAAGATTTAAAGGC 

TTTAGACCCTGATTTAATAAGTGAGATTCAGGTGATAAGTTTAGCTGATT 

CTAAAACGACACCTGACCTCCTGCTGTTAGATATGCATGATGGAAATAGT 

ATTAGAATACCATTATCTAAATTTAAAGAAAGACTTCCTTTTTACAAACA 

AATTAAGAAGAACCTTAAGGAACCTTCTATTGTTGATATGGAAGTGGGAG 

TTTACACAACAACAAGTACTATTGAATCAACCCCTGTGAAAGCGGAAGAT 

ACAAAAAATAAATCAACTGATAAAACACAAACACAAAATGGTCAGGTTGC 

GGAAAATAGTCAAGGACAAACAAATAACTCAAATACTAATCAACAAGGAC 

AACAGATAGCAACAGAGCAGGCACCCAACCCTCAAAATGTTAAT 

SEQ ID NO. 8805 
STRAIN COH1 

CCTAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAGTT 
GTCTTAACGGAATGGCAAAAGCGTAACCTTGAATTTTTAAAAAAACGCAA 
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AGAAGATGAAGAAGAACAAAAACGTATTAACGAAAAATTACGCTTAGATA 
AAAGAAGTAAATTAAATATTTCTTCTCCTGAAGAACCTCAAAATACTACT 
AAAATTAAGAAGCTTCATTTTCCAAAGATTTCAAAACCTAAGATTGAAAA 
GAAACAGAAAAAAGAAAAAATAGTCAACAGCTTAGCCAAAACTAATCGCA 
TTAGAACTGCACCTATATTTGTAGTAGCATTCCTAGTCATTTTAGTTTCC 
GTTTTCCTACTAACTCCTTTTAGTAAGCAAAAAACAATAACAGTTAGTGG 
AAATCAGCATACACCTGATGATATTTTGATAGAAAAAACGAATATTCAAA 
AAAACGATTATTTCTTTTCTTTAATTTTTAAACATAAAGCTATTGAACAA 
CGTTTAGCTGCAGAAGATGTATGGGTAAAAACAGCTCAGATGACTTATCA 
ATTTCCCAATAAGTTTCATATTCAAGTTCAAGAAAATAAGATTATTGCAT 
ATGCACATACAAAGCAAGGATATCAGCCTGTCTTGGAAACTGGAAAAAAG 
GCTGATCCTGTAAATAGTTCAGAGCTACCAAAGCACTTCTTAACAATTAA 
CCTTGATAAGGAAGATAGTATTAAGCTATTAATTAAAGATTTAAAGGCTT 
TAGACCCTGATTTAATAAGTGAGATTCAGGTGATAAGTTTAGCTGATTCT 
AAAACGACACCTGACCTCCTGCTGTTAGATATGCATGATGGAAATAGTAT 
TAGAATACCATTATCTAAATTTAAAGAAAGACTTCCTTTTTACAAACAAA 
TTAAGAAGAACCTTAAGGAACCTTCTATTGTTGATATGGAAGTGGGAGTT 
TACACAACAACAAGTACTATTGAATCAACCCCTGTGAAAGCGGAAGATAC 
AAAAAATAAATCAACTGATAAAACACAAACAC^AAATGGTCAGGTTGCGG 
AAAATAGTCAAGGACAAACAAATAACTCAAATACTAATCAACAAGGACAA 
CAGATAGCAACAGAGCAGGCACCCAACCCTCAAAATGTTAAT 

SEQ ID NO. 8806 
STRAIN M781 

CCTAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAG 

TTGTCTTAACGGAATGGCAAAAGCGTAACCTTGAATTTTTAAAAAAACGC 

AAAGAAGATGAAGAAGAACAAAAACGTATTAACGAAAAATTACGCTTAGA 

TAAAAGAAGTAAATTAAATATTTCTTCTCCTGAAGAACCTCAAAATACTA 

CTAAAATTAAGAAGCTTCATTTTCCAAAGATTTCAAAACCTAAGATTGAA 

AAGAAACAGAAAAAAGAAAAAATAGTCAACAGCTTAGCCAAAACTAATCG 

CATTAGAACTGCACCTATATTTGTAGTAGCATTCCTAGTCATTTTAGTTT 

CCGTTTTCCTACTAACTCCTTTTAGTAAGCAAAAAACAATAACAGTTAGT 

GGAAATCAGCATACACCTGATGATATTTTGATAGAAAAAACGAATATTCA 

AAAAAACGATTATTTCTTTTCTTTAATTTTTAAACATAAAGCTATTGAAC 

AACGTTTAGCTGCAGAAGATGTATGGGTAAAAACAGCTCAGATGACTTAT 

CAATTTCCCAATAAGTTTCATATTCAAGTTCAAGAAAATAAGATTATTGC 

ATATGCACATACAAAGCAAGGATATCAGCCTGTCTTGGAAACTGGAAAAA 

AGGCTGATCCTGTAAATAGTTCAGAGCTACCAAAGCACTTCTTAACAATT 

AACCTTGATAAGGAAGATAGTATTAAGCTATTAATTAAAGATTTAAAGGC 

TTTAGACCCTGATTTAATAAGTGAGATTCAGGTGATAAGTTTAGCTGATT 

CTAAAACGACACCTGACCTCCTGCTGTTAGATATGCATGATGGAAATAGT 

ATTAGAATACCATTATCTAAATTTAAAGAAAGACTTCCTTTTTACAAACA 

AATTAAGAAGAACCTTAAGGAACCTTCTATTGTTGATATGGAAGTGGGAG 

TTTACACAACAACAAGTACTATTGAATCAACCCCTGTGAAAGCGGAAGAT 

ACAAAAAATAAATCAACTGATAAAACACAAACACAAAATGGTCAGGTTGC 

GGAAAATAGTCAAGGACAAACAAATAACTCAAATACTAATCAACAAGGAC 

AACAGATAGCAACAGAGCAGGCACCCAACCCTCAAAATGTTAAT 

SEQ ID NO. 8807 
STRAIN CJB110 

CCTAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAG 

TTGTCTTAACGGAATGGCAAAAGCGTAACCTTGAATTTTTAAAAAAACGC 

AAAGAAGATGAAGAAGAACAAAAACGTATTAACGAAAAATTACGCTTAGA 

TAAAAGAAGTAAATTAAATATTTCTTCTCCTGAAGAACCTCAAAATACTA 

CTAAAATTAAGAAGCTTCATTTTCCAAAGATTTCAAAACCTAAGATTGAA 

AAGAAACAGAAAAAAGAAAAAATAGTCAACAGCTTAGCCAAAACTAATCG 

CATTAGAACTGCACCTATATTTGTAGTAGCATTCCTAGTCATTTTAGTTT 

CCGTTTTCCTACTAACTCCTTTTAGTAAGCAAAAAACAATAACAGTTAGT 

GGAAAT C AGCATACACCTG ATGATATTTTGATAGAAAAAACGAAT ATT CA 

AAAAAACGATTATTTCTTTTCTTTAATTTTTAAACATAAAGCTATTGAAC 

AACGTTTAGCTGCAGAAGATGTATGGGTAAAAACAGCTCAGATGACTTAT 

CAATTTCCCAATAAGTTTCATATTCAAGTTCAAGAAAATAAGATTATTGC 

ATATGCACATACAAAGCAAGGATATCAGCCTGTCTTGGAAACTGGAAAAA 

AGGCTGATCCTGTAAATAGTTCAGAGCTACCAAAGCACTTCTTAACAATT 
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AACCTTGATAAGGAAGATAGTATTAAGCTATTAATTAAAGATTTAAAGGC 
TTTAGACCCTGATTTAATAAGTGAGATTCAGGTGATAAGTTTAGCTGATT 
CTAAAACGACACCTGACCTCCTGCTGTTAGATATGCATGATGGAAATAGT 
ATTAGAATACCATTATCTAAATTTAAAGAAAGACTTCCTTTTTACAAACA 
AATTAAGAAGAACCTTAAGGAACCTTCTATTGTTGATATGGAAGTGGGAG 
TTTACACAACAACAAGTACTATTGAATCAACCCCTGTGAAAGCGGAAGAT 
ACAAAAAATAAATCAACTGATAAAACACAAACACAAAATGGTCAGGTTGC 
GGAAAATAGTCAAGGACAAACAAATAACTCAAATACTAATCAACAAGGAC 
AACAGATAGCAACAGAGCAGGCACCCAACCCTCAAAATGTTAAT 

SEQ ID NO. 8808 
STRAIN 1169NT 

CCTAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAGT 
TGTCTTAACGGAATGGCAAAAGCGTAACCTTGAATTTTTAAAAAAACGCA 
AAGAAGATGAAGAAGAACAAAAACGTATTAACGAAAAATTACGCTTAGAT 
AAAAGAAGTAAATTAAATATTTCTTCTCCTGAAGAACCTCAAAATACTAC 
TAAAATTAAGAAGCTTCATTTTCCAAAGATTTCAAAACCTAAGATTGAAA 
AGAAACAGAAAAAAGAAAAAATAGTCAACAGCTTAGCCAAAACTAATCGC 
ATTAGAACTGCACCTATATTTATAGTAGCATTCCTAGTCATTTTAGTTTC 
CGTTTTCCTACTAACTCCTTTTAGTAAGCAAAAAACAATAACAGTTAGTG 
GAAATCAGCATACACCTGATGATATOTTGATAGAGAAAACGAATATTCAA 



ACGTTTAGCTGCAGAAGATGTATGGGTA?&AACAGCTCAGATGACTTATC 
AATTTCCCAACAAGTTTCATATTCAAGTTCAAGAAAATAAGATTATTGCA 
TAtGCACATACAAAGCAAGGATATCAGCCTGTCTTGGAAACTGGAAAAAA 
GGCTGATCCTGTAAATAGTTCAGAGCTACCAAAGCACTTCTTAACAATTA 
ACCTTGATAAGGAAGATAGTATTAAGCTATTAATTAAAGATTTAAAGGCT 
TTAGACCCTGATTTAATAAGTGAGATTCAGGTGATAAGTTTAGCTGATTC 
TAAAACGACACCTGACCTCCTGCTGTTAGATATGCACGATGGAAATAGTA 
TTAGAATACCATTATCTAAATTTAAAGAAAGACTTCCTTTTTACAAACAA 
ATTAAGAAGAACCTTAAGGAACCTTCTATTGTTGATATGGAAGTGGGAGT 
TTACACAACAACAAGTACTATTGAATCAACCCCTGTGAAAGCGGAAGATA 
CAAAAAATAAATCAACTGATAAAACACAAACCCAAAATGGTCAGGTTGCG 
GAAAATAGTCAAGGACAAACAAATAACTCAAATACTAATCAACAAGGACA 
ACAACAGATAGCAACGGAGCAGGCACCCAACCCTCAAAATGTTAAT 

SEQ ID NO. 8809 
STRAIN OM9130013 

CCTAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAGTT 

GTCTTAACGGAATGGCAAAAGCGTAACCTTGAATTTTTAAAAAAACGCAA 

AGAAGATGAAGAAGAACAAAAACGTATTAACGAAAAATTACGCTTAGATA 

AAAGAAGTAAATTAAATATTTCTTCTCCTGAAGAACCTCAAAATACTACT 

AAAATTAAGAAGCTTCATTTTCCAAAGATTTCAAGACCTAAGATTGAAAA 

GAAACAGAAAAAAGAAAAAATAGTCAACAGCTTAGCCAAAACTAATCGCA 

TTAGAACTGCACCTATATTTGTAGTAGCATTCCTAGTCATTTTAGTTTCC 

GTTTTCCTACTAACTCCTTTTAGTAAGCAAAAAACAATAACAGTTAGTGG 

AAATCAGCATACACCTGATGATATTTTGATAGAGAAAACGAATATTCAAA 

AAAACGATTATTTCTTTTCTTTAATTTTTAAACATAAAGCTATTGAACAA 

CGTTTAGCTGCAGAAGATGTATGGGTAAAAACAGCTCAGATGACTTATCA 

ATTTCCCAATAAGTTTCATATTCAAGTTCAAGAAAATAAGATTATTGCAT 

ATGCACATACAAAGCAAGGATATCAACCTGTCTTGGAAACTGGAAAAAAG 

GCTGATCCTGTAAATAGTTCAGAGCTACCAAAGCACTTCTTT^ACAATTAA 

CCTTGATAAGGAAGATAGTATTAAGCTATTAATTAAAGATTTAAAGGCTT 

TAGACCCTGATTTAATAAGTGAGATTCAGGTGATAAGTTTAGCTGATTCT 

AAAACGACACCTGACCTCCTGCTGTTAGATATGCACGATGGAAATAGTAT 

TAGAATACCATTATCTAAATTTAAAGAAAGACTTCCTTTTTACAAACAAA 

TTAAGAAGAACCTTAAGGAACCTTCTATTGTTGATATGGAAGTGGGAGTT 

TACACAACAACAAATACCATTGAATCAACCCCTGTTAAAGCAGAAGATAC 

AAAAAATAAATCAACTGATAAAACACAAACACAAAATGGTCAGGTTGCGG 

AAAATAGTCAAGGACAAACAAATAACTCAAATACTAATCAACAAGGACAA 

CAGATAGCAACAGAGCAGGCACCTAACCCTCAAAATGTTAAT 

SEQ ID NO. 86X0 
STRAIN A909 



AAAAACGATTATTTCTTTTCTTTAATTTT' 
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CCTAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAGTTGTC 

TTAACGGAATGGCAAAAGCGTAACCTTGAATTTTTaaAAAAACGCAAAGA 

AGATGAAGAAGAaCAAAAACGTATTAACGAAAAATTACGCTTAGATAAAA 

GAAGTAAATTAAATATTTCTTCTCCTGAAGAACCTCAAAATACTACTAAA 

ATTAAGAAGCTTCATTTTCCAAAGATTTCAAGACCTAAGATTGAAAAGAA 

ACAGAAAAAAGAAAAAATAGTCAACAGCTTAGCCAAAACTAATCGCATTA 

GAACTGCACCTATATTTGTAGTAGCATTCCTAGTCATTTTAGTTTCCGTT 

TTCCTACTAACTCCTTTTAGTAAGCAAAAAACAATAACAGTTAGTGGAAA 

TCAGCATACACCTGATGATATTTTGATAGAGAAAACGAATATTCAAAAAA 

ACGATTATTTCTTTTCTTTAATTTTTAAACATAAAGCTATTGAACAACGT 

TTAGCTGCAGAAGATGTATGGGTAAAAACAGCTCAGATGACTTATCAATT 

TCCCAATAAGTTTCATATTCAAGTTCAAGAAAATAAGATTATTGCATATG 

CACATACAAAGCAAGGATATCAACCTGTCTTGGAAACTGGAAAAAAGGCT 

GATCCTGTAAATAGTTCAGAGCTACCAAAGCACTTCTTAACAATTAACCT 

TGATAAGGAAGATAGTATTAAGCTATTAATTAAAGA^TTAAAGGCTTTAG 

ACCCTGATTTAATAAGTGAGATTCAGGTGATAAGTTTAGCTGATTCTAAA 

ACGACACCTGACCTCCTGCTGTTAGATATGCACGATGGAAATAGTATTAs 

AATACCATTATCTAAATTTAAAGAAAGACTTCCTTTTTACAAACAAATTA 

AGAAGAACCTTAAGGAACCTTCTATTGTTGATATGGAAGTGGGAGTTTAC 

AGAACAAO^TACCATTGAATCAACCCCTGTTAAAGCAGAAGATACAAA 

AAATAAATCAACTGATAAAACACAAmCAC^AAATGGTCAGGTTGCGGAAA 

ATAGTCAAGGACAAACAAATAACTCAAATACTAATCAACAAGGACAACAG 

ATAGCAACAGAGCAGGCACCTAACCCTCAAAATGTTAAT 

SEQ ID NO. '8811 * 
STRAIN 090 

TAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAGTTGTCTTAACGGAAT 

GGCAAAAGCGTAACCTTGAATTTTTAAAAAAACGCAAAGAAGATGAAGAA 

GAACAAAAACGTATTAACGAAAAATTACGCTTAGATAAAAGAAGTaaaTT 

AAATATTTCTTCTCCTGAAGAACCTCAAAATACTACTAAAATTAAGAAGC ' 

TTCATTTTCCAAAGATTTCAAAACCTAAGATTGAAAAGAAACAGAAAAAA 

GAAAAAATAGTCAACAGCTTAGCCAAAACTAATCGCATTAGAACTGCACC 

TATATTTGTAGTAGCATTCCTAGTCATTTTAGTTTCCGTTTTCCTACTAA 

CTCCTTTTAGTAAGCAAAAAACAATAACAGTTAGTGGAAATCAGCATACA 

CCTGATGATATTTTGATAGAAAAAACGAATATTCAAAAAAACGATTATTT 

CTTTTCTTTAATTTTTAAACATAAAGCTATTGAACAACGTTTAGCTGCAG 

AAGATGTATGGGTAAAAACAGCTCAGATGACTTATCAATTTCCCAATAAG 

TTTCATATTCAAGTTCAAGAAAATAAGATTATTGCATATGCACATACAAA 

GCAAGGATATCAGCCTGTCTTGGAAACTGGAAAAAAGGCTGATCCTGTAA 

ATAGTTCAGAGCTACCAAAGCACTTCTTAACAATTAACCTTGATAAGGAA 

GATAGTATTAAGCTATTAATTAAAGATTTAAAGGCTTTAGACCCTGATTT 

AATAAGTGAGATTCAGGTGATAAGTTTAGCTGATTCTAAAACGACACCTG 

ACCTCCTGCTGTTAGATATGCATGATGGAAATAGTATTAGAATACCATTA 

TCTAAATTTAAAGAAAGACTTCCTTTTTACAAACAAATTAAGAAGAACCT 

TAAGGAACCTTCTATTGTTGATATGGAAGTGGGAGTTTACACAACAACAA 

GTACTATTGAATCAACCCCTGTGAAAGCGGAAGATACAAAAAATAAATCA 

ACTGATAAAACACAAACACAAAATGGTCAGGTTGCGGAAAATAGTCAAGG 

ACAAACAAATAACTCAAATACTAATCAACAAGGACAACAGATAGCAACAG 

AGCAGGCACCCAACCCTCAAAATGTTAAT 

SEQ ID NO. 8812 
STRAIN 2603 frame: 1 

PKKKS DT PEKEE WLTEWQKRNLE FLKKRKE DEEEQKRINEKLRLDKRS KLN I S S PEE PQ 
NTTKIKKLHFPKISRPKIEKKQKKEKIVNSLAKTNRIRTAPIFWAFLVILVSVFLLTPF 
SKQKTITVSGNQHTPDDILIEKTNIQKNDYFFSLIFKHKAIEQRLAAEDVWVKTAQMTYQ 
FPNKFHIQVQENKI I AYAHTKQGYQPVLETGKKAD PVN S S EL PKHFLT INLDKE DS I KLL 
IKDLKALDPDLISEIQVISLADSKTTPDLLLLDMHDGNSIRIPLSKFKERLPFYKQIKKN 
LKEPSIVDMEVGVYTTTNTIESTPVKAEDTKNKSTDKTQTQNGQVAENSQGQTNNSNTNQ 
QGQQIATEQAPNPQNVN 

SEQ ID NO. 8813 

STRAIN H36B frame: 1 

PKKKS DT PEKEE WLTEWQKRNLE FLKKRKE DEEEQKRINEKLRLDKRS KLN I S S PEE PQ 
NTTKIKKLHFPKISRPKIEKKQKKEKIVNSLAKTNRIRTAPIFWAFLVILVSVFLLTPF 
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SKQKTITVSGNQHTPDDILIEKTNIQKNDYFFSLIFKHKAJEQRIAAEDVWVKTAQMTYQ 
FPNKFHIQVQENKIIAYAHTKQGYQPVLETGKKADPVNSSELPKHFLTINLDKEDSIKLL 
IKDLKALDPDLISEIQVISLADSKTTPDLLLLDMHDGNSIRIPLSKFKERLPFYKQIKKN 

LKEPSIVDMEVGVYTTTNTIESTPVKAEDTKNKSTDKTQTQNGQVAENSQGQTNNSNTNQ 
QGQQIATEQAPNPQNVN 

SEQ ID NO. 8814 

STRAIN 18RS21 frame: 1 

PKKKSDTPEKEEWLTEWQKRNLEFLKKRKE DEEEQKRINEKLRLDKRSKLNI S S PEE PQ 
NTTKIKKLHFPKISRPKIEKKQKKEKIVNSLAKTNRIRTAPIFWAFLVILVSVFLLTPF 
SKQKTITVSGNQHTPDDILIEKTNIQKNDYFFSLIFKHKAIEQRLAAEDVWVKTAQMTYQ 
FPNKFHIQVQENKIIAYAHTKQGYQPVLETGKKADPVNSSELPKHFLTINLDKEDSIKLL 
IKDLKALDPDLISEIQVISLADSKTTPDLLLLDMHDGNSIRIPLSKFKERLPFYKQIKKN 
LKEPSIVDMEVGVYTTTNTIESTPVKAEDTKNKSTDKTQTQNGQVAENSQGQTNNSNTNQ 
QGQQIATEQAPNPQNVN 

SEQ ID NO. 8815 

STRAIN M732 frame: 1 

PKKKS DT PEKEEWLTEWQKRNLE FLKKRKE DEEEQKRINEKLRLDKRSKLNI S S PEE PQ 
NTTKIKKLHFPK'ISKPKIEKKQKKEKIVN^ 

SKQKTITVSGNQHTPDDILIEKTNIQKNDYFFSLIFKHKAIEQRLAMDVWVKTAQMTYQ 
FPmCFHIQVQENKIIAYAHTKQGYQPVLETGKKADPVNSSELPkHFLTINLDKEDSIKLL 
IKDLKALDPDLISEIQVISLADSKTTPDLLLLDMHDGNSIRIPLSKFKERLPFYKQIKKN 
LKEPSIVDMEVG^TTTSTIESTPVKAEDTKNKSTDKTQTQNGQVAENSQGQTNNSNTNQ 
QGQQIATEQAPNPQNVN 

SEQ ID NO. 8816 

STRAIN COH1 frame: 1 ■ 

PKKKSDTPEKEEWLTEWQKRNLEFLKKRKEDEEEQKRINEBCLRLDKRSKLNIS S PEE PQ 
NTTKIKKLHFPKISKPKIEKKQKKEKIVNSLAKTNRIRTAPIFVVAFLVILVSVFLLTPF 
SKQKTITVSGNQHTPDDILIEKTNIQKNDYFFSLIFKHKAIEQRLAAEDVWVKTAQMTYQ 
FPNKFHIQVQENKIIAYAHTKQGYQPVLETGKKADPVNSSELPKHFLTINLDKEDSIKLL 
IKDLKALDPDLISEIQVISLADSKTTPDLLLLDMHDGNSIRIPLSKFKERLPFYKQIKKN 
LKEPSIVDMEVGVYTTTSTIESTPVKAEDTKNKSTDKTQTQNGQVAENSQGQTNNSNTNQ 
QGQQIATEQAPNPQNVN 

SEQ ID NO. 8817 

STRAIN M781 frame: 1 

PKKKSDTPEKEEWLTEWQKRNLEFLKKRKEDEEEQKRINEKLRLDKRSKLNISSPEEPQ 
NTTKIKKLHFPKISKPKIEKKQKKEKIVNSLAKTNRIRTAPIFVVAFLVILVSVFLLTPF 
SKQKTITVSGNQHTPDDILIEKTNIQKNDYFFSLIFKHKAIEQRLAAEDVWVKTAQMTYQ 
FPNKFHI QVQENKI I AYAHTKQGYQP VLETGKKAD PVN S SEL PKHFLT INLDKE D S I KLL 
IKDLKALDPDLISEIQVISLADSKTTPDLLLLDMHDGNSIRI PLSKFKERLPFYKQIKKN 
LKEPSIVDMEVGVYTTTSTIESTPVKAEDTKNKSTDKTQTQNGQVAENSQGQTNNSNTNQ 
QGQQIATEQAPNPQNVN 

SEQ ID NO. 8818 

STRAIN CJB110 frame: 1 

PKKKS DT PEKEE WLTE WQKRNLE FLKKRKE DE E E QKRI NE KLRL DKR S KLN I S S PEE PQ 
NTTKIKKLHFPKISKPKIEKKQKKEKIVNSLAKTNRIRTAPIFWAFLVILVSVFLLTPF 
SKQKTITVSGNQHTPDDILIEKTNIQKNDYFFSLIFKHKAIEQRLAAEDVWVKTAQMTYQ 
FPNKFHIQVQENKIIAYAHTKQGYQPVLETGKKADPVNSSELPKHFLTINLDKEDSIKLL 
IKDLKALDPDLISEIQVISLADSKTTPDLLLLDMHDGNSIRI PLSKFKERLPFYKQIKKN 
LKEPSIVDMEVGVYTTTSTIESTPVKAEDTKNKSTDKTQTQNGQVAENSQGQTNNSNTNQ 
QGQQIATEQAPNPQNVN 

SEQ ID NO. 8819 

STRAIN 1169NT frame: 1 

PKKKS DT PEKEEWLTEWQKRNLE FLKKRKE DEEEQKRINEKLRLDKRSKLN I S S PEEPQ 
NTTKIKKLHFPKISKPKIEKKQKKEKIVNSLAKTNRIRTAPIFIVAFLVILVSVFLLTPF 
SKQKTITVSGNQHTPDDILIEKTNIQKNDYFFSLIFKHKAIEQRLAAEDVWVKTAQMTYQ 
FPNKFHIQVQENKIIAYAHTKQGYQPVLETGKKADPVNSSELPKHFLTINLDKEDSIKLL 
IKDLKALDPDLISEIQVISLADSKTTPDLLLLDMHDGNSIRI PLSKFKERLPFYKQIKKN 
LKEPSIVDMEVGVYTTTSTIESTPVKAEDTKNKSTDKTQTQNGQVAENSQGQTNNSNTNQ 
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QGQQQIATEQAPNPQNVN 



SEQ ID NO. 8820 

STRAIN JM9130013 frame: 1 

PKKKSDTPEKEEVVLTEWQKRNLEFLKKRKEDEEEQKRINEKLRLDKRSKLNISSPEEPQ 
NTTKIBOCLHFPKISRPKIEKKQKKEKIVNSLAKTNRIRTAPIFWAFLVILVSVFLLTPF 
SKQKTITVSGNQHTPDDILIEKTNIQKNDYFFSLIFKHKAIEQRLAAEDVWVKTAQMTYQ 
FPNKFHIQVQENKIIAYAHTKQGYQPVLETGJCKADPVNSSELPKHFLTINLDKEDSIKLL 
IKDLKALDPDLISEIQVISLADSKTTPDLLLLDMHDGNSIRIPLSKFKERLPFYKQIKKN 

SEQ ID NO. 8821 

STRAIN A909 frame: 1 
PKKKSDTPEKEEVVLTEWQKRNLEFLKKR^ 

NTTKIKKLHFPKISRPKIEKKQKKEKIVNSLAKTNRIRTAPIFVVAFLVILVSVFLLTPF 
SKQKTITVSGNQHTPDDI LIEKTNIQKNDYFFSLI FKHKAIEQRLAAE DVWVKTAQMTYQ 

FPNKFHIQVQENKIIAYAHTKQGYQPVLETGKKADPVNSSELPKHFLTINLDKEDSIKLL 
IKDLKALDPDL I S E IQVI S LADS KTT PDLLLLbMHDGN S IXX PLSKEJCERLPFYKQIKKN 

LKEPSIVDMEVGVYTTTNTIESTPVK^DTKNKSTDKTQXQNGQV^NSQGQTfojSNTNO 
QGQQIATEQAPNPQNVN 

. SEQ ID NO. 8822 ^ * 4 

STRAIN 090 frame: .2 

KKKSDTPEKEEWLTEWQKRNLEFLKKRraDEEEQKRINEKLRLDKRSKLNISSPEEPQN 
TTKIKKLHFPKISKPKIEKKQKKEKIVNSLAKTNRIRTAPIFVVAFLVILVSVFLLTPFS 
KQKTITVSGNQHTPDDILIEKTNIQJCNDYFFSLIFKHKAIEQRLAAEDVWKTAQMTYQF 
PNKFHIQVQENKIIAYAHTKQGYQPVLETGICKADPVNSSELPKHFLTINLDKEDSIKLLI 
KDLKALDPDLISEIQVISLADSKTTPDLLLLDMHDGNSIRIPLSKFKERLPFYKQIKKNL 
KE PS I VDME VGVYTTT ST I EST PVKAE DTKNKS T DKTQTQNGQVAENSQGQTNNSNTNOO 
GQQIATEQAPNPQNVN 

SEQ ID NO. 8901 
STRAIN 2603 

ATGAAAAAAGGACAAGTAAATGATACTAAGCAATCTTACTCTCTACGTAAA 

TATAAATTTGGTTTAGCATCAGTAATTTTAGGGTCATTCATAATGGTCACAAGTCCTGTT 

TTTGCGGATCAAACTACATCGGTTCAAGTTAATAATCAGACAGGCACTAGTGTGGATGCT 

AATAATTCTTCCAATGAGACAAGTGCGTCAAGTGTGATTACTTCCAATAATGATAGTGTT 

CAAGCGTCTGATAAAGTTGTAAATAGTCAAAATACGGCAACAAAGGACATTACTACTCCT 

TTAGTAGAGACAAAGCCAATGGTGGAAAAAACATTACCTGAACAAGGGAATTATGTTTAT 

AGCAAAGAAACCGAGGTGAAAAATACACCTTCAAAATCAGCCCCAGTAGCTTTCTATGCA 

AAGAAAGGTGATAAAGTTTTCTATGACCAAGTATTTAATAAAGATAATGTGAAATGGATT 

TCATATAAGTCTTTTTGTGGCGTACGTCGATACGCAGCTATTGAGTCACTAGATCCATCA 

GGAGGTTCAGAGACTAAAGCACCTACTCCTGTAACAAATTCAGGAAGCAATAATCAAGAG 

AAAATAGCAACGCAAGGAAATTATACATTTTCACATAAAGTAGAAGTAAAAAATGAAGCT 

AAGGTAGCGAGTCCAACTCAATTTACATTGGACAAAGGAGACAGAATTTTTTACGACCAA 

ATACTAACTATTGAAGGAAATCAGTGGTTATCTTATAAATCATTCAATGGTGTTCGTCGT 

TTTGTTTTGCTAGGTAAAGCATCTTCAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCT 

CCTCAACCACAAGCCCGTATTACTAAAACTGGTAGACTGACTATTTCTAACGAAACAACT 

ACAGGTTTTGATATTTTAATTACGAATATTAAAGATGATAACGGTATCGCTGCTGTTAAG 

GTACCGGTTTGGACTGAACAAGGAGGGCAAGATGATATTAAATGGTATACAGCTGTAACT 

ACTGGGGATGGCAACTACAAAGTAGCTGTATCATTTGCTGACCATAAGAATGAGAAGGGT 

CTTTATAATATTCATTTATACTACCAAGAAGCTAGTGGGACACTTGTAGGTGTAACAGGA 

ACTAAAGTGACAGTAGCTGGAACTAATTCTTCTCAAGAACCTATTGAAAATGGTTTAGCA 

AAGACTGGTGTTTATAATATTATCGGAAGTACTGAAGTAAAAAATGAAGCTAAAATATCA 

AGTCAGACCCAATTTACTTTAGAAAAAGGTGACAAAATAAATTATGATCAAGTATTGACA 

GCAGATGGTTACCAGTGGATTTCTTACAAATCTTATAGTGGTGTTCGTCGCTATATTCCT 

GTGAAAAAGCTAACTACAAGTAGTGAAAAAGCGAAAGATGAGGCGACTAAACCGACTAGT 

TATCCCAACTTACCTAAAACAGGTACCTATACATTTACTAAAACTGTAGATGTGAAAAGT 

CAACCTAAAGTATCAAGTCCAGTGGAATTTAATTTTCAAAAGGGTGAAAAAATACATTAT 

GATCAAGTGTTAGTAGTAGATGGTCATCAGTGGATTTCATACAAGAGTTATTCCGGTATT 
CGTCGCTATATTGAAATT 

SEQ ID NO. 8902 
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STRAIN 090 

AAAAAAGGACAAGTAAATGATACTAAGCAATCTTACT 

CTCTACGTAAATATAAATTTGGTTTAGCATCAGTAATTTTAGGGTCATTC 

ATAATGGTCACAAGTCCTGTTTTTGCGGATCAAACTACATCGGTTCAAGT 

TAATAATCAGACAGGCACTAGTGtGGATGCTAATAATTCTTCCAATGAGA 

CAAGTGCGTCAAGTGTGATTACTTCCAATAATGATAGTGTTCAAGCGTCT 

GATAAAGTTGTAAATAGTCAAAATACGGCAACAAAGGACATTACTACTCC 

TTTAGTAGAGACAAAGCCAATGGTGGAAAAAACATTACCTGAACAAGGGA 

ATTATGTTTATAGCAAAGAAACCGAGGTGAAAAATACACCTTCAAAATCA 

GCCCCAGTAGCTTTCTATGCAAAGAAAGGTGATAAAGTTTTCTATGACCA 

AGTATTTAATAAAGATAATGTGAAATGGATTTCATATAAGTCTTTTTGTG 

GCGTACGTCGATACGCAGCTATTGAGTCACTAGATCCATCAGGAGGTTCA 

GAGACTAAAGCACCTACTCCTGTAACAAATTCAGGAAGCAATAATCAAGA 

GAAAATAGCAACGCAAGGAAATTATACATTTTCACATAAAGTAGAAGTAA 

AAAATGAAGcTAAGGTAGCGAGTCCAACTCAATTTACATTGGACAAAGGA 

GACAGAATTTTTTACGACCAAATACTAACTATTGAAGGAAATCAGTGGTT 

ATCTTATAAATCATTCAATGGTGTTCGTCGTTTTGTTtTGCTAGGTAAAG 

CATCTT CAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCTCCTC AACCA 

CAAGCCCGTATTACTAAAACTGGTAGACTGACTATTTCTAACGAAACAAC 

TACAGGTTTTGATATTTTAATTACGAATATTAAAGATGATAACGGTATCG 

CTGCTGTTAAGGTACCGGTTTGGACTGAACAAGGAGGGCAAGATGATATT 

AAATGGTATACAGCTGTAACTACTGGGGATGGCAACTACAAAGTAGCTGT 

ATCATTTGCTGACCATAAGAATGAGAAGGGTCTTTATAATATTCATTTAT 

ACTACCAAGAAGCTAGTGGGACACTTGTAGGTGTAACAGGAACTAAAGTG 

ACAGTAGCTGGAACTAATTCTTCTCAAGAACCTATTGAAAATGGTTTAGC 

AAAGACTGGTGTTTATAATATTATCGGAAGTACTGAAGTAAAAAATGAAG 

CTAAAATATCAAGTCAGACCCAATfTACTTTAGAAAAAGGTGACAAAATA 

AATTATGATCAAGTATTGACAGCAGATGGTTACCAGfGGATTTCTTACAA 

ATCTTATAGTGGTGTTCGTCGCTATATTCCTGTGAAAAAGCTAACTACAA 

GTAGT^AAAAAGCGAAaGATGAGGCGACTAAACCGACTAGTTATCCCAAC 

TTACCTAAAACAGGTACCTATACATTTACTAAAACTGTAGATGTGAAGAG 

TCAACCTAAAGTATCAAGTCCAGTGGAATTTAATTTTCAAAAGGGTGAAA 

AAATACATTATGATCAAGTGTTAGTAGTAGATGGTCATCAGTGGATTTCA 

TACAAGAGTTATTCCGGTATTCGTCGCTATATTGAAATT 

SEQ ID NO. 8903 

STRAIN A909 

AAAAAAGGACAAGTAAATGATACTAAGCAATCTTAC 

TCTCTACGTAAATATAAATTTGGTTTAGCATCAGTAATTTTAGGGTCATT 
CATAATGGTCACAAGTCCTGTTTTTGCGGATCAAACTACATCGGTTCAAG 
TTAATAATCAGACAGGCACTAGTGTGGATGCTAATAATTCTTCCAATGAG 
ACAAGTGCGTCAAGTGTGATTACTTCCAATAATGATAGTGTTCAAGCGTC 
TGATAAAGTTGTAAATAGTCAAAATACGGCAACAAAGGACATTACTACTC 
CTTTAGTAGAGACAAAGCCAATGGTGGAAAAAACATTACCTGAACAAGGG 
AATTATGTTTATAGCAAAGAAACCGAGGTGAAAAATACACCTTCAAAATC 
AGCCCCAGTAGCTTTCTATGCAAAGAAAGGTGATAAAGTTTTCTATGACC 
AAGTATTTAATAAAGATAATGTGAAATGGATTTCATATAAGTCTTTTTGT 
GGCGTACGTCGATACGCAGCTATTGAGTCACTAGATCCATCAGGAGGTTC 
AGAGACTAAAGCACCTACTCCTGTAACAAATTCAGGAAGCAATAATCAAG 
AGAAAATAGCAACGCAAGGAAATTATACATTTTCACATAAAGTAGAAGTA 
AAAAATGAAGCTAAGGTAGCGAGTCCAACTCAATTTACATTGGACAAAGG 
AGACAGAATTTTTTACGACCAAATACTAACTATTGAAGGAAATCAGTGGT 
TATCTTATAAATCATTCAATGGTGTTCGTCGTTTTGTTtTGCTAGGTAAA 
GCATCTTCAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCTCCTCAACC 
ACAAGCCCGTATTACTAAAACTGGTAGACTGACTATTTCTAACGAAACAA 
CTACAGGTTTTGATATTTTAATTACGAATATTAAAGATGATAACGGTATC 
GCTGCTGTTAAGGTACCGGTTTGGACTGAACAAGGAGGGCAAGATGATAT 
TAAATGGTATACAGCTGTAACTACTGGGGATGGCAACTACAAAGTAGCTG 
TATCATTTGCTGACCATAAGAATGAGAAGGGTCTTTATAATATTCATTTA 
TACTACCAAGAAGCTAGTGGGACACTTGTAGGTGTAACAGGAACTAAAGT 
GACAGTAGCTGGAACTAATTCTTCTCAAGAACCTATTGAAAATGGTTTAG 
CAAAGACTGGTGTTTATAATATTATCGGAAGTACTGAAGTAAAAAATGAA 
GCTAAAATATCAAGTCAGACCCAATTTACTTTAGAAAAAGGTGACAAAAT 
AAATTATGATCAAGTATTGACAGCAGATGGTTACCAGTGGATTTCTTACA 
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AATCTTATAGTGGTGTTCGTCGCTATATTCCTGTGAAAAAGCTAACTACA 
AGTAGTGAAAAAGCGAAAGATGAGGCGACTAAACCGACTAGTTATCCCAA 
CTTACCTAAAACAGGTACCTATACATTTACTAAAACTGTAGATGTGAAGA 
GTCAACCTAAAGTATCAAGTCCAGTGGAATTTAATTTTCAAAAGGGTGAA 
AAAATACATTATGATCAAGTGTTAGTAGTAGATGGTCATCAGTGGATTTC 
ATACAAGAGTTATTCCGGTATTCGTCGCTATATTGAAATT 

SEQ ID NO. 8904 

STRAIN H36B 

AAAAAAGGACAAGTAAATGATACTAAGCAATCTTACT 

CTCTACGTAAATATAAATTTGGTTTAGCATCAGTAATTTTAGGGTCATTC 

ATAATGGTCACAAGTCCTGTTTTTGCGGATCAAACTACATCGGTTCAAGT 

TAATAATCAGACAGGCACTAGTGTGGATGATAATAATTCTTCCAATGAGA 

CAAGTGCGTCAAGTGTGATTACTTCCAATAATGATAGTGTTCAAGCGTCT 

GATAAAGTTGTAAATAGTCAAAATACGGCAACAAAGGACATTACTACTCC 

TTTAGTAGAGACAAAGCCAATGGTGGAAAAAACATTACCTGAACAAGGGA 

ATTATGTTTATAGCAAAGAA^CCGAGGTGAAAAATACACCTTGAAAATCA 

GCCCCAGTAGCTTTCTATGCAAAGAAAGGTGATAAAGTTTTCTATGACCA 

AGTATTTAATAAAGATAATGTGAAA^GGATTXCATATAAGTCTTTTTGTG 

GCGTACGTCGATACGCAGCTATTGAGTCACTAGATCCATCAGGAGGTTCA 

GAGACTAAAGCACCTACTCCTGTAACAAATTCAGGAAGCAATAATCAAGA 

GAAAATAGCAACGCAAGGAAATTATACATTTTCACATAAAGTAGAAGTAA 

AAAATGAAGCTAAGGTAGCGAGTCCAACTCAATTTACATTGGACAAAGGA 

GACAGAATTTTTTACGACCAAATACTAACTATTGAAGGAAATCAGTGGTT 

ATCTTATAAATCATTCAATGGTGTTCGTCGTTTTGTTtTGCTAGGTAAAG 

CATGTTCAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCTCCTCAACCA 

CAAGCCCGTATTACTAAAACTGGTAGACTGACTATTTCTAACGAAACAAC 

TACAGGTTTTGATATTTTAATTACGAATATTAAAGATGATAACGGTATCG 

CTGCTGTTAAGGTACCGGTTTGGACTGAACAAGGAGGGCAAGATGATATT 

AAATGGTATACAGCTGTAACTACTGGGGATGGCAACTACAAAGTAGCTGT 

ATCATTTGCTGACCATAAGAATGAGAAGGGTCTTTATAATATTCATTTAT 

ACTACCAAGAAGCTAGTGGGACACTTGTAGGTGTAACAgGAACTAAAGTG 

ACAGTAGCTGGAACTAATTCTTCTCAAGAACCTATTGAAAATGGTTTAGC 

AAAGACTGGTGTTTATAATATTATCGGAAGTACTGAAGTAAAAAATGAAG 

CTAAAATATCAAGTCAGACCCAATTTACTTTAGAAAAAGGTGACAAAATA 

AATTATGATCAAGTATTGACAGCAGATGGTTACCAGTGGATTTCTTACAA 

ATCTTATAGTGGTGTTCGTCGCTATATTCCTGTGAAAAAGCTAACTACAA 

GTAGTGAAAAAGCGAAAGATGAGGCGACTAAACCGACTAGTTATCCCAAC 

TTACCTAAAACAGGTACCTATACATTTACTAAAACTGTAGATGTGAAGAG 

TCAACCTAAAGTATCAAGTCCAGTGGAATTTAATTTTCAAAAGGGTGAAA 

AAATACATTATGATCAAGTGTTAGTAGTAGATGGTCATCAGTGGATTTCA 

TACAAGAGTTATTCCGGTATTCGTCGCTATATTGAAATT 

SEQ ID NO. 8905 

STRAIN 18RS21 

AAAAAAGGACAAGTAAATGATACTAAGCAATCTTACTC 

TCTACGTAAATATAAATTTGGTTTAGCATCAGTAATTTTAGGGTCATTCA 

TAATGGTCACAAGTCCTGTTTTTGCGGATCAAACTACATCGGTTCAAGTT 

AATAATCAGACAGGCACTAGTGTGGATGCTAATAATTCTTCCAATGAGAC 

AAGTGCGTCAAGTGTGATTACTTCCAATAATGATAGTGTTCAAGCGTCTG 

ATAAAGTTGTAAATAGTCAAAATACGGCAACAAAGGACATTACTACTCCT 

TTAGTAGAGACAAAGCCAATGGTGGAAAAAACATTACCTGAACAAGGGAA 

TTATGTTTATAGCAAAGAAACCGAGGTGAAAAATACACCTTCAAAATCAG 

CCCCAGTAGCTTTCTATGCAAAGAAAGGTGATAAAGTTTTCTATGACCAA 

GTATTTAATAAAGATAATGTGAAATGGATTTCATATAAGTCTTTTTGTGG 

CGTACGTCGATACGCAGCTATTGAGTCACTAGATCCATCAGGAGGTTCAG 

AGACTAAAGCACCTACTCCTGTAACAAATTCAGGAAGCAATAATCAAGAG 

AAAATAGCAACGCAAGGAAATTATACATTTTCACATAAAGTAGAAGTAAA 

AAATGAAGcTAAGGTAGCGAGTCCAACTCAATTTACATTGGACAAAGGAG 

ACAGAATTTTTTACGACCAAATACTAACTATTGAAGGAAATCAGTGGTTA 

TCTTATAAATCATTCAATGGTGTTCGTCGTTTTGTTTTGCTAGGTAAAGC 

ATCTTCAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCTCCTCAACCAC 

AAGCCCGTATTACTAAAACTGGTAGACTGACTATTTCTAACGAAACAACT 

ACAGGTTTTGATATTTTAATTACGAATATTAAAGATGATAACGGTATCGC 
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TGCTGTTAAGGTACCGGTTTGGACTGAACAAGGAGGGC^AGATGATATTA 
AATGGTATACAGCTGTAACTACTGGGGATGGCAACTACAAAGTAGCTGTA 
TCATTTGCTGACCATAAGAATGAGAAGGGTCTTTATAATATTCATTTATA 
CTACCAAGAAGCTAGTGGGACACTTGTAGGTGTAACAGGAACTAAAGTGA 
CAGTAGCTGGAACTAATTCTTCTCAAGAACCTATTGAAAATGGTTTAGCA 
AAGACTGGTGTTTATAATATTATCGGAAGTACTGAAGTAAAAAATGAAGC 
TAAAATATCAAGTCAGACCCAATTTACTTTAGAAAAAGGTGACAAAATAA 
ATTATGATCAAGTATTGACAGCAGATGGTTACCAGTGGATTTCTTACAAA 
TCTTATAGTGGTGTTCGTCGCTATATTCCTGTGAAAAAGCTAACTACAAG 
TAGTGAAAAAGCGAAAGATGAGGCGACTAAACCGACTAGTTATCCCAACT 
TACCTAAAACAGGTACCTATACATTTACTAAAACTGTAGATGTGAAAAGT 
CAACCTAAAGTATCAAGTCCAGTGGAATTTAATTTTCAAAAGGGTGAAAA 
AATACATTATGATCAAGTGTTAGTAGTAGATGGTCATCAGTGGATTTCAT 
ACAAGAGTTATTCCGGTATTCGTCGCTATATTGAAATT 

SEQ ZD NO. 8906 

STRAIN M732 

CAAGTAAATGATaCTAAGCAATCTTACTCTCTACGTAAATATAAATTTGG* 
TTTAGCATCAGTAATTTTAGGGTCATTCATAATGGTCACAAG^TCCTGTTT 
TTGCGGATCAAAcTACATCGGTTCAAGTTAATAATCAGACAGGCACTAGT 
GTGGATGCTAATAATTCTTCCAATGAGACAAGTGCGTCAAGTGTGATTAC 
TTCCAATAATGATAGTGTTCAAGCGTCTGATAAAGTTGTAAATAGTCAAA 
ATACGGCAACAAAGGACATTACTACTCCTTTAGTAGAGACAAAGCCAATG 
GTGGAAAAAACATTACCTGAACAAGGGAATTATGTTTATAGCAAAGAAAC 
CGAGGTGAAA^TACACCTTCAAAATCAGCCCCAGTAGCTTTCTATGCAA 
AGAAAGGTGATAAAGTTTTCTATGACCAAGTATTTAATAAAGATAATGT'G 
. AAATGGATTTCATATAAGTCTTTTGGTGGCGTACGTCGATACGCAGCTAT 
TGAGTCACTAGATCCATCAGGAGGTTCAGAGACTAAAGCACCTACTCCTG 
TAACAAATTCAGGAAGCAATAATCAAGAGAAAATAGCAACGCAAGGAAAT 
TATACATTTTCACATAAAGTAGAAGTAAAAAATGAAGCTAAGGTAGCGAG 
TCCAACTCAATTTACATTGGACAAAGGAGACAGAATTTTTTACGACCAAA 
TACTAACTatTGAAGGAAATCAGTGGTTATCTTATAAATCATTCAATGGT 
GTTCGTCGTTTTGtTttGcTAGGTAAAGCATCTTCAGTAGAAAAAACTGA 
AGATAAAGAAAAAGTGTCTCCTCAACCACAAGCCCGTATTACTAAAACTG 
GTAGACTGACTATTTCTAACGAAACAACTACAGGTTTTGATATTTTAATT 
ACGAATATTAAAGATGATAACGGTATCGCTGCTGTTAAGGTACCGGTTTG 
GACTGAACAAGGAGGGCAAGATGATATTAAATGGTATACAGCTGTAACTA 
CTGGGGATGGCAACTACAAAGTAGCTGTATCATTTGCTGACCATAAGAAT 
GAGAAGGGTCTTTATAATATTCATTTATACTACCAAGAAGCTAGTGGGAC 
ACTTGTAGGTGTAACAGGAACTAAAGTGACAGTAGCTGGAACTAATTCTT 
CTCAAGAACCTATTGAAAATGGTTTACCAAAGACTGGTGTTTATAATATT 
ATCGGAAGTACTGAAGTAAAAAATGAAGCTAAAATATCAAGTCAGACCCA 
ATTTACTTTAGAAAAAGGTGACAAAATAAATTATGATCAAGTATTGACAG 
CAGATGGTTACCAGTGGATTTCTTACAAATCTTATAGTGGTGTTCGTCGC 
TATATTCCTGTGAAAAAGCTAACTACAAGTAGTGAAAAAGCGAAAGATGA 
GGCGACTAAACCGACTAGTTATCCCAACTTACCTAAAACAGGTACCTATA 
CATTTACTAAAACTGTAGATGTGAAAAGTCAACCTAAAGTATCAAGTCCA 
GTGGAATTTAATTTTCAAAAGGGTGAAAAAATACATTATGATCAAGTGTT 
AGTAGTAGATGGTCATCAGTGGATTTCATACAAGAGTTATTCCGGTATTC 
GTCGCTATATTGAAATT 

SEQ ID NO. 8907 

STRAIN COH1 

AAAAAAGGACAAGTAAATGATACTAAGCAAT CTTACTCTCT 

ACGTAAATATAAATTTGGTTTAGCATCAGTAATTTTAGGGTCATTCATAA 

TGGTCACAAGTCCTGTTTTTGCGGATCAAACTACATCGGTTCAAGTTAAT 

AATCAGACAGGCACTAGTGTGGATGCTAATAATTCTTCCAATGAGACAAG 

TGCGTCAAGTGTGATTACTTCCAATAATGATAGTGTTCAAGCGTCTGATA 

AAGTTGTAAATAGTCAAAATACGGCAACAAAGGACATTACTACTCCTTTA 

GTAGAGACAAAGCCAATGGTGGAAAAAACATTACCTGAACAAGGGAATTA 

TGTTTATAGCAAAGAAACCGAGGTGAAAAATACACCTTCAAAATCAGCCC 

CAGTAGCTTTCTATGCAAAGAAAGGTGATAAAGTTTTCTATGACCAAGTA 

TTTAATAAAGATAATGTTAAATGGATTTCATATAAGTCTTTTGGTGGCGT 

ACGTCGATACGCAGCTATTGAGTCACTAGATCCATCAGGAGGTTCAGAGA 
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CTAAAGCACCTACTCCTGTAACAAATTCAGGAAGCAATAATCAAGAGAAA 
ATAGCAACGCAAGGAAATTATACATTTTCACATAAAGTAGAAGTAaAAAA 
TGAAGcTAAGGTAGCGAGTCCAACTCAATTTACATTGGACAAAGGAGACA 
GAATTTTTTACGACCAAATACTAACTATTGAAGGAAATCAGTGGTTATCT 
TATAAATCATTCAATGGTGTTCGTCGTTTTGTTtTGCTAGGTAAAGCATC 
TTCAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCTCCTCAACCACAAG 
CCCGTATTACTAAAACTGGTAGACTGACTATTTCTAACGAAACAACTACA 
GGTTTTGATATTTTAATTACGAATATTAAAGATGATAACGGTATCGCTGC 
TGTTAAGGTACCGGTTTGGACTGAACAAGGAGGGCAAGATGATATTAAAT 
GGTATACAGCTGTAACTACTGGGGATGGCAACTACAAAGTAGCTGTATCA 
TTTGCTGACCATAAGAATGAGAAGGGTCTTTATAATATTCATTTATACTA 
CCAAGAAGCTAGTGGGACACTTGTAGGTGTAACAGGAACTAAAGTGACAG 
• TAGCTGGAACTAATTCTTCTCAAGAACCTATTGAAAATGGTTTACCAAAG 
ACTGGTGTTTATAATATTATCGGAAGTACTGAAGTAAAAAATGAAGCTAA 
AATATCAAGTCAGACCCAATTTACTTTAGAAAAAGGTGACAAAATAAATT 
ATGATCAAGTATTGACAGCAGATGGTTACCAGTGGATTTCTTACAAATCT 
TATAGTGGTGTTCGTCGCTATATTCCTGTGAAAAAGCTAACTACAAGTAG 
TQAAAAAGCGAAAGATGAGGCGACTAAACCGACTAGTTATCCCAACTTAC 
CTAAAACAGGTACCTATACATTTACTAAAACTGTAGATGTGAAAAGTCAA 
CCTAAAGTATCAAGTCCAGTGGAATTTAATTTTCAAAAGGGT.GAAAAAAT 
ACATTATGATCAAGTGTTAGTAGTAGATGGTCATCAGTGGATTTCATACA 
AGAGTTATTCCGGTATTCGTCGCTATATTGAAATT 

SEQ XD NO. 8908 

STRAIN M7 81 * ^ „ 

AAAAAAGGACAAGTAAATGATACTAAGCAATCTT 

ACTCTCTACGTAAATATAAATTTGGTTTAGCATCAGTAATTTTAGGGTCA 
TTCATAATGGTCACAAGTCCTGTTTTTGCGGATCAAACTACATCGGTTCA 
AGTTAATAATCAGACAGGCACTAGTGTGGATGCTAATAATTCTTCCAATG 
AGACAAGTGCGTCAAGTGTGATTACTTCCAATAATGATAGTGTTCAAGCG 
TCTGATAAAGTTGTAAATAGTCAAAATACGGCAACAAAGGACATTACTAC 
TCCTTTAGTAGAGACAAAGCCAATGGTGGAAAAAACATTACCTGAACAAG 
GGAATTATGTTTATAGCAAAGAAACCGAGGTGAAAAATACACCTTCAAAA 
TCAGCCCCAGTAGCTTTCTATGCAAAGAAAGGTGATAAAGTTTTCTATGA 
CCAAGTATTTAATAAAGATAATGTGAAATGGATTTCATATAAGTCTTTTG 
GTGGCGTACGTCGATACGCAGCTATTGAGTCACTAGATCCATCAGGAGGT 
TCAGAGACTAAAGCACCTACTCCTGTAACAAATTCAGGAAGCAATAATCA 
AGAGAAAATAGCAACGCAAGGAAATTATACATTTTCACATAAAGTAGAAG 
TAAAAAATGAAGCTAAGGTAGCGAGTCCAACTCAATTTACATTGGACAAA 
GGAGACAGAATTTTTTACGACCAAATACTAACTATTGAAGGAAATCAGTG 
GTTATCTTATAAATCATTCAATGGTGTTCGTCGTTTTGTTtTGCTAGGTA 
AAGCATCTTCAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCTCCTCAA 
CCACAAGCCCGTATTACTAAAACTGGTAGACTGACTATTTCTAACGAAAC 
AACTACAGGTTTTGATATTTTAATTACGAATATTAAAGATGATAACGGTA 
TCGCTGCTGTTAAggTACCGGTTTGGACTGAACAAGGAGGGCAAGATGAT 
ATTAAATGGTATACAGCTGTAACTACTGGGGATGGCAACTACAAAGTAGC 
TGTATCATTTGCTGACCATAAGAATGAGAAGGGTCTTTATAATATTCATT 
TATACTACCAAGAAGCTAGTGGGACACTTGTAGGTGTAACAGGAACTAAA 
GTGACAGTAGCTGGAACTAATTCTTCTCAAGAACCTATTGAAAATGGTTT 
ACCAAAGACTGGTGTTTATAATATTATCGGAAGTACTGAAGTAAAAAATG 
AAGCTAAAATATCAAGTCAGACCCAATTTACTTTAGAAAAAGGTGACAAA 
ATAAATTATGATCAAGTATTGACAGCAGATGGTTACCAGTGGATTTCTTA 
CAAATCTTATAGTGGTGTTCGTCGCTATATTCCTGTGAAAAAGCTAACTA 
CAAGTAGTGAAAAAGCGAAAGATGAGGCGACTAAACCGACTAGTTATCCC 
AACTTACCTAAAACAGGTACCTATACATTTACTAAAACTGTAGATGTGAA 
AAGTCAACCTAAAGTATCAAGTCCAGTGGAATTTAATTTTCAAAAGGGTG 
AAAAAATACATTATGATCAAGTGTTAGTAGTAGATGGTCATCAGTGGATT 
TCATACAAGAGTTATTCCGGTATTCGTCGCTATATTGAAATT 

SEQ ID NO. 8909 

STRAIN CJB110 

AAAAAAGGACAAGTAAATGATACTAAGCAAT CTTACTCTC 

TACGTAAATATAAATTTGGTTTAGCATCAGTAATTTTAGGGTCATTCATA 

ATGGTCACAAGTCCTGTTTTTGCGGATCAAACTACATCGGTTCAAGTTAA 
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TAATCAGACAGGCACTAGTGTGGATGCTAATAATTCTTCCAATGAGACAA 

GTGCGTCAAGTGTGATTACTTCCAATAATGATAGTGTTCAAGCGTCTGAT 

AAAGTTGTAAATAGTCAAAATACGGCAACAAAGGACATTACTACTCCTTT 

AGTAGAGACAAAGCCAATGGTGGAAAAAACATTACCTGAACAAGGGAATT 

ATGTTTATAGCAAAGAAACCGAGGTGAAAAATACACCTTCAAAATCAGCC 

CCAGTAGCTTTCTATGCAAAGAAAGGTGATAAAGTTTTCTATGACCAAGT 

ATTTAATAAAGATAATGTGAAATGGATTTCATATAAGTCTTTTTGTGGCG 

TACGTCGATACGCAGCTATTGAGTCACTAGATCCATCAGGAGGTTCAGAG 

ACTAAAGCACCTACTCCTGTAACAAATTCAGGAAGCAATAATCAAGAGAA 

AATAGCAACGCAAGGAAATTATACATTTTCACATAAAGTAGAAGTAAAAA 

ATGAAGCTAAGGTAGCGAGT CCAACTCAATTTACATTGGACAAAGGAGAC 

AGAATTTTTTACGACCAAATACTAACTATTGAAGGAAATCAGTGGTTATC 

TTATAAATCATTCAATGGTGTTCGTCGTTTTGTTTTGCTAGGTAAAGCAT 

CTTCAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCTCCTCAACCACAA 

GCCCGTATTACTAAAACTGGTAGACTGACTATTTCTAACGAAACAACTAC 

AGGTTTTGATATTTTAATTACGAATATTAAAGATGATAACGGTATCGCTG 

CTGTTAAGGTACCGGTTTGGACTGAACAAGGAGGGCAAGATGATATTAAA " 

TGGTATACAGCTGTAACTACTGGGGATGGCAACTACAAAGTAGCTGTATC 

ATTTGCTGACCATAAGAATGAGAAGGGTCTTTATAATATTCATTTATACT 

ACCAAGAAGCTAGTGGGACACTTGTAGGTGTAACAGGAACTAAAGTGACA 

GTAGCTGGAACTAATTCTTCTCAAGAACCTATTGAAAATGGTTTAGCAAA 

GACTGGTGTTTATAATATTATCGGAAGTACTGAAGTAAAAAATGAAGCTA 

AAATATCAAGTCAGACCCAATTTACTTTAGAAAAAG(?TGACAAAATAAAT 

TATGATCAAGTATTGACAGCAGATGGTTACCAGTGGATTTCTTACAAATC 

TTATAGTGGTGTTCGTCGCTATATTCCTGTGAAAAAGCTAACTACAAGTA 

GTGAAAAAGCGAAAGATGAGGCGACTAAACCGACTAGTTATCCCAACTTA 

CCTAAAACAGGTACCTATACATTTACTAAAACTGTAGATGTGAAGAGTCA 

AGCTAAAGTATCAAGTCCAGTGGAATTTAATTTTCAAAAGGGTGAAAAAA 

TACATTATGATCAAGTGTTAGTAGTAGATGGTCATCAGTGGATTTCATAC 

AAGAGTTATTCCGGTATTCGTCGCTATATTGAAATT 

SEQ ID NO. 8910 

STRAIN 1169NT 

AAAAAAGGACAAGTAAATGATACTAAGCAATCTTACTC 

TCTACGTAAATATAAATTTGGTTTAGCATCAGTAATTTTAGGGTCATTCA 

TAATGGTCACAAGTCCTGTTTTTGCGGATCAAACTACATCGGTTCAAGTT 

AATAATCAGACAGGCACTAGTGTGGATGCTAATAATTCTTCCAATGAGAC 

AAGTGCGTCAAGTGTGATTACTTCCAATAATGATAGTGTTCAAGCGTCTG 

ATAAAGTTGTAAATAGTCAAAATACGGCAACAAAGGACATTACTACTCCT 

TTAGTAGAGACAAAGCCAATGGTGGAAAAAACATTACCTGAACAAGGGAA 

TTATGTTTATAGCAAAGAAACCGAGGTGAAAAATACACCTTCAAAATCAG 

CCCCAGTAGCTTTCTATGCAAAGAAAGGTGATAAAGTTTTCTATGACCAA 

GTATTTAATAAAGATAATGTGAAATGGATTTCATATAAGTCTTTTGGTGG 

CGTACGTCGATACGCAGCTATTGAGTCACTAGATCCATCAGGAGGTTCAG 

AGACTAAAGCACCTACTCCTGTAACAAATTCAGGAAGCAATAATCAAGAG 

AAAATAGCAACGCAAGGAAATTATACATTTTCACATAAAGTAGAAGTAAA 

AAATGAAGCTAAGGTAGCGAGTCCAACTCAATTTACATTGGACAAAGGAG 

ACAGAATTTTTTACGACCAAATACTAACTATTGAAGGAAATCAGTGGTTA 

TCTTATAAATCATTCAATGGTGTTCGTCGTTTTGTTTTGCTAGGTAAAGC 

ATCTTCAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCTCCTCAACCAC 

AAGCCCGTATTACTAAAACTGGTAGACTGACTATTTCT/^ACGAAACAACT 

ACAGGTTTTGATATTTTAATTACGAATATTAAAGATGATAACGGTATCGC 

TGCTGTTAAGGTACCGGTTTGGACTGAACAAGGAGGGCAAGATGATATTA 

AATGGTATACAGCTGTAACTACTGGGGATGGCAACTACAAAGTAGCTGTA 

TCATTTGCTGACCATAAGAATGAGAAGGGTCTTTATAATATTCATTTATA 

CTACCAAGAAGCTAGTGGGACACTTGTAGGTGTAACAGGAACTAAAGTGA 

CAGTAGCTGGAaCTAATTCTTCTCAAGAACCTATTGAAAATGGTTTAGCA 

AAGACTGGTGTTTATAATATTATCGGAAGTACTGAAGTAAAAAATGAAGC 

TAAAATATCAAGTCAGACCCAATTTACTTTAGAAAAAGGTGACAAAATAA 

ATTATGATCAAGTATTGACAGCAGATGGTTACCAGTGGATTTCTTACAAA 

TCTTATAGTGGTGTTCGTCGCTATATTCCTGTGAAAAAGCTAACTACAAG 

TAGTGAAAAAGCGAAAGATGAGGCGACTAAACCGACTAGTTATCCCAACT 

TACCTAAAACAGGTACCTATACATTTACTAAAACTGTAGATGTGAAAAGT 

CAACCTAAAGTATCAAGTCCAGTGGAATTTAATTTTCAAAAGGGTGAAAA 
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AATACATTATGATCAAGTGTTAGTAGTAGATGGTCATCAGTGGATTTCAT 
ACAAGAGTTATTCCGGTATTCGTCGCTATATTGAAATT 

SEQ ID NO. 8911 

STRAIN JM9130013 

AAAAAAGGACAAGTAAATGATACTAAGCAATCTTACT 
CTCTACGTAAATATAAATTTGGTTTAGCATCAGTAATTTTAGGGTCATTC 
ATAATGGTCACAAGTCCTGTTTTTGCGGATCAAACTACATCGGTTCAAGT 
TAATAATCAGACAGGCACTAGTGTGGATGCTAATAATTCTTCCAATGAGA 
CAAGTGCGTCAAGTGTGATTACTTCCAATAATGATAGTGTTCAAGCGTCT 
GATAAAGTTGTAAATAGTCAAAATACGGCAACAAAGGACATTACTACTCC 
TTTAGTAGAGACAAAGCCAATGGTGGAAAAAACATTACCTGAACAAGGGA 
ATTATGTTTATAGCAAAGAAACCGAGGTGAAAAATACACCTTCAAAATCA 
GCCCCAGTAGCTTTCTATGCAAAGAAAGGTGATAAAGTTTTCTATGACCA 
AGTATTTAATAAAGATAATGTGAAATGGATTTCATATAAGTCTTTTTGTG 
GCGTACGTCGATACGCAGCTATTGAGTCACTAGATCCATCAGGAGGT^CA 
GAGACTAAAGCACCTACTCCTGTAACAAATTCAGGAAGCAATAATCAAGA 
GAAAATAGCAACGCAAGGAAATTATACATTTTCACATAAAGTAGAAGTAA 
AAAATGAAGCTAAGGTAGCGAGTCCAACTCAATTTACATTGGACAAAGGA 
GACAGAATTTTTTACGACCAAATACTAACTATTGAAGGAAATCAGTGGTT 
ATCTTATAAATCATTCAATGGTGTTCGTCGTTTTGTTTTGCTAGGTAAAG 
CATCTTCAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCTCCTCAACCA 
' CAAGCCCGTATTACTAAAACTGGTAQACTGACTATTTATAACGAAACAAC 
TACAGGTTTTGATATTTTAATTACGAATATTAAAGATGATAACGGTATCG 
CTGCTGTTAAGGTACCGGTTTGGACTGAACAAGGAGGGCAAGATGATATT 
AAATGGTATACAGCTGTAACTACTGGGGATGGCAACTACAAAGTAGCTGT 
ATCATTTGCTGACCATAAGAATGAGAAGGGTCJTTATAATATTCATTTAT 
ACTACCAAGAAGCTAGTGGGACACTTGTAGGTGTAACAGGAACTAAAGTG ' 
ACAGTAGCTGGAACTAATTCTTCTCAAGAACCTATTGAAAATGGTTTAGC 
AAAGACTGGTGTTTATAATATTATCGGAAGTACTGAAGTAAAAAATGAAG 
CTAAAATATCAAGTCAGACCCAATTTACTTTAGAAAAAGGTGACAAAATA 
AATTATGATCAAGTATTGACAGCAGATGGTTACCAGTGGATTTCTTACAA 
ATCTTATAGTGGTGTTCGTCGCTATATTCCTGTGAAAAAGCTAACTACAA 
GTAGTGAAAAAGCGAAAGATGAGGCGACTAAACCGACTAGTTATCCCAAC 
TTACCTAAAACAGGTACCTATACATTTACTAAAACTGTAGATGTGAAGAG* 
TCAACCTAAAGTATCAAGTCCAGTGGAATTTAATTTTCAAAAGGGTGAAA 
AAATACATTATGATCAAGTGTTAGTAGTAGATGGTCATCAGTGGATTTCA 
TACAAGAGTTATTCCGGTATTCGTCGCTATATTGAAATT 

SEQ ID NO. 8912 

STRAIN 2 603 frame: 1 

MKKGQVNDTKQSYSLRKYKFGLASVILGSFIMVTSPVFADQTTSVQVNNQTGTSVDANNS 

SNETSASSVITSNNDSVQASDKWNSQNTATKDITTPLVETKPMVEKTLPEQGNYVYSKE 

TEVKNTPSKSAPVAFYAKKGDKVFYDQVFNKDNVKWISYKSFCGVRRYAAIESLDPSGGS 

ETKAPTPVTNSGSNNQEKIATQGNYTFSHKVEVKNEAKVASPTQFTLDKGDRIFYDQILT 

IEGNQWLSYKSFNGVRRFVLLGKASSVEKTEDKEKVSPQPQARITBCTGRLTISNETTTGF 

DILITNIKDDNGIAAVKVPVWTEQGGQDDIKWYTAVTTGDGNYKVAVSFADHKNEKGLYN 

IHLYYQEASGTLVGVTGTKVTVAGTNSSQEPIENGLAKTGVYNIIGSTEVECNEAKISSQT 

QFTLEKGDKINYDQVLTADGYQWISYKSYSGVRRYIPVKKLTTSSEKAKDEATKPTSYPN 

LPKTGTYTFTKTVDVKSQPKVSSPVEFNFQKGEKIHYDQVLWDGHQWISYKSYSGIRRY 
IEI 

SEQ ID NO. 8913 

STRAIN 090 frame: 1 

KKGQVNDTKQSYSLRKYKTOIASVILGSFIMVTSPVFADQTTSVQVNNQTGTSVDANNSS 

NETSASSVITSNNDSVQASDKWNSQNTATKDITTPLVETKPMVEKTLPEQGNYVYSKET 

EVKNTPSKSAPVAFYAKKGDKVFYDQVFNKDNVKWISYKSFCGVRRYAAIESLDPSGGSE 

TKAPTPVTNSGSNNQEKIATQGNYTFSHKVEVKNEAKVASPTQFTLDKGDRIFYDQILTI 

EGNQWLSYKSFNGVRRFVLLGKASSVEKTEDKEKVSPQPQARITKTGRLTISNETTTGFD 

ILITNIKDDNGIAAVKVPVWTEQGGQDDIKWYTAVTTGDGNYKVAVSFADHKNEKGLYNI 

HLYYQEASGTLVGVTGTKVTVAGTNSSQEPIENGLAKTGVYNIIGSTEVKNE1AKISSQTQ 

FTLEKGDKINYDQVLTADGYQWISYKSYSGVRRYI PVKKLTTSSEKAKDEATKPTSYPNL 

PKTGTYTFTKTVDVKSQPKVSSPVEFNFQKGEKIHYDQVLWDGHQWISYKSYSGIRRYI 
EI 
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SEQ ID NO. 8914 

STRAIN A909 frame: 1 

KKGQVNDTKQSYSLRKYKFGLASVILGSFIMVTSPVFADQTTSVQVNNQTGTSVDANNSS 
NETSASSVITSNNDSVQASDKWNSQNTATKDITTPLVETKPMVEKTLPEQGNYVYSKET 
EVKNTPSKSAPVAFYAKKGDKVFYDQVFNKDNVKWISYKSFCGVRRYAAIESLDPSGGSE 
TKAPTPVTNSGSNNQEKIATQGNYTFSHKVEVKNEAKVASPTQFTLDKGDRIFYDQILTI 
EGNQWLSYKSFNGVRRFVLLGKASSVEKTEDKEKVSPQPQARITKTGRLTISNETTTGFD 
ILITNIKDDNGIAAVKVPWTEQGGQDDIKWYTAVTTGDGNYKVAVSFADHKNEKGLYNI 
HLYYQEASGTLVGVTGTKVTVAGTNSSQEPIENGLAKTGVYNIIGSTEVKNEAKISSQTQ 
FTLEKGDKINYDQVLTADGYQWISYKSYSGVRRYIPVKKLTTSSEKAKDEATKPTSYPNL 
PKTGTYTFTKTVDVKSQPKVSSPVEFNFQKGEKIHYDQVLWDGHQWISYKSYSGIRRYI 
EI 

SEQ ID NO. - 8915 

STRAIN H36B frame: 1 ' - ' 

KKGQVNDTKQSYSLRKYKreLASVILGSFIMVTSPVFADQTO 

NETSASSVITSNNDSVQASDKVVNSQNTATKDITTPLVETKPMVEKTLPEQGNYVYSKET 
EVKNTPSKSAPVAFYAECKGDKVFYDQVFNKDNVKWISYKSFCGVRRYAAIESLDPSGGSE 
TKAPTPVTNSGSNNQEKIATQGNYTFSHKVEVKNEAKVASPTQFTLDKGDRIFYDQILTI 
EGNQWLSYKSFNGVRRFVLLGKASSVEKTEDKEKVSPQPQARITKTGRLTISNETTTGFD 
ILITNIKDDNGIAAVKVPWTEQGGQDDIKWYTAVTTGEK3NYKVAVSFADHKNEKGLYNI 
HLYYQEASGTLVGVTGTKVTVAGTNSSQEPIENGLAKTGVYNIIGSTEVKNEAKISSQTQ 
FTLEKGDKINYDQVIiTADGYQWISYKSYSGVRft.YIE;VKKLTTSSEKAKDEiATKPTSYPNL 
PKTGTYT^KTVDVKSQPKVSfePVEFNFQKGEKIHYDQVLVVDGHQWISYKSYSGIRRYI 
EI * * 

,9 

SEQ ID NO. 8916 

STRAIN 18RS21 frame: 1 

KKGQVNDTKQSYSLRKYKFGLASVILGSFIMVTSPVFADQTTSVQVNNQTGTSVDANNSS 
NETSASSVITSNNDSVQASDKWNSQNTATKDITTPLVETKPMVEKTLPEQGNYVYSKET 
EVKNTPSKSAPVAFYAKKGDKVFYDQVFNKDNVKWISYKSFCGVRRYAAIESLDPSGGSE 
TKAPTPVTNSGSNNQEKIATQGNYTFSHKVEVKNEAKVASPTQFTLDKGDRIFYDQILTI 
EGNQWLSYKSFNGVRRFVLLGKASSVEKTEDKEKVSPQPQARITKTGRLTISNETTTGFD 
ILITNIKDDNGIAAVKVPVWTEQGGQDDIKWYTAVTTGDGNYKVAVSFADHKNEKGLYNI 
HLYYQEASGTLVGVTGTKVTVAGTNSSQEPIENGLAKTGVYNIIGSTEVKNEAKISSQTQ 
FTLEKGDKINYDQVLTADGYQWI S YKS YSGVRRYI PVKKLTTSSEKAKDEATKPTS YPNL 
PKTGTYTFTKTVDVKSQPKVSSPVEFNFQKGEKIHYDQVLWDGHQWISYKSYSGIRRYI 
EI 

SEQ ID NO. 8917 

STRAIN M732 frame: 1 

QVNDTKQSYSLRKYKFGLASVILGSFIMVTSPVFADQTTSVQVNNQTGTSVDANNSSNET 
SASSVITSNNDSVQASDKWNSQNTATKDITTPLVETKPMVEKTLPEQGNYVYSKETEVK 
NTPSKSAPVAFYAKKGDKVFYDQVFNKDNVKWISYKSFGGVRRYAAIESLDPSGGSETKA 
PTPVTNSGSNNQEKIATQGNYTFSHKVEVKNEAKVASPTQFTLDKGDRIFYDQILTIEGN 
QWLSYKSFNGVRRFVLLGKASSVEKTEDKEKVSPQPQARITKTGRLTISNETTTGFDILI 
TNIKDDNGI71AVKVPVWTEQGGQDDIKWYTAVTTGDGNYKVAVSFADHKNEKGLYNIHLY 
YQEASGTLVGVTGTKVTVAGTNSSQEPIENGLPKTGVYNIIGSTEVKNEAKISSQTQFTL 
EKGDKINYDQVLTADGYQWIS YKS YSGVRRYI PVKKLTTSSEKAKDEATKPTS YPNLPKT 
GTYTFTKTVDVKSQPKVSSPVEFNFQKGEKIHYDQVLWDGHQWISYKSYSGIRRYIEI 

SEQ ID NO. 8918 

STRAIN COH1 frame: 1 

KKGQVNDTKQSYSLRKYKFGLASVILGSFIMVTSPVFADQTTSVQVNNQTGTSVDANNSS 
NETSASSVITSNNDSVQASDKWNSQNTATKDITTPLVETKPMVEKTLPEQGNYVYSKET 
EVKNTPSKSAPVAFYAKKGDKVFYDQVFNKDNVKWISYKSFGGVRRYAAIESLDPSGGSE 
TKAPTPVTNSGSNNQEKIATQGNYTFSHKVEVKNEAKVASPTQFTLDKGDRIFYDQILTI 
EGNQWLSYKSFNGVRRFVLLGKASSVEKTEDKEKVSPQPQARITKTGRLTISNETTTGFD 
ILITNIKDDNGIAAVKVPVWTEQGGQDDIKWYTAVTTGDGNYKVAVSFADHKNEKGLYNI 
HLYYQEASGTLVGVTGTKVTVAGTNSSQEPIENGLPKTGVYNIIGSTEVKNEAKISSQTQ 
FTLEKGDKINYDQVLTADGYQW I SYTCS YSGVRRYI PVKKLTTSSEKAKDEATKPTS YPNL 
PKTGTYTFTKTVDVKSQPKVSSPVEFNFQKGEKIHYDQVLWDGHQWISYKSYSGIRRYI 
EI 
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SEQ ID NO. 8919 

STRAIN M781 frame: 1 

KKGQVNDTKQSYSLRKYKFGLASVILGSFIMVTSPVFADQTTSVQVNNQTGTSVDANNSS 
NETSASSVITSNNDSVQASDKWNSQNTATKDITTPLVETKPMVEKTLPEQGNYVYSKET 
EVKNTPSKSAPVAFYAKKGDKVFYDQVFNKDNVKWISYKSFGGVRRYAAIESLDPSGGSE 
TKAPT&VTNSGSNNQEKIATQGNYTFSHKVEVKNEAKVASPTQFTLDKGDRIFYDQILTI 
EGNQWLSYKSFNGVRRFVLLGKASSVEKTEDKEKVSPQPQARITKTGRLTISNETTTGFD 
ILITNIKDDNGIAAVKVPVWTEQGGQDDIKWYTAVTTGDGNYKVAVSFADHKNEKGLYNI 
HLYYQEASGTLVGVTGTKVTVAGTNSSQEPIENGLPKTGVYNIIGSTEVKNEAKISSQTQ 
FTLEKGDKINYDQVLTADGYQWISYKSYSGVRRYIPVKKLTTSSEKAKDEATKPTSYPNL 
PKTGTYTFTKTVDVKSQPKVSSPVEFNFQKGEKIHYDQVLWDGHQWISYKSYSGIRRYI 
EI 

SEQ ID NO. 8920 

. STRAIN CJB110 frame: 1 

KKGQVNDTKQSYSLRKYKFGLASVILGSFIMVTSPVFADQTTSVQVNNQTGTSVDANNSS 
NETSASSVITSNNDSVQASDKWNSQNTATKDITTPLVETKPMVEKTLPEQGNYVYSKET 
EVKNTPSKSAPVAFYAKKGDKVFYDQVFNKDNVKWISYKSFCGVRRYAAIESLDPSGGSE 
TKAPTPVTNSGSNNQEKIATQGNYTFSHKVEVKNEAKVASPTQFTLDKGDRIFYDQILTI 
EGNQWLSYKSFNGVRRFVLLGKASSVEKTEDKEKVSPQPQARITKTGRLTISNETTTGFD 
ILITNIKDDNGIAAVKVPVWTEQGGQDDIKWYTAVTTGDGNYKVAVSFADHKNEKGLYNI 
HLYYQEASGTLVGVTGTKVTVAGTNSSQEPIENGLAKTGVYNIIGSTEVKNEAKISSQTQ 
FTLEKGDKINYDQVLTADG YQWI S YKS YSGVRRYI PVKKLTTS SEKAKDE ATKPT S Y PNL 
PKTGTYTFTKTVDVKSQPKVSSPVEFNFQKGEKIHYDQVLVVDGHQWISYKSYSGIRRYI 
EI 

SEQ ID NO. 892X 

STRAIN 1169NT frame: 1 

KKGQVN DTKQS YS LRKYKFGLAS VI LGS F IMVT S PVFADQTT S VQVNNQTGTS VDANN S S 
NETSASSVITSNNDSVQASDKWNSQNTATKDITTPLVETKPMVEKTLPEQGNYVYSKET 
EVKNTPSKSAPVAFYAKKGDKVFYDQVFNKDNVKWISYKSFGGVRRYAAIESLDPSGGSE 
TKAPTPVTNSGSNNQEKIATQGNYTFSHKVEVKNEAKVASPTQFTLDKGDRIFYDQILTI 
EGNQWLSYKSFNGVRRFVLLGKASSVEKTEDKEKVSPQPQARITKTGRLTISNETTTGFD 
ILITNIKDDNGIAAVKVPVWTEQGGQDDIKWYTAVTTGDGNYKVAVSFADHKNEKGLYNI 
HLYYQEASGTLVGVTGTKVTVAGTNSSQEPIENGLAKTGVYNIIGSTEVKNEAKISSQTQ 
FTLEKGDKINYDQVLTADGYQWISYKSYSGVRRYIPVKKLTTSSEKAKDEATKPTSYPNL 
PKTGTYTFTKTVDVKSQPKVSSPVEFNFQKGEKIHYDQVLVVDGHQWISYKSYSGIRRYI 
EI 

SEQ ID NO. 8922 

STRAIN JM9130013 frame: 1 

KKGQVN DTKQS YSLRKYKFGLASVI LGS FIMVTSPVFADQTTS VQVNNQTGTS VDANNSS 
NETSASSVITSNNDSVQASDKWNSQNTATKDITTPLVETKPMVEKTLPEQGNYVYSKET 
EVKNTPSKSAPVAFYAKKGDKVFYDQVFNKDNVKWISYKSFCGVRRYAAIESLDPSGGSE 
TKAPTPVTNSGSNNQEKIATQGNYTFSHKVEVKNEAKVASPTQFTLDKGDRIFYDQILTI 
EGNQWLSYKSFNGVRRFVLLGKASSVEKTEDKEKVSPQPQARITKTGRLTIYNETTTGFD 
ILITNIKDDNGIAAVKVPVWTEQGGQDDIKWYTAVTTGDGNYKVAVSFADHKNEKGLYNI 
HLYYQEASGT LVGVTGTKVT VAGTN S SQE PI ENGLAKTGVYN I IGSTEVKNEAKI S SQTQ 
FTLEKGDKINYDQVLTADGYQWISYKSYSGVRRYIPVKKLTTSSEKAKDEATKPTSYPNL 
PKTGTYTFTKTVDVKSQPKVSSPVEFNFQKGEKIHYDQVLWDGHQWISYKSYSGIRRYI 
EI 
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\JM\J? 


Ct 7A 

oize 


/MIUU lit UU 11 




4S^ 


r» Virrvm Ci cnm n 1 rfmlifiatirvn initiator TVTOtein RnaA 


a 00002 1 


17R 


J_/i>l/Tk. \J\Jiy 1X1C1 ddC XXX, UClu oUUUliil 


<?Annoni 


7Q1 


ClldOyigiyuciwll nJ.Ila.oC KsaUxiy iiv tJ.Ulliaj.ll piuiciil, pU La Live 


<5Aonno4 


Oj 


cunbcivcu xiypuuiciiv/cti piuLciii 


q Af^nnn^ 


£7 


nypuiiiciiuai protein 


oAljrUUUO 


171 
J 1 X 


Vj 1 Jr-Dinamg proiein x cur 


oAvjrvUU / 


1 Ol 

iy 1 


pepuQyi-iJKJ.N a nyuroiasc 


OAVJUUUO 


1 ioz> 


IXallbOl ip LlUIl~*rcpalX i/UupilIlg laCLUt 


c a nnnno 




nypoiiiciicai proiein 


q a r^nn 1 n 


on 
yu 


of uoniain proicin 


oAVjUi/1 I 


1 71 
XZ3 


ceil ai vision proicin uivi^, purauve 


q a ru\(\ i 7 

oAVJUUXZ 


A A 


conservcu nypouieucai proicin 


q a rjAAi i 


AOS 


proicin ox unKnown iuncuon 


C A ndf\ 1 A 




ivies J/ x cioz iainiiy proicin 


o a nhf\ i ^ 

O AOUU 1 J 


1 fin 

XoU 


nypoxaiiininc-guaninc pno spnpn oosy lix itnsicrasc 


Q A rxxc\ 1 A 

OAVJvUXO 


Ojo 


ecu cu v lbiun pruicin r u>n 


Q A nf\(\1 7 
oAvjrUU 1 / 




pcsr> proicin 




177 
JZZ 


noose-pnpspnaie pyropnospnojvinasc 


C A flAfll O 


ioi 


urn l no uauisicra.se, class x 


c a ru\c\o(\ 

OAUUUZU 


7^1 


recouiDinaiion proicin kj 




7R1 
Zoj 


prOlCabC, pUlaUVC 


SAG0022 


330 


fatty acid/phospholipid synthesis protein PlsX 


C A nAAOl 
oAVJUUZ:) 


70 

/y 


acyx carrier protein 


q a nnooA 

oAvjl/UZ*f 


71A 


pnospnonDosyia^ininoiniiaazoie-suc syninasc 


O A dfifYl ^ 

oAIjUUZj 


1 7A1 
XZ*fX 


pnospnoiiDOsyiioixnyigiycinaniiuinc synmasc, puiauve 


dALjUUZO 




amiaopnospnori oosy 1 u ansicrasc 


o AIjUUZ / 


i/in 


pnospnonoosyiionnyigiycinaniiQinc cycio-ngasc 


c a ncido c 
oAtjUUZo 


1 fi7 
X5Z 


r\nAfirtnAi*tV\Ari r 1 rtMrAittomtnA T/\mMtflfrancfora 

pnospnonuosyigiycinamiuc xoixnyiiransxcrasc 


oAOUUZy 


7^n 

ZjU 


aceiyiiransierase, vjin/vx xamixy 




DID 


pnospnon oosy laxninoxxxiiud^u iccarou Aaimuc 

fir\t* rTiTy1fT**3tng'ff>t*Q ca/TTV^P /^*t/r" 1 r\Vi"\/H rr\1 si c f* 
Xv/l Uiy Ilia iloXCJ. aoC/ ixYlx v/y V/ HJlljr ui uiaoc 


q a nnm i 


700 


npnfi^QCP TV^"71/AyI17 ramiiv 

pcpixuabc 9 AY1Z.J/1YU / lcuiuiy 


QAfr00i7 


4^4 


oTr^iin "Fl cfTPTitrtPOf*f*fll qiitFaop imnmitifiP'P'n'ic "nrAtPiTi 

gLUUp .13 ollwpiVlwV/wvCLl OlUlawb 11111X1 Ullugvlliv J^lvrl^lll 


^Anooi'* 


7^9 


^-apptvltnn'nnriQflTniTip-.fi-P f*T>iirifti*a^e twtative 
aoety liiiaiuiu aai i iJiit« vat vpiiiiwiaov^ kyu.u»vivw 


SAG0034 


438 


sugar ABC transporter, sugar-binding protein 


Q A OOOI S 


70^ 


&>ugar ajdv uans>purici, pciiucaoc piuicui 


q a rinni/; 


97/: 


oUgdl ADV^ UaQbpUlLCl, pCIlXl.Ca.oC piU LClli 


q a 00017 


147 

AH / 


ivUUoCXVCU IiyptJlllCLlvvaX piULClll 


c aoooik 


77n 


pnticpnfp/1 Vix/TM^fliP>tir*ii1 nrAfpin 

conserveu nypouieucai proicin 


SAG0039 


305 


N-acetvlneuraiTiinate lvase. Dutative 


SAG0040 


293 


ROK family protein 


SAG0041 


325 


acetyl xylan esterase, putative ! 


SAG0042 


267 


phosphosugar-binding transcriptional regulator, RpiR family, 
putative 


SAG0043 


421 


phosphoribosylamine—glycine ligase 


SAGO044 


162 


phosphoribosylaminoimidazole carboxylase, catalytic subunit 


SAG0045 


363 


phosphoribosylaminoimidazole carboxylase, ATPase subunit 


SAG0046 


463 


membrane protein, putative 
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fa a • 


A fin a tin n 


SAG0047 


432 


f»ffp.nv1r\Qiicpinfitp Ivaqp 


SAG0048 


303 


fTfln^nTintinnal rpoiitator Oro/C^T farnilv 

XXClHd wX kVJ L117X1CX1 IvgUlalvi) V/IW/ V^»X XaXXXXljr 


SAG0049 


332 


HWlliHav iimntinn TYISJ A hpliriase TviivR 


SAG0050 

UilVj \J\J \J 


145 

X "T,7 


i^VincnliofT/TrtC'iTi^ i^fotpin tWiocrVliJit'ficp 1 cwjj TT»n1i»r»ii1iit* vLr/aiarVif" 

piIAJopilAJ ly l\7olllG piULGIIl pxlU&piiaiCLoC?, 1UW lllvJlClslXlal WClglll 


SAG0051 


1 Z.U 


lVlVyxVL> 11117 111 Xctlllliy pi 17 IC ill 


SAGO052 

kj7k.VJ \J\J -J 4* 


5Q9 


iiicjuiuidiic prutcm, puuxuvc , 


55AG0053 


880 


olLlCLiy UC~cUOv7llV7l UCIiyUllJgvIlcXoC 


SAG0054 


338 


aivv9iiui vxciiyui^jgciictoo, piup<tiiLH~picicixing 


SAG0055 


496 


U11CVI11111C oyilUlaoC 


SAO0056 


41? 


IVl^rV 1 £2, C1I1UA lmllliy piULClll ^ 


SAO0057 




1 1 uu buiiicti pro loin oiu 


•SAG0058 


208 


lll/UoUIIlal piUlClIl, JL/P 


SAO0059 


907 


XlUvS>VlXll<ll pivllCUl X-TT 


SAG0060 


98 


llUUoVIxlcll piUtClil L^Z,J 


SAG0061 


277 


liuuov/uicii pruiciii juz. 




09 


xiuuouiiiai pruiciii Ol7 


SAO0063 


1 14 


IlUUoOxllcU piUtClIl i_<ZrZr 


SAG0064 


217 


llUvloLilllcIl pii/lClll OO 


SAO0065 


1 37 


xlUUMJlxlai piOlClll XjIk) 


SAfr0066 


uo 


llUUoUlIlcll piUlClIl ±j£*Z? 


SAH0067 


ou 


XlULIov/lllal pi LI LC 111 Ol / 


SAG0068 


129 


■i~iV*rfcGOTina1 nrotMn T 1 A. 
XlUUaUlxlal piUlCUl JL»l*t 


SAC10069 


101 

lvi 


lil/VJoVJlXlCL-1 piUlCllI I->Zr*+ 


SAG0070 


180 


TilincoTTial T»Tr» , t'< : * in T *\ 

liL/w&VJllldl piUtwlll Xw^ 


SAG0071 


61 


HLWJoUllla.1 piULClll OI*Tj pUlaUYC 


SAG0072 


132 


riViftQntnal t^rnff^'i'n QR 
i ll7VJk9v/llla.l pi 17 twill uO 


SAG0073 


178 

I/O 


TiVif»cninj*1 T»Tr%tp»iTi T 6 

LlUlFoWlll&l piUlwlll XJKj 


SAG0074 


118 

no 


t*iV>nQnnrtft1 nrrtt^in T 1 8 
liuvouiiiai pxutidii juio 


SAG0075 


164 

1\J*T 


fifinQ/MTial nrAfpin 
XltlLPov/Illctl piULClll OJ 


SAG0076 


59 


TiVinQomal •nTrtf^iTi T 30 

jLii/UoUiiiai pi VJlwlll IvJl/ I 


SAG0077 

Oil' — J vy \J I f 


146 


TlnftCntYlfll i^Tof^lTl T 1 ^ 
XlU/VyovllXldl pi 17 td 11 X^l«7 


SAG0078 


434 


nTP/nrotfii n iranQlnpjiQp SpoV cnHiinif 

|/X^ypXV/LwlXl iiailOlUk/ClOW) Ow X 9UUIUUI 


SAG0079 


212 


afienvlfltfi VinaQp 


SAG0080 


72 


tratiQlaHon inifiatinn fiaptnr 1TP-1 

uaiioiauuii iixiLXa>u\7ii x&\j \.\JL XX A 


SAG0081 


38 


TiHo^omal nrntein T 36 


SAG0082 


121 


■riTinsomal nrnfpin S 1 3 i 

AXU\70\71X1O1 pX\7lwXXX J1J 


SAG0083 


118 


TiHo^fimal nrnfein S1 1 


SAG0084 


312 


T"j"NA-fxirp.p.tpf1 "R^TA v\ r\\ vm ptji qp alnVia Qiihnnit - 
jlxa^^v uix^vidA xvi^iiTL pi7Xjrixidc»ow 9 ctxpiia otiuixixxi. 


SAG0085 


128 


Ttlincinmal nrntftin T 1 7 

A lUWOUillllJl pXvllwXIX 1j1 / 


SAG0086 


85 


lipoprotein, putative 


SAG0087 


59 


hypothetical protein 


SAG0088 


56 


hypothetical protein 


SAG0089 


183 


conserved hypothetical protein 


SAG0090 


139 


conserved hypothetical protein 


SAG0091 


144 


transcriptional regulator ComXl , putative j 


SAG0092 


230 


phosphoglycerate mutase family protein 


SAG0093 


250 


D-alanyl-D-alanine carboxypeptidase family protein 


SAG0094 


191 


N-acetylmuramoyl-L-alanine amidase, family 4 protein 
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ORF 


Size 


Annotation 


SAG0095 


344 


heat- inducible transcription repressor HrcA 


SAG0096 


190 


heat shock protein GrpE 


SAG0097 


609 


dnaK protein 


SAG0098 


379 


dnaJ protein 


SAG0099 


415 


transcriptional regulator GntR familv 


SAG0100 


258 


tRTsJA nseudouridine svnthase A 


SAG0101 


252 


nhosnhomefhvlnvrinriidine Icinase mi tati ve 

^xjL\j*3^jxx\jxAx\\*^xxy i^jy a mumiiv miioov) puutuvv 


SAGO 102 


154 


conserved hvnothetieal nrotein 


SAGO 103 

A A>^^ A «^ 


189 


conserved hvnothetieal nrotein TIGR0 1 440 


SAGO 104 


280 


conserved hvnothetieal nrotein 


SAGO 105 


427 


triffcer factor « 


SAGO 106 


191 


DNA-directed UNA nolvmerase delta <mhiinit rmtative 


SAG0107 


534 


CTP svnthase 

^/ X X »J T Xli UUUlw „ 1 


SAGO 108 


308 


conserved hvnothetieal nrotein 


SAG0109 


148 


deoxvuridine S * -trinhosnh a te niielentidnhvdrolase 


SAG0110 


454 


T^NA renair nrotein Rad A 


SAG0111 

\f AAA 


165 


carbonic anhvdrase-related nrotein 


SAG0112 


439 


nvridine nucleotide-disulnhide oxidoreduetase familv nrotf»in 


SAG0113 


484 


fflutamvl-tRNA svnthetase 


SAG0114 


' 322 


ribose ABO Iran snorter nerfnlasxnie Ty-rihnse-hindin<» nrntein 


SAG0115 


310 


ribose ABC transnorter nermease nrotein 


SAG0116 


492 


ribose ABC transnorter ATP-bindiner nrotein 


SAG0117 


132 


ribose ABC transnorter nrotein RhsD 

A 1UUJV rVUVy LXCXlxO|Jv'l Wsk fJX\ \J IXslll IwOx/ 


SAG0118 

w7 A L\J V A A KJ 


303 


ribolcinase 


SAG0119 

%JJL WJ V/ X X. ^ 


328 


ribose oneron renressor RbsR 


SAGO 120 


32 


hvnothetieal nrotein 


SAG0121 


362 


nermease nutative 


SAGO 122 


228 


ABC transnorter ATP-bindinff nrotein 

* XX^^^i* UIUIUJUVJ. >VAj X XXX LSXWwXXl 


SAG0123 


223 


DNA-bindinff resnonse regulator 


SAG0124 


356 


sensor histidine kinase 


SAG0125 


396 


arffinino succinate svnthase 


SAGO 126 


462 


argininosuccinate lyase 


SAG0127 


293 


fructose-bisphosphate aldolase 


SAG0128 


305 


L-2-hydroxyisocaproate dehydrogenase 


SAGO 129 


62 


ribosomal nrotein L28 


SAG0130 


121 


conserved hvnothetieal nrotein 


SAG0131 

A v/ A «^ A 


543 


DAK2 domain nrotein 


SAGO 132 


294 


SPFH domain/Band 7 familv nrotein 


SAGO 133 


38 


conserved hvnothetieal nrotein 


SAG0134 


96 


hypothetical protein 


SAG0135 


246 


amino acid ABC transporter, ATP-binding protein 


SAG0136 


I 516 


amino acid ABC transporter, amino acid-binding protein/permease 
protein 


SAG0.137 


627 


conserved hypothetical protein 


SAGO 138 


279 


undecaprenol kinase, putative 


SAG0139 


251 


negative regulator of competence MecA, putative 


SAG0140 


386 


glycosyl transferase, group 4 family protein 


SAG0141 


256 


ABC transporter, ATP-binding protein 
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Atintfvtotinn 
miuvuiuuii 


SAGO 142 


420 


rnn^pTved hvnothetieal nrotein 


SAGO 143 


410 


Qf»1f»noevsteine Ivase 

O vIvllU w j O XwXXXw l y aOv 


SAG0144 


147 

it/ 


"MlfT T Tamil V TMTVtfMTl 
lillU xtxxxxxxj pil/lClll 


SAG014S 


47? 


fntiQpTVf^H Vivti ntlif* tipjil nrotpin 

vUU&vl V vU iijr p \J IXXv IXWiXX pxi/lwxXX 


c A G0 146 




ti^tii r*il1 tYi— fviriHiT^cr nrntpifi 4 lMiftl+ivl* 
pOlxlL>xllxxl~UxxllXxlxg piULClli *t, pUUlUVC 


OA O01 4.7 


41 1 


x>^~dl<tujrl ~l^~»l«xxXlxC OalUUAypcpixlxaoC XalXilljr piUlCxll 


c AO014R 


SSI 


UxlgUpcpiILLC ADL/ IXdxXopUllOl, oUUoll<llC~UlIxUJxJ.g piUlCIIl, piXUXUVv 






UiXgupcptlUw ADy UaUopUiUCI, pcliliCaoC piUlClIl 


QAoni sn 


^41 


UllgUpcpULUC ADL- UOAlopUl ICI 9 pCXlXlCctoC piUlCiXl 


^Annisi 




. OllgppcpilUC ADV^ Ixallppuricr , r\ ± r -JJlIlQlIlg pxUlClli 




^in 


OxlgOpcpiLUC r\jy\^/ IXallopUl ICi , x\.L r -OlJlUlIlg piOLClIl 




98^ 


^-uipnospnocyuciyi-zv^-ineixiy Kinase 




147 
x*t / 


aQC operun repressor /naxcxv 


c AO01 SS 


9^6 

ZOO 


ZilXXU AD^ UcUlapi4llCX 9 xA. X X **U1IIU1X1^ pi LHCUl 


Q AOH1 S6 




zj.no ADv LictiiopuiLCi, pciiiieabc proieixx 


QAOOI S7 


>JA 


ucoAyriuuiiUk/iccioc-icicxLcu piuLciii, ucgcneiciic 


QAOftl S8 

OAUU 1 JO 


4.1Q 
*tx V 


lyxLisyi-iJviNA oyxxuiciaoc 




76S 


pciiiuiixixx~uiixu.ixxg piuicm ixj, puutuvc 


CAO01 6ft 


1 1 01 


i^/rNxv~utxcv/ieu xvtn/^ puxyiiicicis>c 9 ucia ouuuiui 


QAG0161 


1916 


J_xlN A^JUCL LCU XXX^i^V pLIiyxilCxaoC UCla oUUlXlAlt 


QAG01 69 


191 

XZ.I 


v/CliloClVCU. xxypuuiwtiisai piwic 1X1 


LjrWJKJ 1 Oj 


J 4*3 


PAmnptPTifp nrntpin cr\ A 
VvUllXpC Lv/iXivC pi U Us 111 V^gl/X 


C AO01 64 


9R9 


OUllipCLCIlL/C piLlLClXl L<glD 


QAO016S 


1 S1 


lAxiioci vcu iiypijuxeu^/cix pxuiciii 


QAO01 66 


191 


k/(JlioCl VvvX iXtJlllaXll piUlCXll 




^94 


UUlloCIVCil liy pLIlllCLlUal piULCUl 


QAO016R 


^07 


oppfo In rtii CP' 


QA0016Q 


68 


frgncr i'i t^tif\Tig1 ivoiilsttnr C^tc\I (~^"\ fcitTiilvr 
IXalXodipilUllcIl ICgUlalXJI, vlU/ VxX XaXXXXiy 


QAG0170 


4S 


iiypuuiciit/di pxijicixx 


QAG0171 


1 51 

X <J x 


liypUlXiwUAsCll. ULUlvlll 


QAG0172 


221 


piUlvadvj UulaUVC 


S AGO 17^ 


256 


■nvTTrtlitip—S-Piit*hri'5rv1flt(* T¥*Hiir*tJi^ft 

LijrlXV/AUXW «/ WCU U VAj la lb IbUUVUXav 


SAGO 174 


355 


o\ ii taTti vl - am \ ti irneTiti tl a Qft 


SAG0175 


79 


rivnotrietical TYrotein 

xx jr \t \f uiv xx wcxx ytx \j xwxxx 


S AGO! 76 


94 


cnti^ftTvetl Trvnntrie'Hcal tirntftin 

vUUOvl VvU J Jr UXvUvUI pivlvlll 


SAG0177 

O^i-vJvf x f f 


107 


tViifiTetlfiviTi faTfiilv nrnteiri 

LXXXV/X wVl.V/yVXXX XCXXXXXXjr |JXvtVXXI 


SAGO 178 


208 


tR'NA IjinHitiP domain nrotein 


SAG0179 


238 


conserved hvnothetical nrotein 

VVUawlVvU AXJT pV/UiV VXV/C1X |^X \J Iv XXX 


SAGO 180 


131 


sinffle-strand bindine nrotein 

uixigiw oixaxxvx v/mviiixXj xyxv/xwiix 


SAG0181 


214 


hydrolase, haloacid dehalogenase-like family 


SAG0182 


581 


sensor histidine kinase, putative 


SAGO 183 


246 


response regulator 


SAG0184 


151 


conserved hypothetical protein 


SAG0185 


242 


membrane protein, putative 


SAGO 186 


36 


hypothetical protein 


SAGO 187 


542 


oligopeptide ABC transporter, oligopeptide-binding protein 


SAGO 188 


325 


oligopeptide ABC transporter, permease protein 


SAGO 189 


273 


oligopeptide ABC transporter, permease protein 
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oize 
(a.a.) 


Annotation 


CAHAI OA 


0A7 

zo / 


peptide ADv^ UallopUllCr, fi X a "UlllUlIlg piUlClU 


o Ar5A1 01 

o/vvjuiy i 


one 

ZUo 


peptide niJv/ uanspurier, /\ i a -uniding pro leiii 


c Anni oo 
oAuU 1 VZ 


o/o 


rio system, JtiivDv^ components j 


oACjU193 


541 


alpha amylase family protein 




/CIA 


transcriptional antiterminator, BglG family 


dAvjUIIO 


377 


IS 1548, transposase 


bAviU19o 


DO 


conserved domain protein 


oAvjUiy / 


A/! 

V4 


PTS system, JLLB component, putative 


O A /TV1 AO 


451 


PTS system, 1TC component, putative 


C A nn 

bAoOlyy 


285 


transketolase, N-terminal subunit 


SACjO200 


309 


transke tolase , C-terminal subunit 


SAO0201 


419 


oxidoreductase, putative 


O A riAOAl 

SACiuzOz 


OA 

, 89 


ribosomal protein SI 5 


O A PAOA1 

SAQjU203 


*7AA 

709 


polyribonucleotide nucleotidyltransferase 


SACj0204 


250 


conserved hypothetical protein 


SAG0205 


194 


serine O-acetyltransferase * 


SAviOZUo 


iCA 

oU 


lipoprotein, putative 


SACj02U7 


447 


cysteinyl-tKNA synthetase 


t? A PATAO 

SACjOzOo 


128 


conserved hypothetical protein 


O A PAOAA 

SAvjU2U9 


/■If 1 

251 


T) XT A ■» j,*!.-, r 1f.- r , .infnirhni-L T 1.TT f, ■ ■ ■ ■ tl-. , r. ■«,-■_-■ « ■ ■ *3 

KIN A metnyltransierase, limri lamiiy, group 3 




172 


conserved hypothetical protein 


O A PAO 1 1 

o AvjUZ 1 1 


Zoo 


DegV family protein 


oAVjUZIZ 


3Z 


hypothetical protein 


O A f" , A y > 1 1 

JSACj0z13 


1 A 

39 


hypothetical protein 


dALiUZ14 


1 AQ 

148 


ribosomal protein LI 3 


t> AvjUZ ID 


13U 


ribosomal protein S9 


C A PAO 1 £L 

t>AvjUZlo 


11 


hypothetical protein 


o AvjUZ 1 / 


19 A 

jo4 


site-specific recombinase, phage integrase family 


bAVjUZlo 


15o 


transcriptional regulator, Cro/CI family 


o a nr\i 1 o 
oALiUZiy 


1 A1 

1U1 


hypothetical protein 


oAvjUZZU 


OO 

vz 


conserved hypothetical protein 


o AvjUZZ 1 


/O 


hypothetical protein 


C AfiAOOO 


1 AS 
lUo 


conserved domain proiein 


oAVjUZZj 


OAO 

zuy 


conserved nypoineucai proiem, xusion 


q a rinoo a 


^^0 

DDL 


repneanon minaiion proiem, puianve 




1 AA 


nypomeucai protein 


o/vvJUZZO 


**lo 


recomoinauon proiem 




1 Sfi 
1 JO 


nypomeucai protem 


O/VVJVZZO 


111 
111 


conserved nypomeucai protein 


SAG0229 


95 


conserved hvnothetical urotein 


SAG0230 


96 


conserved hypothetical protein 


SAG0231 


135 


hypothetical protein 


SAG0232 


186 


hypothetical protein 


SAG0233 


226 


hypothetical protein 


SAG0234 


128 


hypothetical protein 


SAG0235 


| 93 


hypothetical protein 


SAG0236 


32 


hypothetical protein 


SAG0237 


34 


hypothetical protein 
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\JMSJe 




Annotation 


SAG0238 


41 


hvnothetical nrotein 


SAG0239 


286 


transcriptional reeulator MutR familv 


<\AG0240 


393 


trnncnrvrtpr mitative 
u ailop wi Lwi , puiauvb 


<sAG0941 


913 


aminr\ nr*iH ARC* tranQnortpr nermpfiQP nrotein 

dlulllU aviu xTJ JO uaiiopui ici , pviuiwaow jjiutvui 


c AH0949 


308 


ominA o/mH AT^f"' Itji n cr> rvrfa^T aTninn ar»iH— "KinHmty nrntpin 
dill 11 1U aviu xtJl>v-» uaixopuiivl) diiiiiivJ awiu ""isiiiviiiig piwvui 




91 1 


dllllllU aC/lU ADv UdllopUI LCI, pCUIlCaoC piULClll 




381 


amitiA o r»iH ARP tTancnrvrtPT ATHP— Hiriflino' nrotpin 
OlIllIlLJ avlU ADv Hallo {J Ul LCI , r\ 1 * "l/lllUUlg piVJLCllI 




1 S9 


T-»-r/-vf £»tti iinVnr*\3UT* "fiinotinn/ltTirtTiT/At^in niitatiVP 
piUlCUl \JL UXLKlIIvJ W 11 AUI1CL11J11/ lipijpiVJLClIl, LIUU1UVC 


c a rj09zi6 


96R 
zoo 


nyjpuijn.cij.vdi piuLcui 


Q AH0947 


116 

no 


Iiy pU U1C LI vol piULClll 




on 


nypuuicLivdi pruLcni 




116 

1 lu 


nypu mciivai piuiom 




1 0^ 


mAtYinfartp nrntAin T\ntativ^ 
UlClIllJI dUC piULClll, pULdLlYC 


Q Af509^1 


79 


IXalloUl ip LlUlldl iCgUlalUly ^ru/V_/l lalllliy 


o A00959 


186 

„ lOU 


Of»gi'tv1ti?a h6T<*faoo ^^"^JA r T tothiiv 
dOCiy ILLallolClaoC, VJiN/A. 1 lalllliy 


QAG0953 


109 


auciy llldlloiciaov, VXTN.r\.l lalllliy 




996 
z»zu 


dr> f^^r^fi^t rt effort* Cf^ (~^t\J A T" fatYiilx/ 

awciyiuaiibiciapc, vjiN/v i laimiy 


QAfr09S5 


31 5 


(JtJllodVCU Jiypuuiciiv^ai pivJtClll 


^Afr0956 


163 


1VLN r\. pUiyiilctaoC bl^JLUa IdL-LUI, IH^I* oUUiailUly 


OAUv^J / 


53 


iipupiuiciu, puiaiivc 


OAUvZj O 


909 


UallooliptliJllal icguiallsl} lcuv laimiy 




^65 


AJjVy iiallopui ici cillUA. piuicui, ljlld laimiy, puiaii vc 


<iaoo960 


938 

ZOO 


ADV Uall2>p<JlLCl, jtV 1 JT Ullltllllg piULClll 


qaho961 


190 


T^!1381 trancmnQjiQp OrfR 
lu l joij iiauopuoaow v-/ixxj 


c A 00969 


197 


TS13R1 tran<:nn<:asp OrPA 

AO IJOij UallopUoaoC LTV 


QAfr0963 


171 


1lVf>rttllAtlf*5l 1 T^Trvtp'ITI 

iiy pvj llic Liuai piv/Lciii 


<*AG0964 


103 


pnncprvpi^ Vjvrirkt1ip»tir*si1 T^iY\t**tn 
vUUovi vvyvi iiy yJyJ tiiw Uvdi uiuiviii 


<%AG0265 


935 


f*onc**Tv^H 1rvr4r»t1iptif*Jil Tvmt^in 

^UlldVl VvU JLiy p%J UlvllvCll pi VJLwlil 


q AG0966 


389 


f»<*t\/1 cr1iiof\csiTTimf*«B 6— r*Vio^nVisit<* H<*5if*ptvl5iQp 
i^i auciy i^iuv/v/oaiiiiiic —x/ ~puvopiia ucavv uy iooc 


<sAG0967 


1 80 

1 Ov 


c nn cf*TVf* H nvrv*tnpHf*jil nrotpin 

vUll&wi VvU Iiy pvi Ulvllvdl pi VJ It- ill 


^AG096R 


304 


<r1\/f*v1 -tT? A QvntnptflQp alnVia Qnhiimt 
giy vy i ixxxn/tl ojruuivuiov) ai.pj.ja buuiuiii 


<sAG0269 


913 


flpvl pflTTipr nrotpin T>nft«mnnri , ift<5tftf?i<5e mitativft 

avji vtuixvi pi vUV/ jj J pjiv/opiiuuivo iviaov ) puiauvv 


<SAG0270 


679 


ctl vp vl -tR [VJ A svntnetase neta ^uhunit 


SAG0271 


85 


cnnQftrvefl nvnothetical nrotein 

vvJJdvl VvU jj j Ulv u vol pivivui 


SAG0272 


87 


memhrane nrotein outative 

IHVUILSICIXIW plUlVlllj pUidUTv 


SAG0273 


502 


(rlvperol 1cina<*e 


SAG0274 


609 


alnha-o^lvceronho annate oxidase 

alUUO til YvVlV|/llV/OpliaiV UAlUuov 


SAG0275 


232 


crlvcerol untalce facilitator nrotein 

KlYvwlvi uputdv idviliutbvi r t w JJ l 


SAG0276 


445 


NADH oxidase outative 

A t|zVJ /ll UAlUttOW , yuiOll V V 


SAG0277 


476 


conserved hypothetical protein 


SAG0278 


661 


transketolase 


SAG0279 


101 


conserved hypothetical protein 


SAG0280 


244 


ABC transporter, ATP-binding protein 


SAG0281 


534 


membrane protein, putative 


SAG0282 


461 


PTS system, UBC components 


SAG0283 


267 


glutamate 5-kinase 


SAG0284 


417 


gamma-glutamyl phosphate reductase 


SAG0285 


298 


conserved hypothetical protein TIGR00006 



404 



WO 2004/018646 



PCT/US2003/026827 



Table 1: Complete list of GBS predicted genes 



sJMsJc 


uUc - 

fa 9 1 


A nnnfcitinn 




■ 108 


ppll division "nrntein T*t«;T nntative 

Uull U1V10XUU r w kv 111 X CO 1 *, ^UlALlVw 


<3 A O09 87 


752 


n^nicilliTi-ftiTifliTity nrritein 9*5£ 


^Afr09RR 


336 


■nli nonho- "NT»a nfttvlmi ifann fwl -"nf^ntjinf^nti de-tran sfferas ft 

pi lUo pi Ivy ii'U^C Ijr 11 11 HI CXillXJ J 1 p ClllCLpC LI LI V* V U (UlaJLvl HOW 


Q A0098Q 


447 

*t*T / 


ATP-Hmpr»Hpnt PIMA "hpliracp DFAD/OFAH box familv 

/\ 1 i "AJ.cpciiU.clll JXI^I/tl llCllva.DC, ±JEi£\\JI l^*-*r\xx uva iciiiiiiy 


q Afi09Q0 


970 


AJDV^ UaJlDpUILCr, DUUDLXalC-UlIlUlllg piULCUl 


Q A009Q1 
0AUUZ7 1 


967 


amino a/"»i/1 AHP tran onrtrf pr npnrtAQCP TlTfYtfMTi 
allllllU aCiU <r\X>\_/ IXallopUllCl, pCl UlCdbv piULCi.ll 


Q A00909 


947 


ami-no a fi rl ABP trancnnrfor A'I'L* Vi-in/linO" n.TYYffMTl 
allllllU aClU /tJDV_/ U al lopUIlCl, f\ JL JT -UlllUlllg piULClll 




74 


cuiiocrvcu lljrpUUlCLlUal piULClll 




104 
out 


UliUlCUUAJll reuUvlaoC 




486 


conscrveo. nypoiiicu.ua.1 pruicin 




971 


"NT A 1 'l cT/nfnofa 

riJ\U synuiciaSc 




AAA 


mninopcpiiuasc 


0 AY^09Q8 

0AUUZ70 


7^0 


pcni ci iiiii- QiiiuxQg proiciii ix\ 




*i 00 


ICUOIIlUlllilllUIl .piULClll \J , 




179 


cuiiocivcu iiypuixicuudj. piuiciii 




AC\ 


nypuuicuucii piuiciii 


q Arso^09 




cunacrvcu iiy pu liic uudi. pruiciii 




184 


^nrtcprrrpn n vnof n pfi pq 1 t\rntpin 

conscrvcu nypouicuCai pruicin 


QAno^04 


487 


coiiscrvca nypouiciicd.1 pruicin . 


^aoo**o5 


IOU 


aUlUlXlUUCCl'*Z, piUUUVvllUIl piUlClll J^rUAO 


QAnn^nA 

oAUujUO 




JSJlI UUlllcllll piUlClll 


DAUUjU / 


11 


XiypULXlCllt/al piUlClll 


q Afio^os 


908 
^70 


rVDVj UallopUl LCI y A JL X UlilUlll^ piU LC111 




94£ 


ADL* UaXlbpUl LCI 9 pCIIUCaoC piULClll, pUutLlVC 


c a nno 1 A 
oAvjtuj 1 U 


1A1 
Jul 


cunbci vcu nypuixic ucai piuiciii 


o/VvJUJ 1 1 


"MA 


JL/i >-r\- UlllU-lIlg iCopULLoC lCgUlalUI, aUUlCllLlly pUlllL 111L1U1L1U11 


q Ano^i 9 


914 


LvUlloCl VCU UypULLiCUval piuiciii 




900 


fry lOrtA/lo ls"i T\ Q CP 

gUaliyialC Ivllla. oC 




104 


T^'M A _/1iT , rf»r»f<>r1 1?^T A "r*nl'v/m**T*ii c** f\m.f*arc* ciilinnif" nntafivp 
J^l>lxA.'~UJ.lCCLCU JXTN/li pUiyillClU.DC, ULUCga oUUULLlL 9 pULctLlVC 


SAG0315 


796 


primosomal protein N 1 


Q A nn'x 1 a 


11 1 


iiiciiiiuiiyi-LXviN/A. iui my i u aiioici aoc 


0 a an** 1 7 

oAuUJi / 


440 


sun proicin 


Af^o^i 8 


94^ 


oCI 111C/ UUCUlllllC pUvopilaLaoC) puiaLlVC 




6S1 


oCIlllC/ LillCUlUilC pi U LC 111 JUUaoC 


QAfr0390 


931 


VyUlloClVCU liypvrUlCLlw<Xl piUlClll 




HQ 


oCiioUi iiibiiumc Mnoac, puutuvc 


c AO0399 


913 


UxS£\. ~UlllUUlg ICopUllbC ICgllldLUl 


c Afi0393 


466 


Viv/lTrt1ac#» Vi si 1 rtn oi/l HaVi alfiorfTiP Cf* f q tyi i 1\//T\# i T^'i*i H\/1 — t^ttiI \/1 pic- fraTic 
iiyuiuictoc, ucuuclciu uciidiugciitioc laiiiiiy/pcpuuy i-piuiy 1 cid lioiid 

iQrtiTiftrjiQp t^vdonViiliTi tvnfi 


SAG0324 


124 


general stress protein, putative 


SAG0325 


258 


pyruvate formate-lyase-activating enzyme 


SAG0326 


251 


transcriptional regulator, DeoR family 


SAG0327 


327 


transcriptional regulator, putative 


SAG0328 


107 


PTS system, cellobiose-specific HA component 


SAG0329 


106 


PTS system, cellobiose-specific HB component 


SAG0330 


433 


PTS system, cellobiose-specific IIC component 


SAG0331 


818 


formate acetyltransferase 


SAG0332 


222 


transaldolase family protein 
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/Villi u uuuu 


SAG0333 


362 


fflvcerol dehvdroopnaQP 

£2 A Jr v vl W 4 vJ.wJJ.jr ui v* gvliAov 


SAG0334 


308 


cv^teine svntVifl^p A 


SAG0335 


214 


conserved nvnothptiral nrnfpin TTfrTO00957 


SAG0336 


429 


VipIipaqp TYIltsitlVP 


SAG0337 


221 


pfvmTif^tfMir*** T*>Twtv»tTi Th Tvnta+iT/** 
VUllxjJGLGXlwC piUlOXll X, pUUtllVC 


SAG0338 


184 


Tinr\cr%miil ciinntnf i-nf - <*t~for»<^ tvr/\+*»-iT"i 

iiuuouiiicu ouuumi liiicriav/C proicm 


S5AG0339 


4S0 


ctopax UllC Kinase Xalliliy piOlCin 


SAG0340 


216 


uyuiuiaoc, xialOaClU. ucnaiOgcnaSC-llKC ianUxy 


SAG0341 


49 


liypuuxCllVal piUlGlXl 


^00^49 


963 


enoyi-v^o/\ nyuraiHse/isomerajse iainiiy protein 


giAUV J*t J 




uraiiscnpuoiiai regulator, iviarjv ianiiiy 


SAG0344 


393 


j^xodxjyi-^acyi^axTier-proTeinj syninase 1 1 1 


SAG0345 


74 


<tuyi isomer piuiein 


<5AG0^46 


319 


enoyi^acyi^aiTier-pxijieinj reauctase 11 


CAG0347 


308 


iiiaiuiiyi ^u/v-acyi carrier protein transacyiase . . 


SAG0348 


244 


«^~wAoacyi-Lacyi-caTner protein j reauctase 


55AG0349 


410 


jTOAoauy i-^auyi^aiTier-proiciii ) syninase n 


SAG0350 


166 

X \J\J 


iXKsciy i-Ks\jjt\ caruoxyiase, oioun carooxyi carrier protein 


SAG0351 


140 


V- 5 *ny uro Aymyxistoyi-^acyi-caiTier-pro lein j Qenyaratase. 


SAG0352 


456 


ucciyi-v^o/\. LfaxuOAyiasc 9 oionn caruoxyiase 


SAG0353 


291 


ai/ciyi-v^o/\ caTouAyiase, carooxyi ira nsiera.se, oeta siiDunit 


SAG0354 


257 


Uv/Cijr jl-^li/a. v/cu uoAy iaoc 9 i/aruoAyi uansi6rase 9 aipna suDumt 


SAG0355 


210 


f*OTl Q ptvp rl livnotlipfir*!il nrnfpin 

vvUOWlVCU Xljf pUUXwUUcll piULClU 


SAG0356 


425 


oksL y i~ ijlvjinxV oyiiuicutoc 


SAG0357 


330 


IlldllUlttllC piULCxxl, pUuxllVC 


SAG0358 


120 


u^jiioci vcu iiypv/uivULrai pioicin 


SAG0359 


303 


P r J CVCtpm TIIJiTinnCP- Ct>P>f^l'fir» TTT^ PAirmnnonf 
X iu ojrOLGXXl) lllallXlvJdw opCviXli/ 1 1 t J L/v/lIipUIlt/Ill 


SAG0360 


270 


x i o ojouciii, ixicuxiiubc~opccixiCr xx Lomponcm 


SAG0361 


336 


x i o oybiciii, liiaiuiuoc-bpcciiic ixxVP components 


SAG0362 


270 


ixjr vxi v^idoCj xidiuciwiu uciiaiUgwiiabw'ixiLw iamiiy 


SAG0363 


194 


lijrpuuivllwal pii-licill 


SAG0364 


203 


TnPTnlrrji'np r»rotpin nutnfivp 
axi*>jlxiuxcixiv7 piviicxxA^ puiativw 


SAG0365 


473 


X9Titliirip/iiTnpil nptmpjicp fi*mil\/ t\rAtpin 
Aouiuiuw uiavii pciiiivaOv XcUixiljr piULClll 


SAG0366 


169 


coTi^prvftd Vivnotliptipfll r\rntpin *T Tfirl? O0 1 ^O 


SAG0367 


186 


acetvltran^ferfl^e GMAT fflmilv 

^♦v/wt-jr III WllOlvlooV) VJl^rxl XC&IXXXljf 


SAG0368 


435 


rjTOtein of unknown "fiinrtirin 


SAG0369 


98 


conserved nvnortiptipfil nrntpi-n 


SAG0370 


139 


HTT "fflmilv nrntpin 

XXX X 1 Oil All J piUlvlH 


SAG0371 


167 


hvnotlietical orotein 

*ij W V-/ tllw UVH1 L will 


SAG0372 


85 


hypothetical protein 


SAG0373 


L 241 


ABC transporter, ATP-binding protein 


SAG0374 


344 


ABC transporter, permease protein 


SAG0375 


266 


conserved hypothetical protein 


SAG0376 


211 


conserved hypothetical protein TIGR0009 1 | 


SAG0377 


127 


conserved hypothetical protein 


SAG0378 


379 


N utilization substance protein A 


SAG0379 


98 


conserved hypothetical protein 


SAG0380 


100 


ribosomal protein L7A family 
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SAG0381 


927 


translation initiation factor EF-2 


SAG0382 


122 


ribosome-bindinff factor A 


SAG0383 


334 


t*ro te in of unknown fiinction/linoDroteui Dutative 


SAG0384 


138 


transnrintional renressor CtonY 


SAG0385 


744 


ponriftT-iTaTiRnorfpr ATPaoe ("YinA 

WvyJJjpwA UclllOLJt/1 Iwl X X aOv VxVXLJx*. 


SAG0386 


68 


c nr>r>pr-tTa"n ^moTTPr Tvrotein C^cytyZ. 

vUpJ^vl tXllllOfJwl IXyX LSlVJlWlll V^Ut/i-* 


SAO0387 


204 


TYiPTYirvrsiTie TvrotftiTi nnt'fitivp 

XllwlllX/lClllw yJl \J IwXll, pUlClUVV 


L>iL\J V/ J O O 


270 


VivdrrVlfiQp fifllnarifi fiprialnopTiJiQft-lilrft fanrHlv 
iijr vxxvj laov/j lidivjciVy iix ixwxxaiugwxicxow iixiw xaxi.ij.ijr 


SAG0389 

UAVJVJ07 


880 


HMA nolvmftTa^ft T 

L/liil ^JVJXj Ul\/l(l0v X 


SAG0390 


146 


A— Tvinrlinc HoTnaiTi nrotftin 

\yUn UlllVXXllg VAVJ1 1 ICt 1X1 plU twill 


SACr0391 


159 


TTflTiQPTiiifiriTial TPOiilfltnT Put* "fjunilv 

LI CLliOWl iLJ LlUlldl LKjfellLCX LUl , X Ul XCUllllJT 




521 

•s^t X 


ppll wall ^iiTTfic** jitipVhvt Tinnilv Tvmf Pin 
vwii vvaii auiio^v diiviiv/i xaixilljr yiuiwu 


OA.VJVJ7J 


228 


TYW A —VithHitiO' Toct^nTiQf* Tf^oiilatriT 

X-/X*t^V "UlXlvllll^ 1 WOjJUllOW LvglXlCIXvll. 




345 


<2ftTiQfYr hlQTlHlTlP VlTIJ**5P 

Ovllovl lllo ix vii nw xviixapw fc 


SAG0395 


246 


ttipttiiSt'SItip nrotftiTi "niitfltivp 

UlwlJXUXClXlw ^IvlvJUi) J-/ilK*U. V W 


SAG0396 


380 


miPiiiTip tRXf A -TTbnQv1trfiTi<;fpT*aQp 


SAG0^97 


102 


ptfvncprvpfi VivrirtitViptiPsil T>rr*TPtTi 

vUJiOvl VvU UjfjJvl UlwtlV^al 1/1 v**'"* 


SAG0398 


179 


RloV "PjHTTilv TYTOTPiTl 
X-f i\j x XAiiiiijr Lyivsiwixi 


SAG0399 

Ox\\J UJ77 


258 


A TQ A /PI Jl f""* 'ftlTTlll V T*lTf>fpiTl • 

r\io/v Xviciv-' xaiiiiijr L7Xv"i*wXix 


SAG0400 


168 


cvriHiTie/deoxvfivlTflvlfitft deaminase faTTiilv nrntpin 

wjr uuuiw \x\s\ja.j wjr uixjr iai»w vi wan miaow xaxiiiijr piuiviii 


SAG0401 


44 


hvnntlietical TiTfiteiTi 

llj JJU UlvUvOJl IJXXJ twill 


SAG0402 


449 


*>"liicoQft-f>-T*>fin<ir>riflte i^mripraQft 

^XUv \J av V" |^ IXKJ oj^/lld IV lOW*lllwlCiSw 


SAG0403 


175 


S-fViTTnvltptTabvHrnfiriljitp pvplo-liira^p "fiimilv nmtpin 

•j ivi xxx y x iv/ u. clxxj vix v/i vici iw vjrviv"iigaow xcuixiijr L7iV7iwiii 


SAG0404 


225 


ThotTiiSniH "fifiTnilv nrotftiTi 

111U1UUU1U X cull 11 V IJXVJ Lwlll 


SAG0405 


347 


Tirotein 0"P nnlmown fiinctioTi/linonrotftiTi mitativp 

piUlwlU V/X 11 1 1JVllW VY11 lUllv LX\JXXf Xl^JU|JXV/l.wXll^ |v 14. XXX 11VL/ 


SAG0406 


299 


T rFP-tyluco^ft-l -nil n qti Vi a tp liTiHvlvltraTiQ'fprflQp 

V^ X X Cyl Uvvuw X L/imoWl IfltV 1X1 1U V 1 Y 1 IX Allolvlttov 


SAG0407 


338 


fflveerol-^-nnosnhate HerivHrnfyftna^p rMAT"irP^+^ 


SAG0408 


109 


ribonnclease P nTOtein conrnonent 


SAG0409 


271 

A / X 


SnoTTTT "PaTTiilv nrntein 

UpUJULU XC&Ullljr UJLwlvltl 


SAG0410 


273 


R3W domain Tirotein 


SAG0411 


177 


conserved hvnothetical nrotein 


SAG0412 


258 


recX nrotein 


SAG0413 


451 


RNA niethvltransferase XrmA familv 


SAG0414 


153 


conserved hvoothetical Drotein 


SAG0415 


142 


acetyltransferase, GNAT family 


SAG0416 


1233 


protease, putative 


SAG0417 


302 


glycosyl transferase, group 2 family protein 


SAG0418 


336 


ribonucleoside-diphosphate reductase 2 y beta subunit 


SAG0419 


137 


nrdl protein 


SAG0420 


721 


ribonucleoside-diphosphate reductase 2, alpha subunit 


SAG0421 


1055 


cell wall surface anchor family protein 


SAG0422 


129 


conserved hypothetical protein 


SAG0423 


132 


conserved domain protein 


SAG0424 


94 


hypothetical protein 


SAG0425 


105 


carboxymuconolactone decarboxylase family protein 


SAG0426 


131 


conserved hypothetical protein 


SAG0427 


129 


transcriptional regulator, MerR family 


SAG0428 


345 


alcohol dehydrogenase, zinc-containing 
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Annotation 




ZrO*T 


U A.1UUICUUO UloC) alUU/KClU ICUUUlaoC xaxlHiy 




9K7 


Cation emuA oyoicm proiem 


q a aciAi i 


1 7A 


uanscnpnonai regulator, i euv lamiiy 


oALlU43Z 


107 


transcriptional regulator, Arai^ ramiiy 




1 ^ao 


surface protein Rib 


oALrU4J4 


Ol 


transposase, IS2S6 family, truncation 


O A /"2 A/1 1 *Z 


07 


DNA-damage-inducible protein J, putative 




oz 


hypothetical protein 


C A I'"! A/11 7 


1 oi 

1Z3 


lipoprotein, putative 


C A r*{\A1Q 

oACjU43o 


1 Ad 

143 


bacteriophage L54a, integrase, truncation 


O A r*A/11Q 

bACjU43iJ 


XT A 

JNA 


conserved hypothetical protein, degenerate 


C A /TlA/l/t A 

dALjU44U 


o4 


conserved hypothetical protein 


O A nf\A A 1 

dACjU441 


1UJ 


conserved domain protein 


C A 'CtCiAAl 
■ o ALIU44Z 


1 CO 


acetyl transferase, GNAT family 


C A ClClAA'X 
oAvjU44J 


1 O/l 
1V4 


acetyltransferase, GNAT family 




1 QQ 
loo 


conserved hypothetical protein * 


oAljU443 ! 


ooJ 


vaiyi-iKiNA syntnetase 


C A CIC\AA& 
oAvJU440 




oxidoreductase, Gfo/Idh/Moc A family 


C A fiA/1/17 

oAljU44/ 


Zo/ . 


magnesium transporter, Cor A family 


dAVJU44o 


101 


transposase, IS2S6 family 


oA\jU44;^ 




conserved hypothetical protein 


oAvjU4DU 




aspartate — ammonia ligase 


C A f~l(\A < 1 


1 /to 


bacteriocin transport accessory protein, putative 


oAVjU4DZ 


1 70 


type II DNA modification methyltransferase, putative 


C A/IAA^"* 
oAVJU4Dj 


OA 


hypothetical protein 


o a a(\A^A 




phosphopantetheine adenylyltransferase 


oAVjU4j 3 


1^7 


conserved hypothetical protein 


C Anf\A<>6 


XT a 
IN A 


conserved hypothetical protein, degenerate 


Q A d(\A*7 


1 OO 

iyz 


conserved hypothetical protein 


OAvJU4Do 


jOo 


conservea nypotnencai protem i 1vxkuuu4o 


C Af^AA^O 
oAVJU*fjy 


1/1 


v an/,r aomam proiem 


Q A ClCiAf%f\ 


JO 1 


adI/ transp oner, a a r-Dinaing/pennease proiem 


o AVJvHO 1 


^7Q 


adL/ transp oner, a i r -Dmamg/permease proiem 


OAUUHOZ 


1 RR 
1 oo 


aninramiaie synuiase component 11 


<J Afr04£1 
OAVJI/HOj 


1 7Q 

1 /7 


x5io i iamny protein 


^A<~tfa£4 




uiotm syntnetase 


^Anodfi^ 


1 UH 


njrpotneut/ai proiem 


c Arr04^ 

oAVJUtDO 


171 


U1101a.bC 




40Q 

*tw/ 


/viyjlt -uiiiuiii^ cnxyiuc uomain proiem 


SAG0468 


210 


endonuclease 111 


SAG0469 


131 


type IV prepilin peptidase-related protein 


SAG0470 


69 


conserved hypothetical protein 


SAG0471 


322 


glucokinase 


SAG0472 


126 


rhodanese-like family protein 


SAG0473 


613 


elongation factor Tu family protein 


SAG0474 


81 


conserved hypothetical protein 


SAG0475 


451 


UDP-N-acetylmuramoylalanine— D-glutamate ligase 


SAG0476 


358 


UDP-N-acetylglucosamine--N-acetylmuramyi-(pentapeptide) 
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(a a 1 


A nnntati on 

1 






•nvrffciilio^nhorvl-iiTiHecarirenol N-acetvlfflucosamine transferase 


SAG0477 


378 


f^ll Hivi^inn nrotein T"jivTB DUtntlVG 

vvll UlYlOXvU fJJL VJlvslll JL/1VJJL<*, puH*MTV 


SAG0478 


420 


r»*»11 Hiviqioti nrotf»in Pt^A 

IsClX VllVliMVll piv t\y 1X1 X lo/\ 


SAr"r047Q 


476 


11 UlVlolOXl piUteill rio/< 


ij/tAJUHOv/ 


974 


yiitix-* pioiexxx, putative 




701 


y iiiLr protein 


Q A 00489 




VCICYT foTnilv nmtpiti 
I VJVJ 1 laimiy protein 




9^9 


y 1111x1 protein 


q A nO A 9 A 


9^£ 
Z.JO 


r»/»H /liiriciAn r\rnfpin T\ii/T\/A niltativ* 1 

ecu aivision protein ljiviv r\. 9 puuttive 




o^o 


isoieucyi-txvrN/\ syntnetaoc 


SAG0486 


100 


conserved hypothetical protein 


o a nr\A C7 


ID 1 


jviuti/nuaix iarniiy protein 


oAvjUnoo 


7^ 


j\ l Jr-Gopcnaent v^ip protease, ,/v i x-umaing suDunit 




*XA 


nypotneucai protein 




fO 


conserveu nyp ouxc ucai protein 


Q A C±C\AQ 1 


910 


amino ^ciQ /v,pv_^ transporter, permease protein 


o a no4Q9 

oAljrU'HJZ 


OAA 


ammo acia /\s>v^ transporter, a i r-oinaiiig protein 


c a nr\AQi 


DO** 


pnospno^uconxutase/pnospnomannomuiase ramny protem 


QAOOAQA 
oAVJvny** 


09. A 


nxetxiyienetetianyoxoioiate 

ueuy uio^eiiaoe/^ixic tueny i lc txaxiy ui oxo 1a le wy wxoiiy txx o laoc 


saoo4qs 


978 


pxotcixx Ul LXXXaJLXVI W 11 XUXX^lXVJXX 




AA(\ 


**Yo/^^rfcirxM*iV%rtmif*1p»s»c^ \/TT Isitop ciiV^ntiif" 
cA.oueoAyiiouiiu\/xeas>e v 11, xaige oixixixixil 




71 


*kY/\rf1^rtwr , iTw\Tiii< ,% 1*»sic#» \/TT email cuT^iinii" 
eA.oucoAyiiooxxu.L>ieaoe v xx, oxxiaxx ouuixxxxt 




900 


geninyiixax^ixaiioicxaae, putative 




97S 


nemoiyoiu i\ 


Q Arjo^oo 


1 S7 

1»> / 


algllllXlC ICpiOooOl AXglv) putative 


e AnO^OI 


SS9 


repair protein xxeeiN 




978 


JU'eg v lauuiy pioteiu 




970 


iipaoe/ aoy xiiyixioiooc 


Q Atf^O^OA 


900 


eonoerveu iiypotucuvvai pioteiu 


QAflOSO^ 


01 


j-/iN/A.~uiiioiiig piotcxxx nu 


QAriOSOf* 




Vi"v/r^ r\l"Vi r* a 1 tity^^mti 
xxypuuxeiiwax px%Jtexxx 


c AG0S07 


310 


vixuyuXvFviXv/iate u.cxxyuxv/g&xxaoe xl 


SAGO'SOS 


411 


Vifttfi-lflfitaTTi TftQicfjiTirie factnT 

Uvifl lflvmiH IvOloUUlvw ulwlVJl 


SAGOSOQ 


403 


u v lav uuii x&oiotaii^^ lawiui 


SAGOS 10 


406 


xiiuxxvjl pi is aai, puiauvv 


SAGOS 1 1 


270 


livrlmlfl^e Vialnanirl deV*a1oo , ena^e-1i1ce fanrilv 


SAG0519 


438 


T-TT) Hnmain "nrotein 


SAG0M3 


128 


conserved Vivnothetical nrotein 

vUllOwl V wU llj p VUlW UwCU pivlvlU 


SAG0514 


894 


cation-rransporting ATPase, E1-E2 family 


SAG0515 


286 


conserved hypothetical protein 


SAG0516 


643 


fructose-l,6-bisphosphatase, putative 


SAG0517 


374 


iron-sulfur cluster-binding protein, putative 


SAG0518 


NA 


peptide chain release factor 2, programmed frameshift 


SAGOS 19 


230 


cell division ABC transporter, ATP-binding protein FtsE 


SAG0520 


309 


cell division ABC transporter, permease protein FtsX 


SAG0521 


236 


carboxymethylenebutenolidase-related protein 


SAG0522 


232 


metallo-beta-lactamase superfamily protein 
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XJiSJC 


oize 


adhu laiion 






UAioorcuuouioc, snort onain uciiyuj.ugciia5c/icuucia5e iarniry 


<\AG0524 


815 


F)MA TuVlvrrM^rnci* TTT ^ncilon QiiHimit/ A' PP— Hprw*nH<»Tii" Vif»1ir»ac*» 
l/lNA puijrlUdcloC ill, cpoiiuu &uu uiu u n. i r -ucjjcnucni ncuCaoC 




1Q7 


aopalUxlv allium UxUlolPI ttow 


qAfJ05?fi i 




acnoromm/1 tP\TA otTfii'ViP't'QGf* 

aspaiaginy i- ucnjln j\ syntnetaj>c 


QAfrft5?7 


1 85 
Ioj 


conservea nypo meticai protein 


o/VvjvjZo 


jZ / 


inosme-uriQine preierrmg nucieosiae nyaroiase 




**ft 
JO 


nypoin.eu.cai proiein 




1 1*7 


vjsmwvyirr iamny proiein 


oAVJv/JJ 1 




conservea nypoinencai protein 




,3Z*f 


conservea nypoineucai proiein 




*4ft1 


conservea nypoinencai protein 






arpepuaase 




DUO 


zinc a±>l> transporter, zinc - oinaing aanesion uprotein 




oO 


noosoniai protein jlo i 


SAG0537 


311 


DHH family protein « 


jAuUjjo 




aaenosrne aeaminase, putanve 






navoaoxin 




01 


chorismate mutase, putative 


o Aviv D*f i 




voltage-gated chloride channel family protein 




1Z / 


loijoi, transposase vjti/a. 




izv 


loijoi, transposase wtld 




11^ 

1 ID 


noosomai protein juiy 




1<\Q 


propnage jLamoaaoaiy site-specinc recomoinase, pnage miegrase 
iamiiy 


q A 00546 


67 


conservea uomam protem 


q a 00547 


1 85 


nypotneticai protein 




ZOJ 


propnage i^amoaaoai, repressor protein, puiauve 




47 


liypuixieuuai prutein 




Id 


conberveu nypoinencai protein 


qAn0551 


5? 


tuiiDCivcu uypumcuvai protem 


qAfr055? 


69 


iiy pUUlCLlL-dl pivlLClli 


SAO055^ 




iiypi/uiCLivcii. pjLxiiwLn 


9,AO0554 




l^iupjuogc JLfllilUUaJa 1 , UdllbUlipuuilal lCgUiaLUI, Iamiiy 


SACr0555 


249 


pl.VJpilci.gw JLalllUUaOa 1 , CtllUJLCpiCoolJI, pUlallVC 


SAG0556 


47 


hvnrtthetifal nrntpin 


SACt0557 


76 


llVTifttllftflPJll TYTfVtfMTl 
lljr jM v Uiv 11L/C11 piUiwJJLl 


SAG0558 


74 


hvnotheticfll "nrntein 


SAG0559 


286 


conserved hypothetical protein 


SAG0560 


77 


conserved hypothetical protein 


SAG0561 


46 


hypothetical protein 


SAG0562 


84 


hypothetical protein 


SAG0563 


53 


hypothetical protein 


SAG0564 


160 


conserved hypothetical protein 


SAG0565 


224 


conserved domain protein 


SAG0566 


138 


prophage LambdaSa 1 , single-strand binding protein 


SAG0567 


439 


prophage LambdaSa 1, reverse transcriptase/maturase family 
protein 



410 



WO 2004/018646 



PCT7US2003/026827 



Table 1: Complete list of GBS predicted genes 



UKr 


oize 


/VXUltl La Li U 11 

•« 




67 


rr\rt Cf>r\rf^r\ ViTmr\+1*l*>fir»fll TMV"*t'f»1TI 
COIloCl VvU liypUUlCUL/aA piVJlS/lll 




1 ^R 

1 JO 


COilbClVCLl liypLltllCllVydi piULOlll 


oAUUj /U 


11^ 
1 1*> 


nypotnencai protein 


oALjUO / 1 


4,3 


nypoineucai protein 


O AVJUD / z 


1 JO 


conservea nypoineucai protein 


oAvjU j / j5 


<A 
34 


nypotneticai protein 


oALiUD /4 


on 
oV 


conservea nypotneticai protein 


oALjUO / j 


1 1 A 


nypotneticai protein 


c a nc\<n/z 
oAkjvJj /o. 


A1 
43 


nypotneticai protein 


C A nA^77 

oACjUj / / 


1 77 
ill 


conservea nypotneticai protein 


oALjUO to 


QQ 
oo 


conserved nypotneticai protein 


O A /^ACTA 


1 A1 

14Z 


conserved hypothetical protein 


O A /~lf\GQf\ 


ii 1 
111 


conservea. nypotneticai protein, truncation 


C A nf\^,Q 1 
oAuUDo 1 


1 1 fi 
1 lo 


conservea nypotneticai protein 


c a nn^oo 


4ZZ 


conservea nypotnencai protein 


C A f~lf\GQ1 


/f A< 
4U0 


conservea nypotnencai protein 


O A^1A^Q/1 

oAIjUjo4 


OZ 


AAMnA«trA>^ l^vPMA^tftA^ Attl f%f*A^1fl ^TUflAAfi ATI 

conservea nypotneucai protein, uuncaiion 


C A C 

dAvjUjoD • 


4/1 


conserved hypothetical protein 


C A /^/iCQ/C 

oACjUjoO 


1D4 


conservea nypotnencai protein 


O A 

oAIjUjo / 


^AA 


propnage JLamDaaoai, structural protein, putative 


oAvjUjoo 


/I 


conservea nypotnencai protein 


C A PACQO 


14.3 


conserved hypothetical protein 


SAG0590 


112 


conserved hypothetical protein 


C A PAC01 

oACj05yl 


/o 


conserved hypothetical protein 


C A /1A<A1 


111 
111 


conserved hypothetical protein t 


SA(jrU593 


1 oc 
Ioj 


prophage LambdaSal, structural protein 


C A PACAyl 

JSAG0594 


Q 1 

ol 


conserved hypothetical protein 


C A PA^O< 


1ZJ 


A A.«t A AW rAtft m Ff\ ATM Aft A a1 «4f»Af ai tt 

conservea nypotnencai protein 


O A /"'•ACAiC 


O /U 


propnage l^aniuaaoai, poiA protein, internal aeietion 


C A PACA7 


DUO 


propnage i^amouaoai, minor structural protein, putative 


O A nA^QQ 


1 J /4 


propnage JLamoaaoai, rs-acetyimurarnoyi-ju-'aianine amiuase, 
lamuy *r 




uoo 


nrnnKiiop T ^mViHsiSal mi a at QtriiPtiiral tytotriti Alitfltivfi 
piLipiia^C? Lxliliuuaua i , \ vvwwjv ouuuiuiai piw Lv/uu., ^uwuvv 


q a nn^nn 


100 
i\jy 


iiypuiiidiLycii piuicin 


OxWJ vOv 1 


70 


IwTlAtVlPtipfll ATAtf*1A 
Ujr pvlLliwliV/ai pi. LwlXl 


o Afr0fi09 


ion 


f*r»nQ#*rvf*H VivnotVi^tiPSil TiTAtftiA 
^Uii&vi VvU uypuu-iwuirai pxviwxix 




1 1 1 


rnncprvpH VivnAtViPtiAfll ATAtfiin 
isUiiod vou iijrpcpuxwu.wai piutt>in 


o/VVJUOV/H 


910 


TirAnlia CR T .QfTlAHflSfl 1 IvQIA AlltfltlVA 

piVJpnagc i »n liAL/ uuua x , ijfoiii, puiauvv 




j^j 


WUllaCl VCU. IiypvJUlvllvyal piuiciii 


SAG0606 


66 


conserved hypothetical protein 


SAG0607 


56 


conserved hypothetical protein 


SAG0608 


59 


hypothetical protein 


SAG0609 


NA 


prophage LambdaSal, integrase, degenerate 


SAG0610 


134 


conserved hypothetical protein 


SAG0611 


NA 


transposase, degenerate 


SAG0612 


53 


conserved hypothetical protein 


SAG0613 


425 


transmembrane protein Vexpl 


SAG0614 


218 


ABC transporter, ATP-binding protein Vexp2 
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oAGUo I j 


A CO 


— .■ . ■ ■ 

transmembrane protein Vexp3 


oAGUolo 


21 / 


DNA-binding response regulator VncR 


bAGOol/ 


439 


sensor histidine kinase VncS 


SAG0618 


t AC 

195 


transposase OrfB, IS3 family, truncation 


SAG0619 


S aT 

66 


conserved hypothetical protein 


SAG0620 


62 


hypothetical protein 


SAG0621 


401 


rod shape-determining protein RodA, putative □ 


SAG0622 


186 


hydrolase, haloacid dehalogenase-hke family 


SAG0623 


f r r\ 
650 


DNA gyrase, B subunit 


SAG0624 


574 


septation ring formation regulator EzrA, putative 


ci a or>/"i c 

SAG0625 


213 


phosphosenne phosphatase SerB 


SAG0626 


I6l 


MutT/nudix family pro tern 


SAG0627 


I5l 


conserved hypothetical protein 


Cl A jf~^ f\ aK ^ Cm) 

SAG0628 


435 


enolase 


SAG0629 


354 


conserved domain protein 


SAG0630 


427 


3-phosphoshikimate 1 ^arboxyvmyltransferase 


SAG0631 


170 


shikimate kinase 


SAG0632 


457 


psr protein 


SAG0633 


45 1 


RNA methyltransferase, TrmA family 


SAG0634 


70 


hypothetical protein 


SAG0635 


245 


acid phosphatase, class B 


SAG0636 


172 


conserved hypothetical protein 


SAG0637 


NA 


transcriptional regulator, TetR family, putative, authentic 
tTameshift 


SAG0638 


109 


cell wall surface anchor family protein, truncation 


CI A C^/V^ICi 

SAG0639 


273 


transposase OrfB, IS3 family 


CI i OA^il A 

SAG0640 


91 


transposase OrfA, IS3 family 


CI A C**Ci^* >f 1 

SAG0641 


V T A 

NA 


Tn5252, Orf 10 protem, degenerate 


CI A /~ ^ f\ £~ A*^ 

SAGO 642 


CC4 

59 


hypothetical protein 


Cl A f~~* f\jT A *> 

SAG0643 


XT A 

NA 


chaperonin, 33 kDa, degenerate 


Cl A /1A/ - A A 

SAG0644 


/I AO 

402 


transcriptional regulator, AraC family 


SAG0645 


CCA 

554 


cell wall surface anchor family protem 


SAG0646 


307 


ceil wall surface anchor family protein 


SAG0647 


305 


sortase family protein 


SAG0648 


O iCA 

260 


sortase family protein 


2SAG0649 


AAA 

890 


cell wall surface anchor family protein, putative 


SAG0650 


1 OA 

189 


sortase family protein 


S AG065 1 


OA1 

201 


protein of unknown function 


SAG0652 


XT A 

NA 


in5252, Ort 28 protein, degenerate 




XT A 


conservea nypomeucax protein, degenerate 


SAG0654 


34 


hypothetical protein 


SAG0655 


57 


conserved hypothetical protein 


SAG0656 


36 


hypothetical protein 


SAG0657 


89 


hypothetical protein 


SAG0658 


383 


lipoprotein, putative 


SAG0659 


330 


ABC transporter, ATP-binding protein 


SAG0660 


272 


membrane protein 


SAG0661 


261 


conserved hypothetical protein 
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SAG0662 


101 


cylX protein 


SAG0663 


282 


cylD protein 


SAG0664 


240 


cylG protein 


SAG0665 


lOl 


acyl earner protein AcpC 


SAG0666 


158 


cylZ protein 


SAG0667 


309 


cylA protein 


SAG0668 


292 


cy IB protein 


SAG0669 


667 


cylE protein 


SAG0670 


317 


cylF protein 


SAG0671 


73 1 


cyll protein 


SAG0672 


403 


cyl J protein 


SAG0673 


I9l 


cylK protein 


SAG0674 


113 


hypothetical protein 


SAG0675 . 


I7l 


putative secreted protein 


SAG0676 


885 


proteinase, putative 


SAG0677 


1062 


hypothetical protein 


SAG0678 


NA 


endopeptidase O, degenerate 


SAG0679 


343 


protein of unknown function * 


SAG0680 


339 


protein of unknown function 


SAG0681 


353 


conserved domain protein 


SAG0682 


409 


permease, putative 


SAG0683 


NA 


transmembrane protein Vexp3, putative, degenerate 


SAG0684 


223 


ABC transporter, ATP -binding protein 


SAG0685 


472 


conserved hypothetical protein 


SAG0686 


261 


DNA-entry nuclease, putative 


SAG0687 


212 


DedA family protein, putative 


SAG0688 


218 


ABC transporter, ATP-binding protein 


SAG0689 


257 


membrane protein, putative 


SAG0690 


272 


conserved hypothetical protein 


SAG0691 


294 


transcriptional regulator, LysR family 


SAG0692 


193 


regulatory protein, putative 


SAG0693 


377 


IS1548, transposase 


SAG0694 


173 


regulatory protein, putative, truncation 


SAG0695 


330 


D-lactate dehydrogenase 


SAG0696 


516 


sodium.galactoside symporter family protein, putative 


SAG0697 


34 1 


2-keto-3-deoxygluconate kinase 


SAG0698 


599 


beta-glucuronidase 


SAG0699 


223 


transcnptional regulator, GntR family 


SAG0700 


205 


2-dehydro-3-deoxyphosphogluconate aldolase/4-hydroxy-2- 
oxogiuiaraie aiuoiase 


SAG0701 


466 


glucuronate isomerase 


SAG0702 


348 


mannonate dehydratase 


SAG0703 


279 


D-mannonate oxidoreductase 


SAG0704 


270 


hydrolase, haloacid dehalogenase-like family 


SAG0705 


596 


glycosyl hydrolase, family 3 


SAG0706 


361 


proline dipeptidase 


SAG0707 


334 


transcriptional regulator, RegM family 


SAG0708 


488 


alpha amylase family protein 
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SAG0709 


332 


glycosyl transferase, group 1 family protein 


SAG0710 


444 


glycosyl transferase, group 1 family protein 


SAG0711 


647 


threonyl-tRNA synthetase 


SAG0712 


234 


DNA-binding response regulator 


SAG0713 


339 


conserved hypothetical protein 


SAG0714 


188 


conserved hypothetical protein 


SAG0715 


216 


amino acid ABC transporter, permease protein 


SAG0716 


231 


amino acid ABC transporter, permease protein 


SAG0717 


266 


amino acid ABC transporter, amino acid-binding protein 


SAG0718 


251 


amino acid ABC transporter, ATP-binding protein. 


SAG0719 


236 


DNA-binding response regulator 


SAG0720_ 


449 


sensory box histidine Iripase 


SAG0721 


269 


metallo-beta-lactamase superfamily protein 


SAG0722 


122 


conserved hypothetical protein * 


SAG0723 


236 


ribonuclease HI 


SAG0724 


1179 


chromosome segregation SMC protein 


SAG0725 


265 


hydrolase, haloacid dehalogenase-like family 


SAG0726 


274 


hydrolase, haloacid dehalogenase-like family 


SAG0727 


536 


signal recognition particle-docking protein FtsY 


SAGD728 


270 


ABC transporter, substrate-binding protein 


SAG0729 


300 


ABC transporter, permease protein, putative 


SAG0730 


42 


ABC transporter, ATP-binding protein 


SAG0731 


347 


bacterial luciferase family protein 


SAG0732 


720 


transcriptional accessory protein Tex, putative 


SAG0733 


142 


conserved hypothetical protein 


SAG0734 


87 


phage shock protein C, putative 


SAG0735 


44 


hypothetical protein 


SAG0736 


311 


HPr(Ser) kinase/phosphatase 


SAG0737 


257 


prolipoprotein diacylglyceryl transferase 


SAG0738 


132 


conserved hypothetical protein 


SAG0739 


143 


conserved hypothetical protein 


SAG0740 


91 


conserved hypothetical protein 


SAG0741 


303 


peptidase, U32 family, putative 


SAG0742 


428 


peptidase, U32 family 


SAG0743 


70 


conserved hypothetical protein 


SAG0744 


265 


membrane protein, putative 


SAG0745 


446 


Mn2+/Fe2+ transporter, NRAMP family 


SAG0746 


369 


riboflavin biosynthesis protein RibD 


SAG0747 


208 


riboflavin synthase, alpha subumt 


oAvjO /4o 




riboflavin biosynthesis protein RibA 


SAG0749 


156 


riboflavin synthase, beta subunit 


SAG0750 


496 


lysyl-tRNA synthetase 


SAG0751 


1 300 


hydrolase, haloacid dehalogenase-like family 


SAG0752 


213 


phosphoglycerate mutase family protein 


SAG0753 


157 


ebsC family protein, putative 


SAG0754 


205 


conserved domain protein 


SAG0755 


282 


peptidase, U32 family 


SAG0756 


174 


conserved hypothetical protein 
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SAG0757 


129 


protein of unknown function/lipoprotein, putative 


SAG0758 


599 


oligoendopeptidase F, putative 


SAG0759 


931 


phosphoenolpyruvate carboxylase 


SAG0760 


377 


IS 1548, transposase j 


SAG0761 


422 


cell division protein, FtsW/RodA/SpoVE family 


SAG0762 


398 


translation elongation factor Tu 


SAG0763 


252 


triosephosphate isomerase 


SAG0764 


230 


phosphoglycerate mutase family protein 


SAG0765 


681 


penicillin-binding protein 2b 


SAG0766 


198 


recombination protein RecR 


SAG0767 


348 


D-alanine— D-alanine ligase . 


SAG0768 


45'5 


UDP-N-acetylmur^oylalany 
D-alanyl-D-alanyl ligase 


SAG0769 


406 


oxalate :formate antiporter 


SAG0770 


228 


membrane protein, putative 


SAG0771 


512 


cell wall surface anchor family protein 


SAG0772 


514 


peptide chain release factor 3 


SAG0773 


126* 


conserved Hypothetical protein * ~ 


SAG0774 


244 


ABC transporter, ATP-binding protein 


SAG0775 


220 


ABC transporter, permease protein 


SAG0776 


276 


YaeC family protein, putative 


SAG0777 


528 


ATP-dependent RNA helicase, DEAD/DEAH box family 


SAG0778 


88 


conserved hypothetical protein 


SAG0779 


254 


conserved hypothetical protein 


SAG0780 


246 


acyltransferase family protein 


SAG0781 


217 


competence protein CelA 


SAG0782 


745 


DNA internalization-related competence protein ComEC/Rec2 


SAG0783 


269 


hydrolase, haloacid dehalogenase-like family 


SAG0784 


314 


sugar-binding transcriptional regulator, LacI family 


SAG0785 


330 


conserved hypothetical protein 


SAG0786 


242 


conserved domain protein 


SAG0787 


345 


DNA polymerase HI, delta subunit, putative 


SAG0788 


202 


superoxide dismutase, Fe-Mn 


SAG0789 


283 


transcriptional antiterminator LicT 


SAG0790 


622 


PTS system, beta-glucosides-specific IIABC components 


SAG0791 


475 


6-phospho-beta-glucosidase 


SAG0792 


364 


conserved hypothetical protein 


SAG0793 


380 


glycerate kinase 2 


SAG0794 


418 


permease, GntP family 


SACi0795 


1 C A 

354 


conserved hypothetical protein 


SAG0796 


147 


transcriptional regulator, MarR family 


SAG0797 


342 


S-adenosylmethionine:tRNAribosyltransferase-isomerase 


SAG0798 


226 


membrane protein, putative 


SAG0799 


233 


glucosamine-6-phosphate isomerase 


SAG0800 


318 


glutathione S -transferase family protein | 


SAG0801 


239 


ribosomal small subunit pseudouridine synthase A 


SAG0802 


38 


hypothetical protein 


SAG0803 


383 


major facilitator family protein 
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SAG0804 


315 


competence protein CoiA 


SAG0805 


601 


oligoendopeptidase B _j 


SAG0806 


208 


hydrolase, haloacid dehalogenase-like family 


SAG0807 


235 


O-melhyltransferase family protein 


SAG0808 


309 


protease maturation protein, putative 


SAG0809 


161 


conserved hypothetical protein 


SAG0810 


872 


alanyl-tRNA synthetase 


SAG0811 


238 


membrane protein, putative 


SAG0812 


272 


glycosyl transferase, family 8 


SAG0813 


81 


hypothetical protein 


SAG0814 


95 


conserved hypothetical protein 


SAG0815 


. 71 


transcriptional regulator, Cro/CI family 


SAG0816 


253 


membrane protein, putative 


SAG0817 


187 


membrane protein, putative 


SAG0818 


319 


ribonucleoside-diphosphate reductase 2, beta subunit 


SAG0819 . 


719 


ribonucleoside-diphosphate reductase 2, alpha subunit 


SAG0820 


74. 


nbonucleoside-chphosphate reductase 2, NrdH-redoxm 


SAG0821 


87 


phosphocarrier protein HPr 


SAG0822 


577 


phoSphoenolpyruvate-protein phosphotransferase 


SAG0823 


475 


glyceraldehyde-3-phosphate dehydrogenase, NADP-dependent 


SAG0824 


. 417 


polysaccharide deacetylase family protein 


SAG0825 


360 


ATP-dependent RNA helicase, DEAD/DEAH box family 


SAG0826 


209 


uridine kinase 


SAG0827 


165 


conserved hypothetical pirotein 


SAG0828 


554 


DNA polymerase III, gamma and tau subunits 


SAG0829 


64 


conserved hypothetical protein 


SAG0830 


311 


biotin— acetyl-CoA-carboxylase ligase 


SAG0831 


398 


S-adenosylmethionine synthetase i 


SAG0832 


753 


protein of unknown function 


SAG0833 


181 


hypothetical protein 


SAG0834 


42 


hypothetical protein 


SAG0835 


188 


conserved hypothetical protein 


SAG0836 


184 


conserved hypothetical protein 


SAG0837 


428 


ABC transporter, ATP-binding protein 


SAG0838 


233 


hypothetical protein 


SAG0839 


226 


transcnptional regulator, TenA family 


SAG0840 


265 


phosphomethylpyrimidine kinase 


SAG0841 


256 


hydroxyethylthiazole kinase 


SAG0842 


223 


thiamine-phosphate pyrophosphorylase 


SACjUo4i 


A 1 O 


\j J - /lr-*XN~aceiyiglUCOSaiIllIlC I •^axuUA.y Viuy lUaUSlvlooC 


SAG0844 


184 


acetyltransferase, GNAT family 


SAG0845 


427 


CBS domain protein 


SAG0846 


286 


methionine aminopeptidase, type I 


SAG0847 


306 


ribonuclease BN, putative 


SAG0848 


151 


GtrA family protein 


SAG0849 


169 


conserved hypothetical protein 


SAG0850 


652 


DNA ligase, NAD-dependent 


SAG0851 


339 


bmrU protein, putative 
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SAG0852 


766 


pullulanase, putative 


SAG0853 


622 


1,4-alpha-glucan branching enzyme 


SAG0854 


379 


glucose- 1 -phosphate adenylyltransferase 


SAG0855 


NA 


glycogen biosynthesis protein GlgD, authentic frameshift 


SAG0856 


476 


glycogen synthase 


SAG0857 


66 


ATP synthase F0, C subunit 


SAG0858 


238 


ATP synthase F0, A subunit j 


SAG0859 


165 


ATP synthase F0, B subunit 


SAG0860 


178 


ATP synthase F 1 , delta subunit 


SAG0861 


501 


ATP synthase F 1 , alpha subunit 


SAG0862 


293 


ATP synthase F 1 , gamma subunit 


SAQ0863 


468 


ATP synthase Fl , beta subunit 


SAG0864 


137 


ATP synthase F 1 , epsilon subunit 


SAG0865 


76 


conserved hypothetical protein 


SAG0866 


423 


UDP-N-acetylglucosamine 1 -carboxyvinyltransferase 


SAG0867 


63 


conserved hypothetical protein 


SAG0868 


285 


DNA-entry nuclease 


SAG0869 


346 


phenylalanyl-tRNA synthetase, alpha subunit 


SAG0870 


,173 


acetyltransferase, GNAT family 


SAG0871 


801 


phenylalanyl-tRNA synthetase, beta subunit 


SAG0872 


300 


conserved hypothetical protein 


SAG0873 


1077 


exonuclease RexB 


SAG0874 


1207 


exonuclease RexA 


SAG0875 


305 


magnesium transporter, CorA family, putative 


SAG0876 


458 


tRNA modification GTPase TrmE 


SAG0877 


636 


ABC transporter, ATP-binding protein 


SAG0878 


322 


acetoin dehydrogenase, thymine PPi dependent, El component, 
alpha subunit 


SAG0879 


332 


acetoin dehydrogenase, thymine PPi dependent, El component, 
beta subunit 


SAG0880 


462 


acetoin dehydrogenase, thymine PPi dependent, E2 component, 
dihydrolipoamide acetyltransferase 


SAG0881 


585 


acetoin dehydrogenase, thymine PPi dependent, E3 component, 
dihydrolipoamide dehydrogenase 


SAG0882 


329 


lipoate-protein ligase A 


SAG0883 


261 


cobyric acid synthase, putative 


SAG0884 


447 


mur ligase family protein 


SAG0885 


283 


conserved hypothetical protein TIGR00159 


SAG0886 


319 


protein of unknown function 


SAG0887 


450 


phosphoglucomutase/phosphomannomutase family protein 


SAG0888 


123 


conserved hypothetical protein 


SAG0889 


126 


conserved hypothetical protein 


SAG0890 


376 


oxygen-independent coproporphyrinogen HI oxidase, putative 


SAG0891 


245 


conserved hypothetical protein 


SAG0892 


256 


hydrolase, haloacid dehalogenase-like family 


SAG0893 


218 


conserved hypothetical protein 


SAG0894 


1370 


protein of unknown function 


SAG0895 


289 


lipoyl-binding domain protein 
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ORJb 


oize 
(a. a.) 


A n no ration 


bAOUsyo 


lUo 


rori H or*»r1i 1 r* tsi <ift fti if a ti Vft 


oAOUoV / 


ZZ1 


r»riTicArvpfl Hvnfttlietieal tyrotein 


o A PAOOQ 


00 


VivnrvtVif*'Hr*a1 trrfttpin 


O A PAOOO 

SAOOoyy 


o / 


ViTrr\rk'fV»^fir»o1 T^tTk+PiTi 


SAG090U 


DO 


\n rr-v t> T"t r* 0 1 TVtY\'f*l*1 Tl 


SAG0901 


12/ 


nypouieucai proicm 


SAG0902 


40 




SAG0903 


44 


nypotnencai proicm 


SAG0904 


00 


nypoineucai pro icm ... 


SAG0905 


1 iff 
13o 


11UC1COS1U.C aipnOapilalC AJLUaoC 


SAG0906 


i£1 ft 
OiU 


Vj 1 Jr-DinQing proiein j^cprv 


SAG0907 


8/ / 


prOlOlll OI UIlKIlOWIl iUElOllUII/lipupiwioiAi, puiauvv _ . _ .... 


SAG0908 


Oftl 

2U3 




SAG0909 


1 


artaftilfronoforOCP ^ -iM A ' t ' "faTTlll'V 

aCCtyitrailSIGraSe, OTN-rv 1 lamny 


SAG0910 


144 




SAG0911 


noft 

930 


Cfl-UOn-UallSporiing /\llrdbC, cl-szz* laiiuij 


SAG0912 


30/ 


nucieosiQC oipnospnatc Kinaoc uuiuaxu piuu/m 


SAG0913 


212 


cnlorairipncnicoi aceryirroiisicrabc 


SAG0914 


ofti 
. 2U3 


conservco nypouioiicai proiein . 


C A AAA 1 C 

SAG0915 


4UD 


Initio, llanspuSaSC 


SAG0916 


o./ 


lnv i o 9 excisionase 


SAG0917 


o3 


iny i o, nypoineticai prutciu 


SAG0918 


/o 


liiyio, nypouiGiicai pro icui 


O A PAft 1 ft 

SAG0919 


1 ^*7 
10/ 


TVkOI #C V»-»7«r\fViofTr»a1 nrntPlfl 


O A /^ftftlft 


23 


inyio, nypoxncticcii pruioiii 


SAG0921 


11/ 


T— ft 1 fZ froncr*rinflnna1 TF^CTlllatftr ftlltatlVG 

inv 10, iransciipuoiia* rcguicnui, pumuv^ 


O A /"IftftTJ 

SAG0922 


01 


inyio, nypouieiicai proicm 


SAG0923 


039 


iny 1 Oj 16 ixacy c i mc icoiouuiv/c pmiciu 


O A /""■ftftlyf 

SAGU924 


Off 
Zo 


liiy 10, icuvi leaaer pcpuuc 


SAGU92D 


lift 
31U 


HP— .ft 1 iZ Vit rrvrvtVi r* a 1 ftfft'f'Pltl 

initio, nypouicucai pxuiciii 


C" A /^IftftOiC 

SAGU920 


111 


TVkOIA "MT P/PAO fnmilv "nmtftiri 


O A /"IftftO *7 

SAG0927 


*71^ 

/ZD 




oAvjv92o 


iN/V 


TViOl ^ Vix/nrkfh#»tir»ffi1 nrft tftin authentic firamCSllift 

JL Ti7» 1 yjy \i y\) UUlvUwdl |iJLVii*^iiij c*i*»xiw»i*HiW aa.*****wwa***» 


bAGU9Z9 


1 Aft 
lOo 


TrtOIA Vixrrkr\fViP»tina1 ■ft1*fttf*i - n 


O A /^.ftftQft 


1 

lOO 


TViQItf^ VivnrfctVif»tir»a1 nrfttPin 


O A /""»ftft1 1 

b AGU9 3 1 


*7^l 
ID 


T«Q1 iC Vi-\mnt'Vi^'Hr , n1 nrfttPin 


bAvjU93Z 


4U1 


TViOl francr*rirttirvn2i1 TPCnilatftT ftlltative 


dA<jtU933 


401 


TnOIA Ptc'K'/^Tiftl 1 1 H fflmilv nTotein 


OAGU934 


IZo 


TYiQI f\ ViTmr^tViftipal ftTfttPlft 


SAG0935 


104 


Tn916 t hypothetical protein 


SAG0936 


39 


Tn916, hypothetical protein 


SAG0937 


NA 


ABC transporter, ATP-binding protein, authentic firameshift 


SAG0938 


122 


transcriptional regulator, GntR family 


SAG0939 


1034 


DNA polymerase m, alpha subunit 


SAG0940 


340 


6-phosphofructokinase 


SAG0941 


500 


pyruvate kinase 


SAG0942 


185 


signal peptidase I, putative 


SAG0943 


41 


r hypothetical protein 
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aliimQaminft— fnictose-6-Dhost)hate aminotransferase, isomenzing 




^77 


cm 54R tran^nosase 


bAvjU:J40 




t"%Vin A T\vc\\&t n 


S AGU94 / 


91 ^ 


amino ariH AT^f 1 tran^norter nermease protein 


SAGU94o 


9HQ 


«jmino aniri arp tran<morter ATP-binding protein 


SAGU949 


97£ 
Z /O 


a-minn aotri aw* tran<rnnrter amino acid-bindins protein 


SAG095O 


oZ 


rtKAcnmal nfAfpin C90 


SAG0951 


io£ 


janiouienai© jKJiia.bc 


SAG095Z 


I9D 


conserveQ nyp u iiic u v<ii jjiuicau. 


SAG0953 


1 90 
izy 


'mrfi/litia /1oominQC0 


SAG0954 




nmloin nf nnVnnum fi in Pti OTl/1 inOT^rOtGin.- Dlltative 


SAG0955 


CI 1 

M 1 


adp francnArfpr a TP-Kin Hinp nrotein 

SUgoX XVJDv>» LI allopUIlCl y /A. X A UlilViixig pxv/v^xj-i. 


SAG0956 


333 


sugar Adv-/ tianspoixer, pcmicoac pivpi^ua, ^uwuvw 


SAG0957 


11 Q 


onrrar A X5/^' franonnrtpr nprmpa nrotein putative 


SAG0955 


4D0 


"KT A 1 VU AVIAQCP 

iNAL/ri oxiaasc 


SAG0959 


. 3Z9 


JL,- laC 12. LC QCUyUXLigClictoC^ 


SAGu9oO 


Q 1 O 


T*\"NT A mrroca A CiinilTlii* 


SAG0961 


Z4/ 




SAG0962 




rrlifAVTrlooO ■foTYlilx/ 1\TAtP111 


SAG0963 


3ZU 


c onscrVv u. nypuuiciiv/ai piuiciu 


SAG09o4 


19< 


"Mci4-/n-4- jav r* Vi an CTf^T* fisnflilv TlTfltclTl 


SAG0963 


i 99 

IZ/ 


TC1 1521 franchncacp OrfA 


SAG09oo 


1 90 

lzy 


TC11SJ1 francnncncp OrfR 


. SAG096 / 


OZU 


f~~l?\/l O cnmfn a cp 


SAG09OO 


Z3Z 


froncr>rinfinn!)1 rpoiilatnr CrtltR fa mil V 


O A /^AA£Q 

SAG09O9 


'rrl 


rri n nfAfp 1 n 


C" A ^AQTH 


9A7 
Z*f / 


o^ofx/lfr-a-ncf^rac^ (TNT AT fatTlUv 
aCciyiliailolCIttOCj vji^jTA. a xaxiiiijr 


C A PAQT1 


ZoZ 


rk-rr\t<»iri nf imlfnnwn "fi in ction/linoTirotein. putative 


O A nAQ'70 

b AGU9 / Z 


XT A 


/*rM-ic*>-rvpr1 Vix/nntiipficial nroteiri authentic franiestiitt 


C A PAQ71 

SAGU9 /3 


19ft 


nicin. -ri*ci cfatip^ nrAtfiin nutative 


SAGU9 /4 


9^ft 
ZDU 


Apr tr a n <m nrter ATP-nindinff protein 


C A PAQ7< 

S AG09 / D 


O0I 


kx±c* troncnortpr AP.rmfiase nrnteiTi nutative 


o AviU9 / 0 


999 


pjlsJA -hi nH in (y rft^nonfss regulator 


C A nrtOT7 


119 
D IZ 


cpficnr ViictiHinp Vinase 


oAvjUV / o 


JJO 


citp-onpmfic Tecombinase. phase inte erase family 


o a nciQIQ 




A'Rr' 1 rmn snorter substrate-bindinff protein 


oAVjUVoU 


957 


nrvncprvpH Vivnothetical protein 


oAvjU9oi 


i 99S 


cof-T"i TYrofpin 


c Anno 9 


591 


cicmal recognition particle protein Ffh 


SAG0983 


110 


conserved hypothetical protein 


SAG0984 


437 


sensor histidine kinase CiaH 


SAG0985 


226 


DNA-binding response regulator CiaR 


SAG0986 


849 


aminopeptidase N 


SAG0987 


217 


phosphate transport system regulatory protein PhoU 


SAG0988 


252 


phosphate ABC transporter, ATP-binding protein Pstfi, putative. 


SAG0989 


267 


phosphate ABC transporter, ATP-binding protein PstB, putative 


SAG0990 


295 


phosphate ABC transporter, permease protein PstA, putative 


SAG0991 


305 


phosphate ABC transporter, permease protein 
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c a nA009 


zoo 


pnospnate /\Dv/ transp oner, pnospnaTC-uinaing proiem 






in vj ju i / in Kjrs,/ sun rami ry pro te m 




9^1 


inositol monopnospnaiase iamuy protein 






conserved hypothetical protein 




1 17 

l j / 


conserved hypothetical protein 




^ 1 A 


macrolide-efflux protein mreA/riboflavin biosynthesis protein 

JtODr 




9 Oil 


tRNA pseudouridine synthase B 






acetyltransferase,. GNAT family 


O A/71 AAA 


.491 

hZo 


conserved hypothetical protein 


C A AA1 


1 OA 


conserved hypothetical protein 


OAni AA9 

kAOlUUZ 


9Q9 

zyz 


protease, putative 


o a f£i AA1 


5 /O 


permease, putative 


C A /Til AA/f 


9H 


Ant transporter, AiJr-Dinauig protein 


q Am aa^ 


7A#S 
/UO 


DNA topoisomerase I 


JC AiTJl AA£ 


• 9CA 
ZoU 


DprA/SMF protein, putative DNA processing factor % ~ 


Q A#ni Am 


1A9 


iron-compound ABC transporter, iron-compound-binding protein 


Q AOI AAfi 


9^1 


iron compouna aul transporter, a x Jr-Dinumg protein 


C A/71 AAO 


11 A 


rron compound ABC transporter, permease protein 


CAniAIA 


19A 


iron compound ABC transporter, permease protein 


oAAjrlUil 


1 89 

loz 


acetyltransferase, CysE/LacA/LpxA/NodL family 


QAH1A1 9 


9^*5 
ZD«3 


rioonuciease tin 




981 
ZoO 


kj i ir-omaing protem 


Q Am A1 4 


1 OA 


conservea nypometicai protem 


C AfJ1 A1 < 


/1G/1 


carbon starvation protem CstA, putative 


Q A f~l 1 A1 A 


Z*fH 


response regulator 


Q Am A1 7 


^7Q 


sensor msnoine Kinase, putative 


o Al^M A1 ft 




lipoprotein, putative 


C A -Til A1 O 


1Q 


hypothetical protein 


C AfJI A9A 


999 

ZZ / . 


lipoprotein, putative 


Q AY*1 A91 


1 A9 
1U / 


hypothetical protein 


QAm 099 

O/VvJ 1 UZZ 


1 79 
lit 


nypoineticai protein 




AH 
Ho 


nypoxnencai protem 


c Afr1094 


1 $tt 

1 OD 


iipopiuicm, puutiivc 




140 


uypumcu^di pxi/Lcui 


q Aril AOfi 


MA 

IN /A. 


imiiiuiKjgoiiii/ bccrcLeu pruicm, oe generate 


^AO1097 


0*T 


^uuocivcu uypuuiciivcti piuiein 






IljrpvUlCUval piiiicin 


q A01 090 


101 


nypomencai proiem 


SAG 1030 


304 


protein of unknown function 


SAG1031 


120 


conserved domain protein 


SAG1032 


85 


conserved hypothetical protein 


SAG1033 


1309 


FtsK/SpoIHE family protein 


SAG1034 


55 


hypothetical protein 


SAG1035 


424 


conserved hypothetical protein 


SAG1036 


80 


conserved hypothetical protein 


SAG1037 


157 


hypothetical protein 


SAG1038 


1003 


phage infection protein, putative 
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/^XllXU UlUUU 


S AG 1039 


96 


r»nnQervpH livrintliptionl nrAtftin 

WJAJLOwX VvU [WlUOUvdl |/Jlw twill 


9AG1040 i 


260 


f*rvn cptvpH HotnaiTi t^mfpin 
^*Jllov/l VOU UOlllClXll piuiciii 


SAG1041 


107 


lYViv>tlif*tif*»l "nrofpiti 


c AG1049 


1060 


ValUalllOyi-pnUbpUaLC oYUlXXaaC, IdXgC oUUlXXXXi 


^AG1043 




valUalllOy 1-pilOopilalC byilllliloC, ollldll olAUUnil 


q AG1044 


307 


a.SpaXTal.6 CaTDaluOyXlTalXSICladC 


q Am oa^ 


A^O 


uixxyarooroiase, muinmncuonai complex type 




900 


orotaie pnospnonDOsyiTxansiera.se 


QAG1047 


9^ 


oronaine 3 -pnospnate aecaruoxyia.se 


o/V\JXV*to 


A\ O 
HXU 


mem Drane protein, puxanve 


QAr^inzio ■ 


^1 *X 
DID 


adl rransp oner, a x x -Dinaiiig protein 


q Arjin^n 


119 
X 1Z 


noonucieonae reauctase, truncation 


1 UJ 1 


JJO • 


aspaxtate-semiajQenyue aenyarogenase 


QAG1059 


47 


ceii waxx suixace ancnor iarnny protein, puxanve . <? 


oAUIUjj 


30 


nypotxieucax protein 


QAG1054 


S31 

JJ X 


caraioupin syntnetase 


D-ttAj X V././ 


JJO 


xojrnate — te uitnyoro io late ngase 


c actios*? 


33Q 


upudxe-proiein iigase /> 


<^a gio^7 


909 


conservetx nypotneucai protein 


qagio^r 


979 
^ /Z 


conservea nypotneucai protein 


OA\J.lUJ7 


1 10 

X XO 


glycine cieavage system ri protein, putative 


D/\AJT X O OO. 


^9» 


odctenai lucixerase iamuy protein 


^AG1061 




UAlUUlcUUw labc, V 1VX1N - U lUUlUg 


c agio69 


9R9 


iipoate-protein ugase /\ ianniy protein 


QAG10M 


99R 


navoprotem-reiatea protein 


Q AO1064 


1 RO 
X OO 


iiavoprotem iamuy protein 


O/xvJ X V/OJ 


1QO 


xTiwixiDianc protein, putative 


qagio/^ 

OAU I UOO 


^79 
Oil, 


nnAcmnAmiiAAmtifa c*a 

pnosp nogiucomuta.se 


Q AG 1067 
OrWj 1 I/O / 


1 7R 
X / o 


XooOl, UallopuaddC kJILt\ 


SAGIOtfR 


977 


TCO< 1 tntncrtncAQp OrfR 
lOOUl, IXcUlapUadoC Wl liJ 




6S 
oj 


nypotncncax protexn 


QAG1070 


S77 
«/ / / 


adu uaixopoxter, Air "Oiuumgf peimedoe protein 


SAG1071 

O/IVJ 1 \J 1 1 


573 


ARr^ 1 trancT\ A i+pr A ' 1 *M— Vtinr1incr/r , %pi*mpa cp TMT^foiri 
ADu U CUloL/Ol LCI , /A. X A ~ l/lllLllllgf OCXlllCadC jJl O LCI 11 


SAG1072 


900 


wOIlbCI YCU liypOUJLCUlC'al UJLO icxn 


SAG 1073 


325 


patiqptvpH HvnAtliP i tif*a1 nrAtpin 

UUlloblVvu pV/lUvllLal £/JlV/lGlii 


SAG 1074 


418 


cptit*ip livHT*riYT/iTiP+1i'\/1iT5ifiC'ft>'rae<> 

ObiUiw JUjr lU.U/VjrlllwUJ.y AlXCUlOXClaow 


SAG1075 


183 


SliiflS/VniOA^rrlPA^wlP fhmilv r^rnfpin 
ouajr x v/ivy/ x x\x\^/ x wiv/ xaxixiiy piuicm 


SAG 1076 


276 


ttiArlifipaHoTi m pfVivl ncp Wpmlir fam-ilv 
XAiv/uix&\^aLi%jix xuwixijr laow, xxwiiixv. xaxiiiiy 


SAG 1077 

UiVVJ IV// / 


350 


nMitiflp f*ViJiiTi TiplftflQP flaptAr 1 

L/CLitlUw W/ilalll IClCOoC X£LV/tOX X 


SAG1078 


189 


thymidine kinases 


SAG1079 


60 


4-oxalocrotonate tautomerase 


SAG1080 


47 


hypothetical protein 


SAG1081 


312 


ApbE family protein 


SAG1082 


200 


conserved hypotheticaTprotein 


SAG1083 


411 


conserved hypothetical protein 


SAG1084 


262 


formate/nitrite transporter family protein 


SAG1085 


424 


xanthine permease 


SAG 1086 


193 


xanthine phosphonT)osyltransferase 



421 



WO 2004/018646 



PCTYUS2003/026827 



Table 1: Complete list of GBS predicted genes 



ORF 


Size 
(a.a.) 


Annotation 


SAG1087 


327 


guanosine monophosphate reductase 


SAG1088 


446 


drug resistance transporter, EmrB/QacA family, putative 


SAG1089 


230 


conserved hypothetical protein 


SAG1090 


666 


potassium uptake protein, putative 


SAG1091 


216 


oxidoreductase, short chain dehydrogenase/reductase family 


SAG1092 


330 


phosphate acetyltransferase 


SAG1093 


294 


ribosomal large subunit pseudouridine synthase, RluD subfamily 


SAG1094 


278 


conserved hypothetical protein 


SAG1095 


223 


GTP pyrophosphokinase family protein 


SAG1096 


190 


conserved hypothetical protein 


SAG1097 


324 


ribose-phosphate pyrophosphokinase 


SAG1098 


371* 


cysteine desulphurase 


SAG1099 


115 


conserved hypothetical protein | 


SAG1100 


210 


conserved hypothetical protein 


SAG1101 

U.4XVJ 1 iwi 


226 


DNA repair nrotein RadC 


SAG1102 


377 


^membrane protein, putative . 


SAG1103 


478 


6-nhoSnho-beta-elucosidase 


SAG1104 


204 


nlatelet activating factor, nutative 


SAG1105 


273 


hydrolase, haloacid dehalogenase-like family 


SAG1106 I 


309 


transcriptional regulator, AraC family, putative 


SAG1 107 


510 


voltage-gated chloride channel family protein 


SAG1108 


357 


spermidine/putrescine ABC transporter, spermidine/putrescine^ 
binding protein 


SAG1109 


258 


spermidine/putrescine ABC transporter, permease protein 


SAG1110 


264 


spermidine/putrescine ABC transporter, permease protein 


SAG! Ill 

fctJX L\al A A A A 


384 


spermidine/putrescine ABC transporter, ATP-binding protein 


SAG1112 


300 


UDP-N-acetylenolpyruvoylglucosamine reductase 


SAG1113 


162 


2-amino-4-hydroxy-6-hy droxyme thyl dihydropteridine 
pyrophosphokinase 


SAG1114 


120 


dihydroneopteriri aldolase 


SAG1115 


267 


dihydropteroate synthase 


SAG1116 


187 


GTP cyclohydrolase I 


SAG1117 


420 


folylpolyglutamate synthase 


SAG1118 


295 


rarD protein 


SAG1119 


288 


homoserine kinase 


SAG1 120 


427 


homoserine dehydrogenase 


SAG1121 


295 


polysaccharide deacetylase family protein 


SAG1 122 


515 


transporter, BCCT family protein 


SAG1123 


34 


hypothetical protein 


SAG1124 


458 


aldehyde dehydrogenase family protein 


SAG1125 


335 


membrane protein, putative 


SAG1126 


228 


protein of unknown function 


SAG1127 


446 


conserved domain protein 


SAG1128 


65 


transcriptional regulator, Cro/CI family 


SAG1129 


36 


hypothetical protein 


SAG1130 


49 


hypothetical protein 


SAG1131 


164 


thiol peroxidase 


SAG1132 


219 


conserved hypothetical protein 
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SAG1133 


254 


conserved hypothetical protein 


SAG1134 


213 


transcriptional regulator, GntR family/potassioum uptake protein, 
TrkA family 


SAG1135 


183 


gls24 protein, putative 


SAG1136 


65 


conserved hypothetical protein 


SAG1137 


180 


gls24 protein, putative 


SAG1138 


64 


conserved hypothetical protein 


SAG1139 


193 


conserved hypothetical protein 


SAG1140 


82 


conserved hypothetical protein 


SAG1141 


112 


conserved hypothetical protein 


SAG1142 


759 


ATP-dependent DNA helicase PcrA 


SAG1143 


• 128 


conserved hypothetical protein 


SAG1144 


441 


uracil permease 


SAG1145 


448 


sodiumialanine symporter family protein 


SAG1146 


411 


cation efflux family protein 


SAG1147 


130 


conserved hypothetical protein 


SAG1148 


231 


membrane protein, putative 


SAG1149 


207 


lipoprotein, putative . 


SAG1150 


400 


ribosomal protein SI 


SAG1151 


*76 


conserved hypothetical protein 


SAG1152 


340 


branched-chain amino acid aminotransferase 


SAG1153 


819 


DNA topoisomerase IV, A subunit 


SAG1154 


653 


DNA topoisomerase IV, B subunit 


SAG1155 


212 


membrane protein, putative 


SAG1156 


217 


uracil-DNA glycosylase 


SAG1157 


161 


conserved hypothetical protein 


SAG1158 


413 


CMP-N-acetylneuramimc acid synthetase NeuA 


SAG1159 


209 


neuD protein 


SAG1160 


384 


UDP-N-acetylglucosamine-2-epimerase NeuC 


SAG1161 


341 


N-acetyl neuramic acid synthetase NeuB 


SAG1162 


466 


polysacchande biosynthesis protem CpsL 


SAG1163 


318 


polysaccharide biosynthesis protem CpsK(V) 


SAG1164 


321 


glycosyl transferase CpsJ(V) 1 


SAG1165 


327 


glycosyl transferase CpsO(V) 


SAG1 166 


295 


glycosyl transferase CpsN(V) 


SAG1167 


241 


polysaccharide biosynthesis protein CpsM(V) 


SAG1 168 


! 364 


polysacchande biosynthesis protein cpsH(V) 


SAG1169 


163 


glycosyl transferase CpsG(V) 


SAG1170 


149 


polysaccharide biosynthesis protein CpsF 


CAP1 1*71 




giycosyi xransierase v^psjc* 


SAG1172 


229 


cpsD protein 


SAG1173 


230 


cpsC protein 


SAG1174 


243 


capsular polysaccharide biosynthesis protein CpsB 


SAG1175 


485 


capsular polysaccharide biosynthesis protein CpsA 


SAG1176 


290 


transcriptional regulator, LysR family, putative . 


SAG1177 


255 


conserved hypothetical protein 


SAG1178 


236 


purine nucleoside phosphorylase 


SAG1179 


418 


voltage-gated chloride channel family protein, putative 
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SAG 1 1 80 1 269 | purine nucleoside phosphorylase 



SAG1181 



135 I arsenate reductase 



SAG 11 82 403 phosphopentomutase 



SAG 11 83 j 223 | ribose 5-phosphate isomerase 



SAG1 1 84 I 236 1 conserved hypothetical protein 



SAG 1185 | 262 1 tributyrin esterase 



SAG1186 



SAG1187 



553 
253 



metallo-beta-lactamase superfamily protein 



ABC transporter, ATP-binding protein 



SAG1188 287 ABC transporter, permease protein 



SAGU89 I 334 | conserved hypothetical protein 



SAG1 190 551 adherence and virulence protein A 



SAG1191 | 239 alpha-acetolactate decarboxylase 



SAG 1192 1 560 1 acetolactate synthase, catabolic 



SAG1193 j 408 | TPR domain protein 



SAG1194 T 396 | membrane protem, putative 



SAG1195 j 153 I MutT/nudix family protein 



SAG1196 1 160 mutator MutT protein 



SAG1197 j 1072 hyaluronidase 



SAG1198 1 348 1 dTDP-glucose 4,6-dehydratase 



SAG1199 I 197 1 dTD^-dehydrorhamnose 3,5-epimerase 



SAG1200 | 289 I glucose-l-phosphate thymidylyltransferase 



SAG1201 



367 1 iminodiacetate oxidase, putative 



SAG1202 262 1 conserved hypothetical protein TIGR00486 



SAG1203 1 227 | conserved hypothetical protein 



SAG1204 I 226 | DNA replication protein DnaD, putative 



SAG1205 f 172 I adenine phosphoribosyltransferase 



SAG 1206 | 854 | conserved domain protein 



SAG1207 1 32 hypothetical protein 



SAG1208 1 732 | single-stranded-DNA-specific exonuclease RecJ 



SAG1209 253 oxidoreductase, short chain dehydrogenase/reductase family 



SAG1210 1 309 1 metallo-beta-lactamase superfamily protein 



SAG1211 I 215 I conserved hypothetical protein 



SAG1212 1 412 j GTP-binding protein HflX 



SAG1213 1 296 | tRNA delta(2Hsopentenylpyrophosphate transferase 



SAG1214 



58 hypothetical protein 



SAG1215 1 305 1 exfoliative toxin A, putative 



SAG1216 1252 pullulanase, putative 



SAG1217 [ NA conserved hypothetical protein, authentic frameshift 



SAG 121 8 1 194 I conserved hypothetical protein 



SAG1219 f 468 I peptidase, M20/M25/M40 family 



SAG1220 I 200 1 nitroreductase family protein 



SAG1221 | NA | glycerophosphoryl diester phosphodiesterase, putative, authentic 
point mutation 



SAG 1222 593 | excinuclease ABCTC subunit 



SAG1223 | 255 | conserved hypothetical protein 



SAG 1224 1 446 1 MATE efflux family protein 



SAG 1225 I 136 I conserved hypothetical protein 



SAG1226 1 165 | conserved hypothetical protein 
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oize 


A nn Afntinn 


QAfr1997 


1 QQ 

I/O 


tvmtpiTi r\€ iTnVnnwn firnction 

yjl \J IV ill Ul Li 1 1M1U W XX iUXlvUVXi 


CAfjl 99R 


Q6 


XuOUjr 1) Udixopi/ociov* viirv 


CA0199Q 


95Q 


xoouy 1 9 txaxiopisociow wi jlu 


oAvJ XZJU 


Q6 


t/OllbCl VOU IiypUlXXCLXl'aX pH-JUGXlX 


c Am 911 


"MA 


lx<lXlSp(Jo<XoC U1UD) luJ ldllJUXjr j UvgwuCiaiv 


C A C±\ H*XH 
oALrl Z3Z 


/ / 


frortpnArooo OrfR TQ1 -fonrilx/ ttt i Tl r» ci <~i nr» 

xraiisposaSc vjriJD, ioj iamuy, truutduuii 


c Am H'X'x 


Q99 
oZZ 


cffonf A/^nnno 1 Tiicfi/liTiia f ft c\{\ fiimilv TIT/^T^iTI 
SuTcpiOOOCCal fUbUUlilt? lXl<*vl IclIIJlXijr piiXlCIH 


g Am h*xa 
oAljrxZ.j't 


1ft£ 


lalTllIlin UlliUlilg oUXlaUC piuiciii t 


oAVJXZjD 


AH ^ 


riDQt 1 nmnn TT iTiirT\Ti TYlJItllfac^ 
UiJul 1 , gTvlUp JJ. IHUUIlj lliaiuictoC/ 


o Aril hi& 


XT A 
IN A 


r*^o t^a-nfi/4acp ofirVionr^/* Trsimf^cVi'tTr 
LJa ptJpilUilbC, dUUlCnUt llalllCoXlill 


c Am H1H 


AAA 


nypoiiiciicai proiciii 


oAuIZjo 


H(\H 
ZUZ 


nypouicucai proieiii 


o a m oio 


/O 


conservea nypouicucai proieiii 


c A'm OAA 


19^ 


conservcu nypotiieucai pruicixiy uuncduon 


c a m o/ii 
oAvjxZ^H 




uaiisposaSc uyiA, ioj iamiiy 


c Am HAH 
oAtjr xZhZ 


0/ 


uallSpOSaSe L/lIr>, Xo3 iaiiiiiy, Txiincauoii 


Q Am HA1 

oAIjxZ**o 


yo 


iDouyi) iraiisposase unn 


c Am HAA 


9^0 


ioouyi 9 uansposase \jlld 


O Am O/IC 


JO 


nypoiuencai proiem 


P AHI HAA 


IfcO 

J07 


nypotiieiicai proiein 


C Am HAH 


1QO 


Sii6~spGCiiic rsconiuijiase, pnagc miegraae lainiiy 


Q Am HASl 


7<; 


coiiocrvcu xiypuinctiuai piuLcixi 


oAvJlZH:/ 


HA 


U^allSCripilUIUll XCglXlatUXy V^XAJ/ v^x lcuxixxy 


CAfi19^A 


691 
OZX 


'TVi^9^9 rplaYacp 


c Am9^i 


191 
IZl 


iiiDZDZ, un 5r protciii 


c Am 9*k9 


19fi 
1ZU 


Tn^9 ^9 Orf 1 0 nmtf in 

in«?z^z, un iu protein 


q Am o<ci 




IX <iIlSpOoa.se, XvjJLO XaXXUiy 




S46 


ITXC XU 11X710 iCUU^laoC 


c Am9^ 




XTXClvUIlU XCSlSicUXvC v>pCX\Jll lCgUldlUlJf piVJlClll XVXdXV. 


q Am9^6 


149 


TOO^ 1 frnn(mnciicp /"Wfti Tmnr»5iTi nTi 
luOU X 9 ixaxxopiioaoc v-/iix>j uuixv^ciuv/ii 


QAni9^7 
OAVJ 1 Zj / 


70Q 


r»OTi<^T\_TTCiT\c'r\r\TTil'r\cr ATTPao** T^l — P9 'filTTTll'V 
OalXUIl~*lXaXlbpv>Lllllg xVXXT(XoC 9 JCrX XJr^> XaMllllY 


OAVJ1Z30 


199 


/*nHmiiiTTi ^"fifliiY cvctf*tn ap^PQcnrv TirAtftiTi 
uavimmxxi vxxiua. ajroiviii ctu/v«woov/*.y pi v/tv/iAi 


uAu X 


QQ 


f» r\Ti Cf*Tirf*f? V>\rr\r\t'V\f*Tif.c4l T\Tf\t"PiTi 
VUllavlVvU iiy pVJUld-lVCM pjLUt^xll 


c Am 960 


969 


rivnritriftToal •nTofpin 

lXy JJULUwllval pi-V/i&lil 


c A0ti961 


1 ^0 


vvllo CX VvU Al_y p *-» Ulv LlVrfttl piu iw Xll 


C A m969 




k/auuii U aiiopUl iiix^ x x uoc, x-> x JL-»^i» xaxxixiy 


G AOi96^ 




friTi qptvrH rlnmniTi •nTritftfn niTtViftTrriri fraTYifi^thift 

vUllovl VvU ixi^xxiaiix pxviLwxxxy auuiviiuv xxaxxxooxxxx^ 


QA01964 
OxVVJ 1 zu*t 


148 

X^O 


TT^Ticr^Ti'ntTrknnl TPT»r<*^^or PrmY "nutative 

Liaiiov/XXpLivxiaX ic^itooui x 9 ptxtaLxw/ 


Q,Afr196S 


906 


psifimiiiTn TpQiQtflriPft traTiQririTTftT TwrtAtivft 

^/ClUlXXXUlll IvOIOmUIwv VX ailopv/X l^/X ^ puidU tv 


SAG1266 


152 


hypothetical protein 


SAG1267 


108 


hypothetical protein 


SAG1268 


230 


repressor protein, putative 


SAG1269 


44 


hypothetical protein 


SAG1270 


471 


linpB/MucB/SamB family protein 


SAG1271 


116 


conserved hypothetical protein 


SAG1272 


102 


conserved hypothetical protein 


SAG1273 


118 


conserved hypothetical protein 


SAG1274 


129 


conserved hypothetical protein 
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SAG1275 


75 


hypothetical protein 


SAG1276 


358 


conserved hypothetical protein 


SAG 1 277 


163 


hypothetical protein 


SAG 1 278 


96 


hypothetical protein 


SAG 1279 


99 


conserved domain protein 


SAG1280 


2274 


SNF2 family protein 


SAG1281 


183 


hypothetical protein 


SAG1282 


63 


calcium-binding protein, putative 


SAG1283 


1631 


agglutinin receptor 


SAG1284 


196 


abortive infection protem AbiGI 


SAG 1285 


281 


abortive infection protem AbiGH 


SAG 1286 c 


933 


Tn5252, Orf28 


SAG1287 


776 


Tn5252, Orf26 j 


SAG1288 


NA 


Tn5252, Orf25, degenerate 


SAG12§9 


284 


Tn5252, Orf23 . 


SAG1290 


80 


hypothetical protein 


SAG1291 


605 


Tn5252, Orf 21 protein, internal deletion 


SAG 1292 


162 


hypothetical protein 


SAG1293 


194 


protease, putative 


SAG 1294 


77 


conserved hypothetical protein 


SAG1295 


127 


conserved hypothetical protein 


SAG1296 


142 


conserved hypothetical protein 


SAG 1297 


.451 


C-5 cytosme-specxfic DNA methylase 


SAG1298 


31 


hypothetical protein 


SAG1299 


272 


conserved hypothetical protein 


SAG1300 


57 


conserved hypothetical protein 


SAG1301 


121 


nbosomal protein L7/L12 


SAG1302 


166 


ribosomal proteinXlO 


SAG1303 


702 


ATP-dependent Clp protease, ATP-bmding subunit 


SAG 1304 


32 


hypothetical protein 


SAG 1 305 


314 


homocysteme S-methyltransferase MmuM, putative j 


SAG1306 


ACQ 

458 


ammo acid permease 


SAG 1307 


216 


hypothetical protein 


SAG 1 308 


167 


hypothetical protein 


SAG 1309 


*> A 

30 


hypothetical protein 


O A I^IA 

SAG1310 


182 


transcriptional regulator, TetR family 


O A /"*» 1111 

SAG1311 


i no 

198 


G I P-binding protem 


SAG1312 


A AO 

408 


ATP-dependent Clp protease, ATP -binding subunit ClpX 


SAG1313 


56 


conserved hypothetical protein 






omyuroioiaxe reuuciose 


SAG1315 


279 


thymidylate synthase 


SAG 13 16 


390 


HMG-CoA synthase 


SAG1317 


427 


3-hydroxy-3-methj^glutaryl-CoA reductase 


SAG1318 


149 


conserved hypothetical protein 


SAG1319 


214 


hemolysin HI, putative 


SAG 1320 


304 


conserved hypothetical protein TIGR00147 


SAG1321 


284 


glutathione S-transferase family protein, putative 


SAG1322 


72 


conserved domain protein 
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oize 
(a. a.) 


/vnno xau o n 


CAOI 191 


111 


isopenieny l-uipno spnaie u.ciia-isoiiicicioc 


Q Afr1 194 


jjU 


pnospnomovaionaie Kinase 


Q Afil 19^ 




uipnospnomevaionaie occarpoxyiasg 




9Q9 


mevaionaie Kinase, puiauve 


C A (~1 1 10*7 
oAVJ 1 / 


4AQ 


sensor mstiaine Kinase 


Q A ri1 199 


999 


UJNA-Dinaing response regulator 


c AH1 lOO 


9H9 


GTP pyrophosphokinase family protein 


c Aril ian 


/C9 


nypotneucai protein 


oAuijj 1 


0*70 

y fy 


Jto protein 


C Aril 1*59 


14/C 


transcriptional regulator, MarR family, putative 


C AP1 *211 




5 ! -nucleotidase family protein r 


O A ni 11A 

oA<ai 3 oh 


1 IjC 

1 Jo 


polypeptide deformylase, putative v - 


oAuIjjj 




NADP-specific glutamate dehydrogenase. 




169 


membrane protein, putative " 


O A m la*? 


589 


ABC transporter, ATP-binding/permease protein 


oAVjrloJo 


579 


ABC transporter, ATP-binding/permease protein 


c a ni no 


157 


acetyltransferase, GNAT family 


C A ril 1/lfl 


622 


ABC transporter, ATP-binding protein 


» oavjt1041 


402 


polyA polymerase family protein 


c Am 1A9 


282 


DegV family protein 




126 


protein of unknown function 


C Aril 1/14 


177 hypothetical protein 


q a m 14^ 


164 


conserved hypothetical protein 


c Am i4£ 


654 


PTS system, fructose specific IIABC components 


Q Am 14*7 


303 


1-phosphofiructokinase 


C Aril 1A8 


247 


lactose phosphotransferase system repressor 


C Aril 14Q 


411 


beta-lactam resistance factor 


q Aril i^n 


544 


surface antigen-related protein 


q Aril 1^1 


307 


2-dehydropantoate 2-reductase, putative 


QAH1 1^9 


356 


regulatory protein, putative 


c Am 1^1 


330 


pyridine nucleotide -disulphide oxidoreductase family protein 


q Aril 1^4 

oAU 1 D DH 


251 


tRNA (guanine-N 1 )-methyltransferase 




172 


16S rRNA processing protein RimM 




503 


transcriptional regulator, RofA family 


O-tVVJ 1 JJ / 


80 


KH domain protein 


OxVVJ XJJO 


90 


ribosomal protein S16 




415 


permease, putative 




236 


ABC transporter, ATP-binding protein 




414 


conserved hypothetical protein 


SAG1362 


532 


carbamoyl-phosphate synthase, large subunit, putative 


SAG1363 


356 


carbamoyl-phosphate synthase, small subunit 


SAG1364 


173 


j>yrimidine operon regulatory protein 


SAG1365 


296 


ribosomal large subunit pseudouridine synthase, RluD subfamily 


SAG1366 


154 


lipoprotein signal peptidase 


SAG1367 


301 


transcriptional regulator, LysR family 


SAG1368 


94 


ribosomal protein L27 


SAG1369 


112 


conserved hypothetical protein 


SAG 1370 


104 


ribosomal protein L21 
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o Am 1*71 


39Z 


.— — — . : 

conserved hypothetical protein 


Q Am *l*7 r > 
oAUlJ /Z 


4U4 


thiamine biosynthesis protein Thil 


QAOI 1H1 

SAGi 5 lo 


lot 
381 


cysteine desulphurase 


SAG 13 74 


150 


conserved hypothetical protein 


SAG 13 75 


A A t\ 

449 


glutathione reductase 


C A 1 0*7*C 

SAG 13 76 


111 


conserved hypothetical protein 


C A 1 1*7*7 

SAG 13 77 


*> oo 

388 


cnonsmate synthase 


O A /"** 1 0*70 

SAG1378 


355 


3-dehydroquinate synthase 


SAG 13 79 


225 


3-dehydroquinate dehydratase 


SAG 13 80 


385 


conserved hypothetical protein 


O A 1 O O 1 

SAG1381 


714 


sulfatase 


SAG 1382 


119 


ribosomal protein L20 .' 


SAG1383 


66 


ribosomal protein L35 


SAG1384 


1 *r> 

176 


translation initiation factor IF-3 


SAG1385 


227 


cytidylate kinase 


O A y*« 1 ** O £ 

SAG1386 


174 


conserved hypothetical protein 


SAG1387 


65 


ferredoxin, 4Fe-4S 


SAG1388 


163 


conserved hypothetical protein 


' O A 1 *> OA 

SAG1389 : 


406 


peptidase T 


SAG1390 


544 


polysaccharide biosynthesis protein, putative 


SAG1391 


484 


UDP-N-acetylmuramoylalanyl^ 
ligase 


o a /~* t 0 ai 

SAG 13 92 


264 


iron compound ABC transporter, ATP-binding protein 


SAG 1393 


*> i f\ 
310 


iron compound ABC transporter, substrate-binding protein 


SAG 1394 


O /! 1 

341 


iron compound ABC transporter, permease protein 


c a i one 
SAG 13 95 


1 1 1 
333 


iron compound ABC transporter, permease protein 


SAG 1396 


*> 1 —t 
217 


conserved hypothetical protein 


C A /""» i o a*7 

SAG 1397 


Oil 

311 


inorganic pyrophosphatase, manganese-dependent 


SAG 1398 


262 


pyruvate foimate-lyase-activating enzyme 


c A o ao 
SAG 1399 


AAA 

444 


CBS domain protein 


OATI/I AA 

SAG 1400 


1 oo 
188 


conserved hypothetical protein 


C A /"II /f A1 

SAG 1401 


O 1 1 

311 


conserved hypothetical protein HGR0 1212 




*iii 
ZI3 


rArz ramily protem 


Q A rjl/IAO 


1 OA 


membrane protein, putative 


QAfJl A(\ A 


ino 


cell wall surface anchor family protein 




9 OA 


sortase family protein 




901 


sortase family protein 


o/VUrl*tU / 


/to 


cell wall surface anchor family protein 




QA1 


cell wall surface anchor family protein 


SAG1409 


NA 


rof>R lYroteiTi authentic frflTnp.ohi'ft 


SAG1410 


379 


glycosyl transferase, group 1 family protein 


SAG1411 


282 


glycosyl transferase, group 2 family protein 


SAG1412 


474 


polysaccharide biosynthesis protein 


SAG1413 


454 


membrane protein, putative i 


SAG1414 


308 


glycosyl transferase, group 2 family protein 


SAG1415 


311 


glycosyl transferase, group 2 family protein 


SAG1416 


352 


nucleotide sugar dehydratase, putative 


SAG1417 


240 


nucleotidyl transferase, putative 
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SAG1418 


274 


polysaccharide biosynthesis protein, putative 


SAG1419 


577 


ipoprotein, putative 


SAG1420 


117 


conserved hypothetical protein 

ft — : 


SAG1421 


243 


glycosyl transferase, group 2 family protein 


SAG1422 


313 


glycosyl transferase, group 2 family protein 


SAG1423 


384 


glycosyl transferase, putative 


SAG1424 


284 


dTDP-4-dehydrorhamnose reductase 


SAG1425 


113 


conserved hypothetical protein 


SAG 1426 


369 


] £NA polymerase sigma-70 factor 




602 


DNA primase 


<?AG1428 


125 


arge conductance mechanosensitive channel protein 


SAG1429 


58 


ribosomal protein S21 


<5AG1430 


167 


conserved hypothetical protein 


SAG1431 

u/\VJ X *r-J X 


268 


amino acid ABC transporter, amino acid-binding protein 


SAG1432 


347 


ammonium transporter family protein 


SAG1433 


375 


conserved hypothetical protein 






rhndanese familv nrotetn 




101 

XV X 


conserved hvnothetical Drotein * 




457 


fflvcerol-3-nhosobate transporter, nutative 


DAVJl*tJ / 




Vivnothetical irrotein 


^A014^R 


754 


fflvcoeen nhosnhofvlase - 


^AfrM^Q 


498 


4-alnha-fflucanotransfeTase 


^Afr1440 


342 


maltose oneron repressor MaUEL nutative 


9Afr1441 
Lj-rVvJ x t*r 1 


415 


maltose/maltodextrin ABC transporter, maltose/maltodextrin- 
bindine orotein 


SAG1442 


456 


maltose ABC transporter, permease protein 


SAG1443 


278 


maltose ABC transporter, permease protein 


SAG1444 

OA.VJ X III 


490 


nroton/nentide svmporter family protein 




NA 


MutT/nudix family protein, authentic frameshift 


SAG 1446 


' 62 


hypothetical protein 


9AG1447 


441 


conserved hvnothetical protein 


SAG1448 

uAvl X 1 rU 


502 


glycosyl transferase, group 1 family protein 


SAG1449 


795 


preprotein translocase SecA subunit, putative 


SAG1450 


330 


conserved domain protein 


SAG1451 


494 


conserved hypothetical protein 


SAG1452 


514 


conserved hypothetical protein 


SAG1453 


409 


preprotein translocase SecY family protein j 


SAG1454 


! 398 


glycosyl transferase, putative 


SAG 1455 


295 


elvcosvl transferase, group 2 family protein 


SAG1456 


NA 


glycosyl transferase, family 8, degenerate 


SAG1457 


129 


IS1381, transposase OrfB 


SAG1458 


127 


IS 1381, transposase OrfA 


SAG1459 


413 


glycosyl transferase family 8 


SAG1460 


401 


glycosyl transferase, family 8 


SAG1461 


335 


conserved hypothetical protein 


SAG1462 


970 


cell wall surface anchor family protein 


SAG1463 


NA 


transcriptional regulator, RofA family, authentic point mutation 


SAG1464 


663 


excinuclease ABC, B subunit 
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SAG1465 


306 


protease, putative 


SAG1466 


727 


glutamine ABC transporter, glutamine-binding protein/pennease 
protein 


SAG1467 


246 


glutamine ABC transporter, ATP-binding protein, GlnQ putative 


SAG1468 


116 


conserved hypothetical protein 


SAG1469 


52 


conserved hypothetical protein 


SAG1470 


. 437 


GTP-binding protein, GTPl/Obg family 


SAG1471 


42 


conserved hypothetical protein j 


SAG1472 


413 


aminopeptidase PepS 


SAG1473 


192 


cell wall surface anchor family protein ^ 


SAG1474 


680 


amidase family protein 


SAG1475 


240 


ribosomal small subunit pseudouridine synthase A 


SAG1476 


280 


oxidoreductase, aldo/keto reductase family 


SAG 1477 


224 


nitroreductase family protein 


SAG1478 


130 


lactoylglutathione lyase 


SAG1479 


308 


glycosyl transferase, group 2 family protein 


SAG1480 


462 


amino acid permease 


SAG1481 


155 


SsrA-binding protein 


SAG1482 " v 


801 


exoribonuclease, VacB/Rnb family 


SAG 1483 


78 


preprotein translocase, SecG subunit 


SAG1484 


48 


ribosomal protein L3 3 


SAG1485 


389 


multi-drug resistance protein 


SAG1486 


548 


membrane protein, putative 


SAG1487 


233 


ABC transporter, ATP binding protein 


SAG1488 


195 


dephospho-CoA kinase 


SAG1489 


273 


foimanridopyrimidine-DNA glycosylase 


SAG1490 


282 


transcriptional regulator, MutR family 


SAG1491 


530 


hypothetical protein 


SAG1492 


58 


hypothetical protein 


SAG1493 


66 


hypothetical protein 


SAG1494 


32 


hypothetical protein 


SAG1495 


81 


CAAX amino terminal protease family protein 


SAG1496 


110 


hypothetical protein 


SAG1497 


37 


hypothetical protein 


SAG1498 


133 


hypothetical protein 


SAG1499 


299 


GTP-binding protein Era 


SAG1500 


132 


diacylglycerol kinase 


SAG1501 


161 


conserved hypothetical protein TIGR00043 


SAG1502 


268 


tetracenomycin polyketide synthesis O-methyltransferase TcmP, 
putative 


SAG1503 


39 


hypothetical protein 


SAG1504 


38 


hypothetical protein 


SAG1505 


158 


MutT/nudix family protein 


SAG1506 


267 


hypothetical protein 


SAG1507 


345 


PhoH family protein 


SAG1508 


590 


67 kDa Myosin-crossreactive streptococcal antigen 


SAG1509 


71 


conserved hypothetical protein 


SAG1510 


169 


peptide methionine sulfoxide reductase 
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SAG1511 


284 


conserved hypothetical protein 


SAG1512 


185 


ribosome recycling factor 


SAG1513 


242 


uridylate kinase 


SAG1514 


226 


peptide ABC transporter, ATP-binding protein 


SAG1515 

U^XV_J X «^ X «^ 


262 


peptide ABC transporter, ATP-binding protein 


SAG1516 


255 


Deotide ABC transDorter neimease nrotein 


SAG1517 


314 


peptide ABC transporter, permease protein 


SAG1518 


538 


peptide ABC transporter, pepti de-binding protein 


SAG1519 


229 


ribosomal nrotein LI 


SAG1520 


141 


ribosomal nrotein LI 1 


SAG1521 


388 


transnosase IS30 familv mutative 


SAG1522 


460 


transD orter maior facilitator familv 


SAG 1523 


404 


neotidase M20/M25/M40 familv 

pwpUUIlOV) XT J ft\JI AY 1 i(J/ 1V1 i\# XvUX&XXJr 


SAG1524 


294 


transcrintional regulator LvsR familv 


SAG1525 


117 


conserved hypothetical protein 


SAG1526 


178 


TS861 transDosase OrfA 


<5 A Gl 527 


277 


TS861 transnosase OrfR 

XXJ \J\J X y UfUlQ^UiKlOv V./XXX-* 


SAG1528 


571 


chorismate binding enzyme 


<5Afr1S?Q 


Olv 


x ioxv opuiiiiy xdixXxiy yjx \j iw/iix 






t-» ^sfrri \/l —m*nl \/1 franc iCAmpracp f*vf*lr*TVl^ilit , i«.fvr»P» 
' |J*5|-FlHJ.jr 1 l^iuijf I Olo Llcxllo loUiiivlaoC) vjr w4UjJxlixixl~ljrJJw 


OAUl JJ 1 


011 


-IxlClxlgClxlGoC ADVj UallbpdX ICI, pCIIlICdoC \JX\JVGlxx 




XiJO 


mfHiciifi^Qi* ARC* iTsiTicnriTfpT* A ' 1 *P ~hinfli*Ti tr i>TAti*in 

xlxuxiguxxtsOV/ AJJv UCUlajJUxlGx, jTV. A J7 "UlUlUIlg |sxvPLwxxl 


OrVVJ LJJJ 




msi'no'anpQf* ARf^ tm n onnrfpr man O'anpcjft-ViinHin or afUiRcirvn 

JUAwAlgjttxlWqiw iXUv/ uaixoLJlsXlAvL, UlaUgOlICSw UliiulUg ciaxijasoiajxi 
XI LsXVJ Lviii 


SAG1534 


215 


■Ton-dtvnendent transcTTntional refnilatoT 


SAG1535 


229 


5-mefJivlthioadenosine nucleosidase/S-adenosvlhomocvsteine 
nucleosidase 

A1UV1 VVCIUUUV 


SAG1536 


89 


conserved hvDOthetical nrotein 


SAG1537 


184 


MutT/nudix family protein 


SAG1538 


459 


UDP-N-acetyl glucosamine pyrophosphorylase 


SAG1539 


31 


hvDOthetical nrotein 


SAG 1540 


137 


conserved hypothetical protein 


SAG1541 


125 


glyoxalase family protein 


SAG1542 


318 


oxidoreductase, Gfo/Idh/MocA family 


SAG1543 


NA 


conserved hypothetical protein, authentic frameshift 


SAG1544 


232 


gluconate 5-dehydrogenase, putative 


SAG1545 


78 


conserved hypothetical protein 


SAG1546 


82 


conserved hypothetical protein 


SAG1547 


166 


acetyltransferase, GNAT family 


SAG1548 


422 


glycosyl transferase, group 2 family protein 


SAG1549 


127 


IS 1381, transposase OrfA 


SAG1550 


129 


IS1381, transposase OrfB 


SAG1551 


67 


hypothetical protein 


SAG1552 


719 


conserved hypothetical protein 


SAG1553 


477 


hypothetical protein 


SAG1554 


225 


hypothetical protein 


SAG1555 


231 


hypothetical protein 


SAG1556 


445 


branched-chain amino acid transport system II carrier protein 
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o/VVjrl D j / 




meimonyi-uviNA syntnetase 


oAGl DDo 


zyi 


tellurite rests tance protein i cod 




ZJI 


memorane protein, puianve 


CApl ££A 

SAG15O0 


/1A 


hypothetical protein 


SAG 1561 


405 


rib system, uc component, putative 


SAG 15 62 


Z80 


conserved hypothetical protein 


SAG 1563 


2/5 


exodeoxyribonuclease 


SAG1564 


11Q 
1 1<$ 


conserved hypothetical protein 


SAG 1565 


1 CO 

15o 


methylated-DNA— protein-cysteine S-methyltransferase 


SAJj1566 


393, 


D-isomer specific 2-hydroxyacid dehydrogenase family protein 


SAG 1567 


182 


acetyltransterase, GNA1 tamily 


SAG1568 


XT A 

NA 


phosphoserine aminotransferase, authentic frameshift 


SAG 1569 


211 


copper homeostasis protein CutC, putative 


SAG 1570 


34 


conserved hypothetical protein 


SAG15/1 


53 


hypothetical protein 


SAG 1572 


28/ 


tetrapyrrole methy lase family protein 


SAG 1.573 


1 AO 

108 


conserved hypothetical protein 


SAG1574 


287 


DNA polymerase HI, delta prime subunit, putative 


SAG 1575 


211 


thymidylate kinase 


SAG 1576 


267 t 


transposase, IS30 family, putative, truncation 


SAG 1577 


219 


AcuB family protein 


O A 1 CTO 

SAG1578 


236 


branched-chain amino acid ABC transporter, ATP -binding protein 


SAG1579 


254 


branched-chain amino acid ABC transporter, ATP-binding protein 


SAG 1580 


317 


branched-chain amino acid ABC transporter, permease protein 


SAG1581 


OOA 

289 


branched-chain amino acid ABC transporter, permease protein 


SAG 1582 


388 


branched-chain amino acid ABC transporter, amino acid-binding 
protein 


SAG 15 83 


01 
81 


conserved hypothetical protein 


O A fll CO/f 

oAuuo4 


Oil 


XSi54o, transposase 


oAG15o5 


190 


ATP-dependent Clp protease, proteolytic subunit ClpP 


SAG 1586 


OAA 

209 


uracil phosphoribosyltransferase 




-3QQ 

3o9 


aminotransferase, , class I 


c Aril ^oo 


152 


jxin a memyitiansierase, 1 rmxi iamny, group z 




4DU 


ammo acia permease, puianve 


CAfJI ^Qfi 




potassium uptake protein, xrK iamny 


oAVjrlOS'X 


A/7C 

4/5 


canon uptaice protein, jtk iamny 


oAu i dvz 


©J 


conserveu. nypoineucai protein 1 lvjivuoz / o 




Z4U 


noosomdi large suounit pseuaouriaine syntnase t> 






conserved nypoineucai protein i ivjjtvuuzo 1 


SAG1595 


235 


conserved hvoothetical nrotein - 


SAG1596 


246 


integrase/recombinase, phage integrase family 


SAG1597 


157 


CBS domain protein 


SAG1598 


173 


conserved hypothetical protein 


SAG1599 


324 


HAM1 protein 


SAG1600 


264 


glutamate racemase 


SAG1601 


79 


conserved hypothetical protein 


SAG1602 


180 


membrane protein, putative 


SAG1603 


173 


transcriptional regulator, biotin repressor family 
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SAG1604 


229 


membrane protein, putative 


SAG1605 


167 


conserved hypothetical protein. 


SAG1606 


247 


RNA methyltransferase, TnnH family 


SAG1607 


92 


acylphosphatase 


SAG1608 


310 


lipoprotein, putative 

— * Jl » r . . 


SAG1609 


221 


amino acid ABC transporter, permease protein 


SAG1610 


285 


amino acid ABC transporter, substrate-binding protein 


SAG1611 


486 


amidase family protein 


SAG1612 


160 


transcription elongation factor GreA 


SAG1613 


600 


conserved hypothetical protein 


SAG1614 


167 


acetyltransferase, GNAT family 


SAG1615 


443 


UDP-N-acetylmuramate~alanirie ligase 


SAG1616 


205 


conserved hypothetical protein 


SAG1617 


32 


hypothetical protein 


SAG1618 


1032 


Sn£2 family protein 


SAG1619 


377 


IS 1548, transposase 


SAG1620 


436. 


phosphoglycerate dehydrogenase-related protein 


SAG1621 


300 


primosomal protein Dnal 


SAGf622 


391 


conserved hypothetical protein 


SAG1623 


159 


conserved hypothetical protein TIGR00244 * 


SAG1624 


501 


sensor histidine kinase CsrS 


SAG1625 


229 


DNA-binding response regulator CsrR 


SAG1.626 


177 


conserved hypothetical protein 


SAG1627 


296 


heat shock protein HtpX 


SAG 1628 


184 


lemA protein 


SAG1629 


237 


glucose-inhibited division protein B 


SAG1630 


459 


sodium transport family protein 


SAG1631 


223 


potassium uptake protein, Trk family, putative 


SAG1632 


276 


cobalt transport family protein 


SAG1633 


558. 


ABC transporter, ATP-binding protein 


SAG1634 


. 212 


conserved hypothetical protein 


SAG1635 


402 


sodium:dicarboxylate symporter family protein 


SAG1636 


455 


branched-chain amino acid transport system II carrier protein 


SAG1637 


351 


alcohol dehydrogenase, zinc-containing 


SAG 163 8 


230 


ABC transporter, permease protein 


SAG1639 


356 


ABC transporter, ATP-binding protein j 


SAG 1640 


458 


peptidase, M20/M25/M40 family 


SAG1641 


274 


YaeC family protein 


SAG1642 


277 


ABC transporter, substrate-binding protein 


SAG1643 


229 


glutamine amidotransferase, class I 


SAG1644 


37 


hypothetical protein 


SAG1645 


238 


conserved hypothetical protein TIGR01033 


SAG1646 


32 


hypothetical protein 


SAG1647 


328 


dihydroxyacetone kinase family protein 


SAG1648 


178 


transcriptional regulator, TetR family, putative 


SAG1649 


37 


hypothetical protein j 


SAG 1650 


329 


dihydroxyacetone kinase family protein 


SAG1651 


192 


dihydroxyacetone kinase family protein ! 
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SAG 1652 


124 


conserved hypothetical protein 


SAG 1653 


237 


glycerol uptake facilitator protein 


SAG1654 


134 


conserved hypothetical protein 


SAG1655 


237 


transcriptional regulator, MerR family 


SAG1656 


369 


conserved hypothetical protein 


SAG1657 


83 


hypothetical protein 


SAG 1658 


244 


conserved hypothetical protein 


SAG1659 


118 


iojap-related protein 


SAG1660 


173 


isochorjsmatase family protein 


SAG1661 


195 


conserved hypothetical protein TIGR00488 


SAG1662 


210 


conserved hypothetical protein TIGR00482 


SAG1663 | 


105 


conserved hypothetical protein TIGR00253 


SAG1664 


372 


GTP-binding protein 


SAG1665 


177 


hydrolase, haloacid dehalagenase-like family 


SAG1666 


304 


membrane protein, putative 


SAG1667 


480 


glutamyl-tRNA(Gln) amidotransferase, B subunit 


SAG1668 


488 


glutamyl-tRNA(Gln) amidotransferase, A s subunit 


SAG1669 


100 


glutamyl-tRNA(Gln) amidotransferase, C subunit 


SAG1670 - 


881 


pyruvate phosphate dikinase 


SAG1671 


276 


protein of unknown function 


SAG1672 


170 


CBS domain protein 


SAG1673 


321 


3-hydroxyacyl-CoA dehydrogenase family protein 


SAG1674 


182 


isochorismatase family protein 


SAG1675 


261 


transcriptional regulator CodY, putative 


SAG1676 


403 


aminotransferase, class I 


SAG1677 


150 


conserved hypothetical protein 


SAG1678 


460 


hydrolase, haloacid dehalogenase-like family 


SAG1679 


320 


asparaginase family protein 


SAG1680 


292 


shikimate 5-dehydrogenase 


SAG1681 


304 


oxidoreductase, aldo/keto reductase family 


SAG1682 


671 


ATP-dependent DNA helicase RecG 


SAG1683 


512 


immunogenic secreted protein, putative 


SAG1684 


366 


alanine racemase 


SAG1685 


119 


holo-(acyl-carrier-protein) synthase 


SAG1686 


335 


phospho-2-dehydro-3-deoxyheptonate aldolase 


SAG1687 


842 


preprotein translocase, SecA subunit 


SAG1688 


315 


mannose-6-phosphate isomerase, class I 


SAG1689 


293 


fructokinase 


SAG1690 


639 


PTS system, HABC components 


SAG1691 


479 


sucrose-6-phosphate hydrolase 


SAG1692 


320 


sucrose operon repressor ScrR 


SAG1693 


144 


N utilization substance protein B 


SAG1694 


129 


conserved hypothetical protein 


SAG1695 


186 


translation elongation factor P 


SAG 1696 


38 


hypothetical protein 


SAG1697 


48 


hypothetical protein 


SAG 1698 


99 


conserved hypothetical protein 


SAG1699 


30 


hypothetical protein 
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SAG1700 


76 


hypothetical protein 


SAG1701 


56 


hypothetical protein 


SAG1702 


41 


hypothetical protein 


SAG1703 


54 


hypothetical protein 


SAG1704 


150 


cytidine/deoxycytidylate deaminase family protein 


SAG1705 


NA 


peptidase, M24 family, authentic point mutation 


SAG1706 


238 


conserved hypothetical protein 


SAG1707 


499 


drug resistance transporter, EmrB/QacA family 


SAQ1708 


38 


hypothetical protein 


SAG1709 


942 


excinuclease ABC, A subunit 


SAG1710 


223 


conserved hypothetical protein 


SAG1711 


314 


magnesium transporter, CorA family 


SAG1712 


. 79 


ribosomal protein S 1 8 


SAG1713 


163 


single-strand binding protein 


SAG1714 


95 


ribosomal protein S6 * 


SAG1715 


374 


A/G-specific adenine glycosylase 


SAG1716 


197 


transcriptional regulator, Cro/CI family 


SAG1717 


104 


thioredoxin 


SAG1718 


166 


PAP2 family protein 


SAG1719 


779 


MutS2 family protein . 


SAG1720 


180 


conserved hypothetical protein 


SAG1721 


103 


conserved hypothetical protein 


SAG1722 


297 


ribonuclease Hm 


SAG1723 


197 


signal peptidase I 


SAG1724 


806 


helicase, putative 


SAG1725 


160 


conserved hypothetical protein 


SAG1726 


364 


DNA-damage-inducible protein P 


SAG1727 


770 


formate acetyltransferase 


SAG1728 


124 


FMN-binding protein j 


SAG1729 


309 


conserved hypothetical protein j 


SAG1730 


251 


conserved hypothetical protein 


SAG1731 


298 


membrane protein, putative 


SAG1732 


282 


glycerol uptake facilitator protein, putative j 


SAG1733 


150 


universal stress protein family 


SAG1734 


400 


transporter, putative 


SAG1735 


219 


transcriptional regulator, Crp/Fnr family 1 


SAG1736 


761 


X-pro dipeptidyl-peptidase 


SAG1737 


119 


hypothetical protein 


SAG1738 


326 


polyprenyl synthetase family protein 


SAG1739 


582 


ABC transporter, AlP-binding protein CydC 1 


SAG1740 


572 


ABC transporter, ATP-binding protein CydD 


SAG1741 


339 


cytochrome d ubiquinol oxidase, subunit II 


SAG1742 


475 


cytochrome d oxidase, subunit I 


SAG1743 


402 


pyridine nucleotide-disulphide oxidoreductase family protein 


SAG1744 


299 


prenyltransferase, UbiA family 


SAG1745 


148 


hypothetical protein 


SAG1746 


35 


hypothetical protein 


SAG1747 


99 


conserved hypothetical protein TIGR00103 
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oize 


^vDIIU l^M II U 11 


^Afxl 74R 




/ % vf*1/*rtYrfYn5*Tif*—'fji tfv-.fi f \/I -TVhriQTVholTrnH cvntVia qp 
isiopi opaixcxatijr ~ttv y i~piioopuwj*.xpxv* sty iiiuaow 


^Afrl74Q 


74.1 

Z*tl 


uallolslipilOllal lCguiatol, lllwixv Aaxiiiiy 


q Afii7*;fi 


17J 


(/AUUUv/lCaoC 


QAfii7*;i 


1 7R 
1 /o 


V/OHSCi VCU IiypwlXlCUWal piUiClll 


c AHI 7<7 




conscrvcQ nyp omecicai proicin 1 ivxxvv/uz / j 


QArji 7^*1 
o/\.vJl / jj 


ZOU 


conserveu nypoineucai pioiem 


o/\vjrl /3*f 


CO 

07 


xioosomai proiein oif 


oAvll /-> 3 


^R 

JO 


nypoin.cQ.cai proicin 


O/WJl /DO . 


*141 


conservco.nypoin6u.cai protein 


c Am 7<7 


jjO 


vj-siaiogiycoproiein enaopepaoase ianniy protein 


oAul / jo 


1 jj 


riDOSOmai-proxein-aiaiiine aneiyitransieiase, puiauve 






protein or uiiKnown iuncnon 


o a rii nfx\ 
oiVkJl /ou 


/O 


conservea nypomencai protein * , . 


o Am 7Ai 




meiaiio-Deia'-iactaniase supenamny proxem 


q Arii7A7 

o/VvTl /OZ 


1 AO 

iojj 


conservea nypotneucai protein 


o/VVJl /OJ 


448 


giutamine syntnetase, type 1 


o/VVJl /O-t 




transcriptional regulator ^iniv 


C AC1 7£*I 
oAvJl /OD 


1 70 


conservea nypomencai protein 


Q Ani ^/C/C 

OiVvJi /OO 


J£*0 


p no spnogiy cerate Kinase 


c Am n&n 
o/vvyi /o/ 


7RO 


aciQ pnospnatase 


CAfJI 7£Q • 
oAul /Oo 


ooo 


giyceraiaenyae j -pnospnate aenyurogenase 


Q Am IfkQ 


0!/Z 


translation eiongauon iactor vj 


oAlJl / /U 


1 DO 


lioosomai protein o / 


q Aril 771 


1 ^7 


rioosomai protein o iz 


Q Aril 7*70 
o/WJl / /Z 


970 
Z /v 


pur operon repressor 


Q Aril 77^ 




nu_y aomain protein 


Q Aril 774 


*+Z*T 


conservea nypuuiciioai pruicin 


Q Aril 77-1 


Z1U 


cunservea nypouiciivai proicin 


QAfil 77£ 
oAUl / / O 


990 


nuuiose~pnospnatc o -cp unerase 


o Aril 777 


7 on 


conservea nypoinciicai protein x xvjjvoo ij/ 


QAfil 77ft 
oAul / /o 


9R3 


rivLN^v ^guannrc'iN i *y~nxciny iuansxciaoc 9 puutuvc 


QAfi1 770 


700 

Z.-70 


uunctnyiaoenooinc ixctubicxaoc 


c Arii7Rn 


ioj 


iiypotneiicai protein 


QAfr17R1 

OAU 1 / 0 1 


IRfi 
1 oo 


piiina.bc~icia.teo pxotciu 






UCUAjllUUnUOlCaDC) A <X\XJ XOllllljr 


^A(r17R^ 


90 

^o 


iijrpouictlV'al pxoiciu 


QAfr17R4 
OrVVJ 1 / o-r 


1^0 


ujrpotiictieai protein 


c Aril 7C^ 


4^0 


iiypouxcticai protein 


^%AG1 786 




pi\JLWlU \J». UlllWllvVVlX J.UX1VUAJI1 


SAG1787 


420 


dltD orotein 


SAG1788 


79 


D-alanyl carrier protein 


SAG1789 


421 


dltB protein 


SAG1790 


511 


D-alanine-activating enzyme 


SAG1791 


395 


sensor histidine kinase 


SAG1792 


224 


DNA-binding response regulator 


SAG1793 


44 


ribosomal protein L34 


SAG1794 


451 


membrane protein, putative 


SAG1795 


388 


transposase, IS30 family, putative 
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SAG1796 


575 


amino acid ABC transporter, permease protein 


SAG1797 


407 


amino acid ABC transporter, ATP-binding protein 


SAG1798 


39 


hypothetical protein 


SAG1799 


792 


xylulose-5-phosphate/fructose-6-phosphatephosphoketolase 


SAG1800 


363 


conserved hypothetical protein 


SAG1801 


559 


transcriptional antiterminator, BglG family 


SAG1802 


253 


conserved hypothetical protein 


SAG1803 


505 


carbohydrate kinase, FGGY family 


SAG1804 


329 


hypothetical protein 


SAG1805 


483 


PTS system, DC component, putative 


SAG1806 


318 


glyoxylate reductase, NADH-dependent 


SAG1807 


339 


hypothetical protein 


SAG1808 


327 


sugar binding transcriptional regulator, Lad family 


SAG1809 


215 


transaldolase family protein 


SAG1810 


238 


carbohydrate isomerase, AraD/FucA family 

i. : — i , 


SAG1811 


287 


hexulose-6-phosphate isomerase, putative 


SAG1812 


221 


hexulose-6-phosphate synthase, putative 


SAG1813 


161 


PTS system, HA component 


SAG1814 


92 


PTS system, IEB component 


SAG1815 


479. 


transport protein SgaT, putative 


SAG1816 


205 


hypothetical protein 


SAG1817 


157 


hypothetical protein 


SAG1818 


430 


adenylosuccinate synthetase 


SAG1819 


340 


perfringolysin O regulator protein 


SAG1820 


224 


conserved hypothetical protein 


SAG1821 


750 


glutamate— cysteine ligase/amino acid ligase, putative 


SAG1822 


272 


protein of unknown function 


SAG1823 


418 


protein of unknown function 


SAG1824 


291 


chaperonin, 33 kDa 


SAG 1825 


325 


NifR3/Smml family protein 


SAG1826 


213 


depxynucleoside kinase family protein 


SAG1827 


163 


phosphinothricin N-acetyltransferase 


SAG1828 


815 


ATP-dependent Clp protease, ATP-binding subunit 


SAG1829 


154 


transcriptional regulator CtsR 


SAG1830 


153 


conserved hypothetical protein 


SAG1831 


346 


translation elongation factor Ts 


SAG1832 


256 


ribosomal protein S2 


SAG1833 


186 


alkyl hydroperoxide reductase, subunit C 


SAG1834 


510 


alkyl hydroperoxide reductase, subunit F 


SAG1835 


134 


conserved hypothetical protein 


SAG1836 


61 


conserved hypothetical protein 


SAG1837 


468 


prophage LambdaSa2, lysin, putative 


SAG1838 


109 


prophage LambdaSa2, holin, putative 


SAG1839 


136 


conserved hypothetical protein 


SAG 1840 


112 


hypothetical protein 


SAG1841 


76 


conserved domain protein 


SAG1842 


1224 


prophage LambdaSa2, PblB, putative 


SAG1843 


240 


conserved hypothetical protein 
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vj aj? 




J\.MIJL1%J UtUUU 

/ 


SAG1844 


911 


rem server! Vivnntlif»fip>Al rwwteiti 


SAG1845 


42 


nvtiotTietiral nrotf*in 


SAG 1846 


15R 


VjvnotVifitipal f>rntfiin 

UJfUvUlvUvAl r -1X1 


<5AG1R47 


977 


vUuoCX VvU liypUUICllVcil piLrlClll 


^AG1R4R 


1 Id 
1 X*T 


wUlloClYvU IljrpvJLaCUUal piUlClU 


o AG! R4Q 


1 1J 


nypuuieuuax pioicin 


^AGIRSO 


101 


IiypUlIlCL10<il piVJictix 


SAG1851 . 


111 


conserved domain protein 






conservea aomain proten^i 




i rh 


propnage i^mDaaoaz, protease, puiauve 


q Am R^A 


joU 


conservea nypotneucai protein 




^7n 


propnage i^amDaaoaz, lernunase large suounit, putative 


QAm R^ 


101 


nypouieucai protein • 




1 1 o 


propnage l^arnoaaoax, ruNxi enaonuciease ramny protein 


QAOIR^R 


*yo 


nypotneucai protein 


QAfJIRSQ 
i>-rVVJ 1 OJ7 


1 Rfi 


propnage i^mouaoaz, sne-spcciiic recomoinase, pnage integrase 

icuixxiy 


^ AG! R60 


1 S4 


V^UlxoCl VCU xx^pUlxlCUv^cIl pxULCxIl 


SAG1861 


119 


prophage LambdaSa2, traiiscriptioixal regulator, Cro/CI family 


QAmR*\7 


R£ 


nypotneucai protein 


QAm r**'* 


I^R 


piopiia.ge LainDaaodZ, singie-suana oinuing protein 


SAG1864 


68 


hypothetical protein 


DAni r<< 


HA 


conservea nypotneucai protem 


C Am si(z& 

O/VvJ 1 oOO 


i no 


conservea nypotneucai protem ' 


Q Am R£*7 


i ai 


conserved hypothetical protein 


c Am R£R 


1 *\A 


hypothetical protein 


q Am RAO 


*tJ 1 


prophage LambdaSa2, type H DNA modification 
metnyi uonsierase, puiauve 


CAm R70 


Z* / D 


propnage LainoQaoaz, urs/\ repncauon protein L/nav^ 5 puiauve 


^AG1R71 


74 R 


t^tot%1i a or** T o rntaH aQaO V\o /-»-f-/i-f*i/^T\li!^ erf* r£*T\\if~*Ck'tir\T\ 
pAUpilagC xU«<iIUUUdi3aZ> 9 UclulCIlUpiulgC ICpilL/dLlUH 

TiTotftin/hvnf\'rti^Hf*ji1 ntrfctpifi tn in njifion/fiicinTi 

JJXUluiLI/ liy LJUUlCUwal pXl/LwliX, UULAwC&llVJlX/XUdllJAl 


SAG1872 


200 


i*ivnnthRtiP5il v\rc\tMT\ 
uypLiixxdXwAi pi v iL/iii 


SAG 1873 


443 




SAG 1874 


87 


livnntnptipal nfotpiti 

Ujr LIUUlvUUOl pAULwXll 


SAG1875 


94 


coTi*ierveH VivnntVieticfll iirntRin 

l*> AJOksI. V vU lijrpUUlwUval UL^/XIJI 


SAG 1876 


176 


•rvrf\r\rt o erf* T j»tnViiljiRa7 TTMH ^TiHrttiiiplpsiQ^* "fifunilv t\tai"^iti 


SAG1877 


236 


prophage LambdaSa2, antirepressor protein, putative 


SAG 1878 




vuuovivcu VAviixiaui piv/icm 


SAG1R7Q 


156 


riVT>r\'f"li«a+ir*a1 Tymtf* i t\ 

uypijuieuvai pivjiciix 


SAG1880 


54 


hypothetical protein 


SAG1881 


51 


hypothetical protein 


SAG1882 


120 


prophage LambdaSa2, repressor protein, putative 


SAG1883 


128 


conserved hypothetical protein 


SAG1884 


134 


hypothetical protein 


SAG1885 


356 


prophage LambdaSa2, site-specific recombinase, phage integrase 
family 


SAG1886 


32 


hypothetical protein 


SAG1887 


689 


Na+/H+ exchanger family protein 
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SAG1888 


78 


hypothetical protein 


SAG1889 


317 


microcin immunity protein MccF, putative 


SAQ1890 


631 


endopeptidase O 


SAG1891 


327 


oxidoreductase, Gfo/Idh/MocA family 


SAG1892 


358 


membrane protein, putative 


SAG1893 


59 


hypothetical protein 


SAG1894 


214 


cyclic nucleotide-binding domain protein 


SAG1895 


204 


polypeptide deformylase 


SAG1896 


333 


sugar binding transcriptional regulator RegR 


SAG1897 


634 


conserved hypothetical protein «, 


SAG1898 


271 


PTS system, HD component 


SAG1899 


288 


PTS system, EC component 


SAG1900 


164 


PTS system, HB component 


SAG1901 


398 


glucuronyl hydrolase 


SAG1902 


144 


PTS system, HA component 


SAG1903 


34 


hypothetical protein 


SAG1904 


270 


oxidoreductase short-chain dfinvdroffena^e/reHiiptAQfi familv 


SAG1905 


212 


conserved hypothetical protein 


SAG1906 


335 


carbohydrate kinase, PfkB family 


SAG1907 


212 


2-dehvdro-3 -deoxvohosoho gluconate aldolase/4-hvdroxv-2- 
oxoglutarate aldolase * 


SAG1908 


499 


hypothetical protein 


SAG1909 


204 


nitroreductase family protein 


SAG1910 


141 


transcriptional regulator, MarR family 


SAG1911 


1468 


DNA polymerase HI, alpha subunit, Gram-positive type 


SAG1912 


194 


N-acetylmuramoyl-L-alanine anjidase, family 4 protein 


SAG1913 


617 


prolyl-tRNA synthetase 


SAG1914 


419 


membrane-associated zinc metalloprotease, putative 


SAG1915 


264 


phosphatidate cytidylyltransferase 


SAG1916 


250 


undecaprenyl diphosphate synthase 


SAG1917 


113 


preprotein translocase, YajC subunit 


SAG1918 


114 


bacteriocin transport accessory protein, putative 


SAG1919 


387 


malate oxidoreductase 


SAG1920 


445 


citrate carrier protein, CCS family 


SAG1921 


508 


sensor histidine kinase 


SAG1922 


229 


response regulator 


SAG1923 


331 


UDP-glucose 4-epimerase 


SAG1924 


535 


glucan 1,6-alpha-glucosidase 


SAG1925 


377 


sugar ABC transporter, ATP-binding protein 


SAG1926 


283 


helix-turn-helix domain protein, fis-type 


SAG1927 


298 


lacX protein 


SAG1928 


325 


tagatose 1,6-diphosphate aldolase 


SAG1929 


310 


tagatose-6-phosphate kinase 


SAG1930 


171 


galactose-6-phosphate isomerase, LacB subunit 


SAG1931 


141 


galactose-6-phosphate isomerase, LacA subunit 


SAG1932 


816 


neuraminidase-related protein 


SAG1933 


482 


PTS system, UC component, putative 


SAG1934 


101 


PTS system, HB component, putative 
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SAG 193 5 


157 


Jr i o system, iia component, putauve 


SACj193o 


25o 


lactose phosphotransferase system repressor 


SAG1937 


XT A 

NA 


streptococcal histidine triad family protein, degenerate 


SAG1938 


307 


adhesion lipoprotein 


SAG1939 


147 


protein or unknown function 1 1GK0U256 


SAG1940 


738 


GTP pyrophosphokinase family protein 


O A ✓"I -f f* A 1 

SAG1941 


800 


X ,3* -cyclic-nucleotide *V -phosphodiesterase 


ft A * — "* 4 r\ A <*» 

SAG 1942 


151 


nrdl, protein 


SAG1943 


345 


conserved hypothetical protein 


SAG1944 


165 


conserved hypothetical protein 


ft A * rt ii P 

SAG1945 


345 


iron ABC transporter, iron-binding protein 


SAG1946 


257 


DNA-binding response regulator 


SAG1947 


549 


conserved hypothetical protein 


SAG1948 


275 


PTS system, HD component 


SAG 1949 


269 


PTS system, EC component 


SAG1950 


163 


PTS system, IIB component 


SAG1951 


141 


PTS system,. DA component, putative 


SAG1952 


353' 


membrane protein, putative 


SAG1953 


60 


hypothetical protein 


SAG1954 


384 


membrane protein, putative 


ft A v™i ^ f 

SAG1955 


282 


ABC transporter, ATP-bihding protein 


SAG 1956 


96 


conserved hypothetical protein, truncation 


SAG 1957 


250 


response regulator 


SAG1958 


276 


conserved hypothetical protein 


SAG1959 


727 


PTS system, IIABC components 


SAG 1960 


551 


sensor histidine kinase 


SAG1961 


<*s\f 
225 


phosphate regulon response regulator PhoB 


ft A 1 A^rt 

SAG 1962 


218 


phosphate transport system regulatory protein PhoU, putative 


SAG 1963 


253 


phosphate ABC transporter, ATP -binding protein 


SAG 1964 


292 


phosphate ABC transporter, permease protein 


SAG 1965 


281 


phosphate ABC transporter, permease protein 


SAG1966 


293 


hemolysin precursor, putative 


SAG 1967 


195 


hypothetical protein 




Z4o 


conserved nypotneticai protein i ivjKUUU4o 


bAljl9o9 


31 / 


ribosomal protein LI 1 methyltransferase 


SAG 197 1) 


1 AO 


conserved hypothetical protein 


C A /"» 1 ATI 

SAG 1971 


A 1 

41 


hypothetical protein 


SAG 1972 


i HQ 

Z3o 


transcriptional regulator, MerR family 


SAG19/3 




acetyitransierase, vjjnai xamny 


o/VVJ 17/*t 




IVIUVI/IIUIAIA. lCUlilijr JJIULCHI 


SAG1975 


47 


hypothetical protein 


SAG1976 


156 


conserved hypothetical protein 


SAG1977 


163 


acetyltransferase, GNAT family 


SAG1978 


422 


ATPase, AAA family 


SAG1979 


253 


membrane protein, putative 


SAG1980 


300 


ABC transporter, ATT-binding protein 


SAG1981 


68 


hypothetical protein 


SAG 1982 


359 


transcriptional regulator, Cro/CI family 
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SAG 1983 


105 


conserved hypothetical protein 


SAG1984 


188 


conserved hypothetical protein TIGR00730 


SAG1985 


51 


hypothetical protein 


SAG1986 


375 


site- specific recomhinase ohaee inte erase familv 


SAG 1987 


61 


conserved hvnothetical nrotein 


SAG1988 


342 


■ conserved hvoothetical nrotein 


SAG 1989 


139 


hvoothetical nrotein * 


SAG 1990 


.127 


hvoothetical nrotein 


SAG1991 


204 


transcriptional regulator Cro/OT "familv 


SAG1992 

UX XX„J A ✓ Xtf 


518 


nrotein of unknown function 

UAVIVUl V/X UUIkUV ¥T XX lUUvllUU 


SAG1993 


373 


site-snecific recomhina^e iVhflO'ft intearnQP fnrnilv 


SAG1994 


108 


conserved hvoothetical nrotein 


SAG 1995 

ha/A xv^ x — ^ *y 


210 


hvoothetical nrotein 

XX T L/ V VII. W LlvUl ULU IVU1 


SAG1996 


263 


cell wall snrface anchor familv nrnfp.in mitntivp 

vwll tt <XXX uUiiUwv CXliVlXV/X XCUXXXXY 1/lUlvUli 1/UIAUV V 


SAG 1997 


182 


hvoothetical nrotein 


SAG 1998 


457 


hvnothetieal nroteiTi 


SAG1999 


47 


hvoothetical nrotein 


SAG2000 


666 


membrane nrotein niitative 


SAG2001 


756 


coniupal transfer nrotein interninriori-r^ 

vv/uj ugai VxcxxxOxV/x |JxVSlwxll, xlxlwxxU^sllUxx 


SAG2002 


129 


IS1381 transnosase Orffi 


SAG2003 


127 


IS 1381 transnosase OrfA 


SAG2004 


67 


coniu&al transfer nrotein internrntion-N 


SAG2005 


136 


conserved hvoothetical nrotein 


SAG2006 


88 


conserved hvoothetical nrotein 

VVlluwl ▼ WX* UJf UVUIVUVUI V/ LV^lXl 


SAG2007 


317 


conserved hvnothetical nrotein 


SAG2008 


84 


conserved hvnothetical nrotein 


SAG2009 


88 


conserved hvnothetical nrotein 

VV/lliVVl ▼ W^A ilj l/VUlVkivUl LYA V/ kVSjA.L 


SAG2010 


157 


hvoothetical nrotein 


SAG2011 


160 


conserved hvnothetical nrotein 

VVUuVl T W ilj WW UiVUVUl JL/JL VvAJLL 


SAG2012 


90 


hvnothetical nrotein 

•IT UVMlVilVWl L/1WV11I 


SAG2013 


189 


hvoothetical nrotein 


SAG2014 


449 


hvnothetical nrotein 

AA T |/ V U1V UVM1 pi\/tVlll 


SAG2015 


99 


transcriptional regulator, Cro/CI family 


SAG2016 


125 


hvoothetical nrotein 


SAG2017 


429 


transcriptional regulator, Cro/CI family 


SAG2018 


553 


FtsK/SpoHIE family protein 


SAG2019 


153 


hypothetical protein 


SAG2020 


98 


hypothetical protein 


SAG2021 


826 


cell wall surface anchor family protein 


SAG2022 


417 


transposase, ISL3 family 


SAG2023 


546 


mercuric reductase 


SAG2024 


130 


mercuric resistance operon regulatory protein MerR 


SAG2025 


522 


Mn2+/Fe2+ transporter, NRAMP family 


SAG2026 


240 


membrane protein, putative 


SAG2027 


205 


ABC transporter, ATP-binding protein 


SAG2028 


36 


conserved hypothetical protein 


SAG2029 


284 


streptomycin resistance protein 


SAG2030 


130 


hypothetical protein 
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90? 


iiypuuicuv/ai proiem 


S A 09m 9 


1 1 1 
All 


k/Uii&crveo. nypouieiicai protem 






dceiyiiraiisierase, vjInai iamiiy 




Z** / 


membrane protein, putative 


oAVjZV3D 




At>u transporter, A l ir-binding protein 




Oo 


hypothetical protein 


oA*JZU.j / 


JJO 


transcriptional regulator, Cro/CI family 


oAvjZUjo 


•OA/1 


JrAJrz iamiiy protem 


c a non^o 
oAvjZloJJ 




conserved hypothetical protein 


SAG2040 


186 


conserved hypothetical protein TIGR00730 


oACjZU41 


2o7 


protease, putative 


SAG2042 


100 


rhodanese family protein 


SAG2043 


255 


c AMP factor ] 


SAG2Q44 


62 


hypothetical protein ? 


bAG2045 . 


179 


DNA topology modulation protem FlaR, putative 


oACjzU4o 


361 


glycerol dehydrogenase, putative 


bAG2047 


235 


conserved hypothetical protein 


C A O 

oAOzU4o 


614 


5-met1iyltetrahydrofolate--homocysteirie methyltransferase/ 
putative 


C A 

oALrZU4y 


745 


5-methyiteti^ydropteroyltriglutamate— homocysteine 
methyltransferase 


QAfion^n 


. 1U / 


conserved hypothetical protein 


q Af*9ft<ci - 

oAOZUD 1 


ZjU 


branched-chain amino acid transport protein AzlC, putative 


q a rjon^o 


41 


hypothetical protein 


q a mn^i 


ID /U 


serine protease, subtilase family, putative 


q Amn<A 

oAVJZlO*f 


ZZo 


DNA-binding response regulator 




4 AO 
*fOZ 


sensor histidine kinase 


oAUrZUOO 


zuz 


chromosome assembly-related protein 


QAfJin^7 




leucyl-tRNA synthetase 


oAVJZUjo 




major facilitator family protein 


QAri9n^o 

o/WJZUJl* 


OR1 
Zol 


protein of unknown function 




J70 


glycosyl transferase, family 8 




401 


glycosyl transferase, family 8 


SAfr90fi9 


170 


transcription ann termination protein XNusLr 




U J 17 


paiaogeniciLy protein, putative 


SAG9064 


57 


preproiem uansiocase, oecc suDumt, putative 


SAG206S 


5ft 


riDosomai protem jlo o 


OAVJAiVUl; 


1/3 


pemciiiin-uinuing protein za 


SAO9067 


904 


riDosomai large suounit pseuaounaine synthase, KiuJJ subiamily 


SAG2068 


546 


conserved hyppthetical protein 


SAG2069 


403 


phosphopentomutase 


SAG2070 


223 


deoxyribose-phosphate aldolase 


SAG2071 


400 


Na+ dependent nucleoside transporter 


SAG2072 


259 


uridine phosphorylase 


SAG2073 


245 


transcriptional regulator, GntR family 


SAG2074 


540 


60 kda chaperonin | 


SAG2075 


94 


chaperonin, 10 kDa 


SAG2076 


267 


ABC transporter, ATP-binding protein 
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SAG2077 


298 


ABC transporter, permease protein 


SAG2078 


320 


protein of unknown fimction/lipoprotein, putative 


SAG2079 


265 


hydrolase, haloacid dehalogenase-like family 


SAG2080 


286 


glyoxalase family protein 


SAG2081 


243 


conserved hvDothetical nrotein 


SAG2082 


205 


anaerobic ribonucleoside-triohosnhate reductase activating nrotein 


SAG2083 


163 


acetyltransferase, GNAT family 


, SAG2084 


310 


virulence factor MviM nutative 


SAG2085 


47 


conserved hvnothetical nrotein 


SAG2086 


723 


anaerobic ribonucleoside-trinhosnh ate reductase 


SAG2087 


495 


membrane protein, putative 


SAG2088 


40 


hvoothetical nrotein 


SAG2089 


105 


conserved hvnothetical nrotein 


SAG2090 


136 


conserved hvnothetical nrotein TTfrR002SG 


SAG2091 


88 


conserved hvnothetical nrotein 


SAG2092 


132 


conserved hvnothetical nrotein 


SAG2093 


379 


rec A nrotein 


SAG2094 


NA 


comoetence/damape-indiicihle nrotein Oin A Aiif1 a i<*ntis ,> frampeltift 


SAG2095 


183 


■ DNA-3-methvlaHenine &1vcocv1jic^ T 


SAG2096 


196 


Hollidav iunction DNA helicase RnvA 


SAG2097 


418 


transDorter nutative 


SAG2098 


659 


DNA mismatch renair nrotein He/xrR 


SAG2099 


33 


hvnothetical nrotein 


SAG2100 


67 


cold shock nrotein. CSD familv 


SAG2101 


858 


DNA mismatch renair nrotein Hev A 


SAG2102 


145 


arffinine renressor Ar*»R nutative 


SAG2103 


563 


arffinvl-tRNA svnthetase 


SAG2104 


102 


conserved hvnothetical nrotein 


SAG2105 


290 


conserved hvnothetical nrotein 


SAG2106 


314 


conserved hypothetical protein 


SAG2107 


5.83 


aspartyl-tRNA synthetase 


SAG2108 


426 


histidyl-tRNA synthetase 


SAG2109 


60 


ribosomal protein L32 


SAG2110 


49 


ribosomal protein L33 


SAG2111 


173 


conserved hypothetical protein 


SAG2112 


494 


site-specific recombinase, phage integrase family 


SAG2113 


82 


conserved hypothetical protein 


SAG2114 


342 


conserved hypothetical protein 


SAG2115 


143 


hypothetical protein 


SAG2116 


151 


conserved hypothetical protein 


SAG2117 


71 


hypothetical protein J 


SAG2118 


306 


transcriptional regulator, Cro/CI family 


SAG2119 


373 


conserved domain protein 


SAG2120 


269 


hypothetical protein 


SAG2121 


223 


hypothetical protein 


SAG2122 


223 


DNA-binding response regulator 


SAG2123 


454 


sensor histidine kinase 


SAG2124 


517 


membrane protein, putative 
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SAG2125 


308 


carbamate kinase 


SAG2126 


332 


ornithine carbamovltransferase 


SAG2127 


431 


sensor histidine kinase 


SAG2128 


277 


resnonse regulator 


SAG2129 


240 


am inn acid ARC* Iran snorter A TP-bin din a nrntpin 


SAG2130 


504 


amino nr*i d ARP trpncorvrtPT ammo ar*id— Tvind in <r nrntpin /nprm oo 

OxxXxxxV> uVlU rUJV IXIUxoUVrl Iwly QilllllU OOIU LrHlimiK LIlVllClXx/ UCxlxlCaoC 

nrotein 

plv IXvXXX rf 


SAG2131 


847 


membrane nrotein nntative 


SAG2132 


247 


conserved bvnothetieal nrotein 


SAG2133 


118 


conserved nomothetical nrntein 

WUsvl TvU u Jr pUUlvUvOl L/xUlxvxxx 


SAG2134 


772 


nienribTane nrotein nntative 

XxXksXXllSx<UxW pil/lvlllj [/UUUlVv 


SAG2135 


179 


transcrintional iieoiilator TetR rarnilv rmtative 

kXtXXxOV/XXpriXV'xxClA AwgUlOlUl) lvll\ xYBl Hljtjr , ^/tX ixxli Vv . 


SAG2136 


98 


conserved nvnothetioal nrotein 


SAG2137 


203 


rihosomal nrntein S14 * 


SAG2138 


95 


conserved bvnothetieal nrotein <D 

VV/41UV1 V Vp>V& IX jr pwuiwuvcu. &XXV/VWXXX 


SAG2139 


451 


renlicative TYMA heliense 

XwjJXX\/C*tX V v JL^XNx^ llwllvdOG 


SAG2140 




ribosomal nrotein L9 


SAG2141 


660 


DHT1 familv nrotein 

X*AXL1 XCXXXA^XjT JJlVllVilJ 


SAG2142 

A L\J AV A I** 


613 


olucose inhibited division nrotein A 

glUvv^OW UllUUltvu UIVIOIUU ^lUlulll fi 


SAG2143 


203 


membrane nrotein niitative 

UlVlUwlCHlV £JX\SlXvXXX, pUluUVv 


SAG2144 


373 


tlWA (5-methylaminomethy 


SAG2145 


222 


T ..-serine dehvdratase it*on-Qii1*fiiT~d<=»-nf»nd/»-nt h#»ta cnVtnnit 

x«* Oi/Llliw UwJxjr UlclUlOV) ll Ull^d Ull Ux "UCpCllUvlllj LICvcx oULULxXIlL 


SAG2146 

k*JA WJ AV A IV 


290 


T ..-serine dehvdratase irnn-snlfivr-denpnriAnt nlnlia cnKimif 


SAG2147 

k/i- A> VJ AV A T / 


234 


nrotein of unknown fiinerion/linnnrrrtein nn tativ** 


SAG2148 


179 


T vqTV/T Hnmain nrrttein 

x-»jroxVX IxUxxxC&xll |/xULGxix 


SAG2149 


264 


cobalt transnort familv nrotRin 


SAG2150 


280 

x<OV 


A Rf"* 1 fran snorter A TP-Hindi tier -nrotein 

AUV IxCUxOLsl/AlVx, xx J. X UlAllxxll^ JJIUlCxlx 


SAG2151 


279 


A T3r^ fran snorter A ' 1 " H -hind in o nrntfin 

/VU\^ U. CXXlO^-l*JX 9 jTX. X X L/lxlUIlXg |JI,UlCXxl 


SAG2152 


180 


(^TjP-di ac vl (rl vcerol — &\ vr»erol .nft ncnfi a tf» 'X - 

Dhosnbatidvltransferase 

1/iIV *J 1> A%A T A fcA AAA AiJ A UU W 


SAG2153 


427 


nentidase. Ml 6 familv 


SAG2154 


414 


conserved hvoothetical nrotein 


SAG2155 


117 


conserved hvnothetical nrotein 

V/AAiJV' ▼ W^*- J 1/VUAVVxVIU L/A.VkVUl 


SAG2156 


369 


recF protein 


SAG2157 


278 


transporter, putative 


SAG2158 


220 


transcrintional regulator Cro/CI familv 


SAG2159 


493 


inosine-S'-monophosphate dehydrogenase 


SAG2160 


161 


transcriptional regulator, ArgR family 


SAG2161 


226 


transcriptional regulator, Crp/Fnr family 


SAG2162 


234 


conserved hypothetical protein 


SAG2163 


410 


arginine deiminase 


SAG2164 


136 


acetyltransferase, GNAT family | 


SAG2165 


337 


ornithine carbamoyltransferase 


SAG2166 


475 


arginine/ornithine antiporter 


SAG2167 


318 


carbamate kinase 


SAG2168 


341 


tryptophanyl-tRNA synthetase 


SAG2169 


230 


membrane protein, putative 


SAG2170 


290 


conserved hypothetical protein 
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SAG2171 


539 


ABC transporter, ATP-binding protein 


SAG2172 


859 


ABC transporter, permease protein, putative 


SAG2173 


159 


conserved hypothetical protein TIGR00246 


SAG2174 


409 


serine protease 


SAG2175 


257 


partitioning protein, ParB family 
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SAG0017 


447 


+ 














pcsB 


SAG0031 


299 


+ 














peptidase, M23/M37 family 


SAG0032 


434 










+ 


+ 


• 


group B streptococcal surface immunogenic protein 


SAG0034 


438 


+ 








+ 






sugar ABC transporter, sugar-binding protein 


SAG0051 


126 


+ 










+ 




WORN motif family protein 


SAG0079 


212 








+ 


+ 


+ 




adenylate kinase- 


SAGO086 


85 






+ 










lipoprotein, putative 


SAG0093 


256 


+ 








+ 


+ 




D-alanyl-D-alanine carboxypeptidase family protein 


SAG0094 


191 
















^-acetylmiuamoyl-L-alanine amidase, family 4 protein 


SAGO 108 


308 


+ 












■ 


conserved hypothetical protein 


SAG0114 


322 


+ 




+ 










ribosc ABC transporter, periplasmic D-ribose-binding 
protein 


SAG0124 


356 


+ 














sensor histidine kinase 


SAGO 132 


294 


+ 










+ 




SPFH domain/Band 7 family protein 


SAGO 134 


96 


+ 












+ 


hypothetical protein 


SAGO 146 


395 


+ 














penicillin-binding protein 4, putative 




411 
















D-fllflfivf-D-alaTTine carKoxvncntirfa^e familv nratem 

U1UUJ I nlqUHW Well VJ\##*jy^»|>fci\lBW>^ UUiU 1 JF |/tUkvul 


SAG0148 


551 






+ 




+ 






oligopeptide ABC transporter, substrate-binding protein, 
putative 


SAGO 166 


123 


+ 














conserved domain protein 


SAG0I76 


94 


+ 














conserved hypothetical protein 


SAG0187 


542 


+ 




+ ■ 




+ 






oligopeptide ABC transporter, oligopeptide-binding 
protein 


SAG0206 


60 






+ 








+ 


lipoprotein, putative 


SAG0213 


39 


+ 












+ 


hypothetical protein 


SAG0231 


135 


+ 














hypothetical protein 


SAG0242 


30S 






+ 






_ 




amino acid ABC transporter, amino acid-binding protein 


SAG0245 


152 






+ 








+ 


protein of unknown function/lipoprotera, putative 


SAG0255 


315 
















conserved hypothetical protein 


SAG0257 


53 






+ 








+ 


lipoprotein, putative 


SAG0265 


235 


+ 












+ 


conserved hypothetical protein 


SAG0290 


27C 


+ 










+ 




ABC transporter, substrate-binding protein 


SAG0298 


75( 
















penicillin-binding protein 1A 
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SAG0306 


535 


+ 














KH domain protein 


SAG0321 


339 


+ 














sensor histidine kinase, putative 


SAG0329 


106 


+ 














PTS system, cellobiose -specific HB component 


SAG0368 


435 










+ 


+ 




protein of unknown function 


SAG0371 


167 


+ 












+ 


hypothetical protein 


SAG0383 


334 


+ 




+ 


— 


+ 






protein of unknown function/lipoprotem, putative 


SAG0392 


521 


+ - 


+ 






+ 


+ 




cell wall surface anchor family protein 


SAG0394 


345 








+ 








sensor histidine kinase 


SAG0405 


347 


+ 




+ 




+ 


4 




protein of unknown runction/lipoprotein, putative 


SAG0406 


299 


+ 














UTP-glucose- 1 -phosphate uridytyltransferase 


SAG0407 


338 


+ 














glycerol-3 -phosphate dehydrogenase (NAD(P)+) 


SAG0416 


1233 




+ 






+ 


+ 




protease, putative 


SAG0421 


1055 




+ 






+ 






cell wall surface anchor family protein 


SAG0433 


1389 




+ 












surface protein Rib 


SAG0437 


123 






*+ 










lipoprotein, putative 


SAG0451 


149 


+ 




+ 








+ 


bacteriocin transport accessory protein,putative 


SAG0455 


357 


+ 














conserved hypothetical protein 


SAG0472 


126 


+ 








+ 






rhodanese-lQce family protein 


SAG0482 


84 


+ 














YGGT family protein 


SAG0499 


275 








+ 








hemolysin A 


SAG0503 


279 


+ 








+ 


+ 




Itpase/acylhydrolase 


SAG0504 


200 


+ 














conserved hypothetical protein 


SAG0506 


65 


+ 












+ 


hypothetical protein 


SAG0521 


236 


+ 














carboxymethylenebutenolidase-related protein 


SAG0535 


506 


+ 








+ 


+ 




zinc ABC transporter, zinc-binding adhesion liprotein j 


SAG0596 


670 








+ 








prophage LambdaSal, pblA protein, internal deletion 


SAG0603 


111 








+ 








conserved hypothetical protein 


SAG0604 


239 








+ 








prophage LambdaSal, lysin, putative 


SAG06U 


439 
















sensor histidine kinase VncS 


SAG0624 


574 


+ 














septation ring formation regulator EzrA, putative 


SAG0629 


354 


+ 














conserved domain protein 


SAG0635 


245 


+ 














acid phosphatase, class B 1 


SAG0638 


109 
















cell wall surface anchor family protein, interruption-N 
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(aa) 


Signal 
Peptide 


Soitase 
motif 


Lipo- 
protein 


Other 


Western 
blot 


FACS 


GBS 
specific 


Annotation 


SAG064S 


554 




+ 






+ 


+ 




cell wall surface anchor family protein 


SAG0646 


307 


+ 


+ 






+ 






cell wall surface anchor family protein 


SAG0647 


305 


+ 














sortase family protein 


SAG0649 


890 




+ 






+ 


+ 

« 


■ • 


cell wall surface anchor family protein, putative 


SAG0658 


383 


+ 




+ 










lipoprotein, putative 


SAG0675 


171 
















putative secreted protein 


SAG0676 


885 








+ 








proteinase, putative 


SAG0677 


1062 




+ 












hypothetical protein 


SAG0679 


343 


+ 




+ 




+ 






protein of unknown function 


SAG0680 


339 


+ 








+ 






protein of unknown function ' 


SAG06S1 


353 


+ 














conserved domain protein 


SAG0686 


261 


+ 








+ 


+ 




DNA-entry nuclease, putative 


SAG0714 


188 


+ 












+ 


conserved-hypothetical protein 


SAG0717 


266 


+ 








+ 


+ 




amino acid ABC transporter, amino acid-binding protein 


SAG0720 


449 








+ 








sensory box histidine kinase 


SAG0738 


132 


+ 














conserved hypothetical protein 


SAG0739 


143 


+ 










• 




conserved hypothetical protein 


SAG0742 


428 








+ 




+ 




peptidase, U32 family 


SAG0755 


282 


+ 














peptidase, U32 family 


SAG0757 


129 


• + 




+ 




+ 






protein of unknown function/lipoprotein, putative 


SAG0764 


230 








+ 


+ 






phosphoglycerate mutase femily protein 


SAG076S 


681 


+ 














penicillin-binding protein 2b 


SAG0771 


512 


+ 


+ 






+ . 


. + 


+ 


cell wall surface anchor family protein 


SAG0776 


276 


+ 




+ 










YaeC family protein, putative 


SAG0777 


528 








+ 


+ 


+ 




ATP-dependent RNA helicase, DEAD/DEAH box family 


SAG0785 


330 
















conserved hypothetical protein 


SAGO808 


309 


+ 




+ 




+ 


+ 




protease maturation protein, putative 


SAG0824 


417 


+ 














polysaccharide deacetylase family protein 


SAGQ832 


753 










+ 


+ * 




protein of unknown function 


SAG0833 


181 


+ 












+ 


hypothetical protein 


SAG0867 


63 


+ 














conserved hypothetical protein 


SAG0868 


285 


+ 








+ 






DNA-entry nuclease 


SAG0886 


319 


+ 








+ 


+ 




protein of unknown function 
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SAG0904 


56 


-V 












+ 


hypothetical protein 


SAG0907 


877 


+ 




+ 




+ 






protein of unknown function/lipoprotein, putative 


SAG0926 


333 


+ ' 














rn916, NLP/P60 family protein 


SAG0942 


185 


+ 








+ 


+ 




signal peptidase I, putative 


SAG0949 


276 


+ 




+ 




+ 


+ 




amino acid ABC transporter, amino acid-binding protein 


SAG0954 


349 










+ 


_ 




protein oT unknown function/lipoprotein, putative 


SAG0961 


247 


+ 








+ 


_ 




sortase SrtA 


SAG0963 


320 
















conserved hypothetical protein 


SAG0971 


282 


+ 


- 


+ 




+ 


- 




protein of unknown function/lipoprotein, putative 


SAG0973 


320 


+ 












+ 


nisin-resistance protein, putative ' 


SAG0977 


312 








+ 








sensor histidine kinase 


SAG0979 


553 




• 


+ 




+ 






ABC transporter, substrate-binding protein 


SAG0984 


437 


+ 














sensor histidine kinase CiaH 


SAG0992 


286 


+ 








+ 


+ 




phosphate ABC transporter, phosphate-binding protein 


SAG1007 


342 


+ 




+ 




+ 


_ 

i 




iron-compound ABC transporter, iron-compound-binding 
protein 


SAG1014 


190 


+ 














conserved hypothetical protein 


SAG1018 


40 






+ 








+ 


lipoprotein, putative 


SAG1024 


183 


+ 




+ 










lipoprotein, putative 


SAG 1029 


101 


+ 














hypothetical protein 


SAG 1030 


304 


+ 








+ 


+ 




protein of unknown function 


SAG1037 


157 


+ 














hypothetical protein 


SAG1052 


47 




+ 










+ 


cell wall surface anchor family protein, putative 


SAG 1072 


200 


+ 














conserved hypothetical protein 


SAG 1094 


278 








+ 


+ 


+ 




conserved hypothetical protein 


SAG 11 08 


357 


+ 








+ 






spermidine/putrescine ABC transporter, 
spermidine/putrescine-binding prot 


SAG 1121 


295 


+ 














polysaccharide deacetylase family protein 


SAG 1126 


228 


+ 








+ 


+ 




protein of unknown function 


SAG1 127 


446 


+ 












+ 


conserved domain protein 


SAG 11 30 


45 


+ 












+ 


hypothetical protein 


SAG1138 


6A 


+ 














conserved hypothetical protein' 


SAG U 39 


193 


+ 














conserved hypothetical protein 
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SAG 1149 


207 


+ 




+ 








1 


ipoprotein, putative 


SAG 11 84 


236 


+ 












< 


unserved hypothetical protein 


SAG 1186 


553 








+ 








iietaUo-beta-lactarnase superfarnily protein 


SAG U 89 


334 


+ 




• 










unserved hypothetical protein 


SAG 1190 


551 








+ 








adherence and virulence protein A 


SAG 1197 


1072 


+ 














tiyaluronidase 


SAG1201 


367 


+ 














tminodiacetate oxidase, putative 


SAG1206 


854 


+ 














conserved domain protein 


SAG1214 


58 


+ 














hypothetical protein 


SAG1216 


1252 




+ 












pullulanase, putative 


SAG1227 


198 


+ 














protein of unknown function 


SAG 1233 


822 


+ 








+ ■ 






streptococcal histidine triad family protein 


SAG1234 


306 


+ 




+ 




+ 


+ ' 




lammin-binding surface protein 


SAG 1238 


202 


+ 














[Hypothetical protein 


SAG1283 


1631 




+ 






+ . 


+ 




agglutinin receptor 


SAG 13 13 


56 


+ 














conserved hypothetical protein 


SAG1327 


409 


+ 














sensor histidine kinase 


SAG1331 


979 


+ 


+ 






+ 


+ 




R5 protein 


SAG1333 


690 


+ 


+ 






+ 


+ 




5*-nucIeotidase family protein 


SAG 1350 


544 


+ 














surface antigen-related protein 


SAG 1361 


414 


+ 














conserved hypothetical protein 


SAG1371 


392 
















conserved hypothetical protein 


SAG1393 


310 






+ 










iron compound ABC transporter, substrate-binding protein 


SAG1404 


308 


+ 


+ 






+ 






cell wall surface anchor family protein 


SAG 1405 


294 


+ 








+ 






sortase family protein 


SAG 1406 


293 


+ 














sortase family protein 


SAG1407 


705 


+ 


+ 






+ 


+ 




cell wall surface anchor family protein 


SAG 1408 


901 




+ 












cell wall surface anchor family protein 


SAG1419 


57*3 






+ 








+ 


lipoprotein, putative 


SAG1431 


268 
















amino acid ABC transporter, amino acid-binding protein 


SAG1433 


37i 


> + 














conserved hypothetical protein 


SAG1441 


41i 


> + 








+ 


+ 




rnaltose/maltodextrin ABC transporter, 
rnaltose/maltodextrin -binding protein 



450 
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SAG 1462 


970 




+ | 










c 


ell wall surface anchor family protein 


SAO 1471 


192 


+ | 


+ 










+ c 


,ell wall surface anchor family protein 






+ * 


+ 










2 


midase family protein 


SAG14S3 


78 


+ 












I 


jreprotein translocase, SecG subunit 


SAG 148 8 


195 












+ 






SAG 1491 


53U 


+ 












+ 




SAG 1508 


590 
















17 IrTVa Kjfvnoin^mcenn^tlVA C I rpi nwtWfl 1 JlntltJPTI 


SAG 15 18 


CIO 






+ j 












O A f 1 CIA 

SAG 1530 


267 


+ 














-»p^»tiHv1_nrr»K/l fictrana knmprncp cvelnnhilin-tvne 
jepuuyi-pnjiyi bio Uuiui ibvjinti u^c, cydujjuuui-vyijc 


SAG1533 


308 






+ 




+ 






mmmmtKA ADP trancnnttn' mnri<Tan*»cf» JiiflHint? adhesion 

iprotein 


SAG1544 


232 


+ 








- 






gluconate 5^iehydrogenflse > putative 


SAG 155.1 


%>l 














4. 


nypouicucai prtiusiu 


SAG 1552 


719 


+ 














conservea nypouieiivaj piviicm 


« ini eel 
















4. 


h , i/TV\tti t*t t f g 1 nmfpin 


SAG 1562 


280 


+ 














vUUiCJ VCU UjFXJUUlGUvol 




388 


+ 








+ 






hranrJip/l-rham ammo acid ABC! transnortfer amino acid* 
binding protein 




449 






- 


+ 


+ 


+ 




potassium uptake protein, Trk family 




79 


+ 














conserved hypothetical protein 




285 










+ 






amino acid ABC transporter, substrate-binding protein 


SAOtfilft 
OXYVJ i vj I o 


1032 








+ 


+ 


+ 




Sn£2 family protein* 


SAG 1624 


501 


+ 














sensor histidine kinase CsrS 


SAG 1628 


184 


+ 














lemA protein 


SAG 1631 


223 


+ 








+ 






potassium uptake protein, Trk family, putative 


SAG 1641 


274 


• + 








+ 






YaeC family protein 


SAG1642 


2T 


+ 




+ 




+ 






ABC transporter, substrate-binding protein 


SAG1683 


512 


I + 














immunogenic secreted protein, putative 


SAG 1706 


23* 


J + 














conserved hypothetical protein 


SAGI745 


141 


i + 












+ 


hypothetical protein 


SAG1752 


39< 


) + 














conserved hypothetical protein TIGR00275 


SAG 1759 


23< 










+ 






protein of unknown function 


SAG1762 


16 


9 + 














conserved hypothetical protein 
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Table 2 



ORF 



Size Signal | Sortase 
(aa) Peptide motif 



Lipo- 
protein 



Other 



Western 



blot 



FACS 



GBS 
specific 



Annotation 



SAG1767 



289 + 



acid phosphatase 



SAGI768 



336 



glyceraldehyde 3 -phosphate dehydrogenase 



SAG 1774 



424 



conserved hypothetical protein 



SAG1786 



130 + 



protein of unknown function 



SAG1787 



420 +' 



dltD 



SAG1791 



395 + 



sensor histidine kinase. 



SAG 1 822 



protein of unknown function 



SAG1823 



418 



protein of unknown function 



SAG1837 



468 



prophage LambdaSa2, Iysin, putative 



SAG1838 



109 + 



prophage LambdaSa2, holm, putative 



SAG1839 



136 



conserved hypothetical protein 



SAG1842 



1224 



prophage LambdaSa2, PbflB, putative 



SAG1912 



N-acetylmuramoyl-L-alanine amidase, family 4 protein 



SAG1921 



508 . + 



sensor histidine kinase 



SAG1932 



816 + 



neuraminidase-related protein 



SAG 1938 



307 



adhesion lipoprotein 



SAG 1941 



800 + 



,3*-cyclic-nucleotide T -phosphodiesterase 



SAG1945 



345 + 



iron ABC transporter, iron-binding protein 



SAG 1947 



549 



conserved hypothetical protein 



SAG1960 



551 



sensor histidine kinase 



SAG1966 



293 



hemolysin precursor, putative 



SAG1996 



263 + 



cell wall surface anchor family protein, putative 



SAG1997 



hypothetical protein 



SAG1998 



457 



hypothetical protein 



SAG2021 



826 



cell wall surface anchor family protein 



SAG2043 



255 + 



c AMP factor 



SAG2053 



1570 + 



serine protease, subtilase family, putative 



SAG2055 



462 



sensor histidine kinase 



SAG2056 



chromosome assembly-related protein 



SAG2063 



630 



pathogenicity protein, putative 



SAG2078 



320 + 



protein of unknown functton/lipoprotein, putative 



SAG2094 



competence/damage-mducible protein CinA, authentic 
frameshift 
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Table 2 



ORF 


Size 
(aa) 


Signal 
Peptide 


Soxtase 
motif 


Lipo- 
protein 


Other 


Western 
blot 


FACS 


GBS 
specific 


Annotation 


SAG2121 


223 


+ 












+ 


hypothetical protein 


SAG2123 


454 
















sensor histidine kinase 


SAG2141 


660 


+ 








+ 






DHH family protein 


SAG2147 


234 






+ 




+ 


+ 




protein of unknown function/lipoprotein, putative 


SAG2148 


179 


+ 














LysM domain protein 


SAG2174 


409 


+ 














serine protease 


SAG00I3 


428 










+ 






protein of unknown function 
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Table 3 



ORF 


Annotation 


SAG0038 


conserved hypothetical protein 


SAG0048 


transcriptional regulator Cro/CI family 


SAG0091 


transcriptional regulator ComXl putative 


SAG0137 


conserved hypothetical protein 


SAG0686 


DNA-entry nuclease putative . 

* * 


SAG0770 


membrane protein putative 


SAG0868 


DNA-entiy nuclease 


SAG1143 


conserved hypothetical protein 


SAG1233 


streptococcal histidine triad family protein 


SAG1596 

• 


integrase/recombinase phage integrase family 


SAG1616 


conserved hypothetical protein 


SAG1721 


conserved hypothetical protein. 
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Table 5 



Strain 


Source 


Capsular serotype 


Reference 


090 


Lancefield 


la 




515 


Houston 


la 


(1) 


A909 


Lancefield 


la 


(2) 


Davis 


Charming 


la 




DK1 


Houston • 


la 


• * 


DK8 


Houston 


la 




H36b 


Lancefield 


lb 


(2) 


(S7> 7357b 


Charming 


lb 


(3) 


18RS21 


Lancefield 


n 


(4) 


DK21 


Houston 


n 


• 


com 


Seattle 


m 


(5) 


COH31 


Seattle 


m 


<<D 


D136C 


Lancefield 


m 


(4) 


M781 


Houston 


in 


(7) 


M732 


Houston 


m 


(8) 


1169NT1 


Atlanta 


V 


(9) 


2603V/R 


Italy 


V 


This study 


CJB111 


Houston 


V 


(10) 


JM9130013 


Japan 


vm 


(11) 


SMU014 


Japan 


vm 


(ID 


CJB110 


Houston 


Nontypeable 


(12) 
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Table 6 



Cluster 1 

SAG0230 
SAG0231 
SAG0232 
SAG023.3 
SAG0234 
SAG0235 



conserved hypothetical protein 
hypothetical protein 
hypothetical protein 
hypothetical protein 
hypothetical protein 
hypothetical protein 



Cluster 2 

SAG0222 conserved domain protein 

SA&0223 conserved hypothetical protein, fusion 

SAG0225 hypothetical protein 

S AG0226 recombination protein 

SAG0227 hypothetical protein 

SAG0228 conserved hypothetical protein 

SAG0229 conserved hypothetical protein 



Cluster 3 

SAG0634 
SAG0635 
SAG0636 
SAG0638 
SAG0640 



hypothetical protein 

acid phosphatase, class B 

conserved hypothetical protein 

cell wall surface anchor family protein, interruption-N 

transposase OrfA, IS3 family 
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SAG0642 

SAG0643 

SAG0644 

SAG0645 

SAG0646 

SAG0647 

SAG0648 " 

SAG0649 

SAG0650 

SAG0§51 

Cluster 4 

SAG1898 
SAG1899 
SAG1900 
SAG1901 
SAG1902 
SAG1905 
SAG1906 

Cluster 5 

SAG0247 
SAG0248 



Table 6 

hypothetical protein 
chaperonin, 33 kDa, degenerate 
transcriptional regulator, AraC family 
cell wall surface anchor family protein 
cell wall surface anchor family protein 
sortase family protein 
sortase family protein 

cell wall surface anchor family protein, putative 
sortase family protein 
protein of unknown function 

PTS system, IBD component 
PTS system, IIC component 
PTS system, KB component 
glucuronyl hydrolase 
PTS system, HA component 
conserved hypothetical protein 
carbohydrate kinase, PfkB family 



hypothetical protein 
hypothetical protein 
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SAG0249 
SAG0674 
SAG0675 
SAG0676 
SAG0677 
SAG0680 
SAG0681 
SAG0684 
SAG1698 

Cluster 6 

SAG0261 
SAG0262 
SAG0965 
SAG0966 
SAG2002 

Cluster 7 

SAG1027 
SAG1028 
SAG1029 
SAG1030 
SAG1031 



Table 6 

hypothetical protein 

hypothetical protein 

putative secreted protein 

proteinase, putative 

hypothetical protein 

protein of unknown function 

conserved domain protein 

ABC transporter, ATP-binding protein 

conserved hypothetical protein 



IS1381, transposase OrfB . 
IS 1 38 1 , transposase OrfA 
IS 1381, transposase OrfA 
IS1381, transposase OrfB 
IS1381, transposase OrfB 

conserved hypothetical protein 
hypothetical protein . 
hypothetical protein 
protein of unknown function 
conserved domain protein 
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SAG1 032 conserved hypothetical protein 
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Cluster 8 

SAG1253 
SAQ1254 
SAG1255 
SAG2022 
SAG2023 
SAG2024 



.transposase, ISL3 family 
mercuric reductase 

mercuric resistance opferon regulatory protein MerR 
transposase, ISL3 family 
mercuric reductase 

mercuric resistance operon regulatory protein MerR 



Cluster 9 

S AG1 993 site-specific recombinase, phage integrase family 

S AG1 994 conserved hypothetical protein 

SAG1995 hypothetical protein 

S AG1 996 cell wall surface anchor family protein, putative 

S AG1 997 hypothetical protein 

SAG1998 hypothetical protein 

SAG2000 membrane protein, putative 

SAG2001 conjugal transfer protein, interruption-C 

SAG2007 conserved hypothetical protein 

SAG2008 conserved hypothetical protein 

SAG2009 conserved hypothetical protein 

SAG2010 hypothetical protein 
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Table 6 

SAG201 1 conserved hypothetical protein 



SAG2012 


hypothetical protein 


SAG2016 


hypothetical protein 


SAG2017 „ 


transcnptional regulator, Cro/CI family 


SAC52025 


Mn2+/Fe2+ transporter, NRAMP family 


Cluster 10 




SAG1039 


conserved hypothetical protein 


SAG1447 


conserved hypothetical protein 


SAG1448 


glycosyl transferase, group 1 family protem 


SAG1449 


preprotein translocase Sec A subunit, putative 


SAG1450 


conserved domain protem 


SAG1452 


conserved hypothetical protem 


SAG1453 


preprotem translocase SecY family protem 


SAG1454 


glycosyl transferase, putative 


SAG1455 


glycosyl transferase, group 2 family protein 


SAG1456 


glycosyl transferase, family 8, degenerate 


SAG1459 


glycosyl transferase family 8 


SAG1460 


glycosyl transferase, family 8 


SAG1461 


conserved hypothetical protein 


SAG1462 


cell wall surface anchor family protein 


SAG1463 


transcriptional regulator, RofA family, authentic point mutation 


SAG1469 


conserved hypothetical protein 
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Table 6 

SAG147 1 conserved hypothetical protein 
SAG1933 ITS system, DC component, putative 



Cluster 11 

SAG0009 hypothetical protein 

SAG0120 hypothetical protein 

SAG0157 deoxyribonuclease-related protein, degenerate 

SAG0186 hypothetical protein 

SAG0216 hypothetical protem 

SAG0236 hypothetical protein m 

•» * 

SAG0307 hypothetical protein 

SAG0308 ABC transporter, ATP-binding protein 

S AG03 1 1 DNA-binding response regulator, authentic point mutation 

S AG05 1 8 peptide chain release factor 2, programmed frameshift 

SAG0553 hypothetical protein 

SAG0555 prophage LambdaSal, antirepressor, putative 

SAG0564 conserved hypothetical protein 

SAG0579 conserved hypothetical protein 

SAG0580 conserved hypothetical protein, truncation 

S AG06 1 1 transposase, degenerate 

SAG0637 transcriptional regulator, TetR family, putative, authentic frameshift 

SAG0641 Tn5252, Orf 10 protein, degenerate 
S AG0652 Tn5252, Orf 28 protein, degenerate 
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Table 6 

SAG0655 conserved hypothetical protein 

SAG0678 endopeptidase O, degenerate 

SAG0683 transmembrane protein Vexp3, putative, degenerate 

S AG085 5 glycogen biosynthesis protein GlgD, authentic frameshift 

SAG0898 hypothetical protein 



SAG0899 


hypothetical protein 


SAG0901 


hypothetical protein 


SAG0902 


hypothetical protein 


SAG0903 


hypothetical protein 


SAG0917. 


Tn9J.6, hypothetical protein 


SAG0920 


Tn9 16, hypothetical protein 


SAG0922 


Tn9 1 6, hypothetical protein 


SAG0924 


Tn9l6, tetM leader peptide 


SAG0928 


Tn9l6, hypothetical protein, authentic frameshift 


SAG0936 


Tn9l6, hypothetical protein 


SAG0943 


hypothetical protein 


SAG0972 


conserved hypothetical protein, authentic frameshift 


SAG1023 


hypothetical protein 


SAG1080 


hypothetical protein 


SAG1123 


hypothetical protein 


SAG1129 


hypothetical protein 


SAG1136 


conserved hypothetical protein 


SAG1217 


conserved hypothetical protein, authentic frameshift 
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Table 6 



SAG1231 


transposase OrfB, IS3 family, degenerate 


SAG1242 


transposase OrfB, IS3 family, truncation 


SAG1309 


hypothetical protein 


SAG1331 


R5 protein 


SAG1437 


hypothetical protein 


SAG1445 


MutT/nudix family protein, authentic frameshift 


SAG1484 


ribosomal protein L33 


SAG1493 


hypothetical protein 


SAG1539 


hypothetical protein 


SAG1543 


conserved hypothetical protein, authentic frameshift 


SAG1560 


hypothetical protein 


SAG1568 


phosphoserine aminotransferase, authentic frameshift 


SAG1570 


conserved hypothetical protein 


SAG1601 


conserved hypothetical protein 


SAG1644 


hypothetical protein 


SAG1646 


hypothetical protein 


SAG1699 


hypothetical protein 


SAG1705 


peptidase, M24 family, authentic point mutation 


SAG1708 


hypothetical protein 


SAG1857 


prophage LambdaSa2, HNH endonuclease family protein 


SAG1864 


hypothetical protein 


SAG1868 


hypothetical protein 
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Table 6 



SAG1 869 prophage LarnbdaSa2, type n DNA modification methyltransferase, 
putative 

SAG1 872 hypothetical protein 

S AG1 874 hypothetical protein . 

S AG1 876 prophage LambdaSa2, HNH endonuclease family protein 

SAG1878 conserved domain protein 

SAG1881 . hypothetical protein 

SAG1 883 conserved hypothetical protein 

SAG1886 hypothetical protein 

SAG1903 hypothetical protein 

SAG1 937 streptococcal histidine triad family protein, degenerate 

SAG1971 hypothetical protein 

SAG1979 membrane protein, putative 

S AG1 980 ABC transporter, ATP-binding protein 

S AG1 98 1 hypothetical protein 

S AG1 982 transcriptional regulator, Cro/CI family 

SAG1983 conserved hypothetical protein 

S AG1 984 conserved hypothetical protein TIGR00730 

SAG1985 hypothetical protein 

SAG1 991 transcriptional regulator, Cro/CI family 

S AG1 992 protein of unknown function 

SAG1 999 hypothetical protein 

SAG2004 conjugal transfer protein, interruption-N 
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Table 9: GBS genes shar d with pneumocc cus 

ORFxxxxx Annotatl n ; . _ 

QRF01580 polysaccharide biosynthesis protein, putative 

ORF01612 conserved hypothetical protein 

ORF01613 giycosyi transferase, group 1 family protein . 

ORF01617 conserved hypothetical protein 

ORF01 61 8 conserved hypothetical protein , 

ORF01 621 giycosyi transferase, putative , ; \ 

ORF01622 giycosyi transferase, group 2 family protein ; , 

ORF01623 giycosyi transferase, family 8, degenerate 

ORF01624 IS1381, transposase OrfB ; . 

ORF01625 IS1381, trahsposase QrfA 

QRF01626 giycosyi transferase family 8 - . 

ORF01627 giycosyi transferase, family 8 - - 

ORF01628 conserved hypothetical protein ^ „ . 

ORF01630 cell wall surface anchor family protein 

ORF01635 protease, putative . 

ORF01643 aminopeptidase PepS (pepS) 

ORF01702 peptidase, M20/M25/M40 family , 

QRF01731 IS1381, transposase QrfA , 

ORF01732 jS1381, transposase OrfB „ 

ORF01740 tellurite resistance protein TehB (tehB) _____ 

ORF01747 methylated-DNA-protein-cysteine S-methyltransferase (ogt) . 

. ORF01749 acetyltransferase, GNAT family 

ORF01763 AcuB family protein _> J 

ORF01764 branched-chain amino acid ABC transporter, ATP-binding protein (livF) 

ORF01765 branched-chain amino acid ABC transporter, ATP-binding protein "(IMS) . 

ORF01 766, branched-chain amino acid ABC transporter, permease protein 

ORF01767 branched-chain amino acid ABC transporter, permease protein (liyH) 

ORF01769 branched-chain amino acid ABC transporter, amino acid-binding protein • 

ORF01775 aminotransferase, class I , 

ORF01779 potassium uptake protein, Trk family 

ORF01780 cation uptake protein, Trk family 

ORF01824 cobalt transport family protein _ 

ORF01826 conserved hypothetical protein 

ORF01832 peptidase, M20/M25/M40 family __ 

QRF01845 conserved hypothetical protein 

ORF01848 transcriptional regulator, MerR family 

ORF01853 isochorismatase family protein 

QRF01859 membrane protein 

ORF01875 oxidoreductase, aldo/keto reductase family 

ORF01880 phospho-2-dehydro-3-deoxyheptonate aldolase 

ORF01981 rRNA(guanlne-N1-)-methyltransferase t putative 

ORF02083 prophage LambdaSa2, DNA replication protein DnaC, putative 

ORF02101 Na+/H+ exchanger family protein 

ORF02107 membrane protein, putative . 

ORF02139 UDP-glucose 4-epimerase (galE) 

ORF02143 lacX protein 

ORF02162 conserved hypothetical protein 

ORF02186 hemolysin precursor, putative 

ORF02192 transcriptional regulator, MerR family 

ORF02195 MutT/nudix family protein , 

ORF02228 IS1381, transposase OrfB 

ORF02229 1S1381, transposase QrfA 

ORF02233 conserved hypothetical pr teln 

ORF02234 conserved hypothetical protein 

. ORF02276 5-methyltetrahydropteroyltriglutamate~homocysteine methyltransferas (metE) 
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Table 9: GBS gen s shar d with pneumoccocus 



ORFxxxxx Annotation 

ORF02278 branched-chain amino acid transport prot in AziC, putative 

ORF02288 glycosyl transferase, family 8 ; 

QRF02289 glycosyl transferase, family 8 

QRF02341 ribosomal protein L32 (rpmF) a 

QRF02343 conserved hypothetical protein 

ORF02358 sensor histidine kinase 

ORF02369 conserved hypothetical protein - 

ORF02384 LysM domain protein 

QRF02428 hypoxanthine-guanine phosphoribosyitransferase (hpt) 

ORF0301 1 ribosomal protein L33 

QRF03Q14 ribosomal protein L33 m . 
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Table 10: GBS gen s shared with GAS 

ORFxxxxxAnn tati n 

ORF00064 ribosomal protein S14, putative 

ORF00095 D-alanyl-D-alanine carboxypeptidase family protein 

ORF00096 N-acetyimuramoyl-L-alanine amidase, family 4 protein 

ORF001 10 conserved hypothetical protein ; • 

ORFQ01 12 DNA repair protein RadA (radA) 

ORF00124 permease, putative [ 

ORF00148 giycosyi transferase, group 4 family protein 

ORF00154 penicillin-binding protein 4, putative 

ORFQQ1 57 oligopeptide ABC transporter, permease protein 

ORF00206 oligopeptide ABC transporter, oligopeptide-binding protein 

ORF00207 oligopeptide ABC transporter, permease protein _J 

ORF00208 oligopeptide ABC transporter, permease protein . 

• ORF00209 peptide ABC transporter, ATP-binding protein 

ORF00210 peptide ABC transporter, ATP-binding protein 

QRF00216 IS 1548, transposase 

ORF00226 conserved hypothetical protein 

ORF00232 conserved hypothetical protein ' 

ORF00239 site-specific recombinase, phage integrase family 

ORF00250 conserved hypothetical protein " 

QRF00251 conserved hypothetical protein " 

ORF00289 ABC transporter, ATP-binding protein ^ 

ORF00305 NADH oxidase, putative ' 

ORF00317 cell division protein FtsL, putative 

ORF00333 conserved hypothetical protein / 

ORF00383 hydrolase, haloacid dehalogenase-iike family 

ORF00430 expressed putative lipoprotein • , , 

ORF00431 transcriptional repressor CopY , 

ORF00434 membrane protein, putative 

ORF00438 transcriptional regulator, Fur family 

ORF00442 membrane protein, putative = 

ORF00445 bioY family protein ; ; 

ORF00446 AtsA/ElaC family protein 

ORF00468 expressed putative protease . 

ORF00469 giycosyi transferase, group 2 family protein . 

ORF00471 nrdl protein (nrdi) 

ORF00473 expressed protein of unknown function . 

ORF00474 conserved hypothetical protein 

ORF00507 conserved hypothetical protein 

ORF00525 bioY family protein 

ORF00528 thiolase 

QRF00531 AMP-binding enzyme domain protein 

ORF00548 YGGT family protein 

ORF00565 exodeoxyribonuclease VII, small subunit (xseB) 

QRF00568 arginine repressor ArgR, putative 

ORF00572 expressed putative lipase/acyihydrolase 

ORF00573 conserved hypothetical protein 

ORF00586 iron-sulfur cluster-binding protein, putative 

ORF0Q592 oxidoreductase, short chain dehydrogenase/reductase family 

ORF00604 dipeptidase 

ORF0061 1 voltage-gated chloride channel family protein __ 

ORF00619 prophage LambdaSal, repressor protein, putative 

ORF00622 conserved hypothetical protein 

QRF00627 prophage LambdaSal, antirepressor. putative 

ORF00634 cons rved hypothetical protein 

ORF00848 conserved hypothetical protein 
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Table 6 

S AG2039 conserved hypothetical protein 

SAG2044 hypothetical protein 

SAG2052 hypothetical protein 

SAG2065 ribosomal protein L33 

SAG2094 , competence/damage-inducibie protein CinA/authentic frameshift 

SAG2099 hypothetical protein 

Cluster 12 

SAG1 164 glycosyl transferase CpsJ(V) 

SAG1165 glycosyl transferase CpsO(V) 

SAG1166 glycosyl transferase CpsN(V) 

S AG1 1 67 polysaccharide biosynthesis protein CpsM(V) 

S AG1 1 68 polysaccharide biosynthesis protein cpsH(V) 



Cluster 13 

S AG058 1 conserved hypothetical protein 

SAGOS 82 conserved hypothetical protein 

SAGOS 83 conserved hypothetical protein 

SAG0585 conserved hypothetical protein 

SAG0586 conserved hypothetical protein 

SAG0587 prophage LambdaSal, structural protein, putative 

SAG0588 conserved hypothetical protein 

SAG0589 conserved hypothetical protein 
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SAG0590 conserved hypothetical protein 

S AG059 1 conserved hypothetical protein 

SAG0593 prophage LambdaSal , structural protein 

SAG0594 conserved hypothetical protein 

SAG0595 conserved hypothetical protein 

SAG0596 prophage LambdaSal , pblA protein, internal deletion 



Cluster 14 

SAG0915 Tn916, transposase 

SAG0918 Tn916,^h^othetical protein 

SAG0919 Tn916, hypothetical protein 

SAG0921 Tn916, transcriptional regulator, putative 

SAG0925 Tn916, hypothetical protein 

SAG0926 Tn916,NLP/P60 family protein 

SAG0927 membrane protein, putative 

SAG0929 Tn916, hypothetical protein 

SAGO930 Tn916, hypothetical protein 

S AG093 1 . Tn9 1 6, hypothetical protein 

SAG0932 Tn916, transcriptional regulator, putative 

SAG0933 Tn916, FtsK/SpoIHE family protein 

SAG0934 Tn916, hypothetical protein 

SAG0935 Tn916, hypothetical protein 

SAG0937 ABC transporter, ATP-binding protein, authentic frameshift 
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Cluster 15 

SAG1835 conserved hypothetical protein 

SAG1837 * prophage LambdaSa2, lysin, putative 

SAG1839 conserved hypothetical protein 

SAG1840 hypothetical protein 

S AG1 842 prophage LambdaS2|2, PblB, putative 

SAG1843 conserved hypothetical protein 

SAG1 844 conserved hypothetical protein 

SAG1849* hypothetical protein 

SAG1851 conserved domain protein 

SAG1852 conserved domain protein 

S AG1 853 prophage LambdaSa2, protease, putative 

S AG1 854 conserved hypothetical protein 

SAG1855 prophage LambdaSa2, terminase large subunit, putative 

S AG1 856 hypothetical protein 

SAG1 858 hypothetical protein 

SAG1859 prophage LambdaSa2, site-specijfic recombinase, phage integrase family 

SAG1860 conserved hypothetical protein 

SAG1861 prophage LambdaSa2, transcriptional regulator, Cro/CI family 

SAG1862 hypothetical protein 

S AG1 863 prophage LambdaSa2, single-strand binding protein 

S AG1 865 conserved hypothetical protein 
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S AG1 866 conserved hypothetical protein 
SAG1 867 conserved hypothetical protein 

S AG1 870 prophage LambdaSa2, DNA replication protein DnaC, putative 

S AG1 87 1 prophage LambdaSa2, bacteriophage replication protein/hypothetical 

protein, trunc^oq/fiision 

SAG1 873 prophage LambdaSa2, replicative DNA hehcase 

prophage LambdaSa2, antirepressor protein, putative 
hypothetical protein 

prophage LambdaSa2, repressor protein, putative 
hypothetical protein 



SAG1877 
SAG1879 
SAG1882 
SAGI884 
SAG1885 



prophage LambdaSa2, site-specific recombinase, phage integrase family 



Cluster 16 

SAG1247 site-specific recombinase, phage integrase family 

SAG1250 Tn5252, relaxase 

SAG1251 Tn5252, Orf 9 protein 

SAG1252 Tn5252, Orf 10 protein 

S AG1 256 IS86 1 , transposase OrfB, truncation 

SAG1257 cation-transporting ATPase, E1-E2 family 

SAG1258 cadmium efflux system accessory protein 

SAG1259 conserved hypothetical protein 

SAG1260 hypothetical protein 

SAG1261 conserved hypothetical protein 
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cation-transporting A lipase, xii-rsz iamiiy 


SAG1263 


conserved domain protein, authentic frameshift 


SAG1264 


transcriptional repressor CopY, putative 


SAG1265 


cadmium resistance transporter, putative 


SAG1266 


hypothetical protein 


SAG1267 


'hypothetical prdtein 


SAG1268 


repressor protein, putative 


SAG1270 


hnpB/MucB/SamB family protein 


SAG1271 


conserved hypothetical protein 


SAG1272 


conserved hypothetical. protein 


SAG1273 


conserved hypothetical protein 

- , - - 


SAG1274 


conserved hypothetical protein 


SAG1276 


conserved hypothetical protein 


SAG1277 


hypothetical protein 


SAG1278 


hypothetical protein 


SAG1279 


conserved domain protein 


SAG1280 


SNF2 family protein 


SAG1281 


hypothetical protein 


SAG1283 


agglutinin receptor 


SAG1284 


abortive infection protein AbiGI 


SAG1285 


abortive infection protein AbiGII 


SAG1286 


Tn5252, Orf28 


SAG1287 


Tn5252, Orf26 
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SAG1285 


T 1 ** COCO /~v._^p"> C /lArrpn ProtA 

lnoz->Z, unz^, degenerate 


SAG1289 


Tn5252, Orf23 


SAG1290 


hypothetical protein 


SAG1291 


Tn5252, Orf 21 protein, internal deletion 


SAG12^T 


hypothetical protein 


SAG1293 


protease, putative 


SAG1294 


conserved hypothetical protein 


SAG1295 


conserved hypothetical protein 


SAG1296 


conserved hypothetical protein 


SAG1297 


C-5 cytosine-specific DNA methylase 


SAG1299 


conserved hypothetical protein 


SAG1304 


hypothetical protein 
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T .nriK 


. A nnnf fi'rinn 

• AUUU14UU11 


llv UOwlVvvy iilc 




SAG0466 


UUUJIClOw 




giucoKinase 




amino acici /vd^ transporter, /v i i -oinciing protein 


SAG0767. 


D-alanine— D-alapine ligase 


SAG1086 


xanthine phosphorijosyltransferase 




-a 

giuiamaie raccmase 


O/YVJlOoU 


snijainaie d -oenyorogenase 


O/A.VJI / Z*D 


ci on a 1 npntiHacp T 

bigiiai pcpiiuatsc i 


ouridC/c-exposcu 


- 


Q A flfMY70 


aaeny late Kinase 




i^-aianyi-i^- alanine carDoxypepiiaase iamny protei 


OAuu 1 Oj 


competence protein i^gi/v 




adl uaiibporier, suuou ate- oinuing protein 




pi \J twill V/l UUiUlU WJU JLUllvllUU 


SAG0503 


upaow av/jr iiiy uiuiaov 


SAG1473 


cell wall surface anchor family protein 


SAG1552 


conserved hypothetical protein 


SAG1641 


YaeC family protein 


SAG2147 


protein of unknown fiinction/lipoprotein, putative 


SAG2148 


LysM domain protein 
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ORFxxxxx Annotation 

ORF00003 PcsB protein (pscB) 

ORF00004 ribose-phosphat pyrophosphokinase (prsA) 

ORF00005 aminotransferase, class 1 [ 

ORF00006 recombination protein O 

ORF00009 fatty acid/phospholipid synthesis protein PisX (pisX) 

ORF00011 phosphoribosylaminoimidazole-succinocarboxamide synthase (purC) 

ORF00012 phosphoribosylformyiglycinamidine synthase, putative 

ORF00013 amidophosphoribosyltransferase (purF) 

ORF00014 phosphoribosylformylglycinamidine cyclo-ligase (purM) 

ORF00015 phosphoribosylglycinamide formyltransferase (purN) . 

ORF00020 group B streptococcal surface immunogenic protein ' 

ORF00021 N-acetylmannosamine-6-P epimerase, putative 

ORFQQ022 sugar ABC transporter, sugar-binding protein , 

ORF00023 .sugar ABC .transporter, permease protein 

ORF00024 sugar ABC transporter, permease protein 

ORF00026 cbnserved hypothetical protein 

ORF00027 N-acetyineuraminate lyase, putative 

ORF00028 expressed ROK famiiy protein _^ 

ORF00030 phosphosugar-binding transcriptional regulator, RpiR family, putative 

ORF00031 phosphoribosylamine-glycine iigase (purD) 

ORF00032 phosphoribosylaminoimidazole carboxylase, catalytic subunit (purE) z 

ORF00033 phosphoribosylaminoimidazoje carboxylase,, ATPase subunit (purK) * 

ORF00036 adenylosuccinate lyase (purB) * 

ORF00037 transcriptional regulator, Cro/CI family -j_ 

ORF00038 Holliday junction DNA helicase RuvB (ruvB) ; 

ORF0QP39 phosphotyrosine prQtein phosphatase, low molecular wejght - 

ORF00Q4Q MORN mbtjf c family protein . . , ' 

ORF00041 membrane protein, putative ^ ^_ 

ORF00043 alcohol dehydrogenase, propanol-preferring (adhP) 

ORF00045 MATE efflux family protein 

ORF00046 ribosomal protein S10 (rpsJ) 

ORF00047 ribosomal protein L3 (rpIC) 

QRF00048 ribosomal protein L4 (rpID) 

ORF00049Tibosomal protein L23 (rplW) 

ORF00050 ribosomal protein L2 (rplB) 

ORF00052 ribosomal protein S19 (rpsS) 

ORF00054 ribosomal protein L22 (rpIV) 

ORF00055 ribosomal protein S3 (rpsC) 

ORF00056 ribosomal protein L16 (rpIP) 

ORF00058 ribosomal protein L29 (rpmC) 

QRF00059 ribosomal protein S17 (rpsQ) 

ORF00060 ribosomal protein L14 (rpIN) 

ORF00061 ribosomal protein L24 (rpiX) 

ORF00083 ribosomal protein L5 (rplE) 

ORF00065 ribosomal protein S8 (rpsH) 

QRF00066 ribosomal protein L6 (rplF) 

ORF00068 ribosomal protein L18 (rpIR) 

ORF00069 ribosomal protein S5 (rpsE) 

ORF00070 ribosomal protein L30 (rpmD) 

ORF00071 ribosomal protein L15 (rpIO) 

ORF00072 preprotein translocase, SecY subunit 

QRF00073 adenylate kinase (adk) 

ORF00074 translation initiation factor IF-1 (infA) 

ORF00075 ribosomal protein L36 (rpmJ) 

ORF00077 ribosomal protein S13 (rpsM) 
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ORFxxxxx Annotati n ; 

ORF00078 ribosomal protein S1 1 (rpsK) 

ORF00080 DNA-directed RNA polymerase, alpha subunit (rpoA) 

ORFQQ093 transcriptional regulator ComX1 , putative ; 

ORF00094 phosphoglycerate mutase family protein 

ORF00097 heat-inducible transcription repressor HrcA (hrcA) 

ORF00098 heat shock protein GrpE (grpE) 

ORF00099 dnaK protein (dnaK) 

ORF00100 dnaJ protein (dnaJ) ^ ; , 

ORFOOIOi transcriptional regulator, GntR family ; 

ORF00102 tRNA pseudouridine synthase A (truA) ] 

ORF00l03phosphomethylpyrimtdine kinase, putative 

ORF00104 conserved hypothetical protein ■ , • 

, ORF00105 conserved hypothetical protein , 

ORF00106 conserved hypothetical protein 0 

ORF001 07 trigger factor (tig) ' 

QRF00108 DNA-direpted RNA polymerase, delta subunit, putative 

ORFOQI 09 CTP synthase (pyrG) I L 

ORF001 1 1 deoxyuridine 5^-triphosphate nucleotidohydrolase (dut) 

ORF001 13 carbonic anhydrase-related protein 

ORF0Q1 15 pyridine nucleotide-disulphidepxidoreductase family protein 

ORF001 16 glutamyt-tRNA synthetase (gltX) 

ORF001 19 ribose ABC transporter, ATP-binding protein (rbsA) 

ORF00122 ribose operon repressor RbsR (rbsR) 

ORF00125 ABC transporter, ATP-binding protein 

QRF00126 DNA-bipding response regulator \ • n 

ORF00128 sensor histidihe kinase , , _ V 

ORF00131 fructose-bisphosphate aldolase (fba) . • 

ORF00132 L-2-hydroxyisocaproate dehydrogenase . . ' 

QRF00133 ribosomal protein L28 (rpmB) 

ORF00134 conserved hypothetical protein 

ORF00135 DAK2 domain protein . 

ORF00136 expressed SPFH domain/Band 7 family protein 

QRF00141 amino acid ABC transporter, ATP-binding protein 

ORF00142 amino acid ABC transporter, amino acid-binding protein/permease protein 

ORF00143 conserved hypothetical protein 

ORF00145 undecaprenol kinase, putative . 

ORF00146 negative regulator of competence MecA, putative 

QRF00149 ABC transporter, ATP-binding protein 

ORF00150 conserved hypothetical protein 

ORF00151 selenocysteine lyase (csdB) 

ORF00152 NifU family protein 

ORF00153 conserved hypothetical protein 

ORF00155 D-alanyl-D-alanine carboxypeptldase 

ORF00158 oligopeptide ABC transporter, permease protein 

ORF00160 oligopeptide ABC transporter, ATP-binding protein 

ORF00161 oligopeptide ABC transporter, ATP-binding protein 

ORF00167 adc operon repressor AdcR (adcR) 

ORF00168 zinc ABC transporter, ATP-binding protein 

ORF00169 zinc ABC transporter, permease protein 

ORF00172 tyrosyl-tRNA synthetase (tyrS) 

ORF00173 penicillin-binding protein 1B, putative 

ORF001 74 DNA-directed RNA polymerase, beta subunit (rpoB) 

ORF00176 DNA-dlrected RNA polymerase beta' subunit (rpoC) " ' 

ORF00178cons tved hypothetical protein t 

ORF00179 competence protein CgIA (cglA) 
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ORFxxxxx Annotation 

ORF001 80 competence prot in CgIB (cglB) 

ORF00181 conserved hypothetical protein 

ORF00183 conserved hypothetical protein 

ORF00184 acetate kinase (ackA) 

ORF00190 pyrroline-5-carboxylate reductase (proC) 

ORF00191 glutamyl-aminopeptidase (pepA) 

ORF00198 single-strand binding protein (ssb) . 

QRF00211 PTS system, 1 1 ABC components 

ORF00212 alpha amylase family protein 

ORF00214 transcriptional antitermlnator, BgIG family 

QRF00219 PTS system, HC component, putative . , 

ORF00224 ribosomal protein S15 (rpsO) ; 

ORF00225 polyribonucleotide nucleotidyltransferase (pnp) 

ORF00227 serine O-acetyltransferase. (cysE) . ■ . 

ORF00229 cysteinyl-tRNA synthetase (cysS) 

ORF00230 conserved hypothetical protein : 

ORF00231 RNA methyltransferase, TrmH family, group 3 • 

ORF00233 DegV family protein : 

, QRF00236 ribosomal protein L13 (rplM) . 

ORF00237 ribosomal protein S9 (rpsl) 

ORF00261 transcriptional regulator MutR family 

ORF00262.transporter, putative ; • _ 

ORF00263 amino acid ABC transporter, permease protein , 

ORF00264 amino acid ABC transporter, amino acid-binding protein 

ORF00265 amino acid ABC transporter, permease protein 

ORF00266 amino acid ABC transporter, ATP-binding protein • 

ORF00295 N-acetytgiucosamine-6-phosphate deacetytase (nagA) 

ORF00296 conserved hypothetical protein • • 

ORF00297 glycyl-tRNA synthetase, alpha subunit (glyQ) 

ORF00299 glycyl-tRNA synthetase, beta subunit (glyS) ■ 

ORF00300 conserved hypothetical protein " 

QRF00302 glycerol kinase (gipK) 

ORF00303 alpha-glycerophosphate oxidase 

QRF00304 glycerol uptake facilitator protein (gipF) 

ORF00306 conserved hypothetical protein 

ORF00307 transketolase (tkt) 

ORF00309 ABC transporter, ATP-binding protein , 

QRF00310 membrane protein, putative 

ORF00313 PTS system, IIBC components 

ORF00314 glutamate 5-kinase (proB) 

ORF00315 gamma-glutamyi phosphate reductase (proA) 

QRF00316 conserved hypothetical protein TIGR00006 

ORF00318 penicillin-binding protein 2X (pbpX) 

ORF00319 phospho-N-acetylmuramoyl-pentapeptide-transferase (mraY) 

ORF00320 ATP-dependent RNA helicase, DEAD/DEAH box famity 

ORF00321 ABC transporter, substrate-binding protein 

ORF00322 amino acid ABC transporter, permease protein 

ORF00323 amino acid ABC transporter, ATP-binding protein 

ORF00325 thioredoxin reductase (trxB) 

ORF00326 conserved hypothetical protein 

ORF00327 NAD synthetase (nadE) 

ORF00328 aminopeptidase C (pepC) 

ORF0Q328 penlclllln-blndlng protein 1A(pbp1A) 

ORF00330 recombination protein U (recU) 

ORF00331 conserved hypothetical protein m 
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ORF00335 conserved hypothetical protein 

ORF00336 conserved hypothetical protein 

ORF00337 autoinducer-2 production protein LuxS (luxS) ; 

ORF00338 KH domain protein 

ORF00348 guanyiate kinase (gmk) 

ORF00349 DNA-directed RNA polymerase, omega subunit, putative s 

ORF00350 primosomai protein N' (priA) 

ORF003S1 methjonyl-tRNA formyltransferase (fmt) • _^ 

ORF00352 Sun protein (sun) s • 

QRF00353 serine/threonine phosphatase, putative ' 

QRF00354 serine/threonine protein kinase . : . 

ORF00355 conserved hyp6theticai protein 

« ORFQ0356 sensor histidine kinase, putative ; __■ 

ORF00358 DNA-bindihg response regulator 

ORF00359 hydrolase, haloacid dehalogenase famity/peptidyi-prolyl cis-trans isomerase, cyclophilin type 

ORF00360 general stress protein, putative • 

QRFQ0361 pyruvate formate-lyase-activating enzyme (pfIA) 

ORF00362 transcriptional regulator, DeoR family . B 

QRF00363 transcriptional regulator, putative . 

ORF00364 PTS system, celloblose-specific IIA component (ceIC) 

ORF00366 PTS system, cellobiose-specific MB component (celA) 

ORF00367 PTS system, cellobiose-specific DC component (celB) 

ORF00368 formate acetyltransferase (pfiD) , 

ORF00369 transaldolase family protein ; 

ORF0Q371 glycerol dehydrogenase (gidA) 

ORF00372 cyste'tne synthase A (cysK) J [ 

ORF00373 conserved hypothetical protein T1GR00257 

ORF00374 helicase, putative ; 

ORF00375 competence protein F, putative 

ORF00376 ribosomal subunit interface protein (yfiA) 

ORF00385 enoyl-CoA hydratase/isomerase family protein 

ORF00386 transcriptional regulator, MarR family 

ORF00387 3-oxoacyl-(acyl-carrier-protein) synthase III (fabH) 

ORF00388 acyl carrier protein (acpP) • 

ORF00390 enoyl-(acyl-carrier-protein) reductase II (fabK) 

ORF00391 malonyl CoA-acyl carrier protein transacylase (fabD) 

ORF00392 3-oxoacyHacyl-carrier protein] reductase (fabG) 

ORF00393 3-oxoacyl-(acyl-carrier-protein) synthase II (fabF) 

ORF00394 acetyl-CoA carboxylase, biotin carboxyl carrier protein (accB) 

ORF00395 (3R>hydroxymyristoyl-(acyl'Carrier-protein) dehydratase (fabZ) 

ORF00396 acetyl-CoA carboxylase, biotin carboxylase (accC) 

ORF00397 acetyl-CoA carboxylase, carboxyl transferase, beta subunit (accD) 

ORF00398 acetyl-CoA carboxylase, carboxyl transferase, alpha subunit (accA) 

ORF00400 seryl-tRNA synthetase (serS) 

ORF0Q403 conserved hypothetical protein 

ORF00404 PTS system, mannose-specific HP component 

ORF00405 PTS system, mannose-specific IIC component (manM) 

ORF00406 PTS system, mannose-specific IIAB components (manL) 

ORF00407 hydrolase, haloacid dehalogenase-like family 

ORF00410 xanthine/uracil permease family protein 

ORF00411 conserved hypothetical protein T1GR00150, putative 

QRF00412 acetyltransferase, GNAT family 

ORF0041 3 xpressed protein of unknown function 

ORF00415 HIT family protein (hit) 

ORF00419 ABC transporter, ATP-binding protein 
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ORFxxxxx Annotation 

ORF00421 ABC transport r t permease protein 

ORF0Q422 conserved hypothetical prot in 

ORF00423 conserved hypothetical protein TIGR00091 

ORF00424 conserved hypothetical protein. POINT MUTATION 

ORFQ0425 N utilization substance protein A (nusA) 

ORF00426 conserved hypothetical protein 

ORF00427 ribosomal protein L7A family 

ORF00428 translation initiation factor IF-2 . 

ORF00429 ribosome-bfnding factor A (rbf A) . 

ORF00432 copper-trahspprter ATPase CopA . ' 

ORF00435 hydrolase, haloacid dehalogenase-like family ^ 

ORF00436 DNA polymerase I (polA) 

ORF00437 CoA binding domain protein ._. 

ORF00440 PNA-binding response regulator 

ORF00441 sensor histidine kinase , ^ 

ORF00443 queuine tRNA-ribosyltransferase (tgt) 

ORF00444 conserved hypothetical protein 

ORF00449 glucose-6-phosphate isomerase (pgi) ' 

ORF00451 rhomboid family protein 

ORF0Q452 expressed putative lipoprotein , 

ORF00453 UTP-glucose-1 -phosphate uridylyltransferase (galll) . 

ORF00454 glycerol-3-phosphate dehydrogenase (NAD(P)+) (gpsA) 

ORF00455 ribonuclease P protein component (mpA) • 

ORF00456 SpolllJ family protein 

ORF00458 R3H domain protein ' 

ORF00463 conserved hypothetical protein 
ORF00464 RecX protein 

ORF00465 RN A methyltransf erase, Tnm A family 

ORF00470 ribonucleoside-diphosphate reductase 2, beta subunit (nrdF) . " • 

ORF00472 ribonucleoside-diphosphate reductase 2, alpha subunit (nrdE) 

ORF00482 alcohol dehydrogenase, zinc-containing 

ORF00483 oxidoreductase, aldo/keto reductase family 

ORF00484 cation efflux system protein 

ORF00485 transcriptional regulator, TetR family . . 

ORF00496 conserved hypothetical protein 

ORF00500 acetyltransferase, GNAT family 

ORF00501 conserved hypothetical protein . 

ORF00502 valyl-tRNA synthetase (valS) 

ORF00508 aspartate-ammonia ligase (asnA) 

ORF0051 1 type II DNA modification methyltransferase, putative 

ORF00513 phosphopantetheine adenylyltransferase (coaD) 

ORF00515 conserved hypothetical protein 

ORF00519 conserved hypothetical protein 

ORF00520 conserved hypothetical protein TIGR00048 

ORF00522 ABC transporter, ATP-blnding/permease protein 

ORF00523 ABC transporter, ATP-blnding/permease protein 

ORF00524 anthranilate synthase component II (trpG) 

ORF00532 endonuclease 111 (nth) 

ORF00534 conserved hypothetical protein 

ORF00535 glucokinase (glk) 

ORF00536 expressed protein with rhodanese domain 

ORF00537 elongation factor Tu family protein 

ORF00540 UDP-N-ac tylmuram ylalanlne-D-glutamate llgas (murD) 

ORF00541 UDP-N-acetylglucosamine-N-acetylmuramyl-(pentapeptide) pyrophosphoryl-undecaprenol 
acetylglucosamine transferase (murG) 
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ORF00542 cell division protein DivlB t putative 

ORF00544 cell division protein FtsA (ftsA) j 

ORF00545 cell division protein FtsZ (ftsZ) _ 

ORF00546 ylmE protein, putative 
ORF00547 ylmF protein (ylmF) 

ORF00549 yimH protein (ylmH) ; 

ORFQ0550 cell division protein DivlVA. putative , 

ORF00552 isoleucyl-tRNA synthetase (ileS) , • 

ORF00553 conserved hypothetical protein 

ORF00554 MutT/nudix family protein - 

ORF00555 ATP-dependent Clp protease, ATP-binding subunit 

ORF00557 conserved hypothetical protein ; * 

ORF00558 amino acid ABC transporter, permease protein 

ORF00559 amino acid ABC transporter, ATP-binding protein 

ORF00560 phosphoglucomutase/phosphomannomutase family protein 

ORF00562 methylenetetrahydrofolate dehydrogenase/methenyltetrahydrofolate cyclohydrolase (folD) 

. ORF00564 exodeoxyribonuclease VII, large subunit (xseA) 

ORF00566 geranyitranstransferase, putative 

ORF00567 hemolysin A a . 

ORF00570 DNA repair protein RecN (recN) 

ORF00571 expressed DegV family protein 

ORF00574 DNA-binding protein HU (hup) - ' ' 

ORF00576 dihydroorotate dehydrogenase A (pyrDA) 

ORF00577 bete-lactam resistance factor (fibB) 

ORF00578 beta-lactam resistance factor (fibA) 

^ ORF00579 murM protein, putative " - 

ORF0058Q hydrolase, haloacid dehalogenase-tike family 

ORF00581 HP domain protein " 

ORF00582 conserved hypothetical protein 

ORF00583 cation-transporting ATPase, E1-E2 family 

ORF00588 cell division ABC transporter, ATP-binding protein FtsE (ftsE) 

ORF00589 cell division ABC transporter, permease protein FtsX (ftsX) 

ORF00591 metalto-beta-lactamase superfamily protein 

ORF00593 DNA polymerase ill, epsilon subunit/ATP-dependent helicase DinG 

ORF00595 aspartate aminotransferase (aspC) 

ORF00596 asparaginyl-tRNA synthetase (asnS) 

ORF00601 conserved hypothetical protein 

ORF00602 conserved hypothetical protein 

ORF00603 conserved hypothetical protein 

QRF00605 zinc ABC transporter, zinc-binding adhesion liprotein 

ORF00606 ribosomal protein L31 (rpmE) 

ORF00607 DHH family protein 

ORF00609 flavodoxin 

ORF00614 ribosomal protein L19 (rpIS) 

ORF00640 prophage LambdaSal , single-strand binding protein (ssb) 

ORF00693 DNA-binding response regulator VncR (vncR) 

ORF00694 sensor histidine kinase VncS (vncS) 

ORF00699 rod shape-determining protein RodA, putativeD (rodA) 

ORF00700 hydrolase, haloacid dehalogenase-like family 

ORF00701 DNA gyrase, B subunit (gyrB) 

ORF00702 septation ring formation regulator EzrA, putative 

ORF00705 conserved hypothetical protein 

ORF00706 enolase (eno) 

ORF00708 3-phosphoshlkimate 1-carboxyvinyltransf erase (aroA) 

ORF00709 shikimate kinase (aroK) 
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ORF00710 psr protein 

ORF0071 1 RNA methyltransferase, TrmA family 

ORF00729 sortase family protein 

QRF00731 sortase family protein 

ORF00734 sortase family protein, FRAMESHIFT 

ORF00743 ABC transporter, ATP-binding protein 

QRF00744 membrane protein __ 

. ORF00745 conserved hypothetical protein , . ~~ 

ORF00748 cylG protein (cylG) ' - % . __ . 

ORF00776 DNA-entry nuclease, putative ; ; 

ORF00789 2-ketOH3-deoxygluconate kinase " " . 

ORF00792 2<lehydro-3-depxyphosphogluconate aldolase/4-hydroxy-2-oxoglutarate aldolase (eda) 

ORF00798 proline dipeptidase (pepQ) • 

ORF00799 transcriptional regulator, RegM family , a 

ORF00802 glycosyl transferase, group 1 family protein 

ORF00803 threonyl-tRNA synthetase (thrS) 

ORFQ0804 DMA-binding response regulator 

ORF00808 amino acid ABC transporter, permease protein 

ORF00810 amino acid ABC transporter, ATP-binding protein 

ORF00811 DNA-binding response regulator ; ' ■ 

ORF00812 sensory box histidine kinase • 

ORF00813 metallo-beta-lactamase family protein . ■_ m 

QRF00815 ribonuclease HI (rnc) ' . i . 

ORF0081 6 expressed putative chromosome segregation SMC protein * 

ORF00817 hydrolase, haloacid dehatogenase-like family M 

ORFQ081 8 hydrolase, haloacid dehalogenase-like family . 

ORF00819 signal recognition particle-docking protein FtsY(ftsY) . 

ORF00820 ABC transporter, substrate-binding protein ' • 

ORF00821 ABC transporter, permease protein, putative 

ORF00824 transcriptional accessory protein Tex, putative 

ORF00825 conserved hypothetical protein 

ORF00828 HPr(Ser) kinase/phosphatase (hprK) . 

QRF00830 prolipoprotein diacylglyceryl transferase (Igt) . 

ORF00832 conserved hypothetical protein 1 

ORF00835 peptidase, U32 family, putative 

ORF00836 peptidase, U32 family 

ORF00837 conserved hypothetical protein 

ORF00844 lysyl-tRNA synthetase (tysS) _ ; 

ORF00846 phosphoglycerate mutase family protein 

ORF00847 ebsC family protein, putative 

ORF00850 peptidase, U32 family 

ORF00855 oligoendopeptidase F, putative 

ORF00856 phosphoenotpyruvate carboxylase (ppc) 

ORF00859 cell division protein, FtsW/RodA/SpoVE family (ftsW) 

ORF00861 translation elongation factor Tu (tuf) ] 

ORF00863 triosephosphate isomerase (tpiA) 

ORF00865 phosphoglycerate mutase (gpmA) 

ORF00867 recombination protein RecR (recR) 

ORF00868 D-alanine-D-alanine ligase 

ORF00869 UDP-N-acetylmuramoylalanyl-D-glutamyl-2,6-diaminopimelate-D-alanyl-D-alanyl ligase (murF) 

ORF00870 oxalate:formate antiporter 

ORF00871 membrane protein, putative 

ORF00873 peptld chain release factor 3 (prfC) 

ORF00876 ABC transporter, ATP-binding protein 

ORF00880 ATP-dependent RNA helicase, DEAD/PEAH box family 
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ORF00882 conserved hypothetical protein __ 

ORF00883 conserved hypothetical protein 

ORF00884 acyltransferase family protein 

ORF00885 competence protein CelA (celA) 

ORF00887 DNA internalization-related competence protein ComEC/Rec2 

QRF00889 sugar-binding transcriptional regulator, Lacl family 

ORF00892 DNA polymerase III, delta subunit, putative □ 

ORF00893 superoxide dismutase, Fe-Mn (sodA) 

ORF00894 transcriptional antiterminator LicT 

ORF00895 PTS system, beta-glucosides-specific II ABC components , 

ORF00896 6-phQsphQ-beta-glucosidase (bgIA) 

ORF00899 glycerate kinase 2 (garK) . - 

ORF00904 S-adenosylmethlonine:tRNA ribosyltransferase-isomerase (queA) ; - 

. ORF00906 glucosamine-6-phpsphate isomerase (nagB) s 

ORF00908 ribosomal small subunit pseudouridine synthase . . . ■ . 

ORF0091 1 competence protein CoiA (coiA) 

QRF00912 oligoendopeptidase B (pepB) \ " 

ORF00914 O-methyltransferase family protein 

QRF00916 protease maturation protein, putative 

QRF00919 alanyl-tRNA synthetase (alaS) ; ' 

ORF00925 transcriptional regulator, Cro/CI family ^ 

ORF00928 ribonucieoside-diphosphate reductase 2, beta subunit (nrdF) 

ORF00929 ribohucleoside-diphosphate reductase 2, alpha subunit (nrdE) 

ORF00930 ribonucleoside-diphosphate reductase 2, NrdH-redoxin (nrdH) 

ORF00931 phosphocarrier protein HPr (pteH) ' 

ORF00932 phosphoenolpyruvate-protein phosphotransferase (ptsl) . 

QRF00933 glyceraldehyde-3-phosphate dehydrogenase, NADP-dependent (gapN) ' 

ORF00934 polysaccharide deacetylase family protein . 

QRF00935 ATP-<lependent RNA helicase, DEAP/DEAH box family , 

ORF00936 uridine kinase (udk) 

ORF00937 conserved hypothetical protein 

QRF00938 DNA polymerase 111, gamma and tau subunits (dnaX) 

ORF00940 biotin-acetyl-CoA-carboxylase ligase 

ORF00941 S-adenosylmethionine synthetase (metK) 

ORF00955 UDP-N-acetylglucosamine 1-carboxyvinyltransferase (murA) 

ORF00956 acetyltransferase, GNAT family 

ORF00957 CBS domain protein 

ORF00958 methionine aminopeptidase, type I (map) 

ORF00959 ribonuclease BN, putative 

ORF00962 conserved hypothetical protein 

ORF00963 DNA ligase, NAD-dependent (ligA) 

QRF00964 BmrU protein, putative 

ORF00966 pullulanase, putative 

ORF00973 ATP synthase F0, A subunit (atpB) 

ORF00974 ATP synthase F0, B subunit (atpF) 

ORF00975 ATP synthase F1 , delta subunit (atpH) 

ORF00976 ATP synthase F1, alpha subunit (atpA) 

ORF00977 ATP synthase F1 , gamma subunit (atpG) 

ORF00978 ATP synthase F1, beta subunit (atpD) 

ORF00979 ATP synthase F1, epsilon subunit (atpC) 

ORF00981 UDP-N-acetylglucosamine 1-carboxyvinyltransferase (murA) 

ORF00983 DNA-entry nuclease (endA) 

ORF00884 phenylalanyl-tRNA synthetase, alpha subunit (pheS) 

ORF00986 phenylalanyl-tRNA synthetase, beta subunit (pheT) 

ORF00988 exonuclease RexB (rexB) 
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ORFQ0989 exonuclease RexA (rexA) 

ORF00991 tRNA modification GTPase TrmE (trmE) 

ORF00992 ABC transporter, ATP-binding protein __ 

ORF00993 acetoin dehydrogenase, thymine PPi dependent, E1 component, alpha subuhit 

ORF00994 acetoin dehydrogenase, thymine PPi dependent, E1 component, beta subunit 

ORF00995 acetoin dehydrogenase, thymine PPi dependent, E2 component, dihydrolipoamide 

ORF00996 acetoin dehydrogenase, thymine PPi dependent, E3 component, dihydrolipoamide dehydrogenase 

ORF00997 lipoate-protein iigase A (IplA) - 

ORFQ0998 cobyric add synthase, putative • 

ORF00999 mur tigase family protein 

ORF01000 conserved hypothetical protein TIGR00159 ; ; : 

ORF01001 expressed protein of unknown function 

ORF01 002 phosphoglucomutase/phosphomannomutase family protein 

ORF01 005 oxygen-independent coproporphyrinogen III oxidase, putative ; 

ORF01006 conserved,hypbthetica1 protein \ 

ORF01007 hydrolase, haloacid dehalogenase-tike family 

QRF01008 conserved hypothetical protein . . 

ORF01023 GTP-bfnding protein LepA (lepA) ; 

ORF01027 PilB-related protein . . 

ORF01030 cation-transporting ATPase, E1-E2 family 

ORF01033 conserved hypothetical protein ; . 

ORF01040 Tn916, tetracycline resistance protein (tetM) 

ORF01 057 transcriptional regulator, GntR family 

ORF01058 DNA polymerase III, alpha subunit (dnaE) 

ORF01059 6-phosphofructokinase (pfk) ; . 

ORF01Q60 pyruvate kinase (pyk) , , . , 

ORF01063 glucosamine-fructose-^-phosphate aminotransferase (isomerizing) (glmS) 

ORF01066 phnA protein (phnA) ; 

ORF01068 amino acid ABC transporter, permease protein . 

ORF01069 amino acid ABC transporter, ATP-binding protein . 

ORF01070 amino acid ABC transporter, amino acid-binding protein 

ORF01072 ribosomal protein S20 (rpsT) 

ORF01073 pantothenate kinase (coaA) 

ORF01074 conserved hypothetical protein 

QRF01075 cytidine deaminase (cdd) 

ORF01076 expressed putative lipoprotein 

ORF01077 sugar ABC transporter, ATP-binding protein 

ORF01078 sugar ABC transporter, permease protein, putative 

ORF01079 sugar ABC transporter, permease protein, putative 

ORF01080 NADH oxidase (nox-2) 

ORF01081 L-lactate dehydrogenase (Idh) \ 

ORF01082 DNA gyrase, A subunit (gyrA) 

ORF01083 sortase SrtA (srtA) 

ORF01089 GMP synthase (guaA) 

ORF01090 transcriptional regulator, GntR family 

ORF01091 gid protein (gid) 

QRF01093 expressed putative lipoprotein 

ORF01097 ABC transporter, ATP-binding protein 

ORF01099 DNA-binding response regulator , 

ORF01 101 site-specific recombinase, phage integrase family 

ORF01106 signal recognition particle protein Ffh (ffh) 

ORF01108 conserved hypothetical protein 

6RF01 109 sensor hlstlJlne kinase CiaH 

ORF01110 DNA-bindlng response regulator CiaR (ciaR) 

ORF01 1 1 1 aminopeptidase N (pepN) _____ 
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ORF01 1 12 phosphate transport system regulatory protein Pholl (pholl) 

ORF01 113 phosphate ABC transporter, ATP-binding protein PstB, putativ 

ORF011 14 phosphate ABC transporter, ATP-binding protein PstB, putative 

ORF01 115 phosphate ABC transporter, permease protein PstA, putative . 

ORF01116 phosphate ABC transporter, permease protein __ 

ORF01 117 phosphate ABC transporter, phosphate-binding protein 

ORF01 118 NOL1/NOP2/sun family protein . 

ORF01 119 inositol monophosphatase family protein 

ORF01 120 conserved hypothetical protein . 

QRF01 121, conserved hypotheticial protein ; . 

ORF01 122 macrolide-efflux protein mreA/riboflavin biosynthesis protein RibF ^_ 

ORF01123 tRNA pseudouridine synthase B (truB) . . 

ORF01 125 conserved hypothetical protein . - • 

ORF01128 permease, putative ^ , ; 

ORF01129 ARC transporter, ATP-binding protein •■ 

, ORF01131 DNA topoisomerase I (topA) 

ORF01132 DprA/SMF protein, putative DMA processing factor (dprA) 

ORF01134 iron compound ABC transporter, ATP-binding protein ,„ . . 

QRF01 1 37 acetyltransferase, CysE/LacA/LpxA/NodL family , 

ORF01138 ribonuclease HII (rnhB) 

ORF01139 GTP-binding protein t 

ORF01176 carbamoyl-phosphate synthase, large subunit (carB) 

ORF01177 carbamoyi-phosphate synthase, small subunit (carA) ' *- 

ORF01 1 78 aspartate carbamoyltransferetse (pyrB) • . 

ORF01179-dihydroorotase,,multifunctiona< complex type (pyrC) ! 

ORF01180 orotate phosphoribosyltransferase (pyrE) ' 

ORF01181 orotidine S'-phosphate decarboxylase (pyrF) ■ 

ORF01183 ABC transporter, ATP-binding protein • 

ORF01184 ribonucleotide reductase, truncation ■ 

ORF01188 cardiolipin synthetase (els) 

ORF01189 formate-tetrahydrofolate ligase (fhs) : 

ORF01190 iipoate-protein ligase A (IplA) 

ORF01198 flavoprotein-related protein . 

ORF01 199 flavoprotein family protein 

QRF01200 membrane protein, putative 

ORF01201 phosphoglucomutase (pgm) 

ORF01203 1S861, transposase OrfB 

ORF01205 ABC transporter, ATP-binding/permease protein 

ORF01206 ABC transporter, ATP-binding/permease protein . 

ORF01207 conserved hypothetical protein 

ORF01208 conserved hypothetical protein , 

ORF01209 Serine hydroxymethyltransferase 

ORF01210 SuaSA^ciOmdC/YwlC family protein 

ORF01211 modification methylase, HemK family 

ORF01212 peptide chain release factor 1 (prfA) 

ORF01213 thymidine kinases (tdk) 

ORF01214 4-oxalocrotonate tautomerase (xylM) 

ORF01216 ApbE family protein 

ORF01220 xanthine permease (pbuX) 

ORF01221 xanthine phosphoribosyltransferase (xpt) 

ORF01222 guanosine monophosphate reductase (guaC) 

ORF01 227 phosphate acetyltransferase 

ORF01 228 rlbosomal large subunit pseud urldln synthase, RtuD subfamily 

ORF01229 expressed protein of unknown function 

ORF01230 GTP pyrophosphoklnase family protein 
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ORF01231 conserved hypothetical protein 

ORF01232 ribose-phosphate pyrophosphokinase (prsA) 

ORF01233 cysteine desulphurase (iscS) 

ORF01234 conserved hypothetical protein 

ORF01235 conserved hypothetical protein . 

ORF01236 DNA repair protein RadC (radC) 

ORF01238 6-phospho-beta-glucosidase (ascB) 

ORF01239 platelet activating factor, putative . 

ORF01240 hydrolase; haloacid dehalogenase-Jike family 

ORF01242 voltage-gated chloride channel family protein . 

ORF01243 sperrhidlne/putrescine ABC transporter, spenmldine/putrescinie-binding protein (potD) 
ORF01 244 spermidine/putrescme ABC transporter, permease protein (potC) 

ORF01245 spermidine/putrescine ABC transporter, permease protein (potB) ; 

ORF01246 spermldine/putrescine ABC transporter, ATP-binding protein (potA) 

ORF01247 UDP-N-acetylenolpyruvoylglucosamine reductase (murB) 

ORF01248 2-amino-4-hydroxy^-hydroxymethyldihydropteridine pyrophosphokinase (folK) 

ORF01250 dihydropteroate synthase (folP) 

ORF01251 GTP cyclohydrolase I (folE) 

ORF01252 folylpolyglutamate synthase (folC) 

ORF01259 aldehyde dehydrogenase famiiy protein 

ORF01260 membrane protein ; 

ORF01274 gls24 protein, putative ^ 

ORF01276 gls24 protein, putative 

ORF01279 conserved hypothetical protein 

ORF01282 ATP-dependent DNA helicase PcrA (pcrA) ; ■ _^ 

ORF01283 conserved hypothetical protein, FRAMESHIFT 

ORF01 284 uracil permease (uraA) ' 

ORF01285 sodium '.alanine symporter family protein . _ 

ORF01286 cation efflux family protein 

ORF01290 ribosomal protein S1 (rpsA) 

ORF01292 branched-chain amino acid aminotransferase (ilvE) 

ORF01294 DNA topoisomerase IV, A subunit (parC) 

ORF01295 DNA topoisomerase IV, B subunit (parE) 

ORF01296 membrane protein, putative 

ORF01297 uracil-DNA glycosylase (ung) 

ORF01317 transcriptional regulator, LysR family, putative 

ORF01319 purine nucleoside phosphorylase (deoD) 

ORF01321 purine nucleoside phosphorylase (deoD) 

ORF01323 phosphopentomutase (deoB) 

ORF01324 ribose 5-phosphate isomerase (rpiA) 

ORF01327 tributyrin esterase (estA) 

ORF01328 metallo-beta-iactamase superfamily protein 

ORF01329 ABC transporter, ATP-binding protein 

ORF01330 ABC transporter, permease protein 

QRF01331 conserved hypothetical protein 

ORF01332 adherence and virulence protein A (pavA) 

ORF01335 TPR domain protein 

QRF01336 membrane protein 

ORF01338 mutator MutT protein (mutX) 

ORF01339 hyaluronidase 

ORF01343 iminodiacetate oxidase, putative 

ORF01344 conserved hypothetical protein TIGR00486 __ 

ORF01345 conserved hypothetical protein 

QRF01346 DNA replication protein Dnad, putative 

ORF01347 adenine phosphoribosyltransferase (apt) 
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ORF01350 singl -stranded-DNA-specilic exonuclease RecJ (recJ) 

ORF01351 oxidoreductase, short chain dehydrogenase/reductase family 

ORF01352 metallo-beta-lactamase superfamily protein 

ORF01353 conserved hypothetical protein 

ORF01354 GTP-binding protein HflX (hflX) _ 

ORF01355 tRNA delta(2)-isopentenylpyrophosphate transferase (miaA) 

ORF01357 exfoliative toxin A, putative 

ORF01358 puliulanase, putative 

ORF01362 conserved hypothetical protein . 

ORF01 363 peptidase, M20/M25/M40 family 

ORF01364 nitroreductase family protein ' ; . . 

ORF01367 excinuclease ABC. C subunit (uvrC) - ' " 

ORF01 380 streptococcal histidine triad family protein « > 

ORF01381 laminin-biriding surface protein (Imb) _ 

ORF01397 Tn5252, relaxase ; m " 

ORF01403 mercuric reductase (merA) a ; \- : 

ORF01406 1S861 , transposase OrfB, truncation ; , 

ORF01407 cation-transporting ATPase, E1-E2 famiiy 

QRF01411 conserved hypothetical protein . 

ORF01412 cation-transporting ATPase, E1-E2 family \ 

QRF01415 transcriptional repressor CopY, putative * 

ORF01416 cadmium resistance transporter, putative . 

4 ORF01451 C-5 cytosine-specific PNA methylase . _^ 

ORFQ1453 conserved hypothetical protein ' 

ORF01455 ribosomal protein L7/L1 2 (rplL) : , 

QRF01456 ribosomal protein L10 (rpU) , ; ; 

ORF01458 ATP-dependent Clp protease, ATP-binding subunft 

ORF01467 GTP-binding protein (cgpA) , 

ORF01468 ATP-dependent Clp protease, ATP-binding subunit ClpX (dpX) 

ORF01470 dihydrofolate reductase (folA) ; ; 

ORF01471 thymidylate synthase (thyA) 

ORF01472 HMG-CoA synthase 

ORF01473 3-hydroxy-3-methylglutaryl-CoA reductase . 

QRF01474 conserved hypothetical protein 

ORF01475 hemolysin 111, putative 

ORF01476 conserved hypothetical protein T1GR00147 

ORF01479 isopentenyt-diphosphate delta-isomerase 

QRF01480 phosphomevalonate kinase 

QRF01481 diphosphomevalonate decarboxylase (mvaD) 

QRF01482 mevalonate kinase, putative 

ORF01484 DMA-binding response regulator 

ORF01491 polypeptide deformylase, putative 

ORF01495 ABC transporter, ATP-binding/permease protein 

ORF01496 ABC transporter, ATP-binding/permease protein 

ORF01498 ABC transporter, ATP-binding protein 

ORF01499 polyA polymerase family protein 

ORF01500 DegV family protein 

ORF01501 expressed protein of unknown function 

ORF01504 PTS system, fructose specific HABC components 

ORF01505 1-phosphofructokinase (fruK) 

QRF01506 lactose phosphotransferase system repressor (lacR) 

ORF01507 beta-lactam resistance factor 

ORF01 51 1 pyrldln nucleotide-dlsuiphid oxldoreductase family protein 
ORF01512 tRNA (guanine-N1)-methyltransf erase (trmD) 

ORF01513 16S rRNA processing protein RimM (rimM) 
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ORF01 51 5 transcriptional regulator, RofA family 

ORF01516 KH domain protein 

ORF01517 liposomal protein S16 (rpsP) 

ORF01518 permease, putative 

ORFQ1519 ABC transporter, ATP-binding protein 

ORF01520 conserved hypothetical protein 

ORF01523 carbamoyl-phosphate synthase, small subunit (carA) 

QRF01524 pyrimidine operon regulatory protein (pyrR) 

ORF01525 liposomal large subunit pseudouridine synthase, RluD subfamily 

ORF01526 lipoprotein signal peptidase (IspA) . 

ORF01 527 transcriptional regulator, LysR family 
ORF01528ribosom9lprdte»nL27(rpmA) . 

QRF01529 conserved hypothetical protein ; 

ORF01530 liposomal protein L21 (rplU) . . , : 

ORF01531 conserved hypothetical protein, FRAMESHIFT 

ORF01532 thiamine biosynthesis protein Thjj (thil) 

ORF01 533 cysteine desulphurase (IscS) 

ORF01536 glutathione reductase (gor) 

ORF015^7 conserved Hypothetical protein 

ORF01538 chorismate synthase (aroC) 

ORF01539 3-dehydroquinate synthase (aroB) 

ORF01 540 3-dehydroquinate dehydratase (aroD) . • 

ORF01541 conserved hypothetical protein 

ORF01543 ribosomal protein L20 (rpIT) 

QRF01 544 ribosomal protein L35 (rpml) ' ; 

ORF01 545 translation initiation factor lF-3 (infC) 

ORF01546 cytidytate kinase (cmk) 

ORF01548 ferredoxin, 4Fe-4S ; 

ORF01550 peptidase t (pepT) 

ORF01551 polysaccharide biosynthesis protein, putative 

ORF01552 UDP-N>acety1muramoylalanyl-D-glutamate-2 t 6-diaminopimelate ligase (murE) 

ORF01553 iron compound ABC transporter, ATP-bindlng protein (fepC) 

QRF01555 iron compound ABC transporter, permease protein ^ 

ORF01556 iron compound ABC transporter, permease protein 

ORF01558 inorganic pyrophosphatase, manganese-dependent (ppa) ^ 

ORF01559 pyruvate formate-lyase-activating enzyme (pflA) 

ORF01560 CBS domain protein 

QRF01561 conserved hypothetical protein 

ORF01564 PAP2 family protein 

ORF01565 membrane protein, putative 

ORF01567 expressed sortase family protein 

ORF01568 sortase family protein 

QRF01571 rogB protein FRAMESHIFT (rogB) 

ORF01587 conserved hypothetical protein ~ 

ORF01589 RNA polymerase sigma-70 factor (rpoD) 

ORF01590 DNA primase (dnaG) 

ORF01591 large conductance mechanosensitive channel protein (mscL) 

ORF01592 ribosomal protein S21 (rpsU) 

ORF01594 amino acid ABC transporter, amino acid-binding protein 

ORF01598 rhodanese family protein 

ORF01602 glycogen phosphorylase (glgP) 

ORF01603 4-alpha-glucanotransferase (malQ) 

ORF01604 maltose peron repr ssor MaIR, putatlv 

ORF01605 maltose/maltodextrin ABC transporter, maltose/maltodextrin-binding protein 
ORF01606 maltose ABC transporter, permease protein 
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ORF01607 maltose ABC transporter, permease protein - 

QRF01 61 4 preprotein translocase SecA subunit, putative . 

ORF01619 preprotein translocase SecY family protein ; . 

ORF01634 excinuclease ABC, B subunit (uvrB) 

ORF01 636 glutamine ABC transporter, glutamine-binding protein/permease protein (glnP) 

ORF01637 glutamine ABC transporter, ATP-binding protein, GlnQ putative , 

ORF01640 GTP-binding protein, GTP1/Qbg famiiy (obg) _ 

ORF01646 amidase family protein „ 

ORF01647 ribosomal smalt subunit pseudouridine synthase A (rsuA) , 

QRF01 648 oxidoreductase, aldo/keto reductase famiiy .. ; 

QRF01 651 lactoylglutathione lyase (gloA) , , 

ORF01652 glycosyl transferase, group 2 famiiy protein a . . 

ORF01654 SsrA-binding protein (smpB) • - _ I 

ORF01655 exoribonuclease, VacB/Rnb family (vacB) s ; r 

ORF01 657 preprotein translocase, SecG subunit ' , 

ORF01658 multi-drug resistance protein ; . 

ORF01662 dephospho-CoA kinase " , 

ORF01663fprmamidopyrimidine-DNAgiycosylase(mutM) 

ORF01677 GTP-binding protein Era (era) - 

ORF01678 diacylglyceroi kinase (dgkA) • ; 

ORF01679 conserved hypothetical protein TIGR00043 

ORF0l685 PhoH family protein 

ORF01 687 conserved hypothetical protein 

ORF01689 conserved hypothetical protein . J 

ORF01690 ribosome recycling factor (frr) ...... a 

QRF01691 uridytate kinase (pyrH) ___*_ « — 

ORF01693 peptide ABC transporter, ATP-binding protein FRAMESHIFT i 

ORF01697 ribosomal protein L1 (rplA) . ; , 

ORF01698 ribosomal protein L11 (rplK) • . 

ORF01706 IS861, transposase OrfB . • 

ORF01707 chorismate binding enzyme — 

ORF01708 FtsK/SpolllE family protein 

ORF01709 peptidyl-prolyl cis-trans isomerase, cyclophilin-type 

ORF01710 manganese ABC transporter, permease protein n 

ORF0171 1 manganese ABC transporter, ATP-binding protein 

ORF01712 manganese ABC transporter, manganese-binding adhesion liprotein 

ORF01713 iron-dependent transcriptional regulator ; 

ORF01714 5-meth^thioadenosine nucleosidase/S-adenosylhomocysteine nucleosidase (pfs) 

ORF01716 MutT/nudix family protein _ 

ORF01718 UDP-N-acetylglucosamine pyrophosphorylase (glmll) 

ORF01722 oxidoreductase, Gfo/ldh/MocA family 

ORF01725 gluconate 5-dehydrogenase, putative - 

ORF01726 conserved hypothetical protein 

ORF01738 branched-chain amino acid transport system II carrier protein (brnQ) 

ORF01739 methionyi-tRNA synthetase (metG) . 

ORF01745 exodeoxyribonuciease (exoA) „ 

ORF01746 conserved hypothetical protein - 

ORF01752 copper homeostasis protein CutC, putative 

ORF01755 tetrapyrrole methylase family protein 

ORF01756 conserved hypothetical protein . , — - 

ORF01758 DNA polymerase 111, delta prime subunit, putative , 

ORF01759 thymidylate kinase (tmk) — 

ORF01773 ATP-d pend nt Clp protease, pr teoiytlc aubunn CipP (<apP) 

ORF01774 uracil phosphoribosyltransferase (upp) 

ORF01777 RNA methyltransf rase, TrmH family, group 2 
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ORF01781 conserved hypothetical protein TIGR00278 

QRF01 782 ribosomal large subunit pseudouridine synthase B (riuB) 

ORF01783 conserved hypothetical protein TIGR00281 

QRF01784 conserved hypothetical protein . 

QRF01785 integrase/recombinase, phage integrase family 

ORF01786 CBS domain protein 

QRF01787 conserved hypothetical protein t 

ORF01788 HAM1 protein : ' 

ORF01789glutamateracemas6(muri) * 
ORF01791 membrane protein, putative 

ORF01792 transcriptional regulator, biotin repressor family . 

ORF01793 membrane protein, putative l . . 

QRF01795 RIMA methyltransferase. TnmH family 

ORF01796acylpftosphatase ' . . ' 

DRF01797 lipoprotein, putative , 

ORF01799 amino acid ABC transporter, permease protein . 

ORF01801 amidase family protein 

QRF01802 transcription elongation factor GreA (greA) . 

ORF01 803 conserved hypothetical protein 

ORF01804 acetyltransferase, GNAT family ^ 

ORF01 805 UDP-N-acetytmuramate-alanine ligase (murC) 

ORF01 806 conserved hypothetical protein ; 

ORF01808 expressed putative helicase \ ; ; . 

ORF0181 1 phosphoglycerate dehydrogenase-related protein 

' ORF01812 primospmal protein Dnal (dnal) ; ; ; . / 

ORF01813 conserved hypothetical protein \. , 

ORF01814 conserved hypothetical protein TIGR00244 

ORF01815 sensor histidine kinase CsrS (csrS) 

ORF01816 DNA-binding response regulator CsrR (csrR) 

ORF01817 conserved hypothetical protein ; 

ORF01818 heat shock protein HtpX (htpX) 

ORF01820 lemA protein (lemA) 

ORF01821 glucose-inhibited division protein B (gidB) 

ORF01822 sodium transport family protein 

ORF01823 potassium uptake protein, Trk family, putative 

ORF01825 ABC transporter, ATP-binding protein 

ORF01828 branched-chain amino acid transport system II carrier protein (brnQ) - 

ORF01829 alcohol dehydrogenase, zinc-containing (adh) 

ORF01830 ABC transporter, permease protein 

ORF01831 ABC transporter, ATP-binding protein 

ORF01833 expressed YaeC family protein 

ORF01834 ABC transporter, substrate-binding protein 

ORF01835 glutamine amidotransferase, class 1 

QRF01837 conserved hypothetical protein TIGR01033 

ORF01846 glycerol uptake facilitator protein (glpF) ; 

ORF01849 conserved hypothetical protein 

ORF01851 conserved hypothetical protein t ( 

ORF01852 iojap-related protein 

ORF01854 conserved hypothetical protein TIGR00488 

ORF01855 conserved hypothetical protein TIGR00482 

ORF01856 conserved hypothetical protein TIGR00253 

ORF01857 GTP-binding protein - 

ORF01868 hydrol«««, Irioaold d«halogenase«llko family " 

ORF01860 glutamyi>tRNA(Gln) amidotransferase, B subunit (gatB) 

ORF01861 glutamyl-tRNA(Gln) amidotransferase, A subunit (gatA) 
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ORF01862 glutarnyl-tRNA(Gln) amidotransferase, C subunit (gatC) 

ORF01 867 isochorismatase family protein 

ORF01869 transcriptional regulator CodY, putative __ 

ORF01870 aminotransferase, class I 

ORF01871 universal stress protein family FRAMESHIFT - 

ORF01872 hydrolase, haloacid dehalogenase-like family • 

ORF01873 asparaginase family protein 

ORF01874 shikimate 5-dehydrogenase (aroE) 

ORF01876 ATP-dependent DNA helicase RecG (recG) ' ^ 

ORF01878 alanine racemase (air) . q • 

ORF01879 holo-(acytearrier-protein) synthase (acpS) , 

ORF01881 preprotein translocase, SecA subunit (secA) 

ORF01882 mannose-6-phosphate isomerase, class 1 (manA) 

ORF01 883 fructokinase (scrK) ; 

ORF01885 PTS system II ABC components ° 

ORF01886 sucrose-6-phosphate hydrolase (scrB) ' 

ORF01887 sucrose operon repressor ScrR(scrR) 

ORF01888 N utilization substance protein B (nusB) 

ORF01889 conserved hypothetical protein 

ORF01890 translation elongation factor P (efp) 

ORF01900 cytidine/deoxycytidylate deaminase family protein 

ORF01906 excinuclease ABC, A subunit (uvrA) 

ORF01907 conserved hypothetical protein 

ORF01908 magnesium transporter, CorA family (corA) 
ORF01909 ribosomal protein S1 8 (rpsR) 

ORF01910 single-strand binding protein (ssb) - 

ORF01911 ribosomal protein S6 (rpsF) ' 

ORF01912 A/G-specific adenine glycosylase (mutY) 

ORF01914 thioredoxin (trx) . , 

ORF01915 PAP2 family protein 

ORF01916 MutS2 family protein 

ORF01917 conserved hypothetical protein 

ORF01918 conserved hypothetical protein 

ORF01919 ribonuclease Hill (mhC) 

ORF01920 signal peptidase 1 

ORF01921 helicase, putative 

ORF01923 DNA-damage Inducible protein P (dinP) 

ORF01 924 formate acetyltransferase (pfID) 

ORF01926 conserved hypothetical protein 

ORF01927 proteinase, putative, degenerate, FRAMESHIFT 

ORF01929 glycerol uptake facilitator protein, putative 

ORF01930 universal stress protein family 

ORF01933 X-pro dipeptidyl-peptldase (pepX) 

QRF01937 ABC transporter, ATP-blnding protein CydC (cydC) 

ORF01938 ABC transporter, ATP-binding protein CydD 

ORF01945 conserved hypothetical protein TIGR00103 

ORF01948 exonuclease 

ORF01949 conserved hypothetical protein 

ORFQ1950 conserved hypothetical protein T1GR00275 

ORF01952 ribosomal protein S14 (rpsN) 

ORF01957 O-sialoglycoprotein endopeptidase family protein 

ORF01958 ribosomal-proteirhalanine acetyltransferase, putative 

ORF01 860 expressed protein f unknown fun ctl n - — 

ORF01961 conserved hypothetical protein 

ORF01962 metallo-beta-iactamase superfamily protein 
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I ORF01963 conserved hypothetical protein 



ORF01964 glutamine synth tase. type I (glnA) 



ORF01965 transcriptional regulator GlnR (glnR) 



IORF01967 conserved hypothetical protein 
ORF01969 phosphoglycerate kinase (pgk)" 



IORF01971 glyceraldehyde 3-phbsphate dehydrogenase (gap) 



|ORF01972 translation elongation factor G (fusA) 



lQRF01973Tibosomal protein S7 (rpsG) 



ORF01974 ribosomal protein S12 (rpsL) 



IORF01975 pur operon repressor (purR) 



ORF01976 HP domain protein 



ORF.01977 conserved hypothetical protein 



I ORF01978 conserved hypothetical protein 



IORF01979 ribulose-phosphate 3-epimerase (rpe) 



IORF01980 conserved hypothetical protein T1GR00157 



1ORF01983 dimethyladenosine transferase (ksgA) 



IORF01985 primase-related protein 



IORF01987 deoxyribonuclease, TatP family 



IORF01992 dltD protein (dltD) 



ORF01993 P-alanyl carrier protein (dltC) 



1ORF01994 dltB protein (ditB) 



QRF01996 P-alanine-activating enzyme (dltA) 



IQRF01997 sensor histidine kinase 



IORF01998 DNA-bindjng response regulator 



[ORF01999 ribosomal protein L34 (rpmH) 



IORF02004 amino acid ABC transporter, ATP-bindihg protein 



IORF02007 conserved hypothetical protein 



ORF02008 transcriptional antitermiriator, BglG family 



I ORF02017 sugar binding transcriptional regulator, Laclfamily 



1QRF02018 transaldolase family protein 



1ORF02019 carbohydrate isomerase, AraD/FucA family 



IORF02020 hexulose-6-phosphate isomerase, putative 



ORF02021 hexulose-6-phosphate synthase, putative 



ORF02022 PTS system, llA component 



ORF02023 PTS system, HB component 



IORF02024 transport protein SgaT, putative 



QRF02027 adenylosuccinate synthetase (purA) 



1 ORF02033 chaperonin, 33 kDa (hslO) 



ORF02034 NifR3/Smm1 family protein 



I QRF02037 ATP-dependent Clp protease, ATP-binding subunit 
ORF02038 transcriptional regulator CtsR (ctsR) 



1ORF02040 translation elongation factor Ts (tsf) 



IORF02041 ribosomal protein S2 (rpsB) 



IORF02043 alky! hydroperoxide reductase, subunit F (ahpF) 



1ORF02076 prophage LambdaSa2, single-strand binding protein (ssb) 

ORF02082 prophage LambdaSa2 t type II PNA modification methyltransferase, putative 



ORF02086 prophage LambdaSa2, replicative DNA helicase (dnaC) 



QRF02104 endopeptidase O (pepO) 



ORF021 10 polypeptide deformylase (def) 



ORF02111 sugar binding transcriptional regulator RegR (regR) 



IQRF02112 conserved hypothetical protein 



1 ORF02113 PTS system, HP component 



IORF02114 PTS iytt m, IIC component 



[ORF02115 PTS s^tem, tIB component 



IORF02116 glucuronyl hydrolas 
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ORF021 18 PTS system, HA component 

ORF02120 oxidoreductas , short-chain dehydrogenase/reductase family 

ORF02121 conserved hypothetical protein . . 

QRF02122 carbohydrate kinase, PfkB family 

ORF02123 2-dehydro-3-deoxyphosphogluconate aldolase/4-hydroxy-2-oxoglutarate aldolase (eda) 

ORF02127 DNA polymerase III, alpha subunit, Gram-positive type . 

ORF02129 prolyl-tRNA synthetase (proS) • 

ORF02130 membrane-associafed zinc metalloprotease, putative 

ORF02131 phosphatidate cytidylyitransferase (cdsA) 

ORF02132 undecaprenyl diphosphate synthase (uppS) 

ORF02133 preprotein translocgse, YajC subunit (yajC) • 

ORF02140 glucan 1 ,6-alpha-glucosidase (dexB) 

ORF02141 sugar ABC transporter, ATP-binding protein (msmK) 

ORF02142 helix-tum-helix domain protein, fis-type 

ORF021 44 tagatose 1 ,6-diphosphate aldolase (lacD) 

ORF02145 tagatose-6-phosphate kinase (lacC) 

ORF02146 galactose-6-phosphate isomerase, LacB subunit (lacB) 

ORF02147 galactose-6-phosphate isomerase, LacA subunit (lacA) 

ORF02149 PTS system, HC cpmponent, putative 

ORF02150 PTS system, MB component, putative 

ORF02152 PTS systeqn, HA component, putative = 

ORF02153 lactose phosphotransferase system repressor (lacR) 

QRF021 57 adhesion lipoprotein . 

ORF021 58 expressed protejn of unknown function T1GR00256 

ORF02159 GTP pyrophosphokinase (relA) • ; 

QRF02161 nrdl protein (nrdl) . . . 

ORFQ2164 iron ABC transporter, iron-binding protein 

ORF02165 PNA-binding response regulator 

ORF021 67 PTS system, HP component 

ORF02168 PTS system, HC component 

ORF02174 ABC transporter, ATP-binding protein 

ORF02176 response regulator . 

ORF02177 conserved hypothetical protein 

ORF02178 PTS system, llABC components 

QRF02179 sensor hlstidine kinase ^ 

ORF02180 phosphate regulon response regulator PhoB (phoB) 

ORF02182 phosphate ABC transporter, ATP-binding protein (pstB) 

QRF02183 phosphate ABC transporter, permease protein 

ORF02184 phosphate ABC transporter, permease protein 

QRF02188 conserved hypothetical protein TIGR00046 

ORF02189 ribosomal protein L11 methyltransferase (prmA) 

ORF02197 conserved hypothetical protein 

ORF02199 ATPase, AAA family 

ORF02249 mercuric reductase (merA) 

QRF02272 DNA topology modulation protein FlaR, putative 

ORF02273 glycerol dehydrogenase, putative 

QRF02281 DNA-blnding response regulator 

ORF02285 leucyl-tRNA synthetase (leuS) 

ORF02290 transcription antitermination protein NusG (nusG) 

ORF02293 penicillin-binding protein 2A (pbp2A) 

ORF02294 ribosomal large subunit pseudouridine synthase, RluD subfamily 

ORF02296 phosphopentomutase (deoB) 

ORF02297 deoxyrlboae-phoaphate aldolase {deoC) 

ORF02300 uridine phosphorylase (udp) 

ORF02302 60 kda chaperonin (groEL) ____ 
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ORF02303 chaperonin, 10 kPa (groES) 

ORF02305 ABC transporter, ATP-binding protein 

ORF02306 ABC transporter, permease protein , 

ORF02307 expressed putative lipoprotein ^ , 

ORF02309 glyoxalase family protein _ \ 

ORF02310 conserved hypothetical protein , 

ORF0231 1 anaerobic ribonucleoside-triphosphate reductase activating protein (nrdG) 

ORF02312 acetyltransferase, GNAT family ; ■ 

QRF02315 anaerobic ribonucleoside-triphosphate reductase (nrdD) <» 

ORF02318 consented hypothetica) protein , 2 - 

ORF02320 conserved hypothetical protein . ; 

ORF02321 conserved hypothetical protein - 

ORF02322 recA protein (recA) , ■ 

QRF02325 PNA-3-methyladenine glycosylase I (tag) 

ORF02327 Holliday junction DMA helicase RuvA (ruvA) 

ORF02329 DNA mismatch repair protein HexB (hexB) , 

ORF02333 arginine repressor ArgR, putative _ - 

ORF02334 arginyl-tRNA synthetase (argS) - . 

: ORF02337 conserved hypothetical protein \ 

ORF02338 conserved hypothetical protein . 

ORF02339 aspartyl-tRNA synthetase (aspS) ._. ■ 

J ORF02340 histidyl-tRNA synthetase (hisS) : , 

QRF02342 ribosomal protein L33 (rpmG) . ._ 

ORF02357 DNA-bintiing response regulator • . . , 

ORF02359 membrane protein, putative , a ; , .- 

ORF02360 carbamate kinase (arcC) ; ' . . . . 

ORF02361 ornithine carbamoyitransferase (argF) ____ 

ORF02364 amino acid ABC transporter, ATP-binding protein 

ORF02365 amino acid ABC transporter, permease and amino acid-binding protein 

ORF02370 membrane protein, putative . 

ORF02371 transcriptional regulator, TetR family, putative ; ■ 

ORF02373 ribosomal protein S4 (rpsP) . 

ORF02374 conserved hypothetical protein — ; 

ORF02375 replicative DNA helicase (dnaC) , 

ORF02376 ribosomal protein L9 (rpll) 

ORF02377 DHH family protein : 

ORF02378 glucose inhibited division protein A (gidA) 

ORF02380 tRNA (5-methylaminomethyl-2>thiouridyiateVmethyltransferase (trmU) 

ORF02381 L-serine dehydratase, iron-sulfur-dependent, beta subunit (sdhB) 

QRF02382 L-serine dehydratase, iron-sulfur-dependent, alpha subunit (sdhA) 

ORF02385 cobalt transport family protein 

ORF02386 ABC transporter, ATP-binding protein 

QRF02387 ABC transporter, ATP-binding protein, FRAMESHIFT 

ORF02388 CDP-diacylglycerol-glycerol-3-phosphate 3-phosphatldyltransferase (pgsA) 

ORF02389 peptidase, M16 family . 

ORF02390 conserved hypothetical protein 

ORF02391 conserved hypothetical protein • 

ORF02392 recF protein (recF) 

ORF02396 inosine-S'-monophosphate dehydrogenase (guaB) 

ORF02397 transcriptional regulator, ArgR family 

ORF02400 arginine deiminase (arcA) 

ORF02402 ornithine carbamoyitransferase (argF) 

ORF02404 carbamate kin a e (arcC) 

ORF02405 tryptophanyl-tRNA synthetase (trpS) , 

ORF02407 conserved hypothetical protein 
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ORF02408 ABC transporter, ATP-binding protein 

ORF02409 ABC transporter, permease protein, putative 

ORF02410 conserved hypothetical protein T1GR00246 

ORF0241 1 serine protease [ I . 

ORF02412 partitioning protein, ParB family ' 

QRF02413 chromosomal repiication initiator protein DnaA (dnaA) 

ORF02415 DNA polymerase III, beta subunit (dnaN) 

ORF02417 conserved hypothetical protein - ' 

QRF02419 conserved hypothetical GTP-binding protein 

ORF02420 peptidyl-tRNA hydrolase (pth) ] 

QRF02421 transcription-repair coupling factor (mfd) . . 

ORF02423 S4 domain protein _ ! 

ORF02424 cell division protein DivlC, putative s ; 

ORF02426 expressed protein of unknown function 

ORF02427 MesJ/Ycf62 family protein 

QRF02429 cell division protein FtsH (ftsH) s , 
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ORF0Q017 phosphoribosylaminoimidazolecarboxamide formyltransferase/IMP cyclohydrolase (purH) 
ORF00025 conserved hypothetical protein 



ORF00029 acetyl xylan esterase, putative 
ORF00042 aldehyde-alcohol dehydrogenase (adhE) 



ORF00044 threonine synthase (thrC) 
ORF00081 ribosomal protein L17 (rplQ) 



ORF0Q090 conserved hypothetical protein 



ORF00129 argininosuccinate synthase (argG) 

ORF00156 oligopeptide ABC transporter, substrate-binding protein, putative 



ORF00189 protease, putative 
ORF00194 thioredoxin family protein 



ORF00195 tRNA binding domain protein 
ORF00217 conserved domain protein 



ORF00218 PTS system, MB component, putative 
ORF00220 trapsketplase, N-terminal subunit 



QRF00221 transketolase, C-terminal subunit 



ORF00223 oxidoreductase, putative 



ORFQ0282 acetyltransferase, GNAT family 



ORF00290 IS1381, transposase OrfB 



ORF00291 IS 1381, transposase OrfA 



ORF00293 conserved hypothetical protein 



ORiF0Q301 membrane protein, putative 



ORF00343 ABC transporter, permease protein, putative 



QRF00344 conserved hypothetical protein 



ORF00382 aspartate kinase family protein 



ORF00399 conserved hypothetical protein 



ORF00439 celLwali surface anchor family protein 



ORF00447 cytidine/deoxycytidylate deaminase family protein 



ORF00450 5-formyltetrahydrofolate cyclo-ligase family protein 



ORF00480 transcriptional regulator, MerR family 



ORF00499 acetyltransferase, GNAT family 



ORF00504 magnesium transporter, CorA family 



QRF00521 VanZF domain protein 
ORF00612 1S1381, transposase OrfA 



ORF00613 IS1 381, transposase OrfB _ 
ORF00690 transmembrane protein Vexpl (vexD 



ORF00691 ABC transporter, ATP-binding protein Vexp2 (vex2) 
QRF00692 transmembrane protein Vexp3 (vex3) 



ORF00714 conserved hypothetical protein 

ORF00732 expressed cell wall surface anchor family protein, putative 



ORF00774 ABC transporter, ATP-binding protein 
ORF00778 ABC transporter, ATP-binding protein 



QRF00780 conserved hypothetical protein 
ORF00790 beta-glucuronldase 



ORF00800 alpha amylase family protein 
ORF00807 amino acid ABC transporter, permease protein 



ORF00809 amino acid ABC transporter, amino acid-binding protein 
ORF00814 conserved hypothetical protein "~ 



ORF00823 bacterial luciferase family protein 



ORF00840 riboflavin biosynthesis protein RibD (ribD) 
ORF00841 riboflavin synthase, alpha subunit (ribE) 



ORF00842 riboflavin biosynthesis protein RibA (ribA) 
QRF00843 riboflavin synthase, beta subunit (ribH) 



ORF00866 penicillin-binding protein 2b 
ORF00905 membrane protein, putative 
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ORF00910 major facilitator family protein 

QRF00913 hydrolase, haloacid dehalogenase-like family 

ORF00918 conserved hypothetical protein 

ORF00945 conserved hypothetical protein 

ORF00948 ABC transporter, ATP-binding protein 

ORF00952 phosphomethylpyrimldine kinase (thiP) 

QRF00953 hydroxyethylthiazole kinase (thiM) _ [ 

ORF00954 thiamine-phosphate pyrophosphorylase (thiE) 

ORF00961 GtrA family protein ; , 

ORF00967 1 ,4-aipha-glucan branching enzyme (glgB) .. m 

ORF00968 glucose-1 -phosphate adenylyltransferase (glgC) ' . 

ORF00971 glycogen synthase (glgA) ^ . . 

ORF00985 acetyltransferase, GNAT family , , . ... 

ORF00990 magnesium transporter. CorA family, putative ; 

ORF01022 nucleoside diphosphate kinase (ndk) . 

QRF01031 nucleoside diphosphate kinase domain protein 

ORF01085 conserved hypothetical protein , , 

ORF01087 1S1381, transposase OrfA [ ] 

QRF01088lS1381 t transppsaseOrfB 

' ORF01098 ABC transporter, permease protein, putative . ' 

ORF01 100 sensor histidine kinase . 

ORF01 102 ABC transporter, substrate-binding protein ; 

ORF01 127 protease, putative , : , , ; .. .. 

ORF01 135 iron compound ABC transporter, permease protein . , , • . _ 

ORF01136 iron compound ABC transporter, permease protein . . ^ 

QRF01 185 aspartate-semialdehyde dehydrogenase (asd) : ; 1 _ 

ORFi01217 qonserved hypothetical protein _ : 

QRF01218 conserved hypothetical protein - ■ v. 

ORF01219 formate/nitrite transporter family protein 

ORF01226 oxidoreductase, short chain dehydrogenase/reductase family, FRAMESHIFT 

ORF01254 homoserine kinase (thrB) : . 

ORF01255 homoserine dehydrogenase (horn) . 

ORF01264 transcriptional regulator, Cro/Cl family 

ORF01268 thiol peroxidase (psaD) : 

ORF01305 glycosyitransferase CpsJ(V) (cpsJ) 

ORF01306 glycosyltransferase CpsO(V) (cpsO) 

QRF01313 CpsD protein (cpsD) 

ORF01314 cpsC protein (cpsC) 

ORF01315 capsular polysaccharide biosynthesis protein CpsB (cpsB) 

QRF01 31 6 capsular polysaccharide biosynthesis protein CpsA (cpsA) 

ORF01326 conserved hypothetical protein m 

QRF01333 alpha-acetolactate decarboxylase (budA) 

ORF01334 acetolactate synthase, catabolic (ilvK) 

QRF01337 MutT/nudix family protein . 

ORF01369 MATE efflux family protein 

QRF01398 Tn5252, Orf 9 protein 

ORF01399 Tn5252, Orf 10 protein 

ORF01446 protease, putative 

ORF01447 conserved hypothetical protein 

ORF01449 conserved hypothetical protein _^ 

ORF01492 NAPP-specific giutamate dehydrogenase (gdhA) 

ORF01569 expressed cell wall surface anchor family protein 

QRF01570 cell wall surface anchor family prot in . — 

ORF01574 polysaccharide biosynthesis protein 

ORF01579 nucleotidyl transferase, putative 



499 



WO 2004/018646 PCT/US2003/026827 

Table 10: GBS genes shared with GAS 

ORFxxxxxAnn tat! n " __ 

ORF00654 conserved hypothetical protein 

ORF00655 conserved hypothetical protein 

ORF00656 conserved hypothetical protein ; 

ORF00658 conserved hypothetical protein 

ORF00659 conserved hypothetical protein ~ 

ORF00660 prophage LambdaSal, structural protein, putative 

ORF00662 conserved hypothetical protein 

ORF00663 conserve^ hypothetical protein 

ORF00664 conserved hypothetical protein ' 

ORF00665 conserved hypothetical protein t 

QRF00666 prophage LambdaSal t structural protein . • 

ORF00668 conserved hypothetical protein 

QRF00669 prophage LambdaSal , pblA protein, internal deletion 

QRF00677 prophage LambdaSal , lysin, putative . 

ORF00679 conserved hypothetical protein 

ORF00695 transposase QrfB, 1S3 family, truncation 

ORF0Q697 conserved hypothetical protein : 

ORF00707 conserved domain protein 

ORF00713 acid phosphatase precursor, class B 

ORF00720 transposase QrfB, 1S3 family FRAMESHIFT 

ORF00721 transposase OrfA, IS3 family 

ORF00751 cylA protein (cylA) . . 

ORF00755 cyil protein (cyll) 

QRF00760 serine protease, subtilase family, putative POINT MUTATION 

ORF00781 transcriptional regulator, LysR family ' 

w ORF00783 regulatory protein, putative 

ORF00785 1S1548, transposase \ . ; ." 

ORF00786 regulatory protein, putative, truncation . 

ORF00787 D-lactate dehydrogenase (IdhA) 

ORF00801 glycosyl transferase, group 1 family protein , 

ORF00805 conserved hypothetical protein 

ORF00826 phage shock protein C, putative 

ORF00833 conserved hypothetical protein 

ORF00845 hydrolase, haloacid dehalogenase-like family 

ORF00852 conserved hypothetical protein 

ORF00853 expressed putative lipoprotein 

ORF00857 1S1548, transposase 

ORF00890 conserved hypothetical protein 

ORF00902 conserved hypothetical protein 

ORF00926 membrane protein, putative 

ORFQ0927 membrane protein, putative 

ORF00987 conserved hypothetical protein 

ORF01009 expressed protein of unknown function 

ORF01010 lipoyl-binding domain protein 

ORF01011 oxidoreductase, putative 

ORF01012 conserved hypothetical protein 

ORF01024 expressed putative lipoprotein 

ORF01061 signal peptidase I, putative 

ORF01064 1S1548, transposase 

ORF01084 glyoxylase family protein 

ORF01104 SatD 

ORF01 126 conserved hypothetical protein 

ORF01191 conserved hypothetical protein 

ORF01192 conserved hypothetical protein 

ORF01193 glycine cleavage system H protein, putative 
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ORF01 1 94 bacterial luciferas family protein 

ORF01195oxidor ductase, FMN-binding 

ORF01 1 97 lipoate-protein ligase A family protein 
ORF01202 1S861, transposase OrfA 

ORF01223 drug resistance transporter, EmrB/QacA family, putative 
ORF01224 conserved hypothetical protein 

ORF01225 potassium uptake protein, putative 

ORF01237 membrane protein, putative 

ORF01249 dihydroneopterin aldolase (folB) 

ORF01256 polysaccharide degcetylase family protein 

ORF01 273 transcriptional regulator, GntR family/potassioum uptake protein, TrkA family 

ORF0128P conserved hypothetical protein __ 

• ORF01281 conserved hypothetical protein 
ORF01289 lipoprotein, putative 

ORF01.291 conserved hypothetical protein 

ORF01298 conserved hypothetical protein 

OR F01318 conserved hypothetical protein 

O^F01320 voltage-gated chloride channel family protein, putative 

ORF01322 arsenate reductase (arsC) 

ORF01340 dTDP-glucose 4,6-dehydratase (rfbB) 

QRF01341 dTPP-4-dehydrorhamnose 3,5-epimerase 

. ORF01 342 glucose-1 -phosphate thymidylyltransferase (rfbA) 

ORF01356 hypothetical protein _. . ' 

ORF013g8 conserved hypothetical protein 

ORF01374 ISSdyl, transposase OrfB .__ 

ORF01388 transposase OrfA, 1S3 family _ 

ORFQ1 389 transposase OrfB, I S3 family, truncation . 

ORF01391 ISSdyl , transposase OrfB FRAMESH1FT 

ORF01396 transcriptional regulator, Cro/CI family 

ORF01419 repressor protein, putative 

ORF01461 amino acid permease 

ORF01469 conserved hypothetical protein 

ORF01483 sensor histidine kinase 

ORF01485 GTP pyrophosphokinase family protein 

ORF01490 5'-nucleotidase family protein 

ORF01509 2-dehydropantoate 2-reductase, putative 

ORF01510 regulatory protein, putative 

ORF01522 carbamoyl-phosphate synthase, large subunit, putative 

ORF01542 sulfatase 

ORF01549 conserved hypothetical protein 

ORF01554 iron compound ABC transporter, substrate-binding protein 

ORF01557 conserved hypothetical protein 

ORF01563 conserved hypothetical protein T1GR01212 

ORF01583 glycosyltransferase, group 2 family protein 

ORF01584 glycosyltransferase, group 2 family protein 

ORF01585 glycosyltransferase, putative 

ORF01586 dTDP-4-dehydrorhamnose reductase (rfbD) 

ORF01593 conserved hypothetical protein 

ORF01599 conserved hypothetical protein 

ORF01600 glycerol-3-phosphate transporter, putative 

ORF01639 conserved hypothetical protein 

ORF01650 nitroreductase family protein 

ORF01853 amino acid permease 

ORF01665 transcriptional regulator, MutR family 

ORF01683 MutT/nudix family protein 



504 



WO 2004/018646 PCI7US2003/026827 

Table 10: GBS gen s shar d with GAS 



ORFxxxxx Annotation 

ORF01686 67 kDa Myosin-cross reactive streptococcal antigen 

ORF01688 peptide methionin sulfoxide reductase (msrA) 

ORF01694 peptide ABC transporter, permease protein 

ORF01704 conserved hypothetical protein 

ORF01705 1S861 , transposase OrfA 

ORF01741 membrane protein, putative ' 

QRF01770 conserved hypothetical protein 

ORF01772 IS1548, transposase 

ORF01790 conserved hypothetical protein . ' 

ORF01794 conserved hypothetical protein ■ 

ORF01800 amino acid ABC transporter, substrate-binding protein • 

ORF01810 1S1548, transposase ' 

ORF01827 sodium:dicarboxylate symporter family protein ' 

ORF01877 immunogenic secreted protein, putative ■ ; 

ORF01 9,1 3 transcriptional regulator, Cro/CI family 
ORF01928 membrane protein, putative 

ORF01931 transporter, putative _. ■ 

ORF01932 transcriptional regulator, Crp/Fnr family 

ORF01 947 transcriptional regulator, merR family 

QRF01970 acid phosphatase : 

ORF02002 amino acid ABC transporter, permease protein 

ORF02028 perfringolysin O regulator protein (pfoR) 

ORF02029 conserved hypothetical protein o 3 

ORF02031 expressed protein of unknown function , ; 

ORF02032 expressed protein of unknown function , — 

ORF02035 deoxynucleoside kinase family protein 

ORF02042 alkyl hydroperoxide reductase, subunit C (ahpC) . ' 

ORF02126 transcriptional regulator, MarR family 

ORF02128 N-acetylmuramoyl-L-alanine amidase, family 4 protein 

ORF02135 malate oxidpreductase 

ORF02136 citrate carrier protein, CCS family 

ORF02137 sensor histidine kinase family protein 

QRF02138 response regulator . 

ORF02166 conserved hypothetical protein 

ORF02169 PTS system, IIB component 

ORF02170 PTS system, HA component, putative 

ORF02202 ABC transporter, ATP-binding protein 

ORF02262 ABC transporter, ATP-binding protein 

ORF02270 cAMP factor (cfb) 

ORF02280 serine protease, subtilase family, putative 

QRF02286 major facilitator family protein 

QRF02292 preprotein translocase, SecE subunit, putative 

QRF02295 Lyme disease proteins of unknown function, putative 

ORF02298 Na+ dependent nucleoside transporter 

ORF02301 transcriptional regulator, GntR family 

ORF02313 virulence factor MviM, putative 

QRF02316 membrane protein, putative 

ORF02319 conserved hypothetical protein TIGR00250 

ORF02328 transporter, putative 

QRF02331 cold shock protein, CSD family 

QRF02332 PIMA mismatch repair protein HexA (hexA) 

ORF02335 conserved hypothetical protein 

ORF02372 cons rved hypothetical protein 

ORF02383 expressed putative lipoprotein 

ORF02393 transporter, putative 
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ORF02398 transcriptional regulator, Crp/Fnr family 

ORF02399 conserved hypothetical protein 

QRF02401 acetyltransferase, GNAT family 

ORF02403 arginine/ornithine antiporter (arcD) 

ORF03002 conserved hypothetical protein, truncation N 
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ORF00008 protease, putative 

QRF00010 acyl carrier protein (acpP) 

ORF00016 acetyltransferase, GNAT family 

ORF00018 peptidase, M23/M37 family, putative secreted protein 

ORF00035 membrane protein, putative 

ORF00087 lipoprotein, putative •_ 

ORF00088 hypothetical protein 

ORF00089 hypothetical protein ' • 

ORF00091 conserved hypothetical protein 

QRF001 1 7 ribose ABC transporter, periplasmic D-ribose-binding protein (rbsB) 
ORF00118 ribose ABC transporter, permease protein (rbsC) 
ORF00120 ribose ABC transporter protein RbsD (rbsD) 
ORF00121 ribokinase (rbsK) ' 
ORF001 23 hypothetical protein ~ " 

ORF0013Q argininosuccinate lyase (argH) ■ 

ORF00137 conserved hypothetical protein 

ORF00138 hypothetical protein \ 

ORF00166 4<jiphosphp^dyl-2<>methyl-D>erythritol kinase (ispE) 

ORF001 82 conserved domain protein ■ 

ORF00186 transcriptional regulator, Cro/CI family 

ORF00187 hypothetical protein , 

ORF00188 hypothetical protein 

ORF00192 hypothetical protein _ ' 

ORF00193 conserved hypothetical protein , , ' 

ORF00196 conserved hypothetical protein 
* ORF001 99 hydrolase, haloacid dehalogenase-like family 
ORFQ0200 sensor histidine kmase, putative 

ORF00201 response regulator ■ 

ORF00203 conserved hypothetical protein 

ORF00204 membrane protein, putative 

ORF00205 hypothetical protein 

ORF00228 lipoprotein, putative 

ORF00234 hypothetical protein 

ORF00235 hypothetical protein 

ORF00238 hypothetical protein 

ORF00240 transcriptional regulator, Cro/CI family 

ORF00241 hypothetical protein 

ORF00242 conserved hypothetical protein 

ORF00243 hypothetical protein 
ORF00244 conserved domain protein 
ORF00245 conserved hypothetical protein, fusion 
ORF00246 replication initiation protein, putative 

ORF00247 hypothetical protein 

ORF00248 recombination protein 

ORF00249 hypothetical protein 

ORF00252 conserved hypothetical protein 

ORF00253 hypothetical protein 

ORF00254 hypothetical protein 

ORF00255 hypothetical protein 

ORF00256 hypothetical protein 

QRF00257 hypothetical protein 

ORF00258 hypothetical protein 

ORF002S9 hypoth tteaj prot In 

ORF00260 hypothetical protein 

QRF00272 expressed putative lipoprot in 
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ORF00273 hypothetical prot in 

ORF00274 hypothetical protein 

ORF00275 hypothetical protein 

ORF00276 hypothetical protein 

ORF00278 membrane protein, putative 

ORF00279 transcriptional regulator, Cro/Cl family 

ORF00280 acetyitransferase, GNAT family 

ORF00281 acetyltransferase, GNAT family - 

ORF00283 conserved hypothetical protein ' _ 

ORF00284 RNA polymerase sigma factor, ECF subfamily 
ORF00285 lipoprotein, putative 

ORF00287 transcriptional regulator, TetR family 

ORF00288 ABC transporter efflux protein, PrrB family, putative 

ORF00292 hypothetical protein 

ORF00294 expressed protein of unknown function ; 

ORF00298 acyt carrier protein phosphodiesterase, putative 

QRF00308 conserved hypothetical protein 

ORF00324 conserved hypothetical protein 

ORF00332 hs^pthetical protein 

ORF00340 hypothetical protein 

ORF00347 conserved hypothetical protein 

ORF00384 hypothetical protein . 

. ORF00402 membrane protein, putative 

ORF004P8 hypothetical protein I ' 

ORF00409 membrane protein, putative ' , . 

ORF00414 conserved hypothetical protein 

ORF00416 hypothetical protein 

QRF00417 hypothetical protein 

ORF00433 copper-transporter protein CopZ 

ORF00448 hypothetical protein 

ORF00466 conserved hypothetical protein 

ORF00467 .acetyltransferase, GNAT family 

ORF00475 conserved domain protein 

ORF00476 hypothetical protein 

ORF00478 carboxymuconolactone decarboxylase family protein 

QRF00479 conserved hypothetical protein 

ORF00486 transcriptional regulator, AraC family 

ORF00487 surface protein Rib 

ORF00488 transposase, IS256 family, truncation 

ORF00489 DNA-damage-inducible protein J, putative 

ORF00490 hypothetical protein 

ORF00491 lipoprotein, putative 

ORF00493 bacteriophage L54a, integrase, truncation 

ORF00497 conserved domain protein 

ORF00503 oxidoreductase, Gfo/idh/MocA family 

QRF00506 transposase, IS256 family 

ORF00510 bacteriocin transport accessory protein,putative 

ORF00512 hypothetical protein 

ORF00526 biotin synthetase (bioB) 

ORF00527 hypothetical protein 

QRF00533 type IV prepilin peptidase-related protein 

ORF00538 conserved hypothetical protein 

QRF00556 hyp th tical protein 

ORF00563 expressed protein of unknown function 

ORF00575 hypothetical protein 
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ORF00584 conserved hypothetical protein 

ORF00585 fructose-1,6-bisphosphatase, putative 

ORF00590 carboxymethylenebutenolidase-related protein 

ORF0Q597 conserved hypothetical protein — 

ORF00598 inosine-uridine preferring nucleoside hydrolase 

QRF00599 hypothetical protein 

ORF00600 OsmC/Ohr family protein 

ORF00608 adenosine deaminase, putative ■ • 

ORF00610 chorismate mutase, putative ^ 

■ ORF00615 prophage LambdaSal, site-specific recombinase, phage integrase family 

ORF00617 conserved domain protein 

ORF00618 hypothetical protein " 

- QRF00620 hypothetical protein 

ORF00621 conserved hypothetical protein 

ORF00623 hypothetical protein . , , 

ORF00624 hypothetical protein . - 

ORF0Q626 prophage LambdaSal , transcriptional regulator, Cro/CI family 
ORF00628 hypothetical protein 

ORF00630 hypothetical protein - 

ORF00632 hypothetical protein 

ORF00633 conserved hypothetical protein 

ORF00635 hypothetical protein ~ 

ORF00636 hypothetical protein ' " 

ORF00637 hypothetical protein ' ' 

ORF0Q638 conserved hypothetical protein ' ' 

ORF00639 conserved domain protein 

QRF00641 prophage LambdaSal, reverse transcriptase/maturase family protein 

ORF00642 conserved hypothetical protein 

ORF00643 conserved hypothetical protein 

ORF00644 hypothetical protein 

ORF00645 hypothetical protein — 

ORF00646 conserved hypothetical protein 

ORF00647 hypothetical protein " 

ORF0Q649 hypothetical protein 
ORF00650 hypothetical protein 

ORF00652 conserved hypothetical protein 

ORF00653 conserved hypothetical protein 

ORF00657 conserved hypothetical protein, truncation 

ORF00661 conserved hypothetical protein 

ORF00667 conserved hypothetical protein 

ORF00670 prophage LambdaSal. minor structural protein, putative 

ORF00671 prophage LambdaSal , N-acetylmuramoyl-L-alanine amidase, family 4 

ORF00672 prophage LambdaSal, minor structural protein, putative 

ORF00673 hypothetical protein 

ORF00674 hypothetical protein 

ORF00675 conserved hypothetical protein 

ORF00676 conserved hypothetical protein 

ORF00678 conserved hypothetical protein 

ORF00681 conserved hypothetical protein 

ORF00682 hypothetical protein 

ORF00683 prophage LambdaSal, site-specific recombinase, phage integrase family FRAMESH1FT 

ORF00685 conserved hypothetical protein 

ORF00689 conserved hypoth tlcal protein, FRAMESH1FT 

ORF00698 hypothetical protein 

ORF00703 phosphoserine phosphatase SerB (serB) 
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ORF00704 MutT/nudix family protein 

ORF00712 hypothetical protein 

ORF00718 cell wail surface protein, interruption-N 

ORF00723 hypothetical protein 

ORF00726 transcriptional regulator, AraC family 

ORF00727 expressed cell wall surface anchor family protein 
ORF00728 expressed cell wall surface anchor family protein 

ORF00735 expressed protein of unknown function 

ORF00737 conserved hypothetical protein, degenerate 

ORF00738 hypothetical protein * 

ORF00740 hypothetical protein 

. ORF00741 hypothetical protein 

ORF00742 lipoprotein, putative 
ORF00747 cylD protein (cylD) 

ORFQ0749 acyl carrier protein AcpC ' - . 

ORF00750 cylZ protein FRAMESHIFT 

ORF00752 cylB protein (cylB) * ■ 

ORF00753 cylE protein (cylE) , . 

ORF00754 cyiF protein (cylF) : 

ORF00756 cylJ protein (cylJ) [ ] 

ORF00757 cylK protein (cylK) 

ORF00758 hypothetical protein 

ORF00759 putative secreted protein 

ORF00761 hypothetical protein 

ORF00766 expressed putative secreted protein 

ORF00767 hypothetical protein . . 

ORF00768 conserved domain protein ■ 

ORF00769 permease, putative 

ORF00775 conserved hypothetical protein 

ORF00777 DedA family protein, putative 

ORF00779 membrane protein, putative 

ORF00788 sodium:galactoslde symporter family protein, putative 

ORF00791 transcriptional regulator, GntR family 

ORF00793 Glucuronate isomerase (uxaC) 

ORF00794 mannonate dehydratase (uxuA) 

ORF00795 D-mannonate oxidoreductase 

ORF00796 hydrolase, haloacid dehalogenase-like family 

ORF00797 glycosyl hydrolase, family 3 

ORF00806 conserved hypothetical protein 

ORF00822 ABC transporter, ATP-binding protein 

ORF00827 hypothetical protein 

ORF00834 conserved hypothetical protein 

ORF00838 membrane protein, putative 

ORF00839 Mn2+/Fe2+ transporter, NRAMP family 

ORF00848 conserved domain protein 

ORF00872 cell wall surface anchor family protein 

ORF00874 conserved hypothetical protein 

ORF00878 ABC transporter, permease protein 

ORF00879 YaeC family protein, putative 

ORF00888 hydrolase, haloacid dehalogenase-like family 

ORF00891 conserved domain protein 

ORF00898 conserved hypothetical protein 

ORF00900 permease, GntP family 

ORF00903 transcriptional regulator, MarR family 

ORF00907 glutathione S-transferase family protein 
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ORF00909 hypothetical protein 

ORF00921 membrane protein, putative 

ORF00922 glycosyl transferase, family 8 

ORF00923 hypothetical protein 

ORF00924 conserved hypothetical protein 

ORFQ0939 conserved hypothetical protein 

ORF00942 expressed putative secreted protein 

ORF00943 hypothetical protein - 

ORF00944 hypothetical protein _ ' 

ORF00946 conserved hypothetical protein 
ORF00950 hypothetical protein 

ORF00951 transcriptional regulator, TenA family ^_ 

1 ORF00972 ATP synthase F0, C subunit (atpE) ' 

ORF00980 conserved hypothetical protein 

ORF00982 conserved hypothetical protein . 

ORF01j003 conserved hypothetical protein \ ' 

ORFP1004 conserved hypothetical protein 

ORF01 013 hypothetical protein 

. ORF01014 hypothetical protein 

ORF01015 hypothetical protein . 

ORF01016 hypothetical protein 

ORF01018 hypothetical protein 

QRF01019 hypothetical protein . . 

ORF01 021 hypothetical protein ' . . . 

ORF01 025 HP domain protein • » . » 

ORF01 026 acetyltransferase, GNAT family 

ORF01032 chloramphenicol acetyltransferase (cat) 

ORF01034 Tn916, transposase • 

ORF01035 Tn916, excislonase 

ORF01 037 Tn91 6, hypothetical protein 

ORF01038 Tn916, hypothetical protein 

ORF01039 Tn916, transcriptional regulator, putative 

ORF01041 Tn916 t hypothetical protein 

ORF01042 Tn916, NLP/P60 famiiy protein 

ORF01044 membrane protein, putative FRAMESHIFT 

ORF01 048 Tn91 6, hypothetical protein 

ORF01049 Tn916, hypothetical protein 

ORF01050 Tn916, hypothetical protein 

ORF01051 Tn916, transcriptional regulator, putative 

ORF01052 Tn916, FtsK/SpolllE family protein 

ORF01053 Tn916, hypothetical protein 

ORF01054 Tn916, hypothetical protein 

ORF01062 hypothetical protein 

ORF01086 Na+/H+ exchanger family protein 

QRF01092 acetyltransferase, GNAT family 

ORF01096 nisin-resistance protein, putative 

ORF01103 conserved hypothetical protein 

ORF01124 acetyltransferase, GNAT family 

ORF01133 iron-compound ABC transporter, iron-compound-binding protein 

ORF01140 conserved hypothetical protein 

ORF01142 carbon starvation protein CstA, putative 

ORF01143 response regulator 

ORF01144 s nsor histidlne kinase, putative 

ORF01145 lipoprot in, putative 

ORF01146 conserved hypothetical protein, FRAMESHIFT 
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ORF01148 lipoprotein, putative 

ORF01149 hypothetical protein 

ORF01150 hypothetical protein 

ORF01 1 51 hypothetical protein ~ 

ORF01152 lipoprotein, putative 

ORF01153 hypothetical protein _ 

ORF01157 conserved hypothetical protein 

ORF01158 hypothetical protein . 

QRF01 1 59 hypothetical protein 

ORF01 160 expressed protejn of unknown function FRAMESHIFT 

ORF01161 expressed conserved domain protein 

ORF01 162 .conserved hypothetical protein 

ORF01164 FtsK/SpoHiE family protein FRAMESHIFT 

ORF01166 hypothetical protein . ; 

ORF01167 conserved hypothetical protein. 

ORF01168 conserved hypothetical protein 

ORF011ff9 hypothetical protein ; 

QRF01172 phage infection protein, putative 

ORF01173 conserved hypothetical protein 

ORF01174 conserved domain protein 

ORF01 175 hypothetical protein 

ORF01182 membrane protein, putative 

ORF01 186 cell wall surface anchor family protein, putative 

ORF01 187 hypothetical protein 

QRF01204 hypothetical protein . 

ORF01215 hypothetical protein _ t 

ORF01241 transcriptional regulator, AraC family, putative 

ORF01253 rarD protein (rarD) 

ORF01257 transporter, BCCT family protein 

ORF01258 hypothetical protein 

QRF01261 expressed protein of unknown function 

ORF01262 conserved hypothetical protein, FRAMESHIFT 

ORF01263 hypothetical protein 

ORF01265 hypothetical protein . 

QRF01266 hypothetical protein 

ORF01269 conserved hypothetical protein 

ORF01272 conserved hypothetical protein 

ORF01277 conserved hypothetical protein 

ORF01287 conserved hypothetical protein 

ORF01288 membrane protein, putative 

ORF01299 CMP-N-acetylneuraminic acid synthetase NeuA (neuA) 

ORF01300 neuP protein (neuP) 

ORF01301 UPP-N-acetylglucosamine-2-epimerase NeuC (neuC) 

ORF01302 N-acetyl neuramic acid synthetase NeuB (neuB) 

ORF01303 polysaccharide biosynthesis protein CpsL (cpsL) 

ORF01304 polysaccharide biosynthesis protein CpsK(V) (cpsK) 

QRF01307 glycosyltransferase CpsN(V) (cpsN) 

ORF01308 polysaccharide biosynthesis protein CpsM(V) (cpsM) 
ORF01309 polysaccharide biosynthesis protein cpsH(V) (cpsH) 

ORF01310 glycosyltransferase CpsG(V) (cpsG) 

ORF01311 polysaccharide biosynthesis protein CpsF (cpsF) 

ORF01312 glycosyltransferase CpsE (cpsE) 

ORF01348 conserved domain protein 

ORF01349 hypothetical protein 

ORF01370 conserved hypothetical protein 
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ORF01371 conserved hypothetical protein 

ORF01372 expressed protein of unknown function 

ORF01373 iSSdyl, transposase OrfA 

ORFQ1375 conserved hypothetical protein 

ORF01379 transposase OrfB, 1S3 family, truncation 

ORF01382 GBSK, group ii intron, maturase 

ORF01384 hypotheticai protein 

ORF01385 hypothetical protein 

ORF01386 conserved hypothetical protein ' 

ORF01387 conserved hypothetical protein, truncation ^ 

QRF01390 ISSdyl , transposase OrfA FRAMESHIFT 

ORF01392 hypothetical pfotein ' ^ 

♦ ORF01393 hypothetical protein ' 

ORF01394 site-specific recombinase, phage integrase family 

ORF01395 conserved hypothetical protein . 

ORF01401 transposase, ISL3 family 

ORF01404 mercuric resistance operon regulatory protein MerR (merR) 

ORF01408 cadmium efflux system accessory protein (CadC) 

ORF01409 conserved hypotheticai protein 

ORF01410 hypothetical protein 

ORF01417 hypothetical protein 

ORF01418 hypothetical protein 

ORF01420 hypothetical protein 

ORF01421 ImpB/MucB/SamB family protein 

ORF01423 conserved hypothetical protein 
ORF01424 conserved hypothetical protein 

ORF01425 conserved hypothetical protein ' 

ORF01426 conserved hypothetical protein , 

ORF01427 hypothetical protein _ . ' 

ORF01428 conserved hypothetical protein 

ORF01430 hypothetical protein ; 

ORF01431 hypothetical protein 

ORF01432 conserved domain protein 

ORF01433 SNF2 family protein 

ORF01434 hypothetical protein 

ORF01435 calcium-binding protein, putative 

ORF01436 agglutinin receptor (ssp-5) 

ORF01437 abortive infection protein AbiGl (abiGl) 

ORF01438 abortive infection protein AbiGIl (abiGH) 

ORF01439 conserved hypothetical protein 

ORF01440 expressed protein of unknown function 

ORF01441 conserved hypothetical protein, degenerate 

ORF01442 membrane protein, putative 

ORF01443 hypothetical protein 

ORFQ1444 Tn5252, Orf 21 protein, internal deletion , 

ORF01445 hypothetical protein 

ORF01450 conserved hypothetical protein • 

ORF01452 hypothetical protein 

ORF01454 conserved hypothetical protein 

ORF01459 hypothetical protein 

ORF01460 homocysteine S-methyltransferase MmuM, putative 

ORF01463 hypothetical protein 

ORF01464 hypothetical protein 

ORF01465 hypothetical protein 

ORF01466 transcriptional regulator, TetR family 
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ORF01 477 glutathione S-transferase family protein, putative 

ORFQ1478 conserved domain protein _j 

ORF01486 hypothetical protein 

ORF01488 R5 protein 

ORF01489 transcriptional regulator, MarR family, putative 

ORF01494 membrane protein, putative 

ORF01497 acetyltransferase, GNAT family 

ORF01502 hypothetical protein 

ORF01 503 conserved hypothetical protein 

ORF01508 surface antigen-related protein 

ORF01535 conserved hypothetical protein 

ORF01547 conserved hypothetical protein 

. ORF01 566 expressed cell wall surface anchor family protein 

ORF01572 glycosyltransferase, group 1 family protein f ' 

ORF01 573 glycosyltransferase, group 2 family protein . 

QRF01575 membrane protein, putative • 

ORFQ1 576 glycosyltransferase, group 2 family protein 

ORF01577 glycosyltransferase, group 2 family protein . . 

ORF01578 nucleotide sugar dehydratase, putative 

ORF01581 lipoprotein, putative 

ORF01582 conserved hypothetical protein 

. ORF01 596 ammonium transporter family protein 

QRF01 597 conserved hypothetical protein 

QRF01 601 hypotheticai protein 

ORF01608 proton/peptide symporter family protein 

ORF01611 hypothetical protein 

ORF01 61 5 conserved domain protein . 

ORF01638 conserved hypotheticai protein ' 

ORF01641 conserved hypothetical protein 

QRF01645 ceil wall surface anchor family protein 

ORF01660 membrane protein, putative 

ORF01661 ABC transporter, ATP binding protein 

ORF01666 hypothetical protein 

ORF01667 hypothetical protein 

ORF01670 hypothetical protein 

QRF01672 protease, putative, POINT MUTATION 

ORF01673 hypothetical protein 

ORF01674 hypothetical protein 

ORF01675 hypothetical protein 

ORF01680 tetracenomycin polyketide synthesis O-methyltransferase TcmP, putative 

ORF01681 hypothetical protein 

ORF01682 hypothetical protein 

ORF01684 hypothetical protein 

ORF01692 peptide ABC transporter, ATP-binding protein 

ORF01695 peptide ABC transporter, permease protein 

ORF01696 peptide ABC transporter, peptide-binding protein 

ORF01699 transposase, IS30 family, putative 

ORF01700 transporter, major facilitator family 

ORF01703 transcriptional regulator, LysR family 

ORF01 71 5 conserved hypothetical protein 
ORF01719 hypothetical protein 

ORF01720 conserved hypothetical protein 

ORF01721 glyoxalase family protein 

ORF01727 conserved hypothetical protein 

ORF01729 acetyltransferase, GNAT family 
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ORF01730 glycosyl transferas , group 2 family protein 

ORF01733 hypothetical protein 

ORF01734 conserved hypothetical protein 

ORFQ1735 hypothetical protein 

ORF01736 hypothetical protein 

ORF01737 hypothetical protein 

ORF01742 hypothetical protein 

ORF01743 PTS system component, putative ] 

ORF01744 conserved hypothetical protein 

ORF01748 D-isomer specific 2-hydroxyacid dehydrogenase family protein 

ORF01753 conserved hypothetical protein 

, ORF01754 hypothetical protein , 

. ORF01761 transposase, 1S30 family, putative, truncation 
ORF01778 amino acid permease, putative 

ORF01807 hypothetical protein 

ORF01836 hypothetical protein . Ci I 

ORF01838 hypothetical protein • . 

ORF01839 dihydroxyacetone kinase family protein ' ' 

ORF01840 transcriptional regulator, TetR family, putative ' 

ORF01842 hypothetical protein 

ORF01843 dihydroxyacetone kinase family protein 

ORF01 844 dihydroxyacetone kinase family protein 
ORF01 847 conserved hypothetical protein 

ORF01850 hypothetical protein . w ; ' 

QRF01863 pyruvate phosphate dikinase (ppdK) 

ORF01864 expressed protein of unknown function " 

ORF01665 CBS domain protein - " . 

ORF01866 3-hydroxyacyl-CoA dehydrogenase family protein, putative secreted protein 

ORF01892 hypothetical protein 

ORF01893 hypothetical protein 

QRF01894 conserved hypothetical protein 

ORF01895 hypothetical protein ; 

ORF01896 hypothetical protein ' 

QRF01897 hypothetical protein 

ORF01898 hypothetical protein 

ORF01899 hypothetical protein 

ORF01903 conserved hypothetical protein 

ORF01904 drug resistance transporter, EmrB/QacA family 

ORF01905 hypothetical protein 

QRF01922 conserved hypothetical protein 

ORF01925 FMN-binding protein 

ORF01934 hypothetical protein 

ORF01936 polyprenyl synthetase family protein 

ORF01939 cytochrome d ublquinol oxidase, subunit ll (cydB) 

ORF01940 cytochrome d oxidase, subunit I (cydA) 

QRF01941 pyridine nucleotide-disulphlde oxidoreductase family protein 

ORF01942 prenyltransferase, UbiA family 

QRF01943 hypothetical protein 

QRF01944 hypothetical protein 

ORF01946 cyclopropane-fatty-acyl-phospholipld synthase (cfa) 

QRF01951 conserved hypothetical protein 

ORF01953 hypothetical protein . 

QRF01 954 conserved hypoth tlcal protein 

ORF01984 hypothetical protein 

ORF01988 hypothetical protein 
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ORF01 989 hypothetical protein 
ORF0 1 990 hypothetical protein 
ORF01991 hypothetical protein 
ORF02000 membrane protein, putative 

ORF02001 transposase, IS30 family, putative ~ 
ORF02005 hypothetical protein — 
ORF02006 xylulose>5>phosphate/fructose-6«phosphate phosphoketolase (xfp) 
ORF0200y conserved hypothetical Iproteifl ~T ' . " 

ORF0201Q carbohydrate kinase, PQGY family - • . . V * - ' "• ' 

ORF0201 1 hypothetical protejir . ' — 

ORF0201 2 PTS system component, putative . 

ORF02015glyoxylatQ/^ 

ORF0201 6 hypothetical protein " . , X ' . 1 

ORF02025 ftyfr'othetical protein , 

ORF02026 hypothetical prqtein ~ Z 

QRF02030 glutamate-<ysteine Ijgase-related protein "'. j ~ \ \ 

ORF02036 phosphinothridn ;' 
ORF02039 conserved hypothetical protein 

r ORF02Q44 conserved hypothetical proteipu 

ORF02045 conserved h^otheticaliprotein ^ ~ — 

ORF02046 prophage LambdaSa2, lysin, putative ' ~~ 

ORF02047 prophage LambdaSa2, holin, putative 

QRFQ2048 Qon9firved hypothetical protein ' 
ORF02049 hypbthjBtical protein ♦ - 

ORF02050 conserved domain protein . 

ORF02051 prophage L LambdaSa2 t PblB, putative j 

ORF02053 conserved hypothetical protein 

ORF02056 conserved hypothetical protein 

ORF02057 hypothetical protein . ; • 

ORF02058 hypothetical protein 

QRF02059 conserved hypothetical protein ' 

ORF02060 conserved hypotheticaj protein 

ORF02061 hypotheticaj protein 

ORF02062 hypothetical protein __ 

ORF02063 conserved domain protein 

ORF02064 conserved domain protein 

ORF02066 prophage LambdaSa2, protease, putative 

ORF02067 conserved hypothetical protein 

ORFQ2068 prophage LambdaSa2, terminase large subunit, putative 

ORF02069 hypothetical protein 

ORF02070 hypothetical protein 

ORF02071 prophage LambdaSa2, site-specific recombinase, phage integrase family 

ORF02072 conserved hypothetical protein 

ORF02073 prophage LambdaSa2, transcriptional regulator, Cro/Cl family 

ORF02075 hypothetical protein • 

ORF02077 hypothetical protein 

ORF02078 conserved hypothetical protein 

ORF02079 conserved hypotheticaj protein 

QRF02080 conserved hypothetical protein 

ORF02081 hypothetical protein 

ORF02084 prophage LambdaSa2, bacteriophage replication protein/hypothetical protein, 

truncation/fusion 

ORF02085 hypoth tlcal prot In 

ORF02087 hypothetical protein 

ORF02088 conserved hypoth tical protein 



516 



WO 2004/018646 



PCT/US2003/026827 



Table 11: GBS g nes n t shared with GAS or pneum coccus 



ORFxxxxx Annotation 

ORF02089 prophage LambdaSa2, HNH endonuclease family protein 

ORF02090 prophage LambdaSa2 t antirepressor protein, putative 

ORF02091 conserved domain protein . 

ORF02092 hypothetical protein ; • 

ORF02093 hypothetical protein . 

QRF02094 hypothetical protein * - 

QRF02095 prophage LambdaSa2, repressor protein, putative : 

ORF02097 hypothetical protein * . «» . 

ORF02098 B^H^eTa^|d^^sit^g||^c rerornblna^j phage int^jgrase family 
ORF02too hyFiothetical protein ~ ~ ... 

ORF021 02 hypothejic^proteln , ' ..... , , 

ORF021Q3 mjcrocjn jmcnunlty protein MccF,; putative . 

ORF02105 oxidoreductase, Gfo/ldh/MocA family , 

ORF021 08 hypothetic al protein ] . 

ORF02109 Cyclic nucleotide-binding domain protein ; • : 

ORF021 1 9 hypothetical protein . . % . ■ y 

ORF021 24 hypothetical protein [ , ; 

ORF021 25 nitroreductase family protein . ^ 

ORF021 34 bacteriocin transport accessory protein, putative 

ORF02148 neuramirildase-reteted protein* . . 

ORF02160 2\3 % -cyclic-nudeotide 2 % -phosphodiesterase (cpdB) 

ORF02163 conserved hypothetical protein * [ a , - , 

ORPQ8171 membrane pfoteth, putative . . • \ " « 

ORF02172 hypothetical protein , , - - 

ORF02173 membrane protein, putative : 

ORF02175 conserved hypothetical protein, truncation 

ORF02181 phosphate transport system regulatory protein PhoU, putative 

ORF02197 hypothetical protein , • 

ORF02190 conserved hypothetical protein . ~, ' ' 

ORF02191 hypothetical protein - 

ORF02194 acetyltransferase, GNAT family 

ORF02196 hypothetical protein 

ORF02198 acetyltransferase, GNAT family 

ORF02201 membrane protein, putative 

ORF02203 hypothetical protein m 

ORF02205 transcriptional regulator, Cro/CI family 

ORF02206 conserved hypothetical protein 

ORF02207 conserved hypothetical protein TIGR00730 

ORF02208 hypothetical protein 

ORF02209 site-specific recombinase, phage integrase family 

ORF02210 conserved hypothetical protein 

ORF0221 1 conserved hypothetical protein 

ORF02212 hypothetical protein 

ORF02213 hypothetical protein 

ORF02214 transcriptional regulator, Cro/CI family 

ORF02215 expressed protein of unknown function 

QRF02216 site-specific recombinase, phage integrase family 

ORF02217 conserved hypothetical protein 

ORF02219 hypothetical protein 

QRF02221 cell wall anchor protein-related protein 

ORF02223 hypothetical protein 

ORF02224 hypothetical protein 

ORF0222S hypothetical prot in 

ORF02226 membrane protein, putative 

ORF02227 conjugal transfer protein, interruption-C 
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Tabl 11: GBS g nes not shared with GAS or pn um coccus 



ORFxxxxx Annotation 

ORF02230 cons rved hypothetical protein 

ORF02231 conserved hypothetical protein 

ORF02232 conserved hypothetical protein 

ORF02235 hypothetical protein ' ; . 

ORF02236 conserved hypothetical protein ' - 

. ORF02237 hypothetical protein : • 

ORF02238 hypothetical protein ■ ■ ' 

ORF02239 hypothetical protein , - ■ • . ; •■ 

ORF02240 trgn£crffife^ . .' - 

ORF02241 hypothetical protein , • \ 

ORF02242 transcriptional regulator, Cro/CI family ^ 

ORF02243 FtsK/SpolUE famMy protein : : 

ORF02244fiy&blhetical protein 

ORF02245 hypothetical protein , a . . • 

ORF0g246 cell) wall gujtfape ahchorfeu^fly protein / 

ORF02247 transposase, 1SL3 family ' * , , ~ .... : 

ORF0225Q mercuric resistance operon regulatory, protein MerR(merR) . - 

ORF02251 Mn2+/Fe2+ transporter, NRAMP family _^ ' 

ORF02252 membrane protein, putative . ' 

ORF02253 ABC transporter, ATP-binding protein . 

ORF02254 conserved hypothetical protein ; ^ ^ 

ORF02255 streptomycin resistance protein . ; 

ORFQ2257 hypothetical protein , , I " " 

• ORF02258,hypdtheticgil profefn ~ * ^ ~ 

ORF02259 conserved hypothetical protein ' . » 

ORF02260 acetyltransferase, GNAT family . ; 

ORF02261 membrane protein, putative . , . « ., . . 

OBF02263 hypothetical prpteirt __ ' . ' 

ORF02264 transcriptional reguliator, Cro/CI family ~— I 

ORF02265 PAP2 family protein - ,.- 

ORF02266 conserved hypothetical protein FRAMESHIFT _ 

ORF02267 conserved hypothetical protein T1GR00730 " ' 

ORF02268 protease, putative 

ORF02269 rhodanese family protein . . 

ORF02271 hypothetical protein 

ORF02274 conserved hypothetical protein ; 

ORF02275 5-methyltetrahydrofolate-homocysteine methyltransferase, putative 

ORF02277 conserved hypothetical protein 

ORF02279 hypothetical protein 

ORF02282 sensor histidine kinase 

ORF02283 chromosome assembly-related protein 

ORF02287 expressed protein of unknown function 

ORF02291 pathogenicity protein, putative 

ORF02308 hydrolase, haloacid dehalogenase-like family 

ORF02314 conserved hypothetical protein 

ORF02317 hypothetical protein 

ORF02330 hypothetical protein 

ORF02344 site-specific recombinase, phage integrase family m 

ORF02345 conserved hypothetical protein 

ORF02346 conserved hypothetical protein 

ORF02347 hypothetical protein 

ORF02349 conserved hypothetical protein 

QRF0235Q hypothetical protein 

ORF02351 transcriptional regulator, Cro/CI family 

ORF02352 conserved domain protein 
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Table 1 1 : GBS genes not shared with GAS or pneumococcus 



ORFxxxxx Annotation 

ORF02354 hypothetical protein 

ORF02356 expressed putative secreted protein m 

ORF02362 sensor histidine kinase 

ORF02363 response regulator , 

ORF02367 membrane protein, putative i _ . 

ORF02368 conserved hypothetical protein . .. . _ 

ORF02379 membrane protein, putative •• ; . • , 

ORF02395 transcriptional regulator, Cro/Cl family 

ORF0240§ merqfrnane protein, putative ; ~. a 

Of^(g4fSdia^giyicerol Kinase c^tglytic domain protein, putative • , ' / * 

OKFQ?41.8 hypptheticai protejp «» . ' * 

ORF02422 hypothetical protein . / . . , • : 

ORF02425 conserved hypothetical protein j . 

ORF030Q1 conserved hypothetical protein . 

ORF03004 conserved hypothetical protein ; ; . 

QRF03Q05 cylX protein J- • , 

ORF030Q6 Tn916 f hypothetical protein , .. ,. 

ORF03007 Tn91 6, hypothetical protein • 

> ORF03008 Tn916, hypothetical protein, ■ j 

QRF03009 Tn916, tetM leader peptide , . 

OF^3010 Tn916, hypotheticai protein . , 

ORF03012 prophage LambdaSa2, HNH endonuclease family protein 

ORF03013 conserved hypothetical protein • 

ORF03015 conjugal transfer protein, Interfuption-N 
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Tabl 12: GBS ORF's not shared with GAS, pneumococcus or any publish d 

genom 

ORFxxxxx Annotati n 



ORF00035 membrane protein, putative 



ORF00087 lipoprotein, putative 



ORF00088 hypothetical protein 



ORF00089 hypothetical protein 



ORF00123 hypothetical protein 



ORF00138 hypothetical protein 



ORF001 87 hypothetical protein 
ORF001 88 hypothetical protein 



ORF001 92 hypothetical proteift 
ORF0Q205 h^pthetical plrbteih 



ORF00228 lipoprotein, putative 



ORF00234 hypothetical protein 



ORF00235 hypothetical protein 



ORF00238 hypothetical protein 
ORF00240 transcriptional regulator, Cro/CI family" 



QRF00241 hypothetical protein 



ORF00242 conserved hypothetical protein 



ORF00243 hypothetical protein 



ORF00247 hypothetical protein 



ORF00249 hypothetical proteirv 



ORF00253 hypothetical protein 



ORF00254 hypothetical protein 



ORF00255 hypothetical protein 



ORF00256 hypothetical protein 
ORF00257 hypothetical protein 



ORF00258 hypothetical protein 



ORF00259 hypothetical protein 



ORF00260 hypotheticgf'protein 



ORF0027? expressed putative lipoprotein , 
ORF00273 hypdthelical protein 



ORF00274 hypothetical protein 



ORF00275 hypothetical protein 
QRF00276 hypothetical protein 



ORF00278 membrane protein, putative 
QRF00285 lipoprotein, putative 



ORF00292 hypothetical protein 

ORF00294 expressed protein of unknown function 



ORF003Q8 conserved hypothetical protein 
ORF00332 hypothetical protein 



ORF00340 hypothetical protein 
ORF00384 hypothetical protein 



ORF00402 membrane protein, putative 
ORF00408 hypothetical protein 



ORF00416 hypothetical protein 
ORF00417 hypothetical protein 



QRF00448 hypothetical protein 
ORF00476 hypothetical protein 



ORF00489 DNA-damage-inducible protein J, putative 



ORF00490 hypothetical protein 
ORF00491 lipoprotein, putative 



ORF00497 conserved domain protein 

ORF00510 bacteriocin transport accessory protein,putative 



ORFQ0512 hypoth tical protein 
QRF00527 hypothetical protein 



ORF00556 hypothetical protein 
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Tabl 12: GBS ORF's n 



ORFxxxxx Annotati n 

ORF00575 hypothetical protein 
ORF00599 hypothetical prot in 
ORF00618 hypothetical protein 
ORF00620 hypothetical protein 

ORF00623 hypothetical protein _ 

ORF00626 prophage LambdaSal j transcriptionai regulator, Cro/Cl family 
ORF00628 hypothetical protein 

ORF0063P hypotheticaLprotein • » • 

ORFQQ632 h^otheticalpirotein ~~ 

ORF00635 hypothetical protein 1 - ' ■ 

ORF0063& hypothetical protein . 

QRF0Q637 hypothetical protein • 71 ' \ . ' 

ORF00642 conserved hypothetical protein 

ORF00644 hypothetical protein 

ORF0064j5 hypothetical protein . - . 

ORE00647 hypothetical protein ' ' - 

ORF00649 hypothetical protein ' 

ORF00850 hypothetical protein . 

ORF00653 conserved hypothetical protein ■ 

ORF00657 conserved hypothetical protein, truncation 

ORFQ0661 conserved hypothetical protein . 

OF^00673 hypothetical protein ., " ' » 

ORF00674 hypothetical protein a • 

ORF00675 conserved hypothetical protein 

ORF00676 conserved hypothetical protein " * 

ORF00382 hypothetical protein . , 

ORF00685 conserved hypothetical protein • 

ORF00698 hypothetical protein . 

ORF0071 2 hypothetical protein . 

ORF007 , 18 cell wall surface protein, interruption-N ' 

ORF00723 hypothetical protein . 

QRFQ0735 expressed protein of unknown function 

ORF00737 conserved hypothetical protein, degenerate • 

ORF00738 hypothetical protein 

ORF0074Q hypothetical protein 

ORF00741 hypothetical protein 

ORF00747 cylD protein (cylD) 

QRF00753 cylE protein (cylE) 

ORF00756 cylJ protein (cylJ) 
ORF0Q757 cylK protein (cylK) 

ORF00758 hypothetical protein 

ORF00759 putative secreted protein 

ORF00761 hypothetical protein ^ 

ORF00796 hydrolase, haloacid dehalogenase-like family 

ORF00806 conserved hypothetical protein 

ORF00822 ABC transporter, ATP-binding protein 

ORF00827 hypothetical protein 

ORF00872 cell wall surface anchor family protein 

ORF00909 hypothetical protein 

ORF00923 hypothetical protein 

ORF00924 conserved hypothetical protein 

ORF00942 expressed putative secreted protein 

ORF00943 hypothetical protein 

ORF00944 hypothetical protein > 

ORF01013 hypothetical protein 
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Tabl 12: GBS ORF's not shared with GAS, pneumococcus or any published 

genome 

ORFxxxxx Annotati n 

ORF01014 hypothetical protein 

ORF01015hypoth tica) protein 

ORF01016 hypothetical protein 

ORF01018 hypothetical protein [ ] 

ORF01 01 9 hypothetical protein , ~ . 

ORF01 021 hypothetical protein . ~~ * 

ORF01035Tn916, excisionase ~~ 

QRF01 062 hypothetical protein . , " 

ORF01096 niginTfesistance protein, putative • ] ~ 

ORF01145 lipoprotein, putative . . , " 

ORF01 146 conserved hypothetical protein, FRAMESHIFT , ~ 

QRF01148 lipoprotein, putative* - ' 1 . ■ 

ORF01 149 hypothetical I protein . - • , ' ~ r ~- — ' 

QRF01150 hypothetical protein > . ' T . ] — 

ORF01 151 hypothetical protein . 

ORF01152 lipoprotein, putative , ~ 

ORF01153hypdthetical protein 

ORF01158 hypothetical protein ' . 
ORF01159 hypothetical protein 

ORF01161 expressed conserved domain protein - 

ORF01 162 conserved hypothetical protein 

ORF01166 hypothetical protein . ~ 

ORF01168 conserved hypothetical protein j 

ORF01 169" hypothetical prdteln " ; 

ORF01 1 74 conserved domain protein ' "~ & * 

ORF01175 hypothetical protein 

ORF01 1 86 cell wall surface anchor family protein, putative - 

ORF01187 hypothetical protein , ~ — T 

ORF01204 hypothetical protein 

ORF01 21 5 hypothetical protein / . 

ORF01258 hypothetical protein ; " ' ' *''"■». 

ORF01262 conserved hypothetical protein, FRAMESHIFT - 
ORF01263 hypothetical protein 

ORF01265 hypothetical protein 

ORF01266 hypothetical protein 

ORF01304 polysaccharide biosynthesis protein CpsK(V) (cpsK) 

ORF01308 polysaccharide biosynthesis protein CpsM(V) (cpsM) 

ORF01309 polysaccharide biosynthesis protein cpsH(V) (cpsH) 

ORF01349 hypothetical protein 

ORF01 384 hypothetical protein 

ORF01 385 hypothetical protein 

ORF01386 conserved hypothetical protein . 

ORF01 392 hypothetical protein 

ORF01395 conserved hypothetical protein 

ORF01409 conserved hypothetical protein 

ORF01 41 0 hypothetical protein 
ORF01 41 7 hypothetical protein 
ORF0141 8 hypothetical protein 
ORF01420 hypothetical protein 

ORF01423 conserved hypothetical protein 

ORF01424 conserved hypothetical protein 

ORF01425 conserved hypothetical protein 

QRF01 426 cons rved hyp th ticsl protein — 
ORF01427 hypothetical protein — 
ORF01431 hypothetical pr tein — 
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Tabl 12: GBS ORF's not shared with GAS, pneumococcus or any publish d 

genom 

ORFxxxxx Annotation _ 

ORF01432 conserved domain protein 

QRF01434 hypothetical protein 

ORF01435 calcium-binding protein, putative • 

ORF01437 abortive infection protein AbiGI (abiGI) 
ORF01438 abortive infection protein AbiGIt (abiGM) 
ORF01441 conserved, hypothetical protein, degenerate 

ORF01443 hypothetical protein 

ORF01445Jiypothetical protein ^ • 

ORF01452 hypothetical protein . y . 

ORF01459 hypothetical protein ■ ". . - 

ORF01463 hypothetical protein 

ORF01464 hypothetical protein 

ORF0 1 465 hypothetical protein 

ORF01486 hypothetical protein 

ORF01488 R5 protein 

ORF01575 membrane protein, putative . 

ORF01 581 lipoprotein, putative 

• ORF01601 hypothetical protein 

ORF01611 hypothetical protein 

ORF01638 conserved hypothetical protein ; 

ORF01645 cell wall surface anchor family protein 

QRF01660 membrane protein, putative 

QRF01 666 hypothetical protein . 

ORF01667 hypothetical protein - 

ORF01670 hypothetical protein 

ORF01673 hypothetical protein • 

ORF01 674 hypothetical protein ' . 

ORFQ1675 hypothetical protejn . 

ORF01681 hypothetical protein ; 

ORF01 682 hypothetical protein . . 

QRF01684 hypothetical protein 

ORF01719 hypothetical protein 

ORF01733 hypothetical protein 

ORF01735 hypothetical protein 

ORF01736 hypothetical protein 

ORF01737 hypothetical protein 

ORF01742 hypothetical protein 

ORF01754 hypothetical protein 

ORF01761 transposase, IS30 family, putative, truncation 

QRF01807 hypothetical protein 

QRF01836 hypothetical protein 

ORF01838 hypothetical protein 

ORF01842 hypothetical protein 

ORF01850 hypothetical protein 

ORF01 892 hypothetical protein 

ORF01893 hypothetical protein 

ORF01895 hypothetical protein 

ORF01896 hypothetical protein 

ORF01897 hypothetical protein 

ORF01898 hypothetical protein 

ORF01899 hypothetical protein 

ORF01905 hypothetical protein 

ORF01934 hypothetical protein 

ORF01943 hypothetical protein 

ORF01944 hypothetical protein 



523 



WO 2004/018646 PCT/US2003/026827 

Tabl 12: GBS ORF's not shared with GAS, pneumococcus or any publish d 

genome 

ORFxxxxx Annotation • 

ORF01 953 hypothetical protein 

ORF01984 hypothetical protein . 

ORF01988 hypothetical protein " - 

ORF01989 hypothetical protein ■ . • 

ORF020Q5 hypothetical protein . ' • 

ORF0201 1 hypothetical protein , • 

ORF02016 hypothetical protein ■ , 

ORF02025 hypothetical protein . - 

ORF02026 hypothetical protein • ] ' . .. , 

ORF02045 conserved hypothetical protein . . ', . - ' i 

ORF02047 prophage LambdaSa2, holin, putative 

ORF02048 conserved hypotheticaLprotein ' ■ 

PRF020A9 hypothetical protein . 
QRF02Q5Q conserved domain protein * " A 

ORF02053 conserved hypothetical protein . ' ' > 

ORF02057 hypothetical protein r ' 

ORF02058 hypothetical protein . , • 

ORF02061 hypothetical protein 

ORF02062 hypothetical protein a ■ - , • 

ORF02063 conserved domain protein 

ORF02067 conserved hypothetical protein ; . ' 

ORFQ2069 hypothetical protein ; 

ORF02070 hypothetical protein \ • ~ 

ORF02072 conserved hypothetical protein . ' " ' 

ORF02073 prophage LambdaSa2 t transcriptional regulator. Cro/CI family . 

ORF02075 hypothetical protein ' 

QRF02077 hypothetical protein 

ORF02078 conserved hypothetical protein . • ■ . 

ORF02081 hypottietical protein ; ; - 

QRF02085 hypothetical I protein ^_ 

ORF02087 hypothetical protein ; . 

ORF02088 conserved hypothetical protein - . 

ORFQ2091 conserved domain protein . 

ORF02092 hypothetical protein 

ORF02093 hypothetical protein 

ORF02094 hypothetical protein 

ORF02097 hypothetical protein 

ORF02100 hypothetical protein L _ 

ORF02102 hypothetical protein 

ORF021 08 hypothetical protein 
ORF021 1 9 hypothetical protein 

ORF02124 hypothetical protein 

ORF02171 membrane protein, putative 

ORF02172 hypothetical protein 

ORF02173 membrane protein, putative 

ORF02191 hypothetical protein 

QRF02196 hypothetical protein 

ORF02203 hypothetical protein 

ORF02208 hypothetical protein 

ORF02212 hypothetical protein 

ORF02213 hypothetical protein 

ORF02214 transcriptional regulator, Cro/CI family 

ORF0221 5 expressed protein of unknown function 

ORF02217 conserved hypothetical protein 

ORF02219hypoth tical protein 
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Table 12: GBS ORF's not shared with GAS, pneumococcus r any published 

genome 

ORFxxxxx Annotation 

ORF02221 cell wall anchor protein-r lated protein 

ORF02223 hypothetical. protein 

ORF02224 hypothetical protein 

ORF02225 hypothetical protein 

ORF02231 conserved hypothetical protein 

ORF02235 hypothetical protein . 

ORF02236 conserved hypothetical protein • 

ORF02237 hypothetical protein " 

ORF02238 hypothetical protein - , . 

QRF02239 hypothetical protein , 

ORF02241 hypothetical protein . 

ORF02244 hypothetical pipteih •. 

ORF02245 hypothetical protein 
ORFQ2263 hypothetical protein 

ORF02268 protease, putative : 

ORF02271 hypothetical protein . . 

QRF02279 hypothetical protejn , . 

ORF02283 chromosome assembly-related protein 

ORF02317 hypothetical protein • 

ORFQ2330 hypothetical protein 

ORF02344 site-specific recombinase, phage integrase family 

QRF02345 conserved hypothetical protein 

ORF02347 hypothetical protein _^ •• ., , 

ORFQ2349 conserved hypothetical, protein . 

ORFD23S0 hypothetical protein 
ORF02351 transcriptional regulator, Cro/Ci family 

ORF02354 hypothetical protein ; 

ORF02356 expressed putative secreted protein , 

ORF02395 transcriptional regulator, Cro/CI family ' 

ORF02418 hypothetical protein . 

ORF02422 hypothetical protein ' 

ORF02425 conserved hypothetical protein 

ORF03004 conserved hypothetical protein 

ORF03005 cylX protein 

ORF03006 Tn916 t hypothetical protein 

QRF03007 Tn916, hypothetical protein 

ORF03008 Tn916, hypothetical protein 

ORF03009 Tn916, tetM leader peptide 

ORF03010 Tn916 t hypothetical protein 

ORF03015 conjugal transfer protein, interruption-N 
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Table 13$ Comparative Sequences relating to SAG0466 (tbiolase) 



SEQ XD NO. 1301: SA<?0466 FROM THE 2603V/R. 6BS STRAIN 
CTCCTGCCCCTGCAATGGCAGTTAGACCCAT^^ 

ATGATTAAATAGAGCATCAATCGCTGCAAATGGTTCATTCCATTCAATTGCATC^T 
CTGTTAATAGTTTTTCCGTAGCCGTGTGAACCAATTCTC 

ATCCGGAATTCTOTTTTCTGACTCTGAAGCGTTAGAAATGCAGCAGCATCGTGCATT 

■ CAAAGGTGAATTITCCATCAATCTTGGTAATTTTTGAA • 
CTTCCATTGGTAAQATTACyTCTTCTAAATAGCCACCTTC 
TTATCXAACATTTCTCTTCTAAAaCCATATTT'rTGACAGACTCTCT 
GTCAGGXGAAAACTGAGCAACTGTATATTCTCCGTTACGACT 
TACTTTCAATCCCCCXIAACAAGAACTTTTTCATTAATACCTC 
GATGAAGCACACTGC^ATCAATCGTTTGTA 
ATTGCCCCG&GTACCAACTGTGTTCCCACAAATAAT^ 
AAAGGTGTGCTCCTAAAAGTrCTGGACX3GTAAGTTTAAATTGCTT 

* - * 
SEQ ZD NO. 1302t SAG0466 FROM THE M732 GBS TYPE IIX STRAIN 

TCGGTATAAAAGGGAAGCAATTTAAACATTACCGTGC^^ 
GAATCAGAATCTAATATTC&TAGTATT^^ 

TTTTTCTGATTATGAATCCTATATTCCAGTACAAACGATTGATATGCAGTGTC 

GTTATCTAAAAATqAGTGCCGGTATTAATGAAAAAGTTCTTGTTGGGGGGATTGAA^ 

CGTTACGCTAAAGAAGATAATCGTAACGGA^ 

GTTAGAAGGGGCACAAAGAGTCTGTGAAAAATATGGTTT.T^ 

AACXSCGCCTTAACAGCTAAACAAGGTGGCTATTT^^ 

AGAAAACTAAAAGAAGCATTTTTTCAAAAACT 

TTTAATGCACGATGCTGCTGCATTTCTAACGCTTCAGACT 

CAGGAGATCCCAAGCTTAGTCC^GAATTGGTTCAC^CGGCTACGGAA 

GATTATGATGCAATTGAATGGAATGAACC^^ 

AAAATTCAATATTTTTGGAGGGGCATTAGCT^ 

SEQ ID NO. 1303 T SAG0466 FROM THE 090 GBS TYPE la STRAIN 

TTGTGGGAACACAGTTGGTACTGGGGGCAATATTGGTTOT 

TACAAACGATTGATATGCAGTGTGCTTCATCAAGTTCTGCCTT^ 

GAAAAAGTTCTTGTTGGGGGGATTGAAAGTAGTTCTC 

AATATGGTTTtAGAAGAGAAATGTTAGATAAATTGGCATTC 

TATTTAGAAGAGGTAATCTTACCAATGGAAGGGATGCGAGATCAAGGCGTTAGAAAACTAAAAGAAGCA 
ATTACCAAGATTGATGGrAAATTCACCTTTGCTCACT^ 

CGCTTC^GAGTCAGAAAACAGAATTCCGGATTGTTCACATTGTAGAAGTAGCAGGAGATC 
GTTGACACGGCTACGGAAAAACTATTAACAGAAACTCATACT 
ATTTGCAGCGATTGATGCTTTATTTAATCATTATTATCCTGAAGAGAGAGAAAA 
CTTACGGACACCCTTATGCCTGCTCAGG 

SEQ ID NO. 1304 : SAG0466 FROM THE COHl GBS TYPE la STRAIN 

ATCGGTATAAAAGGGAAGCAATTTAAAATTACCGTCCAGAAC 

GAATCAGAATCTAATATTGATAGTATTATTTGTGGGAACACAGTTGGTACTGGG^ 

TTTTTCIGATTATGAATCCTATATTCCAGTACy\AACGATTGAT^ 

GGTATCTAAAAA 

SEQ ID NO. 1305 i SAG0466 FROM THE CJB GBS NONTYPEABLE STRAIN (REVERSE 
COMPLEMENT) 

TTTTCAAAAATTACCAAGATTGATGGAAAATTC^CCT 

CATTTCTAACX3CTTCAGAGTCAGAAAACAGAATTCCGGATTGTTCA 

CCAGAATTGGTTCACACGGCTACGGAAAAACTATTAACAGAAACT 

GAATGAACCATTTGCAGCGATTGATGCTTTATTTAATCATTATTATCCTGAAGAGA 

GGGCATTAGCTTACGGACACCCTTAATGCCTGCTCAGGAATTATTAATATCC 

SEQ ID NO. 1306 1 • sag0466 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

GGTATAAAAGGGAAGCAATTTAAACATTACCGTCCAGAACTTTTAGGAGCAC^ 

ACCAGAATCTAACATTGATAGTATTATTTGTGGGAACACAGTTGGTACTGGGGG 

TTTCTGATTATGAATCCTATATTC 
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Table 13: Comparative Sequences relating to SAG0466 (thiolaae) 



SEQ ID NO. 130.7 r SAG0466 FROM THE 1169NT1 OBS TYPE V STRAIN REVERSE COMPLEMENT 

CAAGATTGATGGAAAATTCACCTTTGGTCACTATTGGAAATGTTTGTTTAATC 
CAGAGTCAGAAAAGM5AATTCCGGATTGTTCACM 

CACGGCTACGGAAAAACTATTAACAGAAACTCATACTAAAATATCGGATTATGATGCAATTGAATC 
(^GCGATTGATGCTTTATTTAATCATTATTATCCTGAAGAGAGAGAAAAATT 
GGACACCCTTATGCCTGCTCAGGAATTATTAATATCCTTCATCIT^ 
CCTAACTGCCATTGCAGGGGCA 

SEQ ID NO, 1308: SAG0466 FROM THE i8R£21 GBS TYPE II STRAIN 

CCTTAACAGTTAAACAAGGTGGCTATTTAGAAGAGGTAATCOT 

CTAAAAGAAA^TTTTTTCAS^ 

GCACGATGCTGCTGC^OTTCTAACGCTTCAGAGTC^GAAAACAGAA 
ATCCCAAGCTIAGTCGA.GAATTGGTTCACAC 

GATGCAATTGAATGGAATGAACC^TTTGCAGCGATT • 
u fcAATATTTTTGGAGGGACAWAGCTTACGGACACCCn^ 

{MTAAAATATAAAAATAAACCTAT<^ " 

SEQ ID NO. 1309: SAG0466 FROM THE 18RS21 GBS TYPE II ST RAIN 

TCGGTATAAAAGGGAAGCAATTTAAACAlTACCGTCC^^ 
GAATCAGAATCTAACATTGATAGTATTATTTGTGGGAACACAGCT 

TTTTTCTGATTATGAATCCTATATTCC^GTACAAACGATTGATATGCAGTGTGC - 
GTTATCTAAAAATCAGTACCGCTATTAATGAAAAAGTTCTTGTTGGGG 
CGTTATCCTAAAGAAGATAATCGTAACGGAGAATATACAGT^ 
GTTAGAAGGGGCCCAGAGAGTCTGTCAAAAATATGGTTTTAGAAGA 

AACGCGCCTTAACAGCTAAACA r - 

SEQ ID NO. 1310: SAG0466 FROM THE H36b GBS TYPE lb STRAIN 

TTTGGGCTACGAACACCTATCGGTATAAAAGGGAAGCAATTTAAACATTACCCT 

AAATCAAATAAAAAAAATAGAATCAGAATCTAACATTGATAGT^ 

TTGGTCGTTTGATGACTCTTTTTTCTGATTATGAATCCTATATTCCAG 

AGTTCTGCCTTGTTTTTTGGTOATCTAAAAATCAGTACC 

TTCTCTTC^CCTATGAGATOTTATGCTAAAG^GATAATCCT 

CTTATGCTGAAACTGTAATGTTAGAAGGGGCCC 

SEQ ID NO. 1311: SAG0466 FROM THE H36b GBS TYPE lb STRAIN (REVERSE COMPLEMENT) 
GAAAATTCACCTTTGCXCACTATTGGAAATGTTTGTTTAATG 

AACAGAATTCCGGATTGTTCACATTGTAGAAGTAGCAGGAGATCCCAAGCTTAGTCCA 

AAAAACTATTAACAGAAACTCATACTAAAATATCGGATTATGATGCAATT^ 

GCTCTATTTAATCATTATTATCCTGAAGAGAGAGAAAAAT^ 

TGCCTGCTCAGGAATTATTAATATCCTTCATCTTA 

TTGCAGGGGCAGGA 

SEQ ID NO. 1312: SAG0466 FROM THE M781 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

CCTTTGCTCACTATTGGAAATGTTTGTTTAA 

CCGGATTGTTGA.CATTGTAGAAGTAGCAGGAGATCCC 

TAACAGAAACTCATACTAAAATATCGGATTATGATGCAATTGAATGGAATGAACC^ 

AATCATTATTATCCTGAAGAGAGAGAAAAATTCAATATTTTTGGAGGGGCATTAGCTTACGGACACC 

AGGAATTATTAATATCCTTCATCTTATGGAGGCATO 

SEQ ID NO. 1313: SAG0466 FROM THE M781 GBS TYPE III STRAIN 

GCAATTTAAACATTACCGTCGAGAACTTTTAGGAGGACACCT 

TTGATACTATTATTTGTGGGAACACAGTTGGTACTGGGGGCAATAT^ 

TCCTATATTCCAGTACAAACGATTGATATGCAGTGTGCTTCATCAAG 

TGCCGGTATTAATGAAAAAGTTCTTGTTGGGGGGATTGAAAGTAGTTCTCIT 

ATAATCGTAACGGAGAATATACCGTTGCTG&GTTTTCT^ 

SEQ ID NO 1314: SAG0466 FROM THE A909 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

CCTTTGCTCACTATTGGAAATGTTTGTOTAATCC 

CCGGATTGTTCACATTGTAGAAGTAGCAGGAGATCCCA 

TAACAGAAACTCATACTAAAATATCGGATTATGATGCAATTGAATGGAATGAACC^ 
AATCATTATTATCCTGAAGAGAGAGAAAAATTCAATATT^ 

AGGAATTATTAATATCCTTCATCTTATGC^GGC^TTAAAATATAAAAATAAACCTAT^ 
C 
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Table 13? Comparative Sequences relating to SAG0466 (thiolase) 

SEQ ID NO.- 1315 s SAG0466 FROM THE JM9130013 GBS TYPE VIII STRAIN REVERSE 
COMPLEMENT 

GCTCACTATTGGAAATGTTTGTTTAATGCACGATGCTGCTGCATC 
TTGTTCAC^TTGTAGAAGTAGCAGGAC^TCCCA 

GAAACTC^TACTAAAATATCGGATTATGATGCAATTGAATGGAATGAACCATTTC 

TTATTATCCTGAAGAGAGAGAAAAATTCAATATTTTTGGAGGGGCATO 

TTATTAATATCCTTCATCTTATGCAGGCATTAAAATATAAAAATAAACCTATGGGTCTAA 

SEQ ID NO. 1316$ SAG0466 FROM THE JM9130013 GBS TYPE VIII STRAIN 

TTTGGGCTACGAACACttATCGGTATAAAAGGGAAGCAAOT 
AAATCAAATAAAAAAAATAGAATCAGAATCTAACATTGATAGTA 
TTGGTCGTTTGATGACTCTTTTTTCTGATTATGAATC^ 
AGTTCTGCCTTGTTTTTTGGTTATCTAAAAATGAG 

TTCTCTOCAACCTATGAGACGTTATGCTAAAGAAGATAATCGTAACGGAGAATO 
SEQ13 01 CTCCTGCCCCTGTCAATCGCAGTT^ 

SEQ1302 — ' r- 

SEQ1303 w— '-i — — ' 

SEQ1304 I—*. — — — , > ----- 

SEQ1305 ~- 

SEQ1306 - — 

SEQ1307 — — ^ 

SEQ1308 CfTAACAGTTAAACAAGGTGGCTATTTAGAAGAGGTAATCTTACCAATGGAAGGGATGC 

SEQ1309 -- — - 

SBQ1310 * 

SEQ1311 — 

SEQ1312 

SEQ1313 r-"-' 

SEQ1314 

SEQ1315 - 

SEQ1316 -- * 



SEQ 13 02 _ _ - - - TCGGTATAAA 

SEQ1303 --- — — — — — 

SEQ13 04 • ATCGGTATAAA 

SEQ13 05 ■ TTTTCAAAAATTACCAAGATTGATGG 

SEQ13 06 GGTATAAA 

SEQ13 07 CAAGATTGATGG 

SEQ13 0 8 AGATCAAGGCGTTAGAAAACTAAAAGAAACATTTTTTCAAAA 

SEQ1309 TCGGTATAAA 

SEQ1310 TTTGGGCTACGAACACCTATCGGTATAAA 

SEQ1311 --- G 

SEQ1312 

SEQ1313 

SEQ1314 

SEQ1315 - 

SEQ1316 TTTGGGCTACGAACACCTATCGGTATAAA 

SEQ1301 TAATGTCCCTCCAAA- AATATTGAATTTTTCTCTCTC - TTCAGGATAATAATGATTAAA 

SEQ130 2 GGGAAGCAATTTAAACATTACCGTCC^GAACTTTTAGGAGCAC^CCTCTTAAATa^T 

SEQ1303 - " " 

SEQ1304 GGGAAGCAATTTAAA - ATTACCGTCCAGAACTTTTAGGAGCACACCTCITAAATCAAAT 

SEQ13 0 5 AAATTCACCTTTGCTCACTATTGGAAATGTTTGTTTAATGCACGATGCTGCTGCATTTC 

SEQ13 0 6 GGGAAGCAATTTAAACATTACCGTCCAGAACTTTTAGGAGC^ 

SEQ1307 AAATTGACCTTTGCTCACTATTGGAAATGTTTGTTTAA^ 

SEQ13 0 8 AAATTCACCTTTGCTCACTATTGGAAATGTTTGTTTAATGCACG^ 

SEQ130 9 GGGAAGCAATTTAAACATTACCGTCCAGAACTTTTAGGAGCACA 

SEQ1310 GGGAAGCAATTTAAACATTACCGTCCAGAACTTTTAGGAGCACACCTOT 

SEQ13 11 AAATTCACCTTTGCTGACTATTGGAAATGTTTGTOTAA 

SEQ13 12 CCTTTGCTCACTATTGGAAATGTTTGTTTAATGCACGATGCTGCTC 

SEQ1313 GCAATTTAAACATTACCGTCCAGAACTTTTAGGAGCACACCTCTTAAATCAAAT 

SEQ 13 14 CCTTTGCTGACTATTGGAAATGTTTGTTTAATGCACGATC 

SEQ1315 GCTCACTATTGGAAATGTTTGTTTAATGCACGATGCTGCTGCATTTC 
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Table 13: Comparative Sequences relating to SAG0466 (thiolase) 

SEQ1316 •• GGGAAGCAATTTAAACATTACCGTCCAGAACTTTTAGGAGG^ 

SEQ13 0 1 AGAGC^TCAATCGCTGCAAATGGTTCATTCC-ATTCAATTGCATCATAATCCGATATTT 

SEQ1302 AAAAAAATAGAATC AGAATCTAAT - -ATT GAT AGTATT ATTTGTGGGAACA - CAGT 

SEQ1303 TTGTGGGAACA- CAGT 

SEQ1304 AAAAAAATAGAATCAGAATCTAAT - -ATT GATAGTATTAT TTGTGGGAACA- CAGT 

SEQ13 0 5 AACGCTTCAGAGTCAGAAAACAGA- - ATTCCGGATTGTTCACATTGTAGAAGTAGCAGG 

SEQ1306 AAAAAAATATAACCAGAATCTAAC - -ATT GATAGTATTATTTOTGGGAACA- CAGT 

SEQ13 07 AACGCTTCAGAGTCAGAAAACAGA- -ATTCCGGATTGTTCACATTGTAGAAGTAGCAGG 

SEQ13 0 8 AACGCTTCAGAGTCAGAAAACAGA- - ATTCCGGATTGTTGACATTGTAGAAGTAGCAGG 

- SEQ13 0 9 AAAAAAATAGAATC AGAATCTAAC - - ATT- - -6ATAGTATTATTTGTGGGAACA- CAGT 

SEQ1310 AAAAAAAT AGAATCAGAATCT AAC - -ATT GATAGTATTATTTGTGGGAACA- CAGT 

SEQ1311 AACGCTTCAGAGTCAGAAAACAGA- - ATTCCGGATTGTTCACATTGTAGAAGTAGCAGG 

SEQ13 12 AACGCTTCAGAGTCAGAAAACAGA- -ATTCCGGATTGTTCACATTGTAGAAGTAGCAGG 

SEQ1313 AAAAAAATAGAATCAGAATCTAAT- - ATT GATAGTATTATTTGTGGGAACA- CAGT 

SEQ1314 AACGCTTCAGAGTCAGAAAACAGA- -ATTCCGGATTGTTCACATTGTAGAAGTAGCAGG 

SEQ1315 AACGCTTCAGAGTCAGAAAACAGA- - ATTCCGGATTGTTCACATTGTAGAAGTAGCAGG 

SEQ1316 AAAAAAATAGAATCAGAATCTAAC- - ATT GATAGTATTATTTGTGGGAACA- CAGT 

" SEQ1301 AGTATGAGTTTCTGTTAATAGTTTTTCOSTAGCCGTGTGA^ 

/ SEQ1302 GGTACTGGGGGCAATATTGG - TCGTTTX^TGACTCITTTTTCTGATTATGAATCCTA - - 

SEQ1303 GGTACTGGGGGCAATATTGG - TCGTTTGATGAClXTrTTTTTCTGATTATGAATCCTA - - 
SEQ1304 * , GGTACTGGGGGCAATATTGG - TCGTTTGATGACTCTTTTTTCTGATTATGAATCCTA - - 

SEQ130S GATCCC^GCTTAGTCCAGAATTGGtTCACACGGCTACGGA 

SEQ13 0 6 GGTACTGGGGGCAATATTGG - TCGTTTGATGACTCTTTTTTCTGATTATGAATCCTA- - 

. SEQ13 07 GATCCCAAGCTTAGTCCAGAATTGGTTCACACGGCTACGGAAA 

SEQ1308 GATCCC^VAGCTTAGTCCAGAATTC^TTCAC^ 

SEQ1309 GGTACTGGGGGCAATATTi^G - TCGTTT^TGACTCTTTTTTCTGATTATGAATCCTA - - 

SEQ1310 GGTACTGGGGGCAATATTGG - TCGTTTGATGACTCTTTTTTCTGATTATGAATCCTA - - 

SEQ13 11 GATCCCAAGCTTAGTCCAGAATTGGTTCACACGGCTACGGAAAAACTATTAACAGAAA 

SEQ1312 GATCCCAAGCTTAGTCCAGAATTGGTTCACACGGCTACGGAAAAACTATTAACAGAAAC 

SEQ13li GGTACTGGGGGCAATATTGG - TCGTTTGATGACTCTTTTTTCTGATTATGAATCCTA- - 

SEQ1314 GATCCCAAGCTTAGTCCAGAATTGGTTCACACGGCTACGGAAAAACTATTAACAGAA^ 

SEQ1315 GATCCCAAGCTTAGTCCAGAATTGGTTCACACGGCTACGGAAAAACT 

SEQ1316 GGTACTGGGGGCAATATTGG - TCGTTTGATGACTCTTTTTT CTGATT ATGAATCCTA - - 

SEQ1301 GGGATCTCCTGCTACTTCTACAATGTGAACAATCCGGA- ATTCTGTTTTCTGACTCTGA 

SEQ1302 TATTCCAGTACAAACGATTGATATGCAGTGTGCT^ 

SEQ1303 TATTCCAGTACAAACGATTGATATGCAGTGTGCTTCATCAAGT - -TCTGCCTTGTTTTT 

SEQ1304 TATTCCAGTACAAACGATTGATATGCAGTGTGCTTCATCAAGT - - TCTGCCTTGTTTTT 

SEQ1305 CATACTAAAATATCGGATTATGATGGAATTGAATGGAAT^ 

SEQ1306 TATTC 

SEQ1307 CATACTAAAATATCGGATTATGATGCAATTGAATGGAATGAACC^TTTGCAGCGATTGA 

SEQ13 0 8 CATACTAAAATATCGGATTATGATGCAATTGAATGGAATGAACCATTTC 

SEQ1309 TATTCCAGT ACAAACGATTGATATGCAGTGTGCTTCATCAAGT - -TCTGCCTTGTTTTT 

SEQ1310 TATTCCAGTACAAACGATTGATATGCAGTGTGCTTCATCAAGT- -TCTGCCTTGTTTTT 

SEQ13 11 CATACTAAAATATCGGATTATGATGCAATTGAATGGAATGAACCATTTG 

SEQ1312 CATACTAAAATATCGGATTATGATGGAATTGAATGGAATGAA^ 

SEQ1313 TATTCCAGTACAAACGATTGATATGCAGTGTGCTTCATCAAGT - -TCTGCCTTGTTTTT 

SEQ1314 CATACTAAAATATCGGATTATGATGCAATTGAATGGAATGAACCATTTC 

SEQ1315 CATACTAAAATATCGGATTATGATGCAATTGAATGGAATGAACC^ 

SEQ1316 TATTCCAGTACAAACGATTGATATGCAGTGTGCTTCATCAAGT - -TCTGCCTTGTTTTT 
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Table 13: Comparative Sequences relating to SAG0466 (thiolase) 



SEQ1301 

SEQ1302 

SEQ1303 

SEQ1304 

SEQ1305 

SEQ1306 

SEQ1307 

SEQ1308 

SEQ1309 

SEQ1310 

SEQ1311 

SEQ1312 ' 

SEQ1313 

SEQ1314 

SEQ1315 

SEQ1316 

SEQ1301 
SEQ1302 
SEQ1303 
SEQ1304 
SEQ1305 
SEQ1306 
SEQ1307 
SEQ1308 
SEQ1309 
SSQ1310 
SEQ1311 
SEQ1312 
SEQ1313 
SEQ1314 
SEQ1315 
SEQ1316 

SEQ1301 
SEQ1302 
SEQ1303 
SEQ1304 
SEQ1305 
SEQ1306 
SEQ1307 
SEQ1308 
SEQ1309 
SEQ1310 
SEQ1311 
SEQ1312 
SEQ1313 
SEQ1314 
SEQ1315 
SEQ1316 



GCGTTAGAAATGCAGCAGCATCGTGCATTAAACAAACATTTC - - GAATAGTGAGCAAAG 
GGT - TATCTAAAAATCAGTG - CCGGTATTAATGAAAAAGTTCTTGTTGGGGGGATTGAA 

- TATCTAAAAA - — — - — 

G CTTT ATTT AAT C ATT ATT ATCCTG AAGAGAGAGAAAAAT T CAATATTTTTGGAGGGGC 
: _ » 

GCTTTATTTAATCATTATTATCCTGAAGAGAGAGAAAAATTGAATATTTTTC 
GCTCTATTTAATCATTAWATCCTGAAGAGAGAGAAAAATTC^ 

GGT - TATCTAAAAATCAGTA - CCGGTAtTAATGMAAAGTTCTTGTTGGGGGGATTGAA 
*GGT -TATCTAAAAATCAGTA- CCGGTATTAATGAAAAAGTTCTTGTTGGGGGGATTGAA 
GCTCTATTTAATCATTATTATCCTGAAGAGAGAGAAAAATTCAATAi^XU"l J i<^AGGGAC 
GCTTTATTTAATCATTATTATCCTGAAGAGAGAGAAAAATTC 

GGT - TATCTAAAAATCAGTG - CCGGTATTAATGAAAAAGTTCTTGTTGGGGGGATTGAA 
GCTCT ATTTAATCATTATT AT CCTGJ^ftGAG AGAGAAAAATT CAATATTrTrGGAGGGAC 
GCTCTATTTAATCATTATTATCCTGAAGAGAGAGAAAAATTCAA 

GGT - TATCTAAAAATCAGTA- CCGGTATTAATGAAAAAGTTCI^GTTGGGGG<^TTGAA 

TGAATTTTCCATCAATCTTGG - - TAATTTTTGAAAAAATGTTTCTTTTAGTTTiX^rAAC 
GTAGTTCTGTTCAACCTATGAGACGTTACGCTAAAGAAGATAATCGTAACGGAGAATAT 
GTAGTTCTCTTCAACCTATGAGACGTTACGCTAAAGAAGATAATCGTAACGGAGAATAT 



TTAGCTTAC6GACACCCTTAA- -TGCCTGCTCAGGAATTATTAATATCC 1- # 

TTAGCTTACGGACACCCTTA TGCCTGCTCAGGAATTATTAATATCCCTCATCTTAT 

TTAGCTTACGGACACCCTTA TGCCTGCTCA^GGAATTATTAATATCCTTCATCTTAT 

GTAGTTCTCTTCAACCTATGAGACGTTATGCTAAAGAAC^ 

GTAGTTCTCTTCAACCTATGAGACGTTATGCTAAAGAAGATAATCGTAACGGAGAATAT 
TTAGCTTACGGACACCCTTA- - - TGCCTGCTCAGGAATTATTAATATCCTTCATCTTAT 

TTAGCTTACGGACACCCTTA TGCCTGCTCAGGAATTATTAATATCCTTCATCTTAT 

. GTAGTTCTCITCAACCTATGAGACGTTACGCTAAAGAAGATAATCGTAACGGA 

TTAGCTTACGGACACCCTTA TGCCTGCTCAGGAATTATTAATATCCTTCATCTTAT 

TTAGCTTACGGACACCCTTA- - - TGCCTGCTCACSGAATTATTAATATCCTTCATCTTAT 
GTAGTTCTCTTCAACCTATGAGACGTTATGCTAAAGAAGATAATCGTAACGGAGAATAT 

CCTTGATCTCGCATCCCTTCCATTGGTAAGATTACYTCTTCTAAATAGCCACCTTGTTT 
CCGTTGCTCAGTTTTCTCCTGACTCTTATGCTG--AAACTGTAATGTTAGAAGGGGCAC 
CCGTTGCTCAGTTTTCTCCTGACTCTTAKGCTG- - AAACTGTAATGTTAGAAGGGGCAC 

CAGGCATTAAAATATAAAAATAAACCTATGGGC - CTAACTGCCATTGCAGGGGCA 

CAGGCATTAAAATATAAAAATAAACCTATGGGT - CTAACTGCCATTGCAGGGGCAG 

CAGTTGOTCAGTTTTCTCCTGACTCTTATGCTG - - AAACTGTAATGTT AGAAGGGGCCC 
CAGTTGCTCAGTTTTCTCCTGACTCTTATGCTG - -AAACTGTAATGTTAGAAGGGGCCC 
CAGGCATTAAAATATAAAAATAAACCTATGGGT - CTAACTGCCATTGCAGGGGCAGGA - 

CAGGCATTAAAATATAAAAATAAACCTATGGGTTCTAACTGC 

CCX3TTGCTCAGTTTTCTCCTGACTCTTATGCTG - - AAACTGTAATGTT AGA 

CAGGCATTAAAATATAAAAATAAACCTATGGGT - CTAACTGCCATTGCAGGGGC 

CAGGCATTAAAAT ATAAAAATAAACCTATGGGT - CTAACTGCCATTGCAGGGGCAGGA - 
TAB CMARATVS TNC S RATNGTS AGTHAS 
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Table 13: Comparative Sequences relating to SAG0466 (thiolase) 



SEQ1301 
SEQ1302 
SEQ1303 
SEQ1304 
SEQ1305 
SEQ1306 
SEQ1307 
SEQ1308 
SEQ130 9 
SEQ1310 
SEQ1311 
SEQ1312 
SEQ1313 
SEQ1314 
SEQ1315 
SEQ1316 

SEQ1301 

9EQ1302 

SEQ1303 

SEQ1304 . 

SEQ1305 

6EQ1306 

SEQ1307 

SEQ1308 

SEQ1309 

SEQ1310 

SEQX311 

SEQ1312 

SEQ1313 

SEQ1314 

SEQ1315 

SEQ1316 

SEQ1301 
SEQ1302 
SEQ1303 
SEQ1304 
SEQ1305 
SEQ1306 
SEQ1307 
SEQ1308 
SEQ1309 
SEQ1310 
SEQ1311 
SEQ1312 
SEQ1313 
SEQ1314 
SEQ1315 
SEQ1316 



GCTGTTAAGGCGCGTTTATGGCTCAAGAATC 

AAGAGTCTGTCAAAAATATGGTTTTAGAAGAGAAATGTTAGATAAATTGGCATTCTTGA 
AAGAGTCTGTCAAAAATATGGTTTTAGAAGAGAAATGTTAGATAAATTGGCATTCTTGA 

~ ^ 2 ~ 1 1 1 1 Z ~!I Z ZZZIZZII IZZIIZIIZZ II I 

GAGAGTCTGTCAAAAATATGGTTTTAGAAGAGAAATGTT^^ 
q - - - - -------- __ 

CCATATTTTTGACAGACTCTCTGGGCCCCTT — CTAACATTACAGTTTCAGCATAAGAG 

CCATAAACGCGCCTTAACAGCTAAACAAGGTGGCTATTTAGAAGAGGTAATCTTAC^ 

CCATAAACGCGCCTTAACAGCTAAACAAGGTGGCTAT^^ 



CCATAAACGCGCCTTAACAGCTAAACA- 



CAGGAGAAAACTGAGCAACTGTATATTCTCCGTTACGATTATCTTCTTTAGCATAACGT 
GGAAGGGATGCGAGATCAAGGCGTTAGAAAACTAAAAGAAGCATTTTTTCAAAAATTA^ 
GGAAGGGATGCGAGATCAAGGCGTTAGAAAACTAAAAGAAGCAT^ 
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Table 13: Cfcmparative Sequences relating to SA60466 (thiolase) 



SEQ1301 
SEQ1302 
SEQ1303 
SEQ1304 
SEQ1305 
SEQ1306 
SEQ1307 
SEQ1308 
SEQ1309 
SEQ1310 
SEQ1311 
SEQ1312 
SEQ1313 
SEQ1314 
SEQ1315 
SEQ1316 • 

SEQ1301 
SEQ1302 
SEQ1303 
SEQ1304 
SEQ1305 
S?Q1306 
SEQ1307 
SEQ1308 
SEQ1309 
SEQ1310 
SEQ1311 
SEQ1312 
SEQ1313 
SEQ1314 
SEQ1315 
SEQ1316 

SEQ1301 
SEQ1302 
SEQ1303 
SEQ1304 
SEQ1305 
SEQ1306 
SEQ1307 
SEQ1308 
SEQ1309 
SEQ1310 
SEQ1311 
SEQ1312 
SEQ1313 
SEQ1314 
SEQ1315 
SEQ1316 



TCATAGGTTGAAGAGAACTACTTTCAATCCCCCCAACAAGAACTTOT 

AAGATTGATGGAAAATTCACCTTTGCTCACTATTGGAAATGTTTGTTTAATGCACGATG 

AAGATTGATGGRAAATTCACCTTTGCTCACTATTGGAAATGTTTGTTTAATGCACGATG 



TACTGATTTTTAGATAACCAAAAAAC — AAGGCAGAACTTGATGAAGCACACTGCATAT 

TGCTGCATTTCTAACGCTTCAGAGTCAGAAAAGAGA 

TGCTGCATTTCTWACGCTTCAGAGTGAGAAAACAGAAT^ 



AATCGTTTGTACTGGAATATAGGATTGATAATCAGAAAAAAGAGTCATCAAACGACCAA 
AGTAGCAGGAGATCCCAAGCTTAGTCCAGAATTGGTTCACACGGCTACGGAAAAACTAT 
AGTAGCAGGAGATCCCAAGCTTAGTCCAGAATTGGTTCACACGGCTACGGAAAAACTAT 
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Table 13: Conqparative Sequences relating to SAG0466 (thiolase) 



SEQ1301 

SEQ1302 

SEQ1303 

SEQ1304 

SEQ1305 

SEQ130 6 

SEQ1307 

SEQ1308 

€£01309 

SEQ1310 

SEQ1311 

SEQ1312 

SEQ1313 . 

SEQ1314 

SEQ1315 

SEQ1316 

SEQ1301 
SEQ1302 
SEQ1303 
SEQ1304 
SEQ1305 
.SPQ1306 
SEQ1307 
SEQ1308 
SEQ1309 
SEQ1310 
SEQ1311 
SEQ1312 
SEQ1313 
SEQ1314 
SEQ1315 
SEQ1316 

SEQ1301 
SEQ1302 
SEQ1303 
SEQ1304 
SEQ1305 
SEQ1306 
SEQ1307 
SEQ1308 
SEQ1309 
SEQ1310 
SEQ1311 
SEQ1312 
SEQ1313 
SEQ1314 
SEQ1315 
SEQ1316 



ATTGCCCC(^GTACC^CTGTGTTCCCACAAATAATACTATCAATGTTAGATTCTGATT 

AACAGAAACTCATACTAAAATATCGGATTATGATGCA^ 

AACAGAAACTCATACTAAAATATCGGATTATGATGCAA 

TATTTTTTTTATTTGATTTAAAAGgIX3TGCTCCT 

AGCGATTGATGCTTTATTTAATCATTATTATC 

AGCGATTGATGCTTTATTTAATGA^ 

» — — ** \ 

TGCTT 

TGGAGGGGCATTAGCTTACGGACACCCTTATGCCTGCTCAGGAATTA 
TGGAGGGGCATTAGCTTACGGACACCCTTATGCCTGCTCAGG 
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Table 14: Comparative Sequences relating to SAG0471 (glucokinase) 



SEQ ZD NO. 1401s SAG0471 FROM THE 18RS21 GBS TYPE IX STRAIN 

TTAAATTTGGTATCTTGACGCTTGAGGGAQAAGTACAAGAAAAA 

TCTGATATOSTTGAATCTCTCAAACATCGTTTGAGCCTCT^ 

AGCTGTTGATAGAACTAGTAAAACAGTAACAGGTGCTTTTAAT 

AAGTTGGAATTCCATTTOTTATTGATAACGATGCTAA 

GTTGTTTTCGTAACCCTCGGAACAGGAGTAGGTGGAGGTGTTATCGCAGA 

AATTGGGCATATGATTGTTGATCCAGAAAATGGATTTACGTGCAC^ 

GTGTTGTTAGAGTAGCACGT CAACTGGCAGAACAATA'yGAGGGTTCXjTCTGCC^TTAAAG CAGCGATTGACACCGGTGATACTGTTACA 

AGTAAAGATATTTTTATA'GCAGCAGAAG^TGGGGAT^ 

AGCTAATATTTCAAATATTTTAAAC^CTGATT 

AGAAATACTTTGTCACATTrreCT^^ 



SEO ZD NO. 1402s SAG0471 FROM THE 090 GBS TYPE Za STRAIN 
CGTTTCTGATATCGTTGAATCTCTCAAACA 

CAGGAGCTGTTGATAGAACTAGTAAAACAGTAACAGGTGCTTTTA^ 
AAAGAAGTTGGAATTCCATTTTTTATTGATAACGATG^ 
- CGATGTrGTTTTC^TAACCCTCGGAAC^GGAGTAGGTGGAGGTGTTAT - 
GAGAAATTGGrGCATATGATTGTTGATCC^GAKAA 

TACAAGTAAAGATATTTTTATAGCAGCAGAAGAJTCG^ 
CAGCAGCTAATATTTCAAATATTTTAAACCCTGA 
' GTTGAGAAATACTTTGT CACATTTG _ ' « 

SEQ ZD NO. 1403: SA60471 FROM THE COH1 GBS TYPE Za STRAIN 

ACAAGAAAAATGGGCAATTGAGACCAATACTTTAGAAAACGGAAGAC^ 

GCCTCTATGGATTAACAAAAGATGACTTTCTCX^TAT 

GCTTTTAATCrAAATTGGGCTGATACTCAAGA 

SEQ ZD NO. 1404: SAG0471 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

TTGGTATCTTGACGCTTGAGGAGAAGTACAAGAAAAATGGGCAA 

TCGTTGAATCTCTCAAAC^TCGTTTGAGCCT 

GATAGAACTAGTAAAAC 

SEQ ZD NO. 1405: SAG0471 FROM THE CJB110 GBS NONTYPEABLE STRAIN 
CACCAGCTAATATTTCAAATATTTTAAACCCTGATTCTGTGGTTA 
GTTGAGAAATACTTTGTCACATTTGCT TTCCCACAAGTTAAAAAG 

SEQ ZD NO. 1406: SAG0471 FROM THE 2603V/R GBS TYPE V STRAIN 

GGGCAATTGAGACCAATACTTTAGAAAACGGAAGACATATCGTTTCTGATATTO 
TTAACAAAAGATGACTTTCTCGGTATCGGT ATGGGTT CTC CAGGAGCTG 

SEQ ZD NO. 1407: SAG0471 FROM THE H36b GBS TYPE lb STRAIN 

GGCAATTGAGACCAATACTTTAGAAAACGGAAGACATATCGTTTCT 

AATTGGGCTGATACTCAAGAAGTAGGTTCAGTTATTGAAAAAG 
ACTTGGTGAACXSCTGGGTAGGTGCTGGTGCCAATAATCCCGAC^ 

SEQ ZD NO. 1408: SAG0471 FROM THE H36 GBS TYPE Zb STRAIN (REVERSE COMPLEMENT) 

TGACAACGGTGATACTGTTACAAGTAAAGATATTTTTATAGCA 
CACGTTACCTTGGACTGGCAGCAGCTAATAT^^ 

GAATTTTTACGTAGTCG CGT TGAGAAATACTTTGTCAC^TTTGCTTT CCCACA 

SEQ ZD NO. 1409: SAG0471 FROM THE M732 GBS TYPE ZZZ STRAIN 

ACAAGAAAAATGGGCAATTGAGACCATACTTAGAAAACGGAAGA 
CTCTATGGATTAACAAAAGATGACTTTCTCGGTATCG^ 

TTTT AATCTAAATTGGG CTGATACTCAAGAAGTAGGTT CGGTTATTGAAAAAGAAGTTGGAATT CCATTT TTTATTGATAACGATGCT A 
ATGTTGCAGCACTTGGTGAACGCTGGGTAGGTGC 

GGTGTTATCX3CAGATGGTAACCTCATC CATGGTGTTG CAAGAGCAGGTGGAGAAATTGGGCATATGATT 

SEQ ZD NO. 1410: SAG0471 FROM THE M732 GBS TYPE ZZZ STRAIN (REVERSE COMPLEMENT) 

CAGCAGCAGGTGAATTTTTACGTAGTCGCGTTGAGAAATACTTTOT 
ATTGCTGAACTAGGTAATGAT 

SEQ ZD NO. 1411: SAG0471 FROM THE M7 81 GBS TYPE ZZZ STRAIN 

AGAAGTACAAGAAAATGGGCAATTGAGACCATACTTAG 

TGAGCCTOTATGGATTAACAAAAGATGACTTTCT CGGTAT CGGTATGGGTTCT C CAGGAGCTGTTGATAGAACTAGT AAAACAGTAACA 

GGTGCT^TTAATCTAAATTGGGCTGATACTCAAGAAGTA 

TGCTAATGTTGCAGCACTTGGTGAACGCTGGGTAGGTGCT 
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Table 14: Comparative Sequences relating to SAG0471 (glucokinase) 



SEQ ID NO. 1412: SAG0471 PROM THE M781 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

GATACTGTTACAAGTAAAGATATTTTTATAGC^GCAGAAGATGGGGATAAATTTGCT 

TGGACTGGCAGCAGCTAATATTTCAAATATTTTAAACCCTGATTCTGTGGTT^ 

GTAGTCGCGTTGAGAAATACTTTGTCACATTTGCTTTCCCACAAGTTAAAAA 

SEQ ID NO. 1413 « SAG0471 FROM THE 090 GBS TYPE la STRAIN 

AAATTTGGTATCTTGACGCTTGAGGGAGAAGTACAAGAAAAATGGGCAT^ 

TATCGTTGAATCTCTCAAACATCGTTTGAGCCTCrATGGAT^ 

TTGATAGAACTAGTAAAACAGTAAOVGGTCCTTTTAATCTAAAT^ 

GGAATTCCATTTTTTATTGATAACGATGCTAATGTTG 

TTTCGTAACC CTCGGAACAGGAGTAGGTGGAGG . 

SEQ ID NO. 1414: SAG0471 PROM* THE 090 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

GTGATACTGTTACAAGTAAAGATATTTTTATAGCAGCA^ 

CTTGGACTGGCAGC!AGCTAATATTTCAAATAT 

ACX3TAGTCGCGTTGAGAAATACTTTATCACATTTGK!TrTCCCA 

«■ * ** • 

SEQ ID NO. 1415 1 SAG0471 PROM THE JM9130013 GBS TYPE VIII STRAIN (REVERSE COMPLEMENT) 

GTTATCGCAGATGGTAACCTCATCCATGGTGTTGCAGGAG 
GTGCACATGTGGTAACAAAGGCTGCCTTGAGACAGTTGCATC^ 

TTTGCTAATTCTGTTGTTGAACGTGTATC^ 
' TATTGGTGGCGGTGTCTCAGCAGCAGGTGAATTTlTACG 
AGTCAACTAA 

SEQ ID NO. 1416: SAG0471 FROM THE JM9130013 GBS TYPE VIII STRAIN (REVERSE COMPLEMENT) 1 

TGGTATCiTGACGCTTGAGGGAGAAGTACAAGAA 
GTTGAATCTC!TC*AAACATCX3TTT(^GCCT 
TAGAACTAGTAAAACAGTGACAGGTGCTTTTA 
TTCCATTTTTTATTG 

SEQ ID NO. 1417: SAG0471 PROM THE 2603V/R TYPE V GBS STRAIN (REVERSE COMPLEMENT) 

AGCAGCTAATATTTCAAATATTTTAAACCCrrGATT 
TTGAGAAATACTTTGTCACATTTGTTTTCCCACAAGGT 

SEQ1401_ — " 

SEQ1402 

SEQ1403 

SEQ1404 

SEQ1405 

SEQ1406 

SEQ1407 

SEQ1408 

SEQ1409 

SEQ1410 

SEQ1411 ~ 

SEQ1412 

SBQ1413 

SEQ1414 

SEQ1415 TTATCGCAGATGGTAACCTCATCCATGGTGTTGCAGGAGCAGG 

SEQ1416 " 

SEQ1417 - - 



SEQ14U1_ 

SEQ1402~ --- 

SEQ1403 --- " 

SEQ1404 ~ 

SEQ1405 

SEQ1406 - - " 

SEQ1407 

SEQ1408 - - --GAG 

SEQ1409 

SEQ1410 

SEQ1411 

SEQ1412 — 

SEQ1413 - " 

SEQ1414 - ~ ~ 

SEQ1415 TGATTGTTGATCCAGAAAATGGATTTACX3TGCACATGT 

SEQ1416 — - - 

SEQ1417 --- - 
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Table 14: Comparative Sequences relating to SAG0471 (glucokinase) 



SEQ1401_ 

SEQ1402 

SEQ1403 

SEQ1404 

SEQ1405 

SEQ1406 

SEQ1407 

SEQ1408 

SEQ1409 

SEQ1410 

SEQ1411 

SEQ1412 

SEQ1413 

SEQ1414 

SEQ14X5 

SEQ1416 

SEQ1417 

SEQ1401_ 

SEQ1402 

SEQ1403 

SEQ1404 

SEQ1405 

SEQ1406 

SEQ1407 

SEQ1408 

SEQ1409 

SEQ1410 

SEQ1411 

SEQ1412 

SEQ1415 

SEQ1414 

SEQ1415 

SEQ1416 

SEQ1417 

SEQ1401_ 

SEQ1402 

SEQ1403 

SEQ1404 

SEQ1405 

SEQ1406 

SEQ1407 

SEQ1408 

SEQ1409 

SEQ1410 

SEQ1411 

SEQ1412 

SEQ1413 

SEQ1414 

SEQ1415 

SEQ1416 

SEQ1417 



CAGTTGCATCAGCGAC^GGTGTTGTTAGAGTAGCACGTCA^ 

— ~ - w: 

CAGTTGCAT<^GCGACAGGTGTTGTTAGAGTAGeAa3TCAACT 
GTTCGT CTGCCATTAAAGCAGCGATTGAC^CGGTGAT^ 

" GATACTGTTACAAGTAAAGATATT 

GTGATACTGTTACAAGTAAAGATATT 

GTTCGTCTGCCATTAAAGCAGCGATTGACCACGGTGATA 

" TTAAATTTGGTATCTTGACGCTTGAGGGAGAAGTACAA 

ACAA 

TTGGTATCTTGACGCTTGAGG - AGAAGTACAA 

TTATAGCAGCAGAAGATGGGGATAAATTTGCTAATTCTGTTGTTG 

r ACAA 

- AGAAGTACAA 

TTATAGCAGCAGAAGATGGGGATAAATTTCCTAATTCTGTTGTTGAAC^ 

AAATTTGGTATCTTGACGCTTGAGGGAGAAGTACAA 

TTATAGCAGCAGAAGATGGGGATAAATTTGCTAATTCTGTTC 
TTATAGCAGC^GAAGATGGGGATAAATTTGCTAATTCTGTTGTTGAACGTC 
TGGTATCTTGACGCTTGAGGGAGAAGTACAA 
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Table 14: Comparative Sequences relating to SAG0471 (glucokinase) 

SEQ1401_ AAAAATGGGCAATTGAGACCAATACTTTAGAAAACIGGAAG^ 

SBQ14 02 CGTTTCTGATATC 

SEQ14 0 3 AAAAATGGGCAATTGAGACCAATACTTTAGAAAACG^ 

SEQ1404 AAAAATGGGCAATTGAGACCAATACTTTAGAAAACX3GAAGA CATATCGTTT CTGATATC 

SEQ14 05 CACCAGCTAATATTTCAAATATTTTAAAC CCTGATT CTGTGGTTATT 

SEQ1406 . GGGCAATTGAGACCAATACTTTAGAAAACXSGAAGACATATC^ CTGATATC 

SEQ1407 -GGCAATTGAGACCAATACTTTAGAAAACGGAAGACATATCGTTTCTGATATC 

SEQ14 0 8 ACXrTTGGACTGGCAGCAGCTAATATTTCAAAT^ 

SEQ1409 AAAAATGGGCAATTGAGAC£A - TACTT - AGAAAACGGAAGACATATCGTTTCTGATATC 

SEQ1410 * - -I-^-^-p—: ----- 

SEQ1411 AAAA - TGGGCAATTGAGACCA - TACTT- AGAAAACGGAAGACATATCGTTTCTGATATC ' 

SKQ1412 ACCITGGACIXaGCAGCAGCTAATATTTCAAATAT T^ 

SEQ1413 AAAAATGGGCA- TTGAGACCA - TACTT - AGAAAACGGAAGACATATCGTTT CTGATATC 

• SEQ1414 ACCTTGGACTGGCAGCAGCTAATATTTCA^ 
SEQ1415 ACCTTGGACTGGCAGCAGCTAATATTTCAAATAT^ 

SEQ1416 AAAAATGGGCAATTGAGACCA - TACTT - AGAAAACGGAAGACATATCGTTT CTGATATC 

SEQ1417 AGCAGCTAATATTTCAAATATTTEAAACCCTGAOT 

SEQ14 0 1_ TTGAATCTCTCA-AACATCX5TTTGAGCCTCTATGGATTAACAA 

SEQ1402 TTGAATCTCTCA - AAC^TCGTTTGAGCCTCTATGGATTAACAAAAGATGA 

• SEQ1403 TTGAATCTCTCA- AACATCGTTTGAGCCTCTATGGAT^ 
SEQ1404 TTGAATCTCTCA-AACATCGTTTGAGCCTCT 

SEQ14 0 5 GTGGCGGTGTCTCAGCAGCAGGTGAAT 1^LTTACGTAGTCGCGTTGAGAAATAl.T TT 

SEQ14 0 6 TTGAATCTCTCA - AACATCGTTTGAG CCTCTATGGATTAACAAAAGATGACTOT 

SEQ14 07 TTGAATCTCTCA- AACATCXJTTTGAGCCT 

SEQ14 0 8 GTGGCGGFTGTCTCAGC^GCAGGTGAATT^ 7 - 

SEQ14 0 9 TTGAATCTCTCA -AACATCXSTTTGAGCCTCrATGGATTAACAAAA 

SEQ1410 CAGCaGCAGGTGAATTTTTACX3TACT 

SEQ1411 TTGAATCTCTCA - AACATCGTTTGAG CCTCTATGGATTAACAAAAGATGAC'l u iTCrCGG 

SEQ1412 GTGG CGGTGTCTCAGCAGCAGGTGAATTTTTACGTAGTC^ 

SEQ1413 TTGAATCTCTCA-AACATCGTTTGAGC^ 

SEQ1414 * GTGGCGGTGTCTCAGCAGCAGGTGAATTTTTACGTAGTCG^ 

SEQ1415 GTGGCXKSTGTCTCAGCAGCAGGTGAATTTTTAC^^ 

SEQ1416 TTGAATCTCTCA- AACATCGTrTGAGCCTCTA 

SEQ1417 GTGGCGGTGTCTCAGCAGC^GGTGAATTTTTACGTAGTC^ 

SEQ1401_ ATCGGTATGGGTTCTCCAGGAGCTGTTGATAGAACTAGTAAAACAGTAACAGGTGCTT^ 

SEQ1402 ATOTGTATGGGTTCTCCAGGAGCTGTTGATAGAACTAGTAAAACAGTAA 

SEQ14 0 3 ATCX3GTATGGGTTCTCCAGGAGCTGTTGATAGAACTAGTAA 

SEQ1404 ATCGGTATGGGGTC T CXIAGGAGCTGTTGATAGAACTAGTAAAAC 

SEQ1405 GTCACATTTGCTTTCCXIACAAGTTAAAAAGTCAACTA 

SEQ1406 ATCGGTATGGGTTCTCCAGGAGCTG 

SEQ1407 ATCGGTATGGGTTCTCXAGGAGCTGTTGATAGAACTA 

SEQ14 0 8 GTCACATTTGCTTT CCCACA 

SEQ14 0 9 ATCGGTATGGGTTCTCCAGGAGCTXSTTGATAGAACTAGTAAAACAGTAACAGGTGC^ 

SEQ1410 GTCACATTTGCTTT CCCACAAGTTAAAAAGTCAA CTAAAATTAAGATTGCTGAACTAGG 

SEQ1411 ATCX5GTATGGGTTCTCCAGGAGOTCTTGATAGAACT 

SEQ14 12 GTCACATTTGCTTTCCCACAAGTTAAAAA 

SEQ14 13 ATCGGTATGGGTTCTCCAGGAGCTGTTGATAGAACTAGTAAAACAGTAACAGGTGCTT^ 

SEQ1414 ATCACAT TTGCTTTCCCACAAGTTAAAAAGT CZAACTAAAATTAA 

SEQ14 1 5 GTCACATTTGCTTT CCCACAAGTTAAAAAGT CAACTAA 

SEQ1416 ATCGGTATGGGTTCTCCAGGAGCn^TTGATAGAACTAGTAAAACAGTCACA 

SEQ1417 GTCACATTTGTTTT CCCACAAGGT > 
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Table 14: Comparative Sequences relating to SAG0471 (glucokinase) 



SEQX4QX_ 

SEQX402 

SKQ1403 

SEQX404 

SEQ1405 

SEQX406 

SEQ1407 

SEQX408 

SEQ1409 

SEQX4X0 

SEQ1411 

SEQ1412 

SEQ1413 ' 

SEQ1414 

SEQ14X5 

SEQX4X6 

SBQ1417 

SEQ1401_ 

SEQX402 

SEQ1403 

SEQ1404 

SEQX405 

SEQX406 

SEQ1407 

SEQX408 

SEQX409 

SEQ1410 

SEQX4XX 

SEQX4X2 

SEQX4X3 

SEQ1414 

SEQX4X5 

SEQX4X6 

SSQX4X7 

SBQX40X_ 

SEQX402 

SEQ1403 

8EQX404 

SEQX405 

SEQX406 

SEQX407 

SEQ1408 

SEQX409 

SEQX4X0 

SEQX4XX 

SEQX4X2 

SEQX4X3 

SEQX4X4 

SEQX4X5 

SEQX4X6 

SEQX4X7 



AATCTAAATTGGGCTGATACTCAAGAAGTAGGTTC^GTTATTGAAAAAGAAGTTGGAAT 
AATCTAAATTGGGCTGATACTCAAGAAGTAGGTTCGGTTATTGAAAA^ 
AATCTAAATTGGGCTGATACTCAAGA 

AATOTAAATTGGGCTGATACTCAAGAAGJAGGTTCAGTTAI^GA 
AATCTAAATTCGGCTGATACTCAAGAAG 

AATGAT — £ - — 

AATCTAAATTGGGCTGATACTCAAGAAGTAGGTT CGGTTATTGAAAAAGAAGTTGGAAT 

— ' r - - t ' *"2 " 1 

AATCTAAATTGGGCTGATACTCAAGAAGTAGGTC 

AATCTAAATTGGGCTGATACTCAAGAAGTAGGTTCAGTTATTGA 

CCATTTTTTATriGATAACGATGCTAATGTTGCAGC^ 
CCATTTTTTATTGATAACGATGCTAATGTTGCAGCACTTGGTGAA^ 

CCATTTTTTATTGATAACGATGCTAATGTTGCAGCACT CTGGGTAGGTGC 

CCATTTTTTATTGATAACGATGCTAATGTTGCAGCACTTG^ 

CCATTTTTTATTGATAACGATGCTAATGTTGCAGCACOT 

CCATTTTTTATTGATAACGATGCTAATGTTGCAGCACTTGGTGAACGCTGGGTAGGTGC 

P. 

CCATTTTTTATTG 

GGTGCCAATAATCCCGACGTTGTTTTCGTAACCCTCGGAACAGGAGTAGGTGGAGGTGT 
GGTGCCAATAATCCCGATGTTGTTTTCGTAACCCTCGGAACAGGAGTAGGTGGAGGTGT 

GGTG CCAATAATCC CX3ACGTTGTT TTCGTAACC 

GGTGCCAATAATCCCGATGTTGTTTTCGTAACCCTCGGAACAGGAGTAGGTGGAGGTGT 

GGTGCCAATAATCCCX^TGTTGTTTTCGTAACCCTCGGAACAGGAGTA 

GGTGCCAATAATCCCGACGTTGTTTTCGTAACCCn , CX3GAACAGGAGTAGGTGGAGG 
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Table 14: Comparative Sequences relating to SAG0471 (glucokinase) 

SEQ14 0 1_ ATCXSCAGATC&TAACCTCATCCATGGTGTTGC^ 

SEQ1402 ATQ3CAGATGGTAACCTCATCCATGGTGTTGC^X3GAG CAGGTGGAGAAATTGGGCATAT 

SEQ1403 . - " " 

SEQ1404 7 

SEQ1405 - 

SEQ1406 

SEQ1407 - - -.- f — ~ 

SEQl408' . ------ ■ 

SEQ1409 ATCGCAGATGGTAACCTCATCCATGGTGTTGCAAGAG CAGGTGGAGAAATTGGG CAT AT 

SEQ1410 

6EQ1411 * .-- 

J5EQ1412 . 

SEQ1413 = 73 

SEQ1414 - 

SE01415 - — - 

SEQ1416 ~ 

SEQ1417 - r -- — 



SEQ1401_ ATTGTTGATCCAGAAAATGGATTTACGTGCAC^^ 
SEQ1402 ' ATTGTTGATCCAGAKAATGGATTTACX3TGCACATGTG^ 

SEQ1403 - 

SEQ1404 — 

SEQ1405 -- -- - 

SEQ1406 " 

SEQ1407 # 

SEQ1408 * -----r 

SEQ1409 ATT - ; 

SEQ1410 — ^ 

SE91411 -— 

SEQ1412 — — — — — t — — — : 

SEQ1413 

SEQ1414 

SEQ1415 

SEQ1416 

SEQ1417 — 



SEQ1401_ GTTt3 CATCAG^GACAGGTGTTGTTAGAGTAGCACGT CAACTCGCAGAACAATATGAGGG 

SEQ14 0 2 GTTGCATCAGCGACAGGTGTTGTTAGAGTAGCACXSTCAACTCGC^ 

SEQ1403 - 

SEQ1404 * 

SEQ1405 -- 

SEQ1406 

SEQ1407 

SEQ1408 

SEQ1409 - - - 

SEQ1410 

SEQ1411 

SEQ1412 

SEQ1413 

SEQ1414 

SEQ1415 - - - ~ 

SEQ1416 - — - 

SEQ1417 - 
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SEQ140X 

SEQX402~ 

SEQ1403 

SEQ1404 

SEQ1405 

SEQX406 

SEQ1407 

SEQi408 

SEQX409 

SEQX410 

SEQX41X 

SEQ1412 

SEQ1413 

SEQ1414 

SEQ1415 

SEQ1416 

SEQ1417 

SEQ1401 
SEQ1402 
SEQX403 
SEQX404 
SEQX405 
SEQX406 
SEQf407 
SEQX408 
SEQX409 
SEQX4X0 
SEQX4XX 
SEQX412 
SEQX4X3 
SEQX4X4 
SEQX4X5 
SEQX4X6 
SEQX4X7 

SEQX40X 
SEQ1402 
SEQX403 
SEQX404 
SEQX405 
SEQX406 
SBQX407 
SEQX408 
SEQX409 
SEQX4X0 
SEQX4XX 
SEQX4X2 
SEQX4X3 
SEQX4X4 
SEQX4X5 
SEQX4X6 
SEQX4X7 



Table 14: Comparative Sequences relating to SAG0471 (glucokinase) 

TCGTCTGCaTTAAAGCAGCGATTGAC^CCGGTGATACTGTTACA^ 
• TCGTCTGCCATTAAAGCAGCGATT<^CAACGGTGATACTGTTACAAGTAAAGA 




CTTGGACTGGCAGCAGCTAATATTTCAAATATTTTAAA 
CTTGGACTGGCAGCAGCTAATATTTCAAATATTTTAAACCC 
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Table 14: Comparative Sequences relating to SAG0471 (glucokinase) 



SEQX401_ 

SEQ1402 

SEQX403 

SEQX404 

SEQ1405 

SEQ1406 

SEQX40? 

SEQ1408 

SEQ1409 

SEQ1410 

8EQ1411 

SEQ1412 

SEQ14X3 

SEQ14X4 

SEQ141S 

SEQ1416 

SBQX4X7 

SEQ1401_ 

SEQX402 

SEQ1403 

SEQX404 

SEQ1405 

*SEQ1406 

SEQ1407 

SEQX408 

SEQ1409 

SEQ1410 

SEQ1411 

SEQ14X2 

SEQ141S 

SEQ1414 

SEQ14X5. 

SEQ1416 

SEQ14X7 



GGCXMTGTCTCAGC^GCAGGTGAATTTTTACGTAGTCGCGTTGAGAAA^^ 
GGCGGTGTCTCAGCAGCAGGTGAATTTTTACGTAGTC^ 

TTTGCTTT CCCACAAGTTAAAAAGTCAACTAAAATTAA"(^T 
TTTG "-- 
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Table 15: Comparative Sequences relating to SAG0492 



sbq id ho. 1501i saq0492 prom the 1169nt1 gbs nontypeable strain 

tgacttggatattcatcaaggagaagtggtggttattattggcc^ 

tggaagtaccaacaaagggaacagtgacttttgaaggaattg^ 

ggcatggtttttcaacagttcaatctatttcccaatatgac^ 

taagcttgatgctcagaczaaaagcatacgagctacttgaaaaagt^ 

gaggacaacaacaacggattgctattgcaagag^ 

cctgaaatggtaggtgaagtottgactgttatccaa 

tgcacgtgaagtagqsgatcg^rctcatttttatgg^ 

seq zd no. 1502 1 sag0492 from the 18rs21 gbs type ii strain 

ttgggaaaaatgaggttttaaaaggcattgacttggata 

tcaacatttttaagaacaatgaatctcttgga^ 

tgatatttttaaaatgcgcgaaaaaatgggcatggttt^ 

tatcacctattaagacaaaggggctttctaatcttgatc 

gctaatacttatccagctagcttatctgga^ 

ttttgatgaacctactt ciagctcttgatcct ctggtatgacga 
tggttattgtcacrcatgaaatgggttttgcacgtc 

seq id no. 1503 1- sag0492 prom the 2603v/r gbs type v strain (reverse complement) 

AAAAATGAGGTTTCAAAAGGCATl^CTTGGATATT 

ATTTTTAAGAACAATGAATCTCTTGGAAGTACCAACAAAG 

TTTTTAAAATGCGCGAAAAAATGGGCATGGTTTTTC^ 

CCTATTAAGACAAAGGGGCTTTCTAATCTTGATGC^ 

TACTTATCCAGCTAGCTTATCTGGAGGACAACAACAACGAATTC 

ATGAACCTACTTCAGCTCTTGATCCTGAAATGGTO 

ATTGTCACTCATGAAATGGGTTTTGCACX3TGAAGTAGCGGATCCT 

SEQ ID NO. 1504 * SAG0492 PROM THE M781 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

GAGGTTTTAAAAGGCATTGACTTXK^TAOT 

AAGAACAATGAATCTCTTGGAAGTACCAACAAAO 

AAATGCGCGAAAAAATGGGCATGGTTTTTCAAC^ 

AAGACAAAGGGACTTTCTAAGCTTGATGCTCAGACAAA^G 

TCCAGCAAGCTTATCTGGAGGACAACAACAACGGA 

CTACTTCAGCTCTTGATCXnXSAAATGGTAGGTGAAGTCT 

ACTXATGAAATGGGTTTTGCACGTGAAGTAGCGGATCGTC 

AGTAT 

SEQ ID NO. 1505s SAG0492 FROM THE 090 GBS TYPE la STRAIN 

TGGTGGTTATTATTGGC CCTTCTGGCT CTGGTAAGTCAACATTTTTAAGAACAATGAAT CTCTTGGAAGTACCAACAAAGGGAACAGTG 

ACTTTTGAAGGGATTGATATAACAGACAAAAAGAATGATATTTTTAAAATGC 

ATTTCCCAATATGACTGTACTAGAAAATATTACTTTATCACCTATTAAGACA 

ACGAGCTACTTGAAAAAGTTGGACTCAAAGAGAAGGCTAATGCTT 

GCAAGAGGTCTTGCAATGAATCCTGATGTCCTTCTTTT^ 

TGTTATGCAA.GATTTAGCTAAATCTGGTATGACGATGGTTATTGTC^ 

TTTTTATGGATGCAGGCATTATTGTTgAs CAAGGGACCCCTAAGGAAGTA 

SEQ ID NO. 1506 1 SAG0492 FROM THE A909 GBS TYPE la STRAIN 

CAATACAAGGACnTCATAAAAGTTTTGGGAA 

ATTGGCCCTTCTGGCTCTGGTAAGTCAACATT^^ 

GATTGATATAACAGACAAAAAGAATGATATTTTTAAAAT^ 

TGACTGTACTAGAAAATATTACTTTATCACCTATTAAGACAAAG 

GAAAAAGTTGGACTCAAAGAGAAGGCTAATACTTATCCAGCTAGCTTA 

TGCAATGAATCCTGATGTCCTTCTTTTTGATG 

ATTTAGCTAAATCTGGTATGACGATGGTTATTGTCACTCA 

GCAGGAATTATTG TgAGCAAGGGGCCC CTAAGGAAGTATTTGAGCAGACAAAAGAAATCCGCACAAGAGATT^ CTT 

SEQ ID NO. 1507 1 SAG0492 FROM THE CJB110 GBS NONTYPEABLE STRAIN (REVERSE COMPLEMENT) 

GACTTGGATATTCATCAAGGAGAAGTGGTGGTTIATT 

GGAAGTACCAACAAAGGGAACAGTGACTTTTGAAGGGATTGATATAACAGACA 

GCATGGTTTTTCAACAGTTCAATCTATTTCCCAATATG^ 

AAGC^TTGATGCTCAGACAAAAGCATACGAGCTACTTGAAAAAGTT^ 

AGGACAACAACAACGAATTGCTATTGCAAGAGGTCITO 

CTGAAATGGTAGGTGAAGTCTTGACTGTTATGCAAGATTTAGCTA 

GCACGTGAAGTAGCGGATCGTGTCTTTTTATGGATGCGGGA^ 
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Table 15: Comparative Sequences relating to SAG0492 



SEQ ID NO. 1508 1 SAG0492 FROM THE H36b GBS TYPE lb STRAIN 
ATGACXSTTTTAAAAGGC^TTGACTTG 

TTAAGAACAATGAATCTCTTGGAAGTACCAACAAAGGGAACA 

TAAAATGCGCGAAAAAATGGGCATGGTTTTTOACAGTTCAATCTATT^ 

TTAAGAOU^GGGGCTTTCTAAGCTTGATGCTCAGA 

TATCCAGCTAGCOTATCTGGAGGACAACAAC^CGAATTC 

ACCTACTTCAGCTCnTGATCCTCAAATGGTAGGTGAAGTCTT^ 

TCACTCATGAAATGGGTTTTGCACGTGAAGTAGCGG^ 

GAAGTAT " ... 

SEQ ID NO. 1509 » SAG0492 FROM THE JH9130013 GBS TYPE VIII STRAIN (REVERSE COMPLEMENT) 

GGTTTTAAAAGGCATTGACTTGGATATTCATCAAGGAGAAGTA 

GAACAATGAATCTCTTGGAAGTACCAACAAAGGGAACAGTGACT^ 

ATGCX^GAAAAAATGGGCATGGTTTTTCAACAGTTC 

GAOVAAGGGGCTTTCTAAGCTTGATGCTCAGACAAAAGC^ 

CAGCTAGCTTATCTGGAG<^CAACAACAACG^ 

ACTTCAGCTCTTGATCCTGAAATGGT^GGTGAAGTCTTGACT 

TXIATGAAATGGGTTTTGCACGTGAACn^ 

TATTTAGCAAAACAAAAGAAAT 

SEQ ID NO. 1510i SAG0492 FROM THE M732 GBS TYPE III STRAIN 

GGTGGTTATTATTGGCCCTTCTGGCTCTGGTAAGTCAAC^TTTTTA 
CTTTTGAAGGGATTGATATAACAGACAAAAAGAATGATATT^^ 
TTTCCCAATATGACTCTACTAGAAAATAra 
CGAGCTACTTGAAAAAGTTl^CTCaAAGAGAAGGCT 

SEQ ID NO. 1511 1 SAG0492 FROM THE COH1 GBS TYPE la STRAIN 

ATTGACTTGGATATTCATCAAGGAGAAGTGGTGGTTATTAT 

CTTGGAAGTACCAACAAAGGGAACAGTGACTTTTGAAG 

TGGGCATGCTTTTTCAACAGTTCAATCTATTTCCCAAT^ 

TCTAAGCTTGATGCrrCAGACRAAAGCATACGAGC 

TGG 
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Table 15: Comparative Sequences relating to SAG0492 

SEQl 501 TGACTTGG 

SEQ1502 TTGGGAAAAATGAGGTTTTAAAAGGCATTGACTTGG 

SEQ15 03 AAAAATGAGGTTTTAAAAGGCATTGACTTGG 

SEQ1504 GAGGTTTTAAAAGGCATTGACTTGG 

SEQ1505 

SEQ15 0 6 AATACAAGGACTTCATAAAAGTTTTGGGAAAAATGAGGTTTTAAAAGGCATTGACTTGG 

SEQ1507 - -GACTTGG 

SEQ1508 ATGAGGTTTTAAAAGGCATTGACTTGG 

SEQ1509 * w -*t '* • -~-r GGTTTTAAAAGGCATTGACTTGG 

SEQ1510 

SEQ1511 - — ATTGACTTGG 

SEQ1501 TATTCATCAAGGAGAAGTGGTGGTTATTATTGGCCC 

SEQ1502 TATTCATCAAGGAGAAGTAGTGGTTATTATTGGCCCTTC 

SEQ1503 TATTGATCAAGGAGAAGTAGTGGTTATTATTGGCCCTC 

SEQ1504 TATTCATGAAGGAGAAGTGGTGGTTATTATTGGCCC 

SEQ1505 - - - - TGGTCGTTATTATTGGCCCTTCTGGCTCTGGTAAGTCAACAT 

SEQ1506 • TATTCATCAAGGAGAAGTAGTGGTTATTATTGGCCCTTC 

SEQ15 07 TATTCATCAAGGAGAAGTGGTGGTTATTATTO 

SEQ15 0 8 TATTCATCAAGGAGAAGTAGTGGTTATTATTGGCCCT 

SEQ1509 TATTCATCAAGGAGAAGTAGTGGTTATT^ 

SEQl 51 0 GGTGGTTATTATTGGCCCTTCTGGCTCTGGTAAGTCAACAT 

SEQ1511 TATTCATCAAGGAGAAGTGGTGGTTATTATTGGCCCTTCT 

SEQ1501 TTTTAAGAACAATGAATCTCTTGGAAGTACCAACAAAGGGAACAG 

SEQ1502 TTTTAAGAACAATGAATCTCTTGGAAGTACCAACAAAGGGAACA 

SEQ15 0 3 TTTTAAGAAGAATGAATCTCTTGGAAGTACCAACAAAGGGAACAGTGACTTTO 

SEQ15 0 4 TTTTAAGAACAATGAAT CT CTTGGAAGTACCAACAAAGGGAAC AGTGAC TTTTGAAGGGA 

SEQ1505 TTTTAAGAACAATGAATCTCTTGGAAGTACCA^ 

SEQ15 0 6 TTTTAAGAACAATGAATCTCTTGGAAGTACCAACAAAGGGAACAGTGACTTOT 

SEQ1507 TTTTAAGAACAATGAATCTCTTGGAAGTACCAACAAA 

SEQ15 0 8 TTTTAAGAAGAATGAATCTCTTGGAAGTACCAACAAAGGGAAG 

SEQ150 9 TTTTAAGAACAATGAATCTCTITGGAAGTACCAACAAAGGGAACAGTGAC 

SEQ1510 TTTTAAGAACAATGAATCTCTTGGAAGTACCAACAAAGGGAACAGTGACTTTTGAAGGGA 

SEQ15 11 TTTTAAGAACAATGAATOTCTTGGAAGTACCAACAAAGGGAACAGTG 

SEQl? 0 1 TTGATATAACAGACAAAAAAAATGATATTTTTAAAATC 

SEQ15 0 2 TTGATATAACAGACAAAAAGAATGATATTTTTAAAATGCGC 

SEQ1503 TTGATATAACAGACAAAAAGAATGATATTTTTAAAATGCGCGAAAAAATGGGCAT^ 

SEQ15 0 4 TTGATATAACAGACAAAAAGAATGATATTTTTAAAATGCGCGAAAAAATGGG 

SEQ15 0 5 TTGATATAACAGACAAAAAGAATGATATTTTTAAAATC 

SEQ15 0 6 TTGATATAACAGACAAAAAGAATGATATTTTTAAAATGCGCGAAAAAATGGGG^ 

SEQ1507 TTGATATAACAGACAAAAAGAATGATATTTTTAAAATGC 

SEQ15 0 8 TTGATATAACAGACAAAAAGAATGATATTTTTAAAATGCGCGAAAAAAT^ 

SEQ15 0 9 TTGATATAACAGACAAAAAGAATGATATTTTTAAAATC 

SEQ15 10 TTGATATAACAGAGAAAAAGAATGATATTTTTAAAATGCGCG 

SEQ1511 TTGATATAACAGACAAAAAGAATGATATTTTTA7VAATGCGCGAAAAAATGGGCATGGTTT 
SEQ15 0 1 TTGAACAGTTCAATCTATTTCCCAATATGACTG 

SEQ15 0 2 TTCAACAGTTCAATCTATTTCCCAATATGACTGTACTAGAAAATATTACTTTATCACCTA 
SEQ15 0 3 TTCAACAGTTCAATCTATTTCCCAATATGACTGT^ 

SEQ15 0 4 TTCAACAGTTCAATCTATTTCCCAATATGACTGTACTAGAAAATATTACTTTA 
SEQ15 0 5 TTCAAGAGTTCAATCTATTTCCCAATATGACTGT 

SEQ150 6 TTCAACAGTTCAATCTATTTCCCT^TATGACTGTACTAGAAAATATTACTTTATCACCTA 

SEQ15 0 7 ttcaacagttcaatctatttcccaatatgactgtactagaa^ 

SEQ150 8 TTCAACAGTTCAATCTATTTCCCAATATGACTGTA 

SEQ15 0 9 TTCAACAGTTC^TCTATTTCCCAATATGACTGTACTAGAAAATATTACTTTATCAC 
SEQ1510 TTCAACAGTTCAATCTATTTCCCAATATGACTGTACTAGAAAATATTACTTTATCACCTA 
SEQ1511 TTCAACAGTTCAATCTATTTCCCAATATGACTGTACTAGAAAATATTACT^ 
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SEQ1501 
SEQ1502 
SEQ1503 
SEQ1504 
SEQ1505 
SEQ1506 
SEQ1507 
SEQ1508 
SEQ1509 
. SEQ1510 
SEQ1511 

SEQ1501 
SEQ1502 
SEQ1503 
SEQ1504 
SEQ1505 
SEQ1506 
SEQ1507 
<6EQ1508 
SEQ1509 
SEQ1510 
- SEQ1511 

SEQ1501 
SEQ1502 
SEQ1503 
SEQ1504 
SEQ1505 
SEQ1506 
SEQ1507 
SEQ1508 
SEQ1509 
SEQ1510 
SEQ1511 

SEQ1501 
SEQ1502 
SEQ1503 
SEQ1504 
SEQ1505 
SEQ1506 
SEQ1507 
SEQ1508 
SEQ1509 
SEQ1510 
SEQ1511 

SEQ1501 
SEQ1502 
SEQ1503 
SEQ1504 
SEQ1505 
SEQ1506 
SEQ1507 
SEQ1508 
SEQ1509 
SEQX510 
SEQ1511 



Table 15: Comparative Sequences relating to SAG0492 



TTAAGACAAAGGGACTTTCTAAGCTTGATGCTCAGACAAAAGCATACGAGCTACTTGAAA 
TTAAGACAAAGGGGCTTTCTAATCTTGATGCTCAGACAAAAGCATATGAGCT 
TTAAGACAAAGGGGCTTTCTAATCTTGATGCTCAGACAAAAGCATATGAGCTACTT 
TTAAGACAAAGGGACTTOCTAAGCTTGATGCTCA^ 

TTAAGACAAAGGGACTTTCTAAGCTTGATGCTCAGACAAAAGCATACGAG^ 

TTAAGACAAAGGGGCTTTCTAAGCTTGATGCTCAG^ 

TTAAGACAAAGGGACTTTCTAAGCTTGATGCTCAGACAAAA 

TTAAGACAAAGGX3GCTTTCTAAGCTTGATGCT 

TTAAGACAAAGGGGCTTTCTAAGCTTGATGCTC^ 

ttaagagaaagggActttctaagcttc 

TTAAGACAAAGGGACTTTCTAAGCTTC^TC 

AAGTTGGACTCAAAGAGAAGGCTAATGCTTATCCAG 

AAGTTGGACTCAAAGAGAAGGCTAATACTTATCCAGCTAGCTTATCT)^ 

AJVGTTGGACTCAAAGAGAAGGCTAATACITATCCAGCTAGCTO 

AAGTTGGACTCAAAGAGAAGGCTAATGCTTATCCAGCAAGCT^ 

AAGTTGGACTCAAAGAGAAGGCTAATGCTTATCCAGCTAGC^ 

AAGTTGGACTCAAAGAGAAGGCTAATACTTATCCAGCTAGCT 

AAGTTGGACTCAAAGAGAAGGCTAATGCTTATCCAGCTAGCTTATCrGGAGGAC^CAAC 
AAGTTGGACTGAAAGAGAAGGCTAATACTTATCCAGCTAG 

AAGTTGGACTCAAAGAGAAGGCtAATACTTATCCAGCTAGCTTATCTGGAGGACAA 

AAGTTGGACTCAAAGAGAAGGCTAATGCTTATCCAGCAAGCTTATCTGG '---^ 

AAGTTGGACTCAAAGAGAAGGCTAATGCTTATCCAGCAAGCl^A 

ACGGATTGCTATTGGAAGAGGTCTTGCAATGAATCCTGATGT^ 

ACGAATTGCTATTGCAAGA6CTCTTGCAATGAATCCTCA 

ACX3AATTGCTATTGCAAGAGGTCTTGCAATCAATCCT 

ACGGATTOCHTVTTGCAAGAGGTCTTGCAATGAATCCTGATGT 

AOTAATTGCTATTGCAAGAGGTCITGCAATGAATCCTGA 

ACGAATTGCTATTGCAAGAGGTCTTGCAATG^TCCTGATGTCCTTCTTTTTGATGAAC 
ACGAATTGCTATTGCAAGAGGTCTTGCAATGAATCCH^ 
ACGAATTGCTATTGCAAGAGGTCTTGCAATGAATCCTGATGTCCTTCT 
ACGAATTGCTATTGCAAGAGGTCTTGCAATGAATCCTGATGTC^ 



NCSRATNGTSAG 

TACTTTCAGCTCTTGATCCTGAAATGGTAGGTGAAGTCTTO 

TACTTCAGCTCTTGATCCTGAAATGGTAGGTGAAGTCTTGACTGTTATGCAAGATT 

TACTTCAGCTCTTGATCCTGAAATGGTAGGTGAAGTCTTGACTGTTA 

TACTTCAGCTCTTGATCCTGAAATGGTAGGTGAAGTCTTGACTGTTATGCAAGATTTAG 

TACTTCAGCTCTTGATCCTGAAATGGTAGGTGAAGTCTTGACTGTTATGCAAGATTTAG 

TACTTCAGCrrerTGATCCTGAAATGGTAGGTGAAGTCTT 

TACTTCAGCTCTTGATCCTGAAATGGTAGGTGAAGTCT 

TACTTCAGCTCTTGATCCTGAAATGGT^^ 

TACTTCAGCTCTrGATCCrGAAATGGTAGGTGAAGTCTTGACTGOT 



TAAATCTGGTATGACGATGGTTATTGTCACTCATGAAATGGGTTTTGCACGTGAAGTAG 
TAAATCTGGTATGACGATGGTTATTGTCACTCATGAAAT^ 

TAAATCTGGTATGACGATGGTTATTGTCACTCATGAAATGGGTTTTGCACGTGAAGTAG 
TAAATCTGGTATGACGATGGTTATTGTGACTCAT^ 

TAAATCTGGTATGACGATGGTTATTGTCACTCATGAAATGGGTTTTGCACGTGA^ 

TAAATCTGGTATGACGATGGTTATTGTCACTCATGAAATGGGTTTTGC^ 

TAAATCIX3GTATGACGATGGTTATTGTCACTCATGAAATGGGTTTTC 

TAAATCTGGTATGACGATGGTTATTGTCACTCATGAAATGGGTTTTGCACGTGAAGTAG 

TAAATCTGGTATGACGATGGTTATTGTCACTCMGAAATGGGT 
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Table 15: Comparative Sequences relating to SAG0492 



SEQ1501 
SEQ1502 
SEQ1503 
SEQ1504 
SEQ1505 
SEQ1506 
SEQ1507 
SEQ1508 
SEQ1509 
SEQ1510 
SEQ1511 



GGATCGTGT CATTTTTATGGATGCAGGCATT ATTGT - GAGCAAGGGACCCCTAAGGAAG 

GGATCGTGTCATTTTTATGGACGCAGAAATTAT ' 

GGATCGTGTCATTTTTATGGATGCAGGAATTATTGTTGAGCAAGGGGCCC 

GGATCGTGTCATTTTTATGGATGCAGGGATTATTGTTGAGCAAGGGACCCCTAAGAAAG 
GGATCGTGTCATTTTTATGGATGCAGGCATTATTGTTGAS CAAGGGACCCCTAAGGAAG 
GGATCGTGT»TTTTTATGGATGC^^ 

GGATCGTGTC -TTTTTATGGATGCGGGAATTATTGT - GAGCAAGGGACC 

GGATCGTGTCATTTTTATGC^TGCASCJAA^ 

GGATCGTGTCA^TTTATGGATGCAGGAATTATTGTTGAGCAAGGGGCCCCTAAGGAAG 



SEQ1501 
SEQ1502 
SEQ1503 
SEQ1504 
SEQ1505 
SEQ1506 
SEQ1507 
S5Q1508 
SEQ1509 
%EQ1510 
SEQ1511 



AT- 



AT- 
A-- 



TTTGAGCAGACAAAAGAAATCCGCACAAGAGATTTCTT 



AT- 



ATTT AGCAAAACAAAAGAAAT - 
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Table 16: Comparative Sequences relating to SAG0767 (D-alanine - D-alanine ligase) 



SEQ ID NO. 1601* SAG0767 FROM THE M781 GBS TYPE III STRAIN 

TGGTCGCTCTGTCCX3AACCTGAAGTATCTGTACTGT 

GTTAAAACTTATTTTATCACGCAAGTAGGTCAATTTATTAAAACACAAGAATTTGATG 

GTTAATGACAAACCAAACTGTTGATTTAGACAAAATGGTTC 

CCGTTTTACATGGACCAATGGGGGAAGATGGTTCTATCCAAGGATTTT 

AATATTCTATCTTCAAGCGTGGCTATGGATAAAATTAC^ 

ATATCAAACTTATTTTGAGGGTCATGATTTGGAACATGCGATTAA 

TAAAACCGGCTAATATGGGGTCATCAGTAGGTATTTGAAAAGCGACAGATGAATC 

GCTCTCAACTAT<^TAGCCX3TATT^TGATlX3AACA 

TGATGTTAAGAGAACTTTTCCT(^ 

AAATTACTATGGATATTCGAGCTAAAGTTGATGAAGC^ 

GCAATCGGGGCTTGTGGTTTATCAC^TGTGATTTCT^ 

AATGCCCGGTTTTACTCAGTGGTCAATGTATCCTCTGC^^ 

SEQ 10 NO. 1602: SAG0767 FROM THE 090 GBS TYPE la STRAIN 

AAACCGGGCATTGTATTCAGTTCGTTTAAGAAGACTTGTCCA 
AGCCCCGATTGCTTTAAAAGCOTTACnTGCATATTC^ 
CCATAGTAATTTTATTATCAATATATTTG^ 
' GTCTTAACATCATTATTCCCTAAAATACCT 
ATACn^GAGAGCTAAGTCAATksCAGAGCGAAGTGAGGATTCATC^ 
TAGCCGGTTTTACAAAAATTGGGA^CTTAAAG 

TAAGTTTGATATGCAACCTGAGGTACACCTACTGTTGCAAGGACTTGTTTTGTTGTAATTT^ 

AGATAGAATATTAGTCCG^CATAAGGCATCCTTAAAA 

GATGTAAAACGGGGAAAACAATTCCATTATCAT 

TTTGTCATT AACTTTTCAT CTGAAGATGGCATT T CAT C AAATT CTTGTGTTTTAAT AAAT TGAC CTACTTGCGTG 

SEQ ID NO. 1603: SAG0767 FROM THE COH1 TYPE la STRAIN 

TCGCTCTGCGGAACGTGAAGTATCTGTACTGTCTGCAGAAAGCG^ 
AAACTTATTTTATC^CGCyVAGTAGGTCAAOT 

ATGACAAACCAAACTGTTGATTTAGACAAAATGGTTCGTCCAAGTGAT^ 

TTTACATGGACCAATGGGGGAAGATGGTTCTATCCAAGGATTTTTAGAAGT^ 

TTCTATCTTCAAGCGTGGCTAT 

SEQ ID NO. 1604s SAG0767 FROM THE CJB110 GBS NONTYPEABLE STRAIN (REVERSE 
COMPLEMENT) 

CGTCGATTTCTATGACTATK^CGCCAAATATATTGATAATAAAATTACT^ 

CTATGGAAGCAATGCGTCAATATGCAAGTAAAGCTTTTAAAGCAATCGGGGC^ 

TTGACGAAAGATGGACAAATCTTCTTAAACGAACTGAATACAATGCCC 

SEQ' ID NO. 1605: SAG0767 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

AACGTGAAGTATCTGTACTGCTCTGCAGAAAAGCGTC^TGOTTGCTATTAATTATGATAAATO 
TTATCACGCAAGTAGGTCAATTTATTAAAACACAAGAATTTGATGAAATGCCATCTT^ 

SEQ ID NO. 1606: SAG0767 FROM THE 1169NT1 GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

CTAATATGGGGTC^TCAGTAGGTATTTCAAAAGCGACAGATG 
TATGATAGCCGTATTTTGATTGAACAAGGCGTGACAGCT^ 

GACAACTTTTCCTGGCGAAGTCGTTAAAGACGTCGATTTCTATGACTATGACGCCAAATATATT^ 
TGGATATTCCAGCTAAAGTTGATGAAGCAACTATGGAAG 
GCTTGTGGTTTATCACGCTGTGATTTCTTTTTG 
TTTTACTCAGTGGTCAATGTATCCTCTGCTTTGGGAAAAT 

SEQ ID NO. 1607: SAG0767 FROM THE 18RS21 GBS TYPE II STRAIN (REVERSE COMPLEMENT) 

TTGACrTAGCTCTCAAGTATGATAGCOSTATTTO 

GGCAATAATGATGTTAAGACAACTTTTCCTGGCGAAGTC 

TGATAATAAAATTACTATGGATATTCCAGCTAAAGTTGATGAAGCS^ 

CTTTTAAAGCAATCGGGGCTTGTGGTTTATCACGCTGTGATOT 

CTGAATAGAATGCCCGGTTTTACTCAGTC 

SEQ ID NO. 1608: SAG07 67 FROM THE 18RS21 GBS TYPE II STRAIN 

ATCTGTACTGTCTGCAGAAAAGCGTCATGCGTGCTATTAATTATGATAAATTTT^ 

GTAGGTCAATTTATTAAAACACAAGAATTTGATGAAATGCCATCTTCAGATGAAAAG 

TTTAGACAAAATGGTTCGTCCAAGTGATATCTATGATGATAA 

AAGATGGTTCTATCCAAGGATTTTTAGAAGTTOTAAGGATGCCTTATGTTGGGACTAATATTCTATC^ 
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Table 16: Comparative Sequences relating to SAG0767 (D-alanine - D-alanine ligase) 



SEQ ID NO. 1609: SAG0767 PROM THE 2603V/R GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

GGCTATGGATAAAATTACAACAAAACAAGTCCTTGCAACAGTAGGTGTACCTC^ 

GTGATGATTTGGAACATGCGATTAAACTCTCTTTAGAAACT 

TCATCAGTAGGTATTTCAAAAGCGACAGATGAATCCTCACTTCGCTCTGCA 

TATTTTGATTGAACAAGGCGTGACAGCTCGTGAAATTGAAGTAGGTATTTTAGGCAATA^ 

CTGGCGAAGTCGTTAAAGACGTCGATTTCTATGACTATGACGCCAAATATATTGATAATA 

GCTAAAGTTGATGAAGCAACTATGGAAGCAATCCGTC^ 

ATCACX3CTGTGAT^CTTTTTGACGAAAGAATGGACAAA 

SEQ ID NO. i610: SAG0767 FROM THE 2603V/R GBS TYPE V- STRAIN 

TCTGTACTGTCTGCAGAAAGCCnXIATGCGTGCTATrAATTA 

AGGTCAATTTATTAAAACACAAGAATTTGATGAAATGCCA 

TAGACAAAATGGTTCGTCCAAGTGATATCTATGATGATAAT 

SEQ ID NO. 1611: SAG0767 FROM THE H36b GBS TYPE lb STRAIN (REVERSE COMPLEMENT) 
AAAACCGGCTAATATGGGGTCATCAGTAGGTATTTCAAAAGC • 
CTCTCAAGTATGATAGCCGTATTTTGATTGAACAAGGCGTGACAGOT 

GATGTTAAGACAACTTTTCCTGGCGAAGTCGTTAAAGACGTCGATTTCTATGACTATGACG 
AATTACTATGGATATTCCAGCTAAAGTTGATGAAGCAA 
CAATCGGGGCTTGTGGTTTATCACGCTGTGATTTCTTTTTGACGAAAGATC 
ATGCCCGGTTTTACTCAGTGGTCAATGTATCCCC 

SEQ ID NO. 1612* SAG0767 FROM THE H36b TYPE lb STRAIN 

GGTGAAGTATCTGTACTGTCTGCAGAAAGCX3TCATGCGTGCTATTAATTATGA 

(^CGC^GTAGGTCAATTTATTAA^C 

CTGTTGATTTAGACAAAATGGTTCGTC 

ATGGGGGAAGATGGTTCTATCCAAGGATTTTTAGAAGTTTT^ 
OTTGGCTATGGATAAAATTAC^^CAAAACAAGTCCTTC 

SEQ ID NO. 1613s SAG0767 FROM THE M7321 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

ATGCGATTAAACTCTCTTTAGAACCTTTAAGTTTCCCAAT 

TCAAAAGCGACAGATGAATCCTCACTTCGCTCTGCAATTGACTTAGCTCTCAAGTATC 

aggcgtgacagctcgtgaaattgaagtaggtattttaggc^taatgatgttaagacaactttt 

aagacx3tcgatttctatgactatgacgccaaatatattgataataaaattactatggatatt 

gcaactatggaagcaatgcgtcaatatgcaagtaaagctttta 

ctttttgacgaaagatggacaaatcttcttaaacgaactgaatacaatgcccggt^ 

tgctttgggaaaatatggggctaacrr 

seq id no. 1614s sag0767 from the m732 gbs type iii strain 

gtcatgccgtgctattaattatgataaattttttgtt 

aagaatttgatgaaatgccatcttcagatgaaaagttaatgacaaacc^ 

agtgatatctatgatgataatgcaattgttttccccgttttacatggacc^ 

tttagaagttttaaggatgccttatgttgggact^ 

aagtccttgcaacagtaggtgtacctcagg 

seq id no. 1615: sag0767 from the a909 gbs type la strain (reverse complement) 
ttttgagggtgatgatttggaacatgcgattaaact 

atatggggtgatcagtaggtatttcaaaagcgagagatgaatcctcacitcgctctgcaattg 

gatagccgtattttgattgaacaaggcgtgacagctcgt^ 

aacttttcctggcgaagtcgttaaagacgtcgattt^ 

atattccagctaaagttgatgaagcaactatggaagcaatgcgtcaatato 

tgtggtttatcacgctgtgatttctttttgacgaaagatggacaaatcttct 

tactcagtggtcaatgtatcccctc^tttg^ 

seq id no. 1616: sag0767 from the a909 gbs type la strain 

TGGTCGCTCTGCGGAAOTTGAAGTATCTCTACTGTC 

OTAAAACTTATTTTATCACGCAAGTAGGTCAATTTACT 

TTAATGACAAACCAAACTGTTGATTTAGACAAAATGGTTCGTCCAA 

CGTTTTACATGGACC^TGGGGGAAGATGGTTCTATCCA^ 

ATATTCTATCTTCAAGCXSTGGCTATGGATAAAATTAC^ 
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Table 16: Comparative Sequences relating to SAG0767 (D-alanine - D-alanine iigase) 

SEQ ID NO. 1617: SA60767 FROM THE JM9130013 GBS TYPE VIII STRAIN (REVERSE 
COMPLEMENT) 

AAGCAGGGGATACATTGACCACTGAGTAAAACCGG^ 
AAAAGAAATCACAGCGTGATAAACCACAAGCCCCGATTGCTT^ 

. GATGCTTCATCAACTTTAGCTGGAATATCCATAGCAATTTTATTATCAATATATTTGGCG 

SEQ1601 . GGTCGCTCTGTCGGAACGTGAAGTATCTGTACTGTCTGCAGAAAGCGTCATGCG 

SEQ1602 ; «- 

SEQ1603 — 

SEQ1604 : * ' ' 

SEQ1605 . 

SEQ1606 ^ : 

SEQ1607 

SEQ1608 

SEQ1609 

SEQ1610 -- 

SEQ1611 • 

SEQ1612 

SEQ1613 

SE01614 

SEQ1615 

SEQ1616 * 

SEQ1617 , 

SEQ1601 TAATTATGATAAATTTTTJ<3TTAAAACTTATTTTATCACGC^ 

SEQ1602 - — ---- 

SEQ1603 r 

SEQ1604 

SEQ1605 > 

SEQ1606 

SEQ1607 T 

SEQ1608 

SEQ1609 

SEQ1610 

SEQ1611 

SEQ1612 

SEQ1613 

SEQ1614 

SEQ1615 

SEQ1616 

SEQ1617 

SEQ1 601 AACACAAGAATTTGATGAAATGCCATCTTCAGATGAAAAGTT 

SEQ1602 

SEQ1603 

SEQ1604 

SEQ1605 

SEQ1606 

SEQ1607 

SEQ1608 - - 

SEQ1609 - 

SEQ1610 

SEQ1611 - 

SEQ1612 

SEQ1613 - 

SEQ1614 - - - 

SEQ1615 -- - 

SBQ1616 - - 

SEQ1617 - -- 
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Table 16: Comparative Sequences relating to SAG0767 (D-alanine - D-alanine ligase) 

SEQ1601 TGATTTAGACAAAATGGTTCGTCC^ 

SEQ1602 

SEQ1603 

SEQ1604 *t 

SEQ1605 . . : 

SEQ1606 -kt 

SEQ1607 -„--.l 1 

. SEQ1608 

SEQi609 * : 

SEQ1610 »*- J-, — - - 

SEQ1611 . 

SEQ1612 r 

SEQ1613 

SEQ1614 r * 

SEQ1615 

SEQ1616 

SEQ1617 



SEQ1601 CGTCTTACATGGACCAATGGGGGAAGATGGTTCTATC 

SEQ1602 

SEQ1603 i---^ 

SEQ1604 : 

SEQ1605 — 

SEQ1606 -- 

SEQ1607 . ' — — -r - 

SEQ1608 - 

SEQ1609 

SEQ1610 

SEQ1611 

SEQ1612 

SEQ1613 - 

SEQ1614 

SEQ1615 — 

SEQ1616 

SEQ1617 

SEQ1601 GATGCCTTATGTTGGGACTAATATTCTATCTTCAAGCGTGGCTATGGATAAAATTACAA 

SEQ1602 

SEQ1603 

SEQ1604 

SEQ1605 

SEQ1606 

SEQ1607 

SEQ1608 

SEQ160 9 GGCTATGGATAAAATTACAA 

SEQ1610 

SEQ1611 -- 

SEQ1612 

SEQX613 - - 

SEQ1614 - 

SEQ1615 

SEQ1616 

SEQ16X7 - 
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Table 16: Comparative Sequences relating to SAG0767 (D-alanine - D-alanine ligase) 



SEQ1601 
SEQ1602 
SEQ1603 
SEQ1604 
SEQ1605 
SEQ1606 
SEQX607 
SEQ1608 
SEQ1609 
SEQX6X0 
SEQ1611 
SEQ1612 
SEQ1613 
SEQ1614 
SEQ1615 
SEQX6X6 
SEQ1617 



AAAAC^GTCCTTGCAACAGTAGGTGTACCTCAGGTTGCATATCAAACTTATTTTGAGG 



AAAACAAGTCCTTGCAACAGTAGGTGTACCTC^GGT^ 



-TTTTGAGG 



SEQ16 0 1 TGATGATTTGGAACATGC^TTAAACTCTCTTTAGAAACT 

a SEQ1602 - 

SEQ1603 > -r-- 

SEQX604 r - : 

SEQX605 ---- --- 

SEQ1606 — 

SEQX607 ' — ««- " 

SEQ1608 * •-- 

SEQ16 0 9 TGATGATTTGGAACATGCGATTAAACTCTCTITTAGA • 

SEQX6X0 

&EQX6XX -- 

SEQX6X2 - : 

SEQ1613 ATGCGATTAAACTCTCTTTAGAACCTTTAAGTTTCCCAATTTTTG 

SEQX6X4 

SEQ1615 TGATGATTTGGAACATGCGATTAAACTCTCTTTAGAAACTTTAAGTTTCCCAATTTTTG 

SEQ1616 

SEQX6X7 - 

SEQX60X AAAACCGGCTAATATGGGGTCATCAGTAGGTATTTCAAAAGCGACAGATGAATCCTCAC 

SEQ1602 AAACCGGGC 

SEQ1603 TCGCTCTGCGGAACGTGAAGTATCTGTACTG - TCTGCAGAAA - GCGT 

SEQX604 

SEQX605 AACGTGAAGTATCTGTACTGCTCTGCAGAAAAGCGT 

SEQX 606 CTAATATGGGGTCATCAGTAGGTATTTCAAAAGCGACAGATGAATCCTCAC 

SEQX607 

SEQX6 08 ATCTGTACTG- TCTGCAGAAAAGCGT 

SEQX6 0 9 AAAACCGGCTAATATGGGGTCATCAGTAGGTATTTCAAAAGCGACAGATGAATCCTCAC 

SEQX6X0 TCTGTACTG - TCTGCAGAAA - GCGT 

SEQX6XX AAAACCGGCTAATATGGGGTCATCAGTAGGTATTTCAAAAGCGACAGATGAATCCTCAC 

SEQX6X2 CGTGAAGT ATCTGTACTG - TCTGCAGAAA - GCGT 

SEQX6X3 - AAACCCGGCTAATATGGGGTCATCAGTAGGTATTTCAAAAGCGACAGATGAATCCTCAC 

SEQX 6X4 GT 

SEQX6X5 AAAACCGGCTAATATGGGGTCATCAGTAGGTATTTCAAAAGCGACAGATGAATCCTCAC 

SEQX6X6 TGGTCGCTCTGCGGAACGTGAAGTATCTGTACTG- TCTGCAGAAA- GCGT 

SEQX6X7 AAGCAGGGGATACATTGACCACTGAGTAAAACCGGGC 



SEQX60X TCGCTCTGCAATTGACTTAGCTCTCAAGTATGATAGCCGTATTTT 

SEQX 602 TTGT - ATTCAGTTCGTTTAAGAAGACTTGTCCATCTTTCGTCAAAAAG 

SEQX603 ATGC - GTGCTATTAATTATGATAAATTTTTTGTTAAAACTTATTTTATCACGCAAGTAG 

SEQX604 

SEQX605 ATGC - GTGCTATTAATTATGATAAATTTTTTGTTAAAACTTATTTTATCACGCAAGTAG 

SEQX606 TCGCTCTGCAATTGACTTAGCTCTCAAGTATGATAGCCGTATTTT 

SEQX607 TTGACTTAGCTCTCAAGTATGATAGCCGTATTTTGATTGAACAAGGCG 

SEQX 60 8 ATGC - GTGCTATTAATTATGATAAATTTTTTGTTAAAACTTATTTTATCACGCAAGTAG 

SEQX 60 9 TCGCTCTGCAATTGACTTAGCTCTCAAGTATGATAGCCGTATTTTGATTGAACAA 
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Table 16: Comparative Sequences relating to SAG0767 (D-alanine - D-alanine ligase) 

SEQ1610 ATGC-GTGCTATTAATTATGATAAATTTTTTGTTAAAACTTATTTTATCACGCAAGTAG 

SEQ1611 TCGCTCTGCAATTGACTTAGCTCTCAAGTATGATAGCCGTATTTTGATTG^ 

SEQ1612 ATGC - GTGCTATTAATTATGATAAATTTTTTGTTAAAACTTATTTTATCACGCAAGTAG 

SEQ1613 .TCGCTCTGCAATTGACTTAGCTCTCAAGTATGATAGCCGTATTTT^ 

SEQ1614 ATGGCGTGCTATTAATTATGATAAATTTTTTGTTAAAACTTATTTTATCACGCAAGTAG 

SEQ1615 TCGCTCTGCAATTGACTTAGCTCTCAAGTATGATAGCCGTATTTTGA 

SEQ16 17 TTGT ^ATTCAGTTCGTTTAAGAAGATCTroTCCATCTTYCG 

SEQ1601 GACAGCTCGTCAAATTGAAGTAGGTATITTAGGCAATAATC 

SEQ16 02 GATAAACCACAAGC CCCGATTGCTTTAAAAGCTTTACTTGCATATTGACGCATTG 

SEQ1603 ' GTCAATTTATTAAA ACACAAGAATTTGATGAAATGCCATCTTCAGATGAAAAGTTA 

SEQ1604 ■ 

SEQ16 0 5 GTCAATTTATTAAA- - nACACAAGAATTTGATGAAATGCCATCTTCAGATGAAAA 

SEQ1606 . GACAGCTCGTGAAATTGAAGTAGGTATTTTAGGCAATAATGATGTTAAGACAACTTTTC 

SEQ16 07 GACAGCTCGTGAAATTGAAGTAGGTATTTTAGGCAATAATGAT^ 

SEQ1608" GTCAATTTATTAAA ACACAAGAATTTGATGAAATGCCATCTTCAGATGAAAAGTTA 

SEQ1609 GACAGCTCGTGAAATTGAAGTAGCTATTCT^ 

SEQ1610 GTCAATTTATTAAA ACACAAGAATTTGATGAAATGCC^TCrTCAGATGAAAAGTTA 

SEQ1611 GACAGCTCGTGAAATTGAAGTAGGTAITI^AGGCAATAATGATGTTAAGAC^CTTTTC 

SEQ1612 GTCAATTTATTAAA ACACAAGAATTTGATGAAATGCCATCTTCAGATGAAAAGTTA 

SEQ1613 GACAGCTCGTGAAATTGAAGTAGGTATTTTAGGCAATAATGAT^ 

SEQ1614 GTCAATTTATTAAA ACACAAGAATTTGATGAAATGCCATCTTCAGATGAAAAGTTA 

SEQ1615 GAC^GCTCGTGAAATTGAAGTAGGTATTTTAGGCAATAATGATGTTAAGACAACT 

SEQ1616 GTCAATTTATTAAA ACACAAGAATTTCATGAAATGCCATCITCAGATGAT^AAGTTA 

SEQ1617 GATAAACCACAAGC CCCGATTGCTTTAAAAGCTTTACTiXSCATATTG 

SEQ1601 . TGGCGAAGTTGTTAAAGACGTCGATTTCTATGA- - CTATGACGCCAAAT - ATATTGATA 

SEQ16 0 2 TTCCATAGTT GCTTCATCAACTTTAGCTGGAATATCCAT^GTAATTTTATTATCA 

SEQ1603 TGACAAACC AAACTGTTGATTTAGACAAAATGGTTCGTCCAAGTGATATCTATG 

SEQ16 04 CGTCGATTTCTATGA- - CTATGACGCCAAAT - ATATTGATA 

SEQ1605 

SEQ1606 TGGCGAAGTCGTTAAAGACGTCGATTTCTATGA- - CTATGACGCCAAAT - ATATTGATA 

SEQ1607 TGGCGAAGTCGTTAAAGACGTCGATTTCTATGA- -CTATGACGCCAAAT- ATATTGATA 

SEQ1608 TGACAAACC AAACTGTTGATTTAGACAAAATGGTXCGTCCAAGTGATATCTATG 

SEQ1 6 0 9 TGGCGAAGTCGTTAAAGACGTCGATTTCTATGA- - CTATGACGCCAAAT - ATATTGATA 

SEQ1610 TGACAAACC AAACTGTTGATTTAGACAAAATGGTTCGTCCAAGTGATATCTATG 

SEQ1611 TGGCGAAGTCGTTAAAGACGTCGATTTCTATGA- - CTATGACGCCAAAT - ATATTGATA 

SEQ1612 TGACAAACC : AAACTGTTGATTTAGACAAAATGGTTCGTCCAAGTGATATCTATG 

SEQ1613 TGGCGAAGTTGTTAAAGACGTCGATTTCTATGA- -CTATGACGCCAAAT -ATATTGATA 

SEQ1614 TGACAAACC AAACTGTTGATTTAGACAAAATGGTTCGTCCAAGTGATATCTATG 

SEQ1615 TGGCGAAGTCGTTAAAGACGTCGATTTCTATGA- -CTATGACGCCAAAT- ATATTGATA 

SEQ1616 TGACAAACC AAACTGTTGATTTAGACAAAATGGTTCGTCCAAGTGATATCTATG 

SEQ1617 TTCCATAGAT GCTTCATCAACTTTAGCTGGAATATCO^TAGCAATTTTATTATCA 

SEQ1601 TAAAATTACTAT - - GGATATTCCAGCTAAAGTTGATGAAGCAACTATGGAAGCAATGCG 

SEQ1602 TATATTTGGCGTCATAGTCATAGAAATCGACGTCTTTAACGACTTCGCCAGG- -AAAAG 

SEQ1603 TGATAATGCAAT - - TGTTTTCCCCGTTTTAC ATGGACC AATGGGGGAAG - -ATGGT 

SEQ1604 TAAAATTACTAT - -GGATATTCCAGCTAAAGTTGATGAAGCAACTATGGAAGCAATGCG 

SEQ1605 - 

SEQ1606 TAAAATTACTAT- -GGATATTCCAGCTAAAGTTGATGAAGCAACTATGGAAGCAATGCG 

SEQ1607 TAAAATTACTAT- -GGATATTCCAGCTAAAGTTGATGAAGCAACTATGGAAGCAATGCG 

SEQ1608 TGATAATGCAAT- -TGTTTTCCCCGTTTTAC ATGGACCAATGGGGGAAG- -ATGGT 

SEQ1609 TAAAATTACTAT- -GGATATTCCAGCTAAAGTTGATGAAGCAACTATGGAAGCAATGCG 

SEQ1610 TGATAAT - — 

SEQ1611 TAAAATTACTAT- -GGATATTCCAGCTAAAGTTGATGAAGCAACTATGGAAGCAATGCG 

SEQ1612 TGATAATGCAAT- -TGTTTTCCCCGTTTTAC ATGGACCAATGGGGGAAG- -ATGGT 

SEQ1613 TAAAATTACTAT - - GGATATTCCAGCTAAAGTTGATGAAGCAACTATGGAAGCAATGCG 

SEQ1614 TGATAATGCAAT- -TGTTTTCCCCGTTTTAC ATGGACCAATGGGGGAAG- -ATGGT 

SEQ16X5 TAAAATTACTAT- - GGATATTCCAGCTAAAGTTGATGAAGCAACT ATGGAAGCAATGCG 

SEQ1616 TGATAATGCAAT- -TGTTTTCCCCGTTTTAC- - -ATGGACCAATGGGGGAAG- -ATGGT 

SEQ1617 TATATTTGGCGT ABLECMPARATIVESEQENCESRELA-TINGTSAGD- -ALAN I 
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Table 16: Comparative Sequences relating to SAG0767 (D-alanine - D-alanine ligase) 



SEQ1601 
SEQ1602 
SEQ1603 
SEQ1604 
SEQ1605 
SEQ1606 
SEQ1607 
SBQ1608 
SEQ1609 
SEQ1610 
SEQ1611 
SEQ1612 
SEQ1613 
SEQ1614 
SEQ1615 
SEQ1616 
SEQ16X7 . 

SEQ1601 
SEQ1602 
SEQ1603 
SEQ1604 
SEQ1605 
SEQ1606 
SEQ1607 
SEQ1608 
SEQ1609 
SEQ1610 
SEQ1611 
SEQ1612 
SEQ1613 
SEQ1614 
SEQ1615 
SEQ1616 
SEQ1617 

SBQ1601 
SEQ1602 
SEQ1603 
SEQ1604 
SEQ1605 
SEQ1606 
SEQ1607 
SEQ1608 
SEQ1609 
SEQ1610 
SEQ1611 
SEQ1612 
SEQ1613 
SEQ1614 
SEQ1615 
SEQ1616 
3EQ1617 



T- -GTCTTAAGATCATTATTGCCTAAAATACCTACCT 

C — TATCCAAG- - GATTTTTAGAAGTTTTAAGGATGCCTTATGTTGGGACTAATATTCT 
C^TATGCAAGTAAAGCTTTTAAAGCAATCGGGGCTTGTGGTTTATCACGCTGTGATTT 

CAATATGCAAGTAAAGCTTTTAAAGCAATCGGGGCTTGTGGTTTATCACGCTGTGA 
CAATATGCAAGTAAAGCTTTTAAAGCAATCGGGGC 

C- -TATCCAAG- - GATTTTTAGAAGTTTTAAGGATGCCTTATGTTGGGACTAATAT 
CAATATGCAAGTAAAGCTTTTJU^GCAATCGGGQ^ 

CAATATGCAAGTAAAGCTTTTAAAGCAATCGGGGCTTGTGGTITATC^ 
C- -TATCCAAG- - GATTTTTAGAAGTTTTAAGGATGCCTTATGTT<^ 
CAATATGCAAGTAAAGCTTTTAAAGCAATCGGGGCT 

C- -TATCCAAG- - GATTTTTAGAAGTTTTAAGGATGCCTTATGTTGGGACTAATATTCT 
CAATATGCAAGTAAAGCTTTTAAAGCAATCGGGGCTTGTGGTT 

C- -TATCCAAG- - GATTTTT AGAAGTTTTAAGG ATGCCTTATGTTGGGACTAATATTCT 
E--DALANINELIGASE r -- --- 

TTTTTGACGAAAGA - - TGGAGAAATCTTCITAAACGAACTGAA- TACAATGCCCGGTTT 
TGTTCAATCAAAATACGGCTATCATACTTGAGAGCTAAGTCJ^ 

TCTTCAAGCGTGGCTAT 

TTTTTGACGAAAGA- - TGGACAAATCTTCTT AAACGAACTGAA - TACAATGCCC 

TTTTTGACGAAAGA - - TGGACAAATCTTCTTAAACGAACTGAA- TACAATGCCCGGTTT 
TTTTTGACGAAAGA - - TGGACAAATCTTCTTAAACGAACTGAA- TACAATGCCCGGTTT 

TCTTCAA -« 

TTTTTGACGAAAGAA - TGGACAAATCTTCTTAAACGAACTGAAATAC 

TTTTTGACGAAAGA- - TGGACAAATCTTCTTAAACGAACTGAA - TACAATGCCCGGTTT 

TCTTCAAGCGTGGCTAT(^ATAAAATTACAACAAAACAAG 

TTTTTGACGAAAGA — TGGACAAATCTTCTTAAACGAACTGAA- TACAATGCCCGGTTT 
TCTTCAAGCGTGGCTATGGATAAAATTACAACAAAACAAGTCCT 

TTTTTGACGAAAGA- - TGGACAAATCTTCTTAAACGAACTGAA- TACAATGCCCGGTTT 
TCTTCAAGCGTGGCTATGGATAAAATTAQVACAAT^CAAGTCCTTGCAA^ 

ACTCAGTGGTCAATGTATCCTCTGCTTTGGGAAAA- TATGGGGC TAACTTAT AGTGATT 
GATT(^TCTGTCGCTTTTGAAATACCTACTGATGACCCCATATTAGC 

ACTCAGTGGTCAATGTATCCTCTGCTTTGGGAAAA- T 

ACTCAGTGGTCAATGTATCCCCTGCTTTGGGAAAAGTATGGGGCTAACCTT 

ACTCAGTGGTCAATGTATCCCCTGCTTTGGGAAAA- TATGGGGCTAACTTATAG 

ACTCAGTGGTCAATGTATCCTCTGCTTTGGGAAAA-TATGGGGCTAACTT 

CCTCAGG 

ACTCAGTGGTCAATGTATCCCCTGCTTTGGGAAAA - TATGGGGCTAACTTATAGTGA - - 
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Table 16: Comparative Sequences relating to SAG0767 (D-alanine - D-alanine ligase) 



SEQ1601 
SEQ1602 
SEQ1603 
SEQ1604 
SEQ1605 
SEQ1606 
SEQ1607 
SEQ1608 
SEQ1609 
SEQ1610 
SEQ1611 
SEQ1612 
SEQ1613 
SEQ1614 
, SEQ1615 
SEQ1616 
SEQ1617 

SEQ1601 
SEQ1602 
SEQ1603 
SEQ1604 
SEQ1605 
SEQ160 6 
SEQ1607 
SEQ1608 
SEQ1609 
SEQ1610 
SEQ1611 
SEQ16X2 
SEQ1613 
SEQ1614 
SEQ1615 
SEQ1616 
SEQ1617 

SEQ1601 
SEQ1602 
SEQ1603 
SEQ1604 
SEQ1605 
SEQ1606 
SEQ1607 
SEQ1608 
SEQ1609 
SEQ1610 
SEQ1611 
SEQ1612 
SEQ1613 
SEQ1614 
SEQ1615 
SEQ1616 
SEQ1617 
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Table 16: Comparative Sequences relating to SAG0767 (D-alanine - D-alanine ligase) 



SEQ1601 
SEQ1602 
SEQX603 
SEQ1604 
SEQ1605 
SEQ1606 
SEQ1607 
SEQ1608 
SEQ1609 
SEQ1610 
SEQ1611 
SEQ1612 
SEQ1613 
SEQ1614 
SEQ1615 
SEQ1616 
SEQ1617 



ACTTCTAAAAATCCTTGGATAGAACCATCTTCCCCCATTGGTCCATGTAAAACGGGGAA 



SEQ1601 
SEQX602 
SEQ1603 
SEQ1604 
SEQX605 
SEQ1606 
SEQ1607 
SEQ1608 
SEQX609 
SEQ1610. 
SEQX6XX 
SEQ 1,6X2 
SEQX6X3 
SEQX6X4 
SEQX615 
SEQ1616 
SEQ1617 



AGAATTGCATTATCATCATAGATATCACTTGGACGAAC 



SEQ1601 
SEQ1602 
SEQ1603 
SEQ1604 
SEQ1605 
SEQ1606 
SEQL607 
SEQ1608 
SEQ1609 
SEQX6X0 
SEQX6XX 
SEQX6X2 
SEQX6X3 
SEQX6X4 
SEQX6X5 
SEQX6X6 
SEQX6X7 



TGGTTTGTCATTAACTTTTCATCTGAAGATGGCATTTCATCAAATTCTTGTGTTTTAAT 
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Table 16: Comparative Sequences relating to SAG0767 (D-alanine - D-alanine ligase) 

SEQ1601 --- 

SEQ1602 AATTGACCTACTTGCGTG 

SEQ1603 

SEQ1604 

SEQ1605 

SEQ1606 : • 

SEQ1607 

SEQ1608 

SEQ1609 r 

SEQ16L0 * • 

SEQX611 

SEQ1612 " 

SEQ1613 

SEQ1614 

SEQX615 ^ • * 

SEQ1616 

SEQ1617 ' ' • 
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Table 17: Comparative Sequences relating to SAG1086 (xanthine phophoribosyltransferase) 



SEQ ID NO. 1701: SAG1086 FROM THE11G9NT1 GBS NQNTYPEABLE STRAIN 

TTTAAAGGTTGATTCCTTTTTGACTCATCAGGTAGATTTTGAGTTAATGCAGGAAATAGG 

CCXMCATTACGAAGGTTGTTAOGATTGAAGCATCTGGAATTGCGCC^ 

GCTAAAAAGGCTAAGAACATTACTATGACTGAAGGTATCTTAACTGCTGAAGTC 

TATTGTGAGTCGCTTTTTATCTAACGATGATACTGTACT 

AAATTATTGGTCAAGCTGGAGCTAAGGXTGCTGGTATCGGAATCGTTATTG 

ACAGGTGTTCCAGT . 

SEQ ID NO. 1702s SAG0767 FR OM THE 18RS2iL GBS TYPE li STRAIN 

TTTAGGTGAGAACATTTTAAAGGTTGATTCTTTTTTGACT 

At^TATAAAGAAGCCGGCATTAO^GGTTCTTACGA^ 

GkACCAA'^GATATTTCK^CAAAAAAGCTA 

TACGAGTCAAGTTTCTATTGTGAGTCGCTTTTO 

CTAAAGGATTACTTGAAATTATTGGTCAAGCTGGAGCTA^ 

GATTTGTTAGAAAAAACA ' 

SEQ ID NO. 1703: SAG0767 FROM THE H36bl GBS TYPE lb STRAIN 

AAG^ACGTATTCTTAAAGATGGTGATGTTTTAGGTGAGAA^ 

ATGCAGGAAATAGGTAAAGTTTTTGCTGATAAATAT^ 

AGCAGTGTACGCAGCTCAAGCATTGK3GCGTAC^ 

CTGAAGTGTATTGTTTTACAAAGCAA^ 

GATGACTTTTTAGCAAACGGTGAAGCGGCTAAAGGATT^ 

TATTGAAAAATCTTTCCAAGATGGGCGTGATT 

SEQ ID NO. 1704: SAG0767 FROM THE M732 GBS TYPE III STRAIN 

ATTCTTTTTTGACTATCAGGTAAATTTTC 
AGGTTGTTACAATTGAAGCATCTGGAATTGC^ 
AAGAACA TTACTATGACTGAAGGTATCTTAAC^ 
CTTTTTATCHAACGATGATACTGTACTC^ 

AAGCTGAAGCTAAGGTTGCTGGTATCGGAATCGTTATTGAAAAATCTTTCC^ 

SEQ ID NO. 1705: SAG0767 FROM THE M7 81 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

GAACGTATTCTTAAAGATGGTGATGTTTTAGGTG^ 

GCAGGAAATAqGTAAAGTTTTTGCTGATAAATATAAAGAAGC 

CAGTGTACGCAGCTCMGCATTGGGCGTACCAATGATATTTGCT 

GAAGTGTATTCTTTTACAAAGCAAGTTACGAG 

TGACTTTTTAACAAACGGTCAAGC 

SEQ ID NO. 1706: SAG0767 FROM THE 090 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

ACATTTTAAAGGTTGATTCTTTTTTGACTC^ 
GAAGCCGKSCATTACGAAGGTTGTTACGATTGAAGC^ 
ATTTGCTAAAAAAGCTAAGAACATTACTATGACrGAAG 
TTTCTATTGTGAGTCGCTTTTTATCTAACGATGATACTGTACTCATCAT^ 
.CTTGAAATTATTGGTCAAGCTGGAGCTAAGGTTGCTGGTATC^ 
AAA 

SEQ ID NO. 1707: SAG0767 FROM THE A909 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

ACGTATTCTTAAAGATGGTGATGTTTTAGGTG&GAAC^ 

AGGAAATAGGTAAAGTTTTTGCTGATAAATATAAAGAAGCCGGCA 

GTGTAC^C^GCTCAAGCATTGGGCGTACCAATGATAT 

AGTGTATTCTTTTACAAAGCAAGTTACX^GTCAAGTTTCTATTGTGA 

ACTTTTTAGCAAACGGKCAAGCGGSTAAAGGATTACTTGAAAT^ 

SEQ ID NO. 1708: SAG0767 FROM THE COH1 GBS TYPE la STRAIN 

TTTAAAAGTTGATTCTTTTTTGACT 
CCGGCATTACGAAGGTTGTTACAATTGAAGCA^ 
GCTAAAAAAGCTAR.GAACATTACTATGACTGAAGGTATCTTAACT 
TATTGTGAGTCGCTTTTTATCTAACGATGATACT 

ACAGGTGTTC CGGTT AC 

SEQ ID NO. 1709: SAG0767 FROM THE CJB110 GBS NONTYPEABLE STRAIN (REVERSE 
COMPLEMENT) 

GCTGATAAATATAAAGAAGCCXSGCATTACXSAAGGTTGTTACAAT^ 

GGGCGTACCAATGATATTTGCTAAAAAAGCTAAG 

AAGrTTACGAGTCAAGTTTCTATTGTGAGTCGCTrTTTATCTO 

GCX3GCTAAAGGATTACTTGAAATTTATTGGTCAAGCT 

GGCGTGATTTGTTAGAAAAAACAGGTGTTCCAGT 
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Table 17: Comparative Sequences relating to SAG1086 (xanthine phophoribosyltransferase) 



•SEQ ID NO. 1710« SAG0767 FROM THE 2603 V/R.GBS TYPE V STRAIN 
AACGTATTCTTAAAGATGGTGATGTTTTAGGTGAGAACATTTTAAAA6TTGA 
CAGGAAATAGGTAAAGTTTTTGCTGATAAATATAAAGAAGCCGGCATTACGAAGGTTGTO 
AGTGTACGCAGCTCAAGCATTGGGCGTACCAATGATAT^ 

AAGTGTATT CTTTTACAAAG CAAGTTACGAGTCAAGTTTCTATTGTGAGT CGCTTTTTATCTAACGATGATACTGTACTCATCATTGAT 

GACTTTTTAGCAAACGGTCAAGCGGCTAAAGGATTACTTGA 

TGAAAAATCTTTCCAAGATGGGCGTGATTTGTTAGAAAAAACAGGTGTTCCAG 

SEQ ID NO. 1711s SAG0767 FROM THE JM9130013 GBS TYPE VIII STRAIN (REVERSE 
COMPLEMENT) 

ACGAAGGTTGTTACAATTGAAGGA CAATGATATTTG CTAAAAA 

AGCTAAGAACATTACTATGACTGAAGGTA^ 

GTCGCTTO^ATCTAACGATGATACTGTACTC 

GGTCAAGCTGGAGCTAAGGTTGCTGGTATCGGA , 



SEQ1701 TTTAAAGGTTGATTCCT 

SEQ17 02 ' ■ TTTAGGTGAGAACATTTTAAAGGTTGATTCTT 

SEQ17 03 AGAACGTATTCTTAAAGATGGTGATGTTTTAGGTGAGAACATTTTAAAAGTTGATTCTT 

SEQ1704 ATTCT 

SEQ1705 -GAACGTATTCTTAAAGATGGTGATGTTTTAGGTGAGAACATTTTAAAAGT'TGATTCTT 

SEQ17 06 ACATTTTAAAGGTTGATTCTT 

SEQ1707 ACGTATTCTTAAAGATGGTGATGTTTTAC^T 

SEQ1708 ^-1-: \ ra. - TTTAAAAGTTGATTCTT 

SEQ1709 

SEQ1710 - -AACGTATTCTTAAAGATGGTGATGTTTTAGGTGAGAAC^ 

SEQ1711 . - - 

SEQ17 0 1 TTTGACTCATCAGGTAGATTTTGAGTTAATGCA . 

SEQ 17 0 2 TTTGACTCATCAQ3TAGATTTO^GTTAATCCAGGAAATATC 

SEQ17 0 3 TTTGACTCATCAGGTAGATTTTGAGTTAATGCAGGAAATAGGTAAAG 

SEQ1704 TTTTGACTATCATCTAAATTTTGAGTTAATGCAGGAAATAOT 

SEQ1705 TTTGACTCATCAGGTAAATTTTGAGTTAA 

SEQ17 0 6 TTTGACTGATCAGGTAGATTTTGAGTTAATGCAGGAAATAGGTAAAGTTT^GCTGATA 

• SEQ17 07 TTTGACTCATCAGGTAGATTTTGAGTTAATGCAGGAAATAGGTAAAGTTTTTGCT 

SEQ17 0 8 TTTGACTCATCAGGTAAATTTTGAGTTAATGGAGGAAATAGGTAAAGTTTTTGCTGATA 

SEQ1709 * GCTGATA 

SEQ17 1 0 TTTGACTCATCAGGTAGATTTTGAGTTAATGCAGGAAATAGGTAAAGTTTTTGCTGATA 

SEQ1711 

SEQ17 0 1 ATATAAAGAAGCCGGCATTACGAAGGTTGTTACGATTGAAGCATCTGGAATTGCGCCAG 

SEQ17 0 2 ATATAAAGAAGCCGGCATTACGAAGGTTGTTACGATTGAAGCATCTGGAATTGCACCAG 

SEQ1703 ATATAAAGAAGCCGGCATTACGAAGGTTGTTACAATTGAAGCATCTGGAATTGCGCCAG 

SEQ1704 ATATAAAGAAGCCGGCATTACGAAGGTTGTTACAATTGAAGCATCTCGAAT 

SEQ17 0 5 ATATAAAGAAGCCGGCATTACGAAGGTTGTTAOATTGAAGCATCTGGAAOT 

SEQ17 0 6 ATATAAAGAAGCCGGCATTACGAAGGTTCTTACGATTGA 

SEQ17 07 ATATAAAGAAGCCX3GCATTACGAAGGTTGTTACAATTGAAGCATCTO 

SEQ17 0 8 ATATAAAGAAGCCGGCATTACGAAGGTTGTTACAATTGAAGCATCTGGAATTGCGCCAG 

SEQ17 0 9 ATATAAAGAAGCCGGCATTACGAAGGTTGTTACAATTGAAGCATCTGGAATTGCGCCAG 

SEQ1710 ATATAAAGAAGCCGGC^TTACteAAGGTTGTTACAATTGAAGCATC 

SEQ1711 ACGAAGGTTGTTACAATTGAAGCATCTGGAATTGCGCCAG 

SEQ17 0 1 CAGTGTACGCAGCTCAAGCATTGGGCGTACCAATGA 

SEQ17 0 2 CAGTGTACGCAGCTCAAGC^TTGGGCGKACCAATGATATTTGCTAAAAAAG 

SEQ17 0 3 CAGTGTACGCAGCTCAAGCATTGGGCGTA.CCAATGATATTTGCTAAAAAAGCT 

SEQ17 0 4 CAGTGTACGCAGCTCAAGCATTGGGCGTACCAATGATATTTGCTA^ 

SEQ17 0 5 CAGTGTACGCAGCTCAAGCATTGGGCGTACCAATGATAT 

SEQ17 0 6 CAGTGTACGCAGCTCAAGCATTGGGCGTACC^TGATATTTGCTAAAAAAGCTAAGAACA 

SEQ1707 CAGTGTACGCAGCTCAAGCATTGGGCK3TACGAATGATATTTGCTAAAAAAGCT 

SEQ17 0 8 CAGTGTACGCAGCTCAAGCATTGGGCGTACCAATGATATTTGCTAAAAAAGCTAAGAACA 

SEQ17 0 9 CAGTGTACGGAGCTCAAGCATTGGGCGTACGAATGATATTTGCTAAAAAA 

SEQ17 1 o cagtgtacgcagcto^gcattggxk:gtaccaatgatatttgctaaaaaagct^ 

SEQ1711 cagtgtacgcagctcaagcattgggcgtaccaatgatatttgctaaaaaagctaagaaca 
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Table 17: Comparative Sequences relating to SAG1086 (xanthine phophoribosy transferase) 



SEQ1701 
SEQ1702 
SEQ17 03 
SEQ1704 
SEQ1705 
SEQ1706 
SEQ1707 
SEQ1708 
SEQ1709 
SEQ1710 
SEQ1711 

SEQ1701 
SEQ1702 
SEQ17 03 
SEQ17 04 
SEQ1705 
SEQ1706 
SEQX707 
SEQ1708 
SEQ1709 
SEQ1710 
SEQ1711 

SEQ1701 
SEQ1702 
SEQ1703 
SEQ1704 
SEQ1705 
SEQ1706 
SEQ1707 
SEQ1708 
SEQ17 09 
SEQ1710 
SEQ1711 



TTACTATGACTGAAGGTATCTTAACTGCTGAAGTGTATTCTTTTACAAAGCAAGWTACGA 

TTACTATGACTGAAGGTATCTTAACTGCTGAAGTGTATTCTTTTA^^ 

TTACTATGACTGAAGGTATCTTAACTGCTGAAGTGTATTCTTTTACAAAGCAAGTTACGA 

TTACTATGACTGAAGGTATCTTAACTGCTGAAGTGTATTCTTTTACATUVGCAAGT^ 

TTACTATGACTGAAGGTATRTTAACTGCTGAAGTGTATTCTTTTACAAAGCAA 

TTACTATGACTGAAGGTATCTTAACTGCTGAAGTGTATTCTTTTACAAAGCAAGTTACGA 

TTACTATGACTGAAGGTATCTTAACTGCTGAAGTGTAOTCTTTTACAAAGC 

TTACTATGACTGAAGGTATCTTAACTGCTGAAGTCTATT^ 

TTACTATGACTGAAGGTATCTTAACTGCTGAAGTGTATTCTTTTACAAAGCAAGTTACGA 

TTACTATGACTGAAGXSTATCTTAACTGCTGAAGTGTATTC^ 

TTACTATGACTGAAGGTATCTTAACTGCTGAAGTGT^ 

GTCAAGTTTCTATTGTGAGTCG(nTTTTATCTAAa3ATGA 

GTCAAGTTTCTATTGTGA!3TCGCTTTTTATCTAACGATGATACTGTACT<^TCA 

GTCAAGTTTCTATTGTGAGTCGCTTTTTATCTAACGATGATACTGTACT 

GTCAAGTTTCTATTGTGAGTCGCTTTTTATCTAACGATGATACTGTACTC^ 

GTCAAGTTTCTATTGTGAGTCGCTTTTTATCTAACGATGATACTGTACTCATCATTGATG 

GTCAAGTTTCTATTGTGAGTCGCTTTTTATCTAACGATGATACTGTACTCATCATTGATO 

GTCAAGTTTCTATTGTGAGTCGCTTTTTATCT^^ 

GTCAAGTTTCTATTGTGAGTCGCTTTTTATCTAACC5ATGATACTGTACTCA 
GTCAAGTTTCTATTGTGAGTCGCTTTTTATCTAACG^ 
GTCAAGTTTCTATTGTGAGTCGCTTTTTATCTAACGATGATACT 
♦ GTCAAGTTTCTATTGTGAGTCGCTTTTTATCT 

ACTTTTTAGCAAACGGTCAAGCGGCTAAAGGATTACTTGAAATT - ATTGGTCAAGCTGGA 
ACTTTTTAGCAAACG6TCAAGCGG,CTAAAGGATTACTTGAAA^ - ATTGGTCAAGCTGGA 
ACTTTTTAGCAAACGGTCAAGCGGCTAAAGGATTACTTGAAATT - ATTGGTCAAGCTGGA 
ACTTTTTAGCAAACGGTCAAGCGGCTAAAGGATTACTTGAAATT - ATTGGTCAAGCTGAA 

ACTTTTTAACAAACGGTCAAGC- - - - 

ACTTTTTAGCAAACMGTCYAGCGGCTAAAGGATTACTTGAAATT-AT^ 
ACTTTTTAGCAAACGGKCAAGCGGS TAAAGGATTACTTGAAATT - ATTGGTCAAGCTGGA 
ACTTTTTAGCAAACGGTCAAGCGGCTAAAGGATTACTTGAAATT - ATTGGTCAAGCTGAA 
ACTTTTTAGCAAACGGTCAAGCGGCTAAAGGATTACTTGT^AATTTATTC 
ACTTTTTAGCAAACGGTCAAGCGGCTAAAGGATTACTTGAAATT - ATTGGTCAAGCTGGA 
ACTTTTTAGCAAACGGTCAAGCGGCTAAAGGATTACTTGAAATT - ATTGGTCAAGCTGGA 



SEQ1701 
SEQ1702 
SEQ1703 
SEQ1704 
SEQ1705 
SEQ1706 
SEQ1707 
SEQ1708 
SEQ1709 
SEQ1710 
SEQ1711 

SEQ17 01 
SEQ1702 
SEQ1703 
SEQ1704 
SEQ1705 
SEQ1706 
SEQ1707 
SEQ1708 
SEQ1709 
SEQ1710 
SEQ1711 



CTAAGGTTGCTGGTATCGGAATCGTTATTGAAAAATCTTTCCAAGATGGG 
CTAAGGTTGCTGGTATCGGAATCGTTATTGAAAAATCTTTCCAAGATGGGCGTC 
CTAAGGTTGCTGGTATCGGAATC YTTATTGAAAAATCTTTCCA^ - - 

CTAAGGTTGCHXX5TATCX3GAATCGTTATTGAAAAA 

CTAAGGTTGCTGGTATCGGAATCGTTATTGAAAAATCTTTCCAAGATGGGCGTGATTTG 

CTA 

CTAAGGTTGCTGGTATCGGAATCGTTATTGAAAAATCTTTCCAAGATGGGCGTGATTTG 
CTAAGGTTGCTGGTATCGGAATCGTTATTGAAAAATCTTTCCAAGATGGGCGTGATTTG 
CTAAGGTTGCTGGTATCGGAATCGTTATTGAAAAATCITTCCAAGATGGGCGTGATTTG 
CTAAGGTTGCTGGTATCGGA TABCMARATVSTNCSR- -ATNGTSAGXANTHN 

TAGAAAAAACAGGTGTTCCAGT 

TAGAAAAAACA 

TAGAAAAAACAGGTGTTCCGGTTACTTCTCTTGCTCGT 

' TAGAAAA 

TAGAAAAAACAGGTGTTCCGGTTAC 

TAGAAAAAACAGGTGTTCCAGT- - 

TAGAAAAAACAGGTGTTCCAG 

HRBS YTRANSRAS 
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Table 18: Comparative Sequences relating to SAG1600 (glutamate racemase) 



SEQ ID NO. 1801s SAG1600 PROM THE H36b GBS TYPE lb STRAIN (REVERSE COMPLEMENT) 

AATCITCATTGGAGATCAGGCTAGAGCTCCGTATGGT^ 

TATTGACTAAAAATGTTAAGATGATTGTTATAGC^^ 

CCTGTTTTAGGCGTTATTTTACCAGGAGCTAGCGCAGCTATCAAA 

TGTTAAATCAGATGCTTATCGTCAAAAAAT^ 

TTGTGGAATCAAATCAGATGTCTTCTAGTTTAGCCAAAAAGGTGG 

ATTTTAGGTTGCACGCATTATCCCTTATTACX^^ 

AACCGTTCGTGATATTTCTGTTTTATTGAACTATT^ 

CCGCCAGCCCAA ° 

SEQ ID HO. 1802 J SAG1600 FROM THE M732 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

aaatgttccg*caacttcCagaa'gaggaagtaatct 
" agagagtttacctggcagatggttaaco^cttattgactaa^ 
ctggcaagaaattaaagaaaaactagacatccc^ 
ggaaagttggtattataggtactccca^ 

GTATCCCTTGCTTGTCCGAAATTTGTTCXMTTC 
GTCCCCATTAGTTGGTAAATTAGATAOT 
CTGAGGTTAAATTAATTGATAGTGGCGCAG 
AATAAACACGGTGGTCATCAt?rrTTACACA^ 

SEQ ID NO. 1803 s SAG1600 FROM THE 090 GBS TYPE la STRAIN 

AATCTTCATTGGAGACCAGGCI^ 
ATTGACTAAAAATGTTAAGATGATTGrTTAT 
CTGTTTTAGGCGTTATTTTACCAGG3\GCT 
GTTAAATCAGATGCTTATCGTCAA&AAATTCAAGCCT 
' TGTGGA^TCAAATCAGATGTCTTCTAGTTTAGCCAA 
TTTTAGGTTGCACGCATTATCCCTTATTACGTCCC^TCATTCA 
ACCGTTCGTGATATTTCTGTTTTATTGAACTATTTTGAGA 
CGsCAGCCCAAAAGGTTTTTAAGKSAAATT^ 



SEQ ID NO. 1804 s £AG1600 FROM THE A909 GBS TYPE la STRAIN 

GCGGTTGTGTAAAAGTGATGACCACOTTGOT 
(^TTTCTGCGCCACTATCAATTAATTTAAC 
AAATTAAAGTATCTAATTTACCAACTAATGGGGACAACOT 
ACAATTGGAACAAATTTCGGACAAGCAAGGGATACCA 

AACAGTCATGGGAGTACCTATAATACCAACTTTCCCTAAATTAG TTGATTTGATAGCTG CGCTAGCTCCTGGTAAAATAACG CCTAAAA 

CAGGGATGTCTAGTTTTTCTTTAATTTCTTGCC^G 

AATAAGAAGTTAACCATCTGCCAGGTAAACTCTCTAATCTG 

GATTACTTCCTCTTCTGGAAGTTGAaSGAACATO 

SEQ ID NO- 1805s SAG1600 FROM THE COHl GBS TYPE la STRAIN 

TTCCGTCAACTTCCAAAATATGAACTAATCTTCA TCAACAGATTAGAGA 
GTTTACCTGGCAGATGGTTAACTTCTTAT^ 

AAGAAATTAAAGAAAAACrAGACATCCCTGTTTTAGGCGTTATTTTACC^ 

GTTGGTATTATAGGTACTCCCATGACTGTTAAATCAGATGCTTA 

CCTTGCTTGTCCGAAAT 

SEQ ID NO. 1806 s SAG1600 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

GTAATCTTCATTGGAGATCAGG CT AGAGCTCCGTATGGTCCTAGACCTG CTCAACAGATTAGAGAGTTTACCTGGCAGATGGTTAATTT 

CTTATTGACTAAAAATGTTAAGATGATTGTTAT^ 

TAC 

SEQ ID NO. 1807 s SAG1600 FROM THE 1169NT1 GBS TYPE V STRAIN 

CTTTTGGGCTGGCGGTTGTGTAAAATTG^ 

ATATCACGAACGGTTTCTG CX3CCACTATCAATTAATT TAACCTCAGC CCC CATAACATTTTGAATAATGGGACGTAATAGGGGATAATG 

CGTGCAACCTAAAATTAAAGTATCTAATTTACCAACTAATGGGGACA 

GATTTGATTCCACAATTGGAACAAATTrCX3GACAAGCAAG^ 

GCATCTGATTTAACAGTCATGGGAGTACCTATAA 

SEQ ID NO. 1808 s SAG1600 FROM THE 1169NT1 GBS TYPE V STRAIN 

GTAATCTTCATTGGGGATCAGGCTAGAGCTCCGTAT^ 
CTTATTGACTAAAAATGTTAAGATGATTGTT^ 

SEQ ID NO. 1809s SAG1600 FROM THE 18RS21 GBS TYPE II STRAIN 

GAAATGTTCCGTCAACTTC^GAAGAGGAAGTA^ 
TAGAGAGTTTACCTGGCAGATGGTTAACTTCTTATTGA 
CCTGGCAAGAAATTAAAGAAAAACTAGACATCCCTGTTTTAGGCGT^ 
GGGAAAGTTGGTATTATAGGTACTCCCATGACTGTT^ 
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Table 18: Comparative Sequences relating to SAG1600 (glutamate racemase) 



SEQ ZD NO. 1810: SAG1600 FROM THE 18RS21 TYPE II STRAIN 
ATTTCTTTAAAACCTTTTGGGCTGGCGCT 

CAATAAAACAGAAATATCACGAACGGTTTCTGCGCC^CTATCAATTAATTTA^ 
ATATGGGATAATGCGTGCAACCTAAAATTAAAGTA 

SEQ ID NO. 1811s SAO1600 FROM THE 2603 V/R GBS TYPE V STRAIN 
ATOTCTTTAAAACCTTTTGGGCTGGCGGTTGT 

TCAATAAAACAGAAATAT CACGAACGGTTT CTGCGCCACTAT CAATTAATTTAACCT CAGCCCC CATAAC^TTTTGAATGATGGGACGT 

AATAGGGGATAATGCGTGCAACCTAAAATTAAAGTATCTAATTOACCAAC^^ 

ACTAGAAGACAT CTGATTTGATTCCACAATTGGAACAA 

SEQ ID NO. 1812 1 SAG1600 FROM THE M781 GBS TYPE III STRAIN 

GGCGGTTGTX3TAAAAGTGATGACCACCGTOTTTATTTTC . 

CGGTTTCTGCGCCACTATCAATTAATTTAACCT 

AAAATTAAAGTATCTAATTTACCAACTAATGGGGACAACGTTO 

SEQ ID NO. 1813 s SAG1600 FROM THE M 781 GBS TYPE III STRAIN 

AATCTTCATTGGAGATCAGGCTAC^GCTCCGTATGGTCCT 
TATTGACTAAAAATGTOAAGATGATTGTTATAGCTTGTAATO 

SEQ ID NO. 1814s SAO1600 FROM THE JM9130013 GS TYPE VIII STRAIN 

TGGGCTGGCGGTTGTGTAAAAGTGATGACXACCGTGTTTATOT 

<ACGAACGGTTTCTGCGCC^CTATCAATTAATTTAACCT 

CAACCTAAAATTAAAGTATCTAATTTACCAACTAATGGGGACAACGTT^ ' 
TGATTOCACAATTGGAACAAATTTCGC^ 

CTGATTTAACAGTCATGGGAGTACCTATAATAC CAACTTTCCCTGAA 



SEQ1801 - - AATCTTCATTGGAGATCAGGCTAGAGCT 

SEQ1802 AAATGTTCCGTGAACTTCCAGAAGAGGAAGTAATCTTCATTGGAGA 

SEQ1803 - - - " - AATCT^TCATTGGAGACCAGGCTAGAGCT 

SEQ1804 ---- ' GCGGTTGTGTAAAAG-T 

SEQ1805 TTCCGTCAACTTCCAAAATATGAAGTAATCTT 

SEQ1806 GTAAtCtTCATTGGAGATCAGGCTAGAGCT 

* SEQ1807 CTTTTGGGCTGGCGGTTGTGTAAAAT- T 

SEQ1 8 08 GTAATCTTCATTGGGGATCAGGCTAGAGCT 

SEQ18 0 9 AAATGTTCCGTCAACTTCCAGAAGAGGAAGTAATCTTCATTGGAGATCAGGCTAGAGCT 

SEQ1810 ATTTCTTTAAAACCTTTTGGGCTGGCGGTTGTGTAATAT - T 

SEQ1811 ATTTCTTTAAAACCTTTTGGGCTGGCGGTTGTGTAATAAGT 

SEQ1812 GGCGGTTGTGTAAAAG - T 

SEQ1813 AATCTTCATTGGAGATCAGGCTAGAGCT 

SEQ1814 TGGGCTGGCGGTTGTGTAAAAG-T 

SEQ18 0 1 CGTATGGTC - CTAGACCTGCTCAACAGATTAGAGAGTTTACCTGGCAGATGGTTAATTT 

SEQ1 8 0 2 CGTATGGTC - CTAGACCTGCTCAACAGATTAGAGAGTTTACCTGGCAGATGGTTAACTT 

SEQ1 8 0 3 CGTATGGTC - CTAGACCTGCTCAACAGATTAGAGAGTT - ACCTGGCAGATGGTTAATTT 

SEQ1804 - - GATGACCACCGTGTTTATTTTGCCAATTATGG — TTTATCTCA - AAATAGTTCA 

SEQ18 0 5 CGTATGGTC - CTAGACCTGCTCAACAGATTAGAGAGTTTACCTGGCAGATGGTTAACTT 

SEQ18 0 6 CGTATGGTC - CTAGACCTGCTCAACAGATTAGAGAGTTT ACCTGGCAGATGGTTAATTT 

SEQ1807 - -GATGACCACCGTGTTTATTTTGCCAATTATGG- -TTTATCTCA- AAATAGTTCA 

SEQ1 8 0 8 CGTATGGTC - CTAGACCTGCTCAACAGATTAGAGAGTTTACCTGGCAGATGGTTAATTT 

SEQ18 0 9 CGTATGGTC - CTAGACCTGCTCAACAGATTAGAGAGTTTACCTGGCAGATGGTTAACTT 

SEQ1810 - -GATGACCACCGTGTTTATTTTGCCAATTATGG- -TTTATCTCA- AAATAGTTCA 

SEQ1811 - - GATGACCACCGTGTTTATTTTGCCAATTATGG - -TTTATCTCA- AAATAGTTCA 

SEQ1812 - -GATGACCACCGTGTTTATTTTGCCAATTATGG — TTTATCTCA- AAATAGTTCA 

SEQ1813 CGTATGGTC - CTAGACCTGCTCAACAGATTAGAGAGTTTACCTGGCAGATGGTTAACTT 

SEQ1814 - -GATGACCACCGTGTTTATTTTGCCAATTATGG- -TTTATCTCA- AAATAGTTCA 



561 



WO 2004/018646 



PCT/US2003/026827 



Table 18: C mparative Sequences relating to SAG1600 (glutamate racemase) 



SEQ1801 
SEQ1802 
SEQ1803 
SEQ1804 
SBQ1805 
SEQ1806 
SEQ1807 
SEQ1808 
SEQ1809 
QEQ1810 
SEQ1811 
SEQ1612 
SEQ1813 
SEQ1814 

SEQ1801 
SEQ1802 
SEQ1803 
SEQ1804 
SEQ1805 
SEQ1806 
SEQ1807 
SEQ180S 
SEQ1809 
SEQ1810 
SEQ1811 
SEQ1812 
SEQ1813 
1 SEQ1814 

SEQ1801 
SEQ1802 
SEQ1803 
SEQ1804 
SEQ1805 
SEQ1806 
SEQ1807 
SEQ1808 
SEQ1809 
SEQ1810 
SEQ1811 
SEQ1812 
SEQ1813 
SEQ1814 

SEQ1801 
SEQ1802 
SEQ1803 
SEQ1804 
SEQ1805 
SEQ180 6 
SEQ1807 
SEQ1808 
SEQ1809 
SEQ1810 
SEQ1811 
SEQ1812 
SEQ1813 
SEQX814 



TTATl^CTAAAAATGTTAAGATGATTGTTATAGCTTGTAATACAGCAACTGCAGTTGC 
TTATTGACTAAAAATGTTAAGATGATTGTTATAGCTTCT 

TTATTGACTAAAAATGTTAAGATGATTGTTATAGCTTGTAATACAGCAACTGCAGTTGC 

- - ATAAAACAGAAATATCACGAACGGT - TTCTGCGCOVCTATCAATTAATTTAACCTCA 
TTATTGACTAAAAATGTTAAGATGATTGTTATAGCTTGTAATACAGCAACTGCAGTTGC 
TTATTGACTAAAAATGTTAAGATGATTGTTATAGCTTGTAATACAGCAACTGCAGTTGC 

- - ATAAAACAGAAATATCACGAACGGT - TTCTGCGCC^ 

TTATTGACTAAAAATGTTAAGATGATTGTTATAGCTTGTAATACAGCAACTG^ - 
TTATTGACTAAAAATGTTAAGATGATTGTTATAGCTTGTA^ 

- - ATAAAACAGAAATATCACGAACGGT - TTCTGCGCCACTATCAATTAATTTAACCTCA 

- - ATAAAACAGAAATATCACGAACGGT - TTCTGCGCCACTATCAATTAATTTAACCTCA 

- -ATAAAACAGAAATATCACGAACGGT -.TTCTGCGCCACTATCAATTAATOTAACCTC^ 

TTATTGACTAAAAATGTTAAGATGATTGTTATAGCTTGTAATACAGCAACT^ 

- -ATAAAACAGAAATATCACGAACGGT-TTCTGCGCCACTATCAATTAATTTAACCTCA 

TGGCAAGAAATTAAAGAAAAACTAGACGTGCCTGTTTTAGGCGTTATTT^ 

TGGCAAGAAATTAAAGAAAAACTAGACATCCCTGTTTTAGGCGTTATTTTACCA^ 

TGGCAAGAAATTAAAGAAAAACTAGACATACCTGTTTT 

CCCCCATAACATTTTGAATGATGGGACGTAATAGGGGATAATGC - GTGCAACCTAAAAT 
TGGGAAGAAATTAAAGAAAAACTAGACATCCCTGTTTTAGGCGTT 

TGGCAAGAAATTAAAGAAAAACTAGACATAC 

CCCCCATAACATTTTGAATAATGGGACGTAATAGGGGATAATGC - GTGCAACCTAAAAT 

TGGCAAGAAATTAAAGAAAAACTAGACATCCCTGTTTTAGGCGTTATTTT 
CCCCCATAACATTTTGAATGATGGGACGTAATATGGGATAATGC - GTGCAACCTAAAAT 
CC C C C ATAACATTTTGAATGATGGGACGTAATAGGGGAT AATGC - GTGCAACCTAAAAT 
CCCCC^TAACATTTTGAATGATGGGACGTAATAGGGGATAATGC - GTGCAACCTAAAAT 

CCCCCATAACATTTTGAATGATGGGACGTAATAAGGGATAATGC - GTGCAACCTAAAAT 

AGCGCAGCTATCAAATCAACTAATTCAGGGAAAGTTGGTATTATAGGTACTCCC^ 
. AGCGCAGCTATCAAATCAACTAATTTAGGGAAAGTTGGTATTATAGGTACTCCCATGAC 
AGCGCAGCTATCAAATCAACTAATTCAGGGAAAGTTGGTATTATAGGTACTCCCATGAC 
AAAGTATCTAATTTACC^CTAATGGGGAC^CGTTT<^TAAACCACCTTTTTGGCTAA 
AGCGCAGCTATCAAATCAACTAATTTAGGGAAAGTTGGTATTATAGG 

AAAGTATCTAATTTACCAACTAATGGGGACAATGTTTCATAAACCACC 

AGCGCAGCTATCAAATCAACTAATTTAGGGAAAGTTGGTATTATAGGTACTCCC^TGAC 

AAAGTA 

AAAGTATCTAATTTACCAACTAATGGGGACAACGTTTCATAAACCACCTTTTTGG 
AAAGTATCTAATTTACGAACTAATGGGGACAACGTTTCA^ 

AAAGTATCTAATTTACCAACTAATGGGGACAACGTTTCATAAACCACCTT^ 

GTTAAATCAGATGCTTATCGTCAAAAAATTCAAGCTTTGTCTCCAAATACTGCTGTGG^ 
GTTAAATCAGATGCI^ATCGTCAAAAAATTCAA 
GTTAAATCAGATGCTTATCGTCAAAAAATTC^GCrT^ 
CTAGAAGACATCIt3ATTTGATTCCAC^TTGGAACAAATTTCGG 

GTTAAATCAGATGCTTATCGTCAAAAAATTCAAGCTTTGTCTCCAAATACTGCTGTGGT 

CTAGAAGACATCTGATTTGATTCCACAATTGGAACAAATTTCGGA 

GTTAAATCAGATGCTTAT CGTCAAAAAATTCAAG C 

CTAGAAGACATCTGATTTGATTCCACAATTGGAACAA 

CTAGAAGA - 

CTAGAAGAGATCTGATTTGATTCCACAATTGGAACAAAT 



562 



WO 2004/018646 



PCT/US2003/026827 



Table 18: Comparative Sequences relating to SAG1600 (glutamate racemase) 



SEQ1801 
SEQ1802 
SEQ1803 
SEQ1804 
SEQ1805 
SEQ1806 
SEQ1807 
SEQ1808 
SEQi809 
SEQ1810 
SEQ1811 
SEQ1812 
SEQ1813 
SEQ1814 



TCCCTTGCTTGTCCGAAATTTGTTCCAATTGTGGAATCAAATCAGATCTCOT 
TCCCTTGCTTGTCCGAAATTTGTTCCAATTGTGGAATCAAATCAGATGTC 
TCCCTTGCTTGTCCGAAATTTGTTCCAATTGTGGAATCAAATCAGATGTCTTCTAGTTT 
ACAGCAGTATTTGGAGACAAAGCTTGAATTTTTTGACGATAAGCATCTGATTTAACAGT 
TCCCTTGCTTGTCCGAAAT 

ACAGGAGTATTTGGAGACAAAGOTTGAATTTTT 

. - _ * ___ _ _ _ 

ACAGCAGTATTTGGAGACAAAGCTTGAATTTTTTGACGATAAGCATCTGAT^ 



SEQ1801 
SEQ1802 
SEQ1803 
SEQ1804 
SEQ1805 
SEQ1806 
SEQ1807 
SEQ1808 
SEQ1809 
SEQ1810 
SEQ1811 
3EQ1812 
SEQ1813 
SEQ1814 

SEQ1801 
SEQ1802 
SEQX803 
SEQ1804 
SEQ1805 
SEQ1806 
SEQ1807 
SEQ1808 
SEQ1809 
SEQ1810 
SEQ1811 
SEQ1812 
SEQ1813 
SEQ1814 



GCCAAAAAGGTGGTTTATGAAACGTTGTCCCCATTAGTTGGTAAATTAGATACTTTAAT 
GCGAWVAAGGTGGTTTATGAAACGTTGTC 

GCCAAAAAGGTGGTTTATGAAACGCTGTCCCC^TTAGTTGGTAAATTAGAT^ 
ATGGGAGTACCTATAATACCAACTTTCCCTAAATTAGTTGATTTGATAGCTGCX3CTAGC 



ATGGGAGTACCT ATAA - 



ATGGGAGTACCTATAATACCAACTTTCCCT^ 
P 

TTAGGTTGCACGCATTATCCCTTATTACGTCCCATCATTCAAAATGTTATGGGGGCTGA 
TTAGGTTGCACGCATTATCCCCTATTACGTCCCATCATTCAAAATGTTATGGGGGCTGA 
TTAGGTTGCACGCATTATCCCTTATTACGTCCCATCATTCAAAATGTTATGGGGGCTGA 
CCTGGTAAAATAACGCCTAAAACAGGGATGTCTAGTTTTC 



AMATRACMAS- 



SEQ1801 

SEQ1802 

SEQ1803 

SEQ1804 ' 

SEQ1805 

SEQ1806 

SEQ1807 

SEQ1808 

SEQ180 9 

SEQ1810 

SEQ1811 

SEQ1812 

SEQ1813 

SEQ1814 



GTTAAATTAATTGATAGTGGCGCAGAAACCGTTCGTGATATTTCTGTTTTATTGAACTA 
GTTAAATTAATTGATAGTGGCGCAGAAACCGTTCGTGATATTTCTGTTTTATO 
GTTAAATTAATTGATAGTGGCGCAGAAACCGTTCGTGATATTTCTGTTTTATTGAACTA 
ACTGCAGTTGCTGTATTAC^AGCTATAACAATCATCTTAACATTTTTAGTCAATAAGAA 
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Table 18: Comparative Sequences relating to SAG1600 (glutamate racemase) 



SEQ1801 
SSQ1802 
SEQ1803 
SEQ1804 
SEQ1805 
SEQ180 6 
SEQ1807 
SEQ1808 
SEQ1809 
SEQ1810 
SEQ1811 
SEQ1812 
SEQ1813 
SEQ1814 

SEQ1801 
SEQ1802 
SEQ1803 
SEQ1804 
SEQ1805 
SEQ1806 
SEQ1807 
SEQ1808 
SEQ1809 
SEQ1810 
SEQ1811 
£EQ1812 
SEQ1813 
SEQ1814 " 

SEQ1801 
SEQ1802 
SEQ1803 
SEQ1804 
SEQ1805 
SEQ1806 
SEQ1807 
SEQ1808 
SEQ1809 
SEQ1810 
SEQ18U 
SEQ1812 
SEQ1813 
SEQ1814 



TTTGAGATA^CC^TAATTGGCAAAATAAACACGGTGGTCATCACTTTTACACAACCGC 
TTTGAGATAAACCATAATTGGCAAAATAAACACGGTGGTCATCACTTTTACACAACCGC 
TTTGAGATAAMCCATAATTGGSMAAATAAACACGGTGGTCATCACTTTTACACAACCGS 
TTAACC^TCTGCCAGGTAAACTCTCTAATCTGTTGAGCAGGTCTAGGACCATACGGAGC 

AGCCCAA : 

. AGCCCAAAAGGTTTTAAAGAAA- 

AGCCGAAAAGGTTTTTAAGGAAATTGCAGAA^ 

CTAGCCTGATCTCCAATGAAGATTACITCCTCTTCTGGAAGTTGACGGAA 

•f • 

ACAACCGTTAAACCACCT 
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Table 19: Comparative Sequences relating to SAG1680 (shikimate 5-dehydrogenase) 

SBQ ID NO. 1901: SAG1680 FROM THE 2603 V/R GBS TYPE V STRAIN 

ATCCCTAGACCATTATAAGCATGTTTCACTC 

CAAGTCGAC7UVCTACTAAATTCXX3TGTTAAAATTTCTGGATCGTTAATTAAACTATAATT 

AACTAGTAGCATCAATATAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTC 

ACCTrTATTTGAAACTGTTTTTTAATTTTATCTGATAAGTG^ 

TCTAATTTCCGCAACTCCCTCC^TAGCTGCTTGAACTGC^ 

TTTTATTTTTAGCACTGAAACCTTGAGCTGCT 

CCX3GTTCCAGCTTGATTAACGATAGTATTTACAGCACCCACTAA 

AACACTCTGTTTAAATGGCATTGAAACACT^ 

TACCCTCTTCTACTTCAAATGTCAGATAGGCATAATTCATC 

AGAGAGTGGCGTGCAGG „ 

SEQ ID NO. 1902*: SAG1680 FROM THE H36b GBS TYPE lb STRAIN 

GTOATTAATTGAAATGCTTCTGCTCCTTGATAAAT 

AACAAATCGTAACAATGCT<j3TT t CTTTAGGCTTGTAAACCAAGTCGACAACTACTAAATTCGGTGTTAAAATTTCTGGAT 

CGTTAATTAAACTATAATTATCTAATGGCCrCATTCCTAAACTAGTAGCA 

TCTrTAAATGCTGTCTTATTTTCTAGATAATCAACGACT 

AATGACCTTATCGTAATTTGAGCTGTTACGATTAAA 

CTGCTTTACCTGAACCACCAATACCAGCTATTGTAATTATTTT 

AAACAACCAATGCCATCTGTCATATGGCCTAOTAAACGTCCGGTTCCACCTTGATT 

TAATTOAGCTTGAGGAGATAAATGATCTAGCAAAGGGATAACACT 

TACCCAATGCCCTGACACCTCGAAGZU3CTT 

TTTTTTTCTTGAAAAGAGGTATTCCACATTi^ 

SEQ ID NO. 1903: SAG1680 FROM THE M732 GBS TYPE III STRAIN 

CTGGTCTAATTGCCAATCCTGCACGCC^CTCT 

TATGCCTATCTGACATTTGAAGTAGAAGAGGGTAAATTAACAGAAGCTGTTCG^ 

TGTTAATGTTTCAATGCCATTTAAACAGAGTGTTATCCCTTTG 

CTGTAAATACTATCX3TTAATCAAGGTGGAACCGGACGTTTAGTAGGCCATATGA 

TTAGCAGCTCAAGGTTTCAGTGCTAAAAATAAAATAATTACAATAGCTGGTATTC 

TCAAGCAGCTATGGAGGGAGTTGCGGAAATTAGATTATTTAATra 

CAGATAAAATTAAAAAACAGTTTCAAATAAAGGTAGTCGTTGATTATCTAGAAAATAAGAC^ 

AGAACTAGTCATTTTTATATTGATGCTACTAGTTTAGGAATGAGGCCATTAGATAATTATAGTTTAA^ 

TATTTTAACACCGAATTTAGTAGTTGTCGACTT 

SEQ ID NO. 1904: SAG1680 FROM THE M781 GBS TYPE III STRAIN 

AAATCAGCATCCCTAGACATTATAAGCATGTTTCACTC 

TGTAAACCAAGTCGACAACTACTAAATTCGGTGTTAAAATTTCTXSGAT^ 

ATTCCTAAACTAGTAGCATCAATATAAAAATGACTAGTTCTAAT^^ 

AACGACTACCTTTATTTGAAACTGTTTTTTAATTTTATCTGATAAGTCAATGACCTTA 

TAAATAATCTAATTTCCGCAACTCCCTCCATAGCTC 

GTAATTATTTTATTTTTAGCACTGAAACCTTGAGCTGCTAAAGC^ 

TAAACGTCCGGTTCGA.CCTTGATTAACGATAGTATTTACAGCACCCACT 

AAGGGATAACACTCTGTTTAAATGGCATTGAAACATTAACACCACX3AATACT 

GTTAATTTACCCTCTTCTACTTCAAATGTCAGATAGGC^ 

CGGGGATAGAGAGTGGCGTGCA 

SEQ ID NO. 1905: SAG1680 FROM THE 090 GBS TYPE la STRAIN 

GTTCGAGGTGTCAGGGCATTGGGTATTC^ 

TGATTTATCTCCTCAAGCTAAATTAGTGGGTGCTGTAAATACTATCGTTAATCAAC^ 
ATATGACAGATGGCATTGGTTGTTTTAAAGCTTTAGCAGCTCAAGGTTTC^ 
GGTATTGGTGGTTCAGGTAAAGCAGTTGCAGTTCAAGCAGCTATGGAGGGAGTTG 
TAGCTCAAATTACGATAAGGTCATTGACTTATCAGATAAAATT^ 

TAGAAAATAAGACAGCATTTAAAGACGCTATTAGAACTAGTCATTTTTATATTGATGCTACT 
TTAGATAATTATAGTTTAATTAACX5ATCCAGAA 

AGAAACAGCATTCTTACGATTTGTTAGACAAAATGGAGTGAAACATGCOT 
GAGCAGA 
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Table 19: Comparative Sequences relating to SAG1680 (shikimate 5-dehydrogenase) 

SEQ ID NO. 1906: SAQ1680 FROM THE A909 GBS TYPE Za STRAIN 

CCCTAGACCATTATAATCATGTTTCACTCCATTTTGTCTAACAAATCGTAA 

AGTCGACAACTACTAAATTCGGTGTTAAAATTTCTGGATCGTTAATT 

CTAGTAGCATCAATATAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTGTCT 

CTTTATTTGAAACTGTTTTTTAATTTTATCTGATAAGTCAATGACCTTATCGTAATTT 

TAATTTCCGCAACTCCCTCCATAGCTGCTTGAACTGCA^ 

TTATTTOTAGCAOTGAAACCTTGAGCTGCTAAAGCTTTAAAACAAC 

GGTTCCACCrTGATTAACGATAGTATTTACAGGAC^ 

CACTCTX3TTTAAATGGCATTGAAACATTAACA 

CCCTCTTCTACTTCAAATGTCAGATAGGCATAATTCATGTTTTTTTCOT 

SEQ ID NO. 1907s SAG1680 FROM THE COH1 GBS TYPE la STRAIN 

TGCACGCGACTCTCTATCCCCGTTAATGTC 

AGTAGAAGAGGGTAAATTAACAGAAGCTGTTCGAGGTGTCAGGGCATTGAGTATTCGTGGTGTTAATGTOT 
TTAAACAGAGTGTTATCCCTTTGCTAGATGATTTATCTCCTCZAAGCT 

SEQ ID NO. 1908s SAG1680 FROM THE CJB110 GBS NONTXPEABI«E STRAIN 

ATlX^GTTATTAATTGAAATGCTTCTGCTCC^ 

GTCTAACAAATCGTAACAATGCTGTTTCTTTAOT 

GGATCGTTAATTAAACTATAATTATCTAATGGCCT 

AGCGTCTTTAAATGCTGTCTTATTTTCTAGATAATCAACGACTACCT 

AGTCAATGACCTTATCGTAATTTGAGCTATTACGATTAAATAATCTAA 

GCAACTGCTTTACCK3AACCACCAATACCAGCTATTGTAACT 

SEQ ID NO. 1909s SAG1680 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

ACTCTCTATCCCCGTTAATCTGGAATACCTCTTTTCAAGAAAAAA^ 

GAGGGTAAATTAACAGAAGCTGTTCGAGGTGTCAGGGCATTGGG 

GAGTGTTA^TCCCTTTGCTAGATGAT^ 

GAACCGGACX3TTTAGTAGGCCATATGACAGATGG<^ 

AATAAAATAGTTACAATAGC'fGGTATTGGTG 

SEQ ID NO. 1910: SAG1680 FROM THE 1169NT1 GBS TYPE V STRAIN 

ATTCGTTATTAATTGAAATGCTTCTGCTCCTTGATAAATC^GCATCCCTA 

GTCTAACAAATCGTAACAATGCTGTTTCTTTAGGC^ 

GGATCGTTAATTAAACTATAATTATCTAATGGCCTCAT^ 

AGCGTCTTTAAATGCTGTCTTATTTTCTAGATAATCAAC^ 

AGTCAATGACCTTATCGTAATTTGAGCTGTTACGAT 

SEQ ID NO. 1911s SAG1680 FROM THE 1169NT1 GBS TYPE V STRAIN 

ACTTCTCTATTCCCCGTTAATGTCGAATACCTCTTTTCAAGA 
AAGAGGGTAAATTAACAGAAGCTGTTCGAGGTGTCAGGGC^ 
CAGAGTGTTATCCCTTTGCTAGATGATTTATCTCCTCAAGCTAAATTAGTGGG 
TGGAACC 

SEQ ID NO. 1912s SAG1680 FROM THE 18RS21 GBS TYPE II STRAIN 
TCGTTATTAATTGAAATGCTTCTCCT 

CTAACAAATCGTAACAATGCTGTTTCTTTAGGCTTGTAAACCAAGTCGACAAOT 
ATCGTTAATTAAACTATAATTATCTAATGGCCTCATTC 

CGTCTTTAAATGCTGTCTTArri-rCTAGATAATCAACGACTACCTTTATTTGA 
TCAATGACCTTATCGTAATTTGAGCTGTTACGATTAAATAATCTAATTTCCGCAAC 

SEQ ID NO. 1913s SAG1680 FROM THE 18RS21 GBS TYPE II STRAIN 

ATGCOTATCTGACATTTGAAGTAGAAGAGGGTAAATTAACAGAAGCTO 

GTTAATGTTTCAATGCCATTTAAACAGAGTGTTATCCCTTTC 

TGTAAATACTATCGTTAATCAAGGTGGAACCGGACGTTTAGTAGGCCATATGACAGATGGCATT 

TAGCAGCTCAAGGTTTCAGTGCTAAAAATAAAATA^ 

CAAGCAGCTATGGAGGGAGTTGCGG 



566 



WO 2004/018646 



PCT/US2003/026827 



Table 19: Comparative Sequences relating to SAG1680 (shikimate 5-dehydrogenase) 

SEQ ID NO. 1914: SAG1680 FROM THE JM9130013 GBS TYPE VIII STRAIN 

CCCTAGACCATTATAAGTCATGTTTCACTCCATTTTGTCTAACAAATCCT 
AAGTCGACAACTACTAAATTGGGTGTTAAAATTTCTGGATCGTTAATTAAACTAT^ 

ACTAGTAGCATCAATATAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTGTCTTATTTTCTAGATAAT 
CCTTTATTTdAAACTGTTTTTTAATTTTATCTGATAAGTCAAT 
CTAATTTCCGCAACTCCCTCCATAGCTGCTTGAACTGCAACTGCT^ 
TTTATTTTTAGCACTGAAACCTTGAGCTGCTAAAGCTTTAAAAC^ 



SEQ1901 
SEQ1902 
SEQ1903 
SEQ1904 
SEQ1905 
SEQ1906 
SEQ1907 
SEQ1908 
SEQ1909 
SEQ1910 
SEQ1911 
SEQ1912 
SEQ1913 
SEQ1914 

SEQ1901 
SEQ1902 
SEQ1903 
SEQ1904 
SEQ1905 
SEQ1906 
3EQ1907 
SEQ1908 
SEQ1909 
SEQ1910 
SEQ1911 
SEQ1912 
SEQ1913 
SEQ1914 



5 ATCCCT 

GTTATTAATTGA^TGCTTCTGCTCCTTGA 

TGGTCTAATTGCCAATCClGCACGCCACTCTCTAT-CCCCGTTAATGTGGAATACCTCT 
- AAATCAGCATCCCT 

CCCT 

TGCACGCCACTCTCTAT- CQCCGTTAATGTGGAATACCTCT 

— ATTCGTTATTAATTGAAATGCTTCTGCTCCTTGATAAATCAGCATCCCT 

ACTCTCTAT- CCCCGTTAATGTGGAATACCTCT 

* ATTCGTTATTAATTGAAATGCITCTGCTCCT 

" ACTTCTCTATTCCCCGTTAATGTGGAATACCTCT 

TCGTTATTAATTGAAATCCTTCTGCTCCTTGATAAATCATCATCCCT 

^----j CCCT 

- fj 

GACCATTATAAG - CATGTTTCACTCCATTTTGTCTAACAAATCGTAACAATC 

GACCATTATAAG - CATGTTTCACTCCATTTTGTCTAACAAATCGTAACAATGCTGTTTC 

TTCAAGAAAAAAACATGAAITATGCCTATCTG^ 

GAC - ATTATAAG - CATGTOTCACTdCATTTTGTCTAACAAATCGTA 

GACCATTATAAT - CATGTTTCACTCCATTTTGTCTAACAAATCGTAACAATGCTGTTTC 
TT-AAGAAAAAAA»TGAATTATGCCTATCrGA(^TTTC 
GACCATTATAAG- CATGTTTCACTCCATTTTGTCTAACAAATCGTAACAATC 
TTG^GAAAAAAACATGAATTATGCCTATCTGACATTT 

GACCATTATAAG - CATGTTTCACTCCATTTTGTCTAACAAATCGTAACAATGCTGTTTC 
TTCAAGAAAAAAACATGAATTATGCCTATCTGACATTTGAAGTAGAAGAGGGTAAATTA 
GACCATTATAAG - CATGTTTC^CTCCATTTTGTCTAACAAATCGTAACAATGCTGTTTC 

ATGCCTATCTOACATTTGAAGTAGAAGAGGGTAAATTA 

GACCATTATAAGTCATGTTTCACTCCATTTTGTCTAACAAATCGTAACAATGCTGTTTC 



SEQ1901 
SEQ1902 
SEQ1903 
SEQ1904 
SEQ1905 
SEQ1906 
SEQ1907 
SEQ1908 
SEQ1909 
SEQ1910 
SEQ1911 
SEQ1912 
SEQ1913 
SEQ1914 



TTAGGCTTGTAAACCAAGTC - - GACAACTACTAAATTCGGTGTTAAAATTTCTGGATCG 
TTAGGCTTGTAAACCAAGTC- - GACAACTACTAAATTCGGTGTTAAAATTTCTGGATCG 
CAGAAGCTGTTCGAGGTGTCAGGGCATTGAGTATTCGTGGTC 

TTAGGCTTGTAAACCAAGTC- - GACAACTACTAAATTCGGTGTTAAAATTTCTGGATCG 

GTTCGAGGTGTCAGGGCATTGGGTATTCGTGGTGT TAATGTTTCAATGCCA 

TTAGGCTTGTAAACCAAGTC - - GACAACTACTAAATTCGGTGTTAAAATTTCTGGATCG 
CAGAAGCTGTTCGAGGTGTC^GGGCATTGAGTATTCGTGGTGTTAATGTTTCAATGCCA 
TTAGGCTTGTAAACCAAGTC- - GACAACT ACT AAATTGGGTGTTAAAATTTCTGGATCG 
CAGAAGCTGTTCGAGGTGTCAGGGCATTGGGTATTCGTGGTGTTAATGTTTCAATGCC^ 
TTAGGCTTGTAAACCAAGTC - - GACAACTACTAAATTCGGTGTTAAAATTTCTGGATCG 
CAGAAGCTGTTCGAGGTGTCAGGGCATTGGGTATTCGTGGTGTT^ 
TTAGGCTTGTAAACCAAGTC- - GACAACTACTAAATTCGGTGTTAAAATTTCTGGATCG 
CAGAAGCTGTTCGAGGTGTCAGGGCATTGGGTATTCGTGGTGTTAATGTTTCAATGC^ 
TTAGGCTTGTAAACCAAGTC- - GACAACTACT AAATTGGGTGTTAAAATTTCTGGATCG 
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Table 19: Comparative Sequences relating to SAG1680 (shikimate 5-dehydrogenase) 



SEQ1901 

SEQ1902 

SEQ1903 

SEQ1904 

SEQ1905 

SEQ1906 

SEQ1907 

SEQ1908 

SEQ1909 

SEQ1910. 

SEQ1911 

SEQ1912 

SEQ1913 

SEQ1914 

SEQ1901 
SEQ1902 
SEQ1903 
SEQ1904 
SEQ1905 
SEQ1906 
SEQ1907 
SEQ1908 
SEQ1909 
SEQ1910 
SEQ1911 
SEQ1912 
SEQ1913 
SEQ1914 



TT - AATTAAACT ATAATT ATC T AATGGCCTCATTCCT - AAACTAGTAGCATCAAT 

TT - AATTAAACTATAATTATCT AATGGCCTCATTCCT -AAACTAGTAGCATCAAT 

TTTAAACAGAGTGTTATCCCTTTGCTAGATGATTTATCTCCTCAAGCTAAATTAGTGGGT 

TT - AATTAAACTATAATTATCT AATGGCCTCATTCCT -AAACTAGTAGCATCAAT 

TTTAAACAGAGTGTTATCCCTTTGCTARATGATTTATCTCCTCAAGCTAAATTAGTGGGT 

TT- AATTAAACTATAATTATCT -AATGGCCTCATTCCT -AAACTAGTAGCATCAAT 

TTTAAACAGAGTGTTATCCCTTTGCTAGATGATTTATCTCCTCAAGCTAAATTAGTGGGT 

TT- AATTAAACTATAATTMCT -AATGGCCTCATTCCT- AAACTAGTAGCATCAAT 

TTTAAA^GAGTGTTATCCCTTtGCTAGATGATTO 

TT - AATTAAACTATAATTATCT AATGGCCTCATTCCT - AAACTAGTAGCATCAAT 

TTTAAACAGAGTGTTATCCCTTTGCTAGATGATTTATCTCCT 

TT - AATTAAACTATAATTATCT AATGGCCTCATTCCT -AAACTAGTAGCATCAAT 

TTTAAACAGAGTGTTATCCCTTTGCTAGATGATTTATCTCCTCAACkrr 

TT - AATTAAACTATAATTATCT AATGGCCTCATTCCT - AAACTAGTAGCATCAAT 

TAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTGTCTTATTTTCTAGATAATCAAC 

TAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTGTCTTATTTTCTAGATAATCAAC 

CTGTAAATACTATCGTTAATG^GGTGGAACCGGACGTTTAGTAGG^ 

TAAAAATGACTAGTTCTAATAGCGTOTTTAAATGCTGTCTTATTTTCTAGATAATCAAC 

CTGTAAATACTATCGTTAATCAATOTGGAACCGSACGTTTAGTAGGCCATAT^ 

TAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTGTCTTATTTTCT 

CTGTAAATACT — 7 

TAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTGTCTTATTTT 

CTGTAAATACTATCGOTAATCAAGGTGGAACaSGACGTTTAGTA 

TAAAAATGACTAGTTCT^TAGCGTCTTTAAATGCTGTCTO 

CTGTAAATACTATCGTTAATCAAGGTGGAACC 

(TAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTG 

CTGTAAATACTATCGTTAATCAAGGTGGAACCGGACGTTTAGTAGGCCATATGACAGAT 
TAAAAATGACTAGTTCTAATAGCGTCTTTAAATGCTGTCTTATTTTCTAGATAATCAAC 



SEQ1901 
SEQ1902 
SEQ1903 
SEQ1904 
SEQ1905 
SEQX906 
SEQ1907 
SEQ1908 
SEQ1909 
SEQ1910 
SEQ1911 
SEQ19X2 
SEQ1913 
SEQ1914 

SEQ1901 
SEQ1902 
SEQ1903 
SEQ1904 
SEQ1905 
SEQ1906 
SEQ1907 
SEQ1908 
SEQ1909 
SEQ1910 
SEQ1911 
SEQ1912 
SEQ1913 
SEQ1914 



ACTACCTTTATTTGAAACTGTTTTTTAATTTTATCTGATAAGTCAATGACCTTATCGTA 
ACTACCTTTATTTGAAACTGTTTTTTAATTTTATCTGATAAGTCAATGACCTTATCGTA 
GCATTGGTTGTTTTAAAGCTTTAGCAGCTCAA.GGTTTCAGTGCTAAAAATAAAATAATT 
ACTACCTTTATTTGAAACTCTTTTTTAATTTTATCTGATAAGTCAATGACCTTATCGTA 
GCATTGGTTGTTTTAAAGCTTTAGCAGCTCAAGGTTTCAGTGCTAAAAATAAAATAGTT 
ACTACCTTTATTTGAAACTGTTTTTTAATTTTATCTGATAAGTCAATGACCTTATCGTA 

ACTACCTTTATTTGAAACTGTTTTTTAATTTTATCTGATAAGTCAATGACCTTATCGTA 

GCATTGGTTGTTTTAAAGCTTTAGCAGCTCAAGGTTTC^GTGCTAAAAA 

ACTACCTTTATTTGAAACTGTTTTTTAATTTTATCTGATAAGTCAATGACCTTATCGTA 

ACTACOTTTATTTGAAACTGTTTTTTAATTTTATCTGATAAGTCAATGACCTTATCGTA 
GCATTGGTTGTTTTAAAGCTTTAGCAGCTCAAGGTTTCAGTGCTA 

ACTACCTTTATTTGAAACTGTTTTTTAATTTTATCTGATAAGTCAATGACCTTATCGTA 

TTTGAGCTGTTACGATTAAATAATCTAATTTCCGCAACTCCCTCGAT^ 

TTTGAGCTGTTACGATTAAATAATCrAATTTCCGCAACTCCCTCCATAGCTGCTTGAAC 

CAATAGCTGGTATTGGTGGTTCAGGTAAAGCAGTTGCAGTTCAAGCAGCTATGGAGGGA 

TTTGAGCTGTTACGATTAAATAATCTAATTTCCGCAACTCCCTCCATAGCTGCTTGAAC 

CAATAGCTGGTATTGGTGGTTC^GGTAAAGCA&TTGCM 

TTTGAGCTGTTACGATTAAATAATCTAATTTCCGCAACTCCCTCGATAGCT 

TTTGAGCTATTACGATTAAATAATCTAATTTCCGCAACTCCCTCCATAACTGCT 

CAATAGCTGGTATTGGTG - 

TTTGAGCTGTTACGAT 

TTTGAGCTGTTACGATTAAATAATCTAATTTCCGCAAC 

CAATAGCTGGTATTGGTGGTTC^GGTAAAGCAGTTGCAGTTCAAGCAGCTATGGA 
TTTGAGCTATTACGATTAAATAATCTAATTTCCGCAACTCCCTCGATAGCTGCTTGAAC 
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Table 19: Comparative Sequences relating to SAG1680 (shikimate 5-dehydrogenase) 



SEQ1901 
SEQ1902 
SEQ1903 
SEQ1904 
SEQ1905 
SEQ1906 
SEQ1907 
SEQ1908 
SEQ1909 
SEQ1910 
SEQ1911 
SEQ1912 
SEQ1913 
SEQ1914 

SEQ1901 
SEQ1902 
SEQ1903 
SEQ1904 
SEQ1905 
SEQ1906 
SEQ1907 
SEQ1908 
SEQ1909 
SEQ1910 
•SEQ1911 
SEQ1912 
SEQ1913 
SEQ1914 

SEQ1901 
SBQ1902 
SEQ1903 
SEQX9Q4 
SEQ1905 
SEQ1906 
SEQ1907 
SEQ1908 
SEQ1909 
SEQ1910 
SEQ1911 
SEQ1912 
SEQ1913 
SEQ1914 

SEQ1901 
SEQ1902 
SEQ1903 
SEQ1904 
SEQ1905 
SEQ1906 
SEQX907 
SEQ1908 
SEQ1909 
SEQ1910 
SEQ1911 
SEQ1912 
SEQ1913 
SEQ1914 



GCAACTGCTTTACCTGAACCACCAATACCAGCTATTGTAATTATTTTATTTTTAG 
GCAACTGCTTTACCTGAACCACCAATACCAGCTATTGTAATO 

TTGCGGAAATTAGATTATTTAATCGTAACAGCTCAAATTACGATAAGGTCATTGACTTA 
GCAACTGCTTTACCTGAACCZACCAATACCAGCTATTGTAATTATTTTATTTTTAGCACT 
TTGCGGAAATTAGATTATTTAATTOTAATAGCTCAAATTACGATAAGGTCATTGACTTA 
GCAACTGCTTTACCTGAACCACCAATACCAGCTATTGTAATTATTTTATTTTTAGCACT 



GCAACTCCTTTACCTGAACCACCAATACCAGCTATTGTAACTATTTT 



TTGCGG 

GCAACTGCTTTACCTGAACCACCAATACCAGCT 

AAACCTTGAGCTGCTAAAGCTTTAAAAC^ 
AAACCTTGAGCTGCTAAAGCTTTAAAACAACCAATC 

CAGATAAAATTAAAAAACAGTTTCAAATAAAGGTAGTCGTTGATTATCTAGAAAAT^G 
AAACCTTGAGCrrcCTAAAGCTrrAAAACAACCAATGCCATCTGTCAT^ 
CAGATAAAATTAAAAAACAGTTTCAAATAAAGGTAGTCGTTGATTATCT 
AAACCrTGAGCTGCTAAAGCTTTAAAACAACC^ 



AAACCTTGAGCTGCTAAAGCTTTAAAACAACCAATC^ - 

CGTCCGGTTCCACCTTGATTAACGATAGTATTTACAGCACCCACTAATTTAGCTTGAGG 
TOTCCGGTTCCACCTTGATTAACGATAGTATTTACAGCACCC^CTAATTTAGCTTGA^ 
CAGCATTTAAAGACGCTATTAGAACTAGTCATTTTTATATTGATGCTACTAGTTTAGGA 
CGTCCGGTTCCACCTTGATTAACGATAGTATTTACAGCACCCAOTAATTTAGCTTGAGG 
CAGC^TTTAAAGACGCTATTAGAACTAGTCATTTTTATATTGATGCTACTAGTTTAGGA 
CGTCCGGTTCCACCTTGATTAACGATAGTATTTACAGCACCCACTAATTTAGCTTGAGG 



STN CSRATNGTS ASHKMATDHYDRGNAS 

GATAAATCATCTAGCAAAGGGATAACACTCTGTTTAAATGGCATTGAAACATTAA 

GATAAATCATCTAGCAAAGGGATAACACTCTGTTTAAATGGCATTGAAAC^T^ 

TGAGGCCATTAGATAATTATAGTTTAATTAACGATCCAGATAT 

GATAAATCATCTAGCAAAGGGATAACACTCTGTTTAAATGGCATTGAAACATTAACACC 

TGARGCCATTAGATAATTATAGTTTAATTAACGATCCAGAAATTTTAACACCCAA^ 

GATAAATGATCTAGCAAAGGGATAACACTCTGTTTAAATGGCATTGAAACATTAACACC 
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Table 19: Comparative Sequences relating to SAG1680 (shikimate 5-dehydrogenase) 



SEQ1901 

SEQ1902 

SEQ1903 

SEQ1904 

SEQ1905 

SEQ1906 

SEQ1907 

SEQ1908 

SEQ1909 

SEQ1910 

SEQ1911 

SEQ1912 

SEQ1913 ' 

SEQ1914 

SEQ1901 
SEQ1902 
SEQ1903 
SEQ1904 
SEQ1905 
SEQ1906 
SEQ1907 
SEQ1903 
SEQ1909 
SEQ1910 
' SEQ1911 
SEQ1912 
SEQ1913 
SEQ1914 

SEQ1901 
SEQ1902 
SEQ1903 
SEQ1904 
SEQ1905 
SEQ1906 
SEQ1907 
SEQ1908 
SEQ1909 
SEQ1910 
SEQ1911 
SEQ1912 
SEQ1913 
SEQ1914 



CGAATACCCAATGCCCTGAC^CCTCGAACAGCTTCTGTTAATTTACCCTCTTCTACTTC 
CGAATACCCAATGCCCTGACACCTCGAACAGCTTCTGTTAATTTACCCTCTTCTACTTC 

TAGTTGTCGACTT 

CGAATACTCAATGCCCTGACACCTCGAACAGCTTCTGTTAATTT 

TAGTTGTCGACTTGGTTTACAAGCCTAAAGAAA(^GCATTGTTACGATTTGTTAGACAA 
CGAATACCCAATGCCCTGACACCTCGAACAGCTTCTGTTAATTTACCCTCTTCTACTTC 

AATGTCAGATAGGCATAATTCATGTTTTTTTCTTGAAAAGAGGTATTC 

AATGTCAGATAGGCATAATTCATGTTTTTTTC^TGAAAAGAGGTATTCCACATTAAC^ 

. "° * ■ . • 

AATGTCAGATAGGCATAATTCATGTTTTTTTCT 

ATGGAGTGAAACATGCTTATAAT(^TCTAGGGATGCTGATTTATCAAGGAGCAGA 

AATGTCAGATAGGCATAATTC^TGTTTTTTTCTTGAAAAGA 

r — _ 

GATAGAGAGTGGCGTGCAGG- 
GATAGAGAGTGGCGTGCAGGA 

GATAGAGAGTGGCGTGCA 

GAT AG 
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Table 20: Comparative Sequences relating to SAG1723 (signal peptidase I) 



SEQ ID NO. 2001: SAG1723 FROM THE COHl GBS TYPE la STRAIN 

ATCGATTC^TATTGTAGTGGCTAACGAAGAAGAAGGC^ 

ATCAAATATAAAAATGACACCTTAACTATTAACAATAAAAAAA 

TAAATTACAGGAAAAATATTCHSTATAACCCACTTTT^ 



TTCAAAA 

SEQ ID NO. 2002s SAG1680 FROM THE CJB110 GBS NOOTYPEABLE STRAIN (REVERSE 
COMPLEMENT) 

TAAAGTTGAOK^C^CTCCATGGATCC^ • 

TTGTAGTGGCTAACGAAGAAGAAGGCGGCCAAAAGAAAAAAA^ 

AATGACACCTTAACTATTAACAATAAAAAAACAGAAGAACCT 

AAAATATTCGTATAACCCAOTTTTCCAAGACCTAG^ 

CTGTQ»TGCCTAAAGGCCACTATTATCT^ 

ACAATTGTGGGAG 

SEQ ID NO. 2003 s SAG1680 FROM THE 18RS2X GBS TYPE II STRAIN 

TTGAOGGACACTCCATGGATCCAkCTTTAGCTGACAAGGA^ 
GTGGCiaUlCGAAGAAGAAGGCXKSCCAAAAGAAAAAAATT^ 
CACCTTAACTATTAACAATAAAAAAACAGAAGAACC^ 
ATTCGTATAACCCACTTTTCCAAGACCTAGCACAAAG 

TGTGGGAGAGGT 0 

SEQ ID NO. 2004: SAG16S0 PROM. THE 2603 V/R GBS TYPE V STRAIN (REVERSE 
COMPLEMENT) 

AAOTTGACXSGACACTCCA^GGATCCAACTTTA 

GTAGTGGCTAACGAAGAAGAAGGCGGCdAAAAGAAAAAAATTGTTAA^ 
TGACACCITAACTATTAACAATAAAAAAACAGA 
AATATTC^TATAACCCACTTTTCCAAGACCTAGCACAAAGCT 
GTCGTGCCrAAAGGCCACTACTATCTTGTTGGTGATGACCGAATTGTCT 

SEQ ID NO. 2005: SAG1680 FROM THE M732 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

TTGACGGACACrrCCATGGATCCAACTTTAGCTG^ 

GGCTAACGAAGAAGAAGGCGGCCAAAAGAAAAAAATTGTTAAACGTGTCAT^ 
CCTTAACTATTAACAATAAAAAAACAGAAGAACCTTACCTCAAGGAATAT^ 
TCGTATAACCCACTTTTCXiAAGACCTAGCACAAAGCTCTA 
GCCTAAAGGCCACTACTATCTTGTTGGTGATGACCGA 

SEQ ID NO. 2006: SAG1680 FROM THE M781 GBS TYPE III STRAIN 

TTGA CGGACACTCCATGGAT CCAACTTTAGCTGACAAGGAACAGCTAGT AGTT CTCAAACAAACAAAA^ CAATCGATTCGAT ATTGTA 
GTGGCTAACGAAGAAGAAGGCGGCCAAAAGAAAAAAATTGTTA^ 
C^CCTTAACTATTAACAATAAAAAAACAGAAGAACCTTACCTCAAG 
TATTCGTATAACCCACTTTTCCAAGACCTAGCACIAAAGCTCT 

SEQ ID NO. 2007: SAG1680 FROM THE 1169NT1 ,GBS TYPE V STRAIN (REVERSE 
COMPLEMENT) 

TTGGTAAAGTTGACGGACACTCCATGGATCCAACTTO 

GATATTGTAGTGGCTAACGAAGAAGAAGGCGGCCAAAAGAAAAAAA 

TAAAAATGACACCTTAACTATTAACAATAAAAAAACAGAAGAACCTTACCT 

AGGAAAAATATTCGTATAACCCACTTTTCCAAGACCT^ 

ACC^CTGTOSTGCCTAAAGGCCACrACT 

ATCAACG 

SEQ ID NO. 2008: SAG1680 FROM THE H36b GBS TYPE lb STRAIN (REVERSE COMPLEMENT) 

TTGACGGACACTCCATGGATCCAACTTTAGCTGACAAGGAA 

GTGGCTAACGAAGAAGAAGGCGGC CAAAAGAAAAAAATTGTTAAACGTGT CATTGGTATGCCAGGTGATGTCATCAAATATAAAAATGA 

CACCTTAACrATTAACAATAAAAAAACAGAAGAACCTTACCT^ 

ATTCGTATAACCCACTTTTCCAAGACC^^ 

GTGCCTAAAGGCCACTACTATCTTGTTGGTGATGACCGA 

SEQ ID NO. 2009: SAG1680 FROM THE 090 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

TAAAGTTGACGGAC^CTCCATGGATCCAACTTTAGCTG^ 

TTGTAGTGGCTAACGAAGAAGAAGGCGGCCAAAAGAAAAAA^ 

AATGACACCTTAACTATTAACAATAAAAAAACAGAAGAACCTT^ 

AAAATATTCGTATAACCCACTTTTCCAAGACCTAGCACAAAGCT 

CTGTOSTGCCTAAAGGCCACTATTATCTTGTTGGTGATGACCGAATTOT 
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Table 20: Comparative Sequences relating to SAG1723 (signal peptidase I) 



SEQ XD NO. 2010: SAG1680 FROM THE A909 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

AAAGTTGACXSGACACTCCATGGATCCy^CTTTAG CTGACAAGGAACAGCTAGTAGTTCTCAAACAAACAAAAAT CAATCGATTCGATAT 

TGTAGTGGCTAACGAAGAAGAAGGCGGCCAAAAGA^ 

ATGACACCTTAAOTATTAACAATAAAAAAACAGAAGAACCTT^ 

AAATATTCX3TATAACCCACTTTTCCAAGACCTAGCACAAAGCTOT 

TGTCGTGCCTAAAGGCGACTACTATCTTGTTGGTGATGACCG^ 

CG 



SEQ2001 - - 

SEQ2002 TAAAGTTGACGC^CACTCCATGGATCCAACTTTAGCTGACAAGGAACAGCTAGTAG 

SEQ2003 TTGACGGACACTCCATGGATCCAACTTTAGCTGACAAGGAACAGCTAGTAG 

SEQ2004 AAGTTGACGGACACTCCATGGATCCAACTTTAGOTGACAAGGAACAGCT 

SEQ2005 : TTGACGGACACTCCATGGATCCAACTTTAGCTG 

SEQ2006 TTGACGGAGA-CTCCATGGATCCAACTTTAGCTGACAA^ 

SEQ2007 TGGTAAAGTTGACGGACACTCC^TGGATCCAACITTAG 

SEQ2 008 TTGACGGACACTCCATGGATCCAACTTTAGCTGACAAGG^^ 

SEQ2009 TAAAGTTGACGGACACTCCATGGATCCAACTTTAGCTGACAAGGAA 

SEQ2010 AAAGTTGACGGACACTCCATGGATCCAACTTTAGCTGACAAGGAACAGCTAGTAG 

% SEQ2001 , ATCX^TTCGATATTGTAGTGGCTAACGAATSAAGAAGGCG 

* SEQ2002 TCTCAAACAAACAAAAATCAATCGATTCGATATTGTAGTGGCTAACGAAGAAGAAGGCG 

SEQ2003 TCTCAAACAAACAAAAATCAATCGATTCGATATTGTAGTGGCTAACGAAGAAGAAGG 

SEQ2004 TCTCAAACAAACAAAAATCJ^TCGATTCGATATTGTAGTC 

SEQ2005 TCTCAAACAAACAAAA- - TAATCGATTCGATATTGTAGTGGCTAACGAAGAAGAAGGCG 

SEQ2 006 * TCTCAAAGAAACAAAAATGAATCGATTCGATATTG 

SEQ2007 TCTCAAACAAACAAAAATCAATCGATTCGATATTGTAGTGGCTAACGAAGAAGAAGGCG , 

SEQ2008 TCTCAAACAAAC^UVAAATCAATCGATTCGATATTGTAGTGGCTAACGAAGAAGAAGGCG 

SEQ2 009 TCTCAAACAAACAAAAATCAATCGATTCGATATTGTAGTGGCT 

SEQ2010 TCTCAAACAAACAAAAATCAATCGATTCGATATTGTAGTGGCTAACGAAGAAGAAGGCG 

SEQ2001 GCGAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATGCCAGGTC 

SEQ2 002 GCCAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATGCCAGGTGAT 

SEQ2003 GCCAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATGCCAGGTGATGTCATCAA^ 

SEQ2 004 GCCAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATGCCAGGTGATGTCATCAAATATA 

SEQ2 005 GCGAAAAGAAAAAAATTGTTAAACGTGT(^TTGGTATGCCAGGT 

SEQ2 006 GCCAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATG 

SEQ2 007 GCCAAAAGAAAAAAATTGTTAAACGTGTGATTGGTATGCGAGGTGATGTCATC^ 

SEQ2008 GCCAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATGCCAGGTGATC 

SEQ 2 009 GCCAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATGCCAGGTGATGTCATCAAATATA 

SEQ2010 GCCAAAAGAAAAAAATTGTTAAACGTGTCATTGGTATGCCAGGTGATGTC^ 

SEQ2 001 AAAATGACACCTTAACTATTAACAATAAAAAAACAGAAGAACCTTACCTCAAGGAATATA 

SEQ2 002 AAAATGACACCTTAACTATTAACAATAAAAAAACAGAAGA 

SEQ2003 AAAATGACACCTTAACTATTAACAATAAAAAAACAGAAGAACCTTACCTCA^ 

SEQ2 004 AAAATGACACCTTAACTATTAACAATAAAAAAACAGAAGAACCTTACCTCAAGGAATA 

SEQ2 005 AAAATGACACCTTAACTATTAAGAATAAAAAAAC^ 

SEQ 2 006 AAAATGACACCnTAACTATTAACAATAAAAAAACAGAAGAACCTTACCTCAAGGAATATA 

SEQ2007 AAAATGACACCTTAACTATTAACAATAAAAAAACAGAAGM 

SEQ2 008 AAAATGACACCTTAACTATTAACAATAAAAAAA(^GAAGAACCTTACCTC^AGGAATATA 

SEQ2 009 AAAATGACACCTTAACTATTAACAATAAAAAAACAGAAGAACCTT 

SEQ2 010 AAAATGACAC CTTAACTATTAAGAATAAAAAAACAGAAGAACCTT^ 

SEQ2 001 CTAAATTATTT - AAAAAGGATAAATTACAGGAAAAATATTCGTATAACCGACTTTTCCAA 

SEQ2 002 CTAAATTATTT - AAAAAGGATAAATTACAGGAAAAATATTCGTATAACCCACTTTTCCAA 

SEQ2003 CTAAATTATTT - AAAAAGGATAAATTACAGGAAAAATATTCGTATAACCCACTTTTCCAA 

SEQ2004 CTAAATTATTT - AAAAAGGATAAATTACAGGAAAAATATTCGTATAACCC^CTTTTCC^ 

SEQ2005 CTAAATTATTT - AAAAAGGATAAATTACAGGAAAAATATTCGTATAACCCACTTTTCCAA 

SEQ2 006 CTAAATTATTTTAAAAAGGATAAATTACAGGAAAAATATTCGTATAACCCACTTTTCO^ 

SEQ2007 CTAAATTATTT - AAAAAGGATAAATTACAGGAAAAATATTCGTATAACCCACTTTTCCAA 

SEQ2 008 CTAAATTATTT - AAAAAGGATAAATTACAGGAAAAATATTCX5TATAACCCACTTTTCCAA 

SEQ2009 CTAAATTATTT - AAAAAGGATAAATTACAGGAAAAATATTCGTATAACCCAOTTTTCCAA 

SEQ2010 CTAAATTATTT - AAAAAGGATAAATTACAGGAAAAATATTCGTATAACCCACTTTTCCAA 
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Table 20: Comparative Sequences relating to SAG1723 (signal peptidase I) 



SEQ2001 • GACCTAGCACAAAGCTCTACCGCTTTCACCACTGACAGCAATGGCAGCAGCGAATTTACT 

SEQ2002 GACCTAGCAGAAAGCTCTACCGCTTTCACTACTGACAGCAATGGCAGC^ 

SEQ2003 GACCTAGCAC^VAAGCTCTACCGCTTTCACCACTGACAGCAATGGCAG 

SEQ2004 GACCTAGCACAAAGCTCTACCGCTTTCACCACTGACAGCAATGGCA 

SEQ2005 GACCTAGCACAAAGCTCTACCGCTTTCACC^CTGACAGCAATGGCAGCAGCGAATTTACT 

SEQ2 006 GACCTAGCACAAAGCTCTACCGCTTTCACCACTGACAGCAA 

SEQ2 007 GACCTAGCACAAAGCTCTACCGCTTTCACTACn^CAGCAA 

SEQ2 008 GACCTAGCACAAAGCTCTACCGCTTTCACCACTGA^ 

SEQ2 009 GACCTAGCACAAAGCTCTACCGCTTTCACTACT 

SEQ2010 GACCTAGCACAAAGCTCTACCGCTTTCACCACTGACAGCAATGGC^ 

SEQ2001 CTGTCGTGCCTAAAGGCCZACTACTATCTTGTTGGTGATGACCG 

SEQ2002 * CTGTCGTGCCTAAAGGCCACTATTATCTTGTTGGTGATGACCGAATTGTCTCTAAAGAT 

SEQ2 003 CTGTCGTGCCTAAAGGCCACTAciATCTTGTTGGTGATGACCGAATTGTCTCTAAAGAT 

SEQ2 004 CTGTCGTGCCTAAAGGCCACTACTATCTTGTTGGTGATGACCX3AATTGTCTCTAAAGAT 

SEQ2006 T 

SEQ2007 CTGTCGTGCCTAAAGGCCACTACTATCTTGTTGGTGATGACCGAATTGTCT 

SEQ2008 CTGTCGTGCCTAAAGGCCACTACTATCTTGTTGGTGATGACCGA 

SEQ2009 CTOTCGTGCCTAAAGGCCACT^ 

• SEQ2 001 GTCGTGCCGTCGGTTCCTTCAAAA 

SEQ2002 GTCGTGCCGTCGGTCCCTTCAAAAAATCAACAATTGTGGGAG 

SEQ2003 GTCGTGCCGTCGGTCCCTTCAAiuU^TCAACGATTGTGGGAGAGGT 

SEQ2004 GTCGTGCCGTCGGT 

SEQ2005 

SEQ2006 

SEQ2007 GTCGTGCCGTCGGCCCCTTCAAAAAATCAACG 

SEQ2008 

SEQ2009 GTCGTGCCGTCGGT 

SEQ2 010 GTCGTGCCGTCXSGTCCCTTCAAAAAATC^CGTABCMARATVSTNCSRATNGTSAGSGN 



SEQ2001 

SEQ2002 

SEQ2003 

SEQ2004 

SEQ2005 

SEQ2006 

SEQ2007 

SEQ2008 

SEQ2009 

SEQ2010 TDAS 
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Table 21: Comparative Sequences relating to SAG0079 (adenylate kinase) 

SEQ ID NO. 2101s SAG0079 PROM THE 2603V/R GBS TYPE V STRAIN 

AATCTTTTAATTATGGGTl'TGCCrGGTGCTGGTAAAGGTACT 

ACAGGGGATATGTTCCGCGCOGCAATGGCTAATCAAACCGAAATC 

CCTGATGAAGTAACAAAC^GGATTGTAAAAGAGCGCTTAGCrGAGGATGATAT 

CGTACTATTGAACAAGC^CACGCCTTAGATGCTACGCTT^ 

CCATCATGTCTTATAGAGCGTTTGAGTGGTCXjTATTATCAATCGTAAAACT 

GATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCC^ 

GAACCTATTCTTGAACACTATCGTAAGCTTGGT 

GAAAAAGCGTTG 

SEQ ID NO. 2102 « SAG0079 FROM .THE 090 GBS TYPE "la STRAIN (REVERSE COMPLEMENT) 

AATCTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAG 

ACAGGGGATATGTTCCGOKX^CAATGGCTAA 

CCrGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCT^ 

CX3TACTATTGAACMGCACACGCCTTAGATGCTACGCTTGAAGAACT 

CCATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACT 

GATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCT^ 

GAACCTATTCTTGAACACTATCGTAAGCTTGGTCTTGTTA 

GAAAAAGCGTTGCTAGAACTCAAA 

SEQ ID NO. 2103 : SAGO 07 9 .FROM THE 1169NT1 GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

TGGTAAAGGGACTCAAGCAGCTAAGATTGTTGAAGAATTTGGTGTTC 

TAATCAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGA^ 

AGAGCGCTTAGCTGAGGATGATATCGCAGAAAAAGGTTTT^ 

TGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTA 

TCXSTATTATCAATCGTAAAACTGGTGAAACTTTCC^ 

TGAAGATGATAAGCCTGAAACTGTCAAACX5TCGCTTGGA^ 

tggccttgttacagatattgaaggtaatcaagaaataa • 

seq id no. 2104: sag0079 from the 18rs21 gbs type ii strain (reverse complement) 

aatcttttaaccacggcttcgccrggtcsctggtaaaggtact 
acaggggatatgttccgcgccgcaatggctaatcaaaccga 
cctgatgaagtaacaaacgggattgtaaaagagcgcttagctgaggatgata 
cgtactattgaacaaggacacgccttagatgctaogcttgaagaacta 

CC^TCATGTCrTATAGAGCGTTTGAGTGGTCGTATTATCAATC^ 
GATTATAAAGAAGAAGATTACTATCAACXSTGAAGATGATAAGCCTGAA^ 

GAAAAAGCGTTGCTAGAA 

SEQ ID NO. 2105: SAG0079 FROM THE 2603V/R GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

AATCTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAGGTACTCAAGCAGCTA 

ACAGGGGATATGTTCCGCGCCX3CAATGGCTAATCAAACCGAAATGGGACX 

COTGATGAAGTAACAAACGGGATTGTAAAAGA^ 

C£n?ACTATTGAACAAGCACACGCCTTAGATC 

CCATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTAT 

GATTATAAAGAAGAAGATTACTATCAACXSTGAAGATGATAAGCCT^ 

GAACCTATTCTTGAACACTATCGTAAGCTTGGTCTTGT^ 

GAAAAAGCGTTG 

SEQ ID NO. 2106: SAG0079 FROM THE A909 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

ACAGGGGATATGTT CCGCGCCGCAATGGCTAATCAAAC CGAAATGGGACGTTTAG CTAAAAGTTATATTGATAAAGGTGAATTGGTT 
CCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGAT^ 
CGTACTATTGAACAAGCACACGCCTTAGATGCTACGCITGAAGAA 
CCATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTG 

GATTATAAAGAAGAAGATT ACTAT CAACGTGAAGATGATAAGC CTGAAACTGTCAAACXJTCGCTTGGACGTT AAT ATTGCTCAAGGA 
GAATCTATTCTTGAACACrrATCGAAAGCrTGGTCTTG 

SEQ ID NO. 2107: SAG0079 FROM THE CJB110 GBS NONTYPEABLE STRAIN (REVERSE COMPLEMENT) 

ACAGGGGA^ATGT^ 

CCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCT^ 
CGTACTATTGAACAAGCACACGCCTTAGATGCTACGCTTGAAGAACT^ 

CCATCATGTCTTATAGAGCX3TTTGAGTGGT CGTATTAT CAATCGTAAAACTGGTGAAACTTT CCACAAAGTGTTCAACCCA 
GATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCTGAAACTGT 
■ GAACCTATTCTTGAACACTATAG 
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Table 21: Comparative Sequences relating to SAG0079 (adenylate kinase) 

SEQ ID NO. 2108s SAG0079 FROM THE COH1 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 
ATCTTTTAATTATGGX3TTTGCCTGGTC 

(^GGGGATATGTTCCGCGCCGCAATGGCTAATCAAACCCAAATGGGACGTO 
CTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCOTAGCrG^ 
GTACTATTGAGCAAGCACACGCCTTAGATGCTACXSCTTGAAGAACTAGGACTAa^ 
CAACATGCCTTATAGAGCGTTTGAGTGGCCG 

ATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCTGA 

AACCTATTCTTGAACACTATCGTAAGCTTGGTC^ 

AAAAAG CGTTGCTAG 

SEQ ID NO. 2109s SAGO 07 9 FROM THE H36b GBS TRYP lb STRAIN (REVERSE COMPLEMENT) 

CAGGGGATATGTTCCX3CGCCXXIAATGGCTAATCAAACCGAAATGGGACG 

CTGATGAAGTAACAAACX3GGATTGTAAAAGAGCX3 

GTACTATTGAACAAGCACACGCCTTAGATGCrACGCTTGAAGAAC^ 

CATCATGTCTTATAGAGCGTTTGAGTGGTCGTATTATCAATCX5TAAAACT 

ATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCTGAAACTG^ 

AAAAAGCGTTGCT 

SEQ XD NO. 2110s SAG0079 FROM THE JM9130013 GBS TYPE VIII STRAIN (REVERSE 
COMPLEMENT) 

AATCTTTTAATTATGGGTTTGCCTGGTGCTGGTAAA 
ACAGGGGATATGTTCCGOSCCGCAATGGCTAATCAAACCGAA^ 
CCI^TGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATG^ 
CGTACTATTGAACAAGCACACX5CCTTAGATGCTACGCTTC 

(XIATCATGTCTTATAGAGCGTTTGAGTGGT CGTATTAT CAATCX5TAAAACTGGTGAAACTTT 
GATTATAAAGAAGAAGATTACTATCT^CKSTGAAGATGATAAGCCTGAAA 
GAACCTATTCTTGAAC^CTATAAAAAGCTTGGTCTTGT TACAGATATTGAAGGTAATCA 

SEQ ID NO. 2111s SAG0079 FROM THE M732 GBS TYPE .III STRAIN (REVERSE COMPLEMENT) 

CTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAG^ 

GGGGATATGTTCOSCGCCGCMTGGCrrAATCAAACCCAAATGGGACG 

GATGAAGTAACAAACGGGATTGTAAAAGAGCXSCTTAGCTGAGG^ 

ACTATTGAGCAAGCACACX5CCTTAGATGCTACGCTTGAAGAACTA 

ACATGCCTTATAGAGCGTTTGAGTGGCCGTATTATCAATCGTAAAACTG^ 

TATAAAGAAGAAGATTACTATCAACGTGAAGATGATA^ 

CCTATTCTTGAACACTATCGTAAGCTTGGTCTTGTTACAGATATTGA^ 

AAAGCGTTGCTAGAACTCAAA 

SEQ ID NO. 2112s SAG0079 FROM THE M781 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

AATCTTTTAATTACGGGTTTGCCTGGTGCTGGTAAA 
ACAGG-GGATATGTTCCGCGCCX3CAATGGCTAA 

CCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCGC^ 
CXSTACTATTGAGCAAGCACACGCCrTAGATGCTACGCTTG^ 

CCAACATGCCI^ATAGAGCXyrTTGAGTGGCCGTATTAT CAATCGTAAAACTGGTGAAACTTTCCACAAAGTGTTCAAC CCACCAGTA 
GATTATAAAGAAGAAGATTACTATCAACXSTGAAGATGATAAGCCT^ 



SEQ2 101 ATCTTTTAATTATGGGTTTGCCTGJGTGCTGGTAAAGG 

SEQ2102 ATCTTTTAATTATGGGTTTGCCTGGTGCTGGTA 

SEQ2103 TG GTAAAGGGACTCAAGCAG CTAAGATTGTT 

SEQ2104 ATCTTTTAACCACGGGTTOTCCK^TGCrGG 

SEQ2105 ATCJTTTTAATTATGGGTTTGCC TGGTGCTGGTAAAGGTACTCAAGCAGCTAAGATCGTT 

SEQ2 10 6 ATCTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAGGTACTCAAGCAGCE^ 

SEQ2 107 ATCTTTTAACCACX3GGTTTGCTTGGTGCTGGTAAAGGTACTCAAG 

SEQ2 108 ATCTTTTAATT ATGGGTTTGCCTGGTG CTCG CTAAGATTGTT 

SEQ2109 

SEQ2110 ATCTTTTAATTATGGGTTTGCC TGGTGCTGGT AAAGGTACTCAAGCAGCTAAGAT CGTT 

SEQ2 111 - - CTTTTAATTATGGGTTTGCCTGGTGC 

SEQ2 112 ATCTTTTAATTACGGGTTTGCCTGGTGCTGGTAAAGGTACTCA^ 

SEQ2 101 AAGAATTTGGTGTTGCTCACATCrCAACA 

SEQ2 102 AAGAATTTGGTGTTGCTCACAT CTCAAC^GGGGATATGTTCCGCGCCGCAATGGCTAAT 

SEQ2 10 3 AAGAATTTGGTGTTGCGCACAT CTCAACAGGGGATATGTT CCGCGCCG CAATGGCTAAT 

SEQ2104 AAGAATTTGGTGTTGCTCACAT CT CAACAGGGGATATGTT CCGCGCCGCAATGGCTAAT 

SEQ2105 AAGAATTTGGTGTTGCTCACATCTCAACAGGGGATATGTTCCX3 

SEQ2 106 AAGAATTTGGTGTTGCTCACATCITOUICAGGG 

SEQ2107 AAGAATTTGGTGTTGCTCACATCTCAACAGGGGATATGTT CCGCGCCG CAATGG CTAAT 

SEQ2 10 8 AAGAATTTGGTGTTGCTCACATCrCAAaiGGGGATATGTTC 
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Table 21: Comparative Sequences relating to SAG0079 (adenylate kinase) 



SEQ2109 
SEQ2110 

SEQ2111 
SEQ2112 

SEQ2X0X 
SEQ2102 
SEQ2103 
SEQ2104 
SEQ2105 
SEQ2X06 
SEQ2X07 
SBQ?X08 
SEQ2X09 
SEQ2XX0 
SEQ2XXX 
SEQ2112 

SEQ2101 
SEQ2102 
SEQ2X03 
SEQ2X04 
SEQ2105 
SEQ2106 
SEQ2X07 
SEQ2X08 
SBQ2X09 
SEQ2X10 
SEQ2111 
SEQ2112 

SEQ2101 
SEQ2102 
SEQ2103 
SEQ2104 
SEQ2105 
SEQ2106 
SEQ2107 
SEQ2108 
SEQ2X09 
SEQ2X10 
SEQ2XXX 
SEG2112 

SEQ2X0X 
SEQ2X02 
SEQ2X03 
SEQ2X04 
SEQ2X05 
SEQ2X06 
SEQ2X07 
SEQ2X08 
SEQ2X09 
SEQ2XX0 
SEQ2XXX 
SEQ2XX2 

SEQ2X0X 
SEQ2X02 
SEQ2X03 
SEQ2X04 
SEQ2X05 
SEQ2X06 
SEQ2X07 
SEQ2X08 
SEQ2X09 
SEQ2XX0 
SEQ2XXX 
SEQ2XX2 



CAGGGGATATGTTCCGCGCCGCAATGGCTAAT 

AAGAATTTGGTGTTGCTCACAT CT CAACAGGGGATATGTTCCGCGCCGCAATGGCTAAT 

AAGAATTTGGTGTTGCTCACATCTCAACAGGGGATATGTT^ 
AAGAATTTGGTGTTGCTCACATCTCAACAGGGGAra 

CAAACCGAAATGGGACX3TTTAGCTAAAAGTTATAT^ 

CAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGGTTCCTG^ 
CAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTG^ 
CAAACCGAAATGGGACX3TTTAGCTAAAAGTTATATTGATAAAGGTGAATTG 
CAAACCGAAATGGGACGTTTAG CTAAAAGT1!ATAT1X^TAAAGGTGAATTGGTTCCTGAT 
CAAACCGAAATGGGACGTTTAGCTAAAAGT TATATTGATAAAGGTGAATTGGTTCCTGAT 
CAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGG 

CAAACCCAAATGGGACGTTTAGCTAAAAGTTATAT TGATAAAGGTGAATTGGTTCCTGAT 
CAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGG^ 
CAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGG 
CAAACCCAAATGGGACGTTTAGCTAAAAGTTATATTGATAAAGGTGAATTGGT^ 
CAAACCX^AATGGGACGTTTAGCTAAAAGTTATATTGATAAAG^ CCTGAT 



AAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAG 
AAGTAACAAACGGGATTtjTAAAAGAGCGCTTAGCTGAG 
AAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGAT^ 

AAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATG^ . 

AAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATGATATCG 

AAGTAACAAACGGGATTGTAAAAG^GCGCTTAGCTG^ 

AAGIAACAAACGGGAOTGTAAAAGAGCGCTTAGCTGAGGATGAT^ 

AAGTAACAAACGGGATTGTAAAAGAGCGCra 

AAGTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAGGATG^ 

AAGTAACAAACGGGATTGTAAAAGAGCK^TTAGCTGAGGATGATAT CGCAGAAAAAGGT 
AAGTAACAAAOSGGATTGTAAAAGAGaSCTTAGOT 

TTTTTACTTGATGGATATCCACGTACTATTGAACAAGCACACGCCT 
TTTTTACTTGATGGATATCCACGTACTATTGAACAAGCACACGCCT 
TTTTTACTTGATGGGTATCCACX3TACTATTGAACAAGCA 
TTTTTACTTGATGGATATCCACGTACTATTGAAC^^ 

TTTTTACTTGATGGATATC CACGTACTATTG CTT 

TTTTTACTTGATGGATATCCACXSTACTATTGAACAAG 

TTTTTACTTGATGGATATCCT^CGTACTATTGAACAAGCACACGCCT 

TTTTTACTTGATGGATATCCACGTACTATTGAGCAAG 

TTTTTACTTGATGGATATCCACGTACTATTGAACAAGCACACG^ 

TTTTTACTTGATGGATATCCACGTACTATTGAACAAGCACACX3 

TTTTTACTTGATGGATATCCACGTACTACTGAGCAAGCACACGCCT 

TTTTTACTTGATGGATATCC^CGTACTATTGAGCAAGCACACGCC 

GAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTGGATCCATCATGTCT 

GAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTGGATC 

GAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTGGATCCATCATGTCTT 

GAAGAACTAGGACTA(^CTTAGATGGTGTTATTAATATTA 

GAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTGG^ 

GAAGAACTAGGACTACGCTTAGATGGTGTTATTAATAT TAAAGTGGAT CCATCATGTCTT 

GAAGAACTAGGACTACGCTTAGATGGTGTTAT TAATATTAAAGTGGAT CCATCATGTCTT 

GAAGAACTAGGACTACGCTTAGATGGTGTT ATTAATATTAAAGTGGAT CCAACATGCCTT 

GAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTGGATCCATCATG 

GAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTGGATCCATCATG 

GAAGAACTAGGACTACGCTTAGATGGTGTTATTAATATTAAAGTGGAT 

GAAGAACTAGGACTACGCITAGATGGTGTTATTAATATTA 

ATAGAG CX3TTTGAGTGGTCX5TATTATCAAT CGTAAAACTGGTGAAACTTTCCACAAAGTG 

ATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGAAACTTTCCA 

ATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTOG^ 

ATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGAAACT CACAAAGTG 

ATAGAGCGTTTGAGTGGTCGTATTATCAAT CGTAAAACTGGTGAAACTTTC CACAAAGTG 

ATAGAG03TTTGAGTGGTCGTATTATCAATCGTAA 

ATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGT^AACT 

ATAGAGCXSTTTGAGTGGCCGTATTATCAATCGTAAAACTGGTGAAACT^ 

ATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGAAAC^ 

ATAGAGCGTTTGAGTGGTCGTATTATCAATCGTAAAACTGGTGAAACT 

ATAGAGCGTTTGAGTGGCCCTATTATCAATCGTAAAA 

ATAGAGCXJTTTGAGTGGCCGTATTATCAATCGTAAAACT^ 
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Table 21: Comparative Sequences relating to SAG0079 (adenylate kinase) 



SEQ2101 
SEQ2102 
SEQ2103 
SEQ2104 
SBQ2105 
SEQ2106 
SEQ2107 
SEQ2X08 
SEQ2109 
SEQ2110 
SEp2111 
SEQ2112 

SEQ2101 
SEQ2102 
SEQ2103 
SEQ2104 
SEQ2105 
SEQ2106 
SEQ2107 
SEQ2108 
SEQ2109 
SBQ2110 
SEQ2111 
SEQ2112 

SEQ2101 
SEQ2102 
SEQ2103 
SEQ2104 
SEQ2105 
SEQ2106 
SEQ2107 
SEQ2108 
SEQ2109 
SEQ2110 
SEQ2111 
SEQ2112 

SEQ2101 
SEQ2102 
SEQ2103 
SEQ2104 
SEQ2105 
SEQ2106 
SEQ2107 
SEQ2108 
SEQ2109 
SEQ2110 
SEQ2111 
SEQ2112 



TTCAACCC^CCAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCT 

TTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCT 

TTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATCAACGT^ 

TTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATC^CGTGAAGATGATAAGCCT 

TTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCT 

TTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATC^^ 

TTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAAGCCT 

TTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGATAA 

TTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATCAACGTGJ^ 

TTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAGATGA 

TTCAACCCACC^GTAGATTATAAAGAAGAAGATTACT^ 

TTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTAT^ 

GAAACTGTCAAACGTCGCT TGGACGTTAATATTGCTCM 
GAAACTGTCAAACGTCGCTTGGACGTTAATAl^TC 

GAAACTGTCAAACGTCGCT TGGACGTT CATATTGCTCAAGGAGAACCTATTCTTGAACAC 

GAAACTGTCAAACGTCGCTTGGACGTTAATAl^rGCTCAAGGAGAACCT 

GAAACTGTCAAACGTCGCT TGGACGTTAATATTGCTCAAGGAGAACCTATTCTTGAACAC 

GAAACTGTCAAACX3TCGCTTGGACGTTAATATTGCT 

GAAACTGTCAAACGTCGCTTGGACGTTAATATTGCTC^GGAGAACCT 

GAAACTGTCAAACGTCGCTTGGACGTTAATATTGCTCAAGGAGAACCTATO 

GAAACTGTCAAACX5TCGCTTGGACGTTAATATTGCTCAAGGAGAATCT 

GAAACTGTTAAACGTCGCTTGGACGTTAATATTGCTCAAG 

GAAACTGTCAAACGTCGCTTGGACGTTAATATTGCTC^ 

GAAACTGTCAAACX5TCGCn^rcGACX3TTAATATTG CTCAATAB CMARATVSTNCS R AT 

ATCGTAAG CTTGGTCTTGT TACAGATATTGAAGGT AAT CAAGAAAT AACAGAAGT TTTT 

ATAGTAAGCTTGGCCTTGTTACAGATAT^ 

ATCGTAAGCTTGGTCTTGTTACAGATATTGAAGGTAATCAAGAAATAACAGAAG 
ATCGTAAGCTTGGTCTTGTTACAGATATTGAA 

ATCGAAAGCTTGGTCTTGT TACAGATATTGAAGGTAA 

ATAG = 

ATCGTAAGCTTGGTCTTGTTACAGATATTGAAGGTAATCAAGAA^ 
ATCGTAAGCTTGGTC1TGTTACAGATATTGAAGGTAATCAAGAAATAACA 

ATAAAAAGCTTGGTCTTGT TACAGATATTGAAGGTAATCA 

ATCGTAAGCTTGGTCTTGTTACAGATATTGAAGGTAAT CAAGAAATAA CAGAAGTTTTT 
GTSAGADNYATKNAS - - 

CAGATGTTGAAAAAGCGTTG 

CAGATGTTGAAAAAG CGTTGCTAGAACTCAAA 



CAGATGTTGAAAAAGCGTTGCTAGAA • 
CAGATGTTGAAAAAGCGTTG 



CAGATGTTGAAAAAGCGTTGCTAG 
CAGATGTTGAAAAAGCGTTGCT - - 



CAGATGTTGAAAAAGCGTTGCTAGAACTCAAA 
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Table 21: Comparative Sequences relating to SAG0079 (adenylate kinase) 



>SEQ ID NO 2150x090 frame i 1 
NLLIMGLPC^GKGTQAAKIVEEFGVAHISTGD 

EVTNG I VKERLAEDD I AEKG FLLDGY PRT I EQAHALDATL EELGLRLD GVI NI KVD P S CL 
IERLSGRI XNRKTGETFHKVFNPPVDYKEEDYYQREDDKP ILEH 
YRKLGLVTD I EGNQE I TEVFADVEKALLELK 

>SEQ ID NO 2151:114_1169NT £ranet 2 

GKGTQAAKIVEEFGVAHISTOTMFRAAMANQTENGRLAI^ 
LAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGIJ^ 

RKTGETPHKVFNPP VD YKEEDY YQREDDKPETVKRRLDVHI AQGEP ILEHYS KLGIjVTD I 
EGNQEI 

>SEQ ID NO 2152s 114_18RS21 frames 1 

i^ttgspgagkgtqaaktveefotahistgdmfrjOvmanqt 

EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHAIiDA 

IERLSGRI INRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRIjDVOT 

YRKLGLVTDI EGNQE I TEVFADVE KALLE 

>SEQID JK> 2153s 114_2603 frames 1 

NIiLIMGLPGAGKGTQAAKIVE^FGVAHISTGDMFRAAMANQTEMGRIiAKSYIDKGELVPD 
. EVTNGI VKERLAEDD IAEKGFLLDG YPRT I EQAHALDATL EELQLRLDGV I NT KVDPS CL 
IERLSGRI INRKTGETFHKVFNPPVDYKEEDYTQREDDKPETVKRRI^ I LEH 

YRKLGLVTD I EGNQE I TEVFADVEKAL 

>SEQ ID NO 2154: 114_A?09 frames 1 

NLLIMGLPGAGKGTQAAKIVEEF'^AHISTGDMFRAAMANQTEMGRIA 
EVTNGIVKERIiAEDDIAEKGFIiIiDGYPRTIEQAHALDAT^ 

IERLSGRI INRKTGETFHKVFNPPVD YKEEDYYQREDDKPETV^ ILEH 
YRKLGLVTD I EG * 

>SEQ ID NO 2155:114_A909 frames 1 

NLL IMGLPGAGKGTQAAKI VEE FGVAH I S TGDMFRAAMANQTEMGRLAKS YIDKGELVPD 
9 , EVTNGI VKERLAEDDIAEKGFLLDGYPRTI EQAHALDATLEELGLRLD GVI NI KVDPSCL 
IERLSGRI INRKTGET FHKVFNP PVDYKEEDYYQREDD KPETVKRRLDVNIAQGE S I LEH 
YRKLGLVTDI EG 

>SEQ ID NO 2156s 114_CJB110 frames 1 

NLLTTGLLGAGKGTQAAKIVEEFGVAHI STGDMFRAAMANQTEMGRLAKS YIDKGELVPD 
EVTNGIVKERLAEDDIAEKGFLIJ3GYPRTIEQAHAIJDATLEELGLRLDGVINI KVDPSCL 
IERLSGRI INRKMETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGEPILEH 
Y 

>SEQ ID NO 2157s 114_COHl frames 3 

LLI MGLPGAGKGTQAAKTVEEFGVAHI STGDMFRAAMANQTQMGR 

VTNGIVKERIiAEDDIAEKGFIiLDGYPRTI EQAHALDATLEELGLRLDGVINIKVDPTCLI 
ERLSGRI INRKTGET FHKVFNP P VDYKE ED YYQREDDKPETVKRRLDVNIAQGEP I LEHY 
RKLGLVTD I EGNQE I TEVFADVEKALL 

>SEQ ID NO 2158s 114_H36B frames 3 

GDMFRAAMANQTEMGRLAKSYIDKGELVPDEVTNGIVKERLAEDDIAEKGFL 
EQAHALDATLEELGLRLDGVINI KVDP S CL IERLSGRI INRKTGETFHKVFNP P VDYKE E 
DYYQREDDKPETVKRRLDVNIAQGES ILEHYRKLGLVTDIEGNQE I TEVFADVEKAL 

>SEQ ID NO 2159s 114_JM9130013 frame: 1 

NLLIMGLPGAGKGTQAAKIVEEFGVAHISTGJ3MFRAAMANQTEMGRLAKSYIDKGELVPD • 
EVTNGI VKERIjAEDDIABKGFLLDGYPRTI EQAHALDATLEELGLRLDGVINI KVDPSCL 
IERLSGRI INRKTGET FHKVFNP PVDYKEEDYYQREDDKPETVKRRLDWIAQGEP I LEH 
YKKLGLVTD I EGN 

>SEQ ID NO 2160sll4_K732 frames 1 

LL I MGLPGAGKGTQAAKTVEEFGVAHI STGDMFRAAMANQTQMGRLAKS YIDKGELVPDE 
VTNGIVKERLAEDD IAEKGFLLDG YPRTIEQAHALDATLEEliGLRLDGVINI KVDPTCL I 
ERLSGRI INRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQ^ 
RKLGLVTDIEGNQEITEVFADVEKALLELK 

>SEQ ID NO 2161: 114JM781 frames 1 

NLL I TGLPGAGKGTQAAKI VEEFGVAH I STGDMFRAAMANQTQMGRLAKS YIDKGELVPD 
EVTNGI VKERLAEDDIAEKGFLLDGYPRTI EQAHALDATLEELGLRLDGVINI KVDPTCL 
I ERLSGRI I NRKTGET FHKVFN P P VDYKE ED YYQR EDDKP ETVKRRLDVNIAQ 
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Table 21: Comparative Sequences relating to SAG0079 (adenylate kinase) 



SEQ2 15 0 LL IMGLPGAGKGTQAAKI VEEFGVAHI STGDMPRAAMANQTEMGHLAKS YIDKGELVPD 

SKQ2151 GKGTQAAKI VEEFGVAHI STGDMFRAAMANQTEMGRLAKS YIDKGELVPD 

SEQ2152 LLTTGS PGAGKGTQAAKI VEE FGVAHI STGDMFRAAMANQTEMGRLAKS YIDKGELVPD 

SEQ2153 LL I MGLPGAGKGTQAAiCI VEEFGVAHI STGDMFRAAMANQTEMGRLAKS YIDKGE^ 

SEQ2154 LLI MGLPGAGKGTQAAKI VEEFGVAHI STGDMFRAAMANQTEMGRLAKS YIDKGELVPD 

SEQ2155 IjL I MGLPGAGKGTQAAKI VEEFGVAHI STGDMFPJ^MANQTEMGPJLAKS YIDKGELVPD 

SEQ2 15 6 LLTTGLLGAGKGTQAAKIVEEFGVAHISTGDMFRAAMAWQTEMGRLAKS YIDKGELVPD 

SHQ2157 LLIMGLPGAGKGTQAAiaVEEFGVAHISTGDMFRAAMANQT.QMGPJLAKSYIDKGELVPD 

SEQ2 15 8 . — GDMFRAAMANQTEMGRLAKS YIDKGELVPD 

SEQ2 15 9 LLI MGLPGAGKGTQAAKI VEE FGVAHI STGDMFRAAMANQT EMGRLAKSYI DKGELVPD 

SEQ2 16 0 LLI MGLPGAGKGTQAAKI VEEFGVAHI STGDMFRAAMANQTQMGRLAKS YI DKGELVPD 

SKQ2161 LL I TGL PGAGKGTQAAKI VEEFGVAHI S TGDMFRAAMANQTQMGRLAKS YI DKGELVPD 

SEQ2150 EVTNG I VKERLAEDD IAEKGFLLDGYPRTI EQAHALDATLEELGLRLDGVI NI KVDPS CL 

SEQ2151 QVTNG I VKE,RIiAEDD I AEKGFLLDGYP RTI EQAHALDATLEELGLRLDGVI NI KVDPS CL 

SEQ2 152 EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEQAHALDATLEELGL 

SEQ2153 EVTNGIVKERLAEDDIAEKGFI^GYPRTIEQAHALDATLEELGLRIJ3GVINIKVDPSCL 

SEQ2154 EVTNGI VKERIiAEDDIAEKGFLLDG YPRTI EQ AHALDATLEELGLRLDGVI NI KVDPS CL 

SEQ2155 EVTNGI VKERLAEDD I AEKGFLLDGYPRTI EQAHALDATLEELGLRliDGVINI KVDPSCL 

SEQ2156 EVTNGIVKERIiAEDDIAEKGFLLDGYPRTIEQAHAIiDATLEELGLRi^ 

SEQ2 157 EVTNGI VKERLAEDDI AEKGFLLDGYPRTI FiQAHALDATLEELGLRLDGVI NI KVDPTCL 

SEQ2158 EVTNGIVKERLAFjDDIAEKGFLLDGYPRTIEQAHALDATLEELGLRIjDGVIN^ 

SEQ2159 EVTNG I VKERLAEDD I AEKGFLLDGYPRTI EQ AHALDATLEELGLRLD GVT NI KVDPS CL 

SEJQ2160 EVTNGIVKERLAEDDIAEKGFLLDGYPRTIEX2AHALDATLEELGLRLDGVINIKTOPTCL 

SEQ2161 EVTNGI VKERIiAEDDIAEK&LIiDGYPRTI EQAHALDATLEELGLRLDGVI NI KVDPTCL 

SEQ2 15 0 I ERLSGRI INRKTGETFHKVFNP PVD YKEED YYQREDDKPETVKRR^ P ILEH 

SEQ2151 I ERLSGRI INRKTGETFHKVFNP P VD YKEEDY YQREDDKPETVKRRLDVHIAQGEP I LEH 

SEQ2 152 I ERLSGRI INRKTGETFHKVFNP PVDYKEED Y YQREDDKP ETVKRRLDVNIAQGEP I LEH 
SEQ2153 * IERLSGRI INRKTGETFHKVFNPPVD YKEED YYQREDDKPE^ 

SEQ2154 IERLSGRI INRKTGET FHKVFNPPVDYKEED YYQREH5DKP ETVKRRiDVNI AQGES I LEH 

" SEQ2155 IERLSGRI INRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVK^ ILEH 

SEQ2156 * IERLSGRI INRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVK^ 

SEQ2157 I ERLSGRI INRKTGETFHKVFNPPVD YKEED YYQREDDKPETVKRRLDWIA 

SEQ2158 IERLSGRI! INRKTGET FHKVFNP PVD YKEED YYQREDD KP ETVKP^RLDWIA^ I LEH 

SEQ2159 I ERLSGRI INRKTGETFHKVFNPPVD YKEED YYQREDDKPETVKRRLDVNI AQGEP ILEH 

SEQ2160 IERLSGRI INRKTGETFHKVFNP PVDYKEEDYYQREDDKPETVKRRIiDVNIAQGEPI LEH 

SEQ2161 IERLSGRI INRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQ 

SKQ2150 RKLGLVTD I EGNQE ITEVFADVEKALLELK 

SEQ2151 S KLGL VTD I EGNQ E I 

SEQ2152 RKLGLVTD I EGNQE ITEVFADVEKALLE - - 

SEQ2153 RKLGLVTD I EGNQE I TEVFADVEKAL 

SEQ2154 RKLGLVTD I EG 

SEQ2155 RKLGLVTDI EG 

SEQ2156 

SEQ2157 RKLGLVTDIEGNQEITEVFADVEKALL- - - 

SEQ2158 RKLGLVTD I EGNQE I TEVFADVEKAL 

SEQ2159 KKLGLVTD I EGN 

SEQ2 16 0 RKLGLVTDI EGNQE ITEVFADVEKALLELK 



SEQ2161 
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Table 22: C mparative Sequences relating to SAG0093 
(D-alanyl-D-alanine carboxypeptidase family protein) 

SEQ ID MO. 220Xi SAG0093 FROM THE 090 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

AAGCCTAACAGTCAACAATCATCATCTCAAAAGTTG^ 

CAATTAtXAGCTGTATCATCAAAAGATTGGAACTTGATTT^^ 

CCTGTTGAAAATATTTATTTGGATAAACGTATTACGAAGCAAGCTACTCAGTTT 

CATTTAATTTCGGGTTATCCTACTGTTGCCTATCA 

TK^CGAGGGGACAAGCAGAAAAGTTGOTAAAAA 

ATGAGTACTGTAGATTCTTTGAATGAGAGCGATCCTAGAGTAGTC^ 

CXMTTTCCGGATOGTAAAACAGCAGAAACAGKSGGTAGGT^ 

ATGGCCAAACATCATTTAAC^TTAGAAGAA^ 

SEQ ID NO. 2202s SAG0093 FROM THE 1169NT1 GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

AAGCCTAACAGTCAACAATCATCACCTCAAAAGTTGAG^ 

CGAITACCAGCTGTATCATCAAAAGATTGGAACTT^ 

CCTGTTGAAAATATTTATTTGGATAAAttnM 

CATTTAATTTCGGGTTATCGTAGTGTTGCCTATCAGX^ 

TTGACGAGGGGACAAGCAGAAAAGTTGGTiU^AAACTTACT 

ATGAGTACTGTAGATTCTTTGAATGAGAGCGATCCTAGAGTAGTC^ 

CGGTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGAT^ 

ATGGCCGAACATCGTTTAACATTAGAAGAATACATAACTTTATTAAAGGAGAATAAC 

SEQ ID NO. 2203: SAG0093 FROM THE 18RS21 GBS TYPE II STRAIN 

AAGCCTAACAGTCAACAATCATCATOTCAA 

CAATTACCAGCTGTATCATCAAAAGATTGGAACTTGATTT^ 

CCTGTTGAAAATATTTATTTGGATAAACGTATTACGAAGC^ 

CATTTAATTTCGGGTTATCGTAGTGTTGCCTATCAG 

TTGAO^GGGGACAAGCAGAAAAGTTGGTAAAAACTTACT 

AT^GTACTGTAGATTCTTTGAATGAGAGCGATCCTAGAGTAG 

CGGTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTT^ 

ATGGCCAAACATCATTTAACATTAGAAGAATACATAAC^^ 

SEQ ID NO. 2204s SAG0093 FROM THE 2603V/R GBS TYPE V STRAIN 

ACAGTCAACAATCATCATCTCAAAAGTTGAGGAATGAG 

CAGCTGTATCATCAAAAGATTGGAACTTGATTTTGGTCAATC^ 

AAAATATTTATTTGGATAAACGTATTAQ3AAGCAAGCTACT 

TTTCGGGTTATCX3TAGTGTTGCCTATCAGGAGAAGTTGTTCAATTCTT 

GGGGACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCT 

CTGTAGATTCTTTGAATGAGAGCGATCCTAGAGTAGTCAGTCAGT^ 

CGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGC^ 

AACATCATTTAACATTAGAAGAATACATAACTTTATTAAAGGAGAAT^ 

SEQ XD NO. 2205s SAG0093 FROM THE A909 GBS TYPE la STRAIN 

AAGCCTAAGAGTCAACAATCATCATCTCAAAAGTTGAGGA^ 

CX^TTACXIAGCTGTATCATCAAAAGATTGGAACTTC^ 

CXrrGTTGAAAATATTTATTTGGATAAAaSTATTAC^ 

CAT^AATTTCGGGTTATCGTAGTGTTGCCTATCAGGAGAAGTO 

TTGACIGAAGGAACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTC 

ATGAGTACTGTAGATTCTTTGAATGAGAGCGATCCTAGAGTAGTCACT 

QMTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGAl^ 

ATGGCCAAACATCATTTAACATTAGAAGAATAC^TAACTTT 

SEQ ID NO. 2206s SAGO 093 FROM THE CJB110 GBS NONTYPEABLB STRAIN 

AAGCCTAACAGTGAACAATCATCATCTCAAAAGTTGAGGAATGAGGATAT^ 

ACAATTACCAGCTGTATCATCAAAAGATTGGAACTTGATT^ 

TCCTGTTGAAAATATTTATTTGGATAAACGTATT^ 

ACATTTAATTTCGGGTTATCGTAGTGTTGCCTATCAGGAGAAGTTGTTC^ 

TTTGACGAGGGGACAAGCAGAAAAGTTGGTAAAAACTTACTC^ 

TATGAGTACTXMAGATTCTTTGAATGAGAGa^ 

AO^TTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGA^ 

TATGGCCAAACATCATTTAACATTAGAAGAATACA 
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Table 22: Comparative Sequences relating to SAG0093 
(D-alanyl-D-alanine carboxypeptidase family protein) 

SEQ ZD NO. 2207 1 SAG0093 FROM THE COB1 GBS TYPE IZX STRAIN 

CCTAACAGTCAACAATCATCATCTCAAAAGTTGAGGAATGAGGATATAA 
ATTACCAGCTGTATCATCAAAAGATTGGAACTOGATTTTGGTC^ 
TGTTGAAAATATTTATTTGGATAAACGTATTACGAAGCAAGCTAC^ 
TTTAATTTCXaGGTTATCXrTAGTGTTGCCTATCA 

GACGAGGGGACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTGCAG^ 
GAGTACTGTAGATTCTTTGAATGAGAGCX^ 
GTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGOT 
GGTCAAACATCATTTAACATTAGAAGAATACATAACT^^ 

SEQ ID NO* 2208s SAGO 093 FROM THE H36b GBS TYPE Xb STRAIN - 

AAGCCTAA CAGTCAACAAT CATCATCTCAAAAGTTGAGGAATGAGGATATAAAAAAGACATC CTCT 

CGATTACCAGCTGTATGATCAAAAGATTGGAACT 

CCTGTTGAAAATAIOTATTTGGATAAACGTATTACGAAGCA^ 

CATTTAATTTCGGGTTATCGTAGTGTTGCCTATC^GGAG 

TTGACGAAGGAACAAGCAGAAAAGTTGGTAAAAACTT^ 

ATGAGTACTGTAGATTCTTTGAATGAGAGCGAT^ 

CGGTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGATTC 
ATGGCCAAACATCATTTAACATTAGAAGAATACATAACTT^ 

SEQ ID NO. 2209 s SAG0093 FROM THE JM91300X3 GBS TYPE VIII STRAIN 

AAGCCTAACAGTCAACAATCATCATCTCAAAAGTTC 

CAATTACCAGCTGTATCATCAAAAGATTGGAACi^GATOT 

CCTGTTGAAAATATTTATTTGGATAAACGTATTACGAA 

CATTTAATTTCGGGTTATCGTAGTGTTGCCTATCAG^ 

TT(^C^GGG(^CAAG CAGAA AAGTTCGTAAAAAC^ 

ATGAGTACTGTAGATTCTTTGAATGAGAGCGATCCT 

ATGGCCAAACkTCATTTAACATTAGA TGGGGTAGAGTCTGCAAAATAT 

SEQ JD NO. 2210: SAG&093 FROM THE M732 GBS TYPE III STRAIN 

AGCCEAACACTCAAC2AATCATCATCTCAAAAGTTGAGGAATGA 

GATTACCAGCTGTATCATCAAAAGATTGGAACTTGA 

CTGTTGAAAATATTTATTTGGATAAACX5TATrACGAAGCAAGCTACI^ 

ATTTAATTTCGGGTTATCGTAGTGTTGCCTATCAGGAGAAGTTGT^ 

TGACGAGGGGACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTC 

TGAGTACTGTAGATTCTTTGAATGAGAGCGATCCKIGA 

GGTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCA 

TGGTCAAACATCATTTAACATrAGAAGAATACATAACTTrATT^ 

SEQ ID NO. 22X1: SAG0093 FROM THE M781 GBS TYPE III STRAIN 

AAGCCTAACAGTCAACAATCATCATCTCAAAAGTTGAGGA 

CGATTACCAGCTCTATCATCAAAAGATTGGAACTTGA 

CCTGTTGAAAATATTTATTTGGATAAACX3TATT^ 

CATTTAATTTCGGGTTATCGTAGTGTTGCGTATC^ 

TTGACGAGGGGACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTC 

ATGAGTACTGTAGATTCTTTGAATGAGAGCGATCCTAGA 

CGGTTTCCGGATGGTAAAACAGCAGAAACAGGGGTAGGTTATGAAGA 

ATGOTCAAACATCATTTAACATTAGAAGAATACATAACTTTA^ 



SEQ22 0 1 AGCCTAACAGTCSUICAATCATCATCTCAAAAGTTGAGGAATGAGGATA 

SBQ2202 AGC CTAACAGTCAACAATCATCACCTCAAAAGTTGAGGA^ 

SEQ2203 AG CCTAACAGTCAACAATCATCATCTCAAAAGTTGAGGA^ 

SEQ2204 ACAGTCAACAATCATCATCnX^AAAAGTTGAGGAATGA 

SEQ2205 AGCCTAACAGTCAACAATCATCAT CTCAAAAGTTGAGGAATGAGGATATAAAAAAGACA 

SEQ22 0 6 AGCCTAACAGTCAAC^TCATCATCTCAAAAGTTGA 

SEQ22 07 - - CCTAACAGTCAACAATCATC^TCTCAAAAGTO 

SEQ2208 AGCCTAACAGTCAACAATCATCATCTCAAAAGTTGAGGAATGAGGATO 

SEQ2 209 AGCCTAACAGTCAACAATCATCATCTCAAAAGTTGAGGAATGAGGA 

SEQ22X0 AGCCHAACAGTCAACAATCATCATCTCAAAAGTTG^ 

SEQ221X AGCCTAACAGTCAACAATCATCATCTCAAAAGTTG^ 
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Table 22: Comparative Sequences relating to SAG0093 
(D-alanyl-D-alanine carboxypeptidase family protein) 



SEQ2201 
SEQ2202 
SEQ2203 
SEQ2204 
SEQ2205 
SEQ2206 
SEQ2207 
SEQ2208 
SEQ2209 
6EQ2210 
SEQ2211 

SEQ2201 
SEQ2202 
SKQ2203 
SEQ2204 
SEQ2205 
SEQ2206 
.SEQ2207 
SEQ2208 
SEQ2209 
SEQ2210 
SEQ2211 

SEQ2201 
SEQ2202 
SEQ2203 
SEQ2204 
SEQ2205 
SEQ2206 
SEQ2207 
SEQ2208 
SEQ2209 
SBQ2210 
SEQ2211 



TCCTCTCAAAAAAGAAAT - AAGAAATT - ACAATTA CCAGCTGTATCAT CAAAAGATTGGA 
TCCTCTCAAAAAAGAAAT - AAGAAATT - ACGATTACCAGCTGTATCATCAAAAGATTGGA 
TCCTCTCAAAAAAGAAAT - AAGAAATT -AQUVTTACCAGCTCTATCATCAAAAGATTGGA 
TCCTCTCAAAAAAGAAAT - AAGAAATT - ACAATTACCAGCTGTATCATCAAAAGATTGGA 
TCCTCTCAAAAAAGAAAT - AAGAAATT -ACGATTACCAGCTGTATCATCAAAAGATTGGA 
TCCTCTCAAAAAAGAAAT-AAGAAATTTACAATTACCAGCTGTATCATCAAAA(^ 
TCCrrCTCAAAAAAGAAATTAAGAAATT - ACGATTACC^GCTGTATCATCAAAAGATTGGA . 
TCCTCTCAAAAAAGAAAT - AAGAAATT -ACX^TTACCAGCTGTATCATCAAAAGATTGGA 
TCCTCTCAAAAAAGAAAT -AAGAAATT -ACAATTACCAGCTGTATCATCAAAAGATTGGA 
TCCTCTCAAAAAAGAAAT -AAGAAATT - ACGATTACCAGCTGTATCAT CAAAAGATTGGA 
TCCTCTCAAAAAAGAAAT -AAGAAATT - ACGATTACC^GCTGTATCATCAAAAGATTGGA 

ACTTGATTTTGGTCAATCGTGACCATAAACATGAA^ 

ACTTGATTTTGGTCAATCGTGACXATAAACATGAAGAATTAAGTCC^ 

ACTTGATTTTGGTCAATCGTGACXZATAAACATGAAGAATTA 

ACTTGATTTTGGTCAATTOTGACCATAAAC^TGAAGAATT 

ACTTGATTTTGGTCAATCGTGACCATAAACATC 

ACTTGATTTTGGTGAATCGTGACCATAAACATGAAGAAOT 

ACTTGATTTTGGTCAATCGTGACXZATAAAC^T^ 

ACTTGATTTTGGTCAATCGTGACCATAA^ 

ACTTGATTTTGGTCAATCGTGACCATAAACATGAAGAATTAAGTCCA 

ACTTGATTTTGGTCAATCGTGACCATAAACATGAAGAATTA 

ACTTGATTTTGGTCAATCGTGACCATAAACATGAAGAAOT 

TTGAAAATATTTATTTGGATAAACGTATTAOS^ 

TTGAAAATATTTATTTGGATAAACGTATTACGAAG CAAGCTACTCAGTTTTTAGAGGCTG 

TTGAAAATATTTATTTGGATAAACGTATTACGAA 

TTGAAAATATTTATTTGGATAAACX3TATTAQ3AAGCAAG 

TTGAAAATATTTATTTGGATAAAO^TO 

'TTGAAAATATTTATTTGGATAAACXS^ 

TTGAAAATATTTATTTGGATAAACGTATTA(X3AAGCAAGCTACT 
TTGAAAATATTTATTTGGATAAACGTATTACXaAAGCAAGCTACT 
TTGAAAATATTTATTTGGATAAACX3TATTACX3AAGCAAGCTA^ 
TTGAAAATATTTATTTGGATAAACGTATTACGAAGCAAGCTA 

TTGAAAATATTTATTTGGATAAACGTATTACGAAG CAAGC TACTCAGT TTTTAGAGGCTG 



SEQ2201 
SEQ2202 
SBQ2203 
SEQ2204 
SEQ2205 
SEQ2206 
SBQ2207 
SEQ2208 
SEQ2209 
SEQ2210 
SBQ2211 

SEQ2201 
SEQ2202 
SEQ2203 
SBQ2204 
SEQ2205 
SEQ2206 
SEQ2207 
SEQ2208 
SEQ2209 
SEQ2210 
SBQ2211 



CTAGAGCAATTGATTCACGAGAACATTTAATTTC 

CTAGAGCAATTGATTCACGAGAACATTTAATTTCGGGTTATCGTAGTGTTGCCT 

CTAGAGCAATTGATTCACGAGAACATTTAATTTCGGGTTATCGT^ 

CTAGAGCAATTGATTCACX3AGAACATTTAATTTCGGGTTATCG 

CTAGAGCAATTGATTCACX3AGAACATTTAATTTCGGGTTATCX3TAGTGTTGC 

CIAGAGCAATTGATTCACGAGAACATTTAATT^ 

CTCAGAGCAATTGATTCACGAGAACATTTAAT^ CGTAGTGTTGCCTATCAGG 

CTAGAGCAATTGATTCACGAGAACATTTAATTTCGGGT^ 

CTAGAGCAATTGATTCACGAGAACATTTAATTTCX3GCT 

CTAGAGCAATTGATTCACGAGAACATTTAATTTCGGG^ 

CTAGAGCAATTGATTCACGAGAACATTTAATTTCXK^ 

AGAAGTTGTTCAATTCTTATGTTACTCAAGAGATGACTAGTA^ 

AGAAGTTGTTCAATTCTTATGTTACTCAAGAGATGACTAGTA^ 

AGAAGTTGTTCAATTCTTATGTTACTCAAGAGATGACTAGTAACCCT^ 

AGAAGTTGTTCAATTCTTATGTTACTCAAGAGATGACT 

AGAAGTTGTTCAATTCTTATGTTACTCAAGAAATGACTAG^ 

AGAAGTTGTTCAATTCTTATGTTACTCAAGAGATGACTAGTAAC^ 

AGAAGTTGTTCAATTCTTATGTTACTCAAGAGATGACT 

AGAAGTTGTTCAATTCTTATGTTACTC^WGAAATGACTAGTAAC^ 

AGAAGTTGTTCAATTCTTATGTTACTCAAGAGATGACTAGTAAC^ 

AGAAGTTCTTCAATTCTTATGTTACTCAAGAGATGACTA 

AGAAGTTGTTCAATTCTTATGTTACTCAAGAGATG^ 
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Table 22: Comparative Sequences relating to SAG0093 
(D-alanyl-D-alanine carboxypeptidase family protein) 



SEQ2201 

SEQ2202 

SEQ2203 

SEQ2204 . 

SEQ2205 

SEQ2206 

SEQ2207 

SEQ2208 

SEQ2209 

SEQ2210 

SEQ2211 

SEQ2201 
SEQ2202 
SEQ2203 
SEQ2204 
SEQ2205 
SEQ2206 
SEQ2207 
SBQ2208 
SEQ2209 
SEQ2210 
SBQ221X 

SEQ2201 
SKQ2202 
SEQ2203 
SEQ2204 
SEQ2205 
SEQ2206 
SEQ2207 
SBQ2208 
SBQ2209 
SEQ2210 
SEQ2211 

SEQ2201 
SBQ2202 
SEQ2203 
SEQ2204 
SEQ2205 
SEQ2206 
SEQ2207 
SEQ2208 
SEQ2209 
SEQ2210 
SEQ2211 

SEQ2201 
SEQ2202 
SEQ2203 
SEQ2204 
SEQ2205 
SEQ2206 
SEQ2207 
SEQ220 8 
SEQ2209 
SEQ2210 
SEQ2211 



ACAAGGAGAAAAGTTGGTAAAAACTTA CT CTCAGC CTGCAGGTGCTAGTGAACACCAGA 
ACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTGCAGGTGCTAG 
AC^GC^GAAAAGTTGGTAAAAACTTACTCTCAGCCTGCAGGTGCTAGTGAACACGAGA 
ACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTC 

ACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTGCAGGTGCTAGTGAACACCA^ 

ACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTGC^ 

ACAAGCAGAAAAGTTGGTAAAAACTTACTCTC^GCCTGCAGGTGCTA 

ACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTCCAGGTGOT 

ACAAGC^GAAAAGTTGGTAAAAACnTACI^TCAGCCTGCAG^ 

ACAAGCAGAAAAGTTGGTAAAAACTTACTCTCAGCCTC 

ACAAGGAGAAAAGTTGGTAAAAACTTACTCTCAGCCTGCAGGTGCT^ 

CTG^TTAGCGATGGATATGAGTACTGTAGA^CTTTGAATGAGAGCGA 
CTGGATTAGCGATGGATATGAGTACIGTAGATTCTT^ 

CTGGATTAGCGATGGATATGAGTACTGTAGATTCT CGATCCTAGAGTAG 

CTGGATT AGCG ATGGATAT GAGTA CTGTAGATT CTTTGAATGAGAG CGAT C CTAGAGT AG 

CTGGATTAGCGATGGATATGAGTACTGTAGATTCITTGAATC^ 

CTGGATTAGCGATGGATATGAGTACrTGTAGATTCTTTGAATGA 

CTGGATTAGCGATGGATATGAGTACrGTAGATTCT^ 

CTGGATTAGCGATGGATATGAGTACTGTAGATTCTTTGAATGAGA 

CTGGATTAGCX^TGGATATGAGTACTGTAGATTCTTTC 

CTGGATT AGCGATGGATATGAGTACTGTAGATT (J T T'l'GAATGAGAG CGAT C CTAGAGTAG 
CTGGATTAG CGATGGATATGAG TACTGTAGATTC J i w I u i l GAATGAGAG CGAT CCTAGAGTAG 

TCAGTCAGTTGAAAAAGATAGCTCCACAATATC^ 

TCAGTCAGTTGAAAAAGATAGCTCCACAATATGGTTTTGTC^ 

TCAGTCAGTTGAAAAAGATAGCTCCACAATATWTTTTGTCTT 

TCAGTCAGTTGAAAAAGATAGCTCCACAATATGGTTTTGTCTTACX^TTTC 

T^GTCAGTTGAAAAAGATAGCTCCACAATA^ 

TCAGTCAGTTX3AAAAAGATAGC^CCACAATATGGTTTrGTCTT 

TCAGTC^GTTGAAAAAGATAGCTCCACAATATGGTTTTGTCTTACGGTTTCCGGATGGTA 
TCAGTCAGT/IX3AAAAAGATAGCTCCACAATATGGTTTTGTCT 
TCAGTCAGTTGAAAAAGATAGCTCCACAATATGGTTTTGTCT^ 
TCAGTCAGTTGAAAAAGATAGCTCCACAATATGGT^ 

T CAGTCAGTTGAAAAAGAT AGCTCCACAATATGGTTTTGT CTTACGGTTT CCGGATGGTA 

AAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCT^ 

AAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCTATGT^ 

AAACAG CAGAAACAGGGGTAGGTTATGAAGATTGGCATTAC CGCTATGTTGGGGTAGAGT 

AAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCTATC 

AAAC^GCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCTATGTTGGGGT^ 

AAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCA 

AAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCTATGTO 

AAACAGCAGAAACAGGGGTAGGTTATGAAGATTGG CATTAC CG CTATGTTGGGGTAGAGT 

AAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCG CTATGTTGGGGTAGAGT 

AAACAGCAGAAACAGGGGTAGGTTATGAAGATTGGCATTACCGCTATGT^ 

CTGCAAAATAT ATGGC CAAACATCATTTAACATTAGAAGAATACATAA 

CTGCAAAATATATGGCCGAACATCGTTTAACATTAGA^ 

CTCCAAAATATATGGCCAAACATCATTTAACATTA 

CTGCAAAATATATGGCCAAACATCATTTAACATCAG 

CTIGCAAAATATATGGCCAAACATCArrTAACATTAGA^ 

CTGCAAAATATATGGCCAAACAT CATTTAACATT AGAAGAAT ACAT AACTTT ATTAAAGG 
CTGCAAAATATATGGTCAAACAT CATTTAACATTAGAAGAATAC^TAACTTTATT AAAGG 
CTGCAAAATATATGGCCAAACATCATTTAACATTAGAAGAATACATAACTTTATTAAA^ 
CTGCAAAATATATGGC CAAACATCATTTAACATTAGAAGAATACAT AACTTT^ 
CTGCAAAATATATGGT CAAACATCATTTAACATTAGAAGAATACATAACTTTATTAAAGG 
CTGCAAAATATATGGT CAAACATC!ATT TAACATTAGAAGAATACATAACTTTATTAAAGG 
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Table 22: Comparative Sequences relating to SAG0093 
(D-alanyl-D-alanine carboxypeptidase family protein) 



SEQ2201 
SEQ2202 
SEQ2203 
SEQ2204 
SEQ2205 
SEQ2206 
SEQ2207 
SEQ2208 
SEQ2209 
SEQ2210 
SEQ2211 



• AGAATAAC CAA • 
AGAATAAC CAA 



AGAATAACCAA ■ 
AGAATAACCAA ■ 
AGAATAACCAA- 



AGAATAACCAAAACCCAGCTTTCTTGTACAA- 



AGAATAACCAA • 
AGAATAACCAA 



AGAATAAC CAAAAC CCAGCTTT CTTGTACAA ■ 



AGAATAACCAAAACCCAGCTTTCTT- 
AGAATAACCAATABCMARATVSTNCi 




« 



>SEQ TD NO 2250: 18_090 frames 1 

KPNSQQS S SQKLRNEDI KKI S S QKRNKKIjQIiPAVS S^WNL I L VNRDHKHEELS PDWPV 
ENIYLDKRITKQATQFLEAARAIDSREinilSGYRSVAYQEKLFNSYVT^ 
QAEKLVKTYSQPAGASEHQTGLAMDMSTTOSIjNESDPR 
TAETGVG YEDWHYR YVGVE SAKYMAKHHLTLE EY I TLL KENNQ 

>SEQ H> NO 2251 1 18JL169NT framei 1 

KPNSQQS S PQKLRNED I KKI S S QKRNKKLRLPAVS SKDWNL I LVNRDHKHEELS PDWPV 
ENIYLDKRITKQATQFLEAARAIDSREHLISGYRSVAYQEKLFNSYVTQEMTSNPN^ 
QAEKLVKTYSQ PAGAS EHQTGIiAMEJMSTVDSLNESDPRWS QLKKIAPQYGFVLRF PDGK 
TAETGVGYEDWHYRYVGVESAKYMAEHRLTLEEYITLL KENNQ 

>SEQ ID NO 2252s 18_18RS21 frame! 1 

KPNSQQ S S SQKLRNED I KKI S S QKRNKKLQLPAVS SKDWNL I LVNRDHKHE ELS PDWPV 
ENIYTiDKRITKQATQFLEAARAIDSREHLISGYRSVAYQEKLFNSYVTO 
QAEKLVKTYSQ PAGAS EHQTGLAMDMS TVDSLNESDPR WSQLKKIAPQYGFVLRFPDGK 
TAETGVGYEDWHYR YVGVE SAKYMAKHHLTLEEYI TLLKENNQ 

>SEQ ID NO 2253: 18_2603 frames 3 

SQQSSSQKLRNEDIKKISSQKRNKKLQLPAVSSKDWNLILVNRDHKH^ 

YLDKRI TKQATQFLEAARAIDS REHL I SGYRSVAYQEKLFNSYVTQEMTSNPNLTRGQAE 

KLVKTYSQPAGASEHQTGLAMDMSTVDSLNESDPRWSQLKKIAPQYGFVLRF^ 

TGVGYEDWHYR YVGVES AKYMAKHHLTI*EEYI TLL KENNQNPAFL Y 

>SEQ ID NO 2254: 18__A909 frame: 1 

KPNS QQS S SQKLRNED I KKTS S QKRNKKLRLPAVS S KDWNL I LVNRDHKHE ELS PDWPV 
ENI YLDICRI TKQATQFLEAARAIDSREHLI SGYRSVAYQEKLFNS YVTQEMTSNPNLTKE 
QAEKLVKTYSQ PAGAS EHQTGLAMDMSTVDSLNES DPRWSQLKKI APQ YGFVLRFPDGK 
TAETGVGYEDWHYR YVGVES AKYMAKHHLTLE EYITIiLKENNQ 

>SEQ ID NO 2255sl8_CJBllO frame: 1 
KPNSQQSSSQKLRNEDIKKISSQKRNKKFTITSCI I KRLELDFGQ S 

>SEQ ID NO 2256sl8_COHl frame: X 

PNSQQSSSQKLRNEDIKKTSSQKRN 

>SEQ ID NO 2257: 18_H3 6B frame: 1 

KPNSQQSSSQKLRNEDIKKTSSQKRNKKIaRLPAVSSKDWNLILVNRDHKHEELSPD 
ENI YLDKRI TKQATQFLEAARAIDS REHLI SGYRSVAYQEKLFNS YVTXEMTSNPNLTKE 
QAEKLVKTYSQPAGASEHQTGliAMDMSTVDSLNESDPRWSQL 
TAETGVGYEDWHYR YVGVE SAKYMAKHHLTLE EYI TLLKENNQ 

>SEQ ID NO 2258: 18_JH9130013 frame: 1 

KPNS QQS S S QKLRNEDI KKI S S QKRNKKLQLP AVS S KDWNL IL VNRDHKHE ELS PDWPV 
ENIYLDKRITKQATQFLEAARAIDSREHLISGYRSVAYQEKLFNSYVTQEMTSNPNLTRG 
QAEKLVKTYSQ PAGAS EHQTGLAMDMS TVDSIjNESDPRWSQLKKXA^ 
TAETGVGYEDWHYR YVGVE SAKYMAKHHLTLE EYI TLLKENNQ 

>SEQ ID NO 2259:18_M732 frame: 3 

pnsqqsssqklrnedikktssqkrnkklrlpavsskdwnlilvn^ 
niyldkritkqatqfleaaraidsrehlisgyrsvayqeklfnsyvtqemtsnpnltrgq 
aeklvktysqpagasehqtgiiamdmstvdslnesdprwsqlkkiapqygfvlrfpdgkt 
aenx^gyedwhyryvgvesakymvkhhltleeyitllkennqnpaf 
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Table 22: Comparative Sequences relating to SAG0093 
(D-alanyl-D-alanine carboxypeptidase family protein) 

>SBQ ID NO 2260: 18_M781 frames 1 

KPN SQQS S SQKLRNEDI KKTS S QKRNKKLRLPAVS SKDWNLILVNRDHKHEELS PDVVPV 
ENI YLDKR ITKQATQFLEAARAI DSREHLI SGYRSVAYQEKLFNS YVTQEMTSNPNLTRG 
QAEKLVKTYSQPAGASEHQTGIiAMDMSTVDSLNESDPRWSQLKK^ 
TAETGVGYEDWHYRYVGVESAKYMVKHHLTLBEYITLIiKENNQ 



SEQ2250 
SEQ2251 
SEQ2252 
SEQ2253 
SEQ2254 
SEQ2255 
SEQ2256 
SEQ2257 
SEQ2258 
SEQ2259 
SEQ2260 

SEQ2250 
SEQ2251 
SEQ2252 
SKQ2253 
SEQ2254 
SEQ2255 
SEQ2256 
SEQ2257 
SEQ2258 
SEQ2259 
SEQ2260 

SEQ2250 
SEQ2251 
SEQ2252 
SEQ2253 
SEQ2254 
SEQ2255 
SBQ2256 
SEQ2257 
SEQ2258 
SBQ2259 
SEQ2260 

SEQ2250 
SEQ2251 
SEQ2252 
SEQ2253 
SEQ2254 
SEQ2255 
SEQ2256 
SEQ2257 
SEQ2258 
SEQ2259 
SEQ2260 

8EQ2250 
SEQ2251 
SEQ2252 
SEQ2253 
SEQ2254 
SEQ2255 
SEQ2256 
SEQ2257 
SEQ2258 
SEQ2259 
SEQ2260 



PNSQQS S SQKLRNEDI KKI SSQKRNKKLQLPAVS S KDWNL I LVNRDHKHEELS P DWPV 
PNSQQSSPQBOiRNEDIKKISSQKRNKinJUjPAVSSKDWNLI^ 

PNSQQS S S QKLRNEDI KKI SSQKKbnQOLQLPAVSSKDWNLILVNIU)HKHEELiS PDVVPV 
--SQQSSSQKLRNEDlkKISSQtfRNKi^LPAVSSKDJ^ 

PNSQQS S SQKLRNEDI KKTSSQIOINKKLRLPAVS S KDWNL I LVNRDHKHEEL S PDVVPV * 

PNSQQSSSQKLRNEDIKKISSQKRNKKFTITSCIIKRLEL DPGQS 

PNSQQS SS QKLRNEDI KKTSSQKRN 

PNSQQS S S QKLRNEDI KKTS SQKRNKKLRLPAVS S KDWNL ILVNRDHKHEELS PDWPV 
PNSQQS S SQKLRNEDI KKI S SQKRNKKLQLPAVS SKDWNLILVNRDHKHEELS PDWPV 
PNSQQS S S QKLRNEDI KKTS SQKRNKKLRLPAVS S KDWNL I LVNRDHKHEELS PDWPV 
PNSQQS SSQKLRNEDI KKTS SQKRNKKLRL PAVSS KDWNLI LVNRDHKKEELS PDWPV 

' NI YLDKRI TKQATQFLEAARAI DS REHLI S GYRSVAYQEKL FNS YVTQEMT SNPNLTRG 
NIYLDKRITKQATQFLEAARAIDSREHLISGYRSVAYQEKLFNSYVTQ 
NI YLDKR I TKQATQFLEAARAIDS REHLI SGYRSVAYQEKLFNS YVTQEMTSNPNLTRG 
NI YLDKRI TKQ^TQFLEAARAIDSREHLISGYRSVAYQEKLFNSYVTQEMTSNPNLTRG 
NIYLDKRI TKQATQFLEAARAIDS REHLI SGYRSVAYQEKLFNS YVTQEMTSNPNLTKE 



NI YLDKRI TKQATQ FLEAARAIDS REHLI SGYRSVAYQEKLFNS YVTXEMTSNPNLTKE 
NIYLDKRI TKQATQFLEAARAIDS REHLI SGYRSVAYQEKLFNS YVTQEMTSNPNLTRG 
NIYLDKRI TKQATQFLEAARAIDS REHLI SGYRSVAYQEKLFNS YVTQEMTSNPNLTRG 
NIYLDKRI TKQATQ FLEAARAIDS REHLI SGYRSVAYQEKLFNS YVTQEMT SNPNLTRG 

AEKLWTYSQPAGASEHQTGLAMDMSTVDSI^ESDPRWSQLKKIAPQYGFVLRFPDGK 
AEKLVKTYSQPAGASEHQTGLAMDMSTVDSLNESDPRWSQLKKIAPQYGFVLRFPDGK 
AEKLVKTYSQPAGASEHQTGLAMDMSTVDSLNESDPRWSQLKKIAPQYGFVLRFPDGK 
AEKLVKTYSQPAGASEHQTGLAMDMSTVDSLNESDPRWSQLKKIAPQYGFVLRFPDGK 
AEKLWTYSQPAGASEHQTGLAMDMSTVDSLNESDPRWSQLKKIAPQYGFVLRFPDGK 



AEKLVKTYSQPAGASEHQTGLAMDMSTVDSLNESDPRWSQLKKXAPQYGFVLRFPDGK 
AEKLVKTYSQPAGASEHQTGLAMDMSTVDSIiNESDPRWSQLKKIAPQYGFVLRFPDGK 
AEKLVKTYSQPAGASEHQTGLAMDMSTVDSLNESDPRWSQLKXIAPQYGFVLRFPDGK 
AEKLVKTYSQPAGASEHQTGLAMDMSTVDSLNESDPRWSQLKKIAPQYGFVLRFPDGK 

AETGVGYEDWHYRYVGVESAKYMAKHHLTLEEYITLLKENNQ 

AETGVGYEDWHYRYVGVESAKYMAEHRLTLEEYITLLKENNQ 

AETGVGYEDWHYRYVGVESAKYMAKHHLTLEEYITLLKENNQ 

AETGVGYEDWHYRWGVESAKYMAKHHLTLEEYITLLKENNQNPAFLY> 

AETGVGYEDWHYR WGVESAKYMAKHHLTLEE YITLLKENNQ 

AETGVGYEDWHYRWGVESAKYMAKHHLTLEEYITLLKENNQ 

AETGVGYEDWHYRWGVESAKYMAKHHLTLEEYITLLKENNQ 

AETGVGYEDWHYRYVGVESAKYMVKHHLTLEEYITLLKENNQNPAF — 

AETGVG YEDWHYR WGVESAKYMVKHHLTLEE Y I TLLKENNQTABL ECMP ARAT IVES E 

ENCESRELATINGTSAGPALANYLDALANINECARBXYPEPTIDASEFAMILYPRTEIN 
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Table 23: Comparative Sequences relating to SAG0163 
(competence protein CglA) 

SEQ ID HO. 2301: SAG0163 FROM THE 090 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

GGCAGTAGAAGTAAATGCT CAAGATAT TTATATCATTCCCAAAGGTGATTGTTATGAACTCTATATG CGTATTGATGATGAAAGGCG 

GTTTATTGATGTTTTTGAGTTTAATAGGATGGCTAGTCT^ 

ACGAAGTCAATTAGGTTCTTGTGACTATGAACTGTCAGAGG 

TCAAGAATCJTTTAGTTATTCGTATTTTGTACT 

ACTGGGTACAAGAGGGCTATATCrrTrTTCCGGCCCTC 

TAAAAATAAGCAAATTATCACGATTGAAGATCCGXSTAGAAATC^ 

AATGACTTATGATGCTTTAATCAAACTGTCT 

CCGTGCTGTTATTCGTGCAAGTTTAACGGG^ 

TATAGAATTAGGGGTTAACTATCAAGAGTTAGAAAATAGTCT 

TGACTTTGAGACAGGTAACTTTAAAAAACACTCATC^ 

TAAGAAACAGGCACAAGTCGAAAAAATTATCCCTCAAG^ 

SEQ ZD NO. 2302s SAG0163 FROM THE JL169NT1 GBS TYPE V STRAIN (REVERSE COMPLEMENT) 

GGTGATTGTTATGAAACCTCTACTATTGCGTA 
TTATTAGTCACTTTAAATTTGTGGCAGG 
AGGGAAGACTGGTTTCATTACGACTATCGAGTGTG^ 
ATCAGGACTTAAAATATTGGTTTGATAATATAAAGCAAATGAAGGA^ 

" TGGGGAGTGGTAAAACAAOTCTCATGTATCAATTAGCTTCAGAAGTATT^ • 
AAATCAAGAATGAC^GATGTTACAACTCCAATTGAATG^ 
ATCGTCCAGATATTTTAATTATCGGAGAGATTAGAGATC^ 
TTTTTTCTACTATTCATGCTAAAAGTATTCCCGGAGT^ 
GTCTAAAATTAATAGCATATCMCGTTTAATTGGAGGA 
ACAAGTGGAATAGACAAGTGGATATCTTGGCTGAAGAAGGATATATC^ 

AAACAACGGAAAGTAGTCCAACTTTT £/ 

SEQ ID NO. 2303 a SAG0163 FROM THE 18RS21 GBS TYPE II STRAIN (REVERSE COMPLEMENT) 

GTTCAATCATTAGCAAAGCAAGTCATTCATCAGGCAGTAGAAGTAA 
GAACTCTATATGCGTATTGATGATGAAAGGCGGTTTATTGATG 
TTTGTGGCAGGCATGAACGTTGGAGAAAAAAGACGAAGTCAAT^ 
TTACGACTATCGAGTGTGGGAGATTATCXSTGGTCAAGAATCTTTAGTTATTC^ 

TGGTTTGATAATATAAAGCAAATGAAGGAAGTACTGGGTATAAGAGGGCTATAT CT GGGAGTGGTAAAACA 

ACTCTCATGTATCAATTAGCTTCAGAAGTATTTAAAAATAAGCAA^ 

ATCTTACAACTCCAATTGAATGAGGATATTGX3AATGACTTAT 

ATTATCGGAGAGATTAGAGATCAAGCGACGGCCCGTGCTGT^ 

GCTAAAAGTATTCC CGGAGTCTATGATAGGCTTAT AGAATTAGGGGTTAACTAT CAAGAGTTAGAAAATAGTCTAAAATTAATAGCA 
TAT CAACGTTTAAT TGGAGGAGGAAGC CTAATTGACTTTGAGACAGGTAATTTT AAAAAACACTCAT CAGACAAGTGGAATAGACAA 
GTGGAT ATCTTGGC TGAAGAAGGACATATCAGTAAGAAACAGGCACAAGTCGAAAAAAT^ CCCTCAAGAAACAACGGAAAGTAGT 
CCAACTTTT 

SBQ ID NO. 2304 1 SAG0X63 FROM THE 2603 V/R QBS TYPE V STRAIN (REVERSE COMPLEMENT) 

GATATTTATATCATTCCCAAACK5TGATTGTTA 

AATAGGATGGCTAGTCTTATTAGTC^CTTTAAATTTGTGGCAGGCATGA^ 

GACTATGAACTGTCAGAGGGAAGACTGGTTTCATTACGACT 

ATTTTGTATTCAGGTCATCAGGACTTAAAATATTG 

CITTTTTCCX3GCCCTGTGGGGAGTGGTAAAACAACTCT 

ATTGAAG ATCXX ^TAGAAATCAAGAATGACAAGATGTTACA^ 

AAACTGTCTITACGGCATCGTCCAGATATTTTAATTATCGGAGAGA 

TTAACXSGGAGTGATGGTTTTTTCTACTATTCATGCTAAAAGTATTCC^ 

CAAGAGTTAGAAAATAGTCTAAAATTAATAGCATATCAACGTTTAATTG^ 

AAAAAACACTCATCAGACAAGTGGAATAGACAAGTGGATATCTTG 

AAAAATTATCCCTCAAGAAACAACGGAAAGTAGTCCAACTTTT 
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Table 23: Comparative Sequences relating to SAG0163 
(competence protein CglA) 

SEQ ZD NO. 2305 1 SAGO 16 3 FROM THE A909 GBS TYPE Za STRAIN (REVERSE COMPLEMENT) 

GTTCAATCATTAGCAAAGCAAGTCATTCATCAGGCACT 

GAACTCTATATGCGTATTGATGATGAAAGGCGGTTTATTGATGTT^ 

TTTGTGGCAGGCATGAACX3TTGGAGAAAAAAGACGA 

TTACGACTATCGAGTGTGGGAGATTATOGTGGTCA^ 

TGGTTTGATAATATAAAGCAAATGAAGGAAGTACTGGGTATAA^ 

ACTCTCATGTATCAATTAGCTTCAGAAGTATTTAAAAATAA^ 

ATGTTACAACTCCAATTGAATGAGGATATTGGAATGAC 

ATTATCGGAGAGATTAGAGATC2^GC!GACGGCCCGTGC^ 

GCTAAAAGTATTCCCGG^GTCTATGATAGGCTTATAGAATTAGGGGTTAA 

TATCAACGTTTAATTGGAGGAGGAAGCCTAATTG^ 

<nX3GATATCTTGGCTGAAGAAGGACATATCAGTAAG 

CCAACTTTT 

SEQ ZD NO. 2306: SAG0163 FROM THE CJB110 GBS NONTYPEABLE STRAIN (REVERSE COMPLEMENT) 

GTTCAATCATTAGCAAAGCAAGT(!ATTCATC!A 

GAACTCTATATGCOTATTGATGATGAAAGGCG 

TTTGTGGCAGGCATGAACGTTGGAGAAAAAA(^CX3AAGT 

TTACX^CTATCGAGTGTGGGAGAITATCGTGGTCAAGA^ 

TGGTTTGATAATATAAAGCAAATGAAGGAAGTACTGGGTACAAGA 

ACT CTCATGTATCAATTAGCTTCAGAAGTATTTAAAAATAAG CAAATTATCACGATTGAAGATCCGGTAGAAATCAAGAATGACAAG 

ATGTTACAACTCCAATTGAATGAGGATATTGGAATGACTTA 

ATTATOSGAGAGATTAGAGATCAAGCGACGGCCC^^ 

GCTAAAAGTATTTCCGGAGTCTATGATAGGCTT^^ 

TATCAACGTTTAATTGGAGGAGGAAGCCTAATTGACT^ 

GTGGATATCTTGGCTGAAGAAGGACATATCAGTAAGAAACAGGCACAAG 

CCAACTTTT 

# 

SEQ ID NO. 2307s SAG0163 FROM THE COHl GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

AGGTGATTGTTATGAAATTCTATATGCGTATTGATGATGAAAGGCGGTTT^ 

TTAGTCACTTTAAATTTGTGGCAGGCATGAACG 

GAAGACTGGTTTCATTACX^CTATCAAGTGTGGG^ 

AGGACTTAAAATATTGGTTTGATAATATAAAGTAAATGAAGG 

GGAGTGGTAAAACAACTCJTCATGTATCAATTAGCTTCAGAA 

TCAAGAATGACAAGATGTTACAACTCCAATTGA^ 

GTCC^GATATTTTAATTATCGGAGAGATTAGAGAT CAAGCGACGGCCCGTGCTGTTATT CGTGCAAGTTT AACGGGAGTAATGGTT T 

TTTCTACTATTCATGCTAAAAGTATTCCCX3GAGTCTATGATAGGCTTATAGAAT TAGGGGTTAACTATCAAGAGTTAGAAAATAGT C 

TAAAATTAATAGCATATCAAOGTTTAATTGGAGGAGX3AA 

AGTGGAATAGACAAGTGGATATCTTGGCTGAAGAAG^ 

CAACGGAAAGTAGTCCAACTTTT 

SEQ ID NO. 2308 s SAG0163 FROM THE H36b GBS TYPE Zb STRAIN (REVERSE COMPLEMENT) 

TCATTAGCAAAGCAAGTCATTCATCAGGCAGTAGA 

TATATG C!GTATTGATGATGAAAGGCGGTTTATTGATGTTTTTGAGTTTA 

GCAGGCATGAACGTTGGAGAAAAAAGACXaAAGTCAATTAGGTTCTT^ 

CTATCGAGTGTGGGAGATTATCGTGGTCAAGAATCTTTAGTTAT^ 

GATAATATAAAGCAAATGAAGGAAGTACTGGGTATAAGAGdG 

ATGTATCAATTAGCTTCAGAAGTATTTAAAAATAAG 

CAACTCCAATTGAATGAGGATATTGGAATGACTTATGATGCTT^ 

GGAGAGAAATAGAGAT CAAGCGACGGC CCGTGCTGITATTC^GTGCAAGTTTAACGGGAG TGATGTTTTTTTCTACTATTCATG CTAA 

AAGTATTCCO^GTCTATGATAGGCTTATAGAATTAGGGGTTA^ 

AOSTTTAATTGGAGGAGGAAGCCTAATTGACTTTGAGAC^GGT 

TATCTTGGC!TGAAGAAGGACATATCAGTAAGAAACAGGCACAAGTCGA 

TTTT 
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Table 23: Comparative Sequences relating to SAG0163 
(competence protein CglA) 

SEQ ID NO. 2309s SAG0163 FROM THE OM9130013 GBS TYPE VIII STRAIN (REVERSE COMPLEMENT) 
GTTCAATCATTAGCAAAGCAAGTCAOT 

GAACTCTATATGCGTATTGATGATGAAAGGCX^TTTATTGATGTTT^ 

TTTGTGGCAGGCATGAACX5TTGGAGAAAAAAGACGAA 

TTACGACTATCGAGTGTGGGAGATTATCGTGGTCAAQAATCT^ 

TGGTTTGATAATATAAAGCAAATGAAGGAAGTACTGGGTATAA 

ACTCTCATGTATCAATTAGCTTCAGAAGTATTTAAAAATAAGCAAATTATC 

ATGTTACAACTCCAATTGAATGAGGATATTGGAATGACTT 

ATTATCGGAGAGATTAGAGATCAAGCGACGGCCGGTGCTGTTATTC 

GCTAAAAGTATTCCCGGAGTCTATGATAGGCT^ 

TATCAACX3TTTAATTGGAGGAGGAAGCCTAATTGAOT 

GTGGAIATCOTGGCTGAA 

CCAAjpTTTT 

S$Q ID NO. 2310 i SAG0163 FROM THE M732 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

TGACITGTTATGAAACTCTATATGCOTATTTGATGAT 
TTAGTCACTTTAAATTTGTGGCftGGCATGAATO 

GAAGACTGGTTTCATTACGACTATCAAGTGTGGGAGATTATCGTGOT 

AGGACTTAAAATATTGGTTTGATAA 

GGAGTGGTAAAACAACTCTCATGTATCAATTAGCTT<^ 

TCAAGAATGACAAGATGTTACAACTCCAATTGAATGA 

GTCCAGATATTTTAATTATCGGAGAGATTAGAGATCAAGCGACG 

TTTCTACTATTCATGCTAAAAGTATTCCCGG 

TAAAATTAATAGCATATCAACGTTTAATTGGAGGAGGAAGC^ 

AGTGGAATAGACAAGTGGATATCTTGGCTGAAGAAGGACATATCA 

CAACGGAAAGTAGTCCAACTTTT o . 

SEQ ID NO. 2311a SAG0163 FROM THE M781 GBS TYPE III STRAIN (REVERSE COMPLEMENT) 

CAGTAGAAGTAAATGCTCAAGATATTTATATCATTCCCA 
TTATTGATGTTTTTGAGTTTAATAGGATGGCTAGTCTTATTAGTCA 
GAAGTCAATTAGGTTCTTGTGACTATGAACTGTC^ 
AAGAATCTTTAGTTATTCGTACTTTCT7VTTCAGCT 
TGTGIGCAAGAGGGCTATATCTTTTTT CCGGC CCTGTGGGGAGTGGTAA 

AAAATAAG CAAATTAT CACGATTGAAGATCCGGTAGAAAT CAAGAATGACAAGATGTTA CAACT CCAATTGAATGAGGAT ATTGGAA 

TGACTTATGATGCTTTAATCAAACTGTCT^ 

GTGCTGTTATTCGTGCAAGTTTAACGGGAGTAATGGTTTTT^ 

TAGAATTAGGGGTTAACTATCAAGAGTTAGAAAATAGTCTAAAATTAATAGCATATCAACGTTTA^ 

ACTTTGAGACAAGTAACTTTAAAAAACACTCATCAGAC^ 

AGAAACAGGCACAAGTOSAAAAAATTATCCCTCAAGAA^ 
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Table 23: Comparative Sequences relating to SAG0163 
(competence protein CglA) 

SEQ2 301 GGCAGTAGAAGTAAATGCTCAAGATATT 

SEQ2302 " 

SEQ2303 TTCAATCATTAGCAAAGCAAGTCATTCATCAGGCAGT^ 

SEQ2 304 GATATT 

SEQ2 305 TTCAATCATTAGCAAAGCAAGTCATTCATCAGGCAGTAGAAGTAAATGC^ 

SEQ2 306 TTCAATCATTAGCAAAGCAAGTCATTCATCAjGGCAGTAGAAGTAAATC 

SEQ2307 - : 

SEQ2 308 - TCATTAGCAAAGCAAG^ CATTCATCAGGCAGTAGAAGTAAATGCTCAAGA 

SEQ23 0 9 TTCAATCATTAGCAAAGCAAGTCATTCATCAGGCAGTA 

SEQ2310 - , ~- 

SEQ2 311 CAGTAGAAGTAAATGCTCAAGATATT 

SEQ2 301 ATATCATTCCCAAAGGTGA -TTGTTATGAA* - CTCTATA TGCGTATT - GATGATGA 

SEQ2 302 GGTGA-TTGTTATGAA -ACCTCTACTATTGCGTATTTGATGATGA 

SEQ2 303 ATATCATTCCCAAAGGTGA - TTGTTATGAA - CTCTATA TGCGTATT -GATGATGA 

SSQ2304 ATATCATTCCCAAAGGTGA - TTGTTATGAA - CTCTATA TGCGTATT -GATGATGA 

SEQ2 305 ATATCATTCCCAAAGGTGA- TTGTTATGAA - CTCTATA TGCGTATT -GATGATGA 

SEQ2306 ATATCATTCCCAAAGGTGA- TTGTTATGAA - CTCTATA TGCGTATT -GATGATGA 

3BQ2307 AGGTGA- TTGTTATGAAATTCTATA TGCGTATT -GATGATGA 

SEQ2308 ATATCATTCCCAAAGGTGA-TTGTTATGAA- CTCTATA TGCGTATT- GATGATGA 

SSQ2309 ATATCATTCCCAAAGGTGA - TTGTTATGAA - CTCTATA TGCGTATT- GATGATGA 

SEQ2 310 — TGACTTGTTATGAAACTCTATA TGCGTATTTGATGATGA 

SEQ2 311 ATATCATTCCCAAAGGTGA - TTGTTATGAA - TTCTATA TGCGTATT- GATGATGA 

. .0 

SEQ2 301 AA- GGCGGTTTATTGA^TGTTTTTGAGTTTAATAGGAIX^ 

SEQ2302 AA - GGCfl^^TATTGATGTTTT'IXSAGTTTAATAGGATGGC TAGTCTTATTAGTCACTTTA 

SEQ2303 AA-GGCGGTTTATTGATGTTTTTGAGTTTAATAGC^ 

SEQ2304 AA-<^CGGTTTATTGATGTTTTTGAGTTTAATAGGATGG * 

SEQ23 0 5 AA-GGCGGTTTATTGATGTTTTTGAGTTTAATAGGATGGCTAGTCTTATTAGTCACTTTA 

SEQ2 306 AA- GGCGGTTTATTGATGTTTTTGAGTTTAATAGGATGG 

SEQ2307 AA- GGCGGTTTATTGATGTTTTTGAGTTTAATAGGATGGCTAGTCTTATT^ 

SEQ2308 AA- GGCGGTTTATTGATGTTTTTGAGTTTAATAGGATGGCT^ 

SEQ23 0 9 AA- GGCGGTTTATTGATGTTTTTGAGTTTAATAGGATGG 

SEQ2 310 AAAGGCGGTTTATTGATGTTITTGAGTTTAATAGGATGGCTAGTCrTATTAGTCACTTTA 

SEQ2 311 AA- GGCGGTTTATTGATGTTTTTGAGTTTAATAGGATGGCTAGTCTTAOT 

SEQ23 0 1 AATTTGTGGCAGGCATGAA CGTTGGAGAAAAAAGA CGAAGTCAATTAGGTT CTTGTGACT 

SEQ2302 AATTTGTGGCAGGCATGAACGTTGGAGAAAAAAGACGAAGTCAATTAGGTT^^ 

SEQ2 303 AATTTGTGGCAGGCATGAACGTTGGAGAAAAAAGACGAAGTCAATTAGGTTCTTGTGACT 

SEQ2 304 AATTTGTGGCAGGCATGAACGTTGGAGAAAAAAGACX3AAGTCAATTAGGTT 

SEQ2305 AATTTGTGGCAGGCATGAAOSTTGGAGAAAAAAGACGAAGTCAATTATO 

SEQ2306 AATTTGTGGCAGGCATGAACGTTGGAGAAAAAAGA03AAGTCAATO 

SEQ2307 AATTTGTGGCAGGCATGAACGTTGGAGAAAAAAGACGAAGTCAATTAGGT^ 

SEQ2308 AATTTGTGGCAGGCATGAACGTTGGAGAAAAAAGACXSAA^ 

SEQ2 309 AATTTGTGGCAGGCATGAACGT TGGAGAAAAAAGACGAAGTCAATTAGGTTCTTGTGACT 

SEQ2310 AATTTGTGGCAGGCATGAACGTTGGAGAAAAAAGACGAAGTCAATTAGGTTCTTGTGACT 

SEQ2 311 AATTTGTGG CAGG<^TGAACGTTGGAGAAAAAAGACX3AAGTCAATTAGGTT CTTGTGACT 
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Table 23: Comparative Sequences relating to SAG0163 
(competence protein CglA) 



SEQ230X 
SSQ2302 
SEQ2303 
SEQ2304 
SEQ2305 
SEQ2306 
SEQ2307 
SEQ2308 
SEQ2309 
SEQ2310 
SEQ2311 

SEQ2301 
SEQ2302 
SEQ2303 
SEQ2304 
SEQ2305 
SEQ2306 
SEQ2307 
SEQ2308 
SEQ2309 
SEQ2310 
SEQ2311 

SEQ2301 
SEQ2302 
SEQ2303 
SEQ2304 
SEQ2305 
SEQ2306 
SEQ2307 
SEQ2308 
SEQ230 9 
SEQ2310 
SEQ2311 

SEQ2301 
SEQ2302 
SEQ2303 
SEQ2304 
SEQ2305 
SEQ2306 
SEQ2307 
SEQ2308 
SEQ2309 
SEQ2310 
SEQ2311 



ATGAACTGTCAGAGGGAAGACTGGTTTCATTACGACTATCGAGTGTGGGAGATTATCGTG 
ATGAACTGT CAGAGGGAAGACT GGTTTCATTACGACTATCGAGTGTG^ 
ATGAACTGTCAGAGGGAAGACTGGTTTCATTACGACTATCGAGTGTGGGAGATTATCGTC 
ATGAACTGTCAGAGGGAAGACTGGTTTCATTACGACTATCGAGTC 

ATGAACTGTCAGAGGGAAGACTGGTTT CATTACGACTATCGAGTGTGGGAGATTATCGTG 

ATGAACTGTCAGAGGGAAGACTGGTTT(^TTACGACTATC^GTG 

ATGAACTGT CZAGAGGGAAGACTGGTTTCATTACGACT 

ATGAACTGT. CAGAGGGAAGACTGGTTTCATTACGACTATCGAGTGTGG 

ATGAACTGTCAGAGGGAAGACTGGTTTCATTAC!GACT 

ATGAACTGTCAGAGGGAAGACTGGTTTCATTACGACITATCAAGTGTGGGAGAT^ 
ATGAACTGTCAGAGGGAAGACTGGTTTCIATT^ 

GTCAAGAATCTTTAGTTATTCGTATTTTGTATTC^ 

GTCAAGAATCTTTAGTTATTCXSTATTT^ 

GTGAAGAATCTTTAGTTATT03TATTTTGTATTC^ 

GTCAAGAATCTTTAGTTATTCGTATTTTGTATTC^GGTCATCIAGGACT 

GTCAAGAATCTTTAGTTATTC^TATTTTGTAT TCAGGTCATCAGGACTTAAAATATTGGT 

GTCAAGAATCTTTAGTTATTCGTATTTTGTATTCAGGTCATCAG(^ 

GTCAAGAATCTTTAGTTATTCGTACTTTGTATTC^ 

GTCAAGAATCTTTAGTTATTCGTATTTTCT 

GTCAAGAATCTTTAGTTATTCGTATTTTGTATTCAGGT 

GTCAAGAATCrTTAGTTATTCXSTACTTTGTATTC^ 

GTCAAGAATCTTTAGTTATTCGTACTTTGTATTC^ 

TTGATAAT ATAAAGCAAATGAAGGAAGT A^nXSGGTACAAGAGGG CTATATC^TTTTTTCCG 
TTGATAATATAAAGCAAATGAAGGAAGTACTGGGTACAAGAGGGCTATATCTTTTTTCCG 
TTGATAATATAAAGC^AAATGAAGGAAGTACTGGGTATAAGAQ 
TTGATAATATAAAGCAAATGAAGGAAGTACTGGGTATAAGAGGGCT 

TTGATAATATAAAGCAAATGAAGGAAGTACTGGGTATAAGAGGGCTATATCTTTTTTCCG 
TTX^TAATATAAAGCAAATGAAGGAAGTACTGGGTACAAGAG 

TTGATAATATAAAGTAAATGAAGGAAGTACTGTGTGCAAGAGGGCTATATCTTTTTTCCG 
TTGATAATATAAAG CAAATGAAGGAAGTACTXX^TATAAGAGGGCTATATCTTTTTTCCG 
TTGATAATATAAAGCAAATGAAGGAAGTACiTGGGTATAAGAGGG 

TTGATAATATAAAGTAAATGAAGGAAGTAC^TGTGTGCAAGAGGGCTATATCTTTTTTCCG 
TTGATAATATAAAGCAAATGAAGGAAGTACTGTGTGCAAGAGGGCTATATCTTTTOT 

GCCC^TGTGGGGAGTGGTAAAACAACTCTCATGTAT CAATTAGCTTCAGAAGTATTTAAAA 

GCCCTGTGGGGAGTGGTAAAACAACTCTCATGTATCAA 

GCCCTGTGGGGAGTGGTAAAACAACTCTCZATGTATCAATTAGCT 

GCCCTGTGGGGAGTGGTAAAACAACTCTCATGTATCAATTAGCT^ 

GCCCTGTGGGGAGTGGTAAAACAACJTCTCATGTATCAATT^ 

GCCCTGTGGGGAGTGGTAAAACAACTCTCATGTATCAATTAGCTTCAGAAGTA 

GCCCTGTGGGGACTGGTAAAACAACTCTCATGTATCA^ 

GCCCTGTGGGGAGTG&TAAAACAACTCTCATGTATCAATTAGCTTC^ 

GCCCTGTGGGGAGTGGTAAAACAACTCTCATC 

GCCCTGTGGGGAGTGGTAAAACAACTCTCATGTAT CAATTAGCTTCAGAAGTATTTAAAA 
GCCCTGTGGGGAGTGGTAAAACAACTCTCATGTAT CAATTAGCTTCAGAAGTATTTAAAA 
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Table 23: Comparative Sequences relating to SAG0163 
(competence protein Cgl A) 



SSQ2301 
SEQ2302 
SEQ2303 
SEQ2304 
SEQ2305 
SBQ2306 
SEQ2307 
SEQ2308 
SEQ2309 
SEQ2310 
SEQ2311 

SEQ2301 
SEQ2302 
SEQ2303 
SEQ2304 
SEQ2305 
SEQ2306 
SBQ2307 
SEQ2308 
SEQ2309 
SEQ2310 
SEQ2311 

SEQ2301 
SEQ2302 
SEQ2303 
SEQ2304 
SEQ2305 
SEQ2306 
SEQ2307 
SEQ230 8 
SEQ2309 
SEQ2310 
SEQ2311 

SEQ2301 
SEQ2302 
SEQ2303 
SEQ2304 
SEQ2305 
SEQ2306 
SEQ2307 
SEQ2308 
SEQ2309 
SEQ23X0 
SEQ2311 

SEQ2301 
SEQ2302 
SEQ2303 
SEQ2304 
SEQ2305 
SEQ2306 
SEQ2307 
SEQ2308 
SEQ2309 
SEQ2310 
SEQ2311 



ATAAGCAAATTATC^CGATTGAAGATCCGGTAGAAATCAAGAATGAC^GATGTTACAAC 
ATAAGCAAATTATCACGATTGAAGATCCGGTAGAAATCAAGAATGAC^ 
ATAAGCAAATTATCACGAT TGAAQATCCXX3TAGAAATCAAGAATGACAAGATGTTACAAC 
ATAAGCAAATTATCACGATTGAAGATCCX^TAGAAATCAAGAATGAC^ 
ATAAGCAAATTATCACGATTGAAGATCCGGTAGAAATCAAGAAT^ 
ATAAGCAAATTATCACGATTGAAGATCCGGTAGAAAT^ 
ATAAGCAAATTATCACGATTGAAGATC CGGTAGAAATCAAGAA 
ATAAGCAAATTATCACGATTGAAGATCCGGTAGAAATCAAGAAT^ 

ATAAGCAAATTATCACGATTGAAGATC CGGTAGAAATCAAGAATGACAAGATGTTACAAC 
ATAAGCAAATTATCACGATTGAAGATC CGGTAGAAATCAAGAATGACAAGATGTTACAAC 
ATAAGCAAATTATCACGATTGAAGATCCGGTAGAAATCAAGAATGAC^ 

. TCCAATTGAATGAGGATATTGKaAATGACTTA^ 
TCCAATTGAATGAGGATATTGGAATGACTTATGATGCTTTAAT 
TCCAATTGAATGAGGATATTGGAATGACTTATGATG 

TCCAATTGAATGAGGATATTGGAATGACTTATGATGCTTTAATC^ C 

TCCAATTGAATGAGGATATTGGAATGACTTATGATGCTTTA^ 

TCCAATTGAATGAGGATATTGGAATGACTTATGATGCTT^ 

TCCAATTGAATGAGGATATTGGAATGACTTATGATGCTTTA 

TCCAATTGAATGAGGATATTGGAATGACrrATGATGCTTTA^ 

TCCAATTGAATGAGGATATTGGAATGACTTAT^ 

TCGAATTGAATGAGGATATTGGAATGACnATGATGCT 

TCCAATTGAATGAGGATATTCGAATGACTTATGATGCT^ 

ATCGTCCAGATATTTTAATTATCGGAGAGAT - TAGAGATCAAGCGACGGCCCGTGCTGTT 
ATCGTCCAGATATTTTAATTAT CGGAGAGAT - TAGAGATCAAGCGACGGCTCGTGCTGTT 
ATCGTCC^GATATTTTAATTAT CGGAGAGAT - TAGAGATCAAGCGACGGCCCGTGCTGTT 
ATCGTCCAGATATTTTAATTATCGGAGAGAT - TAGAGATCAAGCGACGGCCCGTGCTGTT 
ATCGTCCAGATATTTTAATTATCGGAGAGAT - TAGAGATCAAGCGACGGCCCGTGCTGTT 
ATCGTCCAGATATTTTAATTATCGGAGAGAT - TAGAGATCAAGCGACGGCCCGTGCTGTT 
ATCGTCCAGATATTTTAATTAT CGGAGAGAT - TAGAGATCAAGCGACGGCCCGTGCTGTT 
ATCGTCCAGATATTTTAATTATCGGAGAGAAATAGAGATCAAGCX^CX^ 
ATCGTCCAGATATTTTAATTATCGGAGAGAT - TAGAGATCAAGCGACGGCCCGTGCTGTT 
ATCGT CCAGATATTTTAATTATCGGAGAGAT - TAGAGATCAAGCGACGGCCCGTGCTGTT 
ATCGTCCAGATATTTTAATTATCGGAGAGAT - TAGAGATCAAGCGACGGCCCGTGCTGTT 

ATTCGTGCAAGTTTAACGGGAGTGATGGTTTTTTCTACTATTCATGCT 

ATTCGTGC^GTTTAACGGGAGTGATGGTTTTTTCTACTATTCATGCTAAAAGTATTCC^ 

ATTCXSTGCAAGTTTAACGGGAGTGATGGTTTTTTCT^ 

ATT rcTGCAAGTTTAACGGGAGTGATGGTTTTTTCTACTAT^ CATGCTAAAAGTATTCCC 

ATTCGTGCAAGTTTAACGGGAGTGATGGTTTTTTCTACTATTCATC 

ATTCGTGCAAGTTTAACGGGAGTGATGGTTTTTTCTACTA 

ATTCGTGCAAGTTTAACGGGAGTAATGGTTTTTTCTAC TATTCATG CT AAAAGTATTCC C 

ATTCXSTGCAAGTTTAACGGGAGTGATGTTTT^ 

ATTCGTGCAAGTTTAACGGGAGTGATGGTTTTTTCT^ 

ATTOSTGCAAGTTTAAaMGAGTAATGGTTTTTT 

ATTCGTGCAAGTTTAACX^GAGTAATGGTTTTTTCTACTATT 

GGAGTCTATGATAGGCTTATAGAATTAGGGGTTAACTATCAAGAGTTAGAAAATAGTCTA 

GGAGTCTATGATAGGCTTATAGAATTAGGGGTTAACTATCAAGAGTTAGAAAATAGTCT 

GGAGTCTATGATAGGCTTATAGAATTAGGGGTTAACTATCAAGAGTTAGAAAATAGTCTA 

GGAGTCTATGATAGGCTTATAGAATTAGGGGTTAACTATCAAGAGTTAGAAA^ 

GGAGTCTATGATAGGCTTATAGAATTAGGGGTTAACTATC^ 

GGAGTCTATGATAGGCTTATAGAATTAGGGGTTAACTATCAAGAGTTAGAAAATAGT 
GGAGTCTATGATAGGCHTATAGAATTAGGGGTTAACTATCAAGAGTTAGAAAATAGTCTA 
GGAGTCTATGATAGGCTTATAGAATTAGGGGT TAACTATCAAGAGTTAGAAAATAGTCTA 
GGAGTCTATGATAGGCTTATAGAATTAGGGGTTAACTATC^GAGTTAGAAAATAGTCTA 
GGAGTCTATGATAGGCTTATAGAATTAGGGGT TAACTATCAAGAGTTAGAAAATAGTCTA 
GGAGTCTATGATAGGCTTATAGAATTAGGGGTTAACTATCAAGAGTTAGAAAATAGTCTA 



SEQ2301 
SEQ23 02 
SEQ2303 
SEQ2304 
SEQ2305 
SEQ23 06 
SEQ2307 



AAATTAATAGCATATCAACGTTTAATTGGAGGAGGAAGCCTAAT^ 

AAATTAATAGCATATGAACXSTTTAATTGGAGGAGGA^ 

AAATTAATAGCATATCAACGTTTAATTGGAGGAGGAAGCCT^ 

AAATTAATAGCATATCAACGTTTAATTGGAGGAGGAAGCCTAATTGACT^ 

AAATTAATAGCATATCAACGTTTAATTGGAGGAGGAAGCCTAATTC 

AAATTAATAGCATATCAACGTTTAATTGGAGGAGGAAGCCTAAT^ 

AAATTAATAGCATATCAACXSTTTAATTGGAGGAGGAAGCCTAATTGACTT^ 
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SZQ2308 
SEQ2309 
SEQ2310 
SEQ2311 

SEQ2301 
SEQ2302 
SEQ2303 
SEQ2304 
SEQ2305 
SEQ2306 
SEQ2307 
SEQ2308 
SEQ2309 
SEQ2310 
SEQ2311 

SEQ2301 
SBQ2302 
SEQ2303 
SEQ2304 
SEQ230S 
SEQ2306 
SEQ2307 
SEQ2308 
SEQ2309 
SEQ2310 
SEQ2311' 

SEQ2301 
SEQ2302 
SEQ2303 
SEQ2304 
SEQ2305 
SEQ2306 
SEQ2307 
SEQ2308 
SEQ2309 
SEQ2310 
SEQ2311 



AAATTAATAGCATATCAACGTTTAATTG^ 

AAATTAATAGCATATCAACGTTTAATTGGAGGAGGAAGCCTAAT^ 

AAATTAATAGCATATCAACGTTTAATTGGAGGAGGAAGCCTAATTGACTTTGAG^ 

AAATTAATAGCATATCAACGTTTAATTGGAGGAGGAAGCCTAATTGACTT^ 

AACTTTAAAAAACACT CATCAGACAAGTGGAATAGACAAGTGGATATCTTGGCTGAAGAA 
AACTTTAAAAAACACTCATCAGACAAGTGGAATAGACAA 

AATTTTAAAAAACACTCAT CIAGACAAGTGGAATAGACAAGTGGATATCTTGGCTGAAGAA 
AATTTTAAAAAACACTCATC!AGACAAGTGGAATAGACAAGT 

AATTTTAAAAAAC^CTCATCAGACAAGT ' 

AACTTTAAAAAACACTCATCAGACAAGTGGAATAGACAAGTGGA^ 

AACTTTAAAAAACACTCATC^GACAAGTGGAATAGACAAGTGGATA 

AATTTTAAAAAACACTCATCAGACAAGTGGAATAGACAAGTGGA 

AATTTTAAAAAACACTC^TCAGACAAGTGGAATAGAC^ 

AACTTTAAAAAACACTCATCAGACAAGTGGAATAGACAAGTGGATA 

AACTTTAAAAAACACTCATCAGACAAGTGGAATAGACAAGTGGATATCTTG^ CTGAAGAA 

GGACATATCAGTAAGAAACAGGCACAAGT - CGAAAAAATTATCCCTCAAGAAACAACGGA 
GGATATATCAGTAAGAAACAGGCACAAGT- CGAAAAAATTATCCCTCAAGAAACAACGGA 
GGACATATCAGTAAGAAACAGGCACAAGT- CGAAAAAATTATCCCTCAAGAAACAACGGA 
GGAC1ATATCAGTAAGAAACAGGCACAAGTGCGAAAAAATTATCCCTCAAGAAA 
GGACATATCAGTAAGAAACAGGCACAAGT ~ CGAAAAAATTATCCCTCAAGAAACAACGGA 
GGACATATCAGTAAGAAACAGGCACAAGT - CGAAAAAATTATCCCTCAAGAAACAACGGA 
GGACATATCAGTAAGAAACAGGCACAAGT- CGAAAAAATTATCCCTCAAGAAACAACGGA 
GGACATATCAGTAAGAAACAGGCACAAGT- CGAAAAAATTATCCCTCAAGAAACAACGGA 
GGACATATCAGTAAGAAACAGGCACAAGT - CGAAAAAATTATC CCTCAAGAAACAACGGA 
GGACATATCAGTAAGAAACAGGCACAAGT- CGAAAAAATTATCCCTCAAGAAACAACGGA 
GGACATATCAGTAAGAAACAGGCACAAGT - CGAAAAAATTATCCCTCAAGAAACAACGGA 

AAGTAGTCCAACTTTT 

AAGTAGTC CAACTTTT . 

AAGTAGTCCAACTTTT 

AAGTAGTCCAACTTTT 

AAGTAGTCCAACTTTT , 

AAGTAGTCCAACTTTT 

AAGTAGTCCAACTTTT 

AAGTAGTCCAACTTTT 

AAGTAGTCCAACTTTT 

AAGTAGTCCAACTTTT 

AAGTAGTCCAACTTTT 



>SEQ ID MO 2350t63_090 frames 2 

AVEVNAQD I YI I PKGDCYEL YMRI DDERRF ID VFE FNRMAS L I SHFKFVAGMNVGE KRRS 
QLGSCDYELSEGRLVSIiRLSSVGDYRGQESLVIRILYSGHQDLKYWFDNIKQMK^ 
GLYLFSGPVGSGKTTLMYQLASEVFKNKQI ITIEDPVEIKNDKMLQLQLNEDIGMTYDAJj 
IKXSLRHRPDILIIGEIRDOJVTARAVIRASLTGVMVFSTII^^ 

ELENSLKLIAYQRLIGGGSLIDFETGNFKKHSSDKWNRQVDIIiAEEGHISKKQAQVEKII 
PQETTESSPTP 

>SEQ ZD NO 2351s 63_1169NT frames 3 

. LL . NLYYCVFDDERRFIDVFEFNRMASLISHFKFVAGMNVGEKRRS^ 

LVSLRLSSVGDYRGQESLVIRILYSGHQDLKYWFDNIKQMKEVLGTRGIiYIiFSGPVGSGK 

TTLMYQLASEVFKNKQIITIEDPVEIKOT)KMLQIjQLNEDI 

IGE I RDQAT ARAVIRAS IiTGVMVFST IHAKS I PGVYDRIiI ELGVNYQELENS LKLI A YQR 
LIGGGSLIDFETSNFKKHSSDKWNRQVDILAEEGYISKKQAQVEKI IPQETTESSPTF 

>SEQ ID NO 2352i63_18RS21 frames 1 

VQSLAKQVIHQAVEVNAQDI YI I P KGDCYEL YMRI DDERRF IDVF E FNRMAS LI SHFKFV 
AGMNVGEKRRS QLGS CD YELS EGRLVSLRL S S VGD YRGQESLVI RI L YSGHQDL KYWFDN 
I KQMKEVLGI RGL YLFSGPVGSGKTTIiMYQLASEVFKNKQI ITI EDPVEIKNDKMLQLQL 
NEDIG^rITDALIKLSLRHRPDILIIGEIRDQATARAVIRASLTGVMVFSTIHAKSIPGVY 
DRLIELGVNYQELENSI^IAYQRLIGGGSLIDFETGNFKKHSSDKWNRQVDILAEEGHI 
SKKQAQVEKI I PQETTESS PTF 

>SEQ ID NO 2353s 63_2603 frames 1 

DIYIIPKGDCTELYMRIDDERRFIDVFEFNRMASLISHFKWAGMNVGEKIIRSQLGSCDY 
ELSEGRLVSIiRLSSVGDYRGQESLVIRILYSGHQDLKYWFDNIKQMKBVXiGIRGLYLFSG 
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PVGSGKTTLMYQIASEVFKNKQI ITIEDPVE^ 

RPDILI I GE IRDQATARAVI RASLTGVMVFS T IHAKS I P GVYDRL I ELGVNYQELENSLK 
LIAYQRLIGGGSLIDFETGNFKKHSSDKJmQVDILAEEGHISKKQAQVRKNYPSRmGK 
• SNF 

>SEQ ID 170 2354:63_A909 frames 1 

VQ SLAKQVIHQ AVEVNAQD I YI I PKGDCYELYMRIDDERRFI DVFEFNRMASLI SHFKFV 
AGMNVGEKRRS QLGS CD YELS EGRLVS LRL S SVGD YRGQESLVI RI LYS GHQDLKYWFDN 
IKQMKEVLGIRGL YIiFSGPVGSGKTTLMYQLASEVFKNKQI ITIEDPVE I KNDKMLQLQL 
NEDIGMTYDALIKLSLRHRPDILI IGEIRDQATARAVIRASLTGVMVFSTIHAKSI PGVY 
DRLI ELGVNYQELENS LKL IAYQRLI GGGS LI DFETGNFKKHS SDKWNRQVDILAEEGHI ' 
SKKQAQVEKI I PQETTES SPTF 

>SEQ ZD NO 2355:63_CJB110 frame: 1 

VQSLAKQVIHQAVEVNAQDI YI I PKGDCYELYMRIDDERRJ'IDVFEFNRMASLI §HFKFV 
AGMNVGEKRRSQLGS Q3YELSEGRLVSLRLS SVGD YRGQESLVIRIL YSGHQDLKYWFDN 
IKQMKEVLGTRGLYLFSGPVGSGKTTLMYQIiASEVFKNKQIITIEDF^ 
NEDIGMTYDAL I KLSLRHRPD I LI I GEI RDQATARAVI RASLTGVMVF STIHAKS I SGVY - 
DRLI ELGVNYQELENS LKL IAYQRL I GGGSL I DFETGNFKKHS SDKWNRQVD ILAE EGH I 
SKKQAQVEKI I PQETTES SPTF 

>SEQ ID NO 2356 :63_CJB 110 frame: 1 

VQSLAKQVIHQAVEVNAQDI YI I PKGDCYELYMRIDDERRFIDVFEFNRMASLI SHFKFV 
AGMNVGEKRRS QLGS CD YELSEGRLVS LRLS SVGD YRGQE SLVI RI LYS GHQDLKYWFDN 
I KQMKEVLGTRGL YL F S GPVGS GKTTLMYQLASEVFKNKQ I IT I ED P VE I KNDKMLQLQL 
NEDIQ4TYDALIKLSLRHRPDILI IGEIRDQATARAVIRASLTGVMVFSTIHAKSISGVY 
DRLIELGVNYQEIiENSIiKLIAYQRLIGGGSLIDFETGNFKKHS 
SKKQAQVEKI I PQETTES S PTF 

>SEQ ID NO 2357: 63_H36B frame: 1 0 

SLAKQV I HQAVEVNAQDI Y I IPKGDCYELYMRIDDERRFIDVFEFNRMASLI SHFKFVAG 
MNVGBKRRSQLGS CD YELS EGRL VSLRL S S VGD YRGQE S L VI RI LYS GHQDLKYWFDN! K 
QMKEVLGI RGL YLFSGPVGSGKTTLMYQLAS EVF KNKQ 1 1 TI EDPVE I KNDKMLQLQLNE 
DIGMTYDALIKLSLRHRPDILIIGEK 

>SEQ ZD NO 2358i63_JM913<J013 frame: 1 

VQSLAKQVIHQAVEVNAQDI YI I P KGDC YELYMRI DDERRF IDVFE FNRMASLI SHFKFV 
AGMNVGEKRRSQLGSCDYELSEGRLVSLRLSSVGD YRGQESLVI RILYSGHQDLKYWFDN 
I KQMKEVIjGIRGL YLFSGP VGS GKTTLMYQLAS EVFKNKQI ITIEDPVEI KNDKMLQLQL 
NEDIGMTYDALIKLS LRHRPDI LI IGE I RDQATARAVI RASLTGVMVFSTIHAKSI PGVY 
DRLI ELGVNYQELENSLKL IAYQRLI GGGS LI DFETGNFKKHS SDKWNRQVDILAEEGHI 
SKKQAQVEKI I PQETTES SPTF 

>SEQ ZD NO 2359:63_M732 frame: 3 

TCYETL YAYLMMKRRF IDVFEFNRMASL I S HFKFVAGMNVGEKRRSQLGS CD YELS EGRL 
VSLRLSSVGDYRGQESLVIRTLYS GHQDLKYWFDN IK . MKEVLCARGLYLFSGPVGSGKT 
TLMYQLASEVFKNKQI I TI EDPVE I KNDKMLQLQIoNEDIGMTYDALI KLSLRHRPD ILI I 
GE I RDQATARAVI RASLTGVMVFS TIHAKS I PGVYDRL I ELGVNYQELENS LKL IAYQRL 
IGGGSLIDFETSNFKKHSSDKWNRQVDILAEEGHI SKKQAQVEKI I PQETTES S PTF 

>SEQ ZD NO 2360:63_M781 frame: 3 

VEVNAQDIYIIPKGDC^FYMRIDDERRFIDVFEFNRMASLISHFKFVAGMNVGEKRRSQ 
LGS CDYEL S EGRLVSLRLS SVGD YRGQE SLVI RTLYSGHQDLK YWFDNI KQMKEVL CARG 
L YLFSGP VGSGKTTLMYQLAS EVF KNKQ 1 1 TI EDPVEIKNDKMLQLQLNEDIGMTYDAL I 
KLSLRHRPDIL 1 1 GEI RDQATARAVI RASLTGVMVFS TIHAKS I PGVYDRL I EIjGVNYQE 
LENSLKLIAYQRLIGGGSLIDFETSNFKKHSSDKWNRQVDILAEEGHISKKQAQVEKIIP 
QETTESSPTF 

>SEQ ZD NO 23 61:63 COH1 frame: 3 

VIVMKFYMRIDDERRFIDVFEFNRMASLISHFKFVAGMNVGEKRRSQLGSCDYELSEGRL 
VS LRL S S VGD YRGQES LVI RTL YS GHQDLKYW FDNI K 
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SEQ2350 AVEVNAQDIYIIPKGDCYELYMRIDDERRFIDVFEFNRMASLISHFKFV 

SEQ2 351 IiLNLYYCVFDDERRFIDVFEFNRMASLISHFKFV 

SBQ2352 QSLAKQVIHQAVEVNAQDI YI I PKGDCYELYMRIDDERRF IDVFE FNRMASLI SHFKFV 

SKQ2353 - -DIYIIPKGDCTELYMRIDDERRFIDVFEFNRMASLISHFKFV 

SEQ2354 QS LAKQVI HQAVEVNAQD I Y 1 1 PKGDCYELYMRIDDERRFIDVFEFNRMASLI SHFKFV 

SEQ2355 QSLAKQVIHQAVEVNAQDI YI I PKGDCTJfEL YMRIDDERRFIDVFEFNRMASLI SHFKFV 

SEQ2356 QSLAKQVIHQAVEVNAQDIYIIPKGDCYELYMRIDDERRFIDVFEFNRMASLISOT 

SEQ2357 - SIiAKQVI HQAVEVNAQDI YI I PKGDCYELYMRIDDERRFIDVFEFNRMASL I SHFKFV 

SEQ2 358 QSLAKQVIHQAVEVNAQDI YI I PKGDCYELYMRIDDERRFIDVFEFNRMASLI SHFKFV 

SEQ2359 TCYETLYAYLMMKRRFIDVFEFNRMASLI SHFKFV 

SBQ2 360 VEVNAQDIYI I PKGDCYEF YMRIDDERRFIDVFEFNRMASLI SHFKFV 

SEQ2361 . VIVMKFYMRIDDERRFII)VFEFNRMASLISHFKFV 

SEQ2 350 * AGMNVGEKRRSQLGSCHDYELSEGRLVSIiRLSSVGDYRGQESLVIRILYSGHQDLKYWFDN 

SEQ2 351 AGMNVGEKRRS QLGS CD YELSEGRLVSLRLS S VGD YRGQESLVI RI L YS GHQDLKYWFDN 

SEQ2352 AGMNVGEKRRS QLGS CD YElLS EGRLVS LRLSS VGD YRGQESLVI RI LY S GHQDLKYWFDN 

SEQ2353 AGMNVGEKRRSQLGSCDYELSEGRLVSLRLSSVGDYRGQESLVIRILYSGHQDLKYWFDN 

BEQ2354 AGMNVGEKRRSQIjGSCDYELSEGRLVSIiRLSSVC^YRGQESLVIRILYSGHQDLKYWFDN 

SEQ2355 AGMNVGEKRRSQLGS CDYELSEGRLVSLRL SSVGD YRGQE SLV I RI LYS GHQDLKYWFDN 

SEQ2 356 AGMNVGEKRRSQLGSCT)YELSEGRLVSLRLSSVGDYRGQESLVTRILYSGHQDLKYWFDN 

SEQ2357 AGMNVGEKRRSQLGSCDYELSEGRLVSLRLSSVGDYRGQESLVIRILYSGHQDLKYWFDN 

6EQ2358 . AGMNVGEKRRS QLGS CDYELS EGRLVS LRLSS VGD YRGQESLVI RI L YSGHQDLKYWFDN 

SEQ2359 AGMNVGEKRRS QLGS CDYELSEGRLVSLRLSSVGDYRGQESLVTRTL YSGHQDLKYWFDN 
SEQ2360 . AGMNVGEKRRS QIjGSOTYEI*S EGRLVS LRLSS VGD YRGQE SLVIRTLYSCTQDLKYWFDN 

SEQ2361 AGMNVGEKRRSQLGS CDYELS EGRLVS LRL SSVGD YRGQESLVI RTL YS GHQDL KYWFDN 

SEQ2 350 ' IKQMKEVLGTRGL YLF S GP VGSGKTTLMYQLASEVFKNKQ 1 1 T I EDPVE I KNDKMLQLQL 

SEQ2351 IKQMKEVLGTRGL YLFSGPVGSGKTTIjMYQLASEVFKNKQI I TIEDP^ I KNDKMLQLQL 

SEQ2352 IKQMKEVLGIRGLYLFSGPVTSSGKTTLMYQLASEVFKNKQIITIEDPVEIKN^ 

SEQ2353 I KQMKEVLGI RGL YLFSGP VGSGKTTLMYQLASEVF KNKQ 1 1 TIEDP VE I KNDKMLQLQL 

SEQ2354 IKQMKEVLGIRGLYLFSGPVGSGKTTLMYQIjASEVFKNKQIITIEDPTOIKNDKMLQLQL 

SEQ2355 IKQMKEVLGTRGL YLFSGPVGSGKTTLMYQLASEVFKNKQIITIEDPVEIKNDKMLQLQL 

SEQ2356 IKQMKEVLGTRGLYLFSGPVGSGKTTLMYQLASEVFKNKQI ITI EDPVEIKNDKMLQLQL 

SEQ2 357 IKQMKEVLGIRGLYLFSGPVGSGKTTLMYQLASEVFKNKQI ITI EDPVEIKNDKMLQLQL 

SEQ2 358 I KQMKEVLGI RGL YLFS GPVGS GKTTLMYQLASEVFKNKQ 1 1 TI EDPVEIKNDKMLQLQL 

SEQ2359 IK- MKEVLCARGLYLFSGPVGSGKTTLMYQLASEVFKNKQI ITIEDPVEIKNDKMLQLQL 

SEQ23 6 0 IKQMKEVLCARGLYLFSGPVGSGKTTLMYQLASEVFKNKQI I TI ED P VEI KNDKMLQLQ L 

SEQ2361 IK - 

SEQ2350 EDIGMTTOALIKLSIJUIRPDILIIGEIRDQATARAVIRASLTGVMVFSTIHAKSISGVY 

SEQ23 51 EDI GMT YDALI KLSLRHRPDILI IGEIRDQATARAVIRASLTGVMVFSTIHAKS I PGVY 

SEQ2352 EDIGMTYDALI KLSLRHRPDILI I GEIRDQATARAVIRASLTGVMVFSTIHAKS I PGVY 

SEQ2353 EDIGMTYDALIKLSLRHRPDILIIGEIRDQATARAVIRASLTGVMVFSTIHAKSIPGVY 

SEQ2354 EDIGMTYDALI KLSLRHRPDILI I GEIRDQATARAVIRASLTGVMVFSTIHAKS I PGVY 

SEQ2355 EDIGMTYDALI KLSLRHRPDILI I GEIRDQATARAVIRASLTGVMVFSTIHAKS I SGVY 

SEQ2356 EDIGMTYDALI KLSLRHRPDILI IGEIRDQATARAVIRASLTGVMVFSTIHAKS I SGVY 

SEQ2357 EDIGMTYDALI KLSLRHRPDILIIGEK 

SEQ23 5 8 ED I GMTYDALI KLSLRHRP DI L 1 1 GEI RDQAT ARAVI RASLTGVMVF S TIHAKS I PGVY 

SEQ2359 EDI GMTYDAL I KLS LRHRPDI LI I GEIRDQ ATARAVI RASLTGVMVFS TIHAKS I PGVY 

SEQ2360 EDI GMTYDAL I KLSLRHRPDILI I GEIRDQATARAVI RASLTGVMVFS TIHAKS I PGVY 

SEQ2361 - 

SEQ2350 RLIELGVNYQELENSLKLIAYQRLIGGGSLIDFETGNFKKHSSDKWNRQVDILAEEGHI 

SEQ2351 RLIELGVNYQELENSLKLIAYQRLIGGGSLIDFETSNFKKHSSDKWNRQVDILAEEGYI 

SEQ23 52 RLIEIjGVNYQELENSLKLIAYQRLIGGGSLIDFETGNFKKHSSDKWNRQVDILAEEGHI 

SEQ23 53 RLIELGVNYQELENSLKLIAYQRLIGGGSLIDFETGNFKKHSSDKWNRQVDILAEEGHI 

SEQ2354 RLIELGVNYQELENSLKLIAYQRLIGGGSLIDFETGNFKKHSSDKWNRQVDIIAEE(MI 

3EQ2355 RLI ELGVNYQELENS LKLIAYQRL I GGGS L ID FETGNFKKHS S DKWNRQVD I LAEEGH I 

SEQ2 356 RLIELGVNYQELENSLKLIAYQRLIGGGSLIDFETGNFKKHSSDKWNRQVDILAEEGHI 

SEQ2357 

SEQ2358 RLIELGVNYQELENSLKLIAYQRLIGGGSLIDFETGNFKKHSSDKWNRQVDIL^ 

SEQ2359 RLIELGVNYQELENSLKLIAYQRLIGGGSLIDFETSNFKKHSSDKWNRQVDILAEEGHI 

SEQ23 60 RLIELGVNYQELENSLKLIAYQRLIGGGSLIDFETSNFKKHSSDKWNRQVDILAEEGHI 

SEQ2361 - - 
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SEQ2350 
SEQ2351 
SEQ2352 
SEQ2353 
SEQ2354 
SEQ2355 
SEQ2356 
SEQ2357 
SEQ2358 
SEQ2359 
SEQ2360 
SEQ2361 



KKQAQVEKI IPQETTESSPTF 
KKQAQVEKI IPQETTESSPTF 
KKQAQVEKI I PQETTESS PTF 
KKQAQVRKNYP S RNNGKSNF - 
KKQAQVEKI I PQETTESS PTF • 
KKQAQVEKI IPQETTESSPTF 
KKQAQVEKI IPQETTESSPTF 

KKQAQVEKIIPQETTESSPTF 
KKQAQVEKI IPQETTESSPTF 
KKQAQVEKIIPQETTESSPTF . 
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Figure 24: Comparative Sequences relating to SAG0290 
(ABC transporter, substrate-binding protein) 

SEQ ID NO. 2401* SAG0290 PROM THE 1169NT1 GBS TYPE V STRAIN (REVERSE 
COMPLEMENT) 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAA 
TCAAAAAGACGGGAAATTCAAAGGTTATGATGTTGATGT^ 

AAGT AACCTTCAAGACAGTTCCTTTTGATACT ATTT CAACAGGTATTGATGCAGGGAAATTTGATTTAT CA 
GCTAATGATTTTTCATACAATAAAGAAAGAGCAGAAAAATATCTOT 
TTATGCCGTAGTAGGGAAGAAGGGGAGCCATTACAAATCATTAAGTGACCTC^ 
TTTTATCTGGC&TTAACTATGCA^ 

AAAATCAAATATGTTT CTGGGACAACTGGTGTTACTAG CAGATTAAAAAATATTGAGAGTGGGAAAATTGA 

CTTTATCCTATATGATGCCATTTCATCTGACTATA'^ 

CITTGAAAGGTAAAATTGGTAATAATAAGGATGGATTA 

AAAACTCTACAGAAATTTATAAATAAGCGTATTAAAGTTTTGAAAGAAGA 

TAAACAATATTTCGGTGGAGATTACGTTTCAAACATTGATAAA 

SEQ IP NO. 2402: SAG0290 FROM THE 18RS21 GBS TYPE II STRAIN (REVERSE 

COMPLEMENT) * . 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCT^ 

TRAAAAAGACGGGAAATTCAAAGGTTATGATGTTGATGTTGT 

AAGTAACCTTCAAGACAGTTCCTTTTGATACTATTTCAACAGGTATT 

GCTAATGATTTOTCATAC^TAAAGAAAGAGCAGAAAAAT^ 

TTATGCCGTAGTAGGGAAGAAGGGGAGCC^TTACAAATCATTAAGTGACCTCT 

TTTTATCTGGCGTTAACTATGCAC^GGTTCTAGAAAAT^ 

AAAATCAAATATGTTTCTGGGACAACTGGTGTTACTAGCAGATTAAAAAATATTGAG " 
CTTTATCCTATATGATGCCATTTCATCCGACT 

CTTTGAAAGGTAAAATTGGTAATAATAAGGATGGACTAGAATACCTCCTTTTACCAAA 

AAAACTCTACAGAAATTTATAAATAAGCX3TATTAAAGTTTTGAAAGAAAA 

TAAACAATATTTCGGTGGAGATTACGTTTCAAACATTGATAAA 

SEQ ID NO. 2403: SAG0290 FROM THE 2603 V/R GBS TYPE V STRAIN (REVERSE 
COMPLEMENT) 

ATTCAAAGGTTATGATGTTGATGTTGTGAAAGCTGTT 
CAGTTCCTTTTGATACTATTTCAAC^GGTATTG 
TACTUVTAAAGAAAGAGC^GAAAAATATCTCTTCTCAG 
GAAGAAGGGGAGCCATTACAAATCATTAAGTGACCTCTCTGGAA 

ACTATGCACAGGTTCTAGAAAATTGGAATAAAAATC^TCCTAATAAAAAACCAATAAAAAT 
TCTGGGACAACTGGTGTTACTAGCAGATTAAAAAATATTGA 

TGCCATTTCATCCGACTATATTGTAAAAGAC CAAT CATTAAACTTAAGCGTTTCTCCTTTGAAAGGTAAAA 
TTGGTAATAATAAGGATGGACTAGAATACCTCCTTTT^ 

SEQ ID NO. 2404: SAG0290 FROM THE 090 GBS TYPE la STRAIN (REVERSE COMPLEMENT) 

GTATCAGTTCAGGaJT^GAGAAAGTAGAACTTAAA 

TCAAAAAGACGGGAAATTCAAAGGTTATGATGTTC 

AAGTAACCTTCAAGACAGTTCCTTTrGATACT^ 

GCTAATGATTTTTGATACAATAAAGAAAGAGCAGAAAAATATCT 

TTATGCCGTAGTAGGGAAGAAGGOTAGCCATTACAAATCATTAAGTGACCTCTC 

TTTTATCTGGCGTTAACTATGCACAGGTTCTAGAAAAT^ 

AAAATCAAATATGTTTCTGGGACAACTGGTGTTACTAGCAG 

CTTTATCCTATATGATGCCATTTCATCCGACTATATTGTAAAAGACCAAT(^ 

TTGAAAGGTAAAATTGGTAATAATAAGGATGGACTAGAATACCTCCTT^ 

CAGAAATTTATAAATAAGCXSTATTAAAGTTTTGAAAGAAAATGGTACT^ 

GGAGATTACGTTTCAAACATTGATAAA 
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Figure 24: Comparative Sequences relating to SAG0290 
(ABC transporter, substrate-binding protein) 

SEQ ID NO. 2405: SA60290 FROM THE A909 GBS TYPE Xa STRAIN (REVERSE 
' COMPLEMENT ) 

GTATCAGTTCAGGCGTGAGAGAAAGTAGAA 
TCAAAAAGACGGGAAATTCAAAGGTTATGATGTTGATGTTGT 
AAGTAACCTTCAAGACAGTTCCTTTTGATACTATTTCAACAG^ 
. GCTAATGATTTTTCATACAATAAAGAAAGAGCAGAAAAATATCTCTTCTCAGATCCT 
TTATGCCGTAGTAGGGAAGAAGGGGAGCCATTACAAATCATTAAGTGACCT 
TTTTATCT^CGTTAACTATGCACAGGTTCrAGAAAATTGGAATA 
AAAATNAAATATGTTTCTGGGACAACTGGTGTTACTAG<^GATTAA 
CTTTATCCTATATGATGCCATTTCATCCGACTATATTGTA^ 

CTTTGAAAGGTAAAATTGGTAATAATAAGGATGGACTAGAATACCTCCTTTTACCAAAAGA 
AAAACTCTACAGAAATTTATAAATAAGCGT 

SEQ ID NO. 2406: SAG0290 FROM THE CJB110 GBS NONTYPEABLE STRAIN (REVERSE 
COMPLEMENT) " 
GTATCAGTTCAGGCGTGAGAGAAAGTAQAACTTAAAGT^ 
TOUUU^GACGGGAAATTCAAAGGTTA 
° AAGTAACCTTCAAGACAGTTCCTTTTGATACTATTTCAACAG^ 
GCTAATGATTTTTCATACAATAAAGAAAGAGCAGAAAAA 
TTATGCCGTAGTAGGGAAGAAGGGGAGCCATTACAAATC^TTAAGTG 
TTTTATCTGGCGTTAACTATGC^CAGGTTCTAGAAAATTGG 
AAAATCAAATATGTTTCTGGGACAACTGGTGTTACTAGC^ 
CTTTATCCTATATGATGCC^TTTCATCa^CTATATTGTAA 

CTTTGAAAGGTAAAATTGGTAATAATAAGGATGGACTAGAATACCTCCTTTTACCAAAAGATAAAAAAGGT 

AAAACTCTACAGAAATTTATAAATAAGO^^ 

TAAACAATATTTCGGTGGAGATTACGTTTCAAACATTGATAAA 

SEQ ID NO. 2407: SAG0290 FROM THE COH1 GBS TYPE III STRAIN (REVERSE 
COMPLEMENT) 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAG 

TCAAAAAGACX3GGAAATTCAAAGGTTATGACGTTC 

AAGTAACCTTCAAGACAGTTCCTTTTGATACTATTTCAAC^ 

GCTAATGATTTTTCATATAATAAAGAAAGAGCAGAAAAATATCTCT 

TTATGCCGTAGTAGGGAAGAAGGGGAGCCATTACAAATC^TTAAGTGACCTCTCT 

TTTTATCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGAATAAA 

AAAATCAAATATGTTTCTGGGACAACTGGTGTTACTAGCAGATO 

CTTTATCCTATATGATGCCATTTCATCTGACTATATTGTAAAAGATCAATC^ 

CTTTGAAAGGTAAAATTGGTAATAATAAGGATGGATTAGAATACCT 

AAAACTCTACAGAAATTTATAAATAAGCX3TATTAAAGT 

TAAACAATATTTCGGTGGAGATTACX3TTTCAAACATTGATAAA 

SEQ ID NO. 2408: SAG0290 FROM THE H36b GBS TYPE lb STRAIN 
(REVERSE COMPLEMENT) 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTA 

TCAAAAAGACGGGAAATTCAAAGGTTATGATGTTGATGTTGTCA/^ 

AAGTAACCTTCAAGACAGTTCCTTTTGATACTATTTCAAC^ 

GCTAATGATTTTTCATACAATAAAGAAAGAGCAGAAAAATATCTC 

TTATGCCGTAGTAGGGAAGAAGGGGAGCCATTA^ 

TTTTATCTGGCGTTAACTATGCACACMTTCTAGAAAATT^ 

AAAATCAAATATGTTTCTGGGACAACTGGTGTTACr 

CITTATCCTATATGATGCCATTTCATCC^ 

CTTTGAAAGGTAAAATTGGTAATAATAAGGATGGACTAGAATACCTCC^ 

AAAAOTCTACAGAAATTTATAAATAAGCGTATTAAAGTTT^ 

TAAACAATATTTCGGTGGAGATTACGTTTGAAACATTGATAAA 
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Figure 24: Comparative Sequences relating to SAG0290 
(ABC transporter, substrate-binding protein) 

SEQ ID NO . 2409: SAG0290 FROM THE JM9130013 GBS STRAIN VIII (REVERSE 
COMPLEMENT) 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAA 
TCAAAAAGACGGGAAATTCAAAGGTTATGATG 

AAGTAACCTTCAAGACAGTTCCTTTTGATACTATTTCAACAGGTATTGATGCAGC^ 

GCTAATGATTTTTCATACAATAAAGAAAGAGCAGAAAAATATCTCOT 

TTATGCCGTAGTAGGGAAGAAGGGGAGCCATTACAAATCATTAAGTGACCT 

TTTTATCTGK3CGTTAACTATGCACAGG 

AAAATCAAATATCTTTCTGGGACAACTGGTGTTACT 

CTTTATCCTATATGATGCCATTTCATCCGACT 

CTTTGAAAGGTAAAATTGGTAATAATAAGGATGGACT^ 

AAAAOTCTACAGAAATTTATAAATAAGCGTAATAAAGTTTTGAAAGAAAATGGTA 

SEQ ID NO. 2410: SAG0290 FROM THE M732 GBS TYPE III STRAIN (REVERSE 
COMPLEMENT) 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTA 

TCAAAAAGACGGGAAATTCAAAGGTTATGACGTTGATGl^ 

AAGTAACCTTCAAGACAGTTCOTTTTGATACTATTTCAACAGGTATT 

GCTAATGATTTTTGATATAATAAAGAAAGAGCAGAAA 

TTATGCCGTAGTAGGGAAGAAGGGGAGCCATTACAAATC^ 

TTTTATCTGGCGI^AACTATGCACAGGTT 

AAAATCAAATATGTTTCTGGGACAACTGGTGTTACTAGCAGATTAAAAAATATTGAGAGT^ 

CTTTATCCTATATGATGCCATTTCATCTGACTATATTGTAA^ 

CTTTGAAAGGTAAAATTGGTAATAATAAGGATGGATTAGAATACCTCCTT 

AAAACTCTACAGAAATTTATAAATAAC^GTATTA^ 

TAAACAATATTTCGGTGGAGATTACGTTTCAAACATTGATAAA 

SEQ ID NO. 2411: SAG0290 FROM THE M781 GBS TYPE III STRAIN (REVERSE 
COMPLEMENT) 

GTATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCTAC^ 
TCAAAAAGACGC^AAATTCAAAGGTTATGACGTTGATGTTGTCAAA 
AAGTAACCTTCAAGAC^GTTCCTTTTGATACTATTTCAACAGGTAT^ 
GCTAATGATTTTTCATATAATAAAGAAAGAGCAGAAA 

TTATGCCGTAGTAGGGAAGAAGGGGAGCCZATTACAAATCATTAAGTGACCTCTCT 

TTTTATCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGAATAAAAATCATCCT 

AAAATCAAATATGTTOCTGGGAGAACTGGTGTTAOT^ 

CTTTATCCTATATGATGCCATTTCATCTGACTATATTGTAAAAGATCA 

CTTTGAAAGX-WAAAATTGGTAATAATAAGG 

AAAACTCTACAGAAATTTATAAATAAGCGTATTAAAGTTC 

TAAACAATATTTCGGTGGAGATTACX5TTTCAAACATTGATAAA 



SEQ24 0 1 TATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCTACAGATTC^^ 

SEQ2402 TATCAGTTCAGGOSTCAGAGAAAGTAGAACTTAAAGTAGCTACAG^ 

SEQ2403 - 

SEQ2 404 TATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCTACA 

SEQ2405 TAT CAGTTCAGGCGTCAGAGAAAGTAGAACTrAAAGTAGCTA^ CGGCA 

SEQ24 0 6 TATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCra 

SEQ2407 TATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCTACAGAT^ 

SEQ2408 TATCAGTT CAGGCGTCAGAGAAAGTAGAACTTAAAGTAGC TACAGATT CTGACACGGCA 

SEQ2409 TATCAGTTCAGGCGTCAGAGAAAGTAGAACTTAAAGTAGCTACAGATTC^^ 

SEQ2410 TATCAGTTCAGGCGTCAGAGAAAGTAGAACnTAAAGTAGCTACAGATTCT 

SEQ2 411 TATCMTTCAGGOSTCMAGAAAGTAGAACrTAAAGTAGCT 



SEQ2401 CATTTACTTATCAAAAAGACGGGAAATTCAAAGGTTATGATC 

SEQ2402 (^TTTACTTATRAAAAAGACGGGAAATTCAAAGGTTATC 

SEQ2403 ATTCAAAGGTTATGATGTTGATGTTGTCAAAGCT 

SEQ2404 CATTTACTTAT CAAAAAGACGGGAAAT TCA^GGTTATGATGTTGATGTTGTCAAAGCT 

SEQ2405 CATTTACTTATCAAAAAGACXK3GAAAT TCAAAGGTTATGATGTT^ 

SEQ24 0 6 CATTTACTTATCAAAAAGA(X3GGAAATTCAAAGGTTA 

SEQ2407 CATTTACI^ATCAAAAAGACGGGAAATTCAAAGGTTATGAC^ 

SEQ240 8 CATTTACTTATCAAAAAGACGGGAAATTCAAAGCT 

SEQ2409 CATTTACTTAT CAAAAAGACX3GGAAATTCAAAGGTTATGATO 
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Figure 24: Comparative Sequences relating to SAG0290 
(ABC transporter, substrate-binding protein) 



SEQ2410 
SEQ2411 

SEQ2401 
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SEQ2404 
SEQ2405 
SEQ2406 
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SEQ2406 
SEQ2407 
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SKQ2409 
SEQ2410 
SEQ2411 

SEQ2401 
SEQ2402 
SEQ2403 
SEQ2404 
SEQ2405 
SEQ2406 
SEQ2407 
SEQ2408 
SEQ2409 
SEQ2410 
SEQ2411 

SEQ2401 
SEQ2402 
SEQ2403 
SEQ2404 
SEQ2405 
SEQ2406 
SEQ2407 
SEQ2408 
SEQ2409 
SEQ2410 
SEQ241X 

SEQ2401 
SEQ2402 
SEQ2403 
SEQ2404 
SEQ2405 
SEQ2406 
SEQ2407 
SEQ2408 
SEQ2409 
SEQ2410 
SEQ2411 

SEQ2401 
SEQ2402 
SEQ2403 
SEQ2404 
SEQ2405 
SEQ2406 
SEQ2407 
SEQ2408 
SEQ2409 



CATTTACTTAT CAAAAAGACGGGAAATT CAAAGGTTATGACGTTGATGTTGTCAAAGCT 
CATTTACTTAT CAAAAAGAG^GAAATTCAAAGGTTATGACXSTTGATGTTGTCAAAGCT 

GTTTTTAAAGGTAGTAAGTAC^U^GTAACCTTCAAGACAGT^ 
GTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGACAGTTCCTTTTGAT^ 
GTTTTTAAAGGTAGTAAGTAOU^GTAACCTTCAAGACAGTTCCTTTTGATA 
GTTTTTAAAGGTAGTAAGTACAAAGTAACCTCCAAGA<^ 

GTTTTTAAAGGTAGTAAGT ACAAAGTAACCTT CAAGACAGTTCCTTTTGATACTAT TTCA 

GTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGACAGTTCCTT^ 

GTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGACAGT^ 

GTTTTTAAAGGTAGTAAGTACAMGTAACCTTCAAGACAGTTCCTTTTGA 

GTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGAC 

GTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGACAGTTCCTTTTGATACTATTT^ 
GTTTTTAAAGGTAGTAAGTACAAAGTAACCTTCAAGACAGTTCCT^ 

ACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGATOT 

AC^GGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGA 

ACAGGTATTGATGCAGGGAAATTTGATTTATCAGC^ 

ACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGATTTTTC^ 

ACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGATTTTrCA 

ACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGATTTTTC^ 

ACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATG^ CATATAATAAAGAA 

ACAGGTATTGATGCAGGGAAATTTGATTTATC^GCTA^ 

ACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGATTTT^ 

ACAGGTATTGATGCAGGGAAATTTGATTTATCAGCTAATGA 

ACAGGTATTGATGCAGGGAAATTTGATTTATCAG CTAATGATTTTTCATATAATAAAGAA 

AGAGCAGAAAAATATCTCTTCTCAGACCCTATATCCCGTTCAAATTATGCCGTAGTAGGG 

AGAGC^GAAAAATATCTCTTCTCAGATCCTATATCCCGTTCAAATTATGCCGTAGTAGGG 

AGAGCAGAAAAATATCTCTTCTCAGATCCTATATCCCGTTCAAATTATGCCGTAGTAGGG 

AGAGCAGAAAAATATCTCT TCT CAGATCCTATATCCCGTT CAAATTATGCCGTAGTAGGG 

AGAGCAGAAAAATATCTCTTCTCAGATCCTATATCCCGTTCAAATTATGCCG 

AGAGCAGAAAAATATCTCTTCTCAGATCCTATATCCCGTTCAAATTATGCCGTAGTAGGG 

AGAGCAGAAAAATATCTCTTCTCAGATCCTATATCCCGTT 

AGAGCAGAAAAATATCTCTTCT CAGATCCT ATATC CCGTTCAAATTATGCCGTAGTAGGG 
AGAGCAGAAAAATATCTCTTCT CAGATCCTATATCCCGTT CAAATTATGCCGTAGTAGGG 
AGAGCAGAAAAATATCTCTTC!TCAGATCCrrATATCCCGTTCAAATTATGC 
AGAGCAGAAAAATATCTCTTCTCAGATCCTATATCCCGTTCAAATTATGCCGTA 

AAGAAGGGGAGCCATTACAAATCATTAAGTGACCT CTCTGGAAAAT CAACAGAAGTTTTA 
AAGAAGGGGAGCCATTAC!AAATCATTAAGTGACCT CTCTGGAAAAT CAACCGAAGTTTTA 
AAGAAGGGGAGCCATTACAAATCATTAAGTGACCT CTCTGGAAAAT CA^ 
AAGAAGGGGAGCCATTACAAATCATTAAGTGACCT CTCTGGAAAAT CAACOT TTTA 
< AAGAAGGGGAG CCATTACAAATCATTAAGTGACCT CTCTGGAAAAT CAACCGAAGTTTTA 
AAGAAGGGGAGCCATTACAAATCATTAACTGACCT CTCTGGAAAATCIA^ 
AAGAAGGGGAGCCATTACAAATCATTAAGTGACCTCTCTGGAA 

AAGAAGGGGAGCCATTACAAATCATTAAGTGACCTCTCTGGAAAAT CAACCGAAGTTTTA 
AAGAAGGGGAGCCATTACAAATCATTAAGTGACCT CTCTGGAAAATCAACCGAAGTTTTA 
AAGAAGGGGAGCCATTACAAATCATTAAGTGACCTCTCTGGA 
AAGAAGGGGAGCCATTACAAATCATTAAGTGACCTCTCTGGAAAATCAAC^ 

TCTGGCGTTAACTATGCACAGGTT CTAGAAAATTGGAATAAAAATCATCCTAATAAAAAA 
TCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGA^ 
TCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGAATAAAAATCA 
TCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGAA 

TCTGGCX3TTAACTATGCACAGGTT CTAGAAAATTGGAATAAAAATCATNNTAATAAAAAA 

TCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGAATAAA 

TCTGGCGTTAACTATGCACAGGTTCEAGAAAATTGGAA 

TCTGGCGT TAACTATGCACIAGGTTCTAGAAAATTGGAATAAAAATCAT CCT AATAAAAAA 
TCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGAATAAAAAT 

TCTGGCGTTAACTATG CACAGGTTCTAGAAAATTGGAATAAAAATCATCCT AATAAAAAA 
TCTGGCGTTAACTATGCACAGGTTCTAGAAAATTGGAATAAAA^ 

CCAATAAAAATCAAATATGTTTCTGGG ACAACTGGTGTTACT CAGATTAAAAAATATT 
CCAATAAAAATCAAATATGTTTCTGGGACAACTGGTGTTACT 

CCAATAAAAAT CAAAT ATGTTT CTGGGACAACTGGTGT TACTAGCAGATTAAAAAATATT 

C CAATAAAAATCAAATATGTTT CITGGGACAACTGGTGTTACT 

C C^NTAAAAATNAAATATGTTT CTGGGACAACTGGTGTTAC^ 

CCAATAAAAATCAAATATGTTTCTGGGAC^AACTGGTGTTACT 

CCAATAAAAATCAAATATGTTTCTGGGACAACTGGTGTTACTAGCAGAT^ 

CCAATAAAAATCAAATATGTTTCTGGGACA^ 

CCAATAAAAATCAAATATGTTTCTGGG ACTGGTGTTACTAGCAGATTAAAAAATATT 
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SEQ2410 
SEQ2411 

SEQ2401 
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SEQ2410 

SEQ2411 

SEQ2401 
SEQ2402 
SEQ2403 
SEQ2404 
SEQ2405 
SEQ2406 
SEQ2407 
SSQ2408 
SEQ2409 
SEQ2410 
SEQ2411 

SEQ2401 
SEQ2402 
SEQ2403 
SEQ2404 
SEQ2405 
SEQ2406' 
SEQ2407 
SEQ2408 
SEQ2409 
SEQ2410 
SEQ2411 



CCAATAAAAATC^UUVTATGTTTCIX3GGACAACTGG 

C CAATAAAAATCAAATATGTTT CTGGGACAACTGGTGTTACTAGCA^ 

GAGAGTGGGAAAATTGACTTTATC CTATATGATGCCATTTCATCrGACTATATTGTAAAA 
GAGAGTGGGAAAATTGACTTTATC CTATATGATGC CATTT CATC CGACTATATTGTAAAA 
GAGAGTGGGAAAATTGACTTTATCCTATATGATGCCATTTCATCCGACT 
GAGAGTGGGAAAATTGACTTTATCCTATATGATGC CATTT CATCCGACTATATTGTAAAA 
GAGAGTGGGAAAATTGACTTTATC CTTATATGATGC CATTTC^TCCGAOTATATTGTAAAA 
GAGAGTGGGAAAATTGACTTTATCCTATATGATGCCATTTCATCCGACT 
GAGAGTGGAAAAATTGACTTTATCCTATATGATC 
GAGAGTGGGAAAATTGACTTTATCCTATATGATC 

GAGAGTGGGAAAATTGACTTTATCCTATATGATGCCATTTCATCCGACT 
GAGAGTGGAAAAAT TGACTTTATC CTATATGATGC CATTT (^TCTGACTATATTGTAAAA 
GAGAGTGGAAAAATTGACTTTATC CTATATGATGCCATTT CATCTGACTATATTGTAAAA 

GATCAATCATTAAACTTAAGCX^TTTCTCCrm 

GACCAATCM^AAACrTAAGOSTTTCT^ 
GACCAATCATTAAACTTAAGCGTTTCTCCTTTGAAAGGTA^ 

gaccaatcattaaacttaagottttctcctttgaaaggta^ 

gaccaatcattaaacttaagcgtttctcctttgaaaggtaaaa 

gatc^tcattaaacttaagcgtttctcctttgaaag^ 

gaccaatcattaaacttaagastttctcctttgaa^ 

gaccaatcattaaacttaagcgot 

GATCAATCATTAAACrTAAGCGTTTCTCCriTT 
GATCAATCATTAAACTTAAGCGTTTCTCCITTC 

GGATTAGAATACCTCCTTTTACCAAAAGATAAAAAAGGTAAAACTC 
GGACTAGAATACCTCXTTTTACCAAAAGATAAAAAAGGTAAAACTCra 

GGACTAGAATACCTCCTTTTACCAAAAGATAAAAAAG 

GGACTAGAATACCTCCTTTTACCAAAAGATAAA 

GGACTAGAATACCTCCTTTTACCAAAAGATAAAAAAGGTAAAACTCTACAGAAATTTATA 
GGACTAGAATACCTCC!TTTTACCAAAAGATAAAAAAGGT 

GGATTAGAATACCT CCTTTTACCAAAAGATAAAAAAGGTAAAACTCTACAGAAATTTATA 
GGACTAGAATACCTCCTTTTACCAAAAGATAAAAAAGGTAAAACTCTACAGAAATTTATA 
GGACTAGAATACCTCCTTTTACCAAAAGATAAAAAAGGTAAAACT 

GGATTAGAATACCTCCTTTT AC CAAAAGATAAAAAAGGTAAAACTCTACAGAAATTTATA 
GGATTAGAATACCTCCTTTTAC CAAAAGATAAAAAAGGTAAAACTCTACAGAAATT TATA 

ATAAGCGTATTAAAGTTTTGAAAGAAGATGGTACTTTGGCACGTTTAAGTAAACAA 
ATAAGCGTATTAAAGTTTTGAAAGAAAATGGTACTTTGGCAC^ 

ATAAGCGTATTAAAGTTTTGAAAGAAAATGGTACTTTGGCACGTTTAAGTAAACAA 

ATAAGCGT 

ATAAGCXjTATTAAAGTTTTGAAAGAAAATGGTACTT^ 

ATAAGCGTATTAAAGTTTTGAAAGAAGATGGTACTTTGGCACGTTTAAGTAAACAATAT 
ATAAGCGTATTAAAGTTTTGAAAGAAAAT^TACTTTGGC^ 

ATAAGCGTAATAAACTTTTGAAAGAAAATGGTA — 

ATAAGCGTATTAAAGTTTTGAAAGAAGATGGTACTTTGGCACGTTT 
ATAAGCGTATTAAAGTTTTGAAAGAAGATGGTACTTTGGCACGTTTAAGTA 

TCGGTGGAGATTACGTTT CAAACATTGATAAA - 

TCGGTGGAGATTACXjITTCAAACATTGATAAA 

TCGGTGGAGATTACGTTTCAAACATTGATAAA 

TCGGTGGAGATTACGTTTCAAACATTGATAAA 

TCGGTGGAGATTACGTTTCAAACATTGATAAA 

TCGGTGGAGATTACGTTTCAAACATTGATAAA 

TCGGTGGAGATTACGTTTCAAACATTGATAAA- - 

TCX3GTGGAGATTACGTTTCAAACATTGATAAAGTR 
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Figure 24: Comparative Sequences relating to SAG0290 
(ABC transporter, substrate-binding protein) 



SEQ2401 

SEQ2402 

SEQ2403 

SEQ2404 

SEQ2405 

SBQ2406 

SEQ2407 

SBQ2408 

SEQ2409 

SEQ2410. 

SEQ2411 RANSRTRSTBSTRATBNDNGRTN 



>SEQ ZD NO 2450: 8_1169NT frame i 1 

VSVQASEKVELKVATD SDTAPFT YQKDGKFK6YDVDWKAVFKGSKYKVTFKTVPFDTI S 
TGIDAGKFDLSANDFSYNKERAEKYLFSDPISRSNYAWGKKGSHYKSIjSDLSGKSTEVIi 
SGVNYAQVLENWNKNHPNKKPI KI KYV S GTTGVTS RLKNI ES GKI D F I L YDAI S SD YI VK 
DQS LNLSVS PLKGKI GNNKDGL EYLLLPKDKKGKTLQKF I NKRI KVLKEDGTLARL SKQ Y 
FGGDYVSNIDK 

>SEQ ID HO 2451:8_18RS21 frames 1 

VSVQAS EKVELKVATD SDTAPFTYXKDGKFKG YDVDVVTCAVFKGS KYKVTFKTVP FDT I S 
TGIDAGKFDLSANDFS YNKERAEKYLFSDP I SRSNYAVVGKKGSHYKS LSDLSGKS TEVL 
SGVNYAQVLENWNKNHPNKKPI KIKWSGTTGVTSRLK^ 

DQSLNLSVS PLKGKZGNNKDGLEYIiLLPKDKKGKTLQKF INKRI KVLKENGTLARLSKQ Y 
FGGDYVSNIDK 

>SEQ ID NO 2452t8_2603 frame:- 2 

FKGYDVDVVKAVFKGSKYKVTFKTVPFDTISTGIDAGKFDIiSANDFSYNKER 
PISRSNYAWGKKGSHYKSLSDLSGKSTEVLSGVNYAQVLENWNKNH^ 
TTGVTSRLKNI ESGKIDF I L YDAI S S D YI VKDQS LNLS VS PLKGKI GNNKDGLEYLLLP K 
DKK 

>SEQ ID NO 2453:8_090 frame: X 

VSVQAS EKVELKVATD SDTAP F TYQKDGKFKG YDVDWKAVFKGS KYKVTFKTVP FDT I S 
TGIDAGKFDLSANDFS YNKERAEKYLFSDP I SRSNYAWGKKGSHYKSLSDLSGKSTEVL 
SGV^AQVI^BJWNKMIPNKKPIKIKYVSGTTGVT^ 

DQSLNLSVS PLKGKI GNNKDGL EYLLLPKDKKGKTLQKF INKR I KVLKENGTLARL S KQ Y 
FGGDYVSNIDK 

>SEQ ID NO 2454:8_A909 frames 1 

VSVQAS EKVEL KVATDS DT AP FTY QKDGKF KG YDVDWKAVFKGS KYKVT F KTVPFDT I S 
TGI DAG KFDIoSANDFS YNKERAEKYLFSDP I SRSNYAVVGKKGSHYKS LSDLSGKS TEVL 
SGVNYAQVLENWNKNHXNKKPXKXKYVSGTTGVTSRLKNI ESGKI DF I LYDAI S SD YIVK 
DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKKGKTLQKFINKR 

>SEQ ID NO 2455s 8_CJB110 frames 1 

VSVQAS EKVELKVATDSDTAPF TYQ KDGKFKG YDVDVVKAVFKGS KYKVTF KTV PFDTI S 
TGI DAGKFDLSANDFS YNKERAEKYLFSDP I SRSNYAWGKKGSHYKSLSDLSGKS TEVL 
SGVNYAQVLENWNKNHPNKKPI KI KYVSGTTGVTSRLKNI ESGKIDFI LYDAI S SDYIVK 
DQSLNLSVSPLKGKIGNNKDGLEYLIiLPKDKKGKTIjQKFINKRIKVL 
FGGDYVSNIDK 

>SEQ ID NO 2456s 8_COHl frames 1 

VSVQAS EKVELKVATDSDTAPFTYQKDGKFKGYDVDVVKAVFKGSKY 

TGI DAGKFDLSANDFS YNKERAEKYLFSDP I SRSNYAVVGKKGSHY1CSLSDLSGKS TEVL 

SGVNYAQVLENWNKNHPNKKPI KIKYVSGTTGVTSRLKNI^ 

DQSIiNLSVSPLKGKIGNNKDGLEYLIiLPKDKKGKTLQKFINKRIKVLKETC 

FGGDYVSNIDK 

>SEQ ID NO 2457i8_H36B frames 1 

VSVQAS EKVELKVATDSDTAPFTYQKDGKF KGYDVDWKAVFKGS KYKVTF KTVPFDTI S 
TGI DAGKFDLSANDFS YNKERAEKYLFSDP I SRSNYAWGKKGSHYTCS LSDLSGKS TEVL 
SGVNYAQVLENWNKNHPNKKPIKIKYVSGTTGVT 

DQS LNLSVS PLKGKI GNNKDGLEYLLLPKDKKGKTIjQKF INKR I KVLKE^ 
FGGDYVSNIDK 
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Figure 24: Comparative Sequences relating to SAG0290 
(ABC transporter, substrate-binding protein) 

>SEQ ID NO 2458;8_JM9130013 frame: 1 

VSVQ AS EKVELKVATDSDTAPFTY QKDGKF KG YD VDWKAVFKGS KYKVTF KTVP PDT I S 
TG IDAGKFDLS ANDFS YNKERAEKYLFSDP I SRSNYAVVGKKGSHYKSLSDLSGKSTEVL 
SGVNYAQVLENWNKNHPNKKPI KI KYVSGTTGVTS RLKNIESGKIDFI LYDAI SSD YIVK 
DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKKGKTLQKFINKRNKVL 

>SEQ ID NO 2459 1 8_M7 32 frames 1 

VSVQAS EKVELKVATD S DTAPFTYQKDGKFKG YDVDWKAVFKGS KYKVTF KTVP FDT I S 
TGIDAGKFDLS ANDFSYNKERAEKYLFSDPISRSNYAWGKKGSHYKSLSDLSGKSTEV^ 
SGVNYAQVLENWNKNHPNKKP I KI KYVSGTTGVTS RLKNI ESGKIDFI LYDAI SSDYIVK 
L7QSLNLSVSPLKGKIGNNKDGLEYLLLPKDKXGCT 
FGGDYVSNIDK 

>SEQ ID NO 2460 i 8_M7 81 frame x 1 

VSVQAS EKVELKVATDSDTAPFTYQKDGKFKGYDVDVVKATO 

TGIDAGKFDLS ANDFS YNKERAEKYLFSDP I SRSNYAVVGKKGSHYKSLSDLSGKSTEVL 
SGVNYAQVLENWNKNHPNKKP I KI KYVSGTTGVTSRIiKNI ESGKI DFI LYDAI S SD Y I VK 
DQSliNLSVSPLKGKIGNNKDGLEYLLLPKDKKGOT 
FGGDYVSNIDK 



SEQ24 5 0 SVQASEKVELKVATDSDTAP FT YQKDGKFKGYDVDWKAVFKGS KYKVTF KTVP FDT IS 

SEQ2451 S VQ ASEKVELKVATDS DTAPFTYXKDGKFKGYDVDVVKAVFKGS KYKVr F KT VP FDTI S 

SEQ2452 FKGYDVDVVKAVFKGS KYKVTFKTVPFDTI S 

SEQ2453 SVQAS EKVELKVATDS DTAPF TYQKDGKFKGYDVD VVKAVFKGS KYKVTFKTVP FDT I S 

SEQ2454 SVQASEKVELKVATDSDTAPFTYQKDGKFKGYDVDVVKAVFKGSICY S 

SEQ2 455 SVQASEKVELKVATDSDTAP FTYQKDGKFKGYDVDVVKAVFKGSKYKVTFKTVPFDTIS 

SEQ245 6 SVQAS E KVELKVATDSDTAP FT YQKDGKFKGYDVDVVKAVFKGS KYKVTFKTVP FDTI S 

SEQ2457 SVQAS EKVELKVATDS DTAPFT YQKD GKFKGYDVD WKAVFKG S KYKVTFKTVP FDT I S 

SEQ24 5 8 SVQAS EKVELKVATDS DTAP FTYQKDGKFKG YDVDWKAVFKGS KYKVTFKTVP FDTI S 

SEQ2459 SVQAS EKVELKVATDS DTAPFTYQKDGKFKGYDVDVVKAVFKGS KYKVTFKTVP FD S 

SEQ246 0 SVQ ASEKVKLKVATDSDTAP FT YQKTX5KFKGYDVDVVKAVFKGSKYKV r *K J i J VP FDT I S 

SEQ245 0 TGIDAGKFDLSANDFS YNKERAEKYLFSDP I SRSNYAWGKKGSHYKSLSDL SGKSTEVL 

SEQ2451 TGIDAGKFDLS ANDFS YNKERAEKYLFSDP I SRSNYAVVGKKGSHYKSLSDLSGKSTEVL 

SEQ2 452 TGIDAGKFDLSANDFS YNKERAEKYLFSDP I SRSNYAVVGKKGSHYKSLSDLSGKSTEVL 

SEQ2453 TGI DAGKFDLS ANDFS YNKERAEKYLFSDP I SRSNYAVVGKKGSHYKSLSDLSGKSTEVL 

SEQ2454 TGIDAGKFDLS ANDFS YNKERAEKYLFSDPI S RSNYAWGKKGSH YKSLSDLSGKSTEVL 

SEQ2455 TGIDAGKFDLSANDFSYNKERAEKYLFSDPISRSNYAVVGKKGSHYKSLSDLSGKSTEVL 

SEQ2456 TGIDAGKFDLSANDFSYNKERAEKYLFSDPISRSNYAWGKKGSHYKSLSDLSGKSTEVL 

SEQ2457 TGIDAGKFDLSANDFSYNKERAEKYLFSDPISRSNYAWGKKGSHYKSLSDLSGKSTEVL 

SEQ2 458 TGIDAGKFDLSANDFS YNKERAEKYLFSDPISRSNYAVVGKKGSHYKSLSDLSGKSTEVL 

SEQ245 9 TGIDAGKFDLSANDFSYNKERAEKYLFSDPISRSNYAVVGKKGSHYKSLSDLSGKSTEVL 

SEQ2460 TGIDAGKFDLSANDFSYNKERAEKYLFSDPISRSNYAWGKKGSHYKSLSDLSGKSTEVL 

SEQ2450 SGVNYAQVLENWNKNHPNKKPIKIKYVSGTTGVTSRLKNIESGKIDFIL 

SBQ2451 SGVNYAQVLEIJWNKNHPNKKPIKIKWSGTTGVTSRLKNIESGKIDFILYDAIS 

SEQ2452 SGVNYAQVLENWNKNHPNKKPI KI KYVSGTTGVTSRLKNI ESGKIDFI LYDAIS SDYTVK 

SEQ245 3 SGVNYAQVLENWNKNHPNKKPI KI KYVSGTTGVTSRLKNI ES 

SBQ2454 SGVNYAQVLENWNKNHXNKKPXKXKYVSGTTGVTSRLKN 

SEQ2455 SGVNYAQVLENWNKNHPNKKP I KI KYVSGTTGVTSRLKNI ESGKIDFI LYDAI S SDYTVK 

SEQ24S6 SGVNYAQVLENWNKNHPNKKP I KIKYVSGTTGWS RLKNI ESGKI DFI LYDAIS 

SEQ2457 SGVNYAQVLENWNKNHPNKKPIKIKYVSGTTGVTSR^ 

SEQ2458 SGVNYAQVLENWNKNHPNKKPI KI KYVSGTTGVTS RLKNI 

SBQ2459 SGVNYAQVLENWNKNHPNKKP I KIKYVSGTTGVTSRLKNIESGKIDFIL YD AISS 

SEQ24 6 0 SGVNYAQVLENWNKNHPNKKPI KI KYVSGTTGVTSRLKNI ESGKIDF I LYDAI S SD YIVK 

SEQ24S0 DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKKGKTLQKFINKRI 

SEQ2451 DQSLNLSVSPLKGKIGNNKDGLETYLLLPKDKKGKTLQKFINKRIK^ 

SEQ2452 DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKK 

SEQ2 453 DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKKGKTI^ 

SEQ2 454 DQS LNL SVS PL KGKI GNNKDGLEYLLL P KDKKGKTLQKF INKR 

SEQ2455 DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKKGKTIjQKFINKRI 

SEQ2456 DQS LNLSVSPIiKGKI GNNKDGLE YLLLPKDKKGKTLQKF I NKR I KVLKEDGTLARLSKQY 

SBQ2457 DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKKGKTLQKFINKRIKV^ 

SEQ2458 DQSLNLSVSPLKGKI GNNKDGLEYLLLPKDKKGKTLQKFINKRNKVLKENG 

SEQ2 459 DQSLNLSVS PLKGKIGNNKDX3LEYLLLPKDKKGKTLQKF INKRI KVLKEDGTLARLSKQY 

SEQ2460 DQSLNLSVSPLKGKIGNNKDGLEYLLLPKDKKGKTLQKFINKRI KVLKEDGTLARLSKQY 
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Figure 24: Comparative Sequences relating to SAG0290 
(ABC transporter, substrate-binding protein) 
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Table 25: Comparative Sequences relating to SAG0368 
(protein of unknown function) 

SEQ ID NO. 2501: SAG0368 PROM THE 090 GBS TYPE la STRAIN 

TATAATTTTTCGACTAATGAATTGTC^ 

GAAACAAAGCCGTTTTCAATACTATTAATGGGGGTGGACAGAGGTTCAGAGCATCC5AA 

AGCGATTCTATGATCTTAGTGACTATAAATCCTAAAACTAATAAAACy^CGATGACAAGCOT 

ATTAAATTGAGTGGTCCCAAAAATAATGGACAGACTGGAGTAGAAGCAAAGCT 

GCX3GAAATGGCATTGATGACTGTTCAAGACTTATTAGATATTAATGOT 

TOAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGTAACTAAT 

GAACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAATAAATGGAGAACAAG 

CGCTATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAATOTGAAGTAATTCAAAAAGTCCTTA 

TTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTCCGC^ 

TCATCAAAAACGATTCCTAATTTGTTAGCTTATAAAGAOT 

GACGCTACTTTATCAGATGGTGGCTCTTATCAAATTTTAAOTAAGAAACATCTACTTGC^ 

AAAGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACT^GCGCGATTCTATATGAAGATTACTATGGTAC 

AGTAATGATTCTTCTACTTATTCATCAACACAAGAGAATAATTATAATACAACACCTTATO 

TACAGTGGTAATACTACTTATAGTTCTGAGACTAATCAAACAACTCATGAAAATTACTA^ 

AGTAACTATAGCAGTAAC^CTAAGACAGGTCAGGCTGA 

CCTAATCCA 

SEQ ID NO. 2502s SAG0368 FROM THE 1169NT1 GBS TYPE V STRAIN 

TATAATTTTTCGACTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCTAGCTAAATCA 

GAAACAAAGCCGTTTTCAATACTATTAATGGGGGTGGACACAGGTTC^GAG 

TAGCGAOTCTATGATCTTAGTCACTATAAATCCTAAAACTAATAAAACAACGATGAC^ 

GATTAAATTGAGTGGTCCCAAAAATAATGGACAGACTGGCGTAGAAGCAAAGCTAAATGCAGCCTATGCTTCTGGT^ 
TGCGGAAATGGCATTGATGACTGTTCAAGACTTATTAGATATTAATGTTGATTACTOT 

ATTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGTAACTAATAAATTTGACTTTCCAATATCAATTGCTGC^^ 

TGAACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAATAAATGGAGAACAAGCACTTGTT 

GCGCTATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTA 

ATTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTCCGC^ 

ATCATCAAAAACGATTCCTAATTTGTTAGCTTATAAAGATT 

AGACGCTACTTTATCAGATGGTGGCTCTTATCAAATTTTAACTAAGAAACATC^ 

GAAAGAACTAGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCTATATGAAGATTACTATGGTACT^ 

TAGTAATGATTCTTCTACTTATTCATCAACACAAGAGAATAATTATAATACAACACCTTATTCA 

TTACAGTGGTAATACTACTTATAGTTCTGAGACTAATCAAACAACTCATCAAAGTTACTATAATAGTAG^ 

TAATAACTATAGCAGTAAGACTAACACAGGTCAGGCTGATTCAAGTGGAA^ 

GCCTAATCCA 

SEQ ID NO. 2503 SAG0368 FROM THE 18RS21 GBS TYPE II STRAIN 

TATAATTTTTCGACTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCTAGCTAAATCAAAAAGTCAT 

GAAACAAAGCCGTTTTCAATACTATTAATGGGGGTGGACACAGGTTCAGAGCATCGAAAATCT 

AGCGATTCTATGATCTTAGTCACTATAAATCCTAAAACTAATAAAACAACGATGACAAGCTTAG 

ATTAAATTGAGTGGTCCCAAAAATAATGGACAGACTGGAGTAGAAGCAAAGCTAAATGC^ 

GCGGAAATGGCATTGATGACTGTTCAAGACTTATTAGATATTAATGTTGATra 

TTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGTAACTAATAAATTTGACTT 

GAACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAATAAATGGAGAACAAGCACT 

CGCTATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAATTC^^ 

TTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTC 

TCATCAAAAACGATTCCTAATTTGTTAGCTTATAAAGATTCATTGGAACATATTAAATCT 

GACGCTACTTTATCAGATGGTGGCTCTTATCAAATTTTAACTAAGAAACATCTACTTGCAG^ 

AAAGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCTATATGAAGATTACTATC^ 

AGTAATGATTCTTCTACTTATTCATCAACACAAGAGAATAATC 

TACAGTGGTAATACfTACTTATAGTTCTGAGACTAATCAAACAACT 

AGTAACTATAGCAGTAACACTAACACAGGTCAGGCTGATTCAAGTGGAAGTGTGAATAATCATi^ 
CCTAATCCA 
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Table 25: Comparative Sequences relating to SAG0368 
(protein of unknown function) 

SEQ ID NO. 2504s SAG0368 FROM THE 2603 V/R GBS TYPE V STRAIN 

TATAATTTTTCGACTAATGAATTGTCTAAGACTTTTAAAGATTTTAAG 

GAAACAAAGCCGTTTTCAATACTATTAATGGGGGTGGACACAGG 

AGCGATTCTATGATCTTAGTCACTATAAATCCTAAAACTAATAAAAG 

ATTA^TTGAGTGGTCCCAAAAATAATGGACAGACTGGAGTAGAAGC^ 

GCGGAAATGGCATTGATGACTGTTCAAGACTTATTAGAT^ 

TTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGTAACTAA 

GAACCAGAGTACyVAGGCTGTTGOTGAACCAGGGACACATAAAATAAATGGAGAAC^^ 

CGCTATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAATTCAAA?^ 

TTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTCCGCAGT^ 

TCATCAAAAACGATTCCTAATTTGTTAGCTTATAAAGATTCATTGGAACATATTAAATCT 

GACGCTACTTTATCAGATGGTGGCTCTTATC^AATTTTAAC^ 

AAAGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCTATATGAAGATTAC 
AGTAATGATTCTTCTACTTAOTCATCAACACAAGAGAAT^ 

TACAGTGGTAATACTACTTATAGTTCTGAGACTAATCAAACAACTGATCAAAATTACT 

AGTAACTATAGCAGTAACACTAACACAGGTCAGGCTGATTCAAGTGGAAGTC 

CCTAATCCA 

SEQ ID NO. 2505: SAG0368 FROM THE A909 GBS TYPE la STRAIN 

TATAATTTTTCGACTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCT 
GAAACAAAGCCGTTTTCAATACTAITAATGGGGGTGGACAC^ 

AGCGATTCTATGATCTTAGTCACTATAAATCCTAAAACTAATAAAACAACGATGACA^ 

GCGGAAATGGCATTGATGACTGTTCAAGACTTATTAGATATTAATGTTGATTACTTTATGCAAATTAATATGC^ 
TTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGTAACTA^ 

GAACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAATAAATGGAGAACAAG^ 

OTCTATGATGATCC^GAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAA 

TTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTCCGCAGTAACTAATAA 

TCATCAAAAACGATTCCTAATTTGTTAGCTTATAAAGATTCATTGGAACATATTAAATCTTATCA 

GACGCTACTTTATCAGATGGTGGCTCTTATCAAATTTTAACT^ 

AAAGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAGOTCGATTCTATATGAAGA 
AGTAATGATTCTTCTACTTATTCATCAACACAAGAGAATAATT^ 

TAC^GTGGTAATACTACTTATAGTTCTGAGACTAATCAAACAACTCATCAAAATTACTATAATAGTAGC^ 

AGTAACTATAGCAGTAACACTAAGACAGGTCAGGCTGATTCAAGTG^ 

CCTAATCCA 

SEQ ID NO. 2506: SAG0368 FROM THE CJB110 GBS NONTYPEABLE STRAIN (REVERSE 
COMPLEMENT) 

TATAATTTTTCGACTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCTAGCTAAATCAAAAAGTCATGCTATTGAA 

GAAACAAAGCCGTTTTCAATACTATTAATGGGGGTGGACACAGGCT 

AGCGATTCTATGATCTTAGTCACTATAAATCCTAAAACTAATAAAACAACGATGACAAG 

ATTAAATTGAGTGGTCCCAAAAATAATGGACAGACTGGAGTAGAAGCAAA 

GCGGAAATGGCATTGATGACTGTTCAAGACTTATTAGATATTAATGTTGATTAC 

TTAGTTGATTTAGTCAATGCTOTTGGTGGTATAAC^GTAACT 

GAACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAATAAATGGAGAACAAGCACCT 
CX3CTATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTA 
TTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTC 
TCATCAAAAACGATTCCTAATTTGTTAGCI^ATAAAGATTCAT^ 

GACGCTACTTTATCAGATGGTGGCTCTTATCAAATTTTAACTAAGAAACATCTACTTGCAGCT 

AAAGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCT 

AGTAATGATTCTTCTACTTATTCATCAACACAAGAGAATAATTATAATACAACACCTT^ 

TACAGTGGTAATACTACTTATTAGTTCTGAGACTAATCAAACAACTCATCAA^ 

TAGTAACTATAGCAGTAACACTAACACAGGTGAGGCTGATTCAAGTGGAAGTGT 

GCCTAATCCA 
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Table 25: Comparative Sequences relating to SAG0368 
(protein of unknown function) 

SEQ ID NO. 2507 s SAG0368 FROM THE COHl GBS TYPE III STRAIN (REVERSE 
COMPLEMENT) 

GATTTTAAGCTAGATAAATCAAAAAGTCATG^ 

ACAGGTTCAGAGCATCGAAAATCTAAGTGGTCAGGAAATAGCGATT^ 

AATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATTAAATTC 

GTAGAAGCAA&GCTAAATGCAGCCTATGCTTCTGGTGGTGCGG 

ATTAATtfTTGATTACTTTATGCAAATTAATATGCAAGGATTAGTTGA 

ACTAATAAATTTGACTTTCCAATATCAATTGCTGC^ 

AAAATAAATGGAGAAG^GCACTTGTTTATTCTC^ 

AGAC^CGTGAAGTAATTCAAAAAGTCCTTAAAAAAATATTGGCGTTAAATAG 
TCCGCAGTAAGTAATAAC^TGCAAACTAATATTGAGATATCATCAAA 
TC^TTGGAACATATTAAATCTTATCAGTTGAAGGGTGAAGACGCTO 
ACTAAGAAACATCTACTTGCAGTTCAAAATAGAATTAAGAAAGAGCTGGATAA 

AGCGCGATTCTATATGAAGATTACTATGGTACTACTGCTAGTAATGATTCTTCTACTTATTCATCAAC^ 
TATTATTATACAAC^CCCTTATTCAGAAGCA.CCACCAAGTTACAGTGG 

AACAACTCATCAAAGTTACTATAATAGTAGCACTCCTGCTAGTAACTATAGCAGTAACACTA 

TTCAAGTGGAAGTGTTAATAATTATAACGGGGCTGCAACGCCTAATCC 

AACTAATCCA 

SEQ ID NO. 2508s SAG0368 PROM THE H36b GBS TYPE lb STRAIN 

TATAATTTTTCGACTAATGAATTGTCTAAGACTTTTAAAGAT^ 
GAAAC^UVAGCCGTTTTCAATACTATTAATGGGGGfGGACACAGG 

AGCGATTCTATGATCTTAGTCACTATAAATCCTAAAACTAATAAAACAACGATGACAAGCTO 
ATTAAATTGAGTGGTCCCAAAAATAATGGACAGACTGGAGTAGAAGCZAAAGCTAAA 
GCX3GAAATGGCATTGATGACTGTTCAAGACTTATTAGATATTAA 
TTAGTTGATTTAGTCAATGCTGTTGGTGGTATAAGA^ 

GAACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAATAAATGGAGAACAAGCACTTGTO 

CGCTATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAATTCAAAAAGTC^ 

TTGGCGTTAAATAGTA 

SEQ ID NO. 2509s SAG0368 FROM THE 

TTAGTTCATAGAAAAAAATTCTTTCCGCAGTA^ 

CTAATTTGTTAGCTTATAAAGATTCATTGGAACATATTAAATCTTATCAGTTGAAGGGTGAAGACGCTACTT 

ATGGTGGCTCTTATCAAATTTTAACTAAGAAACATCTACTTG 

AGCGTAGTAAAACTCTGAAGACAAGCGCGATTCTATATGA^ 

CTTATTCATCAACACAAGAGAATAATTATAATACAAGACCT^^ 

CTTATAGTTCTGAGACTAATCAAACAACTCATCAAAATTACT^ 

ACACTAACACAGGTCAGGCTGATTCAAGTGGAAGTG 

SEQ ID NO. 2510s SAG0368 FROM THE JM9130013 GBS TYPE VIII STRAIN (REVERSE 
COMPLEMENT) 

TATAATTTTTCGACTAATGAATTGTCTAAGACTTOT 

GAAACAAAGCCGTTTTCAATACTATTAATGGGGGTGGACACAGGTTCAGAGC^ 
AGCGATTCTATGATCTTAGTCACTATAAATCCTAAAACTAATAAAACAACGATGAC^ 
ATTAAATTGAGTGGTCCCAAAAATAATGGACAGACTGGAGTAGAAGCAAAGCTAAAT 
GCGGAAATGGCATTGATGACTGTTCAAGACTTATTA^ 

TTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGTAACTAATAAATTTGAC M riT 

GAACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAA.TAAATGGA 

CGCTATGATGATCC^GAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAATTCAAA 

TTGGCX3TTAAATAGTATTAGTTCATACAAAAAAATTCTTTC 

TCATCAAAAACGATTCCTAATTTGTTAGCTTATAAAGATTCATTGGA^ 

GACGCTACTTTATCAGATGGTGGCTCTTATCAAATT^ 

AAAGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCTAT^ 

AGTAATGATTCTTCTACTTATTCATCAACACAAGAGAATAATTATAAT^^ 

TACAGTGGTAATACTACTTATAGTTCTGAGACTAATCAAACAACTGA^ 

AGTAACTATAGCAGTAACACTAACACAGGTCAGGCTGATTCAAGTGGAA 

CCTAATCCA 
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Table 25: Comparative Sequences relating to SAG0368 
(protein of unknown function) 

SEQ ID NO. 2511: SAG0368 FROM THE M781 GBS TYPE III STRAIN (REVERSE 
COMPLEMENT) 

TTCAATACTATTAATGGGTGTGGACACAG 
CTTAGTCACTATAAATCCTAAAACTAATAAAACAACGATG^ 

TCCCAAAAATAATGGACAGACTGGCGTAGAAGCAAAGCTAAATGCAGCCTATGCTTCTGGTGGTC 

GATGACTGCTCAAGACTTATTAGATATTAATGTTGATTACT 

CAATGCTGTTGGTGGTATAACAGTAACTAATAAATTTGACTTTCCAATATCA^ 

GGCTGTTGTTGAACCAGGGACACATAAAATAAATGGAGAACyUVGCACTTG 

AGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAATTGAAAAAGTCCOT 

TATTAGTTCATACAAAAAAATTCTTTCCGCAGTAAGTAATAACATGCAAACTAATATTGAG^ 

TCCTAATTTGTTAGCTTATAAAGATTCATTGGAACATATTAAATCTTATCAGTTGAA 

AGATGGTGGCTCTTATCAAATTTTAACTAAGAAACATCTACT^ 

AAAGCGTAG?AAAACTCTGAAGACAAGCGCGATTCTAT^ 

TACTTATTCATCAACACAAGAGAATAATTATAATACAACACCTTAOT 

TACTTATAGTTCTGAGACTAATCAAACAACTCATCAAAGTTACTATAATACT 

TAACACTAACAC^GGTCAGGCTGATTCAAGTGGAAGTGTTAA 

AGGAACGCAACCAGTACCAGGTCAAACTAATCCA 



SEQ2501 
SEQ2502 
SEQ2503 
SEQ2504 
SEQ2505 
SEQ2506 
SEQ2507 
SEQ2508 
SEQ2509 
SEQ2510 
SEQ2511 



ATTTTAAGCTAGATAAATCAAAAAGTCATGCTATTGAAGAAACAAAGCCGTTTTCAATA 



-TTCAATA 



SEQ2501 
SEQ2502 
SEQ2503 
SEQ2504 
SEQ2505 
SEQ2506 
SEQ2507 
SEQ2508 
SEQ2509 
SEQ2510 
SEQ2511 



TATTAATGGGTGTGGACAGAGGTTCAGAGCATCGAAAATCTAAGTGGTCAGGAAATAGC 



TATTAATGGGTGTGGACACAGGTTCAGAGCATCGAAAATCTAAGTGGTCAGGAAATAGC 



SEQ2501 
SEQ2502 
SEQ2503 
SEQ2504 
SEQ2505 
SEQ2506 
SEQ2507 
SEQ2508 
SEQ2509 
SEQ2510 
SEQ2511 



ATTCTATGATCTTAGTCACTATAAATCCTAAAAOTAATAAAACAACGATGACAAGCTTA 



ATTCTATGATCTTAGTCACTATAAATCCTAAAACTAATAAAACAACGATGACAAGCTTA 
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Table 25: Comparative Sequences relating to SAG0368 
(protein of unknown function) 



SEQ2501 
SEQ2502 
SEQ2503 
SEQ2504 
SEQ2505 
SEQ2506 
SEQ2507 
SEQ2508 
SEQ2509 
SEQ2510 
SEQ2511 



AACGT<mCGTATTGATTAAATTGAGTGGTCCCAAAAATAATGGACAGACTGGCGTAGAA 



AACGTGACGTATTGATTAAATTGAGTGGTCCCAAAAATAATGGACAGACTGGCGTAGAA 



SEQ2S01. 
SEQ2502 
SEQ2503 
SEQ2.504 
SEQ2505 
SEQ2506 
SEQ2507 
SEQ2508 
SEQ2509 
SEQ2510 
SEQ2511 



CAAAGCTAAATGCAGCCTATGCTTCTGGTGGTGCGGAAATGGCATTGATGACTGTTCAA 



SEQ2501 
SEQ2502 
SEQ2503 
SEQ2504 
SEQ2505 
SEQ2506 
SEQ2507 
SEQ2508 
SEQ2509 
SEQ2510 
SEQ2511 



ACTTATTAGATATTAATGTTGATTACTTTATGCAAATTAATATGCAAGGATTAGTTGAT 



ACTT ATTAGAT ATTAATGT TGAT T AC TTTATGCAAATTAATATGCAAGGATTAGTTGAT 



SEQ2501 
SEQ2502 
SEQ2503 
SEQ2504 
SEQ2505 
SEQ2506 
SEQ2507 
SEQ2508 
SEQ2509 
SEQ2510 
SEQ2511 



TGGTCAATGCTGTTGGTGGTATAACAGTAACTAATAAATTTGACTTTCCAATATCAATT 



TGGTCAATGCTGTTGGTGGTATAACAGTAACTAATAAATTTGACTTTCCAATATCAATT 



SEQ2501 
SEQ2502 
SEQ2503 
SEQ2504 
SEQ2505 
SEQ2506 
SEQ2507 
SEQ2508 
SEQ2509 
SEQ2510 
SEQ2511 



CTGCGAATGAACCAGAGTACAAGGCTGTTGTTGAACCAGGGACACATAAAATAAATGGA 
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Table 25: Comparative Sequences relating to SAG0368 
(protein of unknown function) 

SEQ2501 - 

SEQ2502 

SEQ2503 - 

SEQ2504 - - 

SEQ2505 

SE92506 - 



SE&2 507 AACAAGCA.CTTGTTTATTCTCGTATGCGCTATGATGATCCAGAGGGAGATTATGGGCGT 

SEQ2508 

SEQ2509 . 

SEQ2510 --t 

SEQ2511 AACAAGCACTTGTTTATTCTCGTATGCGCTATGATGATCCAGAGGGAGATTATGGGCGT 

SEQ2 501 i 7 - - TATAATTTTTCG 

SEQ2 502 7 TATAATTTTTCG 

SEQ2503 TATAATTTTTCG 

SEQ2504 . — TATAATTTTTCG 

SEQ2505 -TATAATTTTTCG 

SEQ2506 TATAATTTTTCG 

SEQ2507 ' AAAAAAGACAACX5TGAAGTAATTCAAAAAGTC CTTAAAAAAATATTGGCGTTAAATAGT 

SEQ2 508 -- TATAATTTTTCG 

SEQ2509 

SEQ2510 TATAATTTTTCG 

SEQ2 511 AAAAAAGACAACGTGAAGTAATTCAAAAAGTCCTTAAAAAAATATTGGCGTTAAATAGT 

SEQ2501 CTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCTAGCTAAA 

SEQ2 502 CTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCTAGCTAAATCAAAAAGTCATGCT 

SEQ2 503 CTAATGAATTGTCTAAGACITTTAAAGATTTTAAGCTAGCTAAATCAAAAAGTCATGCT 

SEQ2 504 CTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCT 

SEQ2 505 CTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCTAGCTAAAT(^ 

SEQ2506 CTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCTAGCTAAATCAAAAAGTCATGCT 

SEQ2507 TTAGTTCAT - ACAAAAAAATTCTTTCCGCAGTAAGTAA — TAACATGCAAACTAATATT 

SEQ2 508 CTAATGAATTGTCTAAGACTTTTAAAGATTTTAAGCTAGCTAAA 

SEQ2509 TTAGTTCAT - ACAAAAAAATTCT TTCCGCAGTAAGTAA - -TAACATGCAAACTAATATT 

SEQ2 510 CTAATGAATTGTCTAAGACrTTTAAAGATTTTAAGCT 

SEQ2511 TTAGTTCAT - ACAAAAAAATTCTTTCCGCAGTAAGTAA - -TAACATGCAAACTAATATT 

SEQ2 501 TTGAAGAAACAAAGCCGTTTTCAATAOTATTAATGGGGGTGGACAC^ 

SEQ2502 TTGAAGAAAGAAAGCCGTTTTCAATACTATTAATGGGGGTGGAC^ 

SEQ2503 TTGAAGAAACAAAGCCGTTTTCAATACTATTAATGGGGGTGGACACAGGTTCAGAGCAT 

SEQ2 504 TTGAAGAAACAAAGCCGTTTTCAATACTATTAATGGGGGTGG 

SEQ2 505 TTGAAGAAACAAAGCCGTTTTCAATACTATTAATGGGGGTGGACACAGG 

SEQ2 506 TTGAAGAAACAAAGCCGTTTTCAATACTATTAATGGGGGTGGACAC^ 

SEQ2 507 AGATATCATCAAAAACGATTCCTAATTTGTTAGCTTATAAAGATTCA TTGGAACAT 

SEQ2 508 TTGAAGAAACAAAGCCGTTTTCAATACTATTAATGGGGGTGGAC^ 

S EQ2 509 AGATATCATCAAAAACGATTCCTAATTTGTTAGCTTATAAAGATTCA- - - TTGGAACAT 

SEQ2510 TTGAAGAAACAAAGCCGTTTTCAATACTATTAATGGGGGTGGACACAGGTTCAGAG(^T 

SEQ2511 AGATATCATCAAAAACGATTCCTAATTTGTTAGCTTATAAAGATTCA TTGGAACAT 

SEQ2 501 GAAAATCTAAGT - GGTCAGGAAATAGCGATTCTATGATCTTAGTCACTATAAATC CTAA 

SEQ2 502 GAAAATCTAAGTTGGTCAGGAAATAGCGATTCTATGATCTTAGTCACTATAAATCCTAA 

SEQ2503 GAAAATCTAAGT - GGTCAGGAAATAGCGATTCTATGATCTTAGTCACTATAAATCCTAA 

SEQ2504 GAAAATCTAAGT - GGTCAGGAAATAGCGATTCTATGATCTTAGTCACTAT AAATCCTAA 

SEQ2505 GAAAATCTAAGT - GGTCAGGAAATAGCGATTCTATGATCTTAGTCACTATAAATCCTAA 

SEQ2506 GAAAATCTAAGT-GGTCAGGAAATAGCGATTCTATGATCTTAGTCACTATAAATCCTAA 

SEQ2 507 TTAAATCTTATC - AGTTGAAGGGTGAAGACGCTACTCTATCAG - - ATGGTGGCTCTTAT 

SEQ2 508 GAAAATCTAAGT - GGTCAGGAAATAGCGATTCTATGATCTT AGTCACTATAAATC CTAA 

SEQ2509 TTAAATCTTATC - AGTTGAAGGGTGAAGACGCTACTTTATCAG - -ATGGTGGCTCTTAT 

SEQ2510 GAAAATCTAAGT - GGTCAGGAAATAGCGATTCTATGATCTTAGTCACTATAAATCCTAA 

SEQ2511 TTAAATCTTATC - AGTTGAAGGGTGAAGACGCTACTCTATCAG- -ATGGTGGCTCTTAT 

SEQ2501 ACTAATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATTAAATTGAGTGGTCC 



609 



WO 2004/018646 PCT/US2003/026827 



SEQ2502 
SEQ2503 
SEQ2504 
SEQ2505 
SEQ2506 
SEQ2507 
SEQ2508 
SEQ2509 
SEQ2510 
SEQ2511 

SEQ2501 
SEQ2502 
SEQ2503 
SEQ2504 
SEQ2505 
SEQ2506 
SEQ2507 
SEQ2508 
SEQ2509 
SEQ2510 
SEQ2511 

SEQ2501 
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SEQ2509 
SEQ2510 
SEQ2511 

SEQ2501 
SEQ2502 
SEQ2503 
SEQ2504 
SEQ2505 
SEQ2506 
SEQ2507 
SEQ2508 
SEQ2509 
SEQ2510 
SEQ2511 



Table 25: Comparative Sequences relating to SAG0368 
(protein f unknown function) 

ACTAATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATTAAATTGAG 

ACTAATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATTAAATTGAGTGGTCC 

ACTAATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATTAAATTGAGTGGTC^ 

ACTAATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATTAAATTGAGTGGTCC 

ACTAATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATTAAATTGAGTGGTCC 

AAATTTTAACTAAGAAACATCTACTTGCAGTTCAAAATAGAATTAAGAAAGAGCTGG 

ACTAATAAAACAACGATGACAAGCTTAGAACGTGACGTATTGATT 

AAATTTTAACTAAGAAACATCTACTTGCAGTTCAAAA^ 

ACTAATAAAACAACGATGACAAGCTTAGAACGTGATOTATTGATTAAATTGAGTGGTCC 
AAATTTTAAC TAAGAAACAT CTACTTGCAGTT CAAAATAGAATT AAGAAAGAGC TGGAT 

AAAAATAATGGACAGACTGGAGTAGAAGCAAAG - - CTAAATGCAGCCTATGCTTCTGGT 
AAAAATAATGGACAGACTGGCGTAGAAGCAAAG - - CTAAATGCAGCCTATGCTTCTGGT 
AAAAATAATGGACAGACTGGAGTAGAAGCAAAG- - CTAAATGCAGCCTATGCTTCTGGT 
AAAAATAATGGACAGACTGGAGTAGAAGCAAAG- - CTAAATGCAGCCTATGCTTCTGGT 
AAAAATAATGGACAGACTGG AGTAGAAGCAAAG - - CTAAATGCAGCCTATGCTTCTGGT 
AAAAATAATGGACAGACTGG AGTAGAAGCAAAG - - CTAAATGCAGCCTATGCTTCTGGT 
- AAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCTATATGAAGATTACTATGGTACT 
AAAAATAATGGACAGACTGGAGTAGAAGCAAAG - - CTAAATGCAGCCTATGCTTCTGGT 
AAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCTATATGAAGATTACTATGGTACT 
AAAAATAATGGACAGACTGGAGTAGAAGCAAAG- - CTAAATGCAGCCTATGCTTCTGGT 
AAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCTATATGAAGATTACTATGGTACT 

GTGC - GGAAATGGCATTGATGACTGTTCAAGACTTATTAGATATTAATGTTGATTACT^ 
GTGC - GGAAATGGCATTGATGACTGTTCAAGACTTATTAGATATTAATGTTGATTACTT 
GTGC - GGAAATGGCATTGATGACTGTTCAAGACTTATTAGATATTAATGTTGATTACTT 
GTGC - GGAAATGGCATTGATGACTGTTCAAGACTTATTAGATATT7VATGTTGATTACTT 
GTGC - GGAAATGGCATTGATGACTGTTCAAGACTTATTAGATATTAATGTTGATTAC^ 
GTGC - GGAAATGGCATTGATGACTGTTCAAGACTTATTAGATATTAATGTTGATTACTT 
CTGCTAGTAATGATTCTTCTACTTATTCATCAAC - ACAAGAGAATTATTATTAT - ACAA 
GTGC - GGAAATGGCATTGATGACTGTTCAAGACTTATTAGATATTAATGTTGATTACTT 
CTGCTAGTAATGATTCTTCTACTTATTCATCAAC - ACAAGAGAAT AATT AT AAT - ACAA 
GTGC - GGAAATGGCATTGATGACTGTTCAAGACTTATTAGATATTAATGTTGATTACTT 
CTGCTAGTAATGATTCTTCTACTTATTCATCAAC - ACAAGAGAAT AATT ATAAT - ACAA 

ATGCAAATTAATATGCAAGGATTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGT 

ATGCAAATTAATATGCAAGGATTAGTTGATTTAGTCAATGCTGTTGGTGG 

ATGCAAATTAATATGCAAGGATTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGT 

ATGCAAATTAATATGCAAGGATTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGT 

ATGCAAATTAATATGCAAGGATTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGT 

ATGCAAATTAATATGCAAGGATTAGTTGATTTAGTCAATGCTGTTC 

ACCCTTATTCAGAAGCACCACCAAGTTACAGTGGT - AATACTACTTATAGTT CTGA 

ATGCAAATTAATATGCAAGGATTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGT 

ACC - TTATTCAGAAGCACCACCAAGTTACAGTGGT - AATACTACTTATAGTT CTGA 

ATGCAAATTAATATGCAAGGATTAGTTGATTTAGTCAATGCTGTTGGTGGTATAACAGT 
ACC - TTATTCAGAAGCACCAC CAAGTTACAGTGGT - AATACTACTTATAGTT CTGA 

ACTAATAAATTTGACTTTCCAATATCAATTGCTGCCAATG 

ACTAATAAATTTGACTTTCCAATATCAATTGCTGCC^ATGAACCAGAGTACAAGGCTGT 

ACTAATAAATTTGACTTTCCAATATCAATTGCTGCCAATGAACCAGAGTACAAGGCTGT 

ACTAATAAATTTGACTTTCCAATATCAATTGCTGCCAATGAACCAGAGTAC^^ 

ACTAATAAATTTGACTTTCCAATATCAATTGCTGCCAATGAACCAGAGTACAAGGCTGT 

ACTAATAAATTTGACTTTCCAATATCAATTGCTGCCUUVTGAACCAGAGTACAAGGCTGT 

ACTAATCAAAC - AACTCATCAA AGTTACTAT-AATAG- -TAGCACTCCTGCTAGT 

ACTAATAAATTTGACTTTCCAATATCAATTGCTGCCAATGAACCAGACT 

. ACTAATCAAAC -AACTCATCAA AATTACTAT - AATAG - -TAGCACTCCTGCTAGT 

ACTAATAAATTTGACTTTCCAATATCAATTGCTGCCAATGAACCAGAGTACAAGGCTG 
ACTAATCAAAC -AACTCATCAA AGTTACTAT-AATAG- -TAGCACTCCTGCTAGT 
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Table 25: Comparative Sequences relating to SAG0368 
(protein of unknown function) 

GTTGAACCAGGGACACATAAAATAAATGGAGAACAAGCACTTGTTTATTCTCGTATGCG 

GTTGAACCAGGGACACATAAAATA^TGGAGAACAAGCACTTGTTTATTCT 

GTTGAACCAGGGACACATAAAATAAATGGAGAACAAGCACTTGT^ 

GTTGAACCAGGGACACATAAAATAAATGGAGAACAAGCACTTGTTTATTCTCGTATGCG 

GTTGAACGAGGGACACATAA^TAAATGGAGAACAA 

GTTGAACCAGGGACACATAAAATAAATGGAGAACAAGCACT^ 

ACTATAGCAGTAACAC - TAACACAGGTCAGGCTGATTCAAGTGGAAGTGTTAATAATTA 
GTTGAACCAGGGACACATAAAATAAATGGAGAACAAGCACTTGT TTATTCTCGTATGCG 
ACTATAGCAGTAACAC - TAACACAGGTCAGGCTGATTCAAGTGGAAGTGTCAATAATCA 
GTTGAACCAGGGACACATAAAATAAATGGAGAACAAGCACTTGTTTATTCTCGTATGCG 
ACTATAGCAGTAACAC - TAACACAGGTCAGGCTGATTCAAGTGGAAGTGTTAATAATTA 

TATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAATTCAAAA 

TATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAATTCAAAA 

TATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAAT^ 

TATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACX3TGAAGTAATC 

TATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAATTCAAAA 

TATGATGATCCAGAGGGAGATTATGGGCGTCAAAAAAGACAACXSTGAA^ 

AACGGGGCTGCAACGCCTAATCCAAAC^CAGGAACGCAACCAGTACCAGG 

TATGATGATCC^GAGGGAGATTATGGGCGTCAAAAAAGACAACGTGAAGTAA 

AACGGGGCTGCAACGCCTAATCCA 

TATGATGATCCAGAGGGAGATTATGGGCGTCMlAAAAGACAA 

AACGGGGCTGCAACGCCTAATCCAAACAC^GGAACGCAACC^GTACCAGGTCAAACTAA 

GTCCTTAAAAAAATATTGGCGTTAAATAGTATTAGTTC^TACAAAAAAATTCTTTCCGC 

GTCCTTAAAAAAATATTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTCCGC 

GTCCTTAAAAAAATATTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTCCG 

GTCCTTAAAAAAATATTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCI^ 

GTCCTTAAAAAAATATTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTCCGC 

GTCCTTAAAAAAATATTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTCCGC 

CCA 

GTCCTTAAAAAAATATTGGCGTTAAATAGTA 



GTCCTTAAAAAAATATTGGCGTTAAATAGTATTAGTTCATACAAAAAAATTCTTTCCGC 
CCA 

GTAAGTAATAACATGCAAACTAATATTGAGATATCATCAAAAACGATTCCTAATTTGTT 
GTAAGTAATAAC^TGCAAACTAATATTGAGATATCATCAAAAACGATTCCTAATTTGTT 
GTAAGTAATAACATGCAAACTAATATTGAGATATCATCAAAAACGATTCCTAATTTGTT 
GTAAGTAATAACATGCAAACTAATATTGAGATATCATCAAAAACGATTCCTAATTTGTT 
GTAAGTAATAACATGCAAACTAATATTGAGATATCATCAAAAACGATTCCTAATTTGTT 
GTAAGTAATAACATGCAAACTAATATTGAGATATCATCAAAAACGATTCCTAATTTGTT 



GTAAGTAATAACATGCAAACTAATATTGAGATATCATCAAAAACGATTCCTAATTTGTT 



GCTTATAAAGATTCATTGGAACATATTAAATCTTATCAGTTGAAGGGTGAAGACGCTAC 

GCTTATAAAGATTCATTGGAACATATTAAATCTTATCAGTTGAAAGGTGAAGACGCTAC 

GCTTATAAAGATTCATTGGAAC^TATTAAATCTTATCAGTTGAAGGGTG^ 

GCTTATAAAGATTCATTGGAACATATTAAATCTTATCAGTTGAAGGGTGAAGACGCTAC 

GCTTATAAAGATTCATTGGAACATATTAAATCITATCAGTTGAAGGGTGAAGACGCTAC 

GCTTATAAAGATTCATTGGAA(^TATTAAATCTTATCAGTTGAAGGGTGAAGACGCTAC 



GCTTATAAAGATTCATTGGAACATATTAAATCTTATCAGTTGAAGGGTGAAGACGCTAC 
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Table 25: Comparative Sequences relating to SAG0368 
(protein of unknown function) 

TTATCAGATGGTGGCTCTTATCAAATTTTAACTAAGAAAC^ 

TTATCAGATGGTGGCTCTTATCAAATTTTAACTAAGAAACATCTACTTGCAGTTC^ 

TTATCAGATGGTGGCTCTTATCAAATTTTAACTAAGAAACATCTACTTGCAGTT^ 

TTATCAGATGGTGGCTCITOTCAAATTTTAACTAAG 

TTATCAGATGGTGGCTCTTATCAAATTTTAACrrAAGAAACATCTACTTGCAGTTCAAAA 
TTATGAGATGGTGGCTCTTATCAAATrtTAACTAAGAAACATCTACTTGC^ 



TTATCAGATGGTGGCTCTTATCAAATTTTAACTAAGAAACATCTACTTGCAGTTCAA^ 



AGAATTAAGAAAGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCT 
AGAATTAAGAAAGAACTAGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCT 
AGAATTAAGAAAGAACTGGATAAAAAGCXrTAGTAAAACTCrrGAAGACAAGCGCGATTCT 
AGAATTAAGAAAGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCT 
AGAATTAAGAAAGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCT 
AGAATTAAGAAAGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCT 



AGAATTAAGAAAGAACTGGATAAAAAGCGTAGTAAAACTCTGAAGACAAGCGCGATTCT 



TATGAAGATTACTATGGTACTACTGCTAGTAATGATTCTTCTACTTATTCATCAACACA 
TATGAAGATTACTATGGTACTACTGCTAGTAATGATTCTTCTACTTATTCATCAACACA 
TATGAAGATTACTATGGTACTACTGCTAGTAATGATTCTTCTACTTATTCATCAACACA 
TATGAAGATTACTATGGTACTACTGCTAGTAATGATTCTTCTACTTATTCATCAACACA 
TATGAAGATTACTATGGTACTACTGCTAGTAATGATTCTTCTACTTATTC^TCAACACA 
TATGAAGATTACTATGGTACTACTGCTAGTAATGATTCTTCTACTTATTCATCAACACA 



TATGAAGATTACTATGGTACTACTGCTAGTAATGATTCTTCTACTTATTCATCAACACA 



GAGAATAATTATAATACAACACCTTATTCAGAAGCACCACCAAGTTACAGTGGTAATAC 
GAGAATAATTATAATACAACACCTTATTCAGAAGCACCACCAAGTTACAGTGGTAATAC 
GAGAATAATTATAATACAACACCTTATTCAGAAGC^CCACCAAGTTACAGTGGTAATAC 
GAGAATAATTATAATACAACACCTTATTCAGAAGCACCACCAAGTTACAGTGGTAATAC 
GAGAATAATTATAATACAACACCTTATTCAGAAGCACCACCAAGTTACAGTGGTAATAC 
GAGAATAATTATAATACAACACCTTATTGAGAAGCACCACCAAGTTACAGTGGTAATA^ 



GAGAATAATTATAATACAACACCTTATTCAGAAGCACGACCAAGTTACAGTGGTAATAC 



ACTTAT-AGTTCTGAGACTAATCAAACAACTCATCAAAATTACTATAATAGTAGCACTC 
ACTT AT - AGTTCTGAGACTAATCAAACAACTCATCAAAGTTACTATAATAGTAGCACTC 
ACTTAT - AGTTCTGAGACT AATCAAACAACTGATCAAAATTACT ATAAT AGTAGCACTC 
ACTTAT-AGTTCTGAGACTAATCAAACAACTCATCAAAATTACTATAATAGTAGCACTC 
ACTTAT-AGTTCTOAGACTAATCAAACAACTCATCAAAATTACTATAATAGTAGCACTC 
ACTTATTAGTTCTGAGACTAATCAAACAACTCATCAAAATTACTATAATAGTAGC^CTC 



ACTTAT-AGTTCTGAGACTAATCAAACAACTCATCAAAATTACTATAATAGTAGCACTC 
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(protein of unknown function) 

SEQ2501 TGCTAGTAACTATAGCAGTAAC^CTAACACAGGTCAGGCTGATTCAAGTGGAAGTGTCA 

SEQ2 502 TGOTAATAACTATAGCAGTAACACTAAC^CAGGTCAGGCTGATTCAAGTGGAAGTGTCA 

SEQ2 503 TGCTAGTAACTATAGCAGTAACAOTAACACAGGTCAGGCTGATTC 

SEQ2 504 TGCTAGTAACTATAGCAGTAACACTAACACAGGTCAGGCTGATTCAACT 

SEQ2 505 TGCTAGTAACTATAGCAGTAACACTAACACAGGTCAGGCTGATTCAAGTGGAAGTGTCA 

SEQ2 506 TGCTAGTAACTATAGCAGTAACACTAACACAGGTCAGGCTGATTCAAGTGGAAGTGTCA 

SEQ2507 

SEQ2508 

SEQ2509 ; 

SEQ2 510 * TGCTAGTAACTATAGCAGTAACACTAACACAGGTC^GGCTGATTCAA^TGGAAGTGTCA 
SEQ2511 r r - 

SEQ2501 TAATCATAACGGGGCTGCAACGCCTAATCCA 

SEQ25 02 TAATCATAATGGGGCTGCAACGCCTAATCCA 

SEQ2503 TAATCATAACGGGGCTGCAACGCCTAATCCA 

SEQ2504 TAATCATAACGGGGCTGCAACGCCTAATCCA 

SEQ2505 TAATCATAACGGGGCTGCAACGCCTAATCCA 

SEQ2506 . TAATCATAACGGGGCTGCAACGCCTAATCCA 

SEQ2507 

SEQ2508 - - - 

SEQ2509 - 

SEQ2 5 10 TAATCATAACGGGGCTGCAACGCCTAATCCA 

SEQ2511 

>SEQ IB NO 2550: 54_090 frames 1 
YNFSTNELSKTFKDFKIiAKSKSHAIEETKPFSII^ 

INPKTNKTTMTSLERDVIiI KLSGPK1WGQTGVEAKIiNAAYASGGAEMAIJ4TVQDIjIiDINV 

D YFMQ I NMQGL VDLVNAVGGI TVTNKFDFP I S I AANEP EYKAWEPGTHKI NGEQAIiVYS 

RMRYDDPEGDYGRQKKQREVIQKVLKKIIiAI^SISSYKKILSAVSl^QTNIEISSKTIP 

NLIiAYKDSLEHIKSYQLKGEDATLSDGGSYQXLTKKHLLAVQNRIKKEL^ 

AI L YED YYGTTASNDS STYSSTQENNYNTTP YSEAPPS YSGNTTYSSETNQTTHQNYYNS 

S TPASNYS SNTNTGQAD S S GSVNNHNGAATPNP 

>SEQ IB NO 2S51: 54_1169NT frame: 1 

YNFSTNELSKTFKDFKLAKSKSHAIEETKPFSILLMGVDTGSEHRKSKLVRK . RFYDLSH 
YKS . N . . NNDDKLRT . RID . IEWSQK . WTDWRRS KAKCS L CFWWCGNG IDDCS RLI RY . C 
- LLYAN . YARIS . FSQCCWWYNSN . . I . LSNINCCQ . TRVQGCC . TRDT . NKWRTS TCI»F 
SYAL. . SRGRLWAS KKTT . SNSKSP . KNIGVK . Y . FIQKNSFRSK . .HAN. Y.DIIKNDS 
. FVSL . RFIGTY . ILSVER , RRYFIRWWLLSNFN . ETSTCSSK . N . ERTR . KA . . NSEDK 
RDSI . RLLWYYC. . . FFYLFINTRE . Jj . YNTLFRSTTKLQW . YYL . F.D. SNNSSKLL . . 
.HSC. .L.Q.H.HRSG.FKWKCQ.S.WGCNA.S 

>SEQ ZD NO 2552:54_18RS21 frame: 1 
YNFSTNELSKTFKDFKIAKSKSHAIEETKPFSII^ 

iNPKTNK'ri'MT SLERDVIjI KLS GPKNNGQTGVEAKLNAA YASGGAEMALMTVQDLLD INV 
DYFMQINMQGLVDIiVNAVGGITVTNKFDFPI S IAANEPEYKAWEPGTHKINGEQALVYS 
RMR YDDPEGD YGRQKRQREVI Q KVLKKI IiALNS I S S YKKI LS AVSNNMQTN IEISSKTIP* 
NIoLAYKDSLEHIKSYQLKGEDATLSDGGSYQILTKKHLI^^ 
AILYEDYYGTTASiroSSTYSSTQENNYNTTPYSEAPPSYSGNTTYSSETNQTTH 
STPASNYS SNTNTGQADSS GSVNNHNGAATPNP 

>SEQ ID NO 2S53:54__2603 frame: 1 

YNFSTNBLSKTFKDFKIAKSKSHAIEETKPFSILLM^ 

INPKTNKTTMTSLEIUDVLIKLSGPKNNGQTGVEAKLN^ 

DYFMQINMQGLVDLVNAVGGITVTNKFDFPI S IAANEP EYKAWEPGTHKI NGEQALVYS 
RMR YDD PEGD YGRQKRQREVTQKVLKKILALN S I S S YKKI LSAVSNNMQTNT E I S S KT I P 
NLIAYKDSLEHI KS YQLKGEDATLSDGGS YQI L KTLKTS 
AILYED YYGTTASNTOS STYS STQENITYNTTPYS EAPPS YSGNTTYS SETO 
STPASNYS SNTNTGQADS S GSVNNHNGAAT PNP 

>SEQ ID NO 2554: 54_A909 frame: 1 

YNFSTNELSKTFKDFKIiAKSKSHAIEETKPFSILIiMGVDTGSEHRKS 

INPKTNKTTMTSLERDVLIKLSGPKNNGQTGVEAK^ 

DYFMQ I NMQGLVDLWAVGGI TVTNKFDFP I S I AANEPEYKAWEPGTHKI NGEQALVYS 
RMR YDD P EGD YGRQKRQREV I QKVLKKILALNS I S S YKKI LSAVSNNMQTNI E I S S KT I P 
NLIAYKDSLEHIKSYQIjKGEEATLSDGGSYQILTKKHLIiAVQNRI 
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AILYEDYYGTTASOTSST YS STQENNYNTTP YSEAPP S YSGNTTYS SETNQTTHQNYYNS 
STPASNYS SNTNTGQADSS GSVNNHNGAATPNP 



>SBQ ID NO 2555i54_CJB110 frame t 1 
YNFSTNELSKTFKDFKIiAKSKSHAIEETK^ 

INP KTNKTTMT S LERDVL I KLS GPKNNGQTGVEAKLNAAYAS GGAEMALMTVQDIiIjD INV 
D YFMQINMQGLVDLVNAVGGI TVTNKFDFP I S IAANEPEYKAVVEPGTHKINGEQALVYS 
RMRYDDPEGDYGRQKRQREVI QKviScKIIiALNS I S S YKKILSAVSNNMQTNI EI SS KTI P 
NLI^YKDSLEHIKS YQLKGEDATLSDGGS YQI LTKKHLLAVQNRI KKELDKKRS KTLKTS 
AILYEDYYGTTASNDSSTYSSTQENNYNTTPYSEAPPSYSGNTTY . F.D. SNNSSKLL . . 

>SfiQ ID NO 2556»54_COHl frame t X 

DFKI^KSKSHAIEETKPFSILLMGVDTGSEHRKSKWSGNSDSMILWINPKTNKTTMTS^ 
ERDVLI KLSGPKNNGQTGVFAKLNAAYAS GGAEMALM 

LVNAVGGI TVTNKFDPPI S IAANEPEYKAVVEPGTHKINGEQAIiVYSRMRYDDPEGD YGR 
QKRQREVI QKVLKKI LALNS I S S YKKI LSAVSNNMQTNI EI SS KTI PNLLA YKDSLEHI K 
S YQLKGEDATLSDGGS YQ I LTKKHLLAVQNRI KKELDKKRSKTLKT S A I L YED YYGTTAS 
NDSSTYSSTQENYYYTTPLFRSTTKLQW . YYL .F.D. SNNSSKLL . . .HSC. .L.Q.H.H 
RSG.FKWKC. . L . RGCNA . SKHRNATSTRSN . S 

>SEQ ID NO 2557*54_H36B frame t 1 

YNFSTNFJjS K TFCTFKLAKSKSHAIEBTKPFSI 

INPKTNKTTMTSLERDVLIKLSGPKNNGQTGVFAK^ 

DYFMQINMQGLVDLWAVGGITVTNKFDFPISIAANEPEYKAVTO^ 

RMRYDDPEGDYGRQKRQREVIQKVLKKILALNS I ssykkilsavsnnmqtnibisskti p 

NLLAYKDSLEHIKS YQLKGEDATLSDGGS YQI LTKKHLLAVQNRI KKELDKKRS KTLKTS 

AILYEDYYGTTASNDSSTYSSTQENNYNTTPYSEAPPSYSGOTTYSSETNQTTHQNYYNS 

STPASNYSSNTNTGQADSSGSVNNHNGAATPNP 

>SEQ ID NO 2558 *54_JM9 130013 frame: 1 

YNFSTNELSKTFKDFKLAKSKSHAIEETKP FS ILLMGVDTGSEHRKS KWSGNSDSMILVT 
INPKTNKTTMTSLERDVLI KLSGPKNNGQTGVEAKLNAAYASGGAEMALMTVQDLLDINV 
DYFMQINMCK5LVDLVNAVGGITVTNKFDFP I S IAANEPEYKAVVEPGTHKINGEQALVYS 
RMR YDDPEGDYGRQKRQREVIQKVLKKILALNS I S S YKKILSAVSNNMQTNI E I SS KTI P 
NLLAYKDSLEHI KS YQLKGEDATLSDGGS YQI LTKKHLIAVQNRI KKELDKKRS KTLKTS 
AI L YED YYGTTASNDS STYS S TQENNYNTTP YS EAPP S YS GNTTYS S ETNQTTHQNYYNS 
STPASNYS SNTNTGQADS SGSVNNHNGAATPNP 

>SEQ ID NO 2559:54_M781 frames 2 

S ILLMGH/DTGS EHRKS KWSGNSDSMILVTINPKTNKTTM^ KLSGPKNNGQTG 
VEAKLNAAYASGGAEMALMTVQDLLD INVDYFMQINMQGLVDLVNAVGGITVTNKFDFPI 
S IAANE PE YKAVVE PGTHKINGEQALVYSRMR YDDPEGD YGRQKRQREVI QKVLKKI LAL 
NS I S S YKKI LSAVSNNMQTNI E I S S KT I PNLLAYKDS LEH I KS YQL KGEDATL S DGGS YQ 
ILTKKHLLAVQNRI KKELDKKRSKTLKTSAI LYED YYGTTASNDSSTYSSTQENNYNTTP 
YSEAPPS YSGNTTYS SETNQTTHQS YYNSSTPASNYS SNTNTGQADSSGSVNNYNGAATP 
NPNTGTQPVPGQTNP 



SEQ2550 NFSTNELS KTFKDFKLAKSKSHAI EETKPFS I LLMGVDTGSEHRKSK^ 

SEQ2551 NFSTNELSKTFKDFKLAKSKSHAIF^TKPFSILLMGVDTGSE 

SEQ2552 NFSTNEIiS KTFKDFKLAKSKSHAI EETKPFS I LLMGVDTGS EHRKS KWSGNSDSMI LVT 

SEQ2553 NFSTNELS KTFKDFKLAKSKSHAI EETKPFS I LLMGVDTGS ETO 

SEQ2554 NFSTNELS KTFKDFKLAKS KSHAI EETKPFS ILLMGVDTGSEHRKSKWSGNSDSMI LVT 

SEQ2555 NFSTNELS KTFKDFKLAKSKSHAI EETKPFS I LLMGVDTGS EHRKS KWSGNSDSMI LVT 

SEQ255 6 DFKLDKSKSHAIEETKPFS ILLMGVDTGSEHRKS KWSGNSDSMILVT 

SEQ2 557 NF S TNELS KTFKDF KLAKS KSHAI EETKP FS ILLMGVDTGS EHRKS KWSGNSDSMI LVT 

SEQ2558 NFSTNELS KTFKDFKLAKSKSHAI EETKPFS I LLMGVDTGS EHRKS KWSGNSDSMILVT 

SEQ2 559 - S ILLMGVDTGSEHRKS KWSGNSDSMILVT 

SEQ2550 NPKTNKTTMTS LERDVLI KLS GPKNNGQTGVEAKLNAAYAS GGAFJ^ALMTVQDLLD INV 

SEQ2551 SNNNDDKLRTRIDI EWSQKWTDWRRS KAKCSLCFWWCGNGIDDCSRLIRYCLLY 

SEQ2 552 NPKTNKTTMTSLERDVLIKLSGPKNNGQTGVEAKLNJ^ 

SEQ2 55 3 NPKTNKTTMTSLERDVLIKLSGPKNNGQTGVEAKLNAA 

SEQ2554 NPKTNKTTMTSLERDVLIKLSGPKNNGQTGVEAKLNAAY 

SEQ2 55 5 NPKTNKTTMTSLERDVLI KLSGPKNNGQTGVEAKLNAAYASGGAEMALMTVQDLLD INV 

SEQ2 556 NPKTNKTTMTSLERDVLIKLSGPKNNGQTGVEAKLNAAYASGGAEM 

SEQ2 557 NP KTNKTTMTS LERDVL I KL S G P KNNGQTGVEAKLNAA YAS GGAEMALMTVQDLLD I NV 
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Table 25: Comparative Sequences relating to SAG0368 
(protein of unknown function) 



SEQ2 558 NPKTNKTTMTSLERDVLI KLSGPKNNGQTGVEAKIiNAAYASGGAEMAI^WQDLLDINV 
SEQ2559 ' NPKTNKTTMTSLERDVLIKLSGPKNNGQTGVEAK^ 

SEQ2550 YFMQ I NMQGLVDLVNAVGG I TVTNKFD FP I S I AANEPEYKAVVEPGTHKINGEQAL VYS 

SKQ2551 NYARISFSQCCWWYNS -NILSNINCCQTRVQGCCTRDTNKWRTSTCLFSY 

SEQ2552 YFMQINMQGI*VDLVNAVGGITyTNKPDFP I S I AANE PEYKAWEPGTHKINGEQ AL VYS 

SEQ2 553 YFMQINMQGLVDLVNAVGGITVTNKFDFP I S I AANE PE YKAVVEPGTHKINGEQAi/VYS 

SEQ2554 YFMQ INMQ GLVDLVNAVGGI TVTNKFD F P I S I AANE PE YKAVVEPGTHKINGEQ ALVYS 
SEQ2555 • • YFMQINMQGLVDLVNAVGGITVTNKFDFP I SI^^ 

SEQ2556 YFMQ INMQ GLVDLVNAVGG I TVTNKFDFP I S IAANEPE YKAWE PGTHKINGEQ ALVYS 

SEQ2557 YFMQINMQGLVDLVNAVGGITVTNKFDFPISIAANE 

SEQ2558 YFMQINMQGLVDLVNAVGGI TVTNKFDFP I S IAANEPEYKAVVEPGTHKINGEQALVYS 

SEQ2559 • YFMQINMQGLVDLVNAVGGITVTNKFDFPI S IAANEPE YKAWEPGTHKINGEQ ALVYS 

SEQ2550 MRYDDP EGDYGRQKRQREVI QKVLKKI LALNS I S S YKKILS AVSNNMQTN I E I S S KT I P 

SEQ2 S 5 1 LS RGRLWAS KKTTSNSKS P KNI GVKYF IQKNS FRSKHANYDI I KND S FVS L»RF I GT YI - 

SEQ2552 MRYDDPEGDYGRQKRQREVIQKVLKKI LALNS I SS YKKI LS AVSNNMQTN! EI S SKTI P 

SBQ2553 MRYDDPEGDYGRQKRQREVI QKVLKKI LALNS I SS YKKI LSAVSNNMQTNI EI SSKTI P 

SEQ2554 MRYDDPEGDYGRQKRQREVI QKVLKKI LALNS I S S YKKI LSAVSNNMQTNI EI SSKTI P 

SEQ2555 MRYDDPEGDYGRQKRQREVI QKVLKKI LALNS I S S YKKI LSAVSNNMQTNI E I S SKT I P 

SEQ2556 MRYDDPEGDYGRQKRQREVI QKVLKKI LALNS I S S YKKI L SAVSNNMQTNI E I S S KTI P 

SEQ2557 MR YDDP EGD YGRQKRQREVIQKVL KKI LALNS I S SYKKIL SAVSNNMQTNI E I S S KT I P 

SEQ2558 MRYDDPEGDYGRQKRQREVIQKVLKKI LALNS I S S YKKI LSAVSNNMQTNI EI S SKTI P 

SEQ2559 MRYDDP EGD YGRQKRQREVI QKVLKKI LALNS I S S YKKI L SAVS NNMQTN I E I S S KTI P 

SEQ2 550 LLAYKDSLEHI KS YQLKGEDATLSDGGS YQILTKKHIJIAVQNRIKKELDKKRSKTLKTS 

SEQ2551 L - SVERRRYFIRWWLLSNFNETSTCSSKNERTRKANSEDKRDS I RLLWYYCFFYLFINT 

SEQ2552 LIAYKDSTiEHT KS YQLKGEDATIiSDGGS YQILTKKHLL 

SEQ2553 LLA YKD S LEH I KS YQLKGEDATL SDGGS YQ I LTKKHLLAVQNRI KKELDKKRSKTLKTS 

SEQ2554 LLAYKDS LEHI KS YQLKGEDATL SDGGS YQ I LTKKHLLAVQNR I KKELDKKRS KTLKTS 

SEQ2555 LLA YKDS LEHI KS YQLKGEDATLSDGG S YQ I LTKKHLLAVQNR I KKELDKKRSKTLKTS 

SEQ2556 LIAYKDSLEHIKSYQLKGEDATIiSDGGSYQILTJOCHLIiAVQNRIKKELDKKRSKTLKTS 

SEQ2557 LLAYKDSLEHI KS YQLKGEDATLSDGGS YQ I LTKKHLIiAVQNRI KKELDKKRS KTLKTS 

SEQ2558 IiLAYKDSLEHI KS YQIjKGEDATIjSDGGS YQ ILTKKHLLAVQNRI KK^ 

SEQ255 9 LLA YKDS LEHI KS YQLKGEDATL SDGGS YQI LTKKHLLAVQNR I KKELDKKRS KTLKTS 

SEQ2550 ILYEDYYGTTASNDSSTYSSTQENNYNTTPYSEAPPSYSGNTTYSSETNQTTHQNYYNS 

SEQ2551 ELY NTLFRST TKLQWYYLFDSNNSSKLLHSCLQH 

SEQ2552 ILYEDYYGTTASNDSSTYSSTQENNYNTTPYSEAPPSYSGNTTYSSETNQTTHQNYYNS 

SEQ2553 ILYED YYGTTASND S S TYS STQENNYNTTP YS EAP P S YS GNTT YSS ETNQTTHQNYYNS 

SEQ2554 ILYED YYGTTASNDSSTYS STQENNYNTTP YS EAP P SYS GNTT YSS ETNQTTHQNYYNS 

SEQ2555 ILYED YYGTTASNDSSTYSSTQENNYNTTPYSEAPPSYSGNTTYFDSNNSSKLL 

SEQ255 6 ILYEDYYGTTASNDSSTYSSTQENYYYTTPLFRSTTKLQWYYLFDSNNSSKLLHSCLQH 

SEQ2557 ILYED YYGTTASNDSSTYSSTQENNYNTTPYSEAPPSYSGNTTYSSETNQTTHQNYYNS 

SEQ2558 ILYED YYGTTASNDS S TYS S TQ ENNYNTTP YS EAP P S YS GNTT YS S ETNQTTHQNYYNS 

SEQ2 559 ILYED YYGTTASNDS STYSSTQ ENNYNTTP YS EAP PSYSGOT 

SEQ255 0 TPASNYS SNTNTGQADS SGS VNNHNGAATPNP - 

SEQ2 55 1 RSGFKWKCQSWGCNAS 

SEQ2 552 TPASNYS SNTNTGQ AD S S G SVNNHNGAATPNP 

SEQ2553 TPASNY SSNTNTGQADS S GSVNNHNG AATPNP 

SEQ2 554 TPASNYS SNTNTGQADS SGSVNNHNGAATPNP 

SEQ2555 - 

SEQ2 556 RSGFKWKCLRGCNAS KHRNATS TRSNS 

SEQ2557 TP AS NY SSNTNTGQADS SGSVNNHNGAATPNP 

SEQ2 558 TPASNYS SNTNTGQADS SGSVNNHNGAATPNP 

SEQ2559 TPASNYSSNTNTGQADSSGSVNNYNGAATPNPNTGTQPVPGQTNP 
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Table 26: Comparative Sequences relating to SAG0503 (lipase/acylhydolase) 

SEQ ID NO. 2601: SAG0503 FROM THE 090 6BS TYPE Xa STRAIN 
(REVERSE COMPLEMENT) 

GGGCACAAGTTTGTACAAAAAAGCAGGCTCT 

AGACTTCCTAACAAAGAAAGTTATCCCACTTAACTATGT 

AACCTCTCAAGGTGGTTTTGTCCCACTGCTATCAGAAT^ 

TTATGGTGTGTCTGGGAATACTAGTCAACAAATTTTAAAACGTATGACGACAGATCC^ 

GAAAGCTGATTTATTGACGCTAACTGTTGGTGGTAATGATGTC^ 

ACTAAATTCCTTTGAGAAACGAGCAGAAGCATATAAGGAACGTTTGAAAGAAATAC^ 

TCCTAAATTGCCTATTTATGTTTTAGGCATTTAT^ 

CGTTAITGATAATTGGAATAAAGCTAGAAAAGAAGTAGTTGATGCTTC^ 

CCGCCTTTATAAGGGAATAAATGGTAAAGAGGGTATTACAGAGTCATCAAATAGTC^ 

TCTCITTACTGGAGACCATTTTC^TCCCAATAATATOGGCTATCAAATCATC ' 
TGAAACAAGAAAAAACTGGCCGAACCC^GCTTTCTTGTACAAAG 

SEQ ID NO- 2602 x SAG0503 FROM THE H36b GBS TYPE lb STRAIN 
(REVERSE COMPLEMENT) 

TTTGTAGAAAAAAGGAGGCTCTATTTTTTCCTTG 

AACAAAGAAAGTTATCCCACiTAACTATGTTGCTCTTGGAGATTCTCTGAC 

AGGTGGTTTTGTTCCACTGCTATCAGAATCACTCCATAATCGATACTGTT 

GTCTGGGAATACTAGTCAAOU^TTTTAAAACGTATGACGAC^GATCCTCAAATCGAAAAAGA 

TTTATTGACGCTAACTGTTGGTGGTAATGATGTCTTGGCTGTTATTCG 

CTTTGAGAAACGAGCAGAAGCATATAAGGAACGTTTGAAAGAAATCCTTGCA^ 

GCCTATTTATGTTTTAGGGATTTATAATCCTTTTTACCTAAAOT 

TAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTCAGAAAATGTTTATTT 

TAAGGGAATAAATGGTAAAGAGGGTATTATAGAGTCATCAAATAGTCAGGCAAGTATCACTAATGATC 

TGGAGACCATTTTCATCCCAATAATATTGGCTATCAAA 

AAAAAACTGGCCGAACCCAGCTTTCTTGTACAAAGTGGTCC 

SEQ ID NO. 2603 1 SAG0503 FROM THE 18RS21 GBS TYPE II STRAIN (REVERSE 
COMPLEMENT) 

GTTTGTACAAAAAAGGAGGCTCTATTTTTTCCTTGATCATTCCAAAATCAAATCCTAAATTAACAAAAAAAGACTTCC 

TAACAAAGAAAGTTATCCCACTTAACTATGTTGCTCTTGGAGATTCTCTGACCGAAGGTGTGGGCGATACAACCTCTC 

AAGGTGGTTTTGTTCCACTGCTATCAGAATCACTCCATAATCGATACTC^ 

TGTCTGGGAATACTAGTCAACAAATTTTAAAACGTATGACGACAGATCCTC^^ 

ATTTATTGACGCTAACTGTTGGTGGTAATGATGTCTTGGCTGTTATTCGTAAAGAGCT 

CCTTTGAGAAACCAGCAGAAGCATATAAGGAACGTTTGAAAGAAATCCTTGCAAAAGCAAGACAAGATAATCCTAAAT 
TGCCTATTTATGTTTTAGGCATTTATAATCCTTTTTAC^ 

ATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTGAGAAAATGTTTAT^ 
ATAAGGGAATAAATGGTAAAGAGGGTATTACAGAGTCATCAAATAGTCAGGCAAGTATCACTA 
CTGGAGACCATTTTCATCCG^TAATATTGGCTATCAAATCATGTCTAACGCCGTTATGGAGAA 
GAAAAAACTGGCCGAACCCAGCTTTCTTGTACAA 

SEQ ID NO. 2604: SAG0503 FROM THE COHl GBS TYPE III STRAIN (REVERSE 
COMPLEMENT) 

GGACAAGTTTGTACAAAAAAGCAGGCTCTATTTTTTCCTTGA 

ACTTCCTAACAAAGAAAGTTATCCCACTTAACTATGTTGCTCTTGGAGAT^ 

CCTCTCAAGGTGGTTTTGTCCCACTGCTATCAGAATCACTCCATAATCGATACT 

ATGGTGTGTCTGGGAATACTAGTCAACAAATTTTAAAACGTATGA . 
AAGCTGATTTATTGACGCTAACTGTTGGTGGTAATGATGTCTTGGCTGTTATTCGTAAAGAGCTCA 
TAAATTCCTTTGAGAAACCAGCAGAAGCATATAAGGAACGTTTGAAAGAAATTCTO 
CTAAATTGCCTATTTATCTTTTAGGCATTTATAATCCT 

TTATTGATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTCAGAAAATGTT 
GCCIOTATAAGGGAATAAATGGTAAAGAGGGTATTACAGAGTCATCAAATAGTCAGG 
TCTTTACTGGAGACGATTTTCATCCCAATAATATTGGC^ 
AAACAAGAAAAAACTGGCCGAACCCAGCTTTCTTGTACAAA 
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Table 26: Comparative Sequences relating to SAG0503 (lipase/acylhydolase) 

SEQ ID NO. 2605s SAG0503 FROM THE CJB110 GBS NONTYPEABLB STRAIN (REVERSE 
COMPLEMENT) 

GTTTGTACAAAAAAGCAGGCTCTATTTTTTCCT^ 

Ti\ACAAAGAAAGTTATCCCACTTAACTATGTTGCTCTTGGAGATTCTCTX3ACCGAAGGTGT 

AAGGTGGTTTTGTCCCACTGCTATCAGAAT(^CTCCATAATCGATACTCTTACCAAGTGA 

TGTCTGGGAATACTAGTCAACAAATTTTAAAACGTATGACGACAGATCCrCAAA 

ATTTATTGACGCTAACTGTTGGTGGTAATGATGTCTTGGCTGTTATTCGTAAAGAGOT 

CCTTTGAGAAACCAGCAGAAGCATATAAGGAACGTTTGAAAGAAATACTTGCAAAAGCAAG 

TGCCTATTTATGTTTTAGGCATTTATAATCCTTTTTACCTAAACTTTC 

ATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTCAGAAAATGTCT 

ATAAGGGAATAAATGGTAAAGAGGGTATTACAGAGTCATCAAATAGTCAGGCAAGTATCACT 

CTCGAGACCATTTTCATCC CAATAATATTGGCTATCAAATCATGTCTAA 

GAAAAAACTGGCCGAACCCAGCTTTCTTGTACAA 

SEQ ID NO. 2606: SAG0503 FROM THE 1169NT1 6BS TYPE V STRAIN (REVERSE 
COMPLEMENT) 

GTTTGTACAAAAAAGCAGGCTCTATTTTTTCCTTGATCATTC 
TAAOUVAGAAAGTTATCCC^CTTAACTATGTTGCTCTTGGAGAOT 

AAGGTGGTTTTGTCCCACTGCTATCAGAATCACTCCATAATCGATACTCTTACCAAGTGACTTCTC 

TGTCTGGGAATACTAGTCAACAAATTTTAAAACGTATGACGACAGATCCTC^ 

ATTTATTGACGCTAACTGTTGGTGGTAATGATGTCTTGGOTGTTATTCGTAAAGAGCT 

CCTTTGAGAAACCAGCAGAAGCATATAAGGAACGTTTGAAAGAAATTCTTGC^ 

TGCCTATTTATGTTTTAGGCATTTATAATCCTTTT^ 

ATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTCAGAAAATGTTTAT^ 
ATAAGGGAATAAATGGTAAAGAGGGTATTACAGAGTCATCAAATAGTCAGGCAAGTATC^ 
CTGGAGACCATTTTCATCCCAATAATATTGGCTATCAAATCATGTCTAACGCCGTTATGGAGAAAATAA^ 
GAAAAAACTGGC CGAAC CCAGCTT T CTTGTACAAA 

SEQ ID NO. 2607 s SAG0503 FROM TH3 JM9130013 GBS TYPE VIII STRAIN 
(REVERSE COMPLEMENT) 
GTTTGTACAAAAAAGCAGGCTCTATTTTTTC^ 

TAACAAAGAAAGTTATCCCACTTAACTATGTTGCTCTTGGAGATTCTCTGACCGAAGGTGT 
AAGGTGGTTTTGTTCCACTGCTATCAGAATCACTC^ 

TGTCTGGGAATACTAGTCAACAAATTTTAAAACGTATGACGACAGATCCTCAAA 

ATTTATTGACGCTAACTGTTGGTGGTAATGATGTCTTGGCTGTTATTCGTAAAGAGCTCAGTCATTTATCACTAAATT 

CCTTTGAGAAACCAGCAGAAGCATATAAGGAACGTTTGAAAGAAATC 

TGCCTATTTATGTTTTAGGCATTTATAATCCTT^ 

ATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTCAGAAAATGTTTATTTTGTCCCAATTAATGA^ 
ATAAGGGAATAAATGGTAAAGAGGGTATTACAGAGTCATCAAATAGTCAGGCAAGTATCACTAATGATGCT 
CTGGAGACCATTTTCATCCCAATAATATTGGCTATCAAATCATGTCTAACGCCGTTA^ 
GAAAAAACTGGCCGAACCCAGCTTTCTTGTACAAA 

SEQ ID NO. 2608s SAG0503 FROM THE 2603 V/R GBS TYPE V STRAIN 
(REVERSE COMPLEMENT) 

AGTTTGTACAAAAAAGCAGGCTCTATTTTTTCCT 

CTAACAAAGAAAGTTATCCCACTTAACTATGTTGCTCTTGGAGATTCTCTGACCGAAGGTGTGG 

CAAGGTGGTTTTGTTCCACTGCTATCAGAATGACTCCATAATCGATACTCTTACCAAGTC 

GTGTCTGGGAATACTAGTCAACAAATTTTAAA^ 

GATTTATTGACGCTAACTGTTGGTGGTAATGATGTCITGGCTGTO 

TCCTTTGAGAAACCAGCAGAAGCATATAAGGAACGTTTGAAAGAAATCCTTGCAAA^ 

TTGCCTATTTATGTTTTAGGCATTTATAATCCTTTTTACCTAAACTTTCCACAATTA 

GATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTCAGAAAATGTTT 

TATAAGGGAATAAATGGTAAAGAGGGTATTACAGAGTCATCAAATAGTCAGGCAAGTATC 

ACTGGAGACCATTTTCATCCCAATAATATTGGCTATCAAATCATGTCTAACG 

AGAAAAAACTGGCCGAACCCAGCTTTCTTGTACAAAGTGG 
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Table 26: Comparative Sequences relating to SAG0503 (lipase/acylhydolase) 

SEQ ID NO. 2609: SAG0503 FROM THE M781 GBS TYPE III STRAIN 
(REVERSE COMPLEMENT) 

GGACAAGTTTGTACAAAAAAGCAGGCTCTATTTTTTCCTT^ 

ACTTCCTAACAAAGAAAGTTATCCCACTTAACTATGTTGCT 

CCTCTCAAGCTGGTTTTGTCCCACTGCTATCAGAATCACTCCATAAT 

ATGGTGTGTCTGGGAATACTAGTCAACAAATTTTAAAACGTATGACGACA^ 

AAGCTGATTTATTGACGCTAACTGTTGGTGGTAATGATGTCT^ 

TAAATTCCTTTGAGAAACCAGCAGAAGCATATAAGGAACGTTTGAAAGA^ 

CTAAATTGCCTATTTATGTTTTAGGCATTTATAATCCTTTTTA 

TTATTGATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTC^GAAAATGTTT 
GCCTTTATAAGGGAATAAATGGTAAAGAGGGTATTACAGAGTCATCAAATAG 
TCTTTACTGGAGACCATTTTCATCCCAATAATATTGGCTATCAAATCATGTCT 
AAACAAGAAAAAACTGGCKX3AACCCAGCTTTCTTGTACAAA 



SEQ2601 GGCACAAGTTTGTACAAAAAAGCAGGCTCrATTTTTTCCTTGATa 

SEQ2602 TTTGTACAAAAAAGCAGGCTCTATTTTTTCCTTGATC 

SEQ2603 GTTTGTACAAAAAAGCAGGCTCTATTTTTTCCTTGATCATTCCAAAATCAAA 

SEQ2604 GGACAAGTTTGTACAAAAAAGCAGGCTCTATTTTTTC 

SEQ2 605 GTTTGTACAAAAAAG CAGGCTCTATTTTTTCCT TGATCATTCCAAAATCAAA 

SEQ 2 606 GTTTGTACAAAAAAGCAGGCTCTATTTTTTCCTTGATCATTCCAAAATC7UVA 

SEQ2607 GTTTGTACAAAAAAGCAGGCTCTATTTTTTCCTTGATCATTCCAAAATCAAA 

SEQ2608 AGTTTGTACAAAAAAGCAGGCTCTATTTTTTCCTTGATCATT 

SEQ2609 GGACAAGTTTGTA<^AAAAAGCAGGCTCTATTTTTTCCTTGAT 

SEQ2601 TCCTAAATTAACAAAAAAAGACTTCCTAACAAAGA ' 

SEQ2602 TCCTAAATTAAGAAAAAAAGACTTCCTAACAAAGAAAGTTATCCCACTTAACTATGTTGC 

SEQ2 603 TCCTAAATTAACAAAAAAAGACTTCCTAACAAAGAAAGTTATCCCACT^ 

SEQ2604 TCCTAAATTAACAAAAAAAGACTTCCTAACAAAGAAAGTO 

SEQ2605 TCCTAAATTAACAAAAAAAGACTTCCTAACAAAGAAAGTTATCCCACTTAACTATGTTGC 

SEQ2 606 TCCTAAATTAACAAAAAAAGACTTCCTAACAAAGAAAGTTATC CC^ 

SEQ2 607 TCCTAAATTAAC^AAAAAAGACTTCCTAACAAAGAAAGTTATCCCACTTAACT 

SEQ2608 TCCTAAATTAACAAAAAAAGACTTCCTAAC^AAGAAAGTTATCCCACTTAACTATGTTGC 

SEQ2609 TCCTAAATTAACAAAAAAAGACTTCCTAACAA^GAAAGTTATC CCACTTAACTATGTTGC 

SEQ2601 TCTTGGAGATTCTCIGACCGAAGGTGTGGGCGATACAACCTCTCAAC^ 

SEQ2 602 TCTTGGAGATTCTCTGACCGAAGGTGTGGGCX^TA 

SEQ2603 TCTTGGAGATTCTCTGACCGAAGGTGTGGGCGATACAACCTCTCAAGGTG^ 

SEQ2604 TCTTGGAGATTCTCTGACCGAAGGTGTGGGGGATACAACCTCTCAAGGTGGTTTTGT 

SEQ2605 TCTTGGAGATTCTCTGACCGAAGGTGTGGGCGATACAACCTCT 

SEQ2607 TCTTGGAGATTCTCTGACCGAAGGTGTGGGCGATACAACCTCTCAAGGTG^ 

SEQ2608 TCTTGGAGATTCTCTGACCGAAGGTGTGGGCGATACAACCTCTCAAG^ 

SEQ2 609 TCTTGGAGATTCTCTGACCGAAGGTGTGGGGGATACAACCTCTCAAGGT^ 

SEQ2601 ACTGCT ATCAGAATCACTCCATAATCGATACT CTTACCAAGTGACTTCTGTTAATTATGG 

SEQ2602 ACTGCTATCAGAATCACTCGATAATCGATACTCTTA 

SEQ2603 ACTGCTATCAGAATC^CTCCATAATCGATACTCTTACC^GTGACTTCTGTTAATTATG^ 

SEQ2604 ACTGCTATCAGAATCACTCC^TAATCGATACTCTTAC 

SEQ2 605 ACTGCTAT CAGAATCACTCCATAATCGATACT CTTACCAAGTGACTTCTGTTAATTATGG 

SEQ2 606 ACTGCTATCAGAATCACTCCATAATCGATACTCTTACCAAGTGACTTCTGTTAATTATGG 

SEQ2 607 ACTGCTAT CAGAAT CA CTCCATAATCGATACT CTTACCAAGTGACTTCTGTTAATTATGG 

SEQ2608 ACTGCTAT^GAATC^CTCCATAATCGATACTCITO^ 

SEQ2 609 ACTGCTAT CAGAAT CACTCCATAATCGATACTCTTACCAAGTGACTTCT 

SEQ2 601 TGTGTCIGGGAATACTAGTCAACAAATTTTAAAACGTATG^ 

SEQ2 602 TGTGTCTGGGAATACTAGT CAACAAATTTTAAAACGTATGACX^CAGATCCT CAAATCGA 

SEQ2 603 TGTGTCTGGGAATACTAGTCAACAAATTTTAAAACGTATGAO^ 

SEQ2604 TGTGTCTGGGAATACTAGT CAA.CAAATTTTAA71ACGTATGACGACAGATCCTCAAATCX3A 

S EQ2 605 TGTGTCTGGGAATAOTAGTCAACAAATTTTAAAACGTATGAOT 

SEQ2 606 TGTGTCTGGGAATACTAGTCAACAAATTTTAAAACK3TATGACX^CA 

SEQ2607 TGTGTCTGGGAATACTAGT CAACAAATTTTAAAACGTATGA 

SEQ2608 TGTGTCTGGGAATACTAGT CAACAAATTTTAAAACGTATGACGACAGATCCTCAAATCGA 

SEQ2609 TGTGTCTGGGAATACTAGTCAACAAATTTTAAAACGTATGACGACAGATCCT 

SEQ2 6 0 X AAAAGATTTAGAGAAAGCTGATTTATTGACXyCTAACTG 

SEQ2 602 AAAAGATTTAGAGAAAGCTGATTTATTGACGCTAACTGTTGCT 
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Table 26: Comparative Sequences relating to SAG0503 (lipase/acylhydolase) 

SEQ2603 AAAAGATTTAGAGAAAGCTGATTTATTGACGCTAACTGOT 

SEQ2 604 AAAAGATTTAGAGAAAGCTGATTTATTGACGCTAACTGTTGGTGG 

SKQ2605 AAAAGATTTAGAGAAAGCTGATTTATTGACGCTAACTGTTGGTGGTAATGATGTCTTGGC 

SBQ2607 AAAAGATTTAGAGAAAGCTGATTTATTGACG CT AACTGTTGGTGGTAATGATGTCT TGG C 

SEQ2608 AAAAGATTTAGAGAAAGCTGATTTATTGACX3CTAACTGTTGG ■ 

SEQ2601 TGTTATTCGTAAAGAGCTCAGTCATTTATCACT^ 

SEQ2602 TGTTATTCGTAAAGAGCTCAGTCATTTATCACTAAATTCC^ 

SEQ2603 TGTTATTCGTAAAGAGCTCAGTC^TTTATCACT^^ 

SEQ2 604 TGTTATTCGTAAAGAGCTCAGT CATTT ATCACTAAATTCCTTTGAGAAACCAGCAGAAGC 

SEQ2605 TGTTATTCGTAAAGAGCTCIAGTCATTTATCACTAAATTCCT^ 

SEQ2 606 TGTTATTCGTAAAGAGCTCAGTCATTTATCACTAAATTCCTTTGAGAAACCAGC^GAAGC 

SEQ2607 TGTTATTCGTAAAGAGCTCAGT CATTTATCACTAAATTCCTTTGAGAAACCAGCAGAAGC 

SEQ2608 TGTTATTCGTAAAGAGCTCAGTCATTTATCACTAAAT^ 

SEQ2609 TGTTATTCGTAAAGAGCTO^GTCATTTATCACTAAATTCCTTTGAGAAACCAGCAGAAGC 

SEQ2601 ATATAAGGAACGTTTGAAAGAAATACTTGCAAAAGCAAGACAAGATAAT^ 

SEQ2602 ATATAAGGAACGTTTGAAAGAAATCCTTGCIAAAAGC^^ 

SEQ2603 ATATAAGGAACGTITGAAAGAAATCCTTGCAAAAG CAAGACAAGATAATC CTAAATTGCC 

SEQ2604 ATATAAGGAACGTTTGAAAGAAATTCTTGCAAAAG C^ TG CC 

SEQ2 605 ATATAAGGAACGTTTGAAAGAAATACTTGCAAAAG CAAGACAAGATAATCCTAAATTGCC 

SEQ2 606 ATATAAGGAACGTTTGAAAGAAATTCTTGCAAAAG(ZAAGACAAGATAATCCTAAATTGCC 

SKQ2607 ATATAAGGAACGTTTGAAAGAAATCCTTGCAAAAGCAAGACAAGATAATCCT 

SEQ2 608 ATATAAGGAACGTTTGAAAGAAATCCTTGCAAAAG CAAGACAAGATAATCCTAAATTGCC 

SEQ2 609 ATATAAGGAACGTTTGAAAGAAATTCTTGCAAAAG CAAGACAAGATAATCCTAAATTGCC 

SEQ2601 TATTTATGTTTTAGGCATTTATAATCCTTTTTACCTAAACTT^ 

SBQ2 602 TATTTATGTTTTAGGCATTTATAATCCTTTTTACCTAAA^ 

SEQ2603 TATTTATGTTTTAGGCATTTATAATCCTTTTTACCTAAACTTTCCA(^ATTAACTAAAAT 

SEQ2604 TATTTATGTTTT AGG CATT TATAATCCTTTTTACCTAAACTTTCCACAATTAACTAAAAT 

SEQ2605 TATTTATGTTTTAGGCATTTATAATCCTTTTTACC 

SEQ260 6 TATTTATGTTTTAGGCATTTATAATCCTTTTTA 

SEQ2607 TATTTATGTTTTAGGCATTTATAATCCTTTTTACCTAAACTTTCCAC^TTAACTAAAAT 

SEQ260 8 TATTTATGTTTTAGGCATTTATAATCCTTTTTACCTAA^ 

SEQ2 609 TATTTATGTTTTAGGCATTTATAATCCTTTTTACCTAAACTT^ 

SEQ2 601 GCAAAC CGTTATTGATAATTGGAATAAAGC TACAAAAGAAGTAGTTGATGCTTCAGAAAA 

SEQ2 602 GCAAAC CGTTATTGATAATTGGAATAAAGCT ACAAAAGAAGTAGTTGATC 

SEQ2 603 GCAAAC CGTTATTGATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATC 

SEQ2 604 G CIAAAC CJGTTATTGATAATTGGAATAAAGCTACAAAAGAA 

SEQ2605 GCAAAC CG TTATTGATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATGCTTCAGAAAA 

SEQ2 60 6 GCAAAC CX3TTATTGATAATTGGAATAAAGCTACAAAAGAAG 

SEQ2 607 GCAAAC CGTTATTGATAATTGGAATAAAGCTACAAAAGAAGTAGTTGATC 

SEQ2 608 GCAAACCX3TTATTGATAATTGGAATAAAGCTACAAA 

SEQ2 60 9 GCAAACCX3TTATTGATAATTGGAATAAAGCTACAAAAGAAGTA CTTCAGAAAA 

SEQ2 601 TGTTTATTTTGTCCCAATTAATGACCGCCTTTATAAGGG^ 

SEQ2 602 TGTTTATTTTGTCCCAATTAATGACCGCCTTTATA^ 

SEQ2603 TGTTTATTTTGTCCC1AATTAATGACCGCCTTTATAAGGGAATAAA 

SEQ2 604 TGTTTATTTTGTCC C^^ATTAATGACCGCCTTTATAAG^GAATAAATGGTAAAGAGGGTAT 

SEQ2605 TGTTTATTTTGTCCCAATTAATGACC^CCrTTAT 

SEQ2606 TGTTTATTTTGTCCCAATTAATGACCGCCTTTATAAG^ 

SEQ2607 TGTTTATTTTGTCCCAATTAATGACCGCCTTTATAAGGGAATAAATGGTAAA 

SEQ2 608 TGTTTATTTTGTCCCAATTAATGACXXSCCrTTATAAG 

SEQ2609 TGTTTATTTTGTCCCAATTAATGACCG CCTTTATAAGGGAAT AAAT 

SEQ2 601 TACIAGAGTCATCAAATAGTCAGGCAAGTATCACTAATGATGCT 

SEQ2602 TATAGAGT CATCAAATAGTCAG GCAAGTATCIACTAATGATGCT CTCTTTACTGGAGACCA 

SEQ2 603 TACAGAGT CATCAAAT AGTCAGG CAAGTAT CACTAATGATGCTCTCTrTTACTG 

SEQ2 604 TACAGAGTCATCAAATAGTCAGGCAAGTAT CACTAATGATGCT CTCTT TACTGGAGACCA 

SEQ2 605 TACAGAGT CAT CAAATAGTCAGGCAAGTATCACTAATGATGCTCTCTTTACTGG^ 

SEQ2 606 TACAGAGT CATCAAATAGTCAGGCAAGTAT CACTAATGATGCTCTCTT TACTGGAGACCA 

SEQ2 607 TACAGAGT CATCAAAT AGTCAGGCAAGTATCACTAATGATGCT CTCTTTACTGGAGACCA 

SEQ2608 TACAGAGT CATO\AATAGTCAG^CZAAGTATCACTAATGATGCT CTCTTTACTGGAGACCA 

SEQ260 9 TACAGAGT CATCAAATAGT CAGGCAAGTATCACTAATGATGCrCTCTTTACTGGAGACCA 

SEQ2 601 TTTTC^TCCCAATAATATTGGCTATCAAATCATCT 

SEQ2 602 TTTT C^TCCCIAATAATATTGGCT ATCAAATCATGT CTAACGCCGTTATGGAGAAAATAAA 



619 



WO 2004/018646 



PCT/US2003/026827 



Table 26: Comparative Sequences relating to SAG0503 (lipase/acylhydolase) 

SEQ2 603 TTTTCATCCCAATAATATTGGCTATCAAATCATGTCTAACGCC^TTATGGAGAAAATAA^ 

SEQ2604 TTTTCATCCC^TAATATTGGCTATCAAATCATGTCrAACGCCGTTATGGAGAAAATA^ 

SBQ2605 TTTTCATCCCAATAATATTGGCTATCAAATCATGTCTAACGCC 

SEQ2606 TTTTaTCCCAATAATATTGGCTAtCAAATCATGTCTAACGCra 

SEQ2607 TTTTCATCCCAATAATATTGGCTATCAAATCATGTCTAArc 

SEQ2608 TTTTCATCCCAATAATATTGGCTATCAAATCATGTCTAACGCCGTTATGGAGAAAATA 

SEQ2 609 TTTTCATCCC^TAATATTGGCTATCAAATCATGT 

SBQ2601 TGAAAC^GAAAA^CTGGCCGAACCCAGCriTC , l t TGTACAAAG 

SEQ2 602 TGATU^CAAGAAAAAACTGGCCG^GCCAGCTTTCTTGTACAAAGTCk^CC 

SEQ2603 TGAAACAAGAAAAAACTGGCCXaAACCCAGClT T Cr TC TACAA 

SEQ2604 TGAAACAAGAAAAAACTGGCCGAACCCAG CTTTCT TGTACAAA 

SEQ2605 TGAAACAAGAAAAAACTGGC CX3AACCCAGL w riTCi l TGTACAA 

,SEQ2606 TGAAACAAGAAAAAACTGG CCGAACCCAGCTTTCTTGTACAAA 

SEQ2607 TGAAACAAGAAAAAACTGGC03AACCCAGCTTTCTTCT 

SEQ2608 TGAAACAAGAAAAAACTGGCCGAACCCAGCTTTCTTGTACAAAGT^ 

SEQ2 609 TGAAACAAGAAAAAACTGGCCGAACCCAGCTTTCTTGTACAAATA^ 

SEQ2601 

SEQ2602 

SEQ2603 

SEQ2604 

SEQ2605 

SEQ2606 

SEQ2607 

SEQ2608 

SEQ2609 NGTSAGASACYHYDAS 

>SEQ ID NO 2650:103_090 frame; 2 

IFSLIIPKSNPKLTKKDFLTKKVIPLNYVAIjGDSLTEGVGDTTSQGGFV^ 

LLS ESLHNRYS YQVTSVNYGVSGNTSQQILKRMTTDPQ I EKDLEKADLLTLTVGGNDVLA 

VI RKEL SHLS LNSF EKPAEAYKERLKE I LAKARQDNPKLP I YVLGI YNPF YLNF PQ LTKM 

QTVIDNWNKATKEWDAS ENVYFVPINDRL YKGINGKEGI TES SNS QAS ITNDALFTGDH 

FHPNNIGYQIMSNAVMEKINETRKNWP 

>SEQ ZD NO 2651sl03_H36B frames 2 

IFSLIIPKSNPKLTKKDFLTKKVI PLNYVALGDSLTEGVGDTTSQGGFVPLLS 
ESLHNRYSYQOTSVNYGVSGNTSQQILKRMTTDPQIEKDLEKADLLTLTVGGlTOVIiAVIR 
KELSHL SLNS FEKP AEAYKERLKE I LAKARQDNPKLP I YVLGI YNP F YLNFPQLTKMQTV 
IDNWNKATKEVVDASENVYFVPINDRL YKGINGKEGI I ES SNS QAS ITNDALFTGDHFHP 
NNIGYQIMSNAVMEKINETRKNWP 

>SEQ XD HO 2652tl03_18RS21 frames 3 

IFSLIIPKSNPKLTKraFLTKKVIPLNYVAIiGDSLTEGVGDTTSQGGFVPLIjS 
ESLHNRYS YQVTSVNYGV S GNTS QQIL KRMTTD PQ I EKDL EKADLL TLTVGGNDVLAVI R 
KELSHLSLNS FEKP AEAYKERLKE I LAKARQDNP KLP I YVLGI YNP FYLNFPQLTKMQTV 
IDNWNKATKEWDAS ENVYFVPINDRL YKGINGKEGI TES SNSQAS ITNDALFTGDHFHP 
NNIGYQIMSNAVMEKINETRKNWP 

>SEQ ID NO 2653 il03_COHl frame: 3 

I FSLI I PKSNPKLTKKDFLTKKVI PLNYVALGDSLTEGVGDTT S QGGFVPL 

LSESLHNRYSYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDLEKADLLT^ 

IRKELSHL SLNS FE KP AEAYKERLKE I LAKARQDNPKL PI YVLGI YNP FYLNF PQLTKMQ 

TVIDNWNKATKEVVDASENVYFVPINDRLYKGINGKEGITESSNSQASITN^ 

HPNNIGYQIMSNAVMEKINETRKNWP 

>SEQ ZD NO 2654il03_CJB110 frames 3 

I FSLI I PKSNPKLTKKDFLTKKVI PLNYVALGDSLTEGVGDTTSQGGFVPLLS 
ESLHNRYS YQVTSVNYGVS GNTSQQILKRMTTDPQI EKDLEKADLLTLTVGGNDVLAVI R 
KELSHLSLNS FEKPAEAYKERLKE I LAKARQDNP KLPI YVLGI YNP FYLNF PQLTKMQTV 
IDNWNKATKEVVDAS ENVYFVPINDRL YKGINGKEGI TES SNS QAS I TNDALF^^ 
NNIGYQIMSNAVMEKINETRKNWP 

>SEQ ZD NO 2655il03_1169NT frames 3 

I FSLI I PKSNPKLTKKDFLTKKVI PLNYVALGDSLTEGVGDTTSQGGFVPLLS 

ESLHNRYSYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDLEKADLLTLTVGGNDVLAVIR 

KELSHLSLNSFEKPAEAYTCERLKEILAKARQDNPKLPIYVLGITO 

IDNWNKATKEVVDAS ENVYFVPINDRLYKG I NGKEGITES SNS QAS ITNDALFTGDHFHP 
NNIGYQIMSNAVMEKINETRKNWP 



620 



WO 2004/018646 



PCT7US2003/026827 



Table 26: Comparative Sequences relating to SAG0503 (lipase/acyihydolase) 

>SEQ ID NO 2656:103_JM91300I3 frames 3 

' I FSLI I PKSNPKLTKKDFLTKKVI PLNYVALGDSLTEGVGDTTSQGGFVPLLS 
ESLHNRYS YQVTSVNYGVSGNTSQQILKRMTTDPQ I EKDLEKADLLTLTVGGNDVLAVIR 
KELSHL SLNS F EKP AEA YKERLKE I LAKARQDNPKL P I YVLGI YNP FYLNF PQLTKMQTV ' 
IDNWNKATKEWDAS ENVYFVP INDRL YKG INGKEGI TES SNS QAS I TNDAL FTGDHFHP 
NNIGYQIMSNAVMEKINETRKNWP 
>SBQ ID NO 2657:103_2603 frame: 1 

I FSLI I PKSNPKLTKKDFLTKKVI PLNYVAIiGDSLTEGVGDTTSQGGFVPLL 

S ES LHNRYS YQ VTS VNYGVS GOTS QQI LKI^TTD PQ I EKDLEKAD3^TLTVGGlTOVIiAV I 

RKELSHIiSLNSFEKPAEAYKBMiKEIIiAKARQDNPKLPIYV^ 

V I DNWNKATKEWDASENVYFV PINDRL YKGI NGKEGI TE S SNSQAS I TNDALF TGDHFH 
PNNIGYQIMSNAVMEKINETRKNWP 

>SEQ ID NO 2658 :1Q3_M781 frames 3 

I FSLI I PKSNPKLTKKDFLTKKVI PLNYVALGDSLTEGVGDTTSQGGFVPL 

LS ESIiHNRYS YQWSVNYGVSGNTSQQILKRMTTDPQI EKDLEKADLLTLTVGGND^VLAV 

IRKELSHLSLNSFEKPAEAYKERLKEILAKARQDNPKLPIYVLGIYNPF 

TVIDNWNKATKEVVDASENVYFVPINDRLYKGINGKEGITES SNSQAS ITNDALFTGDHF 

HPNNIGYQ IMSNAVMEKINETRKNWP 



SEQ2650 
SEQ2651 
SEQ2652 
SEQ2653 
SEQ2654 
SEQ2655 
SEQ2656 
SEQ2657 
SEQ2658 



I FSLI I PKSNPKLTKKDFLTKKVI PLNYVALGDSLTEGVGDTTSQGGFVPLLSESLHNRY 
I FSLI I PKSNPKLTKKDFLTKKVI PIiNYVALGDSLTEGVGDTTSQGGFVPLLSESLHNRY 
I FSL 1 1 PKSNPKLTKKDFLTKKVI PLNYVALGDSLTEGVGDTTSQGGFVPLL SESLHNRY 
IFSLI I PKSNPKLTKKDFLTKKVI PLNYVALGDSLTEGVGDTTSQGGFVPL^ 
I FSLI I PKSNPKLTKKDFLTKKVI PIjNYVALGDS LTEGVGDTTS QGGFVPLLS ES LHNR Y 
I FSLI I PKSNPKLTKKDFLTKKVI PLNYVALGDSLTEGVGDTTSQGGFVPLLSESLHNRY 
IFSLII PKSNPKLTKKDFLTKKVI PLNYVALGDSLTEGVGDTTSQGGFVPLLSESLHNRY 
I FSLI I PKSNPKLTKKDFLTKKVI PliNYVALGDSLTEGVGDTTSQGGFVPLLSESLHNRY 
IFSLI I PKSNPKLTKKDFLTKKVI PLNYVALGDSLTEGVGDTTSQGGFVPLLSESLHNRY 



SEQ2650 
SEQ2651 
SEQ2652 
SEQ2653 
SEQ2654 
SEQ2655 
SEQ2656 
SEQ2 657 
SEQ2658 



SYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDLEKADLLTLTVGGNDVLAVIRKELSHLS 
SYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDIjEKADLLTLT^ 

SYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDLEKADLLTLWGGNDVIjAVIRKELSHLS 

SYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDLEKADIjLTLTVGGN^ 

SYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDLEKADLLTLTVGGNDVIAVIRI^ 

SYQVTSVNYGVSGNTSQQILKROTTDPQIEKDLEKADLLTLWGGND*^ 

S YQVTS VNYGVSGNTS QQI LKRMTTDP QI EKDLEKADLLTLTVGGNDVLAVIRKELSHLS 

SYQVTSVNYGVSGNTSQQILKRMTTDPQIEKDLEKADLLTLTVGGNDVIAVIRKELSHLS 

SYQVTSVNYGVSC^SQQILKRMTTDPQIEKDLEKADLLTLTVGGNDVLAVIRKELSHLS 



SEQ2650 
SEQ2651 
SEQ2652 
SEQ2653 
SEQ2654 
SEQ2655 
SEQ2656 
SEQ2657 
SEQ2658 



LNSFEKPAEAYKERLKEILAKARQDNPKLPIYVLGIYNPFYLNFPQLTKMQT^ 

LNS FEKPAEAYKERLKEILAKARQDNPKLPI YVLGI YNPFYLNFPQLTKMQTVI DNWNKA 

LNS FEKPAEAYKERLKE I LAKARQDNPKLP I YVLGI YNP FYLNFPQLTKMQTVI DNWNKA 

LNSFEKPAEAYKERIiKEILAKARQDNPKLPIYVLGIYNPFYLNFPQLTKMQW 

IjNSFEKPAEAYKERLKEILAKARQDNPKLPI YVLG I YNPF YIiNFPQ 

LNS FEKPAEAYKERLKE I LAKARQDNP KLP I YVLG I YN PFYLNFPQLTKMQTVI DNWNKA 

LNS FEKPAEAYKERLKEILAKARQDNP KLPI YVLGI YNPFYLNFPQLTKMQTVIDNWNKA 

LNS FEKPAEAYKERLKE I LAKARQDNPKLP I YVLG I YNPFYLNFPQLTKMQTVI DNWNKA 

LNS FEKPAEAYKERLKE I LAKARQDNPKLP I YVLGI YNP FYLNFPQLTKMQTVI DNWNKA 



SEQ2650 
SEQ2651 
SEQ2652 
SEQ2653 
SEQ2654 
SEQ2655 
SEQ2656 
SEQ2657 
SEQ2658 

SEQ2650 
SEQ2651 
SEQ2652 
SEQ2653 
SEQ2654 
SEQ2655 
SEQ2656 
SEQ2657 
SEQ2658 



TKEWDAS ENVYFVP INDRL YKGI NGKEG I TE S SNS QAS I TNDAL FTGDHFHPNNI G YQ I 
TKEWDAS ENVYFVP INDRL YKGI NGKEGI I E SSNS QAS I TNDAL FTGDHFHPNNI GYQ I 
TKEWDAS ENVYFVP I NDRL YKG I NGKEGI TES SNS QAS I TNDALF TGDHFHPNNIGYQ I 
TKEVVDAS ENVYFVP INDRLYKGIN<2CEGITESSNSQASITNDALFTGDHFHPNNIGYQI 
TKEVVDASENVYFVPINDRLYKGINGKEGITESSNSQASITNDALFTGDHFHPNNIGYQI 
TKEWDASENVYFVPINDRLYKGINGKEGITES SNSQAS ITNDALFTGDHFHPNNI GYQI 
TKEWDAS ENVYFVPINDRLYKGINGKEGITESSNS QAS I TNDALFTGDHFHPNNIGYQ I 
TKEWDAS ENVYFVP I NDRL YKGI NGKEGI TES SN S QAS I TNDAL FTGDHFHPNNI GYQ I 
TKEWDAS ENVYFVP I NDRL YKGI NGKEGI TES SNS QAS I TNDALFTGDHFHPNNI GY Q I 

MSNAVMEKINETRKNWP 
MSNAVMEKINETRKNWP 
MSNAVMEKINETRKNWP 
MSNAVMEKINETRKNWP 
MSNAVMEKINETRKNWP 
MSNAVMEKINETRKNWP 
MSNAVMEKINETRKNWP 
MSNAVMEKINETRKNWP 
MSNAVMEKINETRKNWP 
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Table 27: Comparative Sequences relating to SAG1473 
(cell wall surface anchor family protein) 

SEQ ID. NO. 2701i SAG1473 PROM THE 1169NT1 GBS TYPE V STRAIN 
(REVERSE COMPLEMENT) 

GATACAAGTGATAAGAATACTCACACGAGTGTCGTGACT 
ACTAGACCAGTCTAGTACTGGTTCTTCTTC 

CGTCAACTAATCCACCTACAACAGAACC^TCGCAACCCTCACCTA 
ACGAAGAC^GAAATTGGCAATAATAAGGATATTTCTAGTGGAACAAAAGTATTAATTT 
TAAGAATTTTAGTAAAGCAAGTAGTGATCIAAGAAGAAGTC^^ 
GTGATGGGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2702: SAG147 3 FROM THE 18R?21 GBS TYPE II STRAIN ' 

GATACAAGTGATAAGAATACTGAC^CGAGTGTCGTGACK 

ACTAGACCAGTCTAGTACTGK3TTCTTCTTCTGAAAATC 

CGTCAACTAATCCACCTACAACAGAACCATCGC^ 

ACGAAGACAGAAATTGGCAATAATAAGGATATTTCT^^ 

TAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGGATCGCGATC 

ATGATGGGAAAAAAGG CCACAGTAAGCCTAAAAAGGAA ' 

SEQ ID NO. 2703s SAG1473 FROM THE 2603 V/R GBS TYPE V STRAIN 

C^TACAAGl'GATAAGAATACTGACACGAGTGTCGTGACTACGACOTTATCTGAGGAGAAAAGATC^GATGA 
ACTAGACCAGTCTAGTACTGGTTCTTC 

CGTCAACTAATCGACOTACAACAGAACCATCGCAACCCTCACCTAGTGAAGA 
ACGAAGACAGAAATTGGCAATAATAAGGATATTTCTAGTC 

TAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATCATCATCTTCAAA 
ATGATGGGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2704: SAG1473 FROM THE 090 GBS TYPE la STRAIN 
GACCAGTCTAGTACTGGTTCTTCTTCTC 

AACTAATCCACCTACAACAGAACC^TCGCAAC CCTCAC CTAGTGAAGAGAACAAGC CTGATGGTAGAACGA 
AGACAGAAATTGGCAATAATAAGGATATTTCTAGTGGAACAAAAGTAT^ 
AATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATCATCATOT 
TGGGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2705: SAG1473 FROM THE A909 GBS TYPE la STRAIN 

GATACAAGTGATAAGAATACTGACACGAGTGTQ3TGACT 

ACTAGACGAGTCTAGTACTGGTTCTTCTTCTGAAAATGAA 

CCTCAACTAATCCACCTACAACAGAACCATCGCAACCCTCACCTAGTC 

ACGAAGACAGAAATTGGCAATAATAAGGATATTTCTAGTGGAACAAAAG 

TAAGAATTTTAGTAAAGCAAGTACTGATCAAGAAGAAGTGGATCGCGATG 

ATGATGAGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2706: SAG1473 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

GATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACG 

ACTAGACCAGTCTAGTACTGGTTCTTCTTCTGAAAATGAATCGAGT^ 

CGTCAACTAATCCACCTACAACAGAACCA 

ACGAAGACAGAAATTGGCAATAATAAGGATATTTCTAGTC 

TAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATCAT 
ATGATGGGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 
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Table 27: Comparative Sequences relating to SAG1473 
(cell wall surface anchor family protein) 

SEQ ID NO- 2707: SAG1473 PROM THE COH1 GBS TYPE III STRAIN 
(REVERSE COMPLEMENT) 

GATACAAGTGATAAGAATACTGAC^CGAGTGTCGTGACrACGACCTTATCT 
ACTAGACCAGTCTAGTACTGGTTCITCTTCTGAAAATGAATCAAG 
CCTCAACTAATCCACCTACAACAGAACC^TCGCAACC 
ACGAAGACAGAAATTGGCAATAATAAGGATATTTCTAGT^^ 

TAAGAATTTTAGTAAAG CAAGTAGTGAT CAAGAAGAAGTGGAACGCGATGAATCATC^TCTTCAAAAGCAA 
ATGATGAGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2708: SAG1473 FROM THE H36b GBS TYPE lb STRAIN 

GATACAAGTCATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAAAGA 

ACTAGACCAGTCTAGTACTGGTTCT^CTTCT^ 

COTCAACTAATCCACCTACAACAGAACCATCGCAACCCTCACCT 

ACGAAGACAGAAATTGGCAATAATAAGGATATTTCTAGTGGA 

TAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAArAAGTiTCATCGCGATGAAT 

ATGATGAGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2709: SAG1473 FROM THE JM910013 GBS TYPE VIII STRAIN 

GATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAAAGATTAGATGA 

ACTAGACCAGTCTAGTACTGGTTCTTCTTCTGAAAATGAATCGAGTTCATCAAGTGAACCAG 

CCTCAACTAATCCACCTACAACAGAACCATCGCAACCCTCACCTAG^ 

ACGAAGACAGAAATTGGCAATAATAAGGATATTTCT^^ 

TAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGGATCX3 

ATGATGAGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2710: SAG1473 FROM THE M732 GBS TYPE III STRAIN 

GATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAAAGATCAGATGA 

ACTAGACCAGTCTAGTACTGGTTOTTCTTCTGAAAATGAATCAAGTT 

CCTCAACTAATCCACCTACAACAGAACCATCGCAACCCT 

ACGAAGACAGAAATTGGCAATAATAAGGATATTTCTAGTGGAACAAAAGTATTAAT1T 

TAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGGAACGCG^ 

ATGATGAGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

SEQ ID NO. 2711: SAG1473 FROM THE M781 GBS TYPE III STRAIN 

GATACAAGTGATAAGAATACTGACACX5AGTGTC 
ACTAGACC^GTCTAGTACTGGTTCTTCTT 

CCTCAACTAATCCACCTACAACAGAACCATCGCAACCCTCACCTAGTGAAGAGAACAAGCCTG 
ACGAAGACAGAAATTGGCAATAATAAGGATATTTCTA^ 
TAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAAGAAGTGG 
ATGATGAGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 



SEQ2701 
SEQ2702 
SEQ2703 
SEQ2704 
SEQ2705 
SEQ2706 
SEQ2707 
SEQ2709 
SEQ2710 
SEQ2711 



ATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAA 
ATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAA 
ATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAA 

ATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAA 

ATAO^GTGATAAGAATACTGACACGAGTGTCGTGACTACGACCITATC 

ATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAA 

ATACAAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTGAGGAGAAA 

ATAC7VAGTGATAAGAATACTGACACGAGTGTCGTGACTACGACCTTATCTCAGGAGAAA 

ATACAAGTGATAAGAATACTGACACGAGTGTCCTX^CTACGACCTTATCTGAGGAGAAA 
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SEQ2701 
SEQ2702 
SEQ2703 
SEQ2704 
SEQ2705 
SEQ27 06 
SEQ2707 
SEQ2709 
SEQ2710 
SEQ2711 

SEQ2701 
SEQ2702 
SEQ27 03 
SEQ2704 
SEQ2705 
SEQ27 06 
SEQ2707 
SEQ2709 
SEQ2710 
SEQ2711 

SEQ2701 
SEQ2702 
SEQ2703 
SEQ2704 
SEQ27 05 
SEQ2706 
SEQ2707 
SEQ2709 
SEQ2710 
SEQ2711 

SEQ27 01 
SEQ2702 
SEQ2703 
SEQ2704 
SEQ2705 
SEQ2706 
SEQ2707 
SEQ2709 
SEQ2710 
SEQ2711 

SEQ2701 
SEQ2702 
SEQ2703 
SEQ2704 
SEQ2705 
SEQ2706 
SEQ2707 
SEQ2709 
SEQ2710 
SEQ2711 



GATCAGATGAACTAGACCAGTCTAGTACTGGTTCTTCTTCTGAAAATGAATCGAGTTCA 
GATCAGATGlAACTAGACCAGTCTAGTACTGGTTCTTCTTCTGAAAATGAATCGAGTTCA 
GATCAGATGAACTAGACCAGTCTAGTACTGGTTCTTCTTCTGAAAATGAATCGAGTTCA 

GACCAGTCTAGTACTGGTTCTTCTTCTGAAAATGAATCGAGTTCA 

GATTAGATGAACTAGACCAGTCTAGTACTGGTTCTTCTTCTGAAAATGAATCGAGTTCA 
GATCAGATGAACTAGACC^GTCrAGTACTGGTTCTTCTTCTGAAAATGAATCGAGTT(^ 
GATCAGATGAACTAGACCAGTCTAGTACTGGTTCTTCTTCTGAAAATGAATCAAGTTCA 
- GATTAGATGAACTAGACCAGTCTAGTACTGGTTCTTCTTCTGAAAATGAATCGAGTTCA 
GATCAGATGAACTAGACCAGTCTAGTACTGGTTCTTCTTCTGAAAATGAATCAAGTTCA 
(^TCAGATGAACTAGACCAGTCTAGTACTGGTTCTTCTTCTGAAAATGAATCAAGTTCA 

TCAAGTGAACCAGAAACAAATCCGTCAACTAATCCACCTACAACAGAACCATCGCAACCC 
TCAAGTGAACCAGAAAC?UVATCCGTCAACTAATCCACCTACAACA 

TCAAGTGAACC^GAAACAAATCCGTC^CTAATCCACeTAC^CAGAACCATCGCAACCC 

TC^AGTGAACCAGAAACAAATCCGT(^UVCTAATCCACCTACAACAGAACCATCGCAACCC 

TCAAGTGAACCAGA2UVCAAATCCCTCAACTAATCCACCTACAACAGAACCATCGCAACCC 

TCAAGTGAAC(^GAAACAAATCCGTCAACTAATCCACCTACAACAGAACCATCGCAACCC 

TCAAGTGAACGAGAAACAAATCCOTCAACTAATCCACCTACAACAGA^ 

TCAAGTGAACCAGAAACAAATCCCTCAACTAATCCACCTACAACAGAACCATCGCAACCC 

TCAAGTGAACCAGAAACAAATCCCTCAACTAATCCACCTACAACAGAACC^ 

TCAAGTGAACCAGAAACAAATCCCTCAACTAATCCACCTACAACAGA^ 

TCACCTAGTGAAGAGAACAAGCCTGATGGTAGAACGAAGACAGAAATTGGCAATAATAAG 
TCACCTAGTGAAGAGAACAAGCCTGATGGTAGAACGAAGACAGAAATTGGCAATAATAAG 
TCACCTAGTGAAGAGAACAAGCCTGATGGTAGAACGAAGACAGAAATTGGCAATAATAAG 
TCACCTAGTGAAGAGAACAAGCCTGATGGTAGAACGAAGACAGAAATTGGCAATAATAAG 
TCACCTAGTGAAGAGAACAAGCCTGATGGTAGCACGAAGACAGAAATTGGCAATAATAAG 
TCACCTAGTGAAGAGAACAAGCCTGATGGTAGAACGAAGACAGAAATTGGCAATAATAAG 
TCACCTAGTGAAGAGAACAAGCCTGATGGGAGCACGAAGACAGAAATTGGCAATAATAAG 
TCACCTAGTGAAGAGAACAAGCCTGATGGTAGCACGAAGACAGAAATTGGCAATAATAAG 
TCACCTAGTGAAGAGAACAAGCCTGATGGGAGCACGAAGACAGAAATTGGCAATAATAAG 
TCACCTAGTGAAGAGAACAAGCCTGATGGGAGCACGAAGACAGAAATTGGCAATAATAAG 

GATATTTCTAGTGGAACAAAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAA 
GATATTTCTAGTGGAACAAAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAA- 
GATATTTCTAGTGGAACAAAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAA. 
GATATTTCTAGTGGAACAAAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAA 
GATATTTCTAGTGGAACAAAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAA 
GATATTTCTAGTGGAACAAAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAA 
GATATTTCTAGTGGAACAAAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAA 
GATATTTCTAGTGGAACAAAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAA 
GATATTTCTAGTGGAACAAAAGTATTAATTOCAGAAGATAGTATTAAGAATTTTAGTAAA 
GATATTTCTAGTGGAACAAAAGTATTAATTTCAGAAGATAGTATTAAGAATTTTAGTAAA 

GCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATC^TCATCTTCAAAAGCAAGTGAT 
GCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATCATCATCTTCAAAAGCAAATGAT 
GCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATCATCATC 

GCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATCATCATCTTa^AAAGCAAATGAT 
GCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATCAT^ 

GCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATCATCATCTTCAAAAGCAAATGAT 
GCAAGTAGTGATCAAGAAGAAGTGGAACGCGATGAATCATCATCTTC^AAAGCAAATGAT 
GCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATC^TCATCTTCAAAAGCAAATGAT 
GCAAGTAGTGATCAAGAAGAAGTGGAACGCGATGAATCATCATCTTCAAAAGCAAATGAT 
GCAAGTAGTGATCAAGAAGAAGTGGATCGCGATGAATCATCATCTTCAAAAGCAAATGAT 
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SEQ2701 
SEQ2702 
SEQ27 03 
SEQ2704 
SEQ2705 
SEQ2706 
SEQ2707 
SEQ2709 
SEQ2710 
SEQ2711 

SEQ2701 
SEQ2702 
SEQ2703 
SEQ2704 
SEQ2705 
SEQ2706 
SEQ2707 
SEQ2709 
SEQ2710 
SEQ2711 

SEQ2701 
SEQ2702 
SEQ2703 
SEQ2704 
SEQ2705 
SEQ2706 
SEQ2707 
SEQ2709 
SEQ2710 
SEQ2711 

SEQ2701 
SEQ2702 
SEQ2703 
SEQ2704 
SEQ2705 
SEQ2706 
SEQ2707 
SEQ2709 
SEQ2710 
SEQ2711 

SEQ2701 
SEQ2702 
SEQ2703 
SEQ2704 
SEQ2705 
SEQ2706 
SEQ2707 
SEQ2709 
SEQ2710 
SEQ2711 



Table 27: Comparative Sequences relating to SAG1473 
(cell wall surface anchor family protein) 

GGGAAAAAAGGCOVCAGTAAGCCTAAAAAGGAA- - - - 

GGGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA - 

GGGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA - - 

GGGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

GAGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

GGGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA r - - 

GAGAAAAAAGGCCAC^GTAAGCCTAAAAAGGAASGATAO^GTGATAAGAATACTGACAC 

GAGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

GAGAAAAAAGGCCACAGTAAGCCTAAAAAGGAA 

GAGAAAAAAGGCC^CAGTAAGCCTAAAAAGGAATABC>IARATVS TNCSRATNGT SAGCWA 

AGTGTCGTGACTACGACCTTATCTGAGGAGAAAAGATTAGATGAACTAGACCAGTCTAG 
TRACANCHRAMYRTN 

ACTGGTTCTTCTTCTGAAAATGAATCGAGTTCATCAAGTGAACCAGAAACAAATCCCTC 
ACTAATCCACCTACAACAGAACCATCGCAACCCTCACCTAGTGAAGAGAACAAGCCTGA 
GGTAGCACGAAGACAGAAATTGGCAATAATAAGGATATTTCTAGTGGAACAAAAGTATT 
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Table 27: C mparative Sequences relating to SAG1473 
(cell wall surface anchor family protein) 



SEQ2701 
SEQ27 02 
SEQ2703 
SEQ2704 
SEQ27 05 
SEQ2706 
SEQ27 07 
SEQ2709 
SEQ2710 
SEQ2711 



ATTTCAGAAGATAGTATTAAGAATTTTAGTAAAGCAAGTAGTGATCAAGAARAAGTGGA 



SEQ2701 
SEQ2702 
SEQ2703 
SEQ2704 
SEQ2705 
SEQ2706 
SEQ2707 
SEQ2709 
SEQ2710 
SEQ2711 



CGCGATGAATCATCATCTTCAAAAGCAAATGATGAGAAAAAAGGCCACAGTAAGCCTAA 



SEQ2701 
SEQ2702 
SEQ2703 
SEQ2704 
SEQ2705 
SEQ2706 
SEQ2707 
SEQ2709 
SEQ2710 
SEQ2711 



AAGGAA 



>SEQ ID NO 2750r4_1169NT frames 1 

DTSDKNTDTSVVTTTLSEEKI^DEIiDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 
SPSEEITKPIX3RTKTEIGNNKDISSGTKVLISEDSIKNFSKASSIX3EEVDRDESSSSKASD 
GKKGHSKPKKE 

>SEQ ID NO 2751:4_18RS21 frame: 1 

DTSDKNTDTSVVTTTLSEEKRSDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 
SPSEENKPDGRTKTEIGNNKDISSGTKVLISEDSIBCNFSKASSIDQEEVDRDESSSSKAND 
GKKGHSKPKKE 

>SEQ ID NO 2752s4_2603 frame: 1 

DTSDKNTDTSVVTTTLSEEKRSDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 
SPSEENKPDGRTKTEIGNNKDISSGTK\^ISEDSIKNFSKASSDQEEVDRDESSSSKAND 
GKKGHSKPKKE 

>SEQ ID NO 2753t4J>90 frame t 1 

DQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQPSPSEENKPDGRTKTEIGNNKDISSG 
TKVLISEDSIKNFSKASSDQEEVDRDESSSSKANDGKKGHSKPKKE 

>SEQ ID NO 2754i4_A909 frames 1 
DTSDKNTDTSVVTTTLSEEKRIiDELDQSSTGSSSENESS 

SPSEENKPDGSTKTEIGNNKDISSGTKVLISEDSIKNFSKASSDQEEVDRDESSSSKAND 
EKKGHSKPKKE 

>SBQ ID NO 2755s4_CJB110 frames 1 

DTSDKNTDTSVVTTTLSEEKRSDEIiDQSST^ 

SPSEENKPIX3RTKTEIGNNKDISSGTKVLISEDSIKNF^ 

GKKGHSKPKKE 
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Table 27: Comparative Sequences relating to SAG1473 
(cell wall surface anchor family protein). 

>SEQ ID NO 2756t4_COHl frame i 1 

DTSDKNTDTSVVTTTLSEEKRSDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 
SPSEENKPDGSTKTEIGNNKDISSGTKVLISEDSIKNFSKASSDQEEVERDESSSSKAND 
EKKGHSKPKKE 

>SBQ ID NO 2757t4__H36B frames 1 

DTSDKNTDTSVVTTTLSEEKiajDEIjDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 
SPSEENKPDGSTKTEIGNNKDISSGTKVIiISEDSIKNFSKASSDQEXVDRDESSSSKAND 
EKKGHSKPKKE 

>SEQ ID NO 2758s4_OM9130013 frame: 1 
DTSDKNTDTSVVTTTLSEEKRIiDEIiDQSSTGSSSENESSSS 

SPSEENKPDGSTKTEIGNNKDISSGTKVLISEDSIKNFSKASSDQEEVDRDESSSSKAND 
EKKGHSKPKKE 

>SEQ ID NO 2759:4_M7 32 frames 1 

DTSDKNTDTSVVTTTLSEEKRSDEIiDQSSTGSSSENESSSSSEPETNPSTNPPT^ 
SPSEENKPDGSTKTEI GNNKDI S SGTKVLI SEDS I KNFS KASSDQEEVERDE SS S S KAND 
EKKGHSKPKKE 

>SEQ ID NO 2760:4_M7 81 frames 1 

DTSDKNTDTSVVTTTLSEEKMDEI<DQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 
S PS EENKPDGSTKTEI GNNKDI SSGTKVIjI S EDS I KNFSKASS DQEEVDRDESS SS KAND 
EKKGHSKPKKE 



SEQ275 0 TSDKNTDTSVVTTTLSEEKRSDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 

SEQ2751 TSDKNTDTSVVTTTLSEEKRSDELDQSSTGSS S ENESS SSSEPETNPS 1NPPTTEPSQP 

SEQ2752 TSDKNTDTSVVTTTIjSEEKRSDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 

SEQ2753 DQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 

SEQ27 54 TSDKOT!DTSWTTTLSEEKRLDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 

SBQ275 5 TSDKNTDTSWTTTLSEEKRSDELDQSSTGSSSENESSSSSEPETNPSTN^ 

SEQ2756 TSDKNTDTSVVTTTIiSEEKRSDELDQSSTGSSSENESSSSSEPETNP 

SEQ2757 TSDKNTDTSVVTTTLSEEKRLDELDQSSTGS S S ENESS SS SEPETNPSTNP PTTEPSQP 

SEQ2758 TSDKNTDTS WTTTIjSEEKRIiDELDQS STGSS S ENESS SS SEPETNPSTNPPTTEP SQP 

SEQ27 5 9 TSDKNTDTSWTTTLSEEKRSDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPSQP 

SEQ27 6 0 TSDKNTDTSVVTTTLSEEKRSDELDQSSTGSSSENESSSSSEPETNPSTNPPTTEPS 

SEQ2750 SPSEENKPDGRTKTEIGNNKDISSGTKVLISEDSIKNFSKASSDQEEVDRDESSSSKASD 

SEQ2751 SPSEENKPDGRTKTEIGNNKDISSGTKVLISEDSIKNFSKASSDQEEVD^ 

SEQ2752 SPSEENKPDGRTKTEIGNNKDISSGTKVLISEDSIKNFSKASSDQEEVDRDESSSSKAND 

SEQ2753 SPSEENKPDGRTKTEIGNNKDISSGTKVLISEDSIKNFSKASSDQEEVDRDESSSSKAND 

SEQ2754 SPSEENKPDGSTKTEIGNNKDISSGTKVLISEDSIKNFSKASSDQEEVDRDESSSSKAND 

SEQ2755 SPSEENKPDGRTKTEIGNNKDISSGTKVLISEDSIKNFSKASSDQEEVDRDESSSSKAND 

SEQ2756 S PS E33NKPDGSTKTEIGNNKDI SSGTKVLI SEDS IKNPSKASSDQEEVERDESSSSKAND 

SEQ2757 SPSEENKPDGSTKTEI GNNKDI SSGTKVLI SEDS I KNFSKASS E)QEXVDRDESSSSKAND 

SEQ2758 SPSEENICPDGSTKTEIGNNKDISSGTK\^ISEDSIKNFSKASSDQEEVDRDESSSSKA^ 

SEQ27 5 9 SPSEENKPDGSTKTEI GNNKDI SSGTKVLI SEDS I KNFS KASSDQEEVERDESSSSKA^ 

SEQ27 6 0 SPSEENKPDGSTKTEIGNNKDISSGTKVLISEDSIKNFSKASSDQEEVDRDESSSSKAOT 

SEQ2750 KKGHSKPKKE 

SEQ2751 KKGHSKPKKE 

SEQ2752 KKGHSKPKKE 

SEQ2753 KKGHSKPKKE 

SEQ2754 KKGHSKPKKE 

SEQ2 755 KKGHSKPKKE 

SEQ2756 KKGHSKPKKE 

SEQ2757 KKGHSKPKKE 

SEQ2 758 KKGHSKPKKE 

SEQ2760 KKGHSKPKKE 
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Table 28: Comparative Sequences relating to SAG1552 
(conserved hypothetical protein) 

SEQ ID NO. 2801: SAG1552 PROM THE 1169NT1 GBS TYPE V STRAIN 

(REVERSE COMPLEMENT) 

TTTGTTGTTAAAGGTGATACTGTACTTCAC 

TCCTTAGCAGGTTATCATCACAACGATTTTCCTATTACTCAAAAAACGT^ 

ATGGGGGCAAATACTGTAAGAGTCAAACTACCGATGAATGTTGC^ 

TCAAAGAGGCCACTGTATTTGTTGCAAGGAATACGTATAGATTCTTATCGCAATAAT^ 

GA^AraATAGGGGGTATTTAAAACGAGAAGCAAAAGGCGTTGTGGATATTCTCCA^ 

AcU&TTTTGGT3^CCGTCATTATCATTATGATCTTAGTCCTTGGGTACTTGGTTATCT 

AGTGGTACTGTCGCTTATACTAATCATCAAGAGAA7VAAAACGCAATATAAAGGACG 

GCTAATCCATTTGAGGTCATGCTAGCTC^GTTATGGATGAATTGACACATTATGAGACAGCT 

CATTTGATTAGTTTTTGAAACTCACCAACAACAGAC^ 

TACGTACAACTAAATGTAGAAAATATTCAAGCTAATTCGAATGTTAAAGCAGGTATTTTTC 

GATTTCCATCCTCGATACAAGGATTATCTATTATTTGATAAAGAGAATATC^ 

GAACTTTCITTGTCACAGGGATACGTTAAACTGCTAAATGCTTATCACAAAA 

TATTCGACAGCGAGAGGTATTGCCCAAAAAGAAATTGATAAACGTCCTCTGCCGATTAATGAAAA^ 

CGTTTACTAGAAGATTATGAATCTTTTATATCATCCGGTAGTTTTGGAGCGACTATCAA 

AATGCAAGGGCGTGGAATACATCCTTCGCCACAAATAAACATAGTCAATTCCTATGGGGGG 

CAAGGTTATGGTTTATTAGGCTTTAAAAACGCAAAACATC^TTATCAAGTTGATGGTA 

AAACATCCTCTG 

SEQ ID NO- 2802* SAG1552 FROM THE 

ATGACTAGTGCAACAGGAGATGACTTATATGCTAGC^GTGATGAAAGCTATCTCTACCTTGCGATTAAAACAAAACCT 

GAAAAACTAAAAGAAAAACGATTATTACCAATAGATATTA^^ 

GTCACATTTTCTAAATCTAGTGACTTTGTATTGTCTATTGATCCAAATGGCAACT 

TATAATGCCITAAAAGCGAACTATCTTCGACAGCTTAACGGTAAAGATTTTTATGCTTT 

AGTAATTTTGAGCAGATCAATATGGTATTGAGAAATACAAAGATTGTTGA 

AGGTTCTTACCAACTCATCCTACTGGTCTTCTGAAAACAGGAACAA 

ACAGATATTTCGTTTGGAAAGK3ACTTTATAGAGGTCAGAATTCCG^ 

CAAAAAATTC^CGATGATTACTTTAAACATTATGGTGTGAAGGAGTTAGAAATTG^ 

GCTAATAGCAAAGAAAACAGACTGATAAAGATGGCAGATTATCGTT^ 

TTTTTAAAAGACTCCTATTATAGTATTTAAGAAAGAA 

SEQ ID NO. 2803 1 SAG1552 FROM THE 18RS21 GBS TYPE II STRAIN 

AAGGGCTTATTAAAAGAAAATACAAGAACTAACTTTGTTGTTAAAGGTGATA 

CCTTTTGTTGTTAAAGGAGTAGACGTTGAGTCTTCCTTAGCGGGTTATC^ 

ACXnATCX»TGAATGGTTCCATTTAATTTCCAACATGGGGG 

TTTTACGATGCCTTATATCACCACAACAAAGCATGAAk^ 

TATCGCAATAATGCTTCTATAACAGCTTTTAATGATAATTATAGGGGGTATTTAAAACT 

GATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGATTTG 

GTACTTGGTTATGTCGTAGGGGATGATTGGAATAGTGGTACT^ 

TATAAAGGACGTTATTTTAAAACTTCTGTGGCAGCTAATCCATTTO 

ACACATTATGAGACAGCTAAATATGGTTGGCAACATTTGATTAGTTOT 

TATCGAAAACCATTTGAGGCACAGGCTCCTAAATACGTAGAACTAAATGTAGAAAA 

AAAGCAGGTATGTTTGCAGCATATAAAGCTATTGATTTC 

AATATCAGTAAAGAAGATAGACAAAAGATTAAAGAACTTTCTTTGT^ 

CACAAAATCCCTGTTCTAGTCACGGGTTATGGCTATTCGACAGCGAGAGGTATTGCCCAAA 

CCTCTGCCGATTAATGAAAAAGAACAAGGTCAGOGTTTACTAGAAGATTATGAAT 

GGAGCGACTATCAATGCATGGCAAGACGATTGGAATGCAAGGGCGTGGAATACATC 

CAATTCCTATGGGGGGATGCACAAGTATTTAATCAAGGTTATGGTTTAOT 

CAAGTTGATGGTAAAAGAGGCAAAGGAGAGTGGAAACATCCTCTGATG 

AGCAGTGATGAAAGCTATCTCTACCnTGCGATTAAAACAAAACCTGAAAAACT 

GATATTACACCAAAATCTGGTAGTAGAAAAATGAATGGTAGTAAGGTCACATTTTCT 

TCTATTGATCC^UVATGGCAAGTCTGAATTATTTGTCCAAGAGCGCT^ 

CTTAACGGTAAAGATTTTTATGCTTTCCCACCAAA 

AATACAAAGATTGTTGAAGACATGGAAAAAGTAAAAGCAACAGAGAGGTTCTT^^ 
AAAACAGGAACAACTGATAGGCACCAAAAAACATTTGACT 

G^CAGAATTCCGTGGCAGTTGTTGAATTTTTCTGATCCATCATCTCAAAAAATTCACGA 
GGTGTGAAGGAGTTAGAAATTGAGAGCATTGCTTTAGGATTAGGTGCTAATAG 

gcagattatostttgaaaaattgggagXgacc^ 

AA 
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Table 28: Comparative Sequences relating to SAG1552 
(conserved hypothetical protein) 

SKQ ID NO. 2804s SAG1552 PROM THE 2603 V/R GBS TYPE V STRAIN 
(REVERSE COMPLEMENT) 

TATTAAAAGAAAATACAAGAACTAACTTTGTTGTT^ 

TTGTTAAAGGAGTAGACGTTGAGTCTTCCTTAGCGGGTTAT 

GTGAATGGTTCCATTTAATTTCCAACATCGGGGOUUVTACTGTAAGAGTCAA 

ATGCCTTATATCACCACAACAAAGCATCAAAGAGGCCACTGTATTTGTTC 

ATAATGCTTCTATAACAGCTTTTAATGATAATTATAGGGGGTATTTAAAACGAGAAGCAA 

TCCATGGGCGTAAGCAAGTATGGAATACTGATTTGGGTAGCCGTCATTATCA 

GTTATGTCGTAGGGGATGATTGGAATAGTGGTACTGTGGCTTATACTAAT^ 

GACGTTATTTTAAAACTTCTGTGGCAGCTAATCCATTT^ 

ATGAGAGAGCTAAATATGGTTGGCAACATTTGATTAGTTTTTGAAACTCACCA^ 

AACCATTTGAGGCACAGGCTCCTAAATACGTACAACTAAATGTAGAAAATATTCAAGCTAATTCAAA 

GTATGTTTGCAGCATATAAAGCTATTGATTTCCATCCTCGATACAAGGATTATCTATTATTTGATAAAGAGAATATCA 

GTAAAGAAGATAGAGAAAAGATTAAAGAACTTTCTTTGTC^ 

TCCCTGTTCTAGTGACGGGTTATGGCTAT^ 

CGATTAATGAAAAAGAACAAGGTCAGCGTTTACTAGAAGATTATGAATCTTTTAT^ 

CTATCAATGCATGGCAAGACGATTGGAATGCAAGGGCGTGGAATACATCTTTCGC 

TATGGGGGGATGCACAAGTATTTAATCAAGGTTATGGTTTATTAGGCTTO 

ATGGTAAAAGAGGCAAAGGAGAGTGGAAACATCCTCTGATGACTAGTGCAA 

ATGAAAGCTATCTCTACCTTGCGATTAAAACAAAACCTGAAAAACTAAAAGAAAAACG^ 

CACCAAAATCTGGTAGTAGAAAAATGAATGGTAGTAAGGTCACAT^ 

ATCCAAATGGCAAGTCTGAATTATTTGTCCAAGAGCGCTATAATGCCTTAAAAGCGAACTATC 
GTAAAGATTTTTATGCTTTCCCACCAAAGAAGAAGAGTAGTA 

AGATTGTTGAAGACATGGAAAAAGTAAAAGCAACAGAGAGGOTCTTACCAACTCATCCTACTGGTC 

GAACAACTGATAGGC^CCAAAAAACATTTGATTCACAAACAGATATOT 

TTCCGTGGCAGTTGTTGAATTTTTCTGATCCATCATCTCAAAAAATTCACGATGATTACCT 

AGGAGTTAGAAATTGAGAGGATTGCTTTAGGATTAGGTGCTAATAGCAAA 

ATCGTTTGAAAAATTGGGAGAGACCCGATACCAAAACCTTTTOAAAA 

CTAAAGAAAGAGAGAGAACATATGGTCCA 

SEQ ID NO. 2805s SAG1552 FROM THE A909 GBS TYPE la STRAIN 
(REVERSE COMPLEMENT) 

AAGGGCTTATTAAAAGAAAATACAAGAACTAACTTTGTTGTTAAAGGTGATACTGTA 

CCTTTTGTTGTTAAAGGAGTAGACGTTGAGTCTTCCTTAGCGGGTTATCATCACAACGATTTTCCTATTACT 

ACX3TATCGTGAATGGTTCCATTTAATTTCCAACATGGGGGCAAA 

TTTTACGATGCCTTATATCACCACAAGAAAGCATCAA^ 

TATOX^ATAATGCTTCTATAACAGCrTTTAATGATAATTAT^ 

GATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGATTTGGGTAGCCGT^ 

GTACITGGTTATGTCXn'AGGGGATGATTGGAATAGTGGTACTGTCG^ 

TATAAAGGACGTTATTTTAAAACTTCTGTGGCAGCTAATCCATOT 

ACACATTATGAGACAGCTAAATATGGTTGGCAACATTTGATO 

TATCGAAAACCATTTGAGGCACAGGCTCCTAAATACGTACAACTAAATGTAGAAAATATTCAAGCTAA 

AAAGCAGGTATGTTTGCAGCATATAAAGCTATTGATTTCCATCCrCGATA 

AATATCAGTAAAGAAGATAGACAAAAGATTAAAGAACTTTCT 

CACAAAATCCCTGTTCTAGTCACGGGTTATGGCTATTCGACAGCGAGAGGTATTGCC 

CCTCTGCCGATTAATGAAAAAGAACAAGGTCAGCGTTTACTAGAAGATTATGAATCTTTTATATCA 

GGAGCGACTATCAATGCATGGCAAGACGATTGGAATGCAAGGGCGT^ 

CAATTCCTATGGGGC^ATGCACAAGTATTTAATCAAGGTTATGGTTTAOT 

CAAGTTGATGGTAAAAGAGGCAAAGGAGAGTGGAAACATCCTCTGATGACTAGTC 

AGGAGTGATGAAAGCTATCTCTACCTTGCGATTAAAACAAAACCTGAAAAACT 

GATATTACACCAAAATCTCGTAGTAGAAAAATGAATG^ 

TCTATTGATCCAAATGGCAAGTCTGAATTATTTGTCCAAGAGCGCTATAATGC 
CTTAACGGTAAAGATTTTTATGCTTTCC<^ 

AATACAAAGATTGTTCAAGACATGGAAAAAGTAAAAGCAACAGAGAGG 

AAAAGAGGAACAACTGATAGGCACCAAAAAACATTTGATTGA 

GTCAGAATTCCGTGGCAGTTGTTGAATTTTTCTGATCCATCATCTCAA^ 

GGTGTGAAGGAGTTAGAAAATTGAGAGCCATTGCTTTAGGATTAGGTGCT 

TGGCAGATTATCGTTTGAAAAATTGGGAGAGACCCGATACCAAAACCTTTTTAAAAGA 
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Table 28: Comparative Sequences relating to SAG1552 
(conserved hypothetical protein) 

SEQ ID NO. 2806: SAG1552 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

TATTACTTTGATGGTAGTTTGTATTTACCAAAGGGCTC^ 

GATACTGTACTTCACAAGCCCACGAATAAACCTTTTGT^ 

CATCACAACGATTTTCCTATTACTCAAAAAACGTATCGTGAATGGOT 

GTAAGAGTCAAGGTACCX3ATGAATGTTGCATTTTAC 

TATTTGTTGCAAGGAATACGTATAGATTCTTATCGCAATAATGCCT 

TATTTAAAACGAGAAGCAAAAGGCGTTGTGGATATTCTCCATGGGCGTAAGCAA 

CGTCATTATGATTATGATCTTAGTCCTTGGGTACCT 

TATACTAATCATCAAGAGAAAAAAACGCAATATAAAGGACGTTATTTTAAAACTTCTC 
GTCATGCTAGCTCAAGTAATGGATGAATTGAGA.CATTATGAGAGAGCTAAAT^ 
TCAAACTCACCAACAACAGACCCTTTTGATTATC^^ 
GTAGAAAATATTCAAGCTAATTCAAATGTTAAAGCAGGTATGTTTC 

TACAAGGATTATCTATTATTTGATAAAGAGAATATCAGTAAAGAAGATAGACAAAAGATTAAAGAACTTTCTTTGTm 
CAGGGATACGTTAAACTGCTAAATGCTTATCAGAAAATCCCTGTTC 

GGTATTGCCCAAAAAGAAATTGATAAACGTCCTCTGCCGATTAATGAAAAAGAACAAGGTC^ 

TATGAATCTTTTATATC^TCCGGTAGTTTTGGAGCGACTATCAATC 

AATACATCTTTCGCGACAAATAAAGATAATCAACT 

TTAGGCTTTAAAAACGCAAAACATCATTATCAAGTTGATGGTAA^ 

ACTAGTGCAACAGGAGATGACTTATATGCTAGCAGTGATGAAAGCTATCTCTACCTTG 

AAACTAAAAGAAAAACGATTATTACC^TAGATATTAC^ 

ACA1UUTCTAAATCTAGTGACTTTGTATTGTCTATTGATCCAAATGGCAA 

AATGCCTTAAAAGCGAACTATCTTCGACAGCTTAACGGTAAAGATTTTTATGCTTTCCCACCAAA 

AATT1TGAGCAGATAAATATGGTATTGAGAAATACAAAGATTGTTGAA 

TTCTTACCAACTCATCCTACTGGTCTTCTG&AAACAGGAAC 

GATATTTCGTTTGGAAAGGACTTTATAGAGGTCAGAATTCCGT^ 

AAAATTCACGATGATTACITTAAA(^TTATGGTGTGAAGGAGTTAGAAATTGAGAGCA 

AATAGCAAAGAAAACACACTGATAAAGATGGCAGATTATCGTTTGAAAAATTGGGAG^ 

TTAAAAGACTCCTATTATGTATTAAGAAAGA 

SEQ ID NO. 2807: SAGX552 FROM THE COH1 GBS TYPE III STRAIN 

TTTACCACAGGGCTTATTAAAAGAAAATACAAGAACT 

CAATAAACCTTTTGTTGTTAAAGGAGTAGACGTTGAGTCTTCCT^ 

TCAAAAAACGTATCGTGAATGGTTCCATTTAATTTCCAACATGGGGGCA^ 

TGTTGCATTTTACGATGCCTTATATCACCACAAGAAAGAATCAAAGAGGCCACTGTATTTGTTG^ 

AGATTCTTATCGCy^TAATGCTTCTATAACAGCTTTTAATGATAATTATAGGGGGTA 

CGTTGTGGATATTCTC(^TGGGCGTAAGCAAGTATGGAATACTGATTTTGGTAGCCGT 

TCCTTGGGTACTTGGTTATGTCGTAGGGGATGATTGG 

AACGCAATATAAAGGACGTTATTTTAAAACTTCTGTGGCAGC^ 

TGAATTGACACATTATGAGAGAGCTAAATATGGTTGGCAACAT^ 

TTTTCATTATCGAAAACCATTTGAGGCACAGGCTCCTAAATA 

AAATGTTA^GCAGGTATGTTTGCAGCATATAAAGCTATTGATTTCCATCCTCGATACAAGG 

TAAAGAGAATATCAGTAAAGAAGATAGACAAAAGATTAAAGAACITTC 

TGCTTATCACAAAATCCCTGITCTAGTCACGGGTTATGGCTATTCGACAGCGAGAGGTA 

TAAACGTCCTCTGCCGATTAATGAAAAAGAACAAGGTCAGCGTTTACT 

TAGTTTTGGAGCGACTATGAATGCATGGCAAGACGATTGGAATGCAAGGGCGT^ 

ACATAGTGAATTCCTATGGGGGGATGCACAAGTATTTAA 

TCATTATCAAGTTGATGGTAAAAGAGGCAAAGGAGAGTGGAAACATCCTCT^ 

ATATGCTAGCAGTGATGAAAGCTATCTCTACCTTGCGATTAAAACAA 

ACCAATAGATATTACACCAAAATCTGGTAGTAGAAAAATGAATGGTAGTAA 

TGTATTGTCTATTGATCCAAATGGCAAGTCTGAATTATTTG 

TCGACAGCTTAACGGTAAAGATTTTTATGCTTTCCCACCAAAGAAGAACAGTAGTAAT^ 
ATTGAGAAATACAAAGATTGTTGAAGACATGGAAAAAGTAAAAGCAACAGAGAGGTTCTO 
. TCTTCTCAAAACAGGAACAACTGATAGGCACCAAAAAACATTTGAOT 
TATAGAGGTCAGAATTCCGTGGCAGTTGTTGAATTTTTCT 

ACATTATGGTGTGAAGGAGTTAGAAATTGAGAGCATTGCTTTAGGATTAGGTGCT^ 
AAAGATGGCAGATTATCGTTTGAAAAATTGGGAGAGACCCGATACCAAAACCTTTTT 
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Table 28: Comparative Sequences relating to SAG1552 
(conserved hypothetical protein) 

SEQ ID NO. 2808: SAG1552 FROM THE H3 6b 6BS TYPE lb STRAIN 

aaggggcttattaaaagaaaatacaagaactaactttgttgttaaaggt^ 

accttttgttgttaaaggagtagacgttgagtcttccttagcgggttatcatcacaacgattct 

aacgtatcgtgaatggttccatttaatttccaacatgggggcaaatactgtaa 

attttacgatgccttatatcaccacaacaaagcatcaaagaggcc^ 

ttatcgcaataatgcttctataacagcttttaatgataattatagggggtatttaaaa 

ggatattctccatgggcgtaagcaagtatggaatactg 

ggtacttggttatgtcgtaggggatgatggacatagtggtactgtcgctttatacti^ 

caatataaaggacgttattttaaaacttctgtggcagctaatc 

ttgacacattatgagacagctaaatatggttggcaacatttgattagtttttcaaaot 

cattatcgaaaaccatttgaggcacaggctcctaaata 

gttaaagcmgtatgtttgcagcatataaagctattgatttccatcctcg 

gagaatatcagtaaagaagatagacaaaagattaaagaactttctttg^ 

tatcacaaaatccctgttctagtcacgggttatggctactcgacagcgaga^ 

cgtcctctgccgattaatgaaaaagaacaaggtcagcgtttactagaagat^ 

tttggagcgactatcaatxk^tggcaagacgattggaatgcaagggtgtc 

agtcaattcctatggggggatgcacaagtatttaatcaaggttatggtttatta^ 

TATCAGGTTGATGGTAAAAGAGGCAAAGAAGAGTGGAAACATC 

GCTAGCAGTGATGAAAGCTATCTCTACCTTGCGATTAAAACAAAACCTGAAAAACTAAAAGAAAAACGAT 
ATAGATATTACACCAAAATCTGGTAGTAGAAAAATGAATGGTAGTAAC^TCACATTO 
TTGTCTATTGATCCMATGGCAAGTCrGAATTATTTGTCCAAGAGCGCTATAACGCCTO 
CAGCTTAATGGTAAAGATTTTTATGCTTTCCCAC 

AGAAATACAAAGATTGTTGAAGACATGGAAAAAGTAAAAGCAACAGAGAGGTTCTT^^ 

CTCAAAACAGGAACAACTGATAGGCACCAAAAAACATTTGACT 

GAGGTCAGAATTCCGTGGCAGTTGTTGAATTTTTCTGA 

TATGGTGTGAAGGAGTTAGAAATTGAGAGCATTGCTTTAGGATTAGGTGCTAA 

ATGGCAGATTATCGTTTGAAAAATTGGGAGAGACCCGATACCAAAACCTTTTTAAAAGACTCCTATTATAGT 

SEQ ID NO. 2809: SAG1552 FROM THE JM9130013 GBS TYPE VIII STRAIN 

ACTTTGTTGTTAAAGGTGATACTGTACTTCACAAGCCCACCAATAAACC 

CTTCCTTAGCGGGTTATGATCACAACGATTT^ 

ACATGGGGGCAAATACTGTAAGAGTCAAGGTACCGATGAATGTTGC^^ 
CATCAAAGAGGCCACTGTATTTGTTGCAAGGAATAC^ 

ATGATAATTATAGGGGGTATTTAAAACGAGAAGCAAAAGGCGTTGTGGATATC 

ATACTGATTTTGGTAGCAGTCATTATCATTATGATCTTAGTCCTTGGGTACTTC 

ATAGTGGTACTGTCGCTTATACTAATCATCAAGAGAAAAAAACGCAATATAA^ 

CAGCTAATCCATTTGAGGTCATGCTAGCTCAAGTAATGGATG^ 

AACATTTGATTAGTTTTTCAAACTCACCAACAACAGACCCTTTTCATTATCGAA^ 

AATACGTACAACTAAATGTAGAAAATATTCAAGCTAATTCGAATGTTAAAGCAGGTATCT 

TTGATTTCCATCCTCGATACAAGGATTATCTATTATTTC^ 

AAGAACTTTCTTTGTCACAGGGATACGTTAAACTGCTAAATGCTTATC^ 

GCTACTCGACAGCGAGAGGTATTGCCCAAAAAGAAATTGATAAACGTCCT 

AGCGTTTACTAGAAGATTATGAATCTTTTATATCATCCGGTAGTTTTGGAGCGA 

GGAATGCAAGGGTGTGGAATACATCCTTCGCCACAAATAAACATAGTCAATTCCT 

ATCAAGGTTATGGTTTATTAGGCTTTAAAAACGCAAAACATCATTATCAGGTTGAT^ 

GGAAACATCCTCTGATGACTAGTGCAAGAGGAGATGACTTATATGCTAGC^ 

TTAAAACAAAACCTGAAAAACTAAAAGAAAAACGATTATTACC^^ 

TGAATGGTAGTAAGGTCACATTTTCTAAATCTAGTGACTTTC 

TTGTCCAAGAGCGCTATAACGCCTTAAAAGCGAACTATCT 

CAAAGAAGAACAGTAGTAATTTTGAGCAGATAAATATGGTATTGAGAAATACAAAGAOT 

TAAAAGCAACAGAGAGGTTCTTACCAACTCATCCTACTGGTCTTCT 

CATTTGATTCACAAACAGATATTTCGTTTGGA 

CTGATCCATCATCTCAAAAAATTCACGATGATTACTT^ 

CTTTAGGATTAGGTGCTAATAGCAAAGAAAACACACTGATAAAGATGG 

CCGATACCAAAACCTTTTTAAAAGACTCCTATTATAGTATTAAGAAAG 
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Table 28: Comparative Sequences relating to SAG1552 
(conserved hypothetical protein) 

SEQ ID NO. 2810: SAG1552 FROM THE M732 GBS TYPE III STRAIN 

TACAAGAACTAACTTTGTTGTTAAAGGTGATACTGTACTTG^ 

AGACGTTGAGTCTTCCTTAGCGGGTTATCATCACAACGATTTTCCT 

TTTAATTTCCAACATGGGGGCAAATACTGTAAGAGTCAAGGTACTC 

CCACAACAAAGAATCA^GAGGCCACTGTATTTGTTGCAAGGAA 

AACAGCTTTTAATGATAATTATAGGGGGTATTTA^^ 

GCAAGTATGGAATACTGATTTTGGTAGCCGTGATTATC^ 

GGATGATTGCAATAGTGGTACTGTCGCTTATACTAATCATCAAGAGAAAAAi^ 

AACTTCTGTGGCAGCTAATCCATTTGAGGTCATGCrAGCT^ 

ATATGGTTGGCAACATTTGATTAGTTTTTCAAACTCAC 

ACAGGCTCCTAAATACGTACAACTAAATGTAGAAAATATTCA^ 

ATATAAAGCTATTGATTTCCATCCTCX3ATAC 

ACAAAAGATTAAAGAACTTTCTTTGTCACAGGGATACGTTAAACTGCTAAATGCTTATCACAAAAT 
CACGGGTTATGGCTATTCGAOU^GAGAGGTATTGC^ 

AGAACAAGqTCAGCGTTTACTAGAAGATTATGAATCTTTTATATCATCCGGTAGTTT 

GCAAGACGATTGGAATGCAAGGGCGTGGAATACATCTTTC 

ACAAGTATTTAATCAAGGTTATGGTTTATTAGGCTTTAAAAACGCAA^ 

CAAAGGAGAGTGGAAACATCCTCTGATGACTAGTGCAACAGGAGATGACTTATATGCTAGCAGTGA 
CTACCTTGCGATTAAAACAAAACCTGAAAAACTAAAAGAAAAAC^ 

TAGTAGAAAAATGAATGGTAGTAAGGTCAC^TTTTCTAAATCTAGTGACTTTGTATTGTCTATTGAT^ 

GTCTGAATTATTTGTCCAAGAGCGCTATAATGCCTTAAAAGCGAACTATCTTCGACA^ 

TGCTTTCCCACCAAAGAAGAACAGTAGTAATTTT^ 

CATGGAAAAAGTAAAAGCAACAGAGAGGTTCTTACCAACTC^TCCTACTGGTCT 

GCACCAAAAAACATTTGATTCACAAACAGATATTTCGTTTGGAAAGGACTTTAT^ 

GTTGAATTTTTCTGATCCATCATCTCAAAAAATTCACGATGATTACTTTAAACATTATGGTGTGAAG 

TG^GAGCATTGCTTTAGGATTAGGTGCTAATAGCAAAGAAAACACACT 

TTGGGAGAGACCCGATACCAAAACCTTTTTAAAAGACTCCTATTATAGTATTAAG 

SEQ ID NO. 2811: SAG1552 FROM THE M781 GBS TYPE III STRAIN 

TTTGATGGTAGTTTGTATTTACCACAGGGCTTATTAAAAGA 
GTACTTCACAAGCCCACCAATAAACCTTTTGTTGTTAAAGGAGTAGA 
AACGATTTTCCTATTACTCAAAAAACGTATCGTGAATGCT 
GTCAAGGTACCGATGAATGTTGGA/TTTTACGATGCC 

TTGCAAGGAATACGTATAGATTCTTATCGCAATAATGCTTCTATAACAGCTTTTAATO 

AAACGAGAAGCAAAAGGCGTTGTGGATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGATTTTGGTAGCCGTCAT 

TATCATTATGATCTTAGTCCTTGGGTACTTGGTTATGTCGT^^ 

AATCATCAAGAGAAAAAAACGCAATATAAAGGACGTTATTTTAAAACTTCT 

CTAGCTCAAGTAATGGATGAATTGACACATTATGAGACAGCT^ 

TCACC^UVCAACAGACCCTTTTCATTATCGAAAACCATT^ 

AATATTCAAGCTAATTCAAATGTTAAAGCAGGTATGTTTGCAGC^ 

GATTATCTATTATTTGATAAAGAGAATATCAGTAAAGAAGATAGACAAAAGATTAAAGAACTTO 
TACGTTAAACTGCTAAATGCTTATGACAAAATCCCTGTTCT 

GCCCAAAAAGAAATTGATAAACGTCCTCTGCCGATTAATGAAAAAGAACAAGGTCAG 
TCrTTTATATC^TCCGGTAGTTTTGGAGCGACTATC^ 

TCTTTCGCCACAAATAAACATAGTCAATTCCTATGGGGGGATGCACAAGTATTTAA 

TTTAAAAACGCAAAACyVTCATTATCAAGTTGATGGTAAAAGAGGCAAAGGAGAGT^ 

GCAACAGGAGATGACTTATATGCTAGCAGTGATGAAAGCTATCTCTACCTTGCGATTAA 

AAAGAAAAACGATTATTACCAATAGATATTAGACCAAAATCT^ 

TCTAAATCTAGTGACTTTGTATTGTCT^ 

TTAAAA.GCGAACTATCTTCGACAGCTTAACGGTAAAGATTTTTATGCTTTCCCACCAAA 

GAGCAGATAAATATGGTATTGAGAAATACAAAGATTGTTGAAGACATGGAAAAAGTA 

CCAACTCATCCTACTGGTCTTCTCAAAACAGGAACAACTGATAGGCACCAAAAAAC^ 

TCGTTTGGAAAGGACTTTATAGAGGTC^GAATTCCGTC 

CACGATGATTACTTTAAACATTATGGTGTGAAGGAGTTAGAAATTGAG 

AAAGAAAACACACTGATAAAGATGGCAGATTATCGTTTGA 

GACTCCTATTATAGTATTAAGAAAGAATGG 
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Table 28: C mparative Sequences relating to SAG1552 
(conserved hypothetical protein) 



SEQ2801 

SEQ2802 - - - 

SEQ2803 AAGGGCTTATTAAAAGAAAATACAAGAACT 

SEQ2804 TATTAAAAGAAAATACAAGAACT 

SBQ2805 AAGGGCTTATTAAAAGAAAATACAAGAACT 

SSQ2 806 ATTACTTTGATGGTAGTTTGTATTTACCAAAGGGCTTATTAAAAGAAAATACAA 

SEQ2 807 TTTACCACAGGGCTTATTAAAAGAAAATACAAGAACT 

SEQ2 808 -' - AAGGGGCTTATTAAAAGAAAATACAAGAACT 

SEQ2809 

SEQ2 810 TACAAGAACT 

SEQ2811 TTTGATGGTAGTTTGTATTTACCACAGGGCTTATTAAAAGAAAATA 

SEQ2801 - - TTTGTTGTTAAAGGTGATAC TGTACTTCACAAGCC CACCAATAAAC CTTTTGTTGTT 

SEQ2802 ------ 

SBQ2803 ACrrTG'n^j'ri'AAAGGTGATACTGTAC TTCACAAGCCCAC CAATAAACCTTTTGTTGTT 

SEQ2 804 ACTTTGTTGTTAAAC^TGATACTGTACTTCACAA 

SEQ2 806 ACTTTGTTGTTAAAGGTGATACTGTACTTCACAAG 

SEQ2807 ACTTTGTTGTTAAAGGTGATACTCTACTTCAC^VAGCCC^ 

SEQ2 808 ACTTTGTTGTTAAAGGTGATACTGTACTTCACAAGCCCACCAATAAACCTT^ 

SEQ2 809 ACTTTGTTGTTAAAGGTGATACTGTACTTCACAAGCC CAC CAATAAAC CTTTTGTTGTT 

SEQ2810 ACTTTGTTGTTAAAGGTGATACTGTACTTCACAAG CCCACC^ATAAACCTTTTGTTGTT 

SEQ2811 ACTTTGTTGTTAAAGGTGATACTGTACTTCACAAGC CCAC CAATAAACCTTTTGTTGTT 

SEQ2801 AAGGAGTAGACGTTGAGT CTTCCTTAGCAGGTTAT CAT CACAACGATTTTC CTATT ACT 

SEQ2802 

SEQ2 803 AAGGAGTAGACGTTGAGTCTTCCTTAGCGGGTTATCATCACAACX^TTTTCCTATTACT 

SEQ2804 AAGGAGTAGACGTTGAGTCTTCCTTAGCGGGTTATCATCACAA 

SEQ2805 AAGGAGTAGACGTTGAGTCTTCCTTAGCGGGTTATC^TCACAACGA^ 

SEQ2806 AAGGAGTAGACGTTGAGTCTTC CTTAG CGGGTTAT(^TCACAACGATTTTC CT 

SEQ2807 AAGGAGTAGACGTTGAGTCTTCCTTAGCGGGTTATC^TaVCAACGATTTTCCTATTACT 

SEQ2 808 AAGGAGTAGACX5TTGAGTCTTC CTTAGCGGGTTAT CATCAC^W^CGATTTTCCTATTACT 

SEQ2 809 AAGGAGTAGACGTTGAGTCTTCCTTAGCGGGTTATC^TCACAACGATTTTCCTATTACT 

SEQ2 810 AAGGAGTAGACGTTGAGTCTTC CTTAGCGGGTTAT CAT CACAACGATTTTCCTATTACT 

SEQ2811 AAGGAGTAGACGTTGAGTCTTCCTTAGCGGGTTATCATCACAACGATTT^ 

SEQ2 801 AAAAAACGTATCGTGAGTGGTTCCATTTAATZTCO^CATGGGGGCAAATACTGTAA^ 

SEQ2802 - 

SEQ2803 AAAAAACGTATCGTGAATGGTTCCATTTAATTTCCT^C^TGGGGGCAAATACTGTAAGA 

SEQ2804 AAAAAACGTATCX^TGAATGGTTCCATTTAATTTCCAACATGGGGGCA 

SEQ2805 AAAAAA(^TATCGTGAATGGTTCCATTTAATTTCCAACATGGGGG 

SEQ2 806 AAAAAACGTATCGTGAATGGTT CCATTTAATTTCC^CATGGGGGCAAATA CTGTAAGA 

SEQ2807 AAAAAACGTATQ3TGAATGGTTCCATTTAATTTCCAACA 

SEQ280 8 AAAAAACGTATCXSTGAATGCTTCCATTTAATTTCCAACATGGGGGCAA^ 

SEQ2809 AAAAAACGTATOSTGAATGGTTCCATTTAATTTCCAAC^^ 

SEQ2 810 AAAAAACGTATCGTGAATGGTT CCATTTAATTTCCAACATGGGGGCAAATA CTGTAAGA 

SEQ2811 AAAAAACGTATCGTGAATGGTTCCATTTAATTTCC^ 

SEQ2801 TCAAAGTACCGATGAATGTTGCATTTTAO^TGCTTTA 

SEQ2802 — 

SEQ2 803 TCAAGGTACCGATGAATGTTGGATTTTACGATG 

SEQ2804 TCAAGGTACCGATGAATGTTGCATTTTACGATGCCTTAT^ 

SEQ2 805 TCAAGGTACCGATGAATGTTGCATTTTACGATGCCTTAT^ 

EEQ2806 TCAAGGTACCGATGAATGTTGC^TTTTACGATGCCrTATATCA 

SEQ2807 TCAAGGTACCGATGAATGTTGCATTTTACGATGCCnvrATATCACCACAA 

SEQ2808 TCAAGGTACCX^TGAATGTTGCATTTTACGATGCCTTATATCACCA 

SEQ2 809 TCAAGGTACCGATGAATGTTGCATTTTACX3ATG 

SEQ2 810 TCAAGGTACCGATGAATGTTGCATTTTAC^^ 

SEQ2 811 TCAAGGTACCGATGAATGTTGGATTTTACGATGCCT^ 

SEQ2801 AGAGGCCACTGTATTTGTTGCAAGGAATACXSTATAGAT^ 

SEQ2802 - - 

SEQ2803 AGAGGCCACTGTATTTGTTGCAAGGAATACGTATAGAT TC TTATCGCAATAATGCTTCT 

SEQ2804 AGAGGCCACTGTATTTGTTGCAAGGAATACGTATAGATTCTTAT<^ 

SEQ2 805 AGAGGCC^CTGTATTTGTTGCAAGGAATACGTATAGATTCTTAT CGCAATAATGCTTCT 

SEQ2 806 AGAGGCCACTGTATTTGTTGCAAGGAATACGTATAGATTCTTATCGCAATAATC 

SEQ2807 AGAGGCC^CTGTATTTGTTGCAAGGAATACGTATAGATTCTTATC^ 

SEQ2 808 AGAGGC C^CTGTATTTGTTGCAAGGAATACGT ATAGAT TCTTAT CGCAATAATG CTTCT 
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SEQ2811 

SEQ2801 
SEQ2802 
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SEQ2805 
SEQ2806 
SEQ2807 
SEQ2808 
SEQ2809 
SEQ2810 
SEQ2811 

SEQ2801 
SEQ2802 
SEQ2803 
SEQ2804 
SEQ2805 
SEQ2806 
SEQ2807 
SEQ2808 
SEQ2809 
SEQ2810 
SEQ2 81X 

SEQ2801 
SEQ2802 
SEQ2803 
SEQ2804 
SEQ2805 
SEQ2806 
SEQ2807 
SEQ2808 
SEQ2809 
SEQ2810 
SEQ2811 

SEQ2801 
SEQ2802 
SEQ2803 
SEQ2804 



Table 28: Comparative Sequences relating to SAG1552 
(conserved hypothetical protein) 

AGAGGCCACTGTATTTGTTGCAAGGAATACGTATAGATTCT^ 

AGAGGCCACTGTATTTGTTGCAAGGAATACGTATAGATTCTTATC^^ 

AGAGGCCACTGTATTTGTTGCAAGGAATA(^TATAGATTCTTATCGCAATAATGCrrTCT 

TAACAGCTTTTAATGATAATTATAGGGGGTATTTAA 



TAACAGCTTTTAATGATAATTATAGGGGGTATTTAAAACGAGAAGCAAAAGGCGTTGTG 
TAACAGCTTTTAATGATAATTATAGGGGGTATTTAAAACX^ 



TAACAGCTTTTAATGATAATTATAGGGGGTATTTAAAACGAGAAGCAAAAG GCGTTGTG 
TAACAGCTTTTAATGATAATTATAGGGGGTATTTAAAACG^ 

TAACAGCTTTTAATGATAATTATAGGGGGTATTTAAAACGAGAAGCAAAAGGCGTTGTC 
TAACAGCTTTTAATGATAATTATAGGGGGTATTTAAAACGAGAAGCAAAAGGCGTTGTC 
TAACAGCTTTTAATGATAATTATAGGGGCT^ 
TAACAGCTTTTAATGATAATTATAGGGGGTATTTAAAAC^^ 

TAACAGCTTTTAATGATAATTATAGGGGGTATTTAAAACGAGAAGCAAAAGGCGTTGTG 
• ATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGATTTTGG T AGCCGTCATTAT CAT 



ATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGATTTGGGTAGCCGTCATTATCAT 
ATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGATTTGOT 

ATATTCTCCATGGGCGTAAGGAAGTATGGAATACTGATTTGGGTAGCCGTCATTATCZAT 

ATATTCTCCATGGGCSTAAGCAAGTATGGAATACAGATTTTGGTAGCCGTC^TTA 

ATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGATTTTGGT^ 

ATATTCTCCATGGGCX3TAAGCAAGTATGGAATACTGATTTTGGTAGCAGT 

ATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGATTTT^ 

ATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGATTTC 

ATATTCTCCATGGGCGTAAGCAAGTATGGAATACTGATTTTGGTAGCCGTCATTATCAT 

TATGATCTTAGTCCTTGGGTACTTGGTTATGT CX3TAGGGGATGATTGGAATAGTGGT - AC 

TAT- -CTCTA- -CCTTG<^-ATTAAAAC^AAACCrGAAAAACTAAAAGAAAAACGATTAT 

TATGATCTTAGTCCTTGGGTACTTGGT TATGTCGTAGGGGATGATTGGAATAGTGGT - AC 

TATGATCTTAGTCCTTGGGTACTTGGTTATGTCCT 

TATGATCTTAGTCCTTGGGTACTTGGTTATCTCGTAGGGGATGAOT 

TATGATCTTAGTCCTTGGGTACTTGGTTATGTCGTAGGGGATGATTGGAATAGTGGT-AC 

TATGATCTTAGTCCTTGGGTACTTGGTTATGTCGTAGGGGATGATTGGAATAGTGGT-AC 

TATGATCTTAGTC CTTGGGTACTTGGTTATGT CGTAGGGGATGATGGACATAGTGGT - AC 

TATGATCTTAGTCCTTGGGTACTTGGTTATGTCGTAGGGGATGATTGGAATACT 

TATGATCTTAGTCCTTGGGTACTTGGTTATGTCXn , AGGGGATGATTGCAATAGTGGT-AC 

TATGATCTTAGTCCTTGGGTACTTGGTTATGTCGTAGGGGATGATTGGAATAGTGGT-AC 

TGTCGCTT -ATACTAATCATCAAGAGAA - AAAAACGCAATATAAAGGAC - GTTATTTTAA 
TACCAATAGATATTA — CACCAAAATCTGGTAGTAGAAAAATGAATGGTAGTAAGGTCAC 
TGTCGCTT - ATACTAATCATCAAGAGAA -AAAAACGCAATATAAAGGAC - GTTATTTTAA 
TGTCGCTT - ATACTAATCATCAAGAGAA -AAAAACGC^TATAAAGGAC- GTTATTTTAA 
TGTCGCTT - ATACTAATCATCAAGAGAA - AAAAACGCAATATAAAGGAC - GTTATTTTAA 
TGTCGCTT -ATACTAATCATCAAGAGAA- AAAAACGCAATATAAAGGAC - GTTATTTTAA 
TGTCGCTT - ATACTAATCATCAAGAGAA- AAAAACGCAATATAAAGGAC - GTTATTTTAA 
TGTCGCTTTATACTAATCATCAAGAGGAGAAAAACGCAATATAAAGGAC - GTTATTTTAA 
TGTCGCTT - ATACTAATCATCAAGAGAA- AAAAACGCAATATAAAGGAC - GTTATTTTAA 
TGTCGCTT - ATACTAATCATCAAGAGAA -AAAAACGCAATATAAAGGAC - GTTATTTTAA 
TGTCGCTT - ATACTAATCATCAAGAGAA -AAAAACGCAATATAAAGGAC - GTTATTTTAA 

AACTTCTGC2GGCAGCTAATCCATTTGAGGTCATGCTAGCT - -GAATTG 

ATTTTCTAAATCTAGTGA- CTTTGTATTGTC- TATTGATCCAAATGGCAAGTCTGAATT- 
AACTTCTGTGGCAGCTAAT CCATTTGAGGT CATGCTAGCTCAAGTAATGGAT - -GAATTG 
AACTTCIXjTGGCAGCTAATCCATTTGAGOTCATG - -GAATTG 

AACTT CTGTGGCAGCT AATCCATTTGAGGTCATGCTAG CTCAAGTAATGGAT - -GAATTG 
AACTTCTGTGGCAGCTAATCXATTTGA^ -GAATTG 
AACTTCTGTGGCAGCTAATCCATTTGAGGTCATGCTAGOT -GAATTG 
AACTTCTGTGGCAGCTAATCCATTTGAGGTCATGCTAGCT - -GAATTG 

AACTTCTGTGG^GCTAATCCATTTGAGGTCATGCTAGCT - -GAATTG 

AACTTCTGTGGCAGCTAATCCATTTGAGGTCATGCTAGCT - - GAATTG 

AACTTCTGTGGC^AGCTAATCCATTTGAGGTCATGCT - -GAATTG 

ACACATTATGAGACAGCTAAATATGGTTGGCAACATTTGATTAGTT^ 

ATTTGTC- CAAGAGCGCTATA- ATGCCT - - TAAAAGCGAACTATCTTCGACAGCTTAACG 

ACACATTATGAGACAGCTAAATATGGTTGGCAACATTTGATTAG 

ACAC^TTATGAGACAGCTAAATATGGTTGGCAACATTTGATTAGT^ 
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Table 28: Comparative Sequences relating to SAG1552 
(conserved hypothetical protein) 



SEQ2805 
SEQ2806 
SBQ2807 
SEQ2808 
SEQ2809 
SBQ2810 
SEQ2811 

SEQ2801 
SEQ2802 
SEQ2803 
SEQ2804 
SEQ2805 
SBQ2806 
SBQ2807 
SEQ2808 
SEQ2809 
SEQ2810 
SEQ2811 

SEQ2801 
SEQ2802 
SEQ2803 
SEQ2804 
SEQ2805 
SEQ2806 
SEQ2807 
SEQ2808 
SEQ2809 
SEQ2810 
SEQ2811 

SEQ2801 
SEQ2802 
SEQ2803 
SBQ2804 
SEQ2805 
SEQ2806 
SEQ2807 
SEQ2808 
SEQ2809 
SEQ2810 
SEQ2811 



ACACATTATGAGACAGCTAAATATGGTTGGCAACATTTGAT^ 

ACACATTATGAGACAGCTAAATATGGTTGGCAACATTTGA 

ACACATTATGAGACAGCTAAATATGGTTGGCAACATTTGATTAij' 

ACACATTATGAGACAGCTAAATATGGTTGGCAACAT^ 

ACACATTATGAGACAGCTAAATATGGTTGGCAACATTTGATTAGTTTT^ 

ACACATTATGAGACAGCTAAATATGGTTGGCAACATTTGATTAGTTTT 

ACAC^TTATGAGACAGCTAAATATGGTTGGCAACATTTGATTAGTTT 

CAACAGAC CCTTTTCGTTATCGAAAA CCATTTG - AGG C!ACAGGCTCCTAAATA 

TAAAGATTTTTATGCTTTCCCACCAAAGAAGAACAGTAG 

CAACAGAC CCTTTTCATTATCGAAAACCATTTG - AGGCACAGGCTCCTAAATA 

CAACAGAC CCTTTTCATTATCGAAAACCATTTG -AGGCACAGGCTCCTAAATA 

CAACAGAC CCTTTTCATTATCGAAAACCATTTG- AGGCACAGGCTCCTAAATA 

CAACAGAC CCTTTTCATTATCGAAAACCATTTG -AGGCACAGGCTCCTAAATA 

CAACAGAC CCTTTTCATTATCGAAAACCATTTG - AGGCACAGGCTCCTAAATA 

CAACAGAC CCTTTTCATTATCGAAAACCATTTG - AGGCACAGGCTCCTAAATA 

CAACAGAC CCTTTTCATTATCGAAAACCATTTG- AGGCACAGGCTCCTAAATA 

CAACAGAC CCTTTTCATTATCGAAAACCATTTG -AGGCACAGGCTCCTAAATA 

CAACAGAC - CCTTTTCATTATCGAAAACCATTTG - AGGCACAGGCTCCTAAATA 

G - TACAACTAAATGTAdAAAATATTCAAGCTAATTCGAATGTTAAAG^ GGTATTT 

GGTATTGAGAAATACAAAGATTGTTGAAGACATGGAAAAAGTAAAAGCAACAGAGAGGT 
G - TAC^CTAAATGTAGAAAATATTCAAGCTAATTCAAATGTTAAAGCA - - -GGTATGT 

G - TACAACTAAATGTAGAAAATATTCAAGCTAATTCAAATGTTAAAGCA GGTATGT 

G-TACAACTAAATGTAGAAAATATTCAAGCTAATTCAAATGTTAAAGCA GGTATGT 

G- TACAACTAAATGTAGAAAATATTCAAGCTAATTCAAATGTTAAAGCA GGTATGT 

G - TACAACTAAATGTAGAAAATATTCAAGCTAATTCAAATGTTAAAGCA GGTATGT 

G - TACAACTAAATGTAGAAAATATTCAAGCTAATTCGAATGTTAAAGCA GGTATGT 

G - TACAACTAAATGTAGAAAATATTCAAGCTAATTCGAATGTTAAAGCA GGTATGT 

G - TACAACTAAATGTAGAAAATATTCAAGCTAATTCAAATGTTAAAGCA GGTATGT 

G - TACAACTAAAT6TAGAAAATATTCAAGCTAATTCAAATGTTAAAGCA GGTATGT 

TTGCAGCATATAAAGCTATTGATTTCCATCCTCGATAC 

TCTTACCAACTCATCCTACTGGTCTT CTCAAAACAGGAACAATTGAT - AGGCACCA 

TTGCAGCATATAAAGCTATTGATTTCXIATCCTCGATACAAGGATTATC 
TTGCAGCATATAAAGCTATT GATTTCCATCCT CGATACAAGGATTATCTAT TATTTGATA 
TTGCAGCATATAAAGCTATTGATTTCCATCCTCGATAC^ 

TTGCAGCATATAAAG CTATTGATTTCCATCCT CGATACAAGGATTATCTATTATTTGATA 

TTGCAGC^TATAAAGCTATTGATTT<XATCCTO^TAC^AGGATTATCTATTATTTGATA 

TTGCAGCATATAAAGCTATTGATTTCCATCCTCGATACAAGGATTATCT 

TTGCAGCATATAAAGCTATTGATTTCCATCCT CGATACAAGGATTATCTAT TATTTGATA 

TTGCAGCATATAAAGCTATTGATTTCCATCCTCGATACAAGGATTATCTATTATT^ 

TTGCAGCATATAAAGCTATTGATTTCCATCCTCGATACAAGGATTATCTATTATTTGATA 



SEQ2801 
SEQ2802 
SBQ2803 
GEQ2804 
SEQ2805 
SEQ2806 
SEQ2807 
SEQ2808 
SEQ2809 
SEQ2810 
SEQ2811 

SEQ2801 
SEQ2802 
SEQ2803 
SEQ2804 
SEQ2805 
SEQ2806 
SEQ2807 
SEQ2808 
SEQ2809 
SEQ2810 
SEQ2811 



AAGAGAATATCAGTAAAGAAGATAGACAAAAGATT - AAAGAACTTTCTTTGTCACAGGGA 
AAAAACATTTGATTCACAAACAGATATTTCGTTTGGAAAGGA 

AAGAGAATATCAGTAAAGAAGATAGACAAAAGATT - AAAGAACTTTCTTTGTCACAGGGA 
AAGAGAATATCAGTAAAGAAGATAGACAAAAGATT-j 
AAGAGAATATCAGTAAAGAAGATAGACAAAAGATT-A 
AAGAGAATATCAGTAAAGAAGATAGACAAAAGATT - AAAGAACTTTCT TTGTCACAGGGA 
AAGAGAATAT CAGTAAAGAAGATAGACAAAAGATT - AAAGAACTTTCTTTGTCACAGGGA 
AAGAGAATATCAGTAAAGAAGATAGACAAAAGATT -AAAGAACTTTCTTTGTCACAGGGA 
AAGAGAATATCAGTAAAGAAGATAGACAAAAGATT-AAAGAACTT^ 
AAGAGAATATCAGTAAAGAAGATAGACAAAAGATT- AAAGAACITTCTTTO 
AAGAGAATATCAGTAAAGAAGATAGACAAAAGATT - AAAGAACIOTCTTTGTCACAGGGA 

TACGTTA - AACTGCTAAATGCTTATCACAAAATCCCTGTTCTAGTCACGGGTTATGGCT 

TCCGTGGCAGTTGTTGAATTTTTCTGATCCA TCATCT CAAAAAATTCACGATGATTA 

TACGTTA - AACTGC TAAATGCTTATCACAAAATC CCTGTTCTAGTCACGGGTTATGGCTA 
TACGTTA - AACTGC TAAATGCTTATCACAAAATCCCTGTTCTAGTCACGGGTTATGGCT 
TACX3TTA - AACTGCTAAATGCTTATCACAAAATCCCTGTT 
TACGTTA- AACTGCTAAATGCTTATCACAAAATCCCTGTTCTA 

TACGTTA - AACTGC TAAATGCTTATCACAAAATCCCTGTTCTAGTCACGGGTTATGGCT 
TACGTTA - AACTGCTAAATGCTTATCACAAAATCCCTGTT CTAGTCACGGGTTATGG CTA 
TACGTTA-AACTGCTAAATGCrTATCACAAAATCCCTC 

TACGTTA - AACTGCTAAATGCTTATCACAAAATCCCTGTTCTACTCACGGGTTATGGCT 
TACGTTA - AACTGCTAAATGCTTATCACAAAATCCCTGTTCEAGTCACX^ 
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Table 28: Comparative Sequences relating to SAG1552 
(conserved hypothetical protein) 

TCX^CAGCGAGAGGTATTG CCCAAAAAGAAATTGATAAACGTC CT CTGCCGATTAATGA 

TTTAAACATTATGGTGTCAAGGAGTTAGAAATTGA- GAGCATTGCTTTAGGATTAGGTG 

TCGACAGCGAGAGGTATTGCCCAAAAAGAAATTGATAAACGTCCTCTC 

TCGACAGCGAGAGGTATTGCCCAAAAAGAAATTGATAAACGTCCTCTGCCGATTA 

TCGACAGCGAGAGGTATTGCCCAAAAAGAAATTGATAAACGTCCTCTGCC^^ 

TCGACAGCGAGAGGTATTGCCCAAAAAGAAATTGATAAACGTCCrCTGCCGA 

TCGACAGCGAGAGGTATTGCCCAAAAAGAAATTGATAAACGTCCTCTC 



TO^CAGCGAGAGGTATTGCCCAAAAAGAAATOGATAAACGTCCTCTGCCGATTA^ 
TCGACAGCGAGAGGTATTGCCCAAAAAGAAATTGATAAACGTC 
TCGACAGCGAGAGGTATTGCCCAAAAAGAAATTGATAAACGTCCTCTG 

AAAGAACAAGGTCAGCGTTTACTAGAAGATTATGAATCTTTTATATCATCCGGTAGTTT 



AAAGAACAAGGTCAGCGTTTACTAGLAAGATTATGAATCTTTTA 
AAAGAACAAGGTCAGCGTTTACTAGAAGATTATGAATCTTT^ 

AAAGAACAAGGTCAGCGTTTACTAGAAGATTATGAATCTTTTATATCATCCGGTAGTTT 

AAAGAACAAGGTCAGCX5TTTACTAGAAGATTATGA 

AAAGAACAAGGTCAGCGTTTACTAGAAGATTATGAATCTTTTATAT 

AAAGAACAAGGTCAGCGTTTACTAGAAGATTATGAATCTTTTATATCATCCGGTA 

AAAGAACAAGGTCAGCGTTTACTAGAAGATTATGAATCTTTTATATCATC 

AAAGAAC^UVGGTCAGCGTTTACTAGAAGATTATGAATCTTTTATATCATCCGGTAGTTT 

AAAGAACAAGGTCAGCGTTTACTAGAAGATTATGAATCTTT^ 

GGAGCGACTATCAATGC^TGGCAAGACX^TTGGAATGCAAGGGCOT 

GGAGAGAC — CCGATAC CAAAACCTTTTTAA AAGACTCCTATTATAGTATT 

GGAGCGACTAT CAATGCATGGCAAGACGAT TGGAATGCAAGGGCGTGGAATACATCTTT 
GGAGCGACTATCAATGCATGGCAAGACGATTGGAATGCA^ 
GGAGCGACTATCAATGCATGGCAAGACGATTGGAATGCAAGGGCGTG 
GGAGCGACTAT CAATG CATGGCAAGACGAT TGGAATGCAAGGGCGTGGAATACATC TTT 
GGAGCGACTATCAATGCATGGCAAGACGATTGGAATGCAAGGGCGTGGAATAC^ 
GGAGCGACTATCAATGCATGGCAAGACGATTGGAATGCAAGGGTOT 
GGAGCGACTATCAATGCATGGCAAGACGATTGGAATGCAAGGGTGTGGA^ 
GGAGCGACTAT CAATG CATGGCAAGACGATTGGAATGCAAGGG03TGGAATACATCTTT 
GGAGCGACTAT CAATGC^TGGCAAGACGATTGGAATXSCAAGGGCGT 

GCCACAAATAAACATAGTCAATTC CTATGGGGGGATGCACAAGTATTTAATCAAGGTTA 

A--AGAAAGAA 

GCCACAAATAAACATAGTCAATTCCTATGGGGGGATGCACAAGTATTTAAT 

GCCACAAATAAACATAGTCAATTCCTATGGGGGGATGCAC^ 

GCCACAAATAAACATAGTCAATTCCTATGGGGGGATGCACIAA 

GCCACAAATAAACATAATCAATTCCTATGGGGGGATGCACAA 

GCCACAAATAAACATAGTCAATTCCTATGGGGGGATGCAC^ 

GCCACAAATAAACATAGTCAATTCCTATGG 

GCCACAAATAAACATAGTC^UVTTCCIATGGGG^ 

GCCACAAATAAACATAGTCAATTCCTATGGGGGGATGC^CAAGTATT^ 
GCCAOUUlTAAAC^TAGTCAATTCCrATGGGGGGATGC^ 

GGTTTATTAGGCTTTAAAAACGCAAAACAT CATTATCAAGTTGATGGTAAAAGAGGCAA 



GGTTTATTAGGCTTTAAAAACGC^AAACATCATTATCAAG 

GGTTTAT TAGGCTTTAAAAACG CIAAAACATCATTATC^AAGTTGATGGTAAAAGAGGCAA 

GGTTTATTAGGCTTTAAAAACGCAAAACATCATTATCAAG 

GGTTTATTAGGCTTOAAAAACGCAAAACATCATTATCAAGTTGATGGTAA 

GGT TTATTAG<5CTTTAAAAACGCAAAACAT CATTATCAAGTTGATGGTAAAAGAGGCAA 

GGTTTATTAGGCTTTAAAAACGCAAAACATCATTATCAGGT^ 

GGTTTATTAGGCTTTAAAAACGCAAAACATCATTATCAGGT^ 

GGTTTATTAGGCTTTAAAAACG CAAAACATCATTATCAAGTTGATGGTAAAAGAGGCAA 
GGTTTATTAGGCTTTAAAAACGCAAAACATCATTATCAAGTTGATC 

GGAGAGTGGAAACATCCTCTG 



GGAGAGTGGAAACAT C CTCTGATGACTAGTG CAACAGGAGATGACT TATATGCTAGCAG 

GGAGAGTGGAAACATCCTCTGATGACTAGTGCAACAGGAGATGACT 

GGAGAGTGGAAACATCCTCTGATGACTAGTGCAACAGGAGATC 

GGAGAGTGGAAACATCCTCTGATGACTAGTGCAACAGGA 

GGAGAGTGGAAACATCCTCTGATGACTAGTGCAACAGGAGATGACT 

GAAGAGTGGAAACATCCTCTGATGACrAGTGCAACAGGAGATGACT 
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Table 28: Comparative Sequences relating to SAG1552 
(conserved hypothetical protein) 

GAAGAGTGGAAACATCCTCTGATGACTAGTGCAACAGGAGATGACTTATATGCT 
GGAGAGTGGAAACATCCTOT^TGACTAGTGCAACAGGAGATG^ 

GGAGAGTGGAAACATCCTCTGATGACTAGTGCAACAGGAGATGACTTATATGCTAGCAG 



GATGAAAGCTATCTCTACCTTGCGATTAAAACAAA^ 

GATGAAAGCTATCTCT ACCTTG CGATT AAAACAAAACCTGAAAAACTAAAAGAAAAACG 

GATGAAAGCTATCTCTACCTTGCGATTAAAAOkAA^ 

GATGAAAGCTATCTCTACCTTGCGATTAAAAC^A^ 

GATGAAAGCTATCTCTACCTTGCGATTAAAACAAAAC 

GATGAAAGCTATCTCTACCTTGCGATTAAAACAAAACCTGAAAAACTA 

GATGAAAGCTATCTCTACCTTGCGATTAAAACAAAACCTGAAAAACTAAAAGAAAAACG 

GATGAAAG CTATCTCTACCTTG CGATTAAAACAAAACCTGAAAAACTAAAAGAAAAACG 

GATGAAAGCTATCTCTACCTTGCGATTAAAACAAAACCTGAAAAACTAAAAGAAAAACG 



TTATTACCAATAGATATTACACCAAAATCTGGTAGTAGAAAAATGAATGGTAGTAAGGT 

TTATTACCAATAGATATTACACCAAAATC!TGGTAGTAG^ 

TTATTACCAATAGATATTACACCAAAATCTGGTAGTAGAAAAATGAATGGTAG 

TTATTACCAATAGATATTACACCAAAATCTGGTAGTAGAAAAATGA 

TTATTACC^TAGATATTACACCAAAATCTGGTAGTAGAAAAATGAATGGTAGTAAGGT 

TTATTACCAATAGATATTACACCAAAATCrGGTAGTAGAAAAATGAATGGTAGTAAGGT 

TTATTACCAATAGATATTACACCAAAATCTGGTAGTAGAAAAATGAATGGTAGT 

TTATTACCAATAGATATTACACCAAAATCTGGTAGTAGAAAAATGAATGGTAGTAAGGT 

TTATTACCAATAGATATTACACCAAAATCTGGTAGTAGAAAAATGAATGGTAGTAAGGT 



ACATTTTCTAAAT CTAGTGAC , riTGTATTGTCTATTGAT C CAAATGGCAAGTCTGAATT 
ACATTT TCTAAAT CTAGTGACTTTGTATTGTCTATTGATC CAAATGGCAAGTCTGAATT 
ACATTTTCTAAATCTAGTGACTTTGTATTGTCT 

ACATTTTCTAAATCTAGTGACTTTGTATTGTCTATTGATCCAAATGGCAAGTCTGAA 
A(^TTTTCTAAATCTAGTGACTTTGT ATTGT CTAT^ 
ACATTTTCTAAATCTAGTGACTTTGTATTGTCTATT^ 

ACATTTTCTAAATCTAGTGACT TTGTATTGTCTATTGATCCAAATGGCAAGTCK5AATT 
ACATTTTCTAAATCTAGTGACTTTGTATTGTCTATTGATCCAAATGGCAAGTCTGAATT 
ACATTTTCTAAATCJTAGTGACTTTGTATTGTC^ 



TTTGTCCAAGAGCGCTATAATGCCTTAAAAGCGAACTATCTT^ 

TTTGTCC^GAGCGCTATAATGCCTTAAAAGCGAACTATCTTCGACAGCrTAACGGTAA 

TTTGTCCAAGAGCGCTATAATGCCTTAAAA 

TTTGTCCAAGAGCGCTATAATGCCTTAAAAGCGA 

TTTGTCCAAGAGCGCTATAATGCCTTAAAAGCGA^ 

TTTGTCCAAGAGCGCTATAACGCCTTAAAAGCGAACTATCTTCGACA 

TTTGTCCAAGAGCGCTATAACGCCTTAAAAGCGAACTATCTTCGACAGCTTA 

TTTGT CCAAGAGCGCTATAATGCCTTAAAAGCGAACTAT CTTCGACAGCTTAACGGTAA 

TTTGTC CAAGAGCGCTATAATGCCTTAAAAGCGAACTATC TTCGAC^ 



GATTTTTATGCTTTCCCACCAAAGAAGAACAGTAGTAATTl^ CAGATAAATATGGT 

GATTTTTATGCTTTCCCACCAAAGAAGAACAGTAGTAATTTTGAGCAGATAAATATGG 

GATTTTTATGCTTTCCCACCAAAGAAGAACAGTAGTAATT 

GATTTTTATGCTTT CC CACCAAAGAAGAACAGTAGTAATT TTGAGCAGATAAATATGGT 

GATTTT1ATGCTTTCCCACCAAAGAAGAACAGTAGTAATTTTGAG 

GATTTTTATGCTTTCCCACCAAAGAAGAACAGTAGTAATT^ 

GATTTTTATGCTTTCCCACCAAAGAAGAA<^GT^^ 

GATTTTTATGCTOTCCCACCAAAGAAGAACAGTAGTAATTTTG 

GATTTTTATGCTTTCCCACCAAAGAAGAACAGTAGTAATTTTGAGC^ 



TTGAGAAATACAAAGATTGTTGAAGACATGGAAAAAGTAA 
TTGAGAAATACAAAGATTGTTGAAGACATGGAAAAAGTAAAAG CAAC^ 
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Table 28: Comparative Sequences relating to SAG1552 
(conserved hypothetical protein) 

TTGAGJ^TACAAAGArTGTTGAAGACATGGAAAAAGTAAAAGCAACAGAGAGGTTCTT 

TTGAGAAATACAAAGATTGTTGAAGACATGGAAAAAGTAAAAGC^ 

TTGAGAAATACAAAGATTGTTGAAGACATO3AAAAAGTAA 

TTGAGAAATACAAA6ATTGTTGAAGACATGGAAAAAGTAAAAG CAACAGAGAGGTTCTT 
TTGAGAAATACAAAGATTGTTCAAGACATGGAAAAAGTAAAA 
TTGAGAAATACAAAGATTGTTGAAGACATGGAAAAAGTAAAAGCAAC^^ 
TTGAGAAATACAAAGATTGTTGAAGACATGGAAAAAGTAAAAG CAACAGAGAGGTT CTT 



CCAACTCATCCTACTGGTCTTCTCAAAACAGGAACAACTGATAGGCACC^ 

CCAACTCATCCTACTGGTCTTCTCAAAACAGGAACAACTGAT^ 

CCAACTCATCCTACTGGTCTTCTCAAAACAGGAACAACTGATAGGCACCAAAA^ 

CCAACTCATCCTACTGGTCTTCTCAAAACAGGAACAACTC 

CCAACTCATCCTACTGGTCTTCTCAAAACAGGAACAACTGATAGGC^ 

CCAACTCATCCTACTGGTCTTCTCAAAACAGGAACAACTGATAGGCACC^ 

CCAACTCATCCTACTGGTCTTCTCAAAACAGGAACAACT^ 

CCAACT CATCCTACTGGTCTTCTCAAAACAGGAACAACTGATAGGCAC 



G^TTCACAAACAGATATTTCGTTTGGAAAGGACTTTATAGAGGTCAGAATTCCGTGG^ 

GATTCACAAACAGATATTTCX5TTTGGAAAGGACTTTATAGAGG 

GATTCACAAACAGATATTTCGTTTGGAAAGGACT^ 

GATTCACAAACAGATATTTCOTTTGGAAAGGACTTTATAGAGGT^ 

GATTOlCAACCAGATATTTCGTTTGGAAAGGACrTO 

GATTCACAAACAGATATTTCGTTTGGAAAGGACTTTATAGAGGTCAGAATTCCX3TGGCA 

GATTCACAAACAGATATTTCGTTTGGAAAGGACTTTATAGAGGTCA 

GATTCACAAACAGATATTTCGTTTGGAAAGGACTTTATA(^ 

GATTCACAAACAGATATTT CGTTTGGAAAGGACTTTATAGAGGTCAGAATTC CGTGGCA 



TTGTTGAATTTTTCTGATCCATCATCTCAAAAAATTCACGATGATTA 

TTGTTG AATTTTTCTGATCCAT CATCT CAAAAAATTCACGATGATTACTTTAAACATTA 

TTGTTGAATTTTTCTGATCCATCATCTCAAAGAATTCAC^^ 

TTGTTGAATTTTTCTGATCCAT CATCTC^U^AAAATTCACGATGATTACTTTAAA CATTA 

TTGTTGAATTTTTCTGATCCATCATCrCAAAAAATTCACGATGATO^ 

TTGTTGAATTTTTCTGATCCATCATCTCAAAAAATTCACGATGATTACTTTAA 

TTGTTGAATTTTTCTGATCCATCATCTCAAAAAATT^ 

TTGTTGAATTTTTCTGATCCATCATCTCAAAAAATTCACGATGAT^ 

TTGTTGAATTTTTCTGATCC^TCATCTCAAAAAATTCACGATGATO 



GGTGTGAAGGAGTTAGAAATTGAGAG - - CATTGCTTTAGGATTAGGTGCTAATAGCAAA 
GGTGTGAAGGAGTTAGAAATTGAGAG- -CATTGCTTTAGGATTAGGTGCTAATAGCAAA 
GGTGTGAAGGAGTTAGAAAATTGAGAG CCATTGCTTTAGGATTAGGTGCT 
GGTGTGAAGGAGTTAGAAATTGAGAG - - CATTGCTTTAGGATTAGGTGCTAATAGCAAA 
GGTGTGAAGGAGTTAGAAATTGAGAG — CATTGCTTTAGGATTAGGTGCTAATAGCAAA 
GGTGTGAAGGAGTTAGAAATTGAGAG- - CATTGCTTTAGGATTAGGTGCTAATAGCAAA 
GGTGTGAAGGAGTTAGAAATTGAGAG- - CATTGCTTTAGGATTAGGTGCTAATAGCAAA 
GGTGTGAAGGAGTTAGAAATTGAGAG- - CATTGCTTTAGGATTAGGTGCTAATAGCAAA 
GGTGTGAAGGAGTTAGAAATTGAGAG- - CATTGCTTTAGGATTAGGTGCTAATAGCAAA 



AAAACACACTGATAAAGATGGCAGATTATCGTTTGAAAAATTGGGAGAGAC^ 
AAAACACACTGATAAAGATGGCAGATTATCGTTTGAAAAATT^ 
AAAACAOICTGATAAAGATGGCAGATTATCGTTTGA 
AAAACACACTGATAAAGATGGCAGATTATCGTTTGAAAAA 

AAAACACACTGATAAAGATGGCAGATTAT CGTTTGAAAAATTGGGAGAGACCXX3ATACC 

AAAAC^CACTGATAAAGATGGCAGATTATCGTTTC 

AAAACACACrGATAAAGATGGCAGATTATCGTTTGAAAAATT^ 

AAAACACACTGATAAAGATGGCAGATTATCGTTTGAAAAATT^ 

AAAACACACTGATAAAGATGGGAGATTATCGTTTGAAAAATTGGGA 
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Table 28: Comparative Sequences relating to SAG1552 
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SEQ2805 . 

SEQ2806 

SKQ2807 

SEQ2808 

SEQ2809 

SEQ2810 

SEQ2811 --- 

>SEQ IP 290 2850s62_1169NT frames 1 

FVVKGDTVLHKPTNKP FWKGVDVES SLAG YHHNDF PI TQ KTYREWFHLI SNMGANTVRV 
K\^^IWAF VDAL YHHNKASKRPLYIiLQGIRIDS YRNNAS I TAFNDNYRGYLKREAKGWD 
ILHGRKQVWNTDFGSRHYHYDLSPWVLGYVVGDDWNSGTVAyTNHQEKKTO 
AAANPFEVMLAQVMDELTHYETAKYGVJQKL I S F SNS PTTDPFR YRKPFEAQAPKYVQLNV 
ENI QANSNVKAGIFAA YKAIDFHPRYKDYLLFDKENI S KEDRQKIKEIiSLSQGYVKLIjNA 
YHKIPVLVTGYGYSTARGIAQKEIDKRPLPINEKEQGQRLLEPYESFISSGSFGATINAW 
QDDWNAFAVOTSFATNKHSQFLWGDAQVFNQGYGLIiGFKN^^ 

MTSATGDDLYASSDESYLYIiAIKTKPEKLKEKRLLPIDITPKSGSRKMNGSKVTFSKSSD 
FVLS IDPNGKS ELFVQERYNALKANYLRQLNGKDFYAFPPKKNS SNFEQINMVLRNTKI V 
EDMEKVKATERFLPTR^TGLLKTGTIDRH^ 

SSQKIHDDYFKHYGVKELEI ES IALGLGANSKENTLIKMADYRLKNWERPDTKTFLKDS y 
YSI.ER 

>SBQ ID NO 2851t62_18RS21 frame: 1 

KGLLKFJTORTNFVVKGDTVLHKPTNKP FWKGVDVES S LAGYHHNDFP ITQKTYREWFHL 
ISNMGANTVRVKVPMNVAFYDALYHHNKAS KRPL YIjLQGI RIDS YRNN AS I TAFNDNYRG 
YLKREAKGWD I LHGRKQVWITITHjGS RHYHYDLS PWVLG YWGDD WNS GTVA YTNHQEKK 
TQYKGRYFKTSVAANPFEVmAQVmELTHYETAKYGWQHLISFSNSPTTDPF 
AQAPKYVQLNVENIQANSNVKAGMFAAYKAIDFHPRYKDYLLFDKENI S KEDRQKI KEL S 
LS Q GYVKLLNA YHKI PVLVTGYGYSTARGI AQKEIDKRPL P INEKEQGQRLLEDYE S FI S 
SGSFGATINAWQDDVmARAWOTSFATNKHSQFLWGDAQVFN 

KRGKGEWKHPLMTS ATGDDL YAS S DES YL YIiA IKTKPEKLKEKRIjL PIDITPKS GS RKMN 
GSKVTFSKSSDFVLSIDPNGKSEIjFVQERYNALKANYLRQLNGKDF^ 
INK^RNTKTVFJDMEKVKATERFLPTO qtdi SFGKDF I EVR 

I P WQLLNFSDPS SQKI HDD YFKHYGVKELE I ESIAIX3LGANSKENTLIKMADYRLKNWER 
PDTKTFLKDSYYVLRK 

>SEQ ID NO 2852t62_2603 frames 3 

LKENTRTNFVVKGDTVLffiCPTNKPFVVKGV^ 

MGANTVRVKVPMNVAFYDALYHHNKASKRPLYIjLQGIRIDSYRN^ 

reakgv\toilhgrkqvwntdix5srhyhydlspwvlgy^ 

kgryfktsvaanpfevmiaqvmdelthyetakygwqhlisfsnspttdpfk^ 

pkyvqlnveniqansnvkagmfaayicaidfh^rykdyi^ 

GYVKLLNAYHKIPVIjVTGYGYSTARGIAQKEIDKRPI^ 

FGATINAWQDDWNARAWNTSFATtfKHSQFLWGDAQVFKQGYGI^ 

KGEWKHPLMTSATGDDLYASSDESYIjYIiAIKTKPEKLKEKRIjIiPIDITP 

VTFSKS SDFVLS I DPNGKS ELFVQER YNAL KANYLRQLNGKDF YAF P P KKNS SNFEQINM 

VLRNTKIVEDMEKVKATERFIiPTHPTGIjLKTC pw 

QLLNFSDPSSQKIHDDYFKHYGVKELEIES IAIX^GANSKENTLIKMADYRLKNWERPDT 

KTFLKDSYYSIKKEWSKERERTYGP 
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AAACCTTTTTAAAAGACTCCTATTATGTATTAAGAAAGAA- -- 

AAACCTTTTTAAAAGACTCCTATTATAGTATTAAGAAAGAATGGTCTAAAGAAAGAGAG 

AAACCTTTTTAAAAGA 

AAACCTTTTTAAAAGACTCCTATTATGTATTAAGAAAGA 

AAA CCTTTTTAAAAGACT 

AAACCTTTTTAAAAGACTCCTATTATAGT • 

AAACCTTTTT AAAAGACTC CT ATT ATAGTATTAAGAAAG 

AAACCTTTTTAAAAGACTCCTATTATAGTATTAAG 

AAACCTTTTTAAAAGACTC CTATTATAGTATT AAGAAAGAATGG 
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GAACATATGGTCCA 
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(conserved hypothetical protein) 

>SEQ ID NO 2853:62_A909 frames 1 
KGLLKENTRTNFVVKGDTVLHKPTNKPFW 

ISNMGANTVRVKVPMNVAFYDALYHHNKASKRPLYLLQGIRIDSYRNNA^ 
YLKREAKGVVD ILHGRKQVWNTDLGS RHYH YDL S P WVLGYWGDDWNSGTVAYTNHQEKK 
TQYKGRYFKTSVAANP FEVMLAQVMDELTHYETAKYGWQHLI S FSNSPTTDPFHYRKPFE 
AQAPKYVQLNVENI QANSNVKAGMFAA YKA I DFHPRYKDYLLFDKENI S KEDRQKI KEL S 
LSQ GYVKLLNA YHKI PVLVTGYGYSTARGXAQKBI DKRP L P INEKEQGQRLLED YES F I S 
SGS FGATINAWQDDWNARAWNTS FATNKHS QFLWGDAQVFNQG YGL LGFKNAKHHYQVDG 
KRGKGE WKHPLMTS ATGDDL YASS DES YL YLAI KTKP E KLKEKRLL PI DI TPKS GSRKMN 
GSKVTFSKSSDFVLSIDPNGKSELEVQE^YNALKAl^RQLNGKDFYAFPPKMJSSNFEQ 
INMVLRNTKIVEDMEKVKATERFLPTHPTGLLKTGTTDRHQCT 

IPWQLLNFSDPSSQRIHDDYFKHYGVKELEN . EPLL . D . VLIAKKTH . . RWQIIV . KIGR 
DPIPKPF.K 

>SEQ ID NO 2854:62_A909 frame: 1 
KGLLKENTRTNFVVKGDTVLHKPTNKPFVVKGVDVESS1A 

ISNMGANTVRVKVPMNVAFYDALYHHNKASKRPLYLLQGIRIDSYRNNASITAFNDNYRG 
YLKREAKGVVDIIjHGRKQVV^DLGSRHYHYDLSPWVLGYWGDDWNSGTVAYTNHQEKK 
TQYKGRYFICTSVAANPFEVMIiAQVMDEIjTHYETAKYGWQHIjI S FSNS PTTDPFHYRKPFE 
AQAPKYVQLNVENI QAN SNVKAGMFAA YKAIDFHPRYKD YLLFDKENI S KEDRQKI KELS 
LSQ^WKLIiNAYHKIPVLVTGYGYSTARGIAQKEIDKRPLPINEKEQGQRLLEDYESFI S 
SGS FGATINAWQDDWNARAWNTSFATNKHS QFLWGDAQWNQJ3YGLIX3FKNAICHHYQVDG 
KRGKGEWKHPLMTSATGDDLYASSDESYLYIiAIKTKPEKLKEKRIJjPIDITPKSGSRKM^ 
GSKVTFSKSSDFVLSIDPNGKSELFVQERYNALKANYLRQIiNGKDFYAFPPKKNSSNFEQ 
INMVLRNTKI VEDMEKVKATERFLPTHPTGLLKTGTTO SFGKDFI EVR 

I PWQLLNFSDPSSQRIHDDYFKHYGVKELEN . EPLL . D . VLIAKKTH . .RWQIIV. KIGR 
DPIPKPF.K 

>SEQ ID NO 2855:62_CJB110 frames 1 

YYFDGSLYLPKGLLKENTRTNFVVKGDTVLHK^TNKP 

QKT YREWFHLI SNMGANTVRVKVPMNVAF YDALYHHNKAS KRPL YLLQGI RIDS YRNNAS 

I TAFNDNYRGYLKREAKGWD I LHGRKQVWNTDFGS RH YHYDL S P WVLG YWGDDWNS GT 

VAYTNHQEKKTQYKGR YFKTSVAANP F EVMLAQVMDEL THYETAKYGW QHLI S FSNS PTT 

DPFHYRKPFEAQAPKYVQLNVENIQANSNVKAGMFAAYKAIDFHPRYKDY^ 

EDRQKI KELSL SQG YVKLLNA YHKI PVLVTGYGYSTARGIAQKEIDKRPLPINEKEQGQR 

LLEDYESFISSGSFGATINAWQDDWNARAWNTSFATNKHNQFLWGDAQVFNQGYGLLGFK 

NAKHHYQVDGKRGKGEWKHPLMTSATGDDLYASSDESYLYIiAIKTKPEKL 

TPKSGS RKMNGSKVTFS KS SD FVLS I DPNGKS ELFVQER YNAL KANYLRQLNGKDFYAF P 

PKKNSSNFEQINMVLRNTKIVEDMEKVKATERFLPTHPTGLLOT 

SFGKDFIEVRI PWQLLNFSDPSSQKIHDDYFKHYGVKELE I ES IALGLGANSKENTLI KM 
ADYRLKNWERPDTKTFLKDSYYVLRK 

>SEQ ID NO 2856:62_COHl frames 2 

LPQGLL KENTRTNFVVKGDTVLHKPTNKP FWKGVDVE S SLAG YHHND FP I TQKTYREW F 
HLISNMGANTVRVKVPMNVAFYDALYHHNKES KRPLYLLQGI RIDS YRNNAS ITAFNDNY 
RGYLKREAKGVVD ILHGRKQVWNTDFGSRHYHYDL S PWVLGYWGDDWNS GTVA YTNHQE 
KKTQYKGRYFKTSVAANPFEVMLAQVMDELTHYETAKYGW 
FEAQAPKYVQIiNVENIQANSNVKAGMFAAYKAIDFBPRYKDYIi 

LSLSQGYVKLLNAYHKI PVLVTGYGYSTARGIAQKEIDKRPLP INE KEQGQRLLED YES F 
ISSGSFGATINAWQDDWNARAWNTSFATNKHSQFLWGDAQVFNQGYGLLGFKNAKHHYQV 
DGKRGKGE WKHPLMTS ATGDDL YASSDESYL YLAI KTKP EKLKEKRLL P I D I TPKS GS RK 
MNGSKVTFSKSSDFVLSIDPNGKSELFVQERYNALKANYLRQLNGKDFYAFPPKKNSSNF 
EQINMVLF^NTKIVEDMEKVKATERFLPTHPTGIiLKTGTTO 

VRIPWQIiLNFSDPSSQKIHDDYFKHYGVKELEI ES IAIjGIiGANSKENTLIKMADYRIjKNW 
ERPDTKTFLKD 

>SEQ ID NO 2857s62_H36B frames 2 
RGIjLKENTRTNFVVKGDTVLHKPTNKPFVVKGVDVESSLAGYH^ 
ISNMGANTTOVKVPMNVAFYDALYHHNKASKRPLYLLQGIRIDSYR 
YLKREAKGVVD I LHGRKQVWNTD FGS SHYHYDL S PWVLGYWGDDGHSGTVALY 

>SEQ ID NO 2858i62_JM9130013 frames 3 
FWKGDTVIiHKPTNKPFVVKGVDVESSIAGYHHNDFP 
KVPMNVAFYDALYHHNKASKRPLYIiliQGIRIDSYRNNASITA 

I LHGRKQVWNTDFGS S HYHYDLS PWVLGYWGDDWNS GTVAYTNHQEKKTQ YKGR YFKT S 
VAANPFEVMLAQVMDELTHYETAKYGW QHL I S FSNS PTTD P FHYRKP FEAQAP KYVQLNV 
ENI QANSNVKAGMFAA YKAIDFHPRYKDYLLFDKENI S KEDRQKI KELSLSQGYVKLLNA 
YHKIPVLVTGYGYSTARGIAQKEIDKRPLPINEKEQGQRLLEDYESFISSGSFGATINAW 
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Table 28: Comparative Sequences relating to SAG1552 
(conserved hypothetical protein) 

QDDWNARVWNTS FATNKHSQFLWGDAQVFNQGYGLLGF KNAKHHYQVDGKRGKEEWKHPL 
MTSATGDDLYASSDESYLYIAIKTKPEKLKEKI^PIDITPKSGSRKMNGSKVTFSKSSD 
FVL S ID PNGKS EL FVQERYNALKANYLRQLNGKDF YAFP P KKNS SNFEQ INMVLRNTKI V 
EDMEKVBCATERFLPTHPTGIiLKTGTTDRHQKTFDSQTDI SFGKDF I EVRI P WQLLNFSDP 
SSQKXHDD YFKHYGVKELE IES IALGLGANS KENTLI KMAD YRLKNWERPDTKTFL KDS Y 
YSIKK 

>SEQ ZD NO 2859:62_M732 frames 2 

TRTNFVVKGDTVLHKPTinCPF\n^GVDVES SLAGY1IHNDF P I TQKTYREWFHLI SNMGAN 
TVRVKVPMNVAFYDALYHHNKESKRPLYLLQGIRIDS YRNNAS ITAFNDNYRGYLKREAK 
GWDILHGRKQVWNTDFGSRHYHYDLS PWVI*G YVVGDDCNSGTVAYTN^QEKKTQYKGRY 
FKTSVAANPFEVMLAQVMDELTHYETAKYGWQHLI SFSNS PTTDP FH YRKPFEAQAPKYV 
QLNVENI QANSNVKAGMFAAYKAI DFHP R YKD YXiL FT)KENI S KEDRQKI KELSL SQGYVK 
LLNAYHKIPVLVTGYGYSTARGIAQKEIDKRPLPINEKEQGQRIJjEDYE^ 
IUAWQDDWNARAWNTSFATNKHSQFLWGDAQVFNQGYGLLGFKNAKHHYQVDGKRGKGEW 
KHPIiMTSATGDDLYASSDESYLYLAIKTKPEKLKEKRLLPIDITPKSGSRKMNGS 
KS S D FVLS I DPNGKS EL FVQERYNALKANYLRQLNGKDF YAFP PKKNS SNFEQ I NMVLRN 
TKIVEDMEKVKATERFLPTHPTGLLKTGTTDRHQKTFDSQTDISFGKDFIEVRIPWQLLN 
FSDPSSQKIHDDYFKHYGVKELEIESIALGLGANSKENTL I KMAD YRLKNWERPDTKTFL 
KDSYYSIK ( 

>SEQ ZD NO 2 860j62_M781 frame t 1 

FDGS L YLP QGLLKE3jnilTNFVVKGDTVLHKPTNKP FWKGVDVE S S LAG YHHND F P I TQ K 
TYREWFHLISNMGANTVRVKVPMNVAFYDALYHHNKESKRPLY^ 

AFNDNYRG YLKREAKGWD I LHGRKQVWNTDFGSRHYHYDLS PWVLGYWGDDWNS GTVA 
YTNHQE KKTQYKGRYFKTSVAANP FEVMLAQVMDELTHYETAKYGWQHL I S FSNS PTTDP 
FHYRKPFEAQAPKYVQLNVENI Q ANSNVKAGMFAAYKAI DFHPRYKD YLL FDKENI SKED 
RQKIKELSLSQGYVKLI^YHKIPVLVTGYGYSTARGLAQKEI^ 

EDYESF IS SGS FGAT INAWQDDWNARAWNTS FATNKHS QFLWGDAQVFNQGYGLLGFKNA 
KHHYQVDGKRGKGEWKHPLMTSATGDDLYASSDESYLYIAIKTKPEKLKEKRLLPIDITP 
KSGSRKMNGSKVTFSKSSDFVLSIDPNGKBELFVQERYNALKANYLRQL^ 
KNSSNFEQINMVLRNTKIVEDMEKVKATERFLPTHPTGI^ 

GKDFIEVRI PWQLLNFSDPSSQKZHDDYFKHYGVKELEI ESIALGLGANSKENTLI KMAD 
YRLKNWERPDTKTFLKDSYYSIKKEW 



SEQ2 850 FVVKGDTVLHKPTNKP FVVKGVDVE S SLAGYHHNDF P I T 

SEQ2 851 KGLLKENTRTNFVVKGDTVIjHKPTNKPFVVKGVDVESSLAGY 

SEQ2852 LKENTRTNFVVKGDTVLHKPTNKPFVVKGVDVES SLAGYHHNDF P I T 

SEQ2853 KGIiLKENTRTNFVVKGDTVLHKPTNKPFVVKGVDVE^ 

SEQ2 854 - - - - KGLLKENTRTNFV\fiCGDTVLHKPTNKPFVVKGV^ I T 

SEQ2 855 YFDGSLYLPKGLIiKENTRTNFVVKGDTVIjHKPTNKPFVVKGVDVES SLAGYHHNDFP IT 

SEQ2856 LPQGLLKENTRTNFWKGDTVLHKPTNKP FVVKGVDVESSLAGYHHNDFPIT 

SEQ2857 RGLLKENTRTNFWKGDTVLHKPTNKPFWK^ 

SEQ2858 FVVKGDTVLHKPTNKP FVVKGVDVES SLAGYHHNDF PIT 

SEQ2859 TRTNFVVKGDTVLHKPTNKP FVVKGVDVES S LAGYHHNDFP I T 

SEQ2860 - FDGSLYLPQGLLKENTRTNFVVKGDTVLHKP TNKP FVVKGVDVES S LAG YHHNDFPI T 

SEQ2850 QKT/YREWFHLZSNMGANTVRVKVPMNVAFYDALY1IHNKM KRPL YLLQG IR IDS YRNNAS 

SEQ2 851 QKTYREWFHLI SNMGANTTOVKTOMNVAF YDAL YHHNKAS KRPL YLLQ GI R I DS YRNNAS 

SEQ2 852 QKTYREWFHLI SNMGANTVRVKVPMNVAPYDALYHHNKAS KRPL YLLQGI R I DS YRNNAS 

SEQ2853 QKTYREWFHLI SNMGANTVRVKVPMNVAFYDALYHHNKASKRPLYLLQGIR ID 

SEQ2854 QKTYREWFHLI SNMGANTVRVKVPMNVAFYDALYHHNKASKRPL^ 

SEQ2855 QKTYREWFHLI SNMGANTVRVKVPMNVAFYDALYHHNKAS KRPL YLLQGIRIDS YRNNAS 

SEQ2 856 QKTYREWFHLI SNMGANTVRVKVPMNVAFYDALYHHN 

SEQ2857 QKTYREWFHL I SNMGANTVRVKVPMNVAFYDALYHHNKAS KRPL YLLQGI RI DS YRNNAS 

SEQ2858 QKTYREWFHLI SNMGANTWVKVPMNVAFYDALYHHNKASKRPLY^ 

SEQ2 859 QKTYREWFHLI SNMGANTVRVKVPMNVAFYDALYH^ 

SEQ2860 QKTYREWFHLISNMGANTVRVKVPMNVAFYDALYHHNKES KRPL YLLQ 

SEQ2850 I TAFNDNYRGYLKREAKGWD I LHGRKCJVWNTDreSRHYHYDLSPWVLG YVVC3)DWNSGT 

SEQ2 851 I TAFNDNYRGYLKREAKGWD I LHGRKQVWNTDLGS RHYHYDL S PWVLGYWGDDWNSGT 

8EQ2852 I TAFNDNYRGYLKREAKGWD I LHGRKQVWNTDLGS RHYHYDLS PWVLGYWGDDWNSGT 

SEQ2 853 I TAFNDNYRGYLKREAKGWD I LHGRKQVWNTDLGSRHYHYDL S PWVLGYWGDDWNSGT 

SEQ2854 ITAFNDNYRGYLKREAKGWDILHGRKQVWNTDLGSRHYHYDLSPWVLGYWGDDWNSGT 

SEQ2 855 ITAFNDNYRGYLKREAKGWDIIjHGRKQVWNTDFGSRHYHYDLSPWVLGYWGD 

SEQ2856 I TAFNDNYRGYLKREAKGWDI LHGRKQVWNTDFGSRHYHYDLS PWVI^YWGDDWNSGT 

SEQ2 857 ITAFNDNYRGYLKREAKGWDILHGRKQVWNTDFGSSHYHYDLSPW 

SEQ2858 I TAFNDNYRGYLKREAKGWD ILHGRKQVWNTDFGS SHYHYDLS PWVLGYWGDDWNSGT 
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Table 28: Comparative Sequences relating to SAG1552 
(conserved hypothetical protein) 



SEQ2859 
SEQ2860 
SEQ2850 
SEQ2851 
SEQ2852 
SEQ2853 
SEQ2 854 
SEQ2855 
SEQ2856 
SEQ2857 
SEQ2858 
SEQ2859 
SEQ2860 

SEQ2850 
SEQ2851 
SEQ28S2 
SEQ2853 
SEQ2854 
SEQ2855 
SSQ2856 
SEQ2857 
SEQ2858 
SEQ2859 
SEQ2860 

SEQ2850 
SEQ2851 
SEQ2852 
SEQ2853 
SEQ2854 
SEQ2855 
SEQ2856 
SEQ2857 
SEQ2858 
SEQ2859 
SEQ2860 

SEQ2850 
SEQ2851 
SEQ2852 
SEQ2853 
SEQ2854 
SEQ2855 
SBQ2856 
SEQ2857 
SEQ2858 
SBQ2859 
SEQ2860 

SEQ2850 
SEQ28S1 
SEQ2852 
SEQ2853 
SEQ2854 
SEQ2855 
SEQ28S6 
SEQ2857 
SEQ2858 
SEQ2859 
SEQ2860 

SEQ2850 
SEQ2851 
SEQ2852 
SEQ2853 
SEQ2854 
SEQ2855 



I TAFNDNYRGYLKREAKGWDI LHGRKQVWNTDFGSRHYHYDLS PWVLGYWGDDCNSGT 
I TAFNDNYRGYLKRFJUCGVVDI LHGRKQVWNTD FGS RHYHYDLS PWVLGYWGDDWNSGT 
VAYTNHQEKKTQYKGRYFKTSAAANPFEVMLAQVMDELTHYETAKYGWQHLISFSNSPTT 
VAYTNHQEIOCTQYKGRYFKTSVAANPFEVMLAQVMDELT^ 

VAYTNHQEKKTQYKGRYFKTSVAANPFEVMLAQVMDELTHYETAKYGWQHLISFSNSPTT 

VAYTNHQEKKTQYKGRYFKTSVAANPFEVMLAQVMDELTHYETAK^ 

VA YTNHQEKKTQ YKGR YFKTSVAANP F EVMLAQVMDELTHYETAKYGW QHL I S FSNSPTT 

VAYTNHQEKKTQYKGRYFKTSVAANPFEVMLAQVMDELTHYETAKY 

VAYTNHQEKKTQYKGRYFKTSVAANPFEVMIoAQVMDELTHYETAKYGWQ^ I SFSNS PTT 

VALY 

VAYTiniQEKKTQYKGKYFKTSVAANPFEVMIiAQVMDELTHYETAKYGWQHL I SFSNSPTT 
VAYTNHQE KKTQ YKGR YFKTSVAANP F EVMLAQVMDELTHYETAKYGWQHL I SFSNS PTT 
VAYTNHQEKKTQYKGRYFKTSVAANPFEVMLAQVMDELTHYETAKYGWQHIjISFSNSPTT^ 

PFRYRKPFEAQAPKYVQLNVENIQANSNVKAGI FAAYKAIDFHPRYKDYLLFDKENISK 

PFHYRKPFEAQAPKYVQLNVTSNIQANSNVICAGMFAAYKAIDFHPRYK^ 

PFHYRKPFEAQAPKWQLNVENIG^SNVKAGMFAAYKAIDFHPRYKDYIjIjFDKENISK 

PFHYRKPFEAQAPKYVQIiNVF^IQANSNVKAGMFAAYKAIDFHPRYKDYLLFDKENISK 

PFHYRKPFEAQAPKYVQIiNVENIQANSNVKAGMFAAYKAIDFHPRYKDYIaLFDKF^ 

PFHYRKPFEAQAPKYVQLNVF2JIQANSNVKAGMFAAYKAIDFHPRYKDYLLFDKENISK 

P FHYRKP F EAQAPKYVQLNVENIQANSNVKAGMFAAYKAI D FHPR YKD YLL FD KEN I S K 

PFHYRKPFEAQAPKYVQLNVENI QANSNVKAGMFAAYKAI DFHPRYKD YLL FDKEN I S K 
PFHYRKPFEAQAPKWQliNVENIQANSNVKAGMFAAYKAIDFHPRYKDYLLFTDKENISK 
PFHYRKPFEAQAPKYVQLNVENIQANSNVKAGMFAAYKAIDFHPRYKDYIjLFDKENISK 

DRQKI KELSLSQGYVKLLNAYHKI PVLVTGYGYSTARGIAQKE IDKRPLPINEKEQGQR 

DRQKI KELSLSQGYVKLLNAYHKI PVLVTGYGYSTARGIAQKE IDK^ 

DRQKI KELSLSQGYVKLLNAYHKI PVIiVTGYGYSTARG I AQKE IDKRPLPINEKEQGQR 

DRQKI KELSLSQGYVKLLNAYHKI PVLVTGYGYSTARGIAQKE IDKRPLPINEKEQGQR 

DRQKI KELSLSQGYVKLLNAYHKI PVLVTGYGYSTARGI AQKEIDKRPLPINEKEQGQR 

DRQKIKELSLSQGYVKLLNAYHKIPVLVTGYGYSTARGIAQKEIDKRPLPINEKEQGQR 

DRQKI KELSLSQGYVKLLNAYHKI PVLVTGYGYSTARGIAQKE IDKRPLPINEKEQGQR 

DRQKI KELS L S QGYVKLLNAYHKI P VLVTGYG YSTARG IAQKE I DKRPLP I NEKEQGQR 
DRQKI KELSLSQGYVKLLNAYHKI PVLVTGYGYSTARG I AQKE I DKRPLP INEKEQGQR 
DRQKIKELSLS QGYVKLLNAYHKI PVLVTGYGYS TARGI AQKE IDKRPLPINEKEQGQR 

LEDYES FI SSGS FGATI NAWQDDWNARAWNTS FATNKHSQFLWGDAQVFNQGYGLLGFK 
LEDYESFISSGSFGATINAWQDDWNAIU^WNTSFATNKHSQFLWGDAQVFNQGYGLLGFK 
LF^YESFISSGSFGATINAWQDDWNARAWNTSFATNKHSQFLWGDAQVFNQGYGLLGFK 
LFJ3YESFISSGSFGATINAWQDDWNARAWNTSFATNKHSQFLWGDAQVFNQGYGLLGFK 
LED YE S F I SS GS FGATINAWQDDWNARAWNTS FATNKHS QFLWGDAQVFNQG YGLLGFK 
LED YES F I SSGSFGATINAWQDDWNARAWNTSFATNKHNQFLWGDAQVFNQGYGLLGFK 
LED YES FISSGS FGATINAWQDDWNARAWNTS FATNKHSQFLWGDAQVFNQGYGLLGFK 

LED YES F I SSGSFGATINAWQDDWNARVWNTS FATNKHSQFLWGDAQVFNQGYGLLGFK 
LEDYESFISSGS FGATINAWQDDWNARAWNTS FATNKHS QFLWGDAQVFNQG YGLLGFK 
LEDYESFISSGS FGATINAWQDDWNARAWNT S F ATNKHSQ FLWGDAQV FNQGYGLLGFK 

AKHHYQVDGKRGKGEWKHPLMTSATGDDL YAS SDES YL YLAI KTKPEKLKEKRLLP IDI 
AKHHYQVDGKRGKGEWKHPLMTSATGDDL YAS SDES YL YLAI KTKPEKLKE KRLLP I D I 
AKHHYQVDGKRGKGEWKHPLMTS ATGDDL YAS SDES YL YLAI KTKP EKLKE KRLLP I DI 
AKHHYQVDGKRGKGEWKHPLMTSATGDDL YAS SDES YLYLAIKTKPEKLKE KRLLP IDI 
AKHHYQVDGKRGKGEWKHPLMTSATGDDL YAS SDESYL YLAI KTKPEKLKEKRLLP I DI 
AKHHYQVDGKRGKGEWKHPLMTSATGDDL YAS SDES YL YLAI KTKPEKLKEKRLLP IDI 

akhhyqvdgkrgkgewkhplmtsatgddl yas sdes ylylaiktkpeklke 

akhhyqvdgkrgkeewkhplmtsatgddlyas sdes yl ylai ktkpeklkekrllp idi 
akhhyqvdgkrgkgewkhplmtsatgddlyas sde syl ylai ktkp eklke krllp i d i 
akhhyqvdgkrgkgewkhplmts atgddl yas sde syl ylai ktkp eklke krllp i di 

pks gsrkmngs kvtfs ks sdfvls idpngkselfvqerynalkanylrqlngkdfyafp 
pksgsrkmngskvtfskssdfvls idpngkselfvqerynalkanylrqlngkdfyafp 
pksgsrkmngskvtfskssdfvlsidpngkselfvqerynalkanylrqlngkdfyafp 
pksgsrkmngskvtfskssdfvlsidpngkselfvqerynalkanylrqlngkdfyafp 
pksgsrkmngskvtfskssdfvlsidpngkselfvqerynalkanylrqlngkdfyafp 
pks gsrkmngs kvtfs kss dfvls i dpngks elfvqerynalkanylrqlngkdfyafp 
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Table 28: Comparative Sequences relating to SAG1552 
(conserved hypothetical protein) 



SEQ2856 
SEQ2857 
SEQ2858 
SEQ2859 
SEQ2860 

SEQ2850 
SE&2851 
SEQ2852 
SEQ2853 
SEQ2854 
SEQ2855 
SBQ2856 
SEQ2857 
SEQ2858 
SEQ2859 
SEQ2860 

SEQ2850 
SEQ2851 
SEQ2852 
SEQ2853 
SEQ2854 
SEQ2855 
SEQ2856 
SEQ2857 
SEQ2858 
SEQ2859 
SEQ2860 

SEQ2850 
SEQ2851 
SEQ2852 
SEQ2853 
SEQ2854 
SEQ2855 
SEQ2856 
SEQ2857 
SEQ2858 
SEQ2859 
SEQ2860 



PKS GS RKMNGS KVTFS KS S DFVL S IDPNGKS EL FVQ ERYNALKANYLRQLNGKD PYAF P 

PKSGS RKMNGS KVT F S KS S DFVLS IDPNGKS ELFVQER YNALKANYLRQLNGKDFYAFP 

PKSGSRKMNGSK\n^FSKSSDPVLSIDPNGKSELFVQEllYNAIjKAl!TY^ 

PKSGSRKMNGS KVTFSKSSDFVLS IDPNGKSEIiFVQERYNALKANYLRQLNGKDFYAPP 

KKNSSNFEQINMVLRNTKIVEDMEKVKATERFLPTHPTGLLKT^ 

KKNSSNFEQINMVLRNTKIVEDMEKVKATERFLPTHPTGLLKTGTTDRHQKTFDSQTDI 

KKNSSNFEQINMVIiRNTKIVEDMEKVKATERFXiPTHPTGIiIiKT 

KKNSSNFEQIlHiVIiRNTKIVEDMEKVKATERP^ 

KKNSSNFEQINMVLRNTKIVEDMEKVKATERFLPTHPTGLLKTGTTDRHQK^ 

KKNSSNFEQINMVLRNTKIVEDMEKVKATERFLPTHPTGIiLKTGTTD 

KKNSSNFEQINMVLRNTKTVEDMEKVKATERFLPTHPTGIiLKTO 

KKNSSNFEQINMVLRNTKIVEDMEKVKATERFLPTHPTGLLKTGTTO 

lOCNSSNFEQINMVLRNTKIVEDMEKVKATERFLPTOT 

KKNSSNFEQINMVLRNTKIVEDMEKVKATERFLPTHPTGLLKTGT^ 

FGKDF I EVRI P WQLLNFSD PS S QKIHDD YFKHYGVKELE I ES I ALGLGANS KENTL I KM 
FGKDFI EVRI PWQLLNFSDPSSQKIHDDYFKHYGVKELEI ES I ALGLGANS KENTXiXKM 
FGKDFI EVRI PWQLLNFSDPSSQKIHDDYFKHYGVKELEI ES I ALGLGANS KENTL I KM 
FGKDF I EVRI PWQLLNFSDPSSQRIHDDYFKHYGVKELENEPLLDVL I AKKTHRWQI IV 
FGKDFIEVRI PWQLLNFSDPSSQRIHDDYFKHYGVKELENEPLLDVLIAKKTHRWQI IV 
FGKDF I EVRI PWQLLNFSD P S S QKIHDD YF KHYGVKELE I ES IALGLGANSKENTLI KM 
FGKDFIEVRIPWQLIiNFSDPSSQKIHDDYFlCHYGVKELEIESIAIjGIjGANSKEirrLIKM 

FGKDFIEVRI PWQLLNFSDPSSQKIHDDYFKHYGVKELEIESIAM 

FGKDFI EVRI PWQLLNFSDPSSQKIHDDYFKHYGVKELEI ES I ALGLGANS KENTL I KM 

FGKDF I EVRI PWQLLNFSDPSSQKIHDDYFKHYGVKELEI ES I ALGLGANSKENTLIKM 

D YRLKNWERPDTKTFLKDS YYS IER 

DYRLKNWERPDTKTFLKDS YYVLRK 

D YRLKNWERPDTKT FL KDS YYS I KKEWS KERERTYGP 

IGRDPI PKPFK 

IGRDPI PKPFK ' 

DYRLKNWERPDTKTFLKDS YYVLRK 

DYRLKNWERPDTKTFLKD 

DYRLKNWERPDTKTFLKDS YYS IKK 

DYRLKNWERPDTKTFLKDS YYS IK 

D YRLKNWERPDTKTFLKDS YYS I KKEW 



643 



WO 2004/018646 



PCT/US2003/026827 



Table 29: Comparative Sequences relating to SAG1641 (YaeC family protein) 

SEQ ID NO. 2901: SAGX641 FROM THE 090 GBS TYPE la STRAIN 

AATCAAGAAGTTTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAAAGTO 

GCACGTTGGGATAAAATTGAAAAGCTAGTAGGCGATAAAGCTAAAATCAAATT^ 

CC^AATCAAGCGAC^GCCAATAAGGATGTGGATATTAATGC^ 

GAAAATAAGAAAAACTTAATTCCACTTGAAAAGACTT^ 

CTOAAAAAATTGAAAAAAGGAGCCACTATTGCAATTCCAA^ 

CAGTCAGCAGGTTTAATCAAATTGAATGTTTCTGGTM 

GATATTAATATTCAGGAGTTAGATGCGAGTCAAACACCACGTGCACTCAAAGATGTAGATGCAGCTATTATT 
ACATACATTGAGCAAGCTAATTTAAAACCTTCAGATGCTATCTTTGTTG 
ATTAATATC^TTGCGGGACGTAAAAATTGGAAAAAGCAAAAGAACGCTAAAGC^ 
CAC^CAGATGAAGTGAAAAAAGTTATC^^GATACTTCAGCTGATA 

SEQ ID NO. 2902: SAG1641 FROM THE 1169NT1 GBS TYPE V STRAIN 
(REVERSE COMPLEMENT) 

ATCAAGAAGTTTCAGCAAGCTCAACTTCAAGTAAAGTTG 

CACGTTGGGATAAAATTGAAAAGCTAGTAGGTGATAAAGCTAAAATCAAATTTACAGAATTO 

CAAATCAAGCGACAGCCAATAAGGATGTGGATATTAATGCCTTTCAACATTACAATTT^ 

AAAATAAGAAAAACTTAATTCCACTTGAAAAGACTTACTTAGCTCCAATTCGTATCTATTC 

TTAAAAAATTGAAAAAAGGAGCCACTATTGCAATTCCAAATGATGCAACAAATG 

AGTCAGCAGGITTAATCAAATTGAATGTTTCTGGTAAGAAGGTTGCAACAGTTGCTAATATC^ 

ATATTAATATTCAGGAGTTAGATGCGAGTCAAAGACCACGTGGACT 

CATACATTGAGCAAGCTAATTTAAAACCTTCAGATGCT^ 

TTAATATCATTGCGGGACGTAAAAATTGGAAAAAGCAAAAGAACGCTAAAGCTAT 
ACACAGATGAAGTGAAAAAAGTTATCAAAGATACTTCAGCTGATATTCCACAATGG 

SEQ ID NO. 2903: SAG1641 FROM THE 18RS21 GBS TYPE II STRAIN 

AATCAAGAAGTTTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAAAGTTGG 

GGACGTTGGGATAAAATTGAAAAGCTAGTAGGTGATAAAGCTAAAAT 

CCAAATCAAGCGACAGCCAATAAGGATGTGGATATTAATGCCTTTCAACATTACAATT 

GAAAATAAGAAAAACTTAATTCCACTTGAAAAGACTTACTTAGCTCCAATTCGTATCTATTCT^ 

CTTATVAAAATTGAAAAAAGGAGCCACTATTGCAATTCCAAATGATGCAACAAATG^ 

GATATTAATATTC^GGAGTTAGATGCGAGTCAAACACCACGTGCACTCAAAGA 

ATTAATATCATTGCGGGACGTAAAAATTGGAAAAAGCAAAAGAAC^^ 
CACACAGATGAAGTGAAAAAAGTTATCAAAGATACTTCAGCTGATATTCCAC 

SEQ ID NO. 2904: SAG1641 FROM THE 2603 V/R GBS TYPE V STRAIN 

AATCAAGAAGTTTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAAAG 

GC^a3TTGGGATAAAATTGAAAAGCTAGTAGGTGATAAAGCTAAAATCAAAOT 

CCAAATCAAGCGACAGCCAATAAGGATGTGGATATTAATGCCTTTCAACATTACAATTTCT 

GAAAATAAGAAAAACTTAATTCCACTTGAAAAGACTTACTT^ 

CTTAAAAAATTGAAAAAAGGAGCCACTATTGCAATTCCAAATGATGCAA 

CAGTCAGCAGGTTTAATCAAATTGAATGTTTCTGGTAAGAAGGTTGC^ 

GATATTAATATTCAGGAGTTAGATGCCAGTCAAACACCACGTGCACTCAAAGATC 

ACATACATTGAGCAAGCTAATTTAAAACCTTCAGATGCTATCTTTGTTGAG 

ATTAATATCATTGCGGGACGTAAAAATTGGAAAAAGGAAAAGAACGCTAAAGC 

CACACAGATGAAGTGAAAAAAGTTATCAAAGATACTTCAGCTGATATTCC^ 

SEQ ID NO. 2905: SAG1641 FROM THE A909 GBS TYPE la STRAIN 

AATCAAGAAGTTTCAGCAAGCTCAACTTCAAGTAAAGTTG 

GCACGTTGGGATAAAATTGAAAAGCTAGTAGGTGATAAAGCTAAAATCAAATTTACAGAATOT 

CCAAATCAAGCGACAGCCAATAAGGATGTGGATATTAATGCCTTO 

GAAAATAAGAAAAACTTAATTCCACTTGAAAAGACTTACTTAGCTCCAATTCGTATCT 

CTTAAAAAATTGAAAAAAGGAGCCACTATTGCAATTCCAAATGATGC^ 

CAGTC^GCAGGTTTAATCAAATTGAATGTTTCTGGTAAGAAGGTTGCAACAGTTC 

GATATTAATATTCAGGAGTTAGATGCGAGTGAAAGACCATO 

ACATACATTGAGCAAGCTAATTTAAAACCTTCAGATGCTATCTTTOTTGAGAA^ 

ATTAATATCATTGCGGGACX5TAAAAATTGGAAAAAGCAAAAGAACGCT 

CACACAGATGAAGTGAAAAAAGTTATCAAAGATACrTCAGCTGATATTCC^ 
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Table 29: Comparative Sequences relating to SAG1641 (YaeC family protein) 

SEQ ID NO. 2906: SAG1641 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

AAGTAAAGTTGTTAAAGTTGGTGTTATGACCTT 

AGGCGATAAAGCTAAARTCAAATTCACAGAATTTACAC^ 

GGATATTAATGCCTTTCAACATTACAATTTCTTAGAAAACTC^^ 

AAAGACTTACTTAGCCCCAATTCGTATCTATTCTGAGAAGGTAAAATCT 

TGCAATTCCAAATGATGCAAGAAATGGTAGCCGTC 

TTCTGGTAAGAAGGTTGCAACAGTTGCTAATATCACATCTAATAAAAAAGATATTAATATTCAGGAGT^ 

TCAAACACCACGTGCACTCAAAGATGTAGATGCAGCTATTATTAATAATACA 

TTCAGATGCTATCTTTGTTGAGAAATCAGATAAAAATTCAAAACAATGG^ 

GAAAAAGCAAAAGAACGCTAAAGCTATCCAAGCTATCTTO^ 

AGATACTTCAGCTGATATTCCACAATGGAA 

SEQ ID NO- 2907: SAG1641 FROM THE COH1 GBS TYPE III STRAIN 
(REVERSE COMPLEMENT) 

AGTTTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAAAG 

GGATAAAATTGAAAAGCTAGTAGGTGATAAAGCTAAAATCAAATTTACA 

AGCGACAGCCAATAAGGATGTGGATATTAATGCCTTTCAACATTACAATTT 

GAAAAACTTAATTCCACTTGAAAAGACTTACTTAGCTCCAATTCGTATCTATTCTGA 

ATTGAAAAAAGGAGCCACTATTGCAATTCCAAATGATGC^ 

AGGTTTAATCAAATTGAATGTTTCTGGTAAGAAGGTTGCAACAGTTGCTAATAT 

TATTCAGGAGTTAGATGCGAGTCAAACACCACGTGCACTCAAAGATGTAGATGCAGCTA 

TGAGCAAGCTAATTTAAAACCTTCAGATGCTATCTTTGTT 

CATTGCGGGACGTAAAAATTGGAAAAAGCAAAAGAACGCTAAAGCTATCCAAGCTATCT 
TGAAGTGAAAAAAGTTATC^AAGATACTT(^GCTGATATTCCACAATGG 

SEQ ID NO. 2908: SAG164X FROM THE H36b GBS TYPE lb STRAIN 

AAGAAGTTTCAGCAAGCTCAACOTCAAGTAAAGTTGTTAAA 

GTTGGGATAAAATTGAAAAGCTAGTAGGTGATAAAGCTAAAATCAAATTTACAGAATTTACAGATTATACA 

ATCAAGCGACAGCCAATAAGGATGTGGATATTAATGCCTTTCAAC^TTACAATTTCTT 

ATAAGAAAAACTTAATTCCACTTGAAAAGACTTACTTAGCTCCAATTCGTATCTATTCTGAGAAGGTA 

AAAAATTGAAAAAAGGAGCCACTATTGCAATTCCAAATGATGCAACAAATGGTA 

CAGCAGGTTTAATCAAATTGAATGTTTCTGK5TAAGAAGGTTGCAACAGOT 

TTAATATTCAGGAGTTAGATGCGAGTCAAACACCACGTGCACTCAAAGATGTAGATO 

ACATTGAGCAAG CTAATTTAAAAC CTTCAGATGCTATCTTTGTTGAGAAA.TCAGATAAAAATTCAAAACAATGGATTA 

ATATCATTGCGGGACGTAAAAATTGGAAAAAGCAAAAGAACGCTAAAGCTATCCAAGCTATCTTGGATC 

CAGATGAAGTGAAAAAAGTTATCAAAGATACTTCAGCTGATATTCC^CAATGG 

SEQ ID NO. 2909: SAG1641 FROM THE JM3190013 GBS TYPE VIII STRAIN 

TTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAAAGTTGGTC 

TAAAATTGAAAAGCTAGTAGGTGATAAAGCTAAAATCAAATTTACAGAATTT^ 

GACAGCCAATAAGGATGTGGATATTAATGCC1TTCAACATTAGAATTT 

AAACTTAATTCCACTTGAAAAGACTTACTTAGCTCCAATTCGTATCTA 

GAAAAAAGGAGCCACTATTGCAATTCCAAATGATGCAACAAATGGTAGCCOT 

TTTAATC^AATTGAATGTITCTGGTAAGAAGGTTGCAACA^^ 

TCAGGAGTTAGATGCGAGTCAAACACCACGTGCACTC^AAGATGTA 

GCAAGCTAATTTAAAACCTTCAGATGCTATCTTTGTTGAGAAATCAGAT 

TGCGGGACGTAAAAATTGGAAAAAGCAAAAGAACGCTAAAGCTATCCAAGCT 

AGTGAAAAAAGTTATCAAAGATACTTCAGCTGATATTCCACAATGG 

SEQ ID NO. 29X0: SAGI64I FROM THE M732 GBS TYPE III STRAIN 

AATCAAGAAGTTTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAA 

GCACGTTGGGATAAAATTGAAAAGCTAGTAGGTGATAAAGCTAAAATCAAATTTA 

CCAAATCAAGCGACAGCCT^TAAGGATGTGGATATTAATGCCTTTCAACATTAa^ 

GAAAATAAGAAAAACTTAATTCCACTTGAAAAGACTTACTTAGCTCCAATTCGTATCTATTCTGAG 

CTTAAAAAATTGAAAAAAGGAGCCACTATTGCAATTCCAAATGATC 

CAGTCAGCAGGTTTAATCAAATTGAATGTTTCTGGTAAGAAGGTTGCAACAGTTC 

GATATTAATATTCAGGAGTTAGATGCGAGTCAAACACCACGTGCACTCAAAGATGTAGATGCAG 

ACATACATTGAGCAAGCTAATTTAAAACCTTCAGATGCT^ 

ATTAATATCATTGCGGGACGTAAAAATTGGAAAAAGCAAAAGAACGCTAAAGCTATCCAAGCTATC^ 
CACACAGATGAAGTGAAAAAAGTTATCAAAGATAC 
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Table 29: Comparative Sequences relating to SAG1641 (YaeC family protein) 

SEQ ID NO. 2911* SAQ1641 FROM THE M781 GBS TYPE III STRAIN 

AGTTTCAGCAAGCTCZAACTTCAAGTAAAGTTGTTAAAGTTGGTGTTATGACCTTTTC 

GGATAAAATTCAAAAGCTAGTAGGTGATAAAGCTAAA^ 

AGCGACAGCCAATAAGGATGTGGATATTAATGCCTTTC^CATTACAATTTOT 
GAAAAACTTAATTCCACTTGAAAAGACn^ACTTAGCTCCAATTCGTATCT 

ATTGAAAAAAGGAGCCACTATTGCAATTCCAAATGATGCAACAAATGGTAGCCGTGCATTGTATGTC 
AGGTTTAATCAAATTGAATGTTTCTGGTAAGAAGGTTGCAACAG 
TATTCAGGAGTTAGATGCGAGTCAAACACCACGTCCA^ 
TGAGCAAGCTAATTTAAAACCTTCAGATC 

CATTGCGGGACGTAAAAATTGGAAAAAGCAAAAGAACGCTAAAGCT 
TGAAGTGAAAAAAGTTATCAAAGATAC3TTCAGCTGATATTCCACAATGG 

SEQ2 901 ATCAAGAAGTTTCAGCAAG CTCAACITCAAGTAAAGTTGTTAAAGTTGGTGTTATGACC 



SEQ2 902 ATCAAGAAGTTTCAGCAAGCTCAACTT CAAGTAAAGTTGTTAAAGTTGGTGTTATGACC 

SEQ2903 ATCAAGAAGTT TCAGCAAGCT CAACTTCAAGTAAAGTTGTTAAAGTTGGTGTTATGACC 

SEQ2904 ATC^GMGTTTC^GCAAGCTCMCrTCAAGTAAAGTTGTTAAAGTTGGTGTTATGACC 

SEQ2 905 ATCAAGAAGTTTCAGCAAGCTCAACTT CAAGTAAAGTTGTTAAAGTTGGTGTTATGACC 

SEQ2 906 AAGTAAAGTTGTTAAAGT TGGTGTTATGACC 

SEQ2 907 AGTTTCAGCAAGCTC^CrTCAAGTAAAGTTGTTAAAGTTGGTGTTATGACC 

SBQ2 908 AAGAAGTTTCAGCAAGCTCAACTTCftAC^Ai^GTTGTTAAAGTTGG 

SEQ2 909 TTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAAAGTTGGTGTTA^^ 

SEQ2910 ATCAAGAAGTTTCAGCAAGCTCAACTTCAAGTAAAGTTGTTAAAGTTGGTC 

SBQ2 911 AGTTTCAGC^UVGCTCAACTTCAAGTAAAGTTGTTAAAGTTGGTGTTATGACC 

SSQ2901 TTTTCTGACACTGAAAAAGCACGTTGGGATAAAATTGAAAAGCT 

SEQ2 902 T/TTTCTGACAC!TGAAAAAGCACGTTGGGAT^ 

SBQ2903 TTTTCTGACACTGAAAAAGCACGTTC4GGAT^ 

SEQ2904 TTTTCTGAC^CTGAT^AAAGCACGTTGGGATAAAATTGAAAAG 

SEQ2 905 TTTTCTGACACTGAAAAAGCACGTTGG 

SEQ2 906 TTTTCTGACACTGAAAAAGCACGTTGGGATAAAATTGAAAAGCTAGTAGGCGATAAAGCT 

SEQ2 907 TTTTCTGACACTGAAAAAGCACGTTGGGATAAAATT^ 

SEQ2908 TTTTCTGACACTGAAAAAGCACX»TTGGGATAAAAra 

SEQ2 909 TTTTCTGACACTGAAAAAGCACGTTGGGATAAAATTGAAAAGCTAGTAGG^ 

SEQ2910 TTTTCTGAC^CTGAAAAAGCACGTTGGGATAAAATTGAAAAGCTAGTAG 

SEQ2911 tittctgacactgaaaaagc^cxstt^ 

SEQ2 901 aaaatcaaattcacagaatttacagattatacacaaccaaatcaagcgacagcc^ 

SEQ2902 AAAATCAAATTTACAGAATTTACAGATTATACAC^CCAAATCAAGCGACAGCCAATAAG 

SEQ2903 AAAATCAAATTTACAGAATTTACAGATTATACACAACaUVATCA^ 

SEQ2 904 AAAATCAAATTTACAGAATTTACAGATTATACAC 

SEQ2 905 AAAATCAAATTTACAGAATTTACAGATTATACACAACCAAA 

SBQ2 906 AAAATCAAATT CACAGAATTTACAGATTATACACAACCIAAATCAAGCGACAGCCAATAAG 

SEQ2907 AAAATCAAATTTACAGAATTTACAGATTATACACAACCAAATCAAG 

SEQ 2 908 AAAATCAAATTTACAGA^TTTACAGATTATACAC^CCAAATC^GCGACAGCCAATAAG 

SEQ2 909 AAAATCAAATTTACAGAATTTACAGATTATAC^ 

SEQ2 910 AAAATCAAATTTACAGAATTTACAGATT^ 

SEQ2911 AAAATCAAATTTACAGAATTTACAGATTATAC^ 

SEQ 2 901 GATGTGGATATTAATG CCTTT C^^CATTACAA , ri l 'r crTAGAAAACTGGAATAAGGAAAAT 

SEQ2 902 GATGTGGATATTAATGCCTTTCAACATTACAATTTCTTAG^ 
SEQ2 903 GATGTGGAT ATTAATGCCTTT CAACATTACAATT^ 

SEQ2 904 GATGTGGATATTAATGCCTTTCAA CAT TACAATTTCTTAGAAAACTGGAATAAGGAAAAT 

SEQ2 905 GATGTGGATATTAATGCCTTTCAACATTACAATTTCr^ 

SEQ2906 GATGTGGATATTAATGCCTTTCAACAT TAC^ATTTCI^AGAAAACrGGAATAAGGAAAAT 

SEQ2 907 GATGTGGATATTAATGCCTTTCAACAT^^ 
SEQ2908 GATGTGGATATTAATGCCTTTC^CATTACAAT^ 

SEQ2 909 GATGIGGATAT/TAATGCCTTTCAA(^TT ACAATTT CTT AGAAAACTGGAATAAGGAAAAT 
SEQ2 910 GATGTGGATATTAATGCCTTTCAACA^ 
SEQ2911 GATGTGGATATTAATGCCTTTCAAC^TTACAAT^ 

SEQ2 901 AAGAAAAACTTAATTCCA.CITGAAAAGACT 
SBQ2902 AAGAAAAACTTAATTCCACTTGAAAA 

SEQ2903 AAGAAAAACTTAATTCCACTTGAAAAGACTTACTT AGCT " 
SEQ2904 AAGAAAAAC!TTAATT(XACTTC4AAAAC^CrTA 
SEQ2 905 AAGAAAAACTTAATTCCACITGAAAAGAC^ 
SEQ2 906 AAGAAAAACITAATTCCACITGAAAAGACT 

SBQ2 907 AAGAAAAACITAATTCC^CTTGAAAAGA CTTACTTAGCTC<ZAATTCIGTATCTATTCrGAG 

SEQ2908 AAGAAAAACTTAATTC(^CITGAAAAGACITACTT 
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Table 29: Comparative Sequences relating to SAG1641 (YaeC family protein) 



SEQ2909 
SEQ2910 
SEQ2911 

SEQ2901 
SEQ2902 
SEQ2903 
SEQ2 904 
SEQ2905 
SEQ2906 
SEQ2907 
SEQ2908 
SEQ2909 
SEQ2910 
SBQ29X1 

SEQ2901 
SEQ2902 
SEQ2903 
SEQ2904 
SEQ2905 
SEQ2906 
SEQ2907 
SEQ2908 
SEQ2909 
SEQ2910 
SEQ2911 

SEQ2901 
SEQ2902 
SEQ2903 
SEQ2904 
SEQ2905 
SEQ2906 
SEQ2907 
SEQ2908 
SEQ2909 
SEQ2910 
SEQ2911 

SEQ2901 
SEQ2902 
SBQ2903 
SEQ2904 
SEQ2905 
SEQ2906 
SEQ2907 
SEQ2908 
SEQ2909 
SEQ2910 
SEQ2911 

SEQ2901 
SEQ2902 
SEQ2903 
SEQ2904 
SEQ2905 
SEQ2906 
SEQ2907 
SBQ2908 
SEQ2909 
SEQ2910 
SEQ2911 



AAGAAAAACTTAATTC CACTTGAAAAGACT TACTTAGCTC CAATTCGTAT CTATTCTGAG 
AAGAAAAACTTAATTCCACTTGAAAAGACTTACJTT^ 

AAGAAAAACTTAATTCCACTTGAAAAGACT CAATTCGTATC TATTCTGAG 

AAGGTAAAAT CTCTTAAAAAAT TGAAAAAAGGAGCCACTATTGCAATT CCAAATGATGCA 
AAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAG CCACTATTG CAATTCCAAATGATGCA 
AAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCCACTATTGCAATTCCAAA 
AAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCC^CTATTGCAATTCCAAATGATGCA 
AAGKSTAAAATCTCTTAAAAAATTGAAAAAAGGAGCCACT 

AAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCC^CTATTGCAATTCCAAATGATGCA 
AAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCCACTATTGCAATTCCAAATGA 
AAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCCACTATTGCAAT^ 
AAGGTAAAATCTCTTAAAAAAT TGAAAAAAGGAGCCACTATTGCAATT CCAAATGATGCA 
AAGGTAAAAT CTCTIAAAAAATTGAAAAAAGGAGCCACTATTGCAA 
AAGGTAAAATCTCTTAAAAAATTGAAAAAAGGAGCCACTATTGC^ 

ACAAATGGTAGCCGTGCATT<3TATGTCC!TTCAGTCAGCAGG 

ACAAATGGTAGCQ3TGCATTGTATGTCCTTCAGTCAG 

ACAAATGGTAGCOTTGCATTGTATGTCCTTCAGTC^ 

ACAAATGGTAGCCXJTGCATTGTATGTCCTTCAGTCAGCAGGT^ 

ACAAATGGTAGCCGTGC^TTGTATGTCCTTCAGTC^GCAGGTTTAATCAAA 

ACAAATGGTAGCCGTGCATTGTATGTCCTTCAGTCAGCAGGTTTAATCAAATTGAATGT 

ACAAATGGTAGCCX3TG CATTGTATGTACTT CAGTCAGCAG^ 

ACAAATGGTAGCCGTGCATTGTATGTCCTTCAGTCAGCAGGCT 

ACAAATGGTAGCC3GTGCATTCTATGTCCTTCAGTCAGCAG 

ACAAATGGTAGCCX5TCCATTCTATGTCCTTCAOTCAGCAGGOT 

ACAAATGGTAGCCGTGCATTGTATGTCCTTC^GTCAGCAGG T 
TCTGGTAAGAAGGTTGCAAC!AGTTGCrrAATATC^CATCT 

TCTGGTAAGAAGGTTG CAACAGTTGCTAATAT CACATCTAATAAAAAGGATATTAATATT 
TCTGGTAAGAAGGTTGCAACAGTTGCTAATATCAC^TCTAAT^ 

TCTGGTAAGAAGGTTGCAACAGTTGCTAATATCACATCTAATAAAAAGGATATTAATATT 

TCTGGTAAGAAGGTTGCAAC^GTTGCTAATATC^CATCTAATAAAAAGGATATTAATATT 

TCTGGTAAGAAGGTTGCAACAGTTGCTAATATCACATCTAATAAAAAAGATATT 

TCTGGTAAGAAGGTTGCAACAGTTGCTAATATC^CATCTAATAAAAAGGATATTAATATT 

TCTGGTAAGAAGGTTGCAACAGTTGCITAATATCACATCTAA 

TCTGGTAAGAAGGTTCCAACAGTTGCTAATATCACATCT^ 

TCTGGTAAGAAGGTTGCAACAGTTGCTAATAT(ZACATCTAATAAAAAGGATATTAATATT 
TCTGGTAAGAAGGTTGCAACAGTTGCTAATAT t^CATCTAATAAAAAGGATATTAATATT 

CAGGAGTTAGATGCGAGTCAAACACCACGTGCACrrCAAAGATCT 

CAGGAGTTAGATGCGAGTCAAACA<XACX3TGCACrCAAAGA 

CAGGAGTTAGATGCGAGTCAAACACCACGTGCACTCAAAGATGTAG^ 

CAGGAGTTAGATGCCAGTCAAACACCACGTGCACT C^^GATGTAJGATGCAGCTATTAT T 

CAGGAGTTAGATGCGAGTCAAACACCACIGTGCACTCAAAGATGTAGAT^ 

CAGGAGTTAGATG CGAGTC!AAACACCACGTGCACT CAAAGATGTAGATGCAG CTATTATT 

CAGGAGTTAGATGCGAGTCAAACACCACGTGCACTCAAAGATGTAGATGCAGCTATTATT 

CAGGAGTTAGATGCGAGTCAAAC^CCACGTGCACTCAAA 

CAGGAGTTAGATGCGAGTCAAACACCACGTGC^CTaUUlGATC 

CAGGAGTTAGATGCGAGTCAAACACCACGTGCACTCAAA 

CAGGAGTTAGATGCGAGTCAAACACCACGTGCACTCAAAGA 

AATAATACATACATTGAGCAAGCTAATTTAAAAC (TTTCAGATC 
AATAATACATAC^TTGAGCAAGCIAATTTAAAACCTTCAGA^ 
AATAATACATACATTGAGCAAGCTAATTTAAAACCT^ 
AATAATACATACAT/TGAGCAAGCTAAT^TTAAAACCTTCAGATGCT 

AATAATACATACAT TGAGCAAG CTAAT TTAAAACCTTCAGATG CTATCTTTGTTGAGAAA 
AATAATACATACATTGAGCAAGCTAATTTAAAACCTTCAGATGCT 

AATAATACATACATTGAG(2AAGCTAATTTAAAAC OTTC^GATGCTATCTTTGTTGAGAAA 

AATAATACATAC^TTGAGCAAGCTAATTTAAAACCITC^GATG 

AATAATACJVTACATTGAGCAAGCTT^TTTAA 

AATAATACATACATTGAGCAAGCTAATTTAAAACCTTCAGAT^ 

AATAATACATACATTGAGCAAGCTAATTTAAAACCTTC^ 
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Table 29: Comparative Sequences relating to SAG1641 (YaeC family protein) 

TCAGATAAAAATTCA?UUVCAATGGATTAATATCATTGCGGGACGTAAAAATTGGAAAAAG 
TCAGAT AAAAATT CAAAACAATGGATTAAT ATCATTGCGGGACG 
TCAGATAAAAATTCAAAACAATGGA 

TCAGATAAAAATTCAAAACAATGGATTAATATCATTGCGGGACGTAAAAATTGGAAAAAG 
TCAGATAAAAATTCAAAACAATGGATTAATATCATTGCGGGACGTAAAAATTGGAAAAAG 
TCAGATAAAAATTCAAAACAATGGATTAATATC^TT^^ 

TCAGATAAAAATTCAAAACAATGGATTAATAT CATTGCGGGACGTAAAAATTGGAAAAAG 
TCAGATAAAAATTCAAAACAATGGATTAATATCATTGCGGGACGTAAAAATTGGAAAAAG 
TCAGATAAAAATTCAAAACAATGGATTAATATCATTGCGGGACGTAAAAATTGGAAAAAG 
TCAGATAAAAATTCAAAACAATGGATTAATATCATTGCGGGACGTAAAAATTGGAAAAAG 
TCAGAT AAAAATTCAAAACAATGGATTAATAT CATTGCGGGACGTAAAAATTGGAAAAAG 

CAAAAGAACGCTAAAGCTATCCAAGCTATCTTGGATGCITTATCAC^ 
CAAAAGAAOSCTAAAGCTATCCAAGCTATCTTGGATGCTTATCAC^ 
CAAAAGAACGCTAAAGCTATCCSUVGCTATCTTGGATGC^ 

CAAAAG^CGCTAAAGCTATCCAAGCTATCTTGGATGCTTATCACACAGATGAAGTGAAA 
CAAAAGAACGCTAAAGCTATCCAAGCTATCTTGGATGCTTATCACACAGATGAAGTGAAA 
OU^AAGAACGCTAAAGCTATCCAAGCTATCTTGGATGCT^ 
CAAAAGAACGCTAAAGCTATCCAAGCTATCTTGGATCCTrATCACAC^ 
CAAAAG AACG CTAAAG CTATCCAAG CTATCTTGGATGCTTATCACACAGATGAAGTGAAA 
CAAAAGAACX3CTAAAGCTATCCAAGCTATCTTGGATC 
OUU^AGAACGCTAAAGCTATCCAAG^TATCTTGGATC 
CAAAAGAACGCTAAAGCTATCGAAGCTATCTGGG^ 

SE Q2 901 AAAGTT ATCAAAGATACTT CAGCTGATATT CCACAATGGAACC CAGCTTTCTTGTACAA 

SEQ2 902 AAAGTTATCAAAGATACTT CAGCTGATATT CCACAATGG 

SEQ2903 AAAGTTATCAAAGATACTTCAGCTGATATTCCAC 

SEQ2904 AAAGTTATCAAAGATACTTCAGCTGATATTCCACAATGG 

SEQ2905 AAAGTTAT CAAAGATACTTCAGCTGATATT C CACAATGG 

SEQ2 906 AAAGTT ATCAAAGATACTTCAG CTGATATT C CACAATGGAA 

SEQ2907 AAAGTTATCAAAGATACTTCAGCTGATATTCCACAATGG 

SEQ2 908 AAAGTTATCAAAGATACTTCAGCTGATATTCCACAATGG 

SEQ2909 AAAGTTAT CAAAGATACTTCAG CTGATATT CCACAATGG 

SEQ2 910 AAAGTTAT CAAAGATAC 

SEQ2911 AAAGTTAT CAAAGATACTTCAG CTGATATT CCACAATGG 



SEQ2901 
SEQ2902 
SBQ2903 
SEQ2904 
SEQ2905 
SEQ2906 
SEQ2907 
SEQ2908 
SEQ2 90 9 
SEQ2910 
SEQ2911 

SEQ2901 
SEQ2902 
SEQ2 903 
SEQ2904 
SEQ2905 
SEQ2906 
SEQ2907 
SEQ2908 
SEQ2909 
SEQ2910 
SEQ2911 



>SBQ ID NO 2950 x 35_090 frames 1 

NQEVSASSTS SKVVKVGVMTFSDTEKARWDKI EKLVGDKAKI KFTEFTD YTQPNQATANK 
DVD INAFQHYNFLENWNKENKKNL I PLEKT YLAPIRI YSEKVKSLKKLKKGATIAI PNDA 
TNGSRALYVLQSAGLI KLNVSGKKVATVANI TSNKKDINI QELDASQTPRALKDVDAAI I 
NNTY I EQANLKP SD AI FVEKSDKNSKQWINI I AGRKNWKKQKNAKAIQ AI LDAYHTDEVK 
KVI KDTSADI PQWNPAFLY 

>SEQ ID NO 2951 s 35_1169NT frames 3 

QEVSAS ST S SKVVKVGVMTFSDTEKARWDKI EKLVGDKAKI KFTEFTD YTQPNQATANKD 
VDINAFQHYNFLFJJWNKENKKNLIPLEK1TLAP 

NGSRALYVLQS AGL IKLNVSGKKVATVANI TSNKKDINIQELDASQTP RALKDVDAAI IN 
NTYI EQANLKPSDAI FVEKSDKNSKQWINI IAGRKNWKKQKNAKAIQAILDAyHTDEVKK 
VIKDTSADIPQW 

>SEQ ID NO 2952s 35_18RS21 frames 1 

NQEVSASSTS S KWKVGVMTFSDTEKARWDKI EKLVGDKAKI KFTEFTDYTQPNQATANK 
DVDINAFQHYNFLENWNKENKKNLIPLEKTYIiAPIRIYSEKVKSLK^ PNDA 
TNGSRALYVLQSAGLI KLNVSGKKVATVANITSNKKDI NI QELDAS QTPRALKDVDAAI I 
NNT YI EQANLKPSDAI FVEKSDKNSKQWINI I AGRKNWKKQKNAKAIQAILDAYHTDEVK 
KVIKDTSADIP 



>SEQ ID NO 2953s 35_2603 frames 1 

NQEVSASSTSSKWKVGVMTFSDTEKARWDKI EKLVGDKAKI KFTEFTDYTQPNQATANK 
DVD INAFQHYNFLENWNKENKKNL I PLEKTYLAP I RI YS EKVKSLKKLKKGATI AI PNDA 
TNGS RAL YVLQSAGLI KLNVS GKKVATVANI TSNKKDINI QELDASQTPRALKDVDAAI I 
NNTYI EQANLKPSDAI FVEKSDKNSKQWINI I AGRKNW KKQKNAKAI QAI LDAYHTDEVK 
KVI KDTSADI PQW 
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Table 29: Comparative Sequences relating to SAG1641 (YaeC family protein) 

>SEQ ID NO 2954s35_A909 frame: 1 

NQEVSAS S TS S KVVTCVGVMTFSDTEKARWDKIEKLVCaDKAKI KFTEFTDYTQPNQATANK 
DVDINAFQHYNFLENWNKENKKNLIPLEK!TY1^^ 

TNGSRALYVI^SAGLIKLNVSGKKVAWANITSNKTO^ I 
NNTYIEQANLKPSDAI FVEKSDKNSKQWINI IAGRKNWKKQKNAKAI QAILDAYHTDEVK 
KVIKDTSADIPQW 

>SEQ ID NO 2955s35_CJB110 frames 2 

S KWKVGVMTFS DTEKARWD KI EKLVGDKAKI KFTEF TD YTQPNQATANKDVD INAFQHY 
NFLENWNKENKKNLI PLEKTYLAPI RIYS EKVXSLKKLKKGATIAI PNDATNGSRAL YVL 
QS AGLI KLNVSGKKVATVANITSNKKDINI QELDASQTPRALKDVDAA I INNTYI EQANL 
KPSDAI FVEKSDKNS KQWINI IAGRKNWKKQKNAKAI QAILDAYHTDEVKKVI KDTSAD I 
PQW 

>SEQ ID NO 2956:35_COHl frames 2 

VSASSTSSKWKVGVMTFSDTEKARWDKI EKLVGDKAKI KFTEFTDYTQPNQATANKDVD 
INAFQHYNFLENWNKENKKNLIPLEKTYLAPIRIYSEKVKSLKK^ 

SRALYVLQSAGLIKLNVSGKKVATVANITSNKKDINIQEIiDASQTPR^ INNT 
YIEQANIiKPSDAIFVEKSDKNSKQWINI IAGRKNWKKQKNAKAIQAILDAYHTDEVKKVI 
KDTSADIPQW 

>SEQ ID NO 2957 s 35 JK36B frames 3 

EVSAS STS SKVVKVGVMTFSDTEKARWDKI EKLVGDKAKI KFTEFTDYTQPNQATANKDV 
DINAFQHYNFLENWNKENKXNLIPLBKTYLAPIRI YSEKVXSLKK^ PNDATN 
GSRALYVIjQSAGLIKIiNVSGKKVATVANITSNKKDINIQELDASQTPRALKDVD 
TYIEQANLKPSDAI FVEKSDKNSKQWINI IAGRKNWKKQKNAKAIQAI IiDA YHTDEVKKV 
IKDTSADIPQW 

>SEQ ID NO 295 8 :35_JM913 0013 frames 2 

SAS STS S KVVKVGVMTF S DTEKARWDKI EKLVGDKAKI KF TE FTD YTQ PNQATANKDVD I 
NAFQHYNFLENWNKENKKNLI PLEKTYLAPIRI YSEKVKSLKKLKKGATIAI PNDATNGS 
RAL YVLQSAGLI KIiNVSGKKVATVANI TSNKKDINIQELDASQTPRALKDVDAAIINNTY 
I EQANL KPSDAI FVEKSDKNSKQWINI IAGRKNWKKQKNAKAI QAI LDAYHTDEVKKVI K 
DTSADIPQW 

>SEQ ID NO 2959s35_M732 frames 1 

NQEVSASSTSSKVVKVGVMTFSDTEKARWDKI EKLVGDKAKI KFTEFTDYTQPNQATANK 
DVDINAFQHYNFLENWNKENKKNLI PLEKTYLAP I RI YSEKVKSLKKLKKGATIAI PNDA 
TNGSRAL YVLQSAGLI KLNVSGKKVATVANITSNKKDINIQELDASQTPRAIiKDVDAAI I 
NNTYIEQANLKPSDAI FVEKSDKNSKQWINI I AGRJCNWKKQKNAKAIQAILDAYHTO 

KVIKD 

>SEQ ID NO 2960s35_M781 frames 2 

VSASSTSS KVVKVGVMTFSDTEKARWDKI E1CLVGDKAKIKFTEFTD YTQPNQATANKDVD 
INAFQHYNFLENWNKENKKNLIPLEKTYIAPIRIYSEKVKSLKKLKKGATIAIPNDATNG 
SRALYVLQSAGLI KLNVS GKKVATVANI TSNKKDINIQELDASQTPRALKDVDAAI INNT 
YIEQANLKPSDAI FVEKSDKNS KQWINI IAGRKNWKKQKNAKAIQAIWDAYHTDEVKKVI 
KDTSADIPQW 



SEQ2 950 QEVSAS STS SKVVKVGVMTFSDTEKARWDKI EKLVGDKAKI KFTEFTDYTQPNQATANK 

SEQ2 951 QEVSAS STS SKVVKVGVMTFSDTEKARWDKI EKLVGDKAKI KFTEFTDYTQPNQATANK 

SEQ2952 Q EVSAS ST S S KWKVGVMT FSDTEKARWDKI EKLVGDKAKI KFTE F TD YTQ PNQATANK 

SEQ2953 QEV SAS STSSKVTCVGVMTFSDTEKARWDKI EKLVGDKAKI KFTEFTDYTQPNQATANK 

SEQ2954 QEVSAS S TS S KWKVGVMT F SDTEKARWDKI E KLVGDKAKI KF TEFTDYTQ PNQATANK 

SEQ2955 - — - SKVVKVGVMTFSDTEKARWDKI EKLVGDKAKI KFTEFTDYTQPNQATANK 

SEQ2 956 - -VSASSTSSKVVKVGVMTFSDTEKARWDKIEKLVGDKAK^ 

SEQ2957 - EVSASSTSSKVVKVGVMTFSDTEKARWDKI EKLVGDKAKI KFTEFTDYTQPNQATANK 

SEQ2 958 SAS STSSKVVKVGVMTFSDTEKARWDKI EKLVGDKAKI KFTEFTDYTQPNQATANK 

SEQ2 959 QEVSAS STS SKVVKVGVMTFSDTEKARWDKI EKLVGDKAKI KFTE FTD YTQ PNQATANK 

SEQ2 960 - -VSASSTSSKWKVGVMTFSDTEKARWDKIEKLVGDKAKIKFTEFTDYTQPNQATANK 

SEQ2950 DVDINAFQHYNFLENWNKENKKNLIPLEKTYLAPIRIYS 

SEQ2 951 DVDINAFQHYNFLENWNKENKKNL I PLEKTYLAPI RI YSEKVKSLKKLKKGATIAI PNDA 

SEQ2952 DVDINAFQHYNFLENWNKENKKNLI PLEKTYLAPIRIYSEKVKSLKKLKKGATIAIPNDA 

SEQ2 953 DVD INAFQHYNFL ENWNKENKKNL I PL EKTYLAP I RI YS E KVKSLKKL KKGAT I AI PNDA 

SEQ2 954 DVDINAFQHYNFLENWNKENKKNLI PLEKTYLAPIRI YSEKVKSLKKLKKGATIAI PNDA 

SEQ2955 ' DVDINAFQHYNFLENWNKENKKNLI PLEKTYL PNDA 

SEQ2956 DVDINAFQHYNFLENWNKENKKNLIPLEKTYLAPIRIYSEKVKSL 

SEQ2957 DVDINAFQHYNFLENWNKENKKNLI PLEKTYLAPIRI 

SEQ295 8 DVDINAFQHYNFLENWNKENKKNLI PLEKTYLAPIRI YSEKVKSLKKLKKGATIAI PNDA 
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Table 29: Comparative Sequences relating to SAG1641 (YaeC family protein) 

t 

SEQ2959 DVDINAFQHYNFLENVftnCENKKNLI 

SEQ2960 DVDINAFQHYNFLENWNKENKKNLIPLEKTYIiAPIRIYSEKVKSLKKLK^ 

SEQ2 950 TNGSRALYVLQSAGLIKLNVSGKKVATOANITSNKKDINIQELDA^ I 

SEQ2951 TNGSRALYVLQSAGLIKLNVSGKKVATVANITSNICKDINIQELDASQTPR 

SEQ2952 TNGSRALYVLQSAGLI KLNVSGKKVATVANITSNKKDINI QELDAS QTPRAL KDVDAAI I • 

SEQ2953 TNGSRALYVLQSAGLI KLNVSGKKVATVANI TSNKKDINIQELDAS QTPRALKDVDAAI I 

SEQ2954 TNGS RAL YVLQ S AGLI KLNVSGKKVATVAN I TSNKKDINI QELDAS QT PRAL KDVDAAI I 

SEQ29S5 TNGSRALYVLQSAGLI KLNVSGKKVATVANITSNKKDINI QELDAS QTPRALKDVDAAI I 

SEQ2 95 6 TNGSRALYVLQSAGLI KLNVSGKKVATVANI TSNKKDINI QELDAS QTPRALKDVDAAI I 

SEQ2 957 TNGSRALYVLQSAGLI KLNVSGKKVATVANI TSNKKDINI QELDAS QTPRALKDVDAAI I 

SEQ2 958 TNGSRALYVLQSAGLI KLNVSGKKVATVAN ITSNKKDINI QELDASQTPRALKDVDAAI I 

SEQ2 959 TNGSRALYVLQSAGLI KLNVSGKKVATVANI TSNKKDINI QELDAS QTPRALKDVDAAI I 

SEQ2 960 TNGSRALYVLQSAGLI KLNVSGKKVATVANITSNKKDINI QELDASQTPRALKDVDAAI I 

SEQ2950 NNTYI EQANLKPSDAI FVEKSDKNSKQWINI I AGRKNWKKQKNAKAIQAILDAYHTDEVK 

SEQ2951 NNTYI EQANLKPSDAI EVEKSDKNSKQWINIIAGRKNWKKQKNAKAIQAILDAYHTDEVK 

SEQ2952 NNTYI EQANLKPSDAI FVEKSDKNS KQWINI IAGRKNWKKQKNAKAIQAILDAYHTDEVK 

SEQ2 953 NNTYI EQANLKPSDAI FVEKSDKNSKQWINI IAGRKNWKKQKNAKAIQAILDAYHTDEVK 

SEQ2954 NNTYI EQANLKPSDAI FVEKSDKNSKQWINI IAGRKNWKKQKNAKAIQAILDAYHTDEVK 

SEQ2955 NNTYI EQANLKPSDAI FVEKSDKNSKQWINI I AGRKNWKKQKNAKAIQAILDAYHTDEVK 

SEQ2956 NNTYI EQANLKPSDAI FVEKSDKNSKQWINI I AGRKNWKKQKNAKAI QAILDAYHTDEVK 

SEQ2957 NNTYIEQANLKPSDAI FVEKSDKNSKQWINI I AGRKNWKKQKNAKAIQAILDAYHTDEVK 

SEQ2 958 NNTYI EQANLKPSDAI FVEKSDKNSKQWINI IAGRKNWKKQKNAKAIQAILDAYHTDEVK 

SEQ2959 NNTYIEQANLKPSDAI FVEKSDKNSKQWINI IAGRKNWKKQKNAKAIQAILDAYHTDEVK 

SEQ2 960 NNTYIEQANLKPSDAI FVEKSDKNSKQWINIIAGRKNWKKQKNAKAIQAIWDAYHTDEVK 

SEQ2 950 KVIKDTSADIPQWNPAFLY 

SEQ2951 KVIKDTSADIPQW- 

SEQ2952 KVI KDTSADI P 

SEQ2953 KVIKDTSADIPQW 

SEQ2954 KVIKDTSADIPQW 

SEQ2955 KVIKDTSADIPQW --- 

SEQ2956 KVIKDTSADIPQW 

SEQ2957 KVIKDTSADIPQW 

SEQ2958 KVIKDTSADIPQW 

SEQ2959 KVIKD 

SEQ2960 KVIKDTSADIPQW 
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Table 30: Comparative Sequences relating to SAG2147 
(protein of uknown function / lipoprotein, putative) 

SEQ ID NO. 3001: SAG2147 FROM THE 1169NT1 GBS TYPE V STRAIN 
(REVERSE COMPLEMENT) 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAAAGTTCGCGTAGCC 

AAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGATGTAAAACAGGCT 

CCAAAACCTTCTCAGGCATCTAATGAAGTCCCAAAAT 

AATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCGGCTGTAGAACAAGCAGTTGTAACA 

GAAAATACCCCTGCTACCAGTCAGGC^CAACAAACTTATGCTGTTACTGAGACAACTTAC 

AAAC CTGCTCAACAC CAGACAAGTGG CCAAGTATTGAGCAATGG AAAT ACTGC AGGGGCG 

GTCGGATCTGCTGCTGCAGCACAAATGGCTGCTGCAAC^GGAGTCCCrGAGTCTACTTOT 

GAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCTAATGCCTCAGGAGCT 

TCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAACAGCT^ 

AATTCAGCTATTAAAGCTTATCGTGCTC^GGTTTATCAGCTTGGGGTTAC 

SEQ ZD NO. 3002 1 SAG2147 FROM THE 18RS21.GBS TYPE II STRAIN 
(REVERSE COMPLEMENT ) 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAAAGTTC 

GCGTAGCCAAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGATGTAA 

AACAGGCTCCAAAACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAGTTCTCAATCTA 

CAGAAGCTAATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCAGCrrGTAGAACAAGC^ 

TTGTAACAGAAAACACCCCTGCTACC^GTCAGGCACy^CAAGCTTATGCTGTTACTGAGA 

C^CTTATAGACCTGCTCAACACCAGACGAGTGGCC^AGTATTGAGTTVATGGAAATACTG 

CAGGGGCTATTGGCTCAGCAGCTGCAGCAGAAATGGCTGC^^ 

CTACTTGGGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTG 

CAGGAGCTTCAGGACTTTTCGAAACGATGCCAGGTTGGGGTTCAACA^ 

ATCAAGTTAATTCAGCTATTAAAGCTTATCGTGCTCAAGGTTTATCAG 

SEQ ID NO. 3003: SAG2147 FROM THE 2603 V/R GBS TYPE V STRAIN 
(REVERSE COMPLEMENT) 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAAAGT 

TCGCGTAGCCAAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGATGT 

AAAACAGGCTCCAAAACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAGTTCTCAATC 

TACAGAAGCTAATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCAGCTGTAGAACAAGC 

AGTTGTAACAGAAAACACCCCTGCTACCAGTCAGGCACAACAAGCTTATGCTGTTACTGA 

GACAACTTATAGACCTGCTCAACACCAGACGAGTGGCCAAGTATTGAGTAATGGAAATAC 

TGCAGGGGCTATTGGCTCAGCAGCTGCAGCACAAATGGCTGCTGCAACAGGAGTCCCTCA 

GTCTACTTGGGAACATATTATTGCCCGTGAATCAAATGGT 

CTCAGGAGCTTCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTC^ 

GGATCAAGTTAATTCAGCTATTAAAGCTTATCGTGCTCAA.GGTTTATCAGCTTGGGGTTA 

C 

SEQ ID NO. 3004: SAG2147 FROM THE 090 GBS TYPE la STRAIN 
(REVERSE COMPLEMENT) 

TAGCCAAAAAATCAAAAATGATTAAGGCGACATCTAAATCAAAAGTAG 
AGGCTCCAAAACCTTCTCAGGGATCTAATGAAGCC^ 

AAGCTAATTCTCAGCMCAAGTTACTGCGAGTGAAGAGGCAGCTGTAGAACAAGCAGTra 
TAACAGAAAACACCCCTGCTACCAGTCAGGCACAAC7^GCTTATGCTGTTACTGAGAC^ 
CTTATAGACCTGCTCAACACCAGACGAGTGGCCAAGTATTGAGTAATGGAAATACTGCAG 
GGGCTATTGGCTCAGCAGCTGCAGCACAAATGGCTGCTGCAAC^ 

CTTGGGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCTAATGCCTCAG 
GAGCTTCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAACAGCTACAGTTCAGGA 

SEQ ID NO. 3005: SAG2147 FROM THE A909 GBS TYPE la STRAIN 
(REVERSE COMPLEMENT) 

AAGGCGACATCTAAATCAAAAGTAGAAGATGTAAAACAGGCTC 
TCTAAI^SAAGCCCCAAAATCAAGTTCTCAATCTACAGAA 

ACTGCXIAGTGAAGAGGCAGCTGTAGAACAAGCAGTTC C 

AGTC^GGCACAAC^GCTTATGCTGTTACTGAGACAACTTATAGACCTGCTCAACACCAG 

ACAAGTGGCCAAGTATTGAGTAATGGAAATACTGCAGGGGCTATTGGCTCA 

GGACAAATGGCTGCTGCAACAGGAGTCCCTCAGTCTACTTGGG7^(^TATTATTGCCCGT 

GAATCAAATGGTAATCCTAATGTTGCTAATGCCTCAGGAGCTTCAGGACTTTTCCAAACG 

ATGCCAGGTTGGGGTTCAACAGCTACAGTTCAGAATCAAGTTAATTCAGCT 

TATCGTGCTCAAGGTTTATCA 
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Table 30: Comparative Sequences relating to SAG2147 
(protein of uknown function / lipoprotein, putative) 

SEQ ID NO. 3006: SAG2147 FROM THE CJB110 GBS NONTYP EAB L E STRAIN 
(REVERSE COMPLEMENT) 

AATCTTTGTCAAAAGCAGATAAAGTTCGCGTAGCCAAAAAATCAAAAATGACTAAGGCGA 

C^TCTAAATCAAAAGTAGAAGATGTAAAACAGGCTCCAAAACCTTCTCAGGCATCTAATG 

AAGCCCCAAAATCAAGTTCTGAATCTACAGAAGCTAATTCTC^ 

GTGAAGAGGCAGCTGTAGAACAAGCAGOTGTAAGAGJy^AACACC^ 

CACAACAAGCTTATGCTGTTACTGAGACAACTTATAGACCTGCT 

GCCAAGTATTGAGTAATGGAAATACTGGAGGGGCTATTGGCTCAGCAGCTGCAGCA 

TGGCTGCTGCAACAGGAGTCCCTCAGTCTACTTGGGAACATATTATTGCCCGTGAATCAA 

ATGGTAATCCTAATGTTGCTAATGCCTCAGGAGCTT 

CTCAAGGTTTATCAGCTTGGGGTTAC 

SEQ ID NO. 3007: SAG2I47 PROM THE COH1 GBS TYPE III STRAIN 
(REVERSE COMPLEMENT) 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAA 

AGTTCGCGTAGCCAAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGA 

TGTAAAACAGGCTCCAAAACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAGTTCTCA 

ATCTAC^GAAGCTAATTCTCAGCAACAAGTTACTGCGAGTGAAGAGGCGGCTGTAGAACA 

AGCAGTTGTAACAGAAAATACCCCTGCTACCAGTCAGGCACAACAAACTTATGCTGTTAC 

TGAGACAACTTACAAACCTGCTCAACACCAGACAAGTGGCCA 

TACTGCAGGGGCGGTCGGATCTGCTGC7X3CAGCACAAATGGCTGCTC 

TCAGTCTACTTGGGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCTAA 

TGCCTCAGGAGCTTC^GGACTTTTCCAAACGATGCC^^ 

TC^GGATCAAGTTAATTCAGCTATTAAAGCTTATCGTGCTCAAGGTTTATCAGCTTGGGG 
TTAC 

SEQ ID NO. 3008: SAG2147 FROM THE H36b GBS TYPE lb STRAIN 

(reverse complement) 

aaaagttcacaagttactactgaatctttgtcaaaagc 

agataaagttcgcgtagccaaaaaatcaaaaatgactaaggcg^ 

agaagatgtaaaacaggctccaaaaccttctcaggcatctaatgaagccccaaaato^g 

ttctcaatctacagaagctaattctcagcaacaagttactgcgagtgaagaggcagctgt 

agaacaagcagttgtaacagaaaagacccctgctac 

tgttactgagacaacttatagacctgctcaac^ccagacaagtggccaagtattgagtaa 
tggaaatactgcaggggctattggctgagcagctgc^ 

agtccctcagtctacttgggaacatattattgcccgtgaatcaaatggtaatcctaatgt 

TGCTAATGCCTCAGGAGCTTCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAACAGC 
TACAGTTCAGGATCAAGTTAATTCAGCTATTAAAGCTT 

SEQ ID NO. 3009: SAG2147 FROM THE M732 GBS TYPE III STRAIN 
(REVERSE COMPLEMENT) 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAAAGTTCGCGTAGC 

CAAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGATGTAAAACAGGC 

TCCAAAACCTTCTCAGGCATCTAATGAAGCCCC^UVAATCAAGTTCTCAATCTA 

TAATTCTC^GCAACAAGTTACTGCGAGTGAAGAGGCGGCTGTAGAACAAGCAGTTGTAAC 

AGAAAATACCCCTGCTACCAGTCAGGCACAACAAACT^ 

CAAACCTGCTCAACACCAGACAAGTGGCCAAGTATT 

GGTCGGATCTGCTGCTGCAGCACAAATGGCTGCTGCAACAGGAGTCCCTCAGTCTACTTG 
GGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCTAATGCCTCAGGAGC 
TTCAGGACTTITCGAAACGATGCGAGGTTGGGGT^ 

TAATTCAGCTATTAAAGCTTATCGTGCTCAAGGTTTATCAGCTTGGGGTTA 
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Table 30: Comparative Sequences relating to SAG2147 
(protein of uknown function / lipoprotein, putative) 

SEQ ID NO. 3010 * SAG2147 FROM THE M781 GBS TYPE III STRAIN 
(REVERSE COMPLEMENT) 

GTAACCCC^GCTGATAAACCTTGAGCACGATAAGCTTTAATAGCTGAATTAACTTGATC 

CTGAACTGTAGCTGTTGAACCCCAACCTGGCATCGTTTGGAAAAGTCCTGAAGCTCCTGA 

GGCATTAGCAACATTAGGATTACGAITTGATTC^ 

CIGAGGGACTCCTGTTGCAGCAGCCATTTGTGCT 

AGTATTTCC^TTGCTCAATACTTGGCCACTTGTCT 

CTCAGTAACAGCATAAGTTTGTTGTGCCTGACTGGTAGCAGGGGT^ 

TGCTTGTTCTACAGCCGCCTCTTCACTCGCAGTAACTTGTTGCTGAGAATOAGCTTCTGT 

AGATTGAGAACTTGATTTTGGGGCTTCATTAGATGCCTGAGAA^ 

TACATCTTCTACTTTTGATTTAGATGTCGCCTTAGTCATTTTTGATTTTTTGGCTACGCG 
AACTTTATCTGCTTTTGACAAAGA 



SKQ3001 
SEQ3002 
SEQ3003 
SEQ3004 
SEQ3005 
SSQ3007 
SEQ3008 
SEQ3009 
SHQ3 010 

SEQ3001 
SEQ3002 
SEQ3003 
SEQ3004 
SEQ3005 
SEQ3 007 
SEQ3008 
SEQ3009 
SEQ3010 

SEQ3001 
SEQ3002 
SEQ3003 
SEQ30Q4 
SEQ3005 
SEQ3007 
SEQ3008 
SEQ3009 
SEQ3010 

SEQ3001 
SEQ3002 
SEQ3003 
SEQ3004 
SEQ3005 
SEQ3007 
SEQ3008 
SEQ3009 
SEQ3010 

SEQ3001 
SEQ3002 
SEQ3003 
SEQ3004 
SEQ3005 
SEQ3007 
SEQ3008 
SEQ3009 
SEQ3010 



AGGCGACATCTAAATCAAAAGTAGAAGATGTAAAACAGGCTCCAAAACCTTCTCAGGCA 



CTAATGAAGOTCCAAAATCAAGTTCTCAATCTA^^ 



CTGCGAGTGAAGAGGCAGCTGTAGAACAAGCAGTTGTA^ 



GTCAGGCACAACAAGCTTATGCTGTTACTGAGAC^ 



CAAGTGGCCAAGTATTGAGTAATGGAAATACTGCAGGGGCTATTGGC^ 
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Table 30: Comparative Sequences relating to SAG2147 
(protein of uknown function / lipoprotein, putative) 

SEQ3001 

SEQ3002 - - 

SEQ3003 

SEQ3004 

SEQ3005 CACAAATGGCTGCTGCAACAGGAGTCCCrCAGTCTACT TGGGAACATATTATTGCCCGT 

SEQ3007 

SEQ3008 - 

SEQ3009 

SEQ3010 - 

SEQ3001 * -- -- --- --- 

SEQ3002 

SEQ3003 - 

SEQ3004 

SEQ3 005 AATCAAATGGTAATCCTAATGTTGCTAATGCCTCAGGAGCTTCAGGACTTTTC 

SBQ3007 - 

SEQ3008 

SEQ3009 

SEQ3010 



SEQ3001 

SEQ3002 

SEQ3003 - 

SEQ3004 

SEQ3 005 TGCCAGGTTGGGGTTCAACAGCTAGAGTTCAGAATCAAGTTAATTCA 

SEQ3007 - - - 

SEQ3008 

SEQ3009 

SEQ3010 - — 

SEQ3 001 AAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAAAGTTCGCGTAGCCAAA 

SEQ3 002 AAAGTT CACAAGTTACTACTGAAT CTTTGTCAAAAGCAGATAAAGTTCGCGTAGCCAAA 

SEQ3003 AAAGTT CACAAGTTACTACTGAAT CTTTGT CAAAAGCAGATAAAGTTCGCGT AGCCAAA 

SEQ3 004 TAGCCAAA 

SEQ3 005 ATCGTGCTCAAGGTTTATCASAATCTTTGTCAAAAGGAGATAAAGTTCGCGTAG 

SEQ3 007 AAAGTT CACAAGTT ACTACTGAATCTTTGT CAAAAGCAGATAAAGTTC^ 

SEQ3 008 AAAGTTCACAAGTT ACTAC TGAAT CTTTGT CAAAAGCAGATAAAGTTCGCGTAGCCAAA 

SEQ3009 AAAGTTC^CAAGTTACTACTGAATCTTTGTCAAAAGCAGATAAAGTTCGCGTAGCCAA 

SEQ3010 GTAACCCCAAGCTGA TAAAC CTTGAGCACGATAAG CTTTAATAGCTGAA 

SEQ3001 AATCAAAAATGACTAAGGCGACATCTAAATCAAAAGT 

SEQ3002 AATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGATGTAAAA 

SEQ3003 AATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGATX3TA 

SEQ3 004 AATCAAAAATGATTAAGGCGACATCTAAATCAAAAGTAGAAGATGT^ 

SEQ3 005 AATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAGATGTAAAAC^ 

SEQ3 007 AATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAG^ 

SEQ3008 AATCAAAAATGACTAAGGCGACAT CTAAAT CAAAAGTAGAAGATGTAAAACAGGCTCCA 

SBQ3009 AATCAAAAATGACTAAGGCGACAT CTAAAT CAAAAGTAGAAGATGTAAAACAGGCT CCA 

SEQ3010 TAACTTGATCCnXSAACTGTAGCTGTTGA 

SEQ3001 AACCT^CTCAGGCATCTAATGAAGTCCCAAAATCAAGTTCT 

SEQ3002 AACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAGTTCTCAATCTACAGAAGCTAAT 

SEQ3003 AACCTTCTCAGGCATCTAATGAAGCC C CAAAAT CAAGTTCTCAATC TACAGAAGCTAAT 

SEQ3004 AACCTTCTCAGG(^TCTAATGAAGCCCCAAAATC^GTTCTa^TCTACAGAAGCrAAT 

SBQ3005 AACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAGTTCT 

SEQ3007 AACCTTCTCAGGCATCTAATGAAGCCCCAAAATCAAGTTCTCAATCTACAGAAGCTAAT 

SEQ3008 AACCTTCTCAGGCATOTAATGAAGCCCCAAAATCAAGTTCT 

SEQ3 009 AACCTT CTCAGGCAT CTAATGAAGCCC CAAAATCAAGTTCTCAATCTACAGAAGCTAAT 

SEQ3 010 AAGCTC CTGAGGCATT AGCAACATTAGGATTAC- CATTTGATTCACGGGCAATAAT 

SEQ3001 TCTCAGCAACAAGTTA(n^CGAGTGAAGAGGCGGCT^ 

SEQ3002 TCTCAGCAACAAGTTACTGCGAGTGAAGAGG(^ 

3EQ3 003 TCTCAGC7LA.CAAGTTACTGCGAGTGAAGAGGCAGCTGTAGAACAAGCAGTTGTAA 

SEQ3 004 TCTCAGCAACAAGTTA CTG CX^GTGAAGAGGCAGCTGTAGAACAAG(^GTTGTAACAGA 

SEQ3005 TCTCAGCAACAAGTTA CTG CGAGTGAAGAGGCAGC TGTAGAACAAGCAGTTGTAACAGA 

SEQ3007 TCT CAGCAACAAGTTACTG CGAGTGAAGAGGCGGC TGTAGAACAAGC^ 

SEQ3008 TCTCAGCAACAAGTTACTGCGAGTGAAGAGGC^ 

SEQ3009 TCTC^GCAACAAGTTACTGCGAGTGAAGAGGCGGCTGTAG 

SEQ3010 TGTT C CCAAGTAGA CTGAGGGACT CCTGTTGCAGCAGC CATTTGTGCTGCAG CAGCAGA 
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Table 30: C mparative Sequences relating to SAG2147 
(protein of uknown function / lipoprotein, putative) 

SEQ3001 - -AAATACCXCTGCTACCAGTCAGGCACAACAAACTTA 

SEQ3002 - -AAACACCCCTGCTACCAGTCAGGCACAACAAGCTTATGCTC 

SEQ3003 - -AAACACCCCTGCTACCAGTCAGGCACAACAAGCTTATGCTGTTACT 

SEQ3004 - - AAACACCCCTGC TACCAGTCAGGCA CAACAAGCTTATGCTGTTACTGAGACAACT^ 

SEQ3005 - - AAACACCCCTGCTACCAGTCAGGCACAACAAGC TTATG CTGTTACTGAGACAACTT A 

SEQ3007 --AAATACCCCTGCTACCAGTCAG43CACAACAAACTTATGCTG 

SEQ3 008 - -AAACACCCCTGOTACCAGTCAGGCACAACAAGCTTATC 

SEQ3 009 - - AAATAC CCCTGCTACCAGTCAGGCACAACAAACTTATGCTGT^ 

SEQ3010 CCGACCGCCCCTGCAGTATTTCCATTGCTCAATACTTG-GCCACTTGTCTGGTGTTGAG 

SBQ3001 AAACCTGCTCAACACCAGACAAGTGGC - CAAGTAT TGAGCAATGGAAATACTGCAGGGG 

SBQ3002 AGACCTGCTCAACACCAGACGAGTGGC - CAAGTATTGAGTAATGGAAATACTGCAGGGG 

SEQ3003 AGACCTGCTCAACACCAGACGAGTGGC - CAAGTAT TGAGTAATGGAAATACTGCAGGGG 

SEQ3 004 AGACCTGCTCAACACCAGACGAGTGGC - CAAGTATTGAGTAATGGAAATACTGCAGGGG 

SEQ3005 AGACCTGCTCAACACCAGACGAGTGGC - CAAGTATTGAGTAATGGAAATACTGCAGGGG 

SEQ3007 AAACCTGCTCAACACCAGACAAGTGGC - CAAGTATTGAGCAATGGAAATACTGCAGGGG 

SEQ3008 AGACCTGCTCAACACCAGACAAGTGGC - CAAGTATTGAGTAATGGAAATACTGCAGGGG 

SEQ3009 AAACCTGCTCAACACCAGACAAGTGGC - CAAGTATTGAGCAATGGAAATACTGCAGGGG 
SBQ3010 . AGGTTTGTAAGTTGTOTCAGTAACAGCATAAGTTTGTTGTGCCTGACTGGTAGCAGGGG 

SEQ3001 GGTCGGATCK3CTGCTGCAGCACAAATGG 

SEQ3002 TATTGGCTCAGCAGCTGCAGCACAAATGGCTGCTGCAACAG 

SEQ3003 TATTGGCTCAGCAGCTGCAGCACAAATGGCTG 

SEQ3004 TATTGGCTCAGCAGCTGCAGCACAAATGGCTGCTGCA 

SEQ3 005 TATTGGCTCAGCAGCTGCIAGCACAAATGGCTGCTGC^ 

SEQ3007 GGTCGGATCTGCTGCTGCAGCACAAATGGCTGCTGCA^ 

SEQ3008 TATTGGCTCAGCAGCTGCAGCACAAAT<3GC^ 

SEQ3 009 GGTCGGATCTGCTGCTGCAGCACAAATGGCTGCTCCAAC^ 

SEQ3 010 A-TTT- - TCTGTTACAACTGOTTGTTCTAC^GCCGCCTCTTCACTCGCAGTAACTTGTT 

SBQ3001 GGGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTTGCT 

SEQ3002 GGGAACATATTATTGC CCGTGAATCAAATGGTAAT CCTAATGTTGCTAATG CCT CAGGAG 

SEQ3 003 GGGAACATATTATTGC CCGTGAATCAAATGGTAATCCTAATGTTGCTAATGCCT CAGGAG 

SEQ3 004 GGGAACATATTATTGC CCXaTGAATOUUVTGGTAAT CCTAATGTTGCTAATGCCT CAGGAG 

SEQ3 005 GGGAACATATTATTGC CCGTGAATCAAATGGTAATCCTAATC 

SEQ3007 GGGAACATATTATTGCCCX3TGAATCAAATGGTAATCCTAATGTTGCTAATGCCT 

SEQ3 008 GGGAACATATTATTGC CCX3TGAATC!AAATGGTAATCCTAATGTTGCTAATGCCT CAGGAG 

SEQ3009 GGGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAATGTO 

SEQ3010 GCTGAGA - ATTAGCTT CTGTAGATTGAG - - -AA- - CTTGATTTTGGGGCTTCATTAGATG 

SEQ3001 CTTCAGGACTTTTCCAAAC<2^ 

SEQ3 002 CITCAGGACTTTTCCAAACGATGCCAGGTTGGG 

SEQ3 003 CTTCAGGACTTTTCCAAACGATGCCAGG 

SEQ3004 CTTCAGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAACAGCTAC^ 

SEQ3005 CTTCAGGACTTTTCCAAACGATGCCAGGTTGGGGTT 

SEQ3 007 CTTCAGGACTrTTCCAAACGATGCCAGGTTGGGGTTCA^ 

SEQ3 008 CTTCAGGACTTTTCCAAACGATGCCAGG 

SEQ300 9 <2TTC!AGGACTTTTCCAAACGATGCCAGGTTGGGGTTCAAC^ 

SEQ3010 CCTGAGAAGGTTTT GGAGCCTGTTTTACATCTTCTACTTTTGATTTAGATGTCGC 

SEQ3 001 TAATTCAGCTATTAAAGCTTATCGTGCTCAAGGTTTATCAGCT - - 

SEQ3002 TAATTCAGCTATTAAAGCTTATCGTGCTCA^ - 

SEQ3 003 TAATTCAGCTATTAAAGCTTATCGTGCTCAAGGTTTATC^ - - 

SEQ3004 - - 

SEQ3 005 TAATTCAGCTATTAAAGCTTATCGTGCTCAAGGTTTATCAGCTTGGGGTTAC — 

SEQ3007 TAATTCAGCTATTAAAGCTTATCGTGCTCAAGGTTTATCAGC^ 

SEQ3008 TAATTCAGCTATTAAAGCTT 

SEQ3 010 TTAGTCA-TTTTTGATTTTTTGGCTArc^ 
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Table 30: Comparative Sequences relating to SAG2147 
(protein of ukn wn function / lipoprotein, putative) 

>SEQ ID NO 3050 1 25_1169NT frame t 1 

KSSQVTTESLSKADKVRVAXKSKMTKATSKSK^ 

S QQQVTAS EEAAVE QAVVTENT PATSQAQQTYAVTETTYKPAQHQTS GQVL SNGNTAGAV 
GSAAAAQMAAATGVPQSTWEHI IARESNGNPNVANASG ASGL F QTMPGWGS TATVQDQVN 
SAIKAYRAQGLSAWGY 

>SEQ ID NO 3051:25_18RS21 frame: 1 

KSSQVTTE SLS KADKVRVAKKS KMTKATSKS KVEDVKQAPKPS QASNEAPKSSSQS TEAN 
SQQ QVTAS E EAAVE QAWTENTPATS QAQQA YAVTETTYRPAQHQTS GQVLSNGNTAGAI 
GSAAAAQMAAATGVPQSTWEHI IARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVN 
SAIKAYRAQGLSAWGY 

>SEQ ID NO 3 052:25_2603 frame: 1 

KSSQVTTESLS KADKVRVAKKS KMTKATSKS KVEDVKQAP KPSQASNEAPKS SSQSTEAN 
SQQ QVTAS EEAAVEQA WTENT PATS QAQQA YAVTETTYRPAQHQTS GQVIiSNGNTAGA I 
GSAAAAQMAAATGVPQSTWEHI IARESNGNPNVANASGAS GLF QTMPGWGS TATVQDQVN 
SAIKAYRAQGLSAWGY 

>SEQ ID NO 3053:25_090 frame: 3 

AKKS KM I KATS KS KVEDVKQAP KP SQASNEAPKS SSQS TEANS QQQVTAS EEAAVEQAW 
TENTPATSQAQQAYAVTETTYRPAQHQTSGQVLSNGINTAGAIGSAAAAQMAAATGVPQST 
WEHI IARE SNGNPNVANAS GAS GLFQTMPGWGSTATVQ 

>SEQ ID NO 3054:25_A909 frame: 1 

KAT S KS KVEDVKQAP KPSQASNEAPKS S SQSTEANS QQQVTAS EEAAVEQAWTENTPAT 
SQAQQA YAVTETTYRPAQHQTS GQVLSNGNTAGA I GS AAAAQMAAATGVPQ S TWEH I IAR 
ESNGNPNVANASGAS GL FQTMPGWGS TATVQNQVNSAI KAYRAQGLS ■ 

>SEQ ID NO 3055:25_CJB110 frame: 3 

S L S KADKVRVAKKS KMTKATSKS KVEDVKQ AP KP S QAS NEAPKS S SQS TEANSQQQVTAS 
EEAAVE QAVVTENTPATS QAQ^A YAVTETTYRPAQHQTS GQVL SNGNTAGAI GSAAAAQM 
AAATGVPQSTWEHI IARESNGNPNVANASGASGLFQT MPGWGSTATVQDQVNSAIKAYRA 
QGLSAWGY 

>SEQt ID NO 3056:25_COH1 frame: 1 

KSSQVTTESLS KADKVRVAKKS KMTKATSKS KVEDVKQAP 

SQQQVT AS EEAAVE QAVVTENTPATSQAQXJTYAVT ETTYKPAQHQT SGQVLSNGNTAGAV 
GSAAAAQMAAATGVPQSTWEHIIARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVN 
SAIKAYRAQGLSAWGY 

>SEQ ID NO 3057:25_H36B frame: 1 

KS S QVT TE SLS KADKVRVAKKS KMTKATS KS KVEDVKQAPKPS QASNEAPKS S S QS TEAN 
S QQQVTAS E EAAVEQAVVTENTPATSQ AQ^A YAVT ETT YRP AQHQTS GQVL SNGNTAGAI 
GSAAAAQMAAATGVPQSTWEHI IARESNGNPNVANAS GAS GLFQTMPGWGSTATVQDQVN 
SAIKA 

>SEQ ID NO 3058:25_H732 frame: 1 

KSSO^TESI^KJUJKVRVAKKS KMTKATSKS KVEDVKQAPKPSQASNEAPKS SSQSTEAN 
SQQQVT AS EEAAVEQAWTENTPATS QAQQTYAVTETTYKPAQHQTSGQVLSNGNTAGAV 
GS AAAAQMAAATGVPQ STWEHI IARESNGNPNVANAS GAS GL FQTMPGWGS TATVQDQVN 
SAI KAYRAQGLS AW G 

>SEQ ID NO 3059:25_M781 frame: 4 

SLS KAD KVRVAKKS KMTKATS KS KVEDVKQAP KPS QAS NEAPKS SSQS TEANS QQQVTAS 
EEAAVEQA WT ENT P ATS Q AQQTYAVTETTYKPAQ HQTS GQVL SNGNTAGAVGS AAAAQ M 
AAATGVPQSTWEHI IARESNGNPNVANAS GASGLFQTMPGWGSTATVQDQVNSAIKAYRA 
QGLSAWGY 



SEQ3050 SSQVTTESLSKJUDKVRVAKXS KMTKATS KSKVEDVKQAPK^ 

SEQ3 051 SSQVTTESLSKADKVRVAKKS KMTKATSKS KVEDVKQAPKPSQASNEAPKS 

SBQ3052 SSQVTTESLS KADKVRVAKKS KMTKATSKS KVEDVKQAP K^ 

SEQ3053 AKKSKMIKATSKSKVEDVKQAPKPSQASNEAPKS SSQSTEAN 

SEQ3 054 - KATS KSKVEDVKQAPKPSQASNEAPKS SSQSTEAN 

SEQ3 055 SLSKADKVRVAKKSKOTKATSKSKVEDVKQ^PKPSQASNEAPK^ 

SEQ3 05 6 SSQVTTESLSKADKVRVAKKSKOTKATSKSKVEDVKQAPKPSQASNE^ 

SEQ3 057 SSQVTTESLS KAD KVRVAKKS KMTKATSKS KVEDVKQ 

SEQ3058 SSQVTTESLSKADKVRVAKKS KMTKATSKS KVEDVKQAPKPSQASNEAPKSSSQS 

SEQ3 059 SLSKADKVRVAK3CS KMTKATSKS KVEDVKQJ^ 
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SEQ3050 
SEQ3051 
SEQ3052 
SEQ3053 
SEQ3054 
SEQ3055 
SEQ3056 
SEQ3057 
SEQ3058 
SEQ3059 

SEQ3050 
SEQ3051 
SEQ3052 
SEQ3053 
SEQ3054 
SEQ3055 
SEQ3056 
SEQ3057 
SEQ3058 
SEQ3059 

SEQ3050 
SEQ3051 
SEQ3052 
SEQ3053 
SEQ3054 
SEQ3055 
SEQ3056 
SEQ3057 
SEQ3058 
SEQ3059 



Table 30: Comparative Sequences relating to SAG2147 
(protein of uknown function / lipoprotein, putative) 

SQQQVTAS EEAAVEQAWTENT PATSQAQQTYAVTETT YKPAQHQT S GQVL SNGNTAGAV 
S QQQVTAS EEAAVEQAWTENT PAT SQAQQAYAVTETT YRPAQHQT SGQVLSNGNTAGAI 
S QQQVTAS EEAAVEQAWTENT PATSQAQQ AYAVTETTYRPAQHQTSGQVLSNGNTAGA I 
S QQQVTAS EEAAVEQAWTENT PATS Q AQQAYAVTETTYRPAQHQTSGQVLSNGNT AGA I 
S QQQVTAS EEAAVEQAWTENTPATS QAQQ AYAVTETT YRPAQHQTS GQVLtSNGNTAGAI 
SQQQVTAS EEAAVEQAWTENTPATS QAQQAYAVTETT YRPAQHQT S GQVL SNGNTAGAI 
SQQQVTAS EEAAVEQAWTENT PATS QAQQTYAVTETT YKPAQHQTS GQVL SNGNTAGAV 
SQQQ^ASEEAAVEQAWTENTPATSQAQQAYAVTETTYRPAQHQTSGQVLSNGNTAGAI 
S QQQVTAS EEAAVEQAWTENTPATSQAQQTYAVTETT YKPAQHQTSGQVLSNGNTAGAV 
S QQQVTAS EEAAVEQ AWT ENT PATS Q AQQTYAVTETTYKPAQHQTSGQ VLSNGNTAGAV 

GSAAAAQMAAATGVPQSTWEHIIARESNGNPNVANASGASGLFQTMPGWGSTATVQDQW 
GSAAAAQMAAATGVPQSTWEHI IARESNGNPNVANASGAS GLFQTMPGWGSTATVQDQVN 
GSAAAAQMAAATGVPQSTWEHI IARESNGNPNVANASGAS GLFQTMPGWGSTATVQDQVN 

GSAAAAQMAAATGVPQSTWEHI IARESNGNPNVANAS GAS GLFQTMPGWGSTATVQ 

GSAAAAQMAAATGVPQSTWEHI IARESNGNPNVANASGASGLFQ/TMPGWGSTATVQNQVN 
GSAAAAQMAAATGVPQSTWEHI IARESNGNPNVANASGAS GLFQTMPGWGSTATVQDQVN 
GSAAAAQMAAATGVPQSTWEHI IARESNGNPNVANAS GAS GLFQTMPGWGSTATVQDQVN 
GSAAAAQMAAATGVPQSTWEHI IARESNGNPNVANASGAS GLFQTMPGWGSTATVQDQVN 
GSAAAAQMAAATGVPQSTWEHI IARESNGNPNVANASGAS GLFQTMPGWGSTATVQDQVN 
GSAAAAQMAAATGVPQSTWEHI I ARESNGNPNVANASGASGLFQTMPGWGS TATVQDQVN 

AIKAYRAQGLSAWGY 
AI KAYRAQGLS AWGY 
AIKAYRAQGLSAWGY 

AI KAYRAQGLS 

AIKAYRAQGLSAWGY 
AIKAYRAQGLSAWGY 

AIKA 

AI KAYRAQGLS AWG - 
AIKAYRAQGLSAWGY 
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Table 31: Comparative Sequences relating to SAG2148 
(LysM domain protein) 

SEQ ID NO. 3101: SAG2148 FROM THE 1169NT1 GBS TYPE V STRAIN 

GCATCTOATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCT 

TCTCTGAATAGTATCAGTAACGCTGATGTCATCAGTATAGGTGATGT^ 

GCAGAAGCAAAATCTCAACCAACAATTGAAAATTCAATGAATTCTT 

AAAGAAGAAATAGCTCGTCGTGAATCA^TGGTAGTTATACTGCACAGAATGGACAATATTATGGAAGATAT 

TCTCAATCTTACCTAAATGGCGACTTATCTCCTGAAAATC^GAAAAAGTAGCGGACAA 

GGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACGGCTGGTAT 

SEQ ID NO. 3102: SAG2148 FROM THE 18RS21 GBS TYPE II STRAIN 

GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACT 

TCTCTCAATAGTATCAGTAACGCTGATGTCATCAGTATAGGTGATGTTTTAAAATTGGATAATTCTACAGCTAG^ 
GCAGAAGCAAAATCTCAACCAACAATTGAAAATTCAAT^^ 

AAAGAA-GAAATAGCTCGTCGTGAATCAAATGGTAGTTATACTGCACAGAATGGACAATATTATG^ 

TCTCAATCTTACCTAAATGGCGACTTATCTCCTGAAAATCAAGAAAAAGTAGCGGACAATTATGTGGTTTCT 

GGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACGGCTGGTAT 

SEQ ID NO. 3103s SAG2148 FROM THE 2603 V/R GBS TYPE V STRAIN 

GCATCTTATACCGTGAAATGAGGTGATACCTTATC^GCTATTGCT^ 

TCTCTCAATAGTATCAGTAACGCTGATGTCATCAGTATAGGTGATGTTTTAAAATrGGATA 
GCAGAAGCAAAATCTCAACCAACAATTGAAAATTCAATGAAOT 

AAAGAAGAAATAGCTCGTCGTGAATCAAATGGTAGTTATACTGCAC^GAATGGACAATATTATG 

TCTCAATCn^ACCTAAATGGCGACTTATCTCCTGAAAATCAAGAAAAAG 

GGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACGGCTGGTAT 

SEQ ID NO. 3104: SAG2148 FROM THE 090 GBS TYPE la STRAIN 
GCATCTTATACCGTGAZ^TCAGGTGATACCTTATCAGCTA 

TCTCTCAATAGTATCAGTAACGCTGATGTCATCAGTATAGGTGATGTTTTAAAATTGGATAATTCT 

GCAGAAGCAAAATCTCAACCAACAATTGAAAATTCAATGAACT 

AAAGAAGAAATAGCTCGTCGTGAATCAAATGGTAGTTATACTGCACAGAA 

TCTCAATCITACCTAAATGGCGACTTATCTCCTGAAAATCAAGAAAAAGTA 

GGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACGGCTGGTAT 

SEQ ID NO. 3105: SAG2148 FROM THE A909 GBS TYPE la STRAIN 

GCATCTTATACCGTGAAATCAGGTGATACCTTATGAGCT 

TCTCTCAATAGTATGAGTAACGCTGATGT<^TCAGTATAGGTGATGCT 

GCAGAAGCAAAATCTCAACCAACAATTGAAAATTCAATGAATTCTTC^ 

AAAGAAGAAATAGCTCGTCGTGAATCAAATGGTAGTTATACTGCACAG 

TCTraATCTTACCTAAATGGCGACTTATCTCCTGAAAATC^ 

GGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACGGCTGGTAT 

SEQ ID NO. 3106: SAG2148 FROM THE CJB110 GBS NONTYPEABLE STRAIN 

GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTC 

TCTCTCAATAGTATCAGTAACGCTGATGTCATCA^ 

GCAGAAGCAAAATCTCAACCAACAATTGAAAATTCAATC 

AAAGAAGAAATAGCTCGTCGTGAATCAAATGGTAGTTATACTGCACAGAATGGACAATAT^ 
TCTCAATCTTACCTAAATGGCGACTTATCTCCTGAAAATCAAGAAAAAGTAGCGGACAAT^ 
GGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACGGCTGGTAT 

SEQ ID NO. 3107: SAG2148 FROM THE COH1 GBS TYPE III STRAIN 
GCATCTTATACCGTGAAATCAGGTGATACCITATC^G 

TCTCTCAATAGTATCAGTAACGCTGATGTCATCAGTATAGGTGATGTTTTAAAATTGGATAAOT 
GCAGAAGCAAAATCTGAACCAACAATTGAAAATTCAA 

AAAGAAGAAATAGCTCGTCGTCAATCAAATGGTAGTTATACTGCACAGAATG^ 

TCTGAATCTTACCTAAATGGCGACTTATCTCCTGAA 

GGATCTTGGTCGGCAGCX3CTATCATTTTGGAATAGTAACGGCTGGTAT 
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Table 31: Comparative Sequences relating to SAG2148 
(LysM domain protein) 

SEQ ZD NO. 3108s SAG2148 PROM THE H36b GBS TYPE lb STRAIN 
(REVERSE COMPLEMENT) 
GCATCTTATACCGTGAAATGAGGTGATACCTT^ 
TCTCTCAATAGTATCAGTAACGCTGATGTCATCAGTATAGGTGATG 
GCAGAAGCAAAA.TCTCAACCAACAATTGAAAATTCAATGAATTCTT 
AAAGAAGAAATAGCTCGTCGTGAATCAAATGGTAGTTATACTGCACAGAATGGACAA 
TCTCAATCTTACCTAAATGGCGACTTATCTCCTGAAAATCAAGAAAAAGTAGCGGACAATTATGTGGC^ 
GGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACGGCTGGTAT 

SEQ ID NO, 3109s SAG2148 FROM THE JM9130013 GBS TYPE VTII STRAIN 
(REVERSE COMPLEMENT) 

GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACTACGGTACAAGAGTTAGTG 

TCTCTCAATAGTATCAGTAACGCTGACGTCATC^GTATAGGTGATGTTTTAAAATTGGATAATTCra 

GCAGAAGCAAAATCTCAACCAACAATTGAAAATTCAATGAATTCTTCATC 

AAAGAAGAAATAGCTCGTCGTGAATCAAATGGTAGTTATACTGCACAGAATGGACAATATTATGG 

TCTCAATCTTACCTAAATGGCGACTTATCTCCTXxAAAAT 

GGATCTTGGTCGGC^GCGCTATCATTTTGGAATAGTAACGGCTGGTAT 

SEQ ID NO. 3110: SAG2148 FROM THE M732 GBS TYPE III STRAIN 

GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCT^ 

TCTCTCAATAGTATCAGTAACGCTGATGTCATCAGTATAGGTG 

GGAGAA<X^AAAATCTCAACCAACAATTGAAAATTCAATC 

AAAGAAGAAATAGCTCGTCGTGAATCAAATGGTAGTTATACTGCACAGAATC 

TCTO^TCTTACCTAAATGGCGACTTATCTCCTGAAAATCAAGAAAAAGTAGCGGA 

GGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACGGCTGGTAT 

SEQ ID NO. 3111: SAG2148 FROM THE M781 GBS TYPE III STRAIN 
(REVERSE COMPLEMENT) 

GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTAT 

TCTCTCAATAGTATCAGTAACGCTGATCTCATCAGTATAG^ 

GCAGAAGCAAAATCTCAACCAACAATTGAAAATTCAATGAATTCTTC^ 

AAAGAAGAAATAGCTOTTCGTGAATCAAATGGTAGTTAT^ 

TCTCAATCTTACCTAAATXXSCGACTTATCTCCTGAAAATCAAGA^ 

GGATCTTGGTCGGCAGCGCTATCATTTTGGAATAGTAACGGCTGGTAT 

SEQ310I G CATCT TATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACT 

SEQ3102 GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAAT 
SEQ3103 GCATCTTATACCXSTGAAATCAGGTGATACCTTATGAGCT^ 

SEQ3 104 GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACT 
SEQ3X05 GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAA^ 
SBQ3 10 6 GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACT 
SEQ3 107 GCATCTTATACC^TGAAATCAGGTGATACCITATC^GCTArrcCTAAAAAT(^TAAAACT 
SEQ3 108 GCATCTTATACCX^TGAAATCAGGTGATACCTTATCA^ 

SEQ3 10 9 GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATC^ 

SEQ 3 110 GCATCTTATACCGTGAAATCAGGTGATACCTTATCAGCTATTGCTAAAAATCATAAAACT 

SEQ3 111 GCATCTTATACOSTGAAATCAGGTGATACCTrATCA^ 

SEQ3 101 ACGGTACAAGAGTTAGTGT CTCTCAATAGTATCAGTAACXJCT^^ 

SEQ3 102 ACGGTACAAGAGTTAGTGTCTCTCAATAGTATCAGTAACGCTGA 

SEQ3103 ACGGTACAAGAGTTAGTGTOTCTCAATAGTATC^GTAACGCTGATGTCATC^GTATAGGT 

SEQ3 104 ACGGTACAAGAGTTAGTGT CTCTGAATAGTAT CAGTAACGCTGATGTCATCAGTATAGGT 

SEQ3 105 ACGGTACAAGAGTTAGTGT CTCTCAATAGTAT CAGTAACGCTGATGTCATCAGTATAGGT 

SEQ3 106 ACGGTACAAGAGTTAGTGTCTCTCAATAGTATCAGTAACXSCTGATGTCATC^ 

SEQ3107 ACGGTACAATAGTTAGTGTCTCTCAATAGTATCAGTAACGCTGATC 

SEQ3 108 ACGGTACAAGAGTTAGTGTCTCTCAATAGTATCAGTAACXXrrGATGT 

SEQ3 109 ACX^TACAAGAGTTAGTGT CTCT CAATAGTATCAGTAACG CTGACGTCATCAGTAT AGGT 

SEQ3110 ACGGTACAATAGTTAGTGTCTCrOATAGTATCAGTAACGCTGATC 

SEQ3 111 ACGGTACAATAGTTAGTGTCTCTCAATAGTATCAGTAACGCT<^TGTCA 
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Table 31: Comparative Sequences relating to SAG2148 
(LysM domain protein) 



SEQ3X01 
SEQ3102 
SEQ3X03 
SEQ3X04 
SEQ3105 
SEQ3106 
SEQ3107 
SEQ3108 
SEQ3109 
SEQ3110 
SEQ3111 

SEQ3101 
SEQ3102 
SEQ3X03 
SEQ3104 
SEQ3105 
SEQ3106 
SEQ3107 
SEQ3108 
SEQ3X09 
SEQ3XX0 
SEQ3XXX 

SEQ3X0X 
SEQ3102 
SEQ3103 
SEQ3X04 
SEQ3105 
SEQ3106 
SEQ3X07 
SEQ3108 
SEQ3109 
SEQ3110 
SEQ3111 

SEQ3101 
SEQ3102 
SEQ3103 
SBQ3X04 
SEQ3105 
SEQ3X06 
SEQ3107 
SEQ3108 
SEQ3X09 
SEQ3110 
SEQ31X1 

SBQ3101 
SEQ3102 
SBQ3103 
SEQ3104 
SEQ3105 
SEQ3106 
SEQ3107 
SEQ3108 
SEQ3X09 
SBQ3XX0 
SEQ311X 



GATGTTTTAAAATTGGATAATTCTACAGCTAGTCAAGC^ 

GATGTTTTAAAATTGGATAATT CTACAGCTAGTCAAGCAGAAGCAAAATCTCAACCAACA 
GATGTTTTAAAATTGGATAATTCITACAGCTAGTCAAGCA 
GATGTTTTAAAATTGGATAATTCTAAAGCTAGTC!AAGCAGAAGCA 
GATGTTTTAAAATTGGATAATTCTACAGCTAGTCAAGCAGAAGCAAA^ 
GATGTTTTAAAATTGGATAATTCTAAAG CTAGTCAAGCAGAAGCAAAATCTCAACCAACA 
GATGTTTTAAAATTGGATAATTCTACAGCTAGTCAAGCAGAAG CAAAATCT CAACCAACA 
GATGTT TTAAAATTGGATAATTCTAC^GCTAGTCAAGCAGAAG CAAAATCT CAACCAACA 
GATGTTTTAAAATTGGATAATTCTACAACTAGTCAAGCAGAAGOUVAATCT 
GATGTTTTAAAATTGGATAATTCTACAG CTAGTCAAGCAGAAGCAAAATCTCAACCAACA 
GATGTTTTAAAATTGGATAATTCTACAGCTAGTCAAGCAGAAGCAAAATCTCA 

ATTG&AAATTCAATGAATTCTTCATCAAAT^ 

ATTGAAAATTCAATGAATTCTTCATCAAATTTGAGTTCAAGTGATTCAGCCGCAA 
ATTGAAAATTCAATGAATTCTTCATC^UUVTTTGAGTT^ 
ATTGAAAATTCAATGAATTCTTCATCAAATTTGAGTT^ 
ATTGAAAATTCAATGAATT CTTCATCAAATTTGAGTTCAAGTGA 

ATTGAAAATTCAATGAATT CTTCATCAAATTTGAGTTCAAGTGATT CAG CCGCAAAAGAA 

ATTGAAAATTCAATGAATTCTTCATCAAATTTGAGTTCAAGTGATTCA 

ATTGAAAATTCAATGAATTCTTCATCAAATTTGAGTT 

ATTGAAAATTCAATGAATTCTTCATCAAATTTGAGTTCAAG^ 

ATTGAAAATTCAATGAATTCTTCATCAAATTTGAGTTCAAGTGATTCAGCTG 

ATTGAAAATTCAATGAATT CTTCATCAAATTTGAGTTCAAG^ 

GAAATAGCTCGTCTCTGAATCAAATGGTAGTTATACTGCA 
GAAATAGCTCGTC^GTGAATCAAATGGTAGTTATACTGCACAG 

GAAATAGCTCGTCGTGAATCAAATGGTAGTTATACTGCACAGAATGGACAATATTA 
GAAATAGCTCGTOSTGAATCAAATGGTAGTTATACTGC^CAGAATGGACAATAT 
GAAATAGCTCGTCCTGJATOVAATGGTAGTTATACTGCACA 
GAAATAGCTCGTCGTGAATCAAATGGTAGTTATACTGCACAGAATGGACAA 
GAAATAGCT CX3TCGTGAATCAAATGGTAGTTATACT 

GAAATAGCTCGTCGTGAATCAAATGGTAGTTATACTGCACAGAATGGACAATATTATGGA 

GAAATAGCTCGTCGTGLAATCAAATGGTAGTTATACTGCACAGAATG^ 

GAAATAGCT TCTCX3TGAATCAAATGGTAGTTATACTGCACAGAATGGAC^ TATGGA 

GAAATAGCTCGTCGTGAAT CAAATGGTAGT TATACTGCACAGAATGGACAATAT TATGGA 

AGATATCAACTGTCTCAATCTTACCn'AAATGGCGACTTA^ 

AGATATCAACTGTCTCAATCTTACCTAAATGGCX^CTTATCTCCTGAAAATCAAGAAAAA 
AGATATCAACTG?TCTCAATCTTACCTAAATGGCGACT^ 

AGATAT CAACTGTCTCAAT CTTAC CTAAATGGCGACTTATCTCCTGAAAATCAAGAAAAA 
AGATAT CAACTGTCTCAATCTTACCTAAATGGCGACTTATCTCC^ 
AGATAT CAACTGTCTCAATCTTACCTAAATGGCX^CT^ 

AGATATCAA CTGTCTCAATCTTAC CTAAATGGCGACTTATCTCCTGAAAATCAAGAAAAA 
AGATAT CAACTGTCTCAAT CTTACCTAAATGGCGA CTTATCTCCTGAAAATCAAGAAAAA 
AGATAT CAACTGTCTCAAT CTTACCTAAATGGCGACTTAT CTCCTGAAAATCAAGAAAAA 
AGATAT CAACTGTCTCAATCTTAC CTAAATGG CGACTTAT CTC CTGAAAATCAAGAAAAA 
AGATAT CIAACTGTCTCAATCTTAC CTAAATGGCGACTTAT CTC 

GTAGCX3GACAATTATGTGGCTTCTCX3TTACGGATCT^ 
GTAGCX3GAC!AATTATGTGGTTTCTCGTTACGGATCTTG^ 
GTAGCGGAG^TTATGTGGTTTCTCGTTACGGATCTT^ 
GTAGCGGACAATTATGTGGTTTCTTOTTACGGATCTTGOT 

GTAGCGGA CAATTATGTGG CTTCT CGT TACGGAT (2TTGGT CGGCAGCGCTATCATTTTGG 
GTAGCXSGACAATTATGTG^TTTCTCGT TACGGATCTTGGT CGGCAGCGCTATCATrri'GG 
GTAG CGGACAATTATGTGG CTTCT CGTTACGGATC TTGGT CGGCAGCGCTATCATTTTGG 
GTAGCTGGACAATTATGTGGCTTCT CGT TACGGATCTTGGT CX3GC&GCX5CTAT CATT TTGG 
GTAGCGGACAATTATGTGG CTTCTCGTTACGGATCTTGGTCGGCAGC^ 
GTAGCGGA CAATTATGTG^CTTCTCXSTTACGGATCTTGGTC^ 
GTAGCX3GACAATTATCTGGCTTCITCGTTA(3GG^ 
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Table 31: Comparative Sequences relating to SAG2148 
(LysM domain protein) 



SEQ3101 
SEQ3102 
SEQ3103 
SEQ3104 
SEQ3105 
SBQ3106 
SEQ3107 
SEQ3108 
SEQ3109 
SEQ3110 
SEQ3111 



AATAGTAACGG CTGGTAT 
AATAGTAACGGCTGGTAT 
AATAGTAACGGCTGGTAT 
AATAGTAACGGCTGGTAT 
AATAGTAACGGCTGGTAT 
AATAGTAACGGCTGGTAT 
AATAGTAACGGCTGGTAT 
AATAGTAACGGCTGGTAT 
AATAGTAACGGCTGGTAT 
AATAGTAACGGCTGGTAT 
AATAGTAACGGCTGGTAT 



>SBQ ID NO 3150:15_1169NT frame: 1 

ASYTVKSGimjSAIAKNHKTTVQELVSLNSISNADVISIGDVLKLDNSTASQAEAKSQPT 
IENSMNS SSNLS SSDS AAKEEI ARRESNGS YTAQNGQYYGRYQLSQS YIjNGDLS PENQEK 
VADNYVAS R YGSWSAALS FWNSNGWY 

>SEQ ID NO 3151:15_18RS21 frames 1 

AS YTVKSGDTLSAI AKNHKTTVQELVSLNS I SNADVI S I GDVLKLDNSTASQAEAKSQPT . 
I ENSMNSS SNLS S S DSAAKEE I ARRESNGS YTAQNGQYYGR YQLSQ S YLNGDLS PENQEK 
VADNYWS RYGSWSAALS FWNSNGWY 

>SEQ ID NO 3152:15 2603 frame i 1 

ASYlVKSGDTLSAIAKNHKTTVQELVSIiNS I SNADVIS I GDVLKLDNSTASQAEAKSQPT 
I ENSMNSS SNLS SSDSAAKEEI ARRESNGS YTAQNGQYYGRYQLSQSYLNGDLS PENQEK 
VADNYWSRYGSWSAALS FWNSNGWY 

>SEQ ID NO 3153tl5_090 frame: 1 

AS YTVKSGDTLSAI AKNHKTTVQELVS LNS I SNADVI S IGDVLKLDNS KAS QAEAKSQPT 
IENSMNSS SNLS SSDSAAKEEIARRESNGS YTAQNGQYYGRYQLSQS YIjNGDLS PENQEK 
VADNYWS RYGSWSAALS FWNSNGWY 

>SEQ ID NO 3154*15_A909 frame: 1 

AS YTVKSGDTLSAI AKNHKTTVQELVSLNS I SNADVI S I GDVLKLDNSTASQAEAKSQPT 
I ENSMNSSSNLS SSDSAAKEEI ARRESNGS YTAQNGQYYGRYQLSQSYLNGDLS PENQEK 
VADNYVASRYGSWS AALS FWNSNGWY 

>SBQ ID NO 3155:15_CJB110 frame: 1 

AS YTVKSGDTLSAI AKNHKTTVQELVS LNS I SNADVI SI GDVLKLDNS KAS QAEAKSQPT 
IENSMNSS SNLS SSDSAAKEEIARRESNGS YTAQNGQYYGRYQLSQSYLNGDLS PENQEK 
VADNYWSRYGSWSAALSFWNSNGWY 

>SEQ ID NO 3156:15_C0H1 frame: 1 

AS YTVKS GDTLS AIAKNHKTTVQ .LVSLNS I SNADVI SI GDVLKLDNSTASQAEAKSQPT 
IENSMNSSSNLSSSDSAAKEEIARRESNGSYTAQNGQYYGRYQLSQSYLNGDLSPENQEK 
VADNYVAS RYGSWSAALS FWNSNGWY 

>SEQ ID NO 3157:15JS36B frame: 1 

AS YTVKSGDTLSAIAKNffiCTTVQELVSLNS I SNADVI S IGDVLKLDNSTASQAEAKSQPT 
IENSMNSS SNLSS SDSAAKEEI ARRESNGS YTAQNGQYYGRYQLSQS YLNGDLS PENQE K 
VADNYVAS RYGSWSAALS FWNSNGWY 

>SEQ ID NO 3158tl5_JM9130013 frame: 1 

ASYTVKSGDTLSAIAKNHKTTVQELVSI^S I SNADVI SIGDVLKLDNSTTSQAEAKSQPT 
I ENSMNSS SNLSS SDSAAKEEIARRESNGS YTAQNGQYYGRYQLSQS YLNGDLS PENQEK 
VADNYVASRYGSWSAALS FWNSNGWY 

>SEQ ID NO 3159:15_M732 frame: 1 

AS YTVKSGDTLSAI AKNHKTTVQ . LVSLNS I SNADVIS IGDVLKLDNSTASQAEAKSQPT 
I ENSMNS S SNLS S SDSAAKEEIARRESNGS YTAQNGQYYGRYQLSQS YLNGDLS PENQEK 
VADNYVASRYGSWSAALSFWNSNGWY 

>SEQ ID NO 3160tl5_M781 frame: 1 

AS YTVKS GDTL SAIAKNHKTTVQ . LVSLNS I SNADVIS IGDVLKLDNSTASQAEAKSQPT 
I ENSMNS SSNL S SSDS AAKEE I ARRESNGS YTAQNGQYYGRYQLSQS YLNGDLS PENQEK 
VADNYVAS RYGSWSAALS FWNSNGWY 



661 



WO 2004/018646 PCT/US2003/026827 



Table 31: Comparative Sequences relating to SAG2148 
(LysM domain protein) 



SEQ3150 
SEQ3151 
SEQ3152 
SEQ3153 
SEQ3154 
SEQ3155 
SEQ3156 
SEQ3157 
SEQ3158 
SEQ3159 
SEQ3160 

SEQ3150 
SEQ3151 
SEQ3152 
SEQ3153 
SEQ3154 
SEQ31S5 
SEQ3156 
SEQ3157 
SEQ3158 
SEQ3159 
SEQ3160 

SEQ3150 
SEQ3151 
SEQ3152 
SEQ3153 
SEQ3154 
SEQ3155 
SEQ3156 
SEQ3157 
SEQ3158 
SEQ3159 
SEQ3160 



AS YTVKSGDTLSAIAKNHKTTVQELVSLNS I SNADVI S I GDVLKLDNSTAS QAEAKSQPT 
AS YTV1CSGDTLSAIAKNHKTTVQELVSLNS I SNADVI S I GDVLKLDNSTAS QAEAKSQPT 
AS YTVKS GDTIj S A I AKNHKTTVQELVSLNS I SNADV I S I GDVL KLDNS TAS QAEAKSQ PT 
AS YTVKSGDTLSAIAKNHKTTVQELVSLNS I SNADVI S I GDVLKLDNSKAS QAEAKSQPT , 
ASYTVKSGDTLSAIAKNHKTTVQELVSI^S ISNADVIS IGDVLKLDN^ 
AS YTVKSGDTL SAIAKNHKTTVQELVSLNS I SNADVI S IGDVL KLDNS KAS QAEAKSQPT 
AS YTVKS GDTL S AIAKNHKTTVQ - LVS LNS I SNADVI SI GDVLKLDNSTAS QAEAKSQPT 
AS YTVKSGDTLSAIAKNHKTTV QELVSLNS I SNADVI S I GDVLKLDNSTAS QAEAKSQPT 
AS YTVKSGDTLS AIAKNHKTTVQELVS LNS I SNADVI S IGDVLKLDNSTTSQAEAKSQPT 
AS YTVKS GDTLSAIAKNHKTTVQ - LVS LNS I SNADVI SIGDVLKLDNS TAS QAEAKSQPT 
AS YTVKS GDTLSAIAKNHKTTVQ - LVSLNS I SNADVIS IGDVLKLDNSTASQAEAKSQPT 

IENS^SSSNLSSSDSAAKEEIARRESNGSYTAQNGQYYGRYQLSQSYLNGDLSPENQEK 
IENSMNSSSNLSSSDSAAKEEIARRESNGSYTAQNGQYYGRYQLSQSYLNGDLSPENQEK 
IENSMNSSSNLSSSDSAAKEEIARRESNGSYTAQNGQYYGRYQLSQSYLNGDLSPENQEK 
IENSMNS SSNLS SSDSAAKEEI ARRESNGS YTAQNGQYYGRYQLSQ S YLNGDLS PENQEK 
I ENSMNS S SNLS S S DS AAKEEI ARRESNGS YT AQNGQ YYGRYQLSQ S YLNGDLS PENQEK 
IENSMNSSSNLSSSDSAAKEEIARRESNGSYTAQNGQYYGRYQLSQSYLNGDLSPENQEK 
IENSMNS SSNLS SSDSAAKEEIARRESNGSYTAQNGQYYGRYQLSQS YLNGDLS PENQEK 
IENSMNSSSNLSSSDSAAKEEIARRESNGSYTAQNGQYYGRYQLSQSYLNGDLSPENQEK 
I ENSMNS SSNLS S SDSAAKE EIARRESNGSYT AQNGQ YYGRYQLS QS YLNGDLSPENQEK 
IENSMNS SSNLSS SDS AAKEEI ARRESNGS YTAQNGQYYGRYQLS Q S YLNGDLS PENQEK 
I ENS MN S S SNLS S SDSAAKEE I ARRESNGS YTAQNGQYYGRYQLSQS YLNGDLS PENQEK 

VADNYVASRYGSWSAALSFWNSNGWY 
VADNYWSRYGSWSAALSFWNSNGWY 
VADNYWSRYGSWSAALSFWNSNGWY 
VADNYWSRYGSWSAALSFWNSNGWY 
VADNYVASRYGSWSAALSFWNSNGWY 
VADNYWSRYGSWSAALSFWNSNGWY 
VADNYVASRYGSWSAALSFWNSNGWY 
VADNYVASRYGSWSAALSFWNSNGWY 
VADNYVASRYGSWSAALSFWNSNGWY 
VADNYVASRYGSWSAALSFWNSNGWY 
VADNYVASRYGSWSAALSFWNSNGWY 
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Table 32: Conversion of ORF R f Nos. with SAG Ref Nos. 



OKr K T NO. 


oAoXXXX K T NO. 


aa 


Annotation 


ORF00003 


SAG0017 


447 


PcsB protein 


ORF00004 


SAGO0 18 


322 


ribose-phosphat pyrophosphokinase 


ORF00005 


SAGO0 19 


391 


aminotransferase, class I ! 


ORF00006 


SAG0020 


253 


recombination protein O | 


ORF00008 


SAG0021 


283 


protease, putative 


ORF00009 


SAG0022 


330 


fatty acid/phospholipid synthesis protein PlsX 


ORF00010 


SAG0023 


79 I 


acyl carrier protein 


ORF00011 


SAG0024 


234 


phosphoribosylaminoimidazoie-succinocarboxamide 
synthase 


ORF00012 


SAG0025 


1241 


phosphoribosylformylgrycinamidine synthase, putative 


ORF00013 


SAG0026 


484 


amidophosphoribosyltransferase 


ORF00014 


SAG0027 


340 


phosphoribosylformyiglycinamidine cyclo-ligase 


ORF00015 


SAG0028 


182 


phosphoribosylglycinamideformyltransferase 


ORF00016 


SAG0029 


250 


acetyltransferase, GNAT family 


ORF00017 


SAG0030 


515 


phosphoribosylaminoimidazolecarboxamide 
formyltransferase/IMP cyclohydrolase 


ORF00018 


SAG0031 


283 


peptidase, M23/M37 family 


ORF00020 


SAG0032 


434 


group B streptococcal surface immunogenic protein 


ORF00021 


SAG0033 


232 


N-acetylmannosamine-6-P epimerase, putative 


ORF00022 


SAG0034 


438 


sugar ABC transporter, sugar-binding protein 


ORF00023 


SAG0035 


295 


sugar ABC transporter, permease protein 


ORF00024 


SAG0036 


276 


sugar ABC transporter, permease protein 


ORF00025 


SAG0037 


147 


conserved hypothetical protein 


ORF00026 


SAG0038 


220 


conserved hypothetical protein 


ORF00027 


SAG0039 


305 


N-acetylneuraminate lyase, putative 


ORF00028 


SAG0040 


293 


ROK family protein 


ORF00029 


SAG0041 


325 


acetyl xytan esterase, putative 


ORF00030 


SAG0042 


267 


phosphosugar-binding transcriptional regulator, RpiR 
family, putative 


ORF00031 


SAG0043 


421 


phosphoribosylamine-glycine ligase 


ORF00032 


SAG0044 


162 


phosphoribosylaminoimidazole carboxylase, catalytic 
subunit 


ORF00033 


SAG0045 


363 


phosphoribosylaminoimidazole carboxylase, ATPase 
subunit 


ORF00035 


OAPAA/ie 


ACZ1 

4bO 


nypotnencai protein 


UKrUuUoo 


oAbUU4/ 




adenylosuccinate lyase 


URrUUUof 


oAoUU4o 


ouo 


transcriptional regulator, Cro/Cl family 


tJRrOUlMo 


oAoUU4y 




noiiiaay junction din a neucase kuvh 


AncAnnoo 


oAVjUUuU 


140 


phosphotyrosine protein phosphatase, low molecular 

vvciyi it 


ORFnnfutn 

Ur\ruuw*tu 


SAGQ051 


126 


MORN motif familv/ nrntoin 


UrvrUUUH 1 


OMOUUJil 




IllOlIIUf alio piULolll, [JUldUvD 


UKrUUU4z 


oAoUUOo 


OoU 


aldehyde-alcohol dehydrogenase 


UKrUUU4o 






aiconoi aenyoiogenase, pro panoi-preie rung 


ORF00044 


SAG0055 


496 


thrponine svnthasfi 

U II wUI III Iw vll IU IQww 


ORF00045 


SAG0056 


412 


MATE efflux family protein 


ORF00046 


SAG0057 


102 


ribosomal protein S10 


ORF00047 


SAG0058 


208 


ribosomal protein L3 


ORF00048 


SAG0059 


i 207 


ribosomal protein L4 


ORF00049 


SAG0060 


i 98 


ribosomal protein L23 


ORF00050 


SAG0061 


277 


ribosomal protein 12 


ORF00052 


SAG0062 


92 


ribosomal protein S1 9 


ORF00054 


SAG0063 


114 


ribosomal protein L22 


ORF00055 


SAG0064 


217 


ribosomal protein S3 
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Table 32: Conversi n f ORF R f Nos. with SAG R f Nos. 



nop p 0 f M n 




33 J 


•Mil luiauui 1 


ORFOOO^fi 


SAG0065 


1^7 
1 o/ 


rihnsAmal Drotein L16 


ORF000S8 


SAG0066 


fift 
uo 


rihA<5omal nrotein L29 


ORF0005Q 


SAG0067 


86 


ribosomat protein S17 


orfoooro 




199 


rihosomal orotsin L14 


orfooori 


qagoorq 


IU I 


nhn^nmal nmfpin 1 94 


nRFnnoR*^ 




1 AO 


nhn^nmal nmtpin 1 ^ 

1 UUOUlllal \Jl U LCI I 1 l_\J 


ORFonnRA 

UrxrUUUwH 


OnOUU / i 


R1 


1 lUUOUl Hal pilMdll O l«T, puiaUVC 


ORFfifiOfi^ ! 
wr\r UUUOw 


QA<T;n079 

. OnVJUU / Z 


1^9 
1 OZ 


ri hncnmal nrntftin Qft 

HUUO'JJllal piUlGIII 00 


HRFnnnfifi 
ur\ruuuoo 


OnVJuU i O 


17A 


IIUUOUIHCII LJIUldll l—\J 


hrfaaara 


OnoUU/H 


11 A 
I ID 


rihncnmal nmtoin 1 1 A 
llUUoUllial piUldil l_ IO 


L/rxrUUUOy 


QAr^AA7*? 


1RA 
ID** 


rihncnmol nrntoln 

nuusornai proiein 00 


r^DCAAATA 1 


oAoUU/O 


oy 


riDosomai protein i_ou 


UKrUUUn 


QAf2AA7*7 


1 Aft 


nDosuiTiai proieiri l 10 


nccnnn70 
IJKrUUUf Z 






jrepruiein uonsiovase, obct suounn 




qa/saa70 


919 
Z I Z 




ORFnnn7ii 


OnUUUOU 


79 
f Z 


tranclatinn inittatinn fartnr IF-1 
U al loldUUI I IllluaUUII laUMJI If - I 


Ur\rUUU / o 


QA<^AAA1 


^A 


nuosornai protein loo 


noFAAA77 


QAf^AnA9 


191 
IZ 1 


rihncn>mal nmtoin C1 Q 


Ur\rUUU f O 


QA/^nnA^ 

ortoUUOo 


1 1A 
l 10 


rihocnmai nmtoln ^1 1 ' 
iiijuovJiiiai pi ij mil i o i i 


ORF00080 


SAG0084 


312 


DNA-directed RNA polymerase, alpha subunit I 


ORF00081 


SAG0085 


128 


ribosomal protein L17 


ORF00087 


SAG0086 


97 


hypothetical protein 


ORF00088 


SAG0087 


59 ! 


hypothetical protein 


ORF00089 


SAG0088 


56 


hypothetical protein 


ORF00090 


SAG0089 . 


183 


conserved hypothetical protein 


ORF00091 


SAG0090 


139 | 


conserved hypothetical protein 


ORF00093 


SAG0091 


144 


transcriptional regulator ComX1 , putative 


ORF00094 


SAG0092 


230 


phosphoglycerate mutase family protein 


ORF00095 


SAG0093 


250 


D-alanyl-D-alanine carboxypeptidase family protein 


UKrUUUyo 






iN-aceiyimuranioy^u-aianine amiQase, Tamny *♦ pruiein 


ORF00G97 


! SAG00Q5 


344 


hAat-inducihla transcrintion reoressor HrcA 


vixr UUU3U 


SAG0096 




hpat shock Drotein GroE 


ORF00099 


SAG0097 


609 


dnaK protein 




GAf^AAOA 


of y 


anaj pruiein 


L/KrUUlUl 


QA^nAQQ 

oMvauuyy 


*fr ID 


franc^rinftnnsl roni llator f^ntR family/ 
Uoiiocnpuunai leyuJaiui, wi ur\ icuuiiy 




QAr^ninn 

OAoUlUU 


ZOO 


tpKl A ncai iHm iriHirto cunthsQO A 
IT\INM pbuuuuui iuii ie oyiiuiooo r\ 


iJKrUUIUo 




zoz 


pnuopiiuii loll lyipyi in iiliu 10 ivuiaoo, puiauva \ 


OKrUUIVJ** 


QAfVM AO 
oAoul Uz 


104 


conserveu nypuuiuutJcii proitsin 


ftDCTAA'1 AK 


oAuUIUo 


ioy 


conservea nypoinouccii pruicin 


I ORF00106 


SAG0104 


280 


conserved hypothetical protein 


ORF00107 


SAG0105 


427 


trigger factor 


ORF00108 


SAG0106 


191 


DNA-directed RNA polymerase, delta subunit, putative 


ORF00109 


SAG0107 


534 


CTP synthase j 


ORF00110 


SAG0108 


308 


conserved hypothetical protein 


ORF00111 


SAG0109 


148 


deoxyuridine 5 % -triphosphate nucleotidohydrolase 


ORF00112 


SAG0110 


454 


DNA repair protein RadA 


ORF00113 


SAG0111 


165 


carbonic anhydrase-related protein 


ORF00115 


SAG0112 


439 


pyridine nucleotide-disulphide oxidoreductase family 
protein 


ORF00116 


SAG0113 


484 


glutamyl-tRNA synthetase 


ORF00117 


SAG0114 


322 


ribose ABC transport r, periplasmic D-ribose-binding 
protein 
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Tabl 32: Conv rsion of ORF Ref Nos. with SAG R f Nos. 



ORF R f N 


wnUAAAA l\v 1 liU, 


33 


Anil ta+loo 

A\JII1 lotion 


ORF00118 

V^l XI W 1 1 \J 


SAG01 1 S 


O 1 \J 


1 luuoo mdu it anoporier, permease protein 


ORF00119 


SAG01 1 6 




iiuuoc nuo udnopouci, r\ i r^-DinQinQ protein 


ORF00120 


SAG01 1 7 


1 OaV 


rihnco A DP tronennrtor nmtain nu P n 

uuuoD r\Dv_y udiiopuiLci pruiein KOSU 


ORF00121 

vy i x i wis i i 


SAG011R 


ouo 


nuu Kinase 


ORF001 29 

w 1 XI V/u 1 C ft 


SAG01 1 Q 


OaCO 


iiuuse operon repressor r\DSr% 


ORFnni9^ 

ur\ruu i aCo 


QAr^nion 




hypothetical protein 




OrtOU I £.\ 




permease, putative 


ORF0H1 9*? 


QAr^fMOQ 
OMVjU izz 




ado transporter, a i r-Dinaing protein 


ORFnO,1°fi 


QAf5m°o 

OMoU I 


OOO 


DNA-binding response regulator 


ORF 0 ni°ft 


< QAftSAiOvl 
OnUU 1 4l«t 


OCR 
OOO 


sensor histidine kinase 


wrxrUU 1*4*7 


oAvsUizO 


one 


argininosuccinate synthase 




OMV3U IZD 


4DZ 


argininosuccinate lyase 


! ORF00131 


SAG0127 


293 


fructose-bis phosphate aldolase 


vJKrUOio-4 


SAG0 128 


305 


L-2-hydroxyisocaproate dehydrogenase 


UKrUUI oo 


^ A ^"*Ooi nn 

SAG0129 


62 


ribosomat protein L28 


iJKrU01o4 


SAG0130 


121 


conserved hypothetical protein 


OKrUU13o 


SAG0131 


543 


DAK2 domain protein 


UKrUUiob 


o a r\ •« o o 

SAG0 132 


294 


SPFH domain/Band 7 family protein 


UKrU01o7 


A A OO 

SAG0133 


38 


conserved hypothetical protein 


VJKrUO 138 


O A f>r\A O J 

SAG0 134 


96 


hypothetical protein 


wKrUU 141 


o AGO loo 


246 


amino acid ABC transporter, ATP-binding protein 


xJKrUUi4^ 


SAG01 36 


516 


amino acid ABC transporter, amino acid-binding 
protein/permease protein 


ORFOOI^ 

v-»r\i uu i *t«j 


^AG01 ^7 


0«w 


conserveo nypouieucai protein 


wr\i wis i *t*j 






unoecaprenoi Kinase, putative 


ORF00146 


SAG0139 


251 i 


negative regulator of competence MecA, putative 




oAviU 14U 


o oo 
OOD 


glycosyl transferase, group 4 family protein 




oAoUi4i 


256 


ABC transporter, ATP-binding protein 




oAoUi4^ 


420 


conserved hypothetical protein 


ORF00151 


SAG0143 


410 i 


seleno cysteine lyase 


ORF00152 


SAG0144 


147 


NifU family protein 


ORF00153 


SAG0145 


472 


conserved hypothetical protein 


ORF00154 


SAG0146 


395 


penicillin-binding protein 4, putative 


ORF00155 


SAG0147 


411 


D-alanyl-D-alanlne carboxypeptidase 


ORF00156 


SAG0148 


551 


oligopeptide ABC transporter, substrate binding protein, 
putative 


ORF00157 


SAG0149 


304 ! 


oligopeptide ABC transporter, permease protein 


ORF00158 


SAG0150 


343 


oligopeptide ABC transporter, permease protein 


ORF00160 


SAG0151 


348 


oligopeptide ABC transporter, ATP-binding protein 


HDCftA-lft'l 

vjrcruuioi 


r O A r^t\A CO 

5AG0152 


310 


oligopeptide ABC transporter, ATP-binding protein 


ORF00166 


e a rsfti 

OnuU 1 JO 


zoo 


4-aipnospnocytioyi-^L>memyi-u-erytnntoi Kinase 


ORFnniR7 
vvrvpuu id/ 




14/ 


adc operon repressor AdcR 






•cob 


zinc ABC transporter, ATP-binding protein \ 


ORF00169 


SAG0 156 


270 


zinc ABC transporter nenmease nroteln 


ORF00172 


SAG0158 


419 


tyrosyl-tRNA synthetase 


ORF00173 


SAG0159 


765 


penicillin-binding protein 1B, putative 


ORF00174 


SAG0160 


1191 


DNA-directed RNA polymerase, beta subunit 


ORF00176 


SAG0161 


1216 


DNA-directed RNA polymerase beta 1 subunit 


ORF00178 


SAG0162 


121 


conserved hypothetical protein 


ORF00179 


SAG0163 


323 


competence protein CgtA 


ORF00180 


SAG0164 


282 


competence protein CgIB 


ORF00181 


SAG0165 


151 


conserved hypothetical protein 


ORF00182 


SAG0166 


! 123 


conserved domain protein | 
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HOC R f Klrt 


SAGxxxx R f No. 


aa i 


Xn notation 


ORF00183 

wl \l WW I W%J 


SAG0167 


324 


conserved hypothetical protein 


ORF00184 


SAG0168 


397 


ac tate kinase 


ORF00186 ! 


SAG0 169 


68 


transcriptional regulator, Cro/CI family 


1 ORF00187 


SAG0170 


45 


hypothetical protein 


ORF001 88 


SAG0171 


151 


hypothetical protein 


ORF001 8Q I 


SAG0 172 


221 


Dro tease, putative 


ORF00190 


SAG0173 


256 


pyrrol in e-5-carboxy late reductase 


ORF00191 


SAG0174 


355 


glutamyl-aminopeptidase 


ORF00192 
wi\r w 1 9^ 


SAG0175 


79 


hypothetical protein 


vrVrW 1 57 O 


SAG0176 


94 


conserved hypothetical protein 




SAG0 177 


107 


thioredo)dn family protein 


ORF00195 


QAG0.17R 
1 / O 


208 


tRNA hinrilnn domain nrntpin 

If XI NrA UlllUlliy UUI i lull 1 piUlCIII 


vJKrUUiyo 


QAfi017Q 


2^ft 


uui loci vcu 1 1 y pu 11 icu 1 uiuiciii 


LJKruu iyo 


oMoU 1 OU 


1^1 


oil iy it?"ou di iu uniuiiiy uiuicui 


UKruu iyy 


oAoUlol 




iiyuiuiaoc, noiuabiu utsi la luy ei icioviiivc? 1011 my 


OKrUQ200 




OOl 


sensor nisuaine ixinase, puiduvt* 


ORF00201 


oAoUl oo 


oa a 


response regulator 


ORF00203 


O A r*f\4 ox 
SAoUl o4 


101 


conservea nypoinencai proxem 


ORF00204 


oAvivl oO 


OAO 


memurane proiem, puiaiive 


ORF00205 


oAQsUl oo 


oe 
OO 


nypoineucai proiem 


/"NO CAAOAC 

j ORF00206 


oAxsUI o / 


PL AO 


ongopepuuQ rVDw transporter, oiigopepuue-uiriuiriy 






fJI ULCll 1 




Q A (-201 flft 


325 


nlinnnAntirlA ARG transnortsr oennease nrotein 

UliyupopilUO rAUVy Uailw^UUCI) pel 1 1 1 wuww piwiwlll 


\-/ r\ r u \jo 


0/Av3\J 1 OO 


273 


nlinonAntirie ABC transDorter Dermease orotein 


! f>RFflft90Q 


SAG01 90 


267 


peptide ABC transporter, ATP-binding protein 


ORFnn9in 


SAG0191 
wn\3v I9i 


208 


oentide ABC transporter ATP-bindina Drotein 

UvUUU w **LJ^^ u QI iwpvi ivl | • 1 ■ ■ wit iuii »y w* wtwii « 


ORFnnpi 1 


SAGQ1 92 


676 


PTS system, II ABC components 


DRF0091 o 


SAG01 93 

OA\Ju 1 9\? 


541 


aloha amvlase familv orotein 


\ r>RFnr>9i4 


i SAG0 194 

O/AVJU 1 9*T 


639 


transcriotional antiterminator BqIG familv 

U Ml lw Vl IWU VI IVll wllWwMUMIHWI | IUHIMJ 


r\RFnn91R 


SAG0195 


377 


IS1548 transoosase 


ORFnn9i7 

vr\ruu£ 1 1 


SAG0196 


66 


conserved domain protein 




SAG0197 


94 


PTS system, IIB component, putative 


ORF00219 


SAG0198 

Wr\\Vw 1 wis 


451 


PTS system, IIC component, putative 


ORFQ0220 


SAG0199 


285 


transketolase, N-tenminal subunit 


ORF00221 


SAG0200 


I 309 


transketolase, C-terrninal subunit 


ORF00223 


1 SAG0201 


419 


oxi do reductase, putative 


1 ORF00224 


SAG0202 


89 


ribosomal protein S1 5 


ORF00225 

VIM \J\JC m w 


SAG0203 


709 


polyribonucleotide nucleotidyltransferase 


S ORF00226 


SAG0204 


250 


conserved hypothetical protein 


ORF00227 


SAG0205 

^S#VX> VfcVW 


194 


serine O-acetyltransf erase 


ORF00228 

V/fxr \J\J f,r .\J 


SAG0206 


60 


hypothetical protein 


ORFQ0229 


SAG0207 


447 


cysteinyf-tRNA synthetase 


ORF00230 


SAG0208 


128 


conserved hypothetical protein 


ORF00231 


I SAG0209 


OF A 

£Ol 


kim a meinyitransTerase, i rmn family, group o 


ORF00232 


CAOAO<(A 


ATO 


conservea nypoineucai proiem 


UrvrUU^OO 


QAG091 1 

QnOut I 1 


286 


DpnV familv orotein 


ORF00234 


SAG0212 


32 


hypothetical protein 


ORF00235 


SAG0213 


39 


hypothetical protein 


ORF00236 


SAG0214 


148 


ribosomal protein L13 


ORF00237 


SAG0215 


130 


ribosomal protein S9 


ORF00238 


SAG0216 


33 


hypothetical protein 


ORF00239 


SAG0217 


384 


site-specific recombinase, phage integrase family 


ORF00240 


SAG0218 


I 158 


transcriptional regulator, Cro/CI family 


ORF00241 


| SAG0219 


| 101 


hypothetical protein 
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ORFR f No. 


SAGxxxxR f N . 


aa 


Annotation 


ORF00242 


SAG0220 


92 


cons rved hypothetical protein j 


ORF00243 


SAG0221 


76 


hypothetical protein 


ORF00244 


SAG0222 


108 


conserved domain protein 


ORF00245 


SAG0223 


209 


conserved hypothetical protein, fusion 


ORF00246 


SAG0224 


332 


replication initiation protein, putative 


ORF00247 


SAG0225 


144 


hypothetical protein 


ORF00248 


SAG0226 


418 


recombination protein 


ORF00249 


SAG0227 


156 


hypothetical protein 


ORF00250 i 


SAG0228 


111 


conserved hypothetical protein 


ORF00251 


SAG0229 


95 


conserved hypothetical protein j 


ORF00252 | 


SAG0230 


96 


conserved hypothetical protein 


ORF00253 


SAG0231 


135 


hypothetical protein 


ORF00254 


SAG0232 


186 


hypothetical protein 


ORF00255 


SAG0233 


226 


hypothetical protein 


ORF00256 


SAG0234 


128 


hypothetical protein 


ORF00257 


SAG0235 


93 


hypothetical protein 


ORF00258 


SAG0236 


32 


hypothetical protein 


ORF00259 


SAG0237 


34 


hypothetical protein 


ORF00260 


SAG0238 


41 


hypothetical protein 


ORF00261 


SAG0239 


286 


transcriptional regulator MutR family 


ORF00262 


SAG0240 


393 


transporter, putative 


ORF00263 


SAG0241 


213 


amino acid ABC transporter, permease protein 


ORF00264 


SAG0242 


308 


amino acid ABC transporter, amino acid-binding 
protein 


ORF00265 


SAG0243 


211 


amino acid ABC transporter, permease protein 


ORF00266 


SAG0244 


381 


amino acid ABC transporter, ATP-binding protein 


ORF00272 


SAG0245 


152 


hypothetical protein 


ORF00273 


SAG0246 


268 


hypothetical protein 


ORF00274 


SAG0247 


116 


hypothetical protein 


ORF00275 


SAG0248 


90 


hypothetical protein 


ORF00276 


SAG0249 


116 


hypothetical protein 


ORF00278 


SAG0250 


193 


hypothetical protein 


ORF00279 


SAG0251 


72 


transcriptional regulator, Cro/CI family 


ORF00280 


SAG0252 


| 186 


acetyltransf erase, GNAT family 


ORF00281 


SAG0253 


192 


acetyltransferase, GNAT family 


ORF00282 


SAG0254 


226 


acetyltransferase, GNAT family 


ORF00283 


SAG0255 


315 


conserved hypothetical protein 


ORF00284 


SAG0256 


163 


RNA polymerase sigma factor, ECF subfamily 


ORF00285 


! SAG0257 


53 


hypothetical protein 


ORF00287 


SAG0258 


202 


transcriptional regulator, TetR family 


ORF00288 


I SAG0259 


365 


ABC transporter efflux protein, DrrB family, putative 


ORF00289 


SAG0260 


! 238 


ABC transporter, ATP-binding protein 


ORF00290 


SAG0261 


129 


IS1381, transposase OrfB 


ORF00291 


SAG0262 


127 


IS1381, transposase OrfA 


ORF00292 


SAG0263 


171 


hypothetical protein 


ORF00293 


SAG0264 


103 


conserved hypothetical protein 


ORF00294 


SAG0265 


235 


conserved hypothetical protein 


ORF00295 


SAG0266 


382 


N-acetyIglucosamine-6-phosphate deacetylase 


ORF00296 


SAG0267 


180 


conserved hypothetical protein 


i ORF00297 


SAG0268 


304 


glycyl-tRNA synthetase, alpha subunit 


ORF00298 


SAG0269 


213 


acyl carrier protein phosphodi sterase, putative 


ORF00299 


SAG0270 


679 


glycyl-tRNA synth tas ; beta subunit 


ORF00300 


SAG0271 


85 


conserved hypothetical protein 


ORF00301 


SAG0272 


87 


membrane protein, putative 
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ORF Ref No. 


SAG xxx x Ref No 


33 


/-MHIUlall II 


ORF00302 


SAG0273 


502 




ORF00303 


SAG0274 


609 


alnha-nlv/rprnnhosDhate oxtHaco 


ORF00304 


SAG0275 


232 


nlvrprnl 1 intake facilitator nmtafn 


ORF00305 i 


SAG0276 


44S 




ORF00306 


SAG0277 


476 


wj) loci Vou 1 lypuu icubai |siou?lll 


ORF00307 


SAG0278 


uy i 


udl loftclUlaot; 


ORF00308 


SAG0279 


101 


conserved hypothetical protein 


UKrUUoUy 


oACjUzoU 


*1A A 

244 


ABC transporter, ATPrbinding protein 


ORF00310 


SAG0281 


534 


membrane protein, putative 


ORF00313 


SAG0282 


461 


PTS system, IIBC components 


ORF00314 


SAG0283 


267 


glutamate 5-kinase 


ORF00315 


SAG0284 


417 


gamma-glutamyl phosphate reductase 


ORF00316 


SAG0285 


298 


conserved hypothetical protein TIGR00006 


ORF00317 


SAG0286 


108 


cell division protein FtsL, putative 


ORF00318 


SAG0287 


752 


penicillin-binding protein 2X 


ORF00319 


SAG0288 


336 


phospho-N-acetylmuramoyl-pentapeptide-transferase 




SAG0289 


447 


ATP-dependent RNA h encase, DEAD/DEAH box 
lamiiy 


ORFflfH21 






moo iransponer, suDsiraie-uinaing protein 


ORF00322 


SAG02Q1 


2R7 


aiiiiiiu aciu mdl» iransporier, permease protein 


ORF00323 


SAG0292 


247 


amine* arJH ARP trancnnrfor ATP-HinHinn nmtetin 
01 1111 10 aoiu nov u eii lofjvji 101 , r\i r-uuiuniy pruiein 


ORF00324 


SAG0293 


74 


wji looi vcu iiypuuieuucii ujuieiii 


ORF00325 


SAG0294 


304 


U1IOIC7UOAIII 1 CUUl/uaoO 


ORF00326 


SAG02QS 


too 


KAJl lot? J VtJU 1 lypuil ttSUUdl [JlUieill 


ORF00327 


SAG0296 


273 


NAD cv/nthotnco 
inaau/ oyi iu icu3oc 


ORF00328 


SAG0297 


444 


Cil 1 III IUUGOuOGOO W 


ORF00329 


SAG029R 


750 


nonirrHlin.HinHinn nmtoin *1 A 


ORF00330 


SAG0299 


199 


recombination protein U 




oAbUoUU 




conserved hypothetical protein 


*• vJKrUUoo^ 


oAoUoUl 


40 


hypothetical protein 


Ut\rUUooO 




nu 


conserved hypothetical protein 


ORF00335 


SAG0303 


384 


conserved hypothetical protein 


ORF00336 


SAG0304 


487 


conserved hypothetical protein j 


ORF00337 


SAG0305 


160 


autoinducer-2 production protein LuxS 


ORF00338 


SAG0306 


535 


KH domain protein 


ORF00340 


SAG0307 


33 


hypothetical protein 


ORF00341 


SAG0308 




ABC transporter, ATP-binding protein, FRAMESHIFT 


ORF00343 


SAG0309 


246 


ABC transporter, permease protein, putative 


ORF00344 


SAG0310 


361 


conserved hypothetical protein 


ORF00345 


SAG031 1 




DNA-binding response regulator POINT MUTATION 




oACiUol 2 


234 


conserved hypothetical protein 


UKrUUo4o 


SAG0313 


209 


guanylate kinase 




OnuUJ 1 *♦ 


1 W*T 


n W A_r4irar*toH DKI A nnl\/maroea rtman-o ei 1K1 inSt 

uiNM-uueciea i\inm puiymeicibe, omega suDunii, 
putative 


ORF00350 


SAG0315 


796 


primosomal protein N' 


ORF00351 


SAG0316 


311 


methionyi-tRNA formyltransferase 


ORF00352 


SAG0317 


440 


Sun protein 


ORF00353 


SAG0318 


245 


serine/threonine phosphatase, putative 


ORF00354 


SAG0319 


651 


serine/threonine protein kinase 


ORF00355 


SAG0320 


231 


conserved hypothetical protein 


ORF00356 


SAG0321 


339 


s nsor histidine kinase, putative 


ORF00358 


SAG0322 


213 


DNA-binding response regulator 
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ORF Ref NO. 


SAGxxxx Ref No. 


aa 


Annotati n 


vJKrUUooy 


oAoUoZo 


400 


hydrolase, naloacid aehalogenase tamily/p ptidyl- 
ijruiyi cis-irana louiiicicab©, cyciopniiin iyp» 


| ORFOO^RO 


onoud&t 


194 i 


nonaral ctrooc orAtoio r\i iloflt m 
ycllcrdl oKcoo (JIUlclll, puIouV© 


ORFQ0?.R1 


SAGn^9*5 


9*5R 


pyiuvdLo iui uiaic-iyctots-scuvaung sniyiiio 


ORFoVl^fi? 

vr\rUUOD<b 


qAr>n^9R 


fcO 1 


irdnbcnpuonai reguiaiur, ueorx Tamny 


| ORFOO^fi^ 




^97 


uanscnpuoriai roguiaior, puiauve 


ORFfin^fiA 
*jr\ruuoo*t 




107 


n i o sysiem, ceuoDiose-specrnc iia component 


ORFnn^fiR 


OnOUO^y 


1 UD 


r* i o sysiem, ceiiODiose-speciTic Ho cornponeni 


nRFnn^R7 

UrxrUUOD / 




4*v* 


i o sysiem, cenooiose-specitic 110 component 


orfoo^rr 


GAf^AQQI 
OMoUOO I 


O I o 


Tounaxe aceiyiiransTerase 




OAoUOoZ 


SVY. 


transaldolase family protein 




oAoUooo 




glycerol dehydrogenase 






oUo 


cysteine synthase A 


oditaaq7q 
vJKrUUof o 




^14 


conserved nypotneticai protein TioKOU^o7 


nppnni74 

URrUUo / 4 


OAVsUOOD 


4^y 


helicase, putative 


ORFftftQ7R 


OAoUOO f 


^ J 


competence protein F, putative 


rjDcnn^7A 


qa on ft 


»o4 


ribosomal subunit interface protein 


vJKrUUoo^ 


oAoUooy 


/I CCA 
4oU 


aspartate kinase family protein 


vJKrUUooo 


oAoUo4U 




hydrolase, naloacid dehalogenase-like family 


ORF00384 


SAG0341 


49 


hypothetical protein 


ORF00385 


SAG0342 


263 


enoyi-CoA hydratase/isomerase family protein 


ORF00386 


SAG0343 


144 


transcriptional regulator, MarR family 


ORF00387 


SAG0344 


323 


3-oxoacyl-(acyl-carrier-protein) synthase III 


ORF00388 


SAG0345 


74 


acyl carrier protein 


ORF00390 


SAG0346 


319 


enoyl-(acyl-carrier-protein) reductase II 


ORF00391 


SAG0347 


308 


malonyl CoA-acyl carrier protein transacylase 


ORF00392 


SAG0348 


244 


3-oxoacyl-[acyl-carrier protein] reductase 


ORF00393 


SAG0349 


410 


3-oxoacyHacyl-rarrier-protein) synthase II 


ORF00394 


SAG0350 


166 


acetyl-CoA carboxylase, biotin carboxyl carrier protein 


ORF00395 


SAG0351 


140 


(3R)-hydroxymyristoyl-(acyl-carrier-protein) 
dehydratase 


ORF00396 


SAG0352 


456 


acetyl-CoA carboxylase, biotin carboxylase 


ORF00397 


. SAG0353 


291 


acetyl-CoA carboxylase, carboxyl transferase, beta 
subunit 


vJKrUUoyo 


SAG0354 


257 


acetyl-CoA carboxylase, carboxyl transferase, alpha 

01 it*M t nit 

suDunti 


ORFOOaQO 


eA«na*;s> 

OnOUO <J«J 


910 


conscrveu nypoinoucoi pruiein 


ORF00400 

vrvrvutuu 


onvjuo %>D 




con/LIRM A cwnthotoca 
ool y l~lr\IMA\ oyiiulcuaoo 


ORF00402 


SAG0357 


330 


hypothetical protein 




! oAoUooo 


4 OA 


conserved hypothetical protein 


iJKrUU4U4 


i C AO AO KG 


oUo 


PTS system, mannose-specific IID component 


\jr\ruu4UO 


oAvjUodU 


OTA 


PTS system, mannose-specific 110 component 


ORF00406 


' SAG0361 


336 


PTS system, mannose-specific IIAB components 


ORF00407 


SAG0362 


270 


hydrolase, naloacid dehalogenase-like family 


ORF00408 


| SAG0363 


194 


hypothetical protein 




oAv»UOD4 


OAO 

ZUO 


membrane protein, putative 


ORF00410 


SAG0365 


473 


xanthine/uracil permease family protein 


ORF00411 


SAG0366 


169 


conserved hypothetical protein TIGR00150, putative 


ORF00412 


SAG0367 


186 


acetyltransferase, GNAT family 


ORF00413 


i SAG0368 


435 


transcriptional regulator, putative 


ORF00414 


SAG0369 


98 


conserved hypothetical protein 


ORF00415 


SAG0370 


139 


HIT family protein 


ORF00416 


SAG0371 


167 


hypothetical protein 


ORF00417 


SAG0372 


85 


hypothetical protein 
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a*** m\ ***** ^ tarn*. m\\ ftl 

SAGxxxx R f No. 


aa i 


Annotati n 


ORF00419 


SAG0373 


241 


ABC transporter, ATP-binding protein 


ORF00421 


SAG0374 


344 


ABC transporter, permease protein 


ORF00422 


SAG0375 ' 


266 


conserved hypothetical protein 


ORF00423 


SAG0376 


211 


conserved hypothetical protein nc?RO0oyi 


ORF00424 


SAG0377 ; 


127 


conserved hypothetical protein, POINT MUTATION 


ORF00425 


oAbOo /o 


07ft 


N utilization suDStance protein m 


ORF00426 


SAG0379 




conserved hypothetical protein 


ORF00427 


SAG0380 


100 


ribosomai protein L7A family 


ORF00428 


SAG0381 


927 


translation initiation factor 11--^ 


ORF00429 


J~» A /SAO O O 

SAG0382 


A OO 

122 


ribosome-binding factor A | 


ORF00430 


SAG0383 


334 


conserved hypothetical protein 


AnrAn a^s a 

ORF00431 


SAG0384 


138 


transcriptional repressor CopY 


ORF00432 


oAo0385 


~f A A 

744 


copper-transporter ATPase Cop A 


• ORF00433 


SAG0386 


68 


copper-transporter protein CopZ 


ORF00434 


SAG0387 


AAi 

204 


conserved hypothetical protein 


ORF00435 


O A OAO 0 O 

SAG0388 


270 


hydrolase, haloacld dehalogenase-like family 


ORF00436 


ciAUUooy 


00O 


DNA polymerase 1 


ORF00437 


5AGQ390 


A AC 

14o 


CoA binding domain protein 


ORF0Q438 


OAG0391 


•4 CO 


transcnptionai regulator, ruriamiiy 


ORF00439 


0 A ^nono 

oACiUoyz 


o21 


ceil wan surface ancnor lamiry protein 


ORF0044Q 


5Aouo9o 


000 1 


UNA-Dinoing response regulator 


ORF00441 


SAG0394 


345 


sensor histidine kinase 


ORF00442 


SAG0395 | 


246 


conserved hypothetical protein 


ORF00443 


SAG0396 I 


380 


queuine tRNA-ribosyltransferase 


ORF00444 


SAG0397 


102 


conserved hypothetical protein 


ORF00445 


SAG0398 


179 


bioY family protein 


ORF00446 


SAG0399 ! 


258 


AtsA/ElaC family protein 


ORF00447 


SAG0400 


168 


cytidine/deoxycytidylate deaminase family protein 


ORF00448 


SAG0401 


44 


hypothetical protein 


ORF00449 


SAG0402 


449 


glucose-6-phosphate isomerase 


ORF00450 


SAG0403 


175 


5-formyltetrahydrofolate cyclo-ligase family protein 


OKrUU40 1 


oAo04U4 


£JLO 


momooio Tamiiy protein 


Of\r004o^ 


oAC3U4UO 


o4f 


1 Art fAf aIa 

lipoprotein 


OKrOU4oo 


oAoU400 


^yy 


u 1 K-giucose-i -pnospnate unayiyiiransTerasB 


OKr004o4 


OA/^ A >(n7 

oAoU4U / 


000 


giyceroi-0"pnospnaie aenyurogenase ^ix/\u\r*/ T ^ 


UKrUU400 


CAAn>tAQ 

oAi3U4Uo 


a no 
iuy 


nuonuciease proiein componeni 


ORF00456 


SAG0409 


271 


SpolltJ family protein 


ORF00458 


SAG0410 


273 


R3H domain protein 


ORF00463 


SAG041 1 


177 


conserved hypothetical protein 


ORF00464 


SAG0412 


258 


RecX protein 


ORF00465 


SAG0413 


451 


RNA methyltransferase, TrmA family 


ORF00466 


SAG0414 


153 


conserved hypothetical protein 


ORF00467 


SAG0415 


142 


acetyltransferase, GNAT family 


ORF00468 


SAG0416 


1233 


protease, putative 


ORF00469 


SAG0417 


302 


glycosyl transferase, group 2 family protein 


ORF00470 


SAG0418 


336 


ribonucleoside-diphosphate reductase 2, beta subunit 


ORF00471 


SAG0419 


137 


nrdl protein 


ORF00472 


SAG0420 


721 


ribonucleoside-diphosphate reductase 2, alpha subunit 


ORF00473 


SAG0421 


1055 


cons rved hypothetical protein 


ORF00474 


SAG0422 


i 129 


conserved hypothetical protein v 


ORF00475 


SAG0423 


132 


conserved domain protein 
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aa 


Annotati n 


ORF00476 


SAG0424 


94 


hypothetical protein 


ORF00478 


SAG0425 


105 


carboxymuconolactone decarboxylase family protein 


ORF00479 


SAG0426 


AO A 
131 


conserved hypothetical protein 


rtnpnn a oo 

ORF00480 


5AG0427 


a on 

129 


transcriptional regulator, MerR family 


/">r-x r/iA A OO 

ORF00482 


SAG0428 


345 1 


alcohol dehydrogenase, zinc-containing 


ORF00483 


SAG0429 


284 


oxidoreductase, aldo/keto reductase family 


a^\ d*\ m At 

ORF00484 


SAG0430 


287 


cation efflux system protein 


ORF00485 


SAG0431 


174 


transcriptional regulator, TetR family 


ORF00486 


SAG0432 


397 ; 


transcriptional regulator, AraC family 


ORF00487 


SAG0433 


1389 


surface protein Rib 


ORF00488 


SAG0434 


61 


transposase, IS256 family, truncation 


ORF00489 


SAG0435 


97 


DNA-damage-inducible protein J, putative 


ORF00490 


SAG0436 


62 


hypothetical protein 


ORF00491 


SAG0437 


123 


hypothetical protein 


ORF00493 


SAG0438 


145 


bacteriophage L54a, integrase, truncation 


ORF00495 


SAG0439 




conserved hypothetical protein, FRAMESHIFT 


ORF00496 


SAG0440 


84 


conserved hypothetical protein 


^x n ^o/\ as\t 

ORF00497 


SAG0441 


103 


conserved domain protein 


ORF00499 


rx a /— vrt j jf rx 

SAG0442 


189 


acetyltransferase, GNAT family 


ORF00500 


SAG0443 


194 


acetyltransferase, GNAT family 


ORF00501 


SAG0444 


188 


conserved hypothetical protein 


ORF00502 


SAG0445 


883 


valyl-tRNA synthetase 


ORF00503 


SAG0446 


319 


oxidoreductase, Gfo/ldh/MocA family 


ORF00504 


SAG0447 


287 


magnesium transporter, CorA family 


ORF00506 


SAG0448 


391 


transposase, IS256 family 


ORF00507 


SAG0449 


354 


conserved hypothetical protein 


ORF00508 


SAG0450 


330 


aspartate— ammonia ligase 


ORF00510 


SAG0451 


149 


bacteriocin transport accessory protein .putative 


ORF00511 


SAG0452 


179 


type 11 DNA modification methyltransf erase, putative 


ORF00512 


o a /~*r\ A CO 

SAG0453 


96 


hypothetical protein 


/"■xn rnAC a o 

ORF00513 


SAG0454 


161 


phosphopantetheine adenylyltransferase 


ORF00515 


SAG0455 


357 


conserved hypothetical protein 


ORF00518 


SAG0456 




conserved hypothetical protein, degenerate 


ORF00519 


SAG0457 


192 


conserved hypothetical protein 


ORF00520 


fx A /~x /-v jcq 

SAG0458 


368 


conserved hypothetical protein TIGR00048 


^^f^f - AAPAJ 

ORF00521 


SAG0459 


171 


VanZF domain protein 


ORF00522 


SAG0460 


CO 4 

581 


ABC transporter, ATP-binding/permease protein 


ORF00523 


o A /"*n A OA 

SAG0461 


579 


ABC transporter, ATP-binding/permease protein 


ORF00524 


rx a /-x n .4 o o 

SAG0462 


188 


anthranilate synthase component II 


ORF00525 


rx a /^i\A CO 

SAG0463 


a *7n 

179 


bioY family protein 


OKr00o2o 


o a r*r\A C A 

SAGQ464 


oon 
330 


btotin synthetase 


ORF00527 


SAG0465 


164 


hypothetical protein | 


ORF00528 


SAG0466 


371 


thiolase 


ORF00531 


r> A a^% f\ A />~9 

SAG0467 


409 


AMP-binding enzyme domain protein 


ORF00532 


u SAG0468 


! 210 


endonuclease III 


ORF00533 


SAG0469 


131 


type IV prepilin peptidase-related protein 


ORF00534 


SAG0470 


69 


conserved hypothetical protein [ 


ORF00535 


SAG0471 


322 


glucokinase 


ORF00536 


SAG0472 


126 


rhodanese domain protein 


ORF00537 


SAG0473 


613 


elongation factor Tu family protein 


ORF00538 


SAG0474 


81 


cons rved hyp th tical protein 


ORF00540 


SAG0475 


451 


UDP-N-acetylmuramoylalanine-D-glutamate ligase 
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Ope Da( KJr\ 


OMV9XXXX fx T IHO. 


aa 


Mnnoianon 








yj L'r'-iN-acBtyig iucosaiTiirie--iN-aceiyi muramyi- 
DentanpntiHe) rwroDhosDhorvl-nnrfpranrpnnl M- 

acetylglucosamine transferase 


ORF00542 


SAG0477 


378 


cell division protein DivIB, putative 


ORF00544 


SAG0478 


429 


cell division protein FtsA 


ORF00545 


SAG0479 


426 


cell division protein FtsZ 


i ORF0054R 


SAG0480 


224 




ORF00S47 


SAR0481 


201 




urvruwiwo 






Yf^fST fomiki nmtoin 

t vjo 1 rarniiy pruiein 


ORFnn*i4Q 


OnvJUtO o 




yimn p rule in 


Ur\PUUOOU 




ZOO 


poll *4 1% /|oi/n n nmtAtn f"^ i\ / f\ / A m i4n4StiA 

ceii envision protein uivivh, puiauve 


ORF00552 


SAG0485 


930 ! 


isoleucyl-tRNA synthetase 


ORrOOobo 


oAGU4oo 


100 


conserved hypothetical protein 


ORF00554 


SAG0487 


151 


MutT/nudix family protein 


ORF00555 


SAG0488 


753 


ATP-dependent Clp protease, ATP-binding subunit 


ORF00556 


SAG0489 


34 


hypothetical protein 


ORF00557 


SAG0490 


76 


conserved hypothetical protein 


ORF00558 


SAG0491 


230 


amino acid ABC transporter, permease protein 


ORF00559 


SAG0492 


244 


amino acid ABC transporter, ATP-binding protein 


ORF00560 


SAG0493 


564 


phosphoglucomutase/phosphomannomutase family 
protein 


ORF00562 


SAG0494 


284 


methyl enetetrahyd rofolate 
dehydrogenase/methenyltetrahydrofolate 

cvclohx/ri ro 1 a 


ORF00563 


SAG0495 


278 


wi raw vcu 1 lyjjwu ioui^cu ^iixjixsui 


ORF00564 


SAG0496 


446 


pxodpoxvrihomir'lpasp VII brriA «5iihumt 


ORF00565 


SAG0497 


71 


exodeoxvrihonurilpasp VII small ^nhiinit 

OAUUOUAj I IUuICuOC VII, OIIICIII OUwUI Hi 


ORF00566 


SAG0498 


290 


aeranvltranstransferase nutativp 

y vi vii 1 j iu v« 10U ui iwiwi 00 yj uici vi v w 


ORF00567 


SAG0499 


275 


hemolvsin A 1 


ORF00568 


SAG0500 


157 


arainine reoressor AraR Dutative 


ORF00570 


SAG0501 


552 


DNA repair protein RecN 


ORF00571 


SAG0502 


278 


DegV family protein 


ORF00572 


SAG0503 


279 


Lipase/Acylhydrolase, putative 


ORF00573 


SAG0504 


200 


conserved hvoothetica) Drotein 

vvl Iwwl VWU 1 IJf puu IWUwul yJ 1 \J tv^ III 


ORF00574 


SAG0505 


91 


DNA-binding protein HU 


ORF00575 


SAG0506 


65 


hypothetical protein 


ORF00576 


SAG0507 


310 


dihydroo rotate dehydrogenase A 


ORF00577 


SAG0508 


411 


beta-lactam resistance factor 


ORF00578 


SAG0509 


403 


beta-lactam resistance factor 


ORF00579 


SAG0510 


406 


murM protein, putative 


ORF00580 


sa<3o^i 1 

onouj i i 


970 


hv/Hrnlsco hsIosif^tH HohQlnnonaco.li(ro fomilw 
liyuiuidoc, HdlVJal^lU Ucl laiuyei ldoe-III\e larniiy 


ORF00581 


SAG0512 


438 


HD domain protein 


ORF00582 


SAG0513 


128 


conserved hypothetical protein 


ORF00583 


SAG0514 


894 


cation-transporting ATPase, E1-E2 family 


ORPnnRnk 

Ur\rUUOO*> 


OMoUOlO 


ZOO 


conserved hypothetical protein 


ORF00585 


SAG0516 


643 


fructose-1 ,6-bisphosphatase, putative 


ORF00586 


SAG0517 


374 


iron-sulfur cluster-binding protein, putative 


ORF00587 


SAG0518 




peptide chain release factor 2, FRAMESHIFT 


ORF00588 


SAG0519 


230 


cell division ABC transporter, ATP-binding protein FtsE 


ORF00589 


SAG0520 


309 


cell division ABC transporter, permease protein FtsX 


OR*)0590 


SAG0521 


I 236 


carboxymethylenebutenolidase-related protein 


ORF00591 


SAG0522 


232 


metallo-beta-lactamase superfamily protein 
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Ant r> f 1 1 

ORF R f No. 


SAGxxxx Ref No. 


aa 


Annotati n 


ORF00592 


SAG0523 


254 


oxidoreductase, short chain dehydrogenase/reductase 
Family 






ooo 


Dina polymerase in, epsuon suoumt/Ai H-uepenoent 

holtAacA HinG 


ORF00595 


SAG0525 


397 


acnnrtatp aminotransfftrasft 

GOUCll LCI LW ul 1 III Iv M CM IO 1 V< QOw 


ORF00596 


SAG0526 


448 


asparaginyl-tRNA synthetase 


vJKrUUOy / 


o Ao U02 # 


loo 


conserved hypothetical protein 






007 

o27 


inosine-uridine preferring nucleoside hydrolase 


r\Drnrtcnn 


oAG0529 


38 


hypothetical protein 


OKrUOoOO 


SAG0530 


137 


OsmC/Ohr family protein 


ORFQQoQI 


SAG0531 


296 


conserved hypothetical protein 


ADCAAfiAO 

(JRrUUo02 


SAGD532 


324 


conserved hypothetical protein 


ADCAAfiAO 

URrUUbUo 


SAG0533 


303 


Uncharactenzed BCR, COG 1481 


ADCAACAvt 


O A PACO /I 

oAG05o4 


465 


di peptidase 


ORF00605 


SAG 0535 


506 


zinc ABC transporter, zinc-binding adhesion liprotein 


| ORF00606 


SAG0536 


86 


ribosomal protein L31 


CjKrUuo07 


SAGQ537 


311 


DHH family protein 


vJKrUUDUo 




Oil A 

340 


adenosine deaminase, putative 


CJKr00b09 


5AG0539 


4 AT 

147 


fiavodoxin 


UKrUUOlO 


oAGOo40 


A4 
91 


ch oris mate mutase, putative 


C/KrUUo 1 1 


O A PAC/1 4 

OAG0541 


Q AO 

o9o 


voltage-gated chloride channel family protein 


\JKrUw0l2 


oAoU542 




loiool, transposase UnA 


vJKrUUo To 


OAPAC/IO 

oAbUMo 


4 OA 


loiool, transposase uitd 


ORr00b14 


oAGQ544 


115 


nbosomal protein L19 


UKrUUolO 


OAOACilC 

oA(jUo4£) 


OCA 

359 


site-specific recombinase, phage integrase family 


ORF00617 i 




67 

w/ 




ORF00618 


SAG0*547 


IOJ 


i lypuu ic u well piuicui 


ORF0061Q 


55AGn*vd8 


26*5 




ORF00620 




47 


hv/r»othe>ti aoI a pa to! a 
1 iy|JvJU IbLil/dl piULOlll 


ORF00621 




74 


UUHoCIVCU 1 lyfJUU IwUwCll pi w loll 1 


ORF00622 


S AGO 5*51 


52 


mncorvoH h\/AAfrhatlAal nrotoi n 

wwllOwlVwU liy)JwUlCUwal |JIUlwlll 


ORFQ0623 


SAGO*5S2 


62 


KvAAthAtiAal Amfoin 
liyfJULI ICSUwCM jjiuiciii 


ORF00624 


QAGn^'i'* 

OnOu jjO 




iiypuuitsUwoi pruitJiii 


w rxi ww wt w> 




6^ 

DO 


u di loui ipuui idt teyuioiui, wiu/wi idiiuiy 


ORF00627 

Wl\l vuVL I 


SAGOO'S 


24Q 




ORF00628 


O/AVJJ UwJU 


47 


iiypuu icuudi pruieiii 


ORF00630 

^^rxr wwwww 




76 

I w 




ORF00632 

VIM WWWW&. 


SAG0558 


i 74 


iiypuuidiwai piuLciii 


ORFQ0633 






wuiiocivou iiypuuiwilwcll piwiciii 


ORF00634 

1 XI WWWwT 




77 


r*/»n<5PrvpH hwAAthatiAal nmtoin 
LuiivCivcu i iypuuiwUv#cii piwiciii 


ORF00635 

wl\l wwWww 


\ SAGn*561 


46 
to 


h\/n Athotir^al r\re\ to In 

iiypwiiioUwai prtJiein 


nRFftfifi^R 
UrsrUUgoD 


oAoUOOZ 




hypothetical protein 


\jT\r\j\J0of 


oAviUOOo 




nypoineticai protein 


ORF00638 


SAG0564 


160 


wiiocivcu i lyyjKJU icuuo i p • w iv? 1 1 » 


ORF00639 


SAG0565 


224 


conserved domain protein 


ORF00640 


SAG0566 


138 


single-strand binding protein 


ORF00641 


SAG0567 


i 439 


reverse transcriptase/maturase family protein 


ORF00642 


SAG056B 


67 


conserved hypothetical protein 


ORF00643 


SAG0569 


158 


conserved hypothetical protein 


ORF00644 


SAG0570 


115 


hypothetical protein 


ORF00645 


SAG0571 


43 


hypothetical protein 


ORF00846 


SAG0572 


138 


conserved hypothetical protein 


ORF00647 


SAG0573 


54 


hypothetical prot in 



673 



WO 2004/018646 



PCTYUS2003/026827 



Tabl 32: Conv rsion of ORF Ref Nos. with SAG Ref Nos. 



ORF R f No. ! 


wmvjaaaa rv ■ iii • 


da 


Mil n uiauoi i 


ORF00648 


SAG0574 


flQ 

U9 




ORF00649 


SAG0575 


1 m 


nypuuioiiucii piuiom 


ORF00650 


SAGO 576 


HO 


i lypuu iciiwai jjiuicm 


ORF00B52 


SAGO 577 


177 
tit 


rAneon/fiH hvnnthfifif*fi1 nmtain 
UJiibai vcu i lypuu icuuai uiuioiM 


ORFnftfi , i3 




oo 


conserveu nypouicuuai proiein 


ORFOOfi'54. 
urxruuojt 


SAGnsfti 


1 IO 


conservea nypuumuucii proiein 


VJrvUUDOU 


QAGflRft9 


.499 


conservea nypoineucai proiein 


ORFOnRRR 


oMvjUOOO 


Ana 


conserveu nypomeucai protein 




OMOU004 


OZ 


conserved hypothetical protein, truncation 


VJrvrUUDOO 


oMuUOOO 


4f 1 


conserved hypothetical protein 


uf\r uuooy 




10** 


conserved hypothetical protein 


ORFflftfififl 
ur\ruuDOu 


OMOuUO f 


OAA 

oUU 


structural protein, putative 


\-Jr\rUUOO 1 


OnOUOOO 


/I 


conserved hypothetical protein 


f\RFftnRfi9 




14o 


conserved hypothetical protein 








conserved hypothetical protein 






7ft 


conserved hypothetical protein 


ORFflflRRR 




1 1 i 

111 


conservea nypomeucai protein 




QAG0RQ 0 . 
OAAVJW O 57 O 


1 ft*? 
TOO 


siruciurai proiein 


ORF0ftfifi7 i 


QAGARQ4 


R1 


conservea nypomeucai proiein 


ORF00668 




19** 


uuiiociVcu c lypotriouvcu proiein 


ORF0Q669 




R7n 


Phil A infomal e\a\c±k\r\r\ 


ORF0Q670 


SAG05Q7 


Rftfi 


minnr ctn 1H1 tral r\ rr\ fair* r> i itofix ta 

minor siruciurai proiein t puiauve 




SAGORQft 


1*V74 

lOf *r 


minor biruuiurai proiein , puiauve 


ORF00B72 






minor suuciuoai proiein , puiauve 


ORF00673 


SAG0600 


109 


hypothetical protein 


UKrU0o74 


oAGOoOl 


70 


hypothetical protein 


UKrUUDf O 


oAl^UoO^ 


100 


conserved hypothetical protein 


UKrUUO/D 


oAoOoOo 


AAA 
111 


holin, putative 


LJKrUUo r ( 


oAtjUbU4 


239 


lysin, putative 


DKrUUD/o 


O A PACAC 

oAGQoOo 


323 


conserved hypothetical protein 


UKrU0o79 


SAG0606 


66 


conserved hypothetical protein 


UKrUUbo 1 




56 


conserved hypothetical protein 


OKrOOoo2 


SAG0608 


59 


hypothetical protein 


OKrOUDOO 


O A PACAA 

SAG0609 


193 


site-specific recombinase, phage integrase family 


ORFflflRfl^ 


OnOUO 1 U 




conserved hypothetical protein 


ORFnnfifl7 


Q AGAR 11 
OnOUO 1 1 




uansposaSo, aeyenersie prOAivicoriir I 


ORFnOfiftQ 


OnUUO 1^ 


JO 


conservea nypoineucai proiein, rr\Mivicoriir i 


ORFOORQn 


OnOUO 1 0 


42*5 


UcH loll ItJI 1 * Ul dl It3 piUvolfl VoAU 1 






91ft 


ADP tr*a ncnnrfor ATP hinHlnn nmtoin V/avnO 

now iransponer, mi n-uinaing protein vexp^ 


ORF00692 




458 


11 al lot 1 ICI 1 IUI al ItJ pi \J LCI 11 V tsAJJO 


ORF0069 4 * 


^AGOfilfi 


217 




ORF006Q4 
vr\rvuuo*t 


^AGftR17 




concAr KtofiHino Uinaca \/n^Q 
ocllotll IlloUUinU MllacicJ VMCO 




oAbUDlo 


iyo 


iransposase urrp, loo ramiiy, truncation 


HRFnnRQ7 




RR 
DO 


conserved hypothetical protein 


ORF00698 


SAG0620 


62 


hvoothetical nmtein 


ORF00699 


SAG0621 


401 


rod shape-determining protein RodA, putativeD 


ORF00700 


SAG0622 


186 


hydrolase, haloacid dehalogenase-like family 


ORF00701 


SAG0623 


650 


DNA gyrase, B subunit 


ORF00702 


SAG0624 


574 


septation ring formation regulator EzrA, putative 


ORF00703 


SAG0625 


213 


phosphoserine phosphatase SerB 


ORF00704 


SAG0626 


161 


MutT/nudix family protein 


ORF00705 


SAG0627 


151 


conserved hypothetical protein 


ORF00706 


SAG0628 


435 


enolase 1 


ORF00707 


SAG0629 


354 


conserved domain protein 
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aa / 


Annotation 


ORF00708 


SAG0630 


427 


3-phosphoshikimate 1 -carboxyvinyltransferase 


ORF00709 


SAG0631 


170 I 


shikimate kinase 


ORF00710 


SAG0632 


457 


psr protein i 


ORF00711 


SAG0633 


451 


RNA methyltransferase, TrmA family 






70 


hypothetical protein 


\Jl\t\J\J 1 IO 




245 


arid ohosDhatas© Dre cursor class B 


URrUUf IH 


OnvJuDOD 


179 


r_nn«;prved hvDOthetical orctoin 


VJrvrUU / 1 1 


OHV3UOO r 




tran<:rrintional rpnulfltnr TfitR familv ni itotivp 
Wax lau i p ii vi ioi icyuiaLui^ i oir\ laiiuiy, puiauvc, 

Z RAMESH1FT 




SAGQ638 


109 


cell wall surface anchor family protein 


ORF00720 


SAG0639 


273 


transposase OrfB, IS3 family 


ORFQ0721 


SAG0640 


91 


transposase OrfA, IS3 family 








Tn5252 Orf 10 orotein deaenerate POINT MUTATION 


ORF00723 


SAG0642 


59 


hypothetical protein 


ORF00725 


SAGO 643 




chaperonin, 33 kDa DEGENERATE 


ORF00726 


SAG0644 


402 


transcriptional regulator, AraC family 


ORF00727 


SAG0645 


554 


cell wall surface anchor family protein, putative 


ORF00728 


SAG0646 


307 


cell wall surface anchor family protein 


ORF00729 


SAG0647 


305 


sortase family protein 


ORF00731 


SAG0648 


260 


sortase family protein 


ORF00732 


SAG0649 


890 


cell wall surface anchor family protein, putative 


ORF00734 


SAG0650 


189 


sortase family protein, FRAMESHIFT 


ORF00735 


SAG0651 


201 


hypothetical protein 


ORF00737 


SAG0653 


76 


conserved hypothetical protein, DEGENERATE 


ORF00738 


SAG0654 


34 


hypothetical protein 


i ORF00740 


SAG0656 


36 


hypothetical protein 


ORF00741 


SAG0657 


89 


hypothetical protein 


ORF00742 


SAG0658 


383 


lipoprotein, putative 


ORF00743 


SAG0659 


330 


ABC transporter, ATP-binding protein 


ORF00744 


SAG0660 


272 


membrane protein 


ORF00745 


SAG0661 


261 


conserved hypothetical protein 


ORF00747 


SAG0663 


282 


cylD protein 


ORF00748 


| SAG0664 


240 


cylG protein 


! ORF00749 


SAG0665 


101 


acyl carrier protein AcpC ! 


ORF00750 


SAG0666 


158 


cylZ protein FRAMESHIFT 


ORF00751 


SAG0667 


309 


cylA protein 


ORF00752 


SAG0668 


292 


cylB protein 


ORF00753 


SAG0669 


667 


cylE protein | 


ORF00754 


SAG0670 


317 


cylF protein 


ORF00755 


SAG0671 


731 


cyll protein 


ORF00756 


SAG0672 


403 


cylJ protein 


| ORF00757 


SAG0673 


191 


cylK protein 


ORF00758 


SAG0674 


113 


hypothetical protein 


Or\rUU7o9 


oAuUO f O 


171 




S ORF00760 


SAG0676 


885 


serine protease, subtilase family, putative 


ORF00761 


SAG0677 


1062 


hypothetical protein 


ORF00762 


SAG0678 




endopeptidase O DEGENERATE 


ORF00766 


SAG0679 


286 


hydrolase, alpha/beta fold family, putative 


ORF00767 


SAG0680 


! 339 


hypothetical protein ; 


ORF00768 


SAG0681 


353 


conserved domain protein 


ORF00769 


SAG0682 


409 


p rmeas , putative 


ORP00770 


SAG0683 




transmembrane protein Vexp3, putative FRAMESHIFT 


ORF00774 


SAG0684 


223 


ABC transporter, ATP-binding protein 
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ORP R f Mr* 


C A rSvVYV R -f Mrt 
OMOAAAA f\ T rxo. 


33 


An nntatlnn 


ur\ruu i f %j 




479 


KAJx to IvcU 1 lyJJUll lOUlial piULclll 


ORFfin77fi 
WrxiuU f f O 




9R1 


wlN/A~ciliry 1 lUUItJdoc, |JUlaUVc 


ORF00777 


SAG0687 


212 


DedA family protein, putative 


OKr 00778 


SAGOooo 


218 


AtJU transporter, a i r-Dinding protein 


ORr00779 


SAG0689 


257 


membrane protein, putative 


ORFQ0780 


SAG0690 


272 


conserved hypothetical protein 


ORF00781 


SAG0691 


294 


transcriptional regulator, LysR family 


L ORF00783 


SAG0692 


193 


regulatory protein, putative 


ORF00785 


SAG0693 


377 


1S1548, transposase 


ORF00786 


SAG0694 


173 


regulatory protein, putative, truncation 


ORF00787 


SAG0695 


330 


D-lactate dehydrogenase 


ORF00788 


SAG0696 


516 | 


sodiumrgalactoside symporter family protein, putative 


ORF00789 


SAG0697 


341 


2-keto-3-deoxygluconate kinase 


ORF00790 


SAG0698 


599 


beta-glucuronidase 


ORF00791 


SAG0699 


223 


transcriptional regulator, GntR family 


ORF00792 


SAG0700 


205 


2<Jehydro-3-deoxyphosphogluconate aIdolase/4- 
hydroxy-2-oxoglutarate aldolase 


UrsrUU ( yo 




AfiR 


oiucuronaie i so me rase 


f^Rpnn7Q^ 

VJr\rUUf ?7*f 


OMV3U f 


o*fo 


mannonaie aenyuraiase 


r\RFftfl7Q«% 


OnoU f Uo 


97Q 


ij-rnannonaie oxiuoreouciase 


nDcnn7Qfi 




97fl 


nyuroiase, naioacio oenaiogenase-iiKe Tamiiy 


nDcnn7Q7 
ur\ruu/y f 


oAbU / UO 


oyo 


giycosyi nyuroiase, Tamiiy o 


ot?Fnrt7QA 


QAfTSn7flfi 
OnOU f UD 




proline uipepuuase i 


HRPnn7QQ 

vjrxruu/yy 






iranscnpuonai reguiaior, rxegivi ramiiy 


ORF00800 


SAG0708 


488 


alpha amylase family protein 


ORF00801 


SAG0709 


332 


giycosyi transferase, group 1 family protein 


ORF00802 


SAG0710 


AAA 

444 


giycosyi transferase, group 1 family protein 


ORFQU803 


SAG071 1 


C A^ 

647 


tnreonyhtRrMA synthetase 


ORF00804 


SAG071 2 


234 


DNA-binding response regulator 


ORF008Q5 


SAG0713 


339 


conserved hypothetical protein 


ORFQ08Q6 


SAG0714 


188 


conserved hypothetical protein 


ORF0Q8Q7 


O A A/VT4 C 

SAGQ71 5 


216 


amino acid ABC transporter, permease protein 


ORF00808 


SAG071 6 


231 


amino acid ABC transporter, permease protein 


ORF00809 


I SAG0717 


266 


amino acid ABC transporter, amino acid-binding 
protein 


UnrUUO IU 


OnOU / IO 


9^1 


amino acio ado iransponer, m i f-uinoiny protein 


VJrvf UUO 1 1 


I <5Afifl71 Q 
OMOVJ # 1 s7 




PlM A_hvJnHinn racnAnea rani ilotnr 

LffNM'Uinainy response reguiaior 


ORPnnRi 9 


QA<^n79n 

OnOU t £\J 




sensory oox nisuume Kinase 


UrxrUUO 1 0 


QAf5n79i 




meiaiiO M Deia M> iaciamase Tamiiy proiem 


VJr\rUUO l«f 


QAtfilY799 




#%«-\ r\ m r\ tori k»% >r\/^+WQfi/^*al AfAfoin 

conserveo nypoineiicai proiem 




QAr5fl791 
OnuU / 


ZOO 


noonuciease in 


UrvrUuO id 


OnOU / 


1 17Q 


QK^r^ fonnll\/ nmlain 

oivio lamny proiem 


\Jr\ruuoi f 


OMoU/ZO 


9RR 
ZOO 


hydrolase, haloacid dehalogenase-like family 


ORF00818 


SAG0726 


274 


hydrolase, haloacid dehalogenase-like family 


vjrvruuoiy 


QAfin797 


OOD 


signal recogniuon panicie-uocKing proiem ris t 


ORF00820 


SAG0728 


270 


ABC transporter, substrate-binding protein 


1 ORF00821 


SAG0729 


300 


ABC transporter, permease protein, putative 


ORF00822 


SAG0730 


42 


ABC transporter, ATP-binding protein 


ORF00823 


SAG0731 


347 


bacterial luciferase family protein 


ORF00824 


SAG0732 


720 


transcriptional accessory protein Te*, putative 


I ORF00825 


SAG0733 


142 


conserved hypothetical protein 


ORF00826 


SAG0734 


87 


phag shock protein C, putative 


ORF00B27 


SAQ0735 


44 


hypothetical protein 


ORF00828 


SAG0736 


311 


HPr(Ser) kinase/phosphatase 
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ADC Qnf Ma 


OMUXXaa W\BT Vi 


aa k 
ad i 


l n Olall v/i I 


vJIaTUUOOU 


Oao v 'Of 


257 


nrnlinnnrotein diacvlalvcervl transferase 


ui\r uuoj^ 


OnOU / OO 


132 


v'V/i loci VCU ' iyfjuuiwu\<ai jj i id i i i 


nRPnnA^ 

UnrUUoOO 


OnOU* 057 


143 


cnnQPrvpd hvoothetical Drotpin 


ur\ruuoo*r 




91 


cnnQprved hvoothetical orotptn 

wUI Idol VCU "/r^ c ^ f Ivlolll 


ORpnnAo.^ 


OnV9u if 1 




nprifirlftsp U32 familv outativp 


Ur\rUuOO D 


OnOU f *r4» 






fiRPnnji^7 


OMUU / *lO 


/ U 


pnnQPn/prl hx/nnthptlcal nrntpin 


ORPfinRlfl 

UKrUUooo 


ortou / *H* 




momhrano nrntpin nutativo 


L/KrUUooy 


OnOU f **D 




A^ri'?-*-/Pc»04- troncnnrtor NIRAMR familv/ 
IVll \/L~l \k3*L~ U <3l lopui lt3l , INiAnlVIr lallllly 


\JKrUUo4U 


oAoU / 40 


ooy 


IlUOIIclVill UlUoy 1 IU icolo ^/lUlt7lll r\IUU 


UKrUUo4l 


Q A fin 7A7 




liUUIIaVlll oyllUlaotJ, al|Jlla oUUUflll 




oAbU/4o 


QQ7 I 

oy / 


nuuiiaViri utusynui6oi9 pruiein rxiun 


L/KrUUo4o 


QAAiA7ilQ 
O AoU / 


lOO 


rlKnflo\/in eunthaeo hota ciiKimif 
llUOIIaVin oyllUlcaoc, Uold oUUUMIl 




OMOU / OU 


AQfi 

**yo 


iyoyi"ir\iNn oyi hi loiaoo 


vJKrUuo4o 


QA^Sn7Ri 
OAbU/Ol 


ouu 


nyurutaotZf iiaiuaoiu uoiidiuytJi iaot7-ui\t5 iciiiiiiy 


L/KrUUCM-O 


Onou # OjC 




nhncnhnnl\/rf>ratp mntacp familv/ nrntpin 




OnOU / OO 


*I*V7 
lOf 


ohoP familv/ nrntpin niitafiv/p 
tiUov^ Idlilliy piUlciil, puuallvt? 


ur\ruuo*»o 


OnOU f O** 


°n^ 


rnncoa/prl rlnmain nrntpin 

vUl loci VCU UUI 1 IdJI 1 ^Jl VJ ICII 1 


rjRpnnft^n 

VJixi UUOQU 


OnOU f OO 




rvpnttiia^A I V\0 famiK/ 




OnOU # OD 


17A 


m n co r\/o H hv/nnthpfir^al nrntpin 
vUiiocivcu i ly [j«ju i clinch i^iuioiii 




QAf^n7R7 




linnnmtain ni itativ/p 


VVrxrUuooo 


OnOU / OO 


OS7S7 


nlinnpnrinnpntirlasp P niltativn 
OIIVJOV3I luwpc^iivicioo 1 | puiduvc 


ORF00856 


SAG0759 


931 


phosphoenolpyruvate carboxylase 


ORF00857 


SAG0760 


377 


IS 1548, trans posase 


ORF00859 


SAG0761 


422 


ceil division protein, rtsw/KOu/vopovc Tamiiy 


ORF00861 


SAG0762 


398 


translation elongation factor Tu 


ORF00863 


SAG0763 


252 


triose phosphate isomerase 


ORF00865 


oAG07o4 


oon 
^oO 


phosphoglycerate mutase 


ORF00866 


oAou7oo 


DO 1 


peniciiiin-Dinaing protein 


ORF00867 


oAoU7oo 


•4 AQ 


recombination protein RecR 


ORF00868 


5AG0767 


o4o 


D-alanine— D-alanlne ligase 


ORF00869 


O A PA7C O 

oAo07oo 


4oo 


u UK-rM-awiyinriu ^a^^oylalanyl-u^lUlamyl-z l D-■ 
diaminopimelate~D-alanyl-D-alanyl ligase 


rrtrt a^f\ 

ORF00870 


5Aou7o9 


4L)b 


oxalate norm ate anuporcer 


ORF00871 


SAG0770 


ooo 

228 


conserved hypothetical protein 


ORF00872 


SAG0771 


512 


ceil wall surface anchor family protein 


ORF00873 


o a t /o 

SAG0772 


514 


peptide chain release factor 3 


ORF00874 


oAo077o 


M Oft 


conserveo nypoineucai proiein 


ORF00876 


SAG0774 


244 


ABC transporter, ATP-binding protein 


ORF00878 


SAG0775 


220 


ABC transporter, permease protein 


ORF00879 


SAG0776 


276 


lipoprotein , putative 


ORF00880 


SAG0777 


528 


ATP-dependent RNA helicase, DEAD/DEAH box 
family 


ORF00882 


SAG0778 


88 


conserved hypothetical protein 


ORF00883 


SAG0779 


254 


conserved hypothetical protein 


ORF00884 


C A AA70A 

SAG0780 


246 


acyltransferase family protein 


ORF00885 


SAG0781 


217 


competence protein CelA 


ORF00887 


j SAG0782 


745 


DNA internaiization-retated competence protein 
ComEC/Rec2 


ORF00888 


SAG0783 


| 269 


hydrolase, haloacid dehalogenase-like family 


ORF00889 


SAG0784 


314 


sugar-binding transcriptional regulator, Lad family 


ORF00880 


8AQ0786 


330 


Gonsarvsd hypothetloat protein 


ORF00891 


SAG0786 


242 


conserved domain protein 


ORF00892 


SAG0787 


345 


DNA polymerase III, delta subunit, putative" 
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ADC Da{ KI 

UKr K6T N . 


5 AoXXXX K TIM . 


33 i 


t\nnoiciii n 


Urvruuoyo 


oAbU f OO 


£Xt£. 


cunomviHp rtiQimttocA Fo.Mn 
oUpoiUAiuo uioiuuiaoo, i civil 1 


ORF00894 


SAG0789 


283 


transcriptional antiterminator UcT 


ORF00895 


SAG0790 


622 


PTo system, Deta-giucosiaes-specrnc iiadu 
xjrnjjui iciiio 


npcnntiQR 
UKrUUoyo 


oAvjUf y i 


HfO 


fi_nhncnho.-hpta-n|i ir^clrlacQ 


UKrUUoyo 


oMou f y £. 


OOf 




ORruuoyy 


oAoU f y o 


ooU 


cons6rv6u nypoineucai protein i ior\uuu*+«j 


OKruuyuu 




4io 


jenrioaSo, wiiir lamuy 


ORF00902 


oAvaU f yo 


IRA i 

oo4 


conservea nypoineiicai protein 


ORF00903 


SAG07yo 


14f 


transcriptional regulator, MarR family 


ORF00904 


SAGQ797 


.34/i 


^aaenosyirneinionine.iKiNiA nuosyiiransTerase- 

oUl 1 1 c 1 do c 


UKrUUyUO 


QAf2fT7QR 
OnOU/oO 


99fi 


1 1 ici i iui di its jjivjitjin, pLiuauw 


UKruuyuo 


QAf5fY7QQ 
OnV3ui99 


9^ 


V^IUU^JOCtl 1 (It Hrf HJOJJl Id It? IdUlllDldOD 


UKrUUyUf 


onoUOUU 


O IO 


\j 1 u la u ll u i la 0"Udl lolciasao UUlllalll {JiuiGiii 


UKruuyuo 


oAoUoUl 


9^Q 


rihncnmal email c 1 1 hi in it ncoi 1H01 irirlino cwnthacp 
IIUUoUIHdl ollldll oUUlilllt [JoCUUVJUl IUII It? oyuilldoc 


UKruuyuy 


QAitsnsino 
oAoUoUl 


oo 


iiyjjuii icuv/di pivjioin 


UKruuyiu 


OnOUOUO 


ooo 


mninr fcif ilitatnr famih/ nmtoin 


UKrUUyi 1 


OAV3UOU** 


O I 


r*nmnptonpp nmtoin f^niA 


UKrUUyi^d 


oAoUoUO 


OUT 


rtltrr#™ionrlririor\tirlaco R 


VJr\rUUyi o 


Or\OUO\JO 


9na 


iiyuiuiaoc, iteiiwciwiu vjci idivjk^d iqo~iii\c iui i my 




OnOUOU / 




v^MicuiyiudMoiddoc laiiiiiy fJt\j*x3Mw 


UKruuy To 


OMOUOUO 


ouy 


nrntoacp ma+i i ration nrntoin ni itsitix/n 
|J|(JLt3doc 1 1 IdLUI allUI 1 piVJidll, |JUUSI1IVC3 


ORF00918 


SAG0809 


161 


conserved hypothetical protein 


ORF0091 9 


SAGOolO 


o72 


alanyl-tRNA synthetase 


ORF00921 


SAG0811 


238 | 


membrane protein, putative 


ORF00922 


SAG0812 


272 i 


glycosyl transferase, family 8 


ORF00923 


SAG0813 


81 


hypothetical protein 


ORF00924 


SAG0814 


95 


conserved domain protein 


ORF00925 


SAG0815 


71 


transcriptional regulator, Cro/CI family 


ORF00926 


SAG0816 


253 


conserved hypothetical protein 


ORF00927 


SAG0817 


187 


conserved hypothetical protein 


ORF00928 


SAG0818 


319 


ribonucieoside-diphosphate reductase 2, beta subunit 


ORF00929 


SAG0819 


719 


ribonucteoside-diphosphate reductase 2, alpha subunit 


ORF00930 


SAG0820 


74 


ribonucieoside-diphosphate reductase 2, NrdH-redoxin 


ORF00931 


SAG0821 


87 


phosphocarrier protein HPr 


ORF00932 


SAG0822 


577 


phosphoenolpyruvate-protein phosphotransferase 
__ 


ORF00933 


SAG0823 


475 


glyceraldehyde-3-phosphate dehydrogenase, NADP- 
dependent 


ORF00934 


oAG0o24 


41 f 


poiysaccnanae aeaceTyiase ramuy proiein 


ORF00935 


SAG0825 


360 


ATP-dependent RNA nelicase, DcAD/DEAH box 
family 


ORF00936 


SAG0826 


209 


uridine kinase 


ORF00937 


SAG0827 


165 


conserved hypothetical protein 


ORF00938 


j SAG0828 


554 


DNA polymerase III, gamma and tau subunits 


ORF00939 


SAG0829 


64 


conserved hypothetical protein 


ORF00940 


SAG0830 


311 


biotin-acetyl-CoA-carboxylase ligase 


ORF00941 


SAG0831 


398 


S-adenosylmethionine synthetase 


ORF00942 


SAG0832 


753 


hypoth ticaljgroteln 


ORF00943 


SAG0833 


181 


hyp th tJcal protein 


ORF00944 


SAG0834 


42 


hypothetical protein 


ORF00945 


SAG0835 


188 


conserved hypothetical protein 
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ADC D f K.I ~ 

UKr K T NO. 


SAGxxxx Ref N . 


aa 


Annotation 






A OH 


conserved hypothetical protein 




oAoUoo/ 


4Zo 


Abo iransporter, a i rMJinding protein 


UrvrUUyoU 


oAbUoOO 


Zoo 


hypothetical protein 




bAbUo^y 




transcriptional regulator, TenA family 


OD cAnn co 
UKrUUyOZ 




OAR 


phospho methyl pyrimidine kinase 


vJKrUUyoo 


O A AflOil <1 

oAoUo41 


oco 
^00 


hydroxyethylthiazole kinase 


UKrUuyo4 


SAG0842 


223 


thiamine-phosphate pyrophosphorylase 


ORrOOyoo 


SAG0843 


419 


UDP-N-acety (glucosamine 1-carboxyvinyltransferase 


vjrvruuyoD 






acetyiiransierase, oima i tamuy 


UKrUuyOf 


oAvjUoAo 


A 9*7 


ot>o aomain protein 


ORF00958 


SAG0846 


286 


methionine aminopeptidase, type 1 


ORF00959 


SAG0847 


306 


ribonuclease BN, putative 


ORF00961 


SAG0848 


151 


GtrA family protein 


ORF00962 


SAG0849 


169 


conserved hypothetical protein 


ORF00963 


SAG0850 


652 


DNA hgase, NAD-dependent 


ORF009o4 


SAG0851 


339 


BmrU protein, putative 


ORF0U9DD 


SAG0852 


766 


pullulanase, putative 


\JKrUUyb7 


CAAAOCO 

oAGQooo 


coo 


1 ,4-alpha-g!ucan branching enzyme 


ADCnnnco 


SAGUOD4 




glucose- 1 -phosphate adenylyltransferase 


L/Kruuyoy 


oAoUoOO 




l\fAAAAA kl a a« mil 1 ! a aI a v\aa4aSm /^l*ir^ F't^Afcir^O-l ~ d~ 

glycogen otosyntnesis protein oigu rKArvitonir i 


ORFQ0Q71 
urvruua/ i 


omouoju 


476 

*ti u 


y iy *-«jy d i oy i hi idoo 


ORF00972 


SAG0857 


66 


ATP synthase F0, C subunit 


\JKrUUy/o 


CAADQRQ 

oAlsUoOo 


ZOO 


a i k syntnase ru, a suountt 






TOO 


ai v syntnase ru, o suounit 


vJKruuy f o 


CAPAfiRft 

oAbUODU 


1 (0 


ATP synthase F1 , delta subunit 




oAvjUoD 1 


OUT 


a i k syntnase r i , aipna suDunit 


nocnno77 


CAPnflfto 
0AV9U0OZ 


^yo 


ATP synthase F1, gamma subunit 


UKrUUy/ o 


oAtjUOOO 


40O 


ATD A\mikAAA A k\Afo r%i tft^i *nU 

a i r* syntnase r i , Deta suounit 


wKrUUy r y 


oA<jUOD4 


■10*7 
JO/ 


ATP synthase F1 , epsPon subunit 


ODcnnoQA 
vJKrUUyoU 


oAv^UoOO 


"7*2 
10 


conserved hypothetical protein 


OKrOUyol 


OAArtQCC 

oAvsQobo 


423 


U D P-N-acetylg I ucosam i n e 1 -carboxyviny Itransf erase 


ORFnnQH 0 
VJr\r UU90£ 


OnOUOO f 


CO 

00 


pAncon/oH Hv/nnthoti/*9l nrntoln 

conservou nypDuicucoi prui6in 


\JrvrUU300 


OrtOUODO 




OKIA^Antn/ nn^loaco 

u iNM**en iry nucieoot? 


ORF00984 


SAG0869 


346 


phenylalanyMRNA synthetase, alpha subunit 


Aocnnnoc 

ORruuyoo 


O A A n 07ft 

oAGOofO 


173 


acetyl transferase, GNAT family 


ORF00986 


SAG0871 


j 801 


phenylalanyt-tRNA synthetase, beta subunit 


ORF00987 


SAG0872 


300 


conserved hypothetical protein 


ORF00988 


SAG0873 


1077 


exonuclease RexB 


ORF00989 


SAG0874 


1207 


exonuclease RexA 


ORF00990 


SAG0875 


305 


magnesium transporter, CorA family, putative 


ORF00991 


SAG0876 


458 


tRNA modification GTPase TrmE 


ORF00992 


! SAG0877 


636 


ABC transporter, ATP-binding protein j 


ORF00993 


SAG0878 


322 


acetoin dehydrogenase, thymine PPi dependent, E1 
component, alpha subunit 


ORF00994 


SAG0879 


332 


acetoin dehydrogenase, thymine PPi dependent, E1 
component, beta subunit 


ORF00995 


SAG0880 


462 


acetoin dehydrogenase, thymine PPi dependent E2 
component, dihydrolipoamide acetyltransferase 


ORF00996 


SAG0881 


585 


acetoin dehydrogenase, thymine PPi dependent, E3 
compon nt, dihydrolipoamide d hydrogenas© 


ORF00997 


SAG0882 


329 


lipoate-protein Hgase A 


ORF00998 


SAG0883 


261 


cobyric acid synthase, putative 
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ORF R f No. 


SAGxxxx Ref N . 


aa 


Ann tatlon 


ORF00999 


SAG0884 


447 


mur ligase family protein 


ORF01000 


SAG0885 


283 


conserved hypothetical protein TIGR00159 


ORF01001 


SAG0886 


319 


Gram-positive signal peptide, YSIRK family domain 
protein 


ORF01002 


SAG0887 


450 


phosphoglucomutase/phosphomannomutase family 
protein 


ORF01003 


SAG0888 


123 


conserved hypothetical protein [ 


ORF01004 


SAG0889 


126 


conserved hypothetical protein 


ORF01005 


SAG0890 


376 


oxygen-independent coproporphyrinogen 111 oxidase, 
putative 


ORF01006 


SAG0891 


245 


conserved hypothetical protein 


ORF01007 


SAG0892 


256 


hydrolase, haloacid dehalogenase-like family 


ORF01008 


SAG0893 


218 


conserved hypothetical protein 


ORF01009 


SAG0894 


1370 


conserved hypothetical protein 


ORF01010 


SAG0895 


289 


Hpoyl-binding domain protein 


ORF01011 


SAG0896 


108 


oxidoreductase, putative 


ORF01012 


SAG0897 


221 


conserved hypothetical protein \ 


ORF01013 


SAG0898 


83 


hypothetical protein 


ORF01014 


SAG0899 


57 


hypothetical protein 


ORF01015 


SAG0900 


56 


hypothetical protein 


ORFQ1016 


SAG0901 


127 


hypothetical protein 


ORF01018 


SAG0902 


45 


hypothetical protein 


ORF01019 


OA ^AAAO 

SAG0903 


44 


1- . - - At- - 1 * . .1 _ A. — * - f 

hypothetical protein 


r\ a r\*~*A 

ORF01021 


o a Ann/tit 

SAG0904 


56 


hypothetical protein 


ORF01022 


SAG0905 


a oa 

138 


nucleoside diphosphate kinase 


ORF01023 


SAG0906 


610 


GTP-binding protein LepA 


-ORF01024 


SAG0907 


877 


streptococcal htsudtne triad family protein 


ORF01025 


SAG0908 


OAO 

203 


HD domain protein 


ORF01026 


SAG0909 


154 


acetyltransferase, GNAT family 


ORF01027 


SAG0910 


AAA 

144 


PilB-related protein 


ORF01030 


"* AA AAAiliI 

SAG091 1 


930 


cation-transporting ATPase, E1-E2 family 


ORF01031 


SAG0912 


367 


nucleoside diphosphate kinase domain protein 


ORF01032 


SAG0913 


212 


chloramphenicol acetyltransferase 


ORF01 033 


a ^%/tr\4 ji 

SAG0914 


203 


conserved hypothetical protein 


ORF01034 


SAG0915 


405 


Tn916, transposase 


ORF01 035 


SAG0916 


67 


Tn916 f excisionase 


ORF01037 


^\ A r\r\r\A n 

SAG0918 


76 


Tn916, hypothetical protein 


ORF01 038 


SAG0919 


157 


Tn9io, nypotnetical protein 


ORF01039 


o a />nno a 

SAG0921 


4 4 7 

117 


Tn916, transcriptional regulator, putative 


ORF01040 


o a Annoo 

SAG0923 


con 
639 


Tn916, tetracycline resistance protein 


ORF01041 


SAG0925 


04 f\ 

oil) 


Tn9io t nypotnetical protein 


OKrUlU4^ 


OAAftftOO 

oA<jU92o 


ooo 
ooo 


i nyio, NLrvHou Tamiiy protein 


ORF01044 


SAG0927 


725 


Tn916, hypothetical protein FRAMESHIFT 


ORF01047 


SAG0928 




Tn916 t hypothetical protein FRAMESHIFT | 


ORF01048 


SAG0929 


168 


Tn916, hypothetical protein 


ORF01049 


SAG0930 


165 


Tn916, hypothetical protein 


ORF01050 


SAG0931 


73 


Tn916, hypothetical protein 


ORF01051 


SAG0932 


401 


Tn916 ( transcriptional regulator, putative 


ORF01052 


SAG0933 


461 


Tn916, FtsK/SpolllE family protein 


ORF01053 


SAG0934 


128 


Tn916, hypothetical protein 


ORF01054 


SAG0935 


104 


Tn916, hypothetical protein 


ORF01056 


SAG0937 




ABC transporter, ATP-binding protein, FRAMESHIFT 


ORF01057 


SAG0938 


i 122 


transcriptional regulator, GntR family 


ORF01058 


SAG0939 


1034 


DNA polymerase 111, alpha subunit 
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SAGxxxx Ref No. 


33 / 


Annotation 


ORF01059 


SAG0940 


340 I 


3-phosphofructokinase 


ORF01060 


SAG0941 


500 


pyruvate kinase Jj 


Ur\TU I UD i 




1 oo 


signal peptidase I, putative 


UIaiU lUDil 




47 


hypothetical protein 


vJrvrUI UOj 




fifl4 


3lucosamine~fructose-6-phosphate aminotransferase 
isomerizing) 


ORF01 0R4 


SAG0945 


377 


IS1548, transposase 


ORFOIOfifi 


SAG0946 


109 


phnA protein 




SAG0947 


213 


amino acid ABC transporter, permease protein 


ORF01069 


SAG0948 


209 


amino acid ABC transporter, ATP-binding protein 


UKrOI 070 




«f 0 


ominn acifi ARP trancnnrtor amino aniri-hinriino 
all III lis avslU ADV./ U di lopxJI Id , all ill iu awu uiiiuiiiij 

Drotein 


ORF01 072 








ORF01073 


SAGOyol 




panioinendit? Kinases 


r"/%<< /vtji 

ORF01074 


oAouyo^ 


lyo 


rnncorv/orl hx/nr^thottfo! nrnfpin 
COiiocivtsu ny|juuieuoai fjiuiciii 


/~\f-> r~r\A atc 

ORF01 075 


oAoUyoo 


i^y 


CyUUllltJ Ucaillll laotJ 


ORF 01 076 


5Aw)yo4 


o4y 


lipoprotein 


ORF01077 


oAtjjuyoo 


on 


c, mof ARP froncnnrtor ATP-hlnrlinn nrntpin 
SUyal nDv Uans>|JUI lOI , r\ I r -Ull IUII iy jjujiciii 


ORF01078 


SAGOyob 




eiiMor AQp Irancnnrfor nomoscA nmtAin mitfltivA 
oUyal HDO lidnbpuilci, jjtsi 1 1 loaoo jjivwsiii, puiauvg 


vjrvrw iu f y 




318 


sugar ABC transporter, permease protein, putative 


ORF01080 


SAG0958 


456 


NADH oxidase 


ORF01081 


SAG0959 


329 


L-lactate dehydrogenase 


ORF01082 


SAG0960 


819 


DNA gyrase, A subunit 


ORF01083 | 


SAG0961 


247 


sortase SrtA 


ORF01084 


SAG0962 ! 


137 


glyoxylase family protein j 


ORF01085 


SAG0963 


320 


conserved hypothetical protein 


ORF01086 


SAG0964 


375 


Na+/H+ exchanger family protein 


ORF01087 


SAG0965 


127 


IS1381, transposase OrfA 


ORF01088 


SAG0966 


129 


IS1 381 . transposase OrfB j 


ORF01089 


SAG0967 


520 


GMP synthase j 


ORF01090 


SAG0968 


232 


transcriptional regulator, GntR family 


ORF01091 


SAG0969 


444 


gid protein 


ORF01092 


SAG0970 


247 


acetyltransferase, GNAT family 


ORF01093 


SAG0971 


282 


lipoprotein.putative 


UKrU lUyo 


ortbuy / £. 




rnn«iprvflri hvnothetical Drotein FRAMESHlFT 


UKrUl uy D 


Onuuy t o 


320 


nfcin-rasistance Drotein. outative 


vjKrinuyf 




250 


ABC transporter, ATP-binding protein 


notrrn aqa 




fiS1 


ABC transporter oermease Drotein. outative 


(JKrUiuyy 




*>*>*> 


HMA-hindina resoonse reaulator 


\JRrOnUU 


QAf2HQ77 






ORF01101 


oAvjUy/o 


ooo 


cito-Qnf>rifir r^nomhinase Dhaae intearase familv 


ORF01102 


SAG0979 


553 


ABC transporter, substrate binding protein, putative 


ORF01103 


SAG0980 


257 


conserved hypothetical protein 


ORF01104 


SAG0981 


228 


SatD 


ORF01106 


SAG0982 


521 


signal recognition particle protein 


ORF01108 


SAG0983 


110 


conserved hypothetical protein 


ORF01109 


SAG0984 


437 


sensor histidine kinase CiaH 


ORF01110 


SAG0985 


226 


DNA-binding response regulator CiaR 


ORF01111 


SAG0986 


849 


amln peptidase N 


ORF01112 


SAG0987 


217 


phosphate transport system regulatory protein PhoU 
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aa i 


Annotation 


ORF01113 


SAG0988 


252 


phosphate ABC transporter, ATP-binding protein PstB, 








putative 


ORF01114 


SAG0989 


267 


phosphate ABC transporter, ATP-binding protein PstB, 








putative 


ORF01115 


SAG0990 


295 


phosphate ABC transporter, permease protein PstA, 








putative 


ORF01116 


SAG0991 


305 


phosphate ABC transporter, permease protein 


ORF01117 


SAG0992 


286 


phosphate ABC transporter, phosphate-binding protein 


ORF01118 


SAG0993 


436 


NOL1/NOP2/sun family protein 


ORF01119 


SAG0994 


254 


inositol monophosphatase family protein 


ORF01120 


SAG0995 


93 


conserved hypothetical protein 


ORF01121 


SAG0996 


137 


conserved hypothetical protein 


ORF01122 


SAG0997 


310 


macrolide-efflux protein mreA/riboflavin biosynthesis 








protein RibF 


ORF01123 


SAG0998 


294 


tRNA pseudouridine synthase B 


ORF01124 


SAG0999 


143 


acetyltransferase, GNAT family 


ORF01125 


SAG1000 


423 


conserved hypothetical protein 


ORF01126 


SAG1001 


196 


conserved hypothetical protein 


ORF01127 


SAG1002 


292 


protease, putative 


ORF01128 


SAG1003 


876 


permease, putative ! 


ORF01129 


SAG1004 


233 


ABC transporter, ATP-binding protein 


ORF01131 


SAG1005 


706 


DNA topoisomerase I 


ORF01132 


SAG1006 


280 


DprA/SMF protein, putative DNA processing factor 


ORF01133 


SAG1007 


342 


iron-compound ABC transporter, iron-compound- 








binding protein 


ORF01134 


SAG1008 


253 


iron compound ABC transporter, ATP-binding protein 


ORF01135 


SAG1009 


324 


iron compound ABC transporter, permease protein 


ORF01136 


SAG1010 


320 


iron compound ABC transporter, permease protein 


ORF01137 


SAG1011 


182 


. — : 

acetyltransferase, CysE/LacA/LpxA/NodL family 


ORF01138 


SAG1012 


253 


ribonuclease HII 


ORF01139 


SAG1013 


283 


GTP-binding protein 


ORF01 140 


A r"» A f\ A A 

SAG1014 


190 


conserved hypothetical protein 


ORF01 142 


A A f% A f\ A f 

\ SAG1015 


494 


carbon starvation protein CstA, putative 


ORF01 143 


SAG1016 


244 


response regulator 


ORF01144 


SAG1017 


579 


sensor histidine kinase, putative 


ORF01145 


SAG1018 


40 


hypothetical protein 


ORF01146 


SAG 101 9 


39 


conserved hypothetical protein, rKAMtonlr l 


ORF01 148 


SAG 1020 


227 


hypothetical protein 


ORF01 149 


SAG1021 


107 


hypothetical protein * 


ORF01150 


SAG 1022 


177 


hypothetical protein 


ORF01151 


SAG1023 


48 


hypothetical protein 


ORF01152 


SAG1024 


183 


hypothetical protein 


ORF01153 


^\ A f> A\ Af>C 

SAG 1025 


149 


hypothetical protein 


ORF01156 


SAG1026 




immunogenic secreted protein, DEGENERATE 


ORF01157 


SAG1027 


84 


conserved hypothetical protein 


ORF01158 


SAG1028 


196 


hypothetical protein 


ORF01159 


SAG1029 


101 


hypothetical protein 


ORF01160 


SAG1030 


304 


conserved hypothetical protein 


ORF01161 


SAG1031 


120 


extracellular prot in, putative POINT MUATION 


ORF^onea 


SAG1032 


85 


cons rved hypothetical protein 


ORF01164 


SAG1033 


1309 


FtsK/SpoIHE family protein 


ORF01166 


SAG1034 


55 


hypoth tical protein 



682 



WO 2004/018646 PCT7US2003/026827 
Tabl 32: Conv rsion of ORF Ref Nos. with SAG Ref N s. 



ORF Ref No 


QAAww Raf No 
OMUaaaa rvtsi «Ut 


93 j 


Vn n fit Jit I n 


ORF01167 


<5AG1035 


424 


conserved hVDOthetical Drotein 


ORF011RR 


«5AG103fi 

OnO 1 w«)U 


80 


r^n^prved hvDOthstical nrotpin 


ORF01 1RQ 


cAfll 037 

OnO 1 Uu * 


157 


hvnnthetical Drotein 


ORF01179 ! 


«3AG103R 

OnO 1 UOO 


1003 


nhanp infection Drotein nutative 


ORF01 1 73 




QR 


r».n n cp rv^rl hvnothptin?*! nmtpln 


ORF01 174 


o a 01 04.0 


9R0 

&UU 


r/incpn/pH Hnmaln nmtpln 

vUNOCI VOU vlV^lllalll ^JlOiOIII 


Ur\rUl I/O 


Q Aft 1041 
OMO 1 U*t 1 


107 


nyuuu icuuai pjuicni 


ORF0117R 
UrvrUI I/O 


O A ft* flylO 


10RO 
1 uou 


rarhamr»\/!-nhn<;nhatfi cvnthn^p brnn J hi I nit 


ORFA1177 


OnO 1 U*rO 


35R 


r^rHamrivl-nhnQnhatA Qv/ntha^p smAll ^uhunit 
uai i^cxi I \\jyi yjt tyj&fji laio oy 1 1 ti laoc, ot i iaii ouuuhii 


ORFOI 1*7A 

L/rvruT i/o 


OnU 1 UH-*r 


307 

Ovf 


ao[Jal Laic vcllUalltuyiuolloldOOw 


ORF0117Q i 
UrvrU I I /y 


OnV3 1 UHO 


430 ( 


Hihv/rirnnrntfl^p miiltlfnnrttnnal nomnlpx tvnp 

Ull \y Ul UUI UlaoC, 1 1 luiUIUI llyliui lal iaihiuica vypc 


ORF011RO 
Ur\rU I lOU 


QAG104R 


90Q 


nrntatp nhoQnhorihocv/itrariQf aj*?iqp 

Ul W LCI tCJ Ul IwOUl IUI IL/UOyiU al IOI Ol Quo 


orfoi 1R1 

wr\rU I lOl 


OnO 1 U*r / 


233 


uiuuuiiio w ui ioo|ji icius ucuai uuAjiaoo 


Urviu I lO^ 


QAG104R 
OnO 1 UHO 


410 

*T IU 


1 1 Id 1 IUI al It? UlUldll^ (JULdUVC 


ORFOHfl^ 


QAG104Q 


513 


ARO trsin^nnrter AXP-hindina Drotein 

r\ L-> V-^ U al lOUvl Iwl | I i Ull lull iy pivlvlll 


ORFOI 1RA 


QAfii 050 


112 


lihnnuHpotide reductase truncation 

1 IwVl IUwICUUUw ICUUwlQQv ( UUIIwaUV/ll 


Ur\rU 1 IOO 


^Aft1051 


35R 


n<%nartatp-^pmialdehvde dehvdroaenase 

doL/ai laic oci i iiaiuci lyuc uci iy ui uyvi iood 


i ORF01 1 ftfi 


<%AG1 059 

OnO 1 \J\J£. 


47 


cell wall surface anchor famllv orotein outative 

^V?ll VVQll QUI IQwO CI I IUI IUI Idllllly |,/IWlwlllt puiouvw 


ORF011R7 


SAG 1053 


30 


hvnothetlcal nrotein 

1 1 JpUU 1 VUVUl |^l Ulwll 1 l 


ORF011RR 


^AG1 054 


531 


cardiolioin svnthetase 


ORF011RQ I 

Or\i U 1 Iu9 


SAG1055 


556 


formate— tetrahvdrofolate lioase 

IwllllBlv IvU Ml If vl VlWIBIO II^GlwW 


orfoi iqo i 

\Jr\t\J i 1 3v 


SAG1 05R 

OnO 1 WO (J 


339 


linoate-nrotpin lioase A 

IIUVQKrIIIVKfll 1 llyuou O 


ORF011Q1 

WixlU 119 1 1 


<5AG1057 


292 


conserved hvnothetical orotein 

wvl lOvl VwU 1 IjfUvU IWUuCU Ulwlvll 1 


ORF011Q9 


QAG105R 


272 


cnnserved hvnothetical orotein 


urvru i i90 


QAG105Q 

OnO 1 Uv)57 


110 

1 I u 


nlvcine cleavaoe svstem H orotein outative 

u,iyvsii 10 vivovayv o j oici 1 1 » i piviviiii ^/uiaiivv 




^AGIOfiO 


328 


harterial luciferase familv orotein 

uauiwi ioi luuiciuwo i aii my piwivin i 


ORF011Q5 


SAG10R1 
ono i uu i 


• 399 


nxidoraductase FMN-bindina 


ORF011Q7 


SAG10R2 


282 


lino ate* orotein iioase A familv orotein 

IIUUQiw UlUIWll 1 IIUOww r% lull IIIV i^#UW«ll 


\Jr\~\J 1 I5?0 


^AG10R3 


92R 
&&o 


flavonmtp in-related nrotein 

navu|jiuicii i iciaicu piviwiii 


ORF01 1 QQ 


SAG1064 

O/AVj 1 UU*T 


180 


tlavo orotein familv orotein 

iiuvu|/iuivin laiiiiiy piuiwiii 


ORF01900 


SAG10R5 

QrtVJ IUUJ 


190 


membrane orotein outative 


orfoi 901 
urvru i^u i 


O Aft 1 Ofifi 


572 


nhosnhonli irnmi itnsp 

Ul lUoUl HJUIUwUI 1 IU UlOO 


ORF01 909 


^AG10R7 


178 


ISRR1 transnosase OrfA 


I orfoi 903 


55AG10RR J 
ono luuu * 


277 


ISRR1 transnosase OrfB 

1 VJUU 1 | U ul lOpwwQwv Wl IU 


ORF01904 


QAG10RQ 

OnO 1 VJ057 


65 


hvnnthetical nrotein 
i iy jjuu icuocti uiukciii 


orfoi 90 5 * 


e Aft 1070 
OnO lUiu 


577 


ARO transnnrter ATP-hindinn/nprmease nrotein 

r^tLJ\^ LI ul lOUUI Iwl | f \ 1 1 Ull IUII iy/ ^vl ■ 1 Ivuww Ul Wlwll i 


ORF01906 


SAG1 071 

O/Avj |Uf 1 


573 


ABO trans norter ATP-bindina/oenmease Drotein 

U Gil lw|/VI Ivl f » \ 1 f l/H IUII IUI Uwl 1 1 1 WUvW l/l vtwll 1 


OR F0 1907 


SAG1072 


200 


conserved hvoothetical orotein 


ORF01 90B 


SAG1 073 
ono iv/fo 


325 


conserved hvoothetical orotein 

UWIImwI VwU lltpVUIwUVUl |/l Viwll 1 


I ORF01 90Q 


SAG1074 
ono i u i *r 


418 


Serine hvdroxvmethvltransf erase 


ORF01 91 0 


SAG1075 


183 


Sua5/YciOA'rdC/YwiC family protein 


ORF01211 


SAG1 076 


276 


modification methyiase, HemK family 


ORF01212 


SAG1077 


359 


peptide chain release factor 1 { 


UKrUl^lo 


OArl'l n*7A 
onol U / O 


! IRQ 


uiyrniuinB Kinases 


ORF01214 


| SAG1079 


60 


4-oxalocrotonate tautomerase 


i ORF01915 


SAG10R0 
Ono iuou 


47 


hvnothetical nrotein 

i ivuuu iquwgu ui uioii i 


ORF01216 


SAG1081 


312 


ApbE family protein 


ORF01217 


SAG1082 


200 


conserved hypothetical protein 


ORF01218 


SAG1083 


411 


conserved hypothetical protein 


ORF01219 


SAG1084 


262 


formate/nitrite transporter family protein 


ORF01220 


SAG1085 


424 


xanthine permease 


ORF01221 


SAG1086 


193 


xanthine phosphoribosyftransferase 


ORF01222 


3AG1087 


327 


guanoalne monophosphat reductas 


ORF01223 


SAG1088 


446 


drug resistance transporter, EmrB/QacA family, 
putative 
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LIKn K T NO. 


SAuXXXX K©T NO. 


aa 


Ann tati n 


urxrui 


oMu i uoy 




conserved hypothetical protein 


\Jt\rV \£Z.O 




ooo 


potassium uptake protein, putative 






0*1 R 


oxidoreductase, short chain dehydrogenase/reductase 

famiK/ FRAMFSHIFT 


ORF01227 


SAG1092 


330 


nhncnhatp 9f*ot\/ltroncfor9ca 
pilUoptlaLC oLfC iy IU al loltJl aoo 


ORF01228 


SAG1093 


294 


rihncnmfll larnft QiiKnnif" nepi iHm iri/iino eunHioco RhiPt 
i luvjoui i icii 101 yo ouuuiiiL jjocuuuuiiunm oyiiuicioc?, imulj 

subfamilv - 

0MVlHl 1 til J 


ORF01229 


SAG1094 


278 


conserved hypothetical protein 


ORF01230 


SAG1095 ! 


223 


GTP dvto oho SDho kinase familv d rote in 


ORF01231 


SAG1096 


190 


con served hvoothetical nrntein 


ORF01232 


SAG1097 i 


324 


rihose-ohosohate nvronhosnhnkinase 


ORF01233 


SAG1098 


371 


cysteine riesulnhurasp 


ORF01234 


SAG1099 


115 


conserved hypothetical protein 


! OPFni2^*? 


OnO 1 1UU 




uiNA-Dinaing protein 


ORF01236 


SAG1101 


226 


DNA repair protein RadC 


ORF01237 


5AG1102 


377 


membrane protein, putative 


ORF01238 


SAG1103 


478 


6-phospho-beta-giucosidase 


ORF01239 


SAG1104 


204 


platelet activating factor, putative 


ORF01240 


SAG1105 


273 


hydrolase, hafoacid dehalogenase-like family 


ORF01241 


SAG1106 


309 


transcriptional regulator, AraC family, putative 


ORF01242 


SAG1107 


510 


voltage-gated chloride channel family protein 


ORF01243 | 


SAG1108 


357 


spermldine/putrescine ABC transporter, 
spermidine/putrescine-binding protein 


ORF01244 


SAG1109 


258 


spermidine/putrescine ABC transporter, permease 
protein 


ORF01245 


SAG1110 


264 


spermidine/putrescine ABC transporter, permease 
protein 


ORF01246 


SAG1111 


384 


spermidine/putrescine ABC transporter, ATP-binding 
protein 


ORF01247 


SAG1112 


300 


UDP-N-acetyienolpynjvoylglucosamine reductase 




OnOl no 


4 CO 


^-amino^-nyaroxyH>nyaro)^metnyiainyaroptenaine 

\jy i \J\Ji luopi 1UMI loot? 


ORF01249 


SAG1114 


120 


dihydroneo pterin aldolase 


ORF01250 


i SAG1115 


267 


dihvdroDteroate svnthase 


ORF01251 


SAG1116 


187 


GTP cyclohydrolase 1 


ORF01252 


SAG1117 


420 


folylpolyglutamate synthase 


ORF01253 


SAG1118 


295 


rarD protein 


ORF01254 


SAG1119 


288 


homoserine kinase 


ORF01255 


SAG1120 


427 


homoserine dehvdroaenase 


ORF01256 


SAG1121 


295 


Dotvsaccharide deacetvtase familv orotein 


ORF01257 


SAG1122 


515 


trans do rter BCCT famiiv orotein 

uuiig^vuuif L-^V-W^ I IOI V Illy k> 1 \f IU 111 


ORF01258 


! SAG1123 


34 


hypothetical protein 


ORF0125Q 


OnO I 1 £.*t 




diuenyas aenyarogenase Tamiiy protein 


ORF01260 


SAG1125 


335 


membrane protein 


ORF01261 


SAG1126 


228 


conserved hypothetical protein 


ORF01262 


j SAG1127 


113 


conserved hypothetical protein, FRAMESHiFT 


ORF01263 




187 


hypothetical protein 


ORF01264 


SAG1128 


65 


transcriptional regulator, Cro/CI tamiiy 


ORF01265 


SAG1129 


36 


hypothetical protein 


ORF01266 


SAG1130 


49 


hypothetical protein 


ORF01268 


SAG1131 


164 


thiol peroxidase 


ORF01269 


8AG1132 


219 


conserv d hyp thetlcal protein 


ORF01272 


SAG1133 


254 


conserved hypothetical protein 
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ORF R f No. 


SAGxxxx Ref No. 


aa t 


<\nn tati n 


ORF01273 


SAG1134 


213 


transcriptional r gulator, GntR family/potassioum 

info U a rtrnt In TrV A famlk/ 

jpiarte proi in, i nvr\ icmiiiy 




uno I I OO 


100 


nl o*5A nrntoin rvitatlVP 
yio^^T pruiclll, puiauvc 




H Oft 




conservea nypouieuocii pruiem rrvMvitonir i 


UKrUUf 0 




A QA 


gisz4 proiem, puiaiive 


UKr 1)1^77 


oAblloo 


04 


conservea nypouieucai proiein 


ORF01 279 




193 


conservea nypomeucai proiein 


OKFU128G 




82 


conserveo nypomeucai proiein 


OKF01281 


SAG1141 | 


112 


conserved hypothetical protein 


ORF01282 




759 | 


ATP-dependent DNA hel lease PcrA 


ORF01 283 


SAG 11 43 


100 


conservea nypotneucai protein, rKAMboriir r 


/"\Oim«4 no A 

ORFQ1284 


SAG1144 


AAA 

441 


uracil permease 


ORF01285 


O A 4 A AC 

SAG 1145 


A A a 

448 


sodiumialenine symporter family protein 


OKF0128O 


O A /"> A A AC 

SACal14o 


AAA 

411 


cation efflux family protein 


ORF01287 


O A A AT 

SAG 11 47 


130 


conserved hypothetical protein 


ORF01288 


O A A A AO 

SAG 1148 


004 


membrane protein, putative 


OKrU1289 


O A A A A O 




conserved hypothetical protein 


OKrO 1290 


0A0I 1 OU 


Af\f\ ' 

4UU 


noosomai proiein oi 


UKrU 1^91 




7ft 
I 0 


conservea nypouieucai proiein 


1 t)Kr01Z9Z 


O A /""* H A CO 


0>f A 

o4U 


Drancneo-cnain amino aciu amino transferase 


vJKrUl Z94 


CAp-1 4CO 

oAollOo j 


0 19 


uinm lopoisornerase iv,m suounii 


nDcn-i oqe 1 


QA/^H HCil 

oftol 1 0*f 


OOO 


HMA tnnnienmoraco IV/ R ciihiintf 
UNmM lupUloUllltJI doc IV, D oUUUIIH 




QAOi 4CC 
OnO I IOO 




concern /o ri h\ynr\thotir , sil nrntoin Tlf^RAn ftO^ 
CUnociVcU 1 iy^JL>U ItJU^dl (JIULtilll 1 IVjrVUUvbO 




oAvjllOO 


OA~7 


uracii-uiNM gtycQsyiase 




OAoliuf 


101 


conserveu nypouieucai proiein 


UKruizyy 


0A0IIO0 




oMr-iN-aceiyineuraniinic aciu synineiase imcum 


npirn a o aa 


CAO-I 4 CO 


^uy 


neuu proiein 


<JKrU ioUI 


oAwllDU 


OCJ*f 


yj L/ "-fr-aceiy 19 1 ucosa mi ne-^-epi merase in e u 


ADcrnono 


OAollOl 


O.A«l 
o4l 


iN-aceiyi neu ramie acio synineiaoe iNeuo 


UKrUloUo 


0A0I Ibz 




cpsL protein 


vJKrU ioU4 


oAbl loo 


01 A 


cpsvis proiein 


r\oct\A one 


oAvjl 1 04 




cpsVJ protein 


ORF01306 


SAG1165 


327 


cpsVO protein 


ORF01307 


SAG1166 


295 


cpsVN protein 


ORF01308 


SAG1167 


241 


cpsVM protein 


ORF01309 


SAG1168 


364 


cpsVH protein 


ORF01310 


SAG1169 


163 


CpsVG 


ORF01311 


SAG1170 


149 


CpsF 


ORF01312 


SAG1171 


462 


CpsE 


ORF01313 


SAG1172 


229 


CpsD protein 


ORF01314 


SAG1173 


230 


cpsC protein 


ORF01315 


SAG1174 


243 


capsular polysaccharide biosynthesis protein CpsB 


ORF01316 


SAG1175 


485 


capsular polysaccharide biosynthesis protein CpsA 


ORF01317 


SAG1176 


290 


capsular polysaccharide synthesis operon 
transcriptional regulator CpsY 


ORF01318 


SAG1177 


255 


cpslaS protein 


ORF01319 


SAG1178 


236 


purine nucleoside phosphorylase 


ORF01320 


SAG1179 


418 


voltage-gated chloride channel family protein, putative 


ORF01321 


SAG1180 


269 


purine nucleoside phosphorylase 


ORF01322 


SAG1181 


! 135 


arsenat reductase 


| ORp01323 


SAG1182 


i 403 


ph sphopentomutase 


ORF01324 


SAG1183 


223 


ribose 5-phosphate isomerase 



685 



WO 2004/018646 



PCTYUS2003/026827 



Table 32: Conv rsion of ORF R f Nos. with SAG R f Nos. 



ORF Ref No. 


SAGxxxx Ref No. 


aa j 


Annotation i 


ORPO IoZd 


O A /""» A A OA 


AAA 


conserv d hypothetical protein 


ORF01 327 


O A A A OR 


AAA 

262 


tributyrin esterase 


ORF01 328 


O A f** A A OC 


553 


metal lo-beta-lactamase superfamily protein 


ORF01 329 


O A /*"* A A 07 

SAG1 1 87 


253 


ABC transporter, ATr-binding protein 


ORF01330 


A A S—% A A 

SAG 11 88 


287 


ABC transporter, permease protein 


ORF01331 


A A ^%a A A A 

SAG1189 


334 


conserved hypothetical protein 


ORF01332 


SAG 1190 


551 


adherence and virulence protein A 


ORF01333 


SAG1191 


239 


alpha-acetolactate decarboxylase 


ORF01334 


a a j j AA 

SAG1192 


560 


acetolactate synthase, catabolic 


ORF01335 


SAG 1193 


408 


TPR domain protein 


ORF01336 


SAG 11 94 


396 


membrane protein ' 


ORF01337 


SAG 1195 


153 


MutT/nudix family protein 


ORF01338 


g*\ A A] A) r+ 

SAG1196 


160 


mutator MutT protein 


ORF01339 


SAG 11 97 


1072 


hyaluronidase 


^\.t~% r~ a j a ja 

ORF01340 


SAG 1198 


348 


dTDP-glucose 4,6-dehydratase 


r—% 7— r\ A A A A 

ORF01341 . 


SAG1199 


197 


dTDP-4-dehydrorhamnose 3,5-epimerase 


ORF01342 


SAG1200 


289 


glucose-1 -phosphate thymidylyltransferase 


ORF01343 


SAG1201 


367 ! 


minodiacetate oxidase, putative 


ORF01344 


SAG1202 


262 


conserved hypothetical protein TIGR00486 


ORF01345 


SAG1203 


227 


conserved hypothetical protein 


ORF01346 


SAG1204 


226 


DNA replication protein Dnad, putative j 


ORF01347 


SAG1205 


172 


adenine phosphoribosyltransferase 


ORF01348 


SAG1206 


854 


conserved domain protein 


ORF01349 


SAG1207 


32 


hypothetical protein 


ORF01350 


SAG1208 


732 


single-stranded-DNA-specrfic exonuclease RecJ 


ORF01351 


SAG1209 


253 


oxtdoreductase, short chain dehydrogenase/reductase 
family 


ORF01352 


SAG1210 


309 


metallo-beta-lactamase superfamily protein 


ORF01353 


SAG1211 


215 


conserved hypothetical protein 


ORF01364 


SAG1212 


412 


GTP-binding protein HfIX 1 


ORF01355 


SAG1213 


296 


tRNA delta(2)-isopentenyipyrophosphate transferase 


ORF01356 


SAG1214 


58 


hypothetical protein 


ORF01357 


SAG1215 


305 


exfoliative toxin A, putative 


ORF01358 


SAG1216 


1252 


pullulanase, putative 


ORF01361 


SAG1217 




conserved hypothetical protein, FRAMESHIFT 


ORF01362 


SAG1218 


194 


conserved hypothetical protein 


ORF01363 


SAG1219 


468 


peptidase, M207M25/M40 family 


ORF01364 


SAG1220 


200 


nitroreductase family protein 


ORF01365 


SAG1221 




glycerophosphoryl diester phosphodiesterase, 

putative, KvJIN 1 MUIATIUN 


ORF01367 


SAG1222 


593 


excinuclease ABC, C subunit 


ORF01368 


SAG1223 


255 


conserved hypothetical protein 


ORF01369 


SAG1224 


446 


MATE efflux family protein 


ORF01370 


SAG1225 


136 


conserved hypothetical protein 


ORF01371 


f\ A ^> A AAA 

SAG 1226 


165 


conserved hypothetical protein 


ORF01372 


SAG1227 


198 


conserved hypothetical protein 


ORF01373 


SAG1228 


96 


ISSdyl , transposase OrfA 


ORF01374 


SAG1229 


259 


ISSdy 1 , transposase OrfB 


ORF01375 


SAG1230 


96 


conserved hypothetical protein 


ORF01377 


SAG1231 




transposase OrfB, IS3 family, degenerate 
FRAMESHIFT 


ORF01379 


SAG1232 


I 77 


transposas OrfB, IS3 family, truncation 


ORF01380 


SAG1233 


822 


streptococcal histidine triad family protein 


ORF01381 


SAG1234 


306 


laminin-binding surface protein 
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ORF Ref No 


OMOaaaa, rx>*?l 


ad 




ORF01382 


SAG 1235 


425 


GRSM nroUD II intron matiiraQn 

ODOl if yiwu^ ii iiiuuii, 11 laiui ado 


ORF01383 

A 1 W ■ WWW 


SAG 1236 




rSa np ntidase Drecursor FRAMF^HIFT 


ORF01384 


SAG1 237 


444 


hvnnthetieal d rote in 


ORF01385 


SAG 1238 


202 


hvnothf*tical d rot© in 


ORF01186 


^AG19**Q 
Ono 1 too 


7fi 


/vincorv^rl hvnnfhotir , al nmtoin 


ORF01 ^87 




19R 


rnncorvori h\/r\/^t'h^tlr*al nmtoin trt 1 n tir\n 
uuilocivcu nypuu icu^ai ^/luiciii, uuiiLtdUUfi 


DRF0 1*^88 

xJfxTVI IOOO 


QAG19A1 


7R 
f O 


trancnncaco OrfA famiKi 
uallo|JUoaao Wl in, IOO Idililiy 


O.RP01 **RQ 


QAf210A9 
OnO 1 Zh-Z 


R7 


iranspusase vjm ca, 100 Tamiiy, iruncauon 


Ur\rU lOoU 


OA1 

OnOlZ*tO 


OA 

yo 


|QQH\/i troncnncaco OrfA PPAMCQUICT 

looay 1 , iransposase vjitm rrvMviconir I 


iJKrU loyi 




Aoy 


looay 1 , u ansposase vjitd i 




OnO l^«K5 


00 
00 


nypoinexicai protein 


ORF01393 


SAG1246 


389 


hypothetical protein 


ORF01394 


SAG1247 


399 


Integrase, phage family 


ORF01395 


SAG 1248 


75 


conserved hypothetical protein 


ORF01396 


SAG 1249 


74 


transcriptional regulator, Cro/C) family 


ORF01397 


SAG1 250 


621 


Tn5252, relaxase 


ORF01398 


SAG1251 


121 


Tn5252, Orf 9 protein 


ORF01399 


SAG1252 


120 


Tn5252, Orf 10 protein 


ORF01401 ] 


SAG 1253 


435 


transposase, ISL3 family 


ORF01403 


SAG 1254 


546 


mercuric reductase 


ORF01404 


SAG1255 


130 


mercuric resistance operon regulatory protein MerR 


j xJKrUlnUD 


oAbl/OO 


A AO 


1 Ofift^ fMh A nA A 4^A f^^i^^Ij inA^flAA 

ioodi v iransposase vjitd, iruncauon 






7ftO 


cauon-irans porung ni rase, c i-c^ Tarnuy 


i pipp/haha 

UKrU IHUO 


QAf2*19*xA 
OnOl ZOO 


199 


caurniurn emux sysiern accessory proiein 


O.RF01A0Q 




yy 


rnncon/oH h\/r»/^thoti^£»l nrnfain 

uunbcrvcu iiypuuifcJLmcii piuicii i 


ARpni aio 

wrxr U It IU 


QAG19RO 


9R9 


i lypoLntJiiuai p rum til 


o,RFniAi 1 
vr\ru i*t i i 


QAf519R1 
Ono I ZO 1 


1QA 
1 yo 


Ll;liociVcU 1 iy pULI loUL.ctl piv/U^in 


nprni A19 


QAG19R9 


RQ^ 


CaliUI l"U allopUl ill iy nl rase, C l*C.4C lalllliy 


ORP01A1A 


^AG19R1 




conservcQ Qurnoin proiein, r rxniviconir i 


. v-rr\rui*MO 


OnOT^CO** 


1 Aft 


iranscnpiionai repressor oupT, puiauve 


f ORFniAIR 


^AG19R^ 
OnO I^OO 


90R 


raHmii im rocictsrtr^o trsincnnrtor ni itsKv/A 
UdUMllUIII 1 tsololal IL#o U dl lopUl tcl , pULaLJVtJ 


; UrxrU |*t I f 


OnO 1 ZOO 


1R9 

Ot 


nypuineucai pruiein 


Urxrll IH IO 


CAG19R7 
OnO I to / 


108 

1 I/O 


h\/n/^»thofir»ol nmtoin 

nypoineucai proiein 


ORF01A1Q 


^AG19RR 
OnO UOO 


9^0 


icpreoour pruieiii« puuiuvtJ 


f"}RFniA90 


Q AG1 9RQ 
OnO I £U9 


AA 




DRF01A91 


^ AG 1970 
OnO I*! U 


471 


ImnR/Mi irR/^amR famUvr nrrktoln 
ii i ijjd/ iviuuo/Odiiio idililiy piuitsiii 


ORF01 A9** 


OAG1971 
OnO Iti 1 


11R 


mncoivort hv/nnthotlf^sil nrotoin 


r*RPA*tA9A 


OnO I £. 1 £ 


109 


mncon/oH ri\/nnthotl/^ol nrntoin 

vonserveu nypoineucoi proiein 


riRFA1A9*? 


OAG197^ 
OnO I c. 1 0 


118 


rnncon/oH K\/nnfhotiosl nmtoin 

curtserveo nypoineucai proiein 


! PIOPA1 A9R 


QAG197A 
OnO 1 A 1 <+ 


19Q 
i zy 


OAneaniaH ht#nnth /ati/*^l nmtoin 

conservea nypouieucoi proiein 


rM3FAiA97 


^AG197n 
OnO I A / O 


7^ 


h\/nnth atinal nrmtoin 

nypoineucai proiein 


r"M3Pn«tA9A 


QAG197R 


OOO 


conservea nypoineucai proiein 


r\nrA 4 inn 


SAG 1277 


163 


hypothetical protein 


ORr01431 


O A ^> * 0*70 

SAG 1278 


96 


hypothetical protein 


DRF01AQ9 


QAG197Q 

OnO Ui9 




mncon/aH Hnmain nmtoin 
vAJIIoclvcU Uwilldlll piLFUSlll 


ORF01433 


SAG1280 


2274 


Helicases conserved O-terminal domain protein 


ORF01434 


SAG1281 


183 


hypothetical protein 


ORF01435 


SAG1282 


63 


lipoprotein, putative 


ORF01436 


SAG1283 


1631 


cell wall surface anchor family protein 


ORF01437 


SAG1284 


196 


abortive infection protein AbiGI 


ORF01438 


SAG1285 


281 


abortive infection protein AbiGI 1 


ORF01439 


SAG1286 


933 


conserved hypothetical protein 


ORF01440 


SAG1287 


776 


conserved hypothetical protein 


ORF01441 


SAG1288 


117 


conserved hypothetical protein, DEGENERATE 
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ORFR fNo. 


SAGxxxx Ref No. 


aa ; 


Annotation 


JJKrU It***: 


OMV3 l£09 


284 

tOt 


mnQprvc»ri hypothetical Drotein 


\JKrU144o 






h\mrkthofir*fll nrotein 


r\DCf\'i AAA 




fins 


Tn^9^9 Orf 21 nrotein internal deletion 


<Jr\rU 1440 


QAA1 9Q9 
otto I cJac. 


1fi2 


hvnnthpfiral nrotein 


/**\DCrn A Ad 

\JKrU144o 


Otto I ^v70 


1Q4 


jJlUlUdoc, JJUlduvo 


UKrU1447 


Otto 14574 


77 


mncDn/oH hv/nnthetieal nrotein 


ORF01449 


SAG1295 


127 


conserved hypothetical protein 


ORF01450 


SAG1296 


142 


conserved hypothetical protein 


ORF01451 


SAG1297 


451 


type II UNA moaiTicauon metnyitransierase opno^ozir 


ORF01452 


SAG 1298 


31 


hypothetical protein 


ORF01453 


SAG1299 


272 


conserved hypothetical protein 


ORF01454 


SAG1300 


57 


conserved hypothetical protein 


ORF01455 | 


SAG 1301 


121 


nbosomal protein l/juiz 


ORF01456 


SAG1302 


166 


ribosomal protein L10 


ORF01458 


SAG 1303 


702 


A I P-oepenaent oip protease, t\ 1 r'-Dinamg suDunn 


ORF01459 


SAG1304 


32 


hypothetical protein i 


ORF01460 


SAG1305 


314 


homocysteine o-rneinyiiransTerase Minuivi, puiauve 


Urxrui40i 


OnO IOUO 


4*>fi 


amino ar*iH npnnnA^A 

Oil III IU ClwlU JJ CI 1 1 ICaoc 


LJKrU14oo 


OMOlOUr [ 


91R 


hvmnthptir*»l nmtpin 


LlKrU 1404 


OMOlOUO 


1R7 




UKrU14DD 


ottoiouy 






DKrO i4DO 


OttO lO I u 


1 A9 


francrrinttnnal rpniilsstrir XptR familv 


vJr\rui*K>/ 


OttO IO I I 


1Q8 


f^TP-hinriinn nrotein 


L/KrU i40o 


OttO I O I 


40, ft 
tuo 


ATP-rfpnpnripnt Cln nrotoase ATP-bindina subunit 
CIpX 


ORF01469 


SAG1313 


56 


conserved hypothetical protein 


nRPft1470 
wrxru i*tiu 


SAG1314 


164 


dihydrofolate reductase 


ORF01471 


SAG 131 5 


279 


thy midy late synthase 


ORF01472 


SAG1316 


390 


HMG-CoA synthase 


ORF0147^ 


SAG1317 


427 


3-hydroxy-3-methyigl utaryl-CoA reductase 


ORF01474 


SAG1318 


149 


conserved hypothetical protein 


I ORF01475 


SAG1319 


187 


hemolysin III, putative 


nRF01476 
urvru it # %j 


SAG 1320 


304 


conserved hypothetical protein TIGR001 47 


OR FO 1477 


SAG1321 


284 


glutathione S-transferase family protein 


ORF01478 

wlxi \J Iff O 


SAG 1322 


72 


conserved domain protein 


rjRF0147Q 


SAG 1323 


331 


isopentenyl-diphosphate delta-isomerase 


ORFni4ftO 


SAG1324 


330 


phosphomevalonate kinase 


ur\ru I to i 


SAG1 325 


314 


diphosphomevalonate decarboxylase 


j ORFni4R9 


SAG1 326 


292 


mevalonate kinase, putative 


ORFOIAA^ 

ui\ru ihoo 


55AG1^27 


409 


sensor histidine kinase 


Anrfti AO A 

UKr0i4o4 


ottbloZO 




r^N A-hinH inn rocrvinQA rpn iilsvtnr 

L/IH/A~UII lull iy ICO|JvJIIOC7 ICyUlalUI 


ORF01485 


oAol o^y 




o I " pyropnospnoivinooo idiniiy pruwin 


ORF01486 


SAG1330 


68 


hypothetical protein 


ORF01488 


SAG1331 


979 


R5 protein 


ORF01489 


SAG1332 


146 


transcriptional regulator, MarR family, putative 


ORF01490 


SAG1333 


690 


5-nucleotidase family protein 


ORF01491 


SAG1334 


136 


polypeptide deformylase, putative 


ORF01492 


SAG1335 


449 


NADP-specific glutamate dehydrogenase 


ORF01494 


SAG1336 


169 


cons rved hypothetical protein 


ORF01495 


SAG1337 


589 


ABC transporter, ATP-binding/permease prot in 


ORF01496 


SAG1338 


579 


ABC transporter, ATP-binding/permease prot in 


ORF01497 


SAG1339 


157 


acetyltransferase, GNAT family 
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nnc d**< Ma 
ORr Ref NO. 


SAoXXXX K T NO. 


33 / 


innoidii uii 


| UKrUi4yo 


OnO I o*frU 


ROO 


ARH transonrtpr ATP-bindina orotein 


1 <jKrui4yy 


OnOl 0*t I 


aoo 


nntv/A notvmprase familv Droteln 


1 UKrUlOUU 






lonV fnmilv nrntpin 
Jcy v laiimy jjujieiii 


| OKruioUl 






noncon/prl h\/nrvth pfi f^P I nrotpin 


; ORF01502 


SAG1344 


177 


hypothetical protein 


ORF01503 


SAG1345 


164 


conserved hypothetical protein 


ORF01504 


SAG1346 


641 


PTS system, tructose specmc iiado components 


j ORF01505 


SAG1347 j 


303 


1 -phosphof ructoki nase 


i ORF01506 


SAG1348 


247 


lactose phosphotransferase system repressor 


I ORF01507 


SAG1349 


411 


beta-lactam resistance factor 


ORF01508 


SAG1350 


544 


surface antigen-related protein 


I ORF01509 


SAG1351 


307 


2-denydropantoate ^-reauctase, putative 


ORF01510 


SAG1352 


356 


regulatory protein, putative 


I ORF01511 


SAG1353 


330 


pyndine nucieotiae-uisuipniae oxiaoreouciase ramiiy 
protein 


| ORF01512 


SAG 1354 


251 


tKNA ^guanine-iNT ^-meinynransierase 


I ORF01513 


SAG1 355 


172 


1 00 rRNA processing proiein Kimivi 


i ORF01515 \ 


SAG1356 


503 


transcriptional regulator, kota lamuy 


I ORF01516 


SAG1357 


80 


KH domain protein 


ORF01517 


SAG1358 


90 


ribosomal protein S16 


ORF01518 


SAG1359 


415 


permease, putative 


ORF01519 


SAG1360 


236 


ABC transporter, Al H-binding protein 


ORF01520 


SAG1361 


414 


conserved hypothetical protein 


j ORF01522 


SAG1362 


532 


carbamoyl-phosphate synthase, large subunit, putative 


ORF01523 


SAG 13 63 


ODD 


^orl^ovwAtil nh/tcnhoto eunthaco email cilhlinit' 

carD3rnoyi"pno5pnaitj synuidoc, oiiiaii ouuuiih 


ORF01524 


SAG 1364 


173 


Dyrimioine operon reguiaiory proiein 


I ORF01525 


SAG1365 


296 


nuosomai large suounit pseuaouname synmase, rxiuu 
suuicuiiiiy 


j ORF01 526 


oAol ODD 


1 OH 


linnnrntoin cinnal nftntirfa^fi 


| OKrUlo^/ 




ou 1 


tran^rrintinnal rpnulator LvsR familv 


j ORrOlo^o 


OAPI OAR 
oAol oOo 


y*t 


rihncnmal nrotoin 1 07 
I lUUovji i leal pi u Ld ii i— ^ • 


1 ADCA4 COft 

| ORF01529 


oAol ooy 


1 ML 


rnncRrv/pH hvnnthptinal nrotsin 

liUI lOOl VCU 1 iyjJ*JU ICULtOI pi UVCH 1 


| ORF01530 


j oAblo/U 




rihncnmal r»rntf*in 191 


| ORr01531 


oAol o / 1 


o»c 


aaacoivpH h\/r>r>th \ nrntpin 
kaji loci vcu iiypuuicuvai pivsidii 


1 ORrOlOO^ 


OAfil 07O 


AHA 


thiamin a hin«5\/nthftsi*5 oroteln Thii 

UIIOIIIIIIO UIU3jllUlvwlw piw»vlll i mi 




OnO IOi 0 


00 1 


pv<?tpinp dssulohurase 


r^opn-ic.oc 


OnO IO/H 


150 


conserved hvDothetical Drotein 


j UKrinOoO 


OnO IOiJ 




Glutathione reductase 


0 r\DCfH*?0,T 

;) iJKrUlOOf 


OnO 10/ v 


111 


conserved hypothetical protein 


i ADCAH COO 

1 L/KrOT OOO 


I QAf*«|077 




ohnris.matp svnthase 




OnO 1 0 r O 


355 


^-dehvdroauinate svnthase 


| UKrulo4U 


0 a n -i 07Q 
OnO IOi O 


225 


3-dehydroQulnate dehydratase 


I ORF01541 


oAolooU 


OOO 


AAneon/aH h\/nrtthAtlcfll nrntpin 
ixJIldCiVcU • lypuu ID Uveal piwiciii 


I ORF01542 


! SAG1381 


! 714 


sulfatase 


ORF01643 


SAG1382 


119 


ribosomal protein L20 


ORF01544 


SAG1383 


66 


ribosomal protein L35 


ORF01545 


SAG1384 


176 


translation initiation factor IF-3 


ORF01546 


SAG1385 


227 


cytidytate kinase 


ORF01547 


SAG1386 


174 


conserved hypothetical protein 


ORF01548 


SAG1387 


65 


ferredoxin, 4Fe-4S 


j ORF01549 


SAG1388 


163 


conserved hypoth tical protein 


ORF01550 


i SAG1389 


406 


peptidase t 


ORF01551 


SAG1390 


544 


polysaccharid biosynthesis prot in, putative 
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ORF Ref No. 


SAGxxxx R f No. 


aa 


Ann tati n 


ORF01552 


SAG1391 


484 


UDP-N-acetylmuramoylalanyl-D-glutamate~2,6- 
diaminopimelate ligase 


ORF01553 


SAG1392 i 


264 


iron compound ABC transporter, ATP-binding protein 


ORF01554 


SAG1393 


310 


iron compound ABC transporter, substrate-binding 
protein 


ORF01555 


SAG1394 


341 


iron compound ABC transporter, permease protein 


ORF01556 


SAG1395 


333 


iron compound ABC transporter, permease protein 


ORF01 557 


SAG 1396 


217 


conserved hypothetical protein 


ORF01558 


SAG 1397 


311 


inorganic pyrophosphatase, manganese-dependent 


\jKrui ooy 






pyruvate formate-iyase-activating enzyme 


UKru loou 




AAA 

444 


CBS domain protein 


ORF01561 


SAG1400 


188 


conserved hypothetical protein 


ORF01563 


SAG1401 


311 


conserved hypothetical protein TIGR01212 


ORF01564 


SAG1402 


213 


PAP2 family protein 


ORF01565 


SAG 1403 


194 


membrane protein, putative 


ORF01566 


SAG1404 


308 


cell wall surface anchor family protein 


ORF01567 


SAG 1405 


294 


sortase family protein 


ORF01568 


SAG 1406 


293 


sortase family protein 


^*Vf-^ paj prtM 

ORF01 569 


SAG1407 


705 


cell wall surface anchor family protein 


ORF01 570 


SAG 1408 


901 


cell wall surface anchor family protein 


ORF01571 


SAG1409 


326 


transcriptional regulator, RofA family FRAMESHIFT 


(JKrOI 57Z 


O A A Af\ 

5AG1410 


379 


glycosyl transferase, group 1 family protein 


UKrul5/«5 


oA(j141 1 


AQA 

282 


exopolysaccharide biosynthesis protein, putative 


\JKrU lor 4 


CAP<lyt<IO 

oAvj14jZ 


A7A 

4/4 


exopoly saccharide biosynthesis protein, putative 


UKrUlOfO 


oAlal41o 


AC A 

454 


hypothetical protein 


<JKrU1 57b 


SAG1414 


O AO 

308 


glycosyl transferase, group 2 family protein 


OKF01 577 


O A /"^«* A AC 

\ SAG1415 


311 


glycosyl transferase, group 2 family protein 


ORr0157o 


O A A A ACS 

SAG 1416 


352 


dTDP-glucose 4,6-dehydratase, putative 


URFQ1 579 


SAG1417 


240 


4-diphosphocytidyl-2C-methyl-D-erythritol synthase, 
putative 


ORF01 *SfiO 






ucu protein, puiauvts 


ORF01581 


SAG1419 


577 


hypothetical protein 




OAP'i/i on 
oAo14ZU 


A A~7 
117 


conserved hypothetical protein 


HDCn-l coo 


OAG14Z1 


Z43 


glycosyl transferase, group 2 family protein 


L/KrU15o4 




oio 


glycosyl transferase, group 2 family protein 


ORF01585 


SAG1423 


384 


conserved hypothetical protein 


ORF01586 


SAG1424 


284 


dTDP-4-dehydrorhamnose reductase 


ORF01587 


SAG1425 


113 


conserved hypothetical protein 


ORF01589 


SAG1426 


369 


RNA polymerase slgma-70 factor 


ORF01590 


SAG1427 


602 


DNA primase 1 


ORF01591 


SAG1428 


125 


large conductance mechanosensitive channel protein 


| ORF01592 


SAG1429 


58 


ribosomal protein S21 


ORF01593 


SAG1430 


167 


conserved hypothetical protein 


ORF01594 


SAG1431 


268 


amino acid ABC transporter, amino acid-binding 
protein 


ORF01596 


SAG1432 


347 


ammonium transporter family protein 


ORF01597 


SAG1433 


375 


conserved hypothetical protein 


ORF01598 


SAG1434 


328 


rhodanese family protein 


ORF01599 


SAG1435 


101 


conserved hypothetical protein 


ORF01600 


SAG1436 


457 


glycerol-3-phosphate transporter, putative 



690 



WO 2004/018646 



PCT/US2003/026827 



Table 32: Conv rsion of ORF Ref N s. with SAG R f Nos. 



ORF Ref No. 


SAGxxxx R f No. 


aa i 


\nn tati n 


ORF01601 


SAG 1437 


55 


hypothetical protein 


ORF01602 j 


SAG 1438 


754 


glycogen phosphorylase 


ORF01603 


SAG1439 


498 


4-alpha-glucanotransferase 


ORF01604 


SAG1440 


342 


maltose operon repressor MaIR, putative 


ORF01605 


SAG1441 


415 


maltose/maltodextrin ABC transporter, 
iiauose/maitoaexinn-oinaing protein 


ORF01606 


SAG1442 


456 


maltose ABC transporter, permease protein 


ORF01 607 


O A A A An 

SAG1443 


278 


maltose ABC transporter, permease protein 


ORF01608 


O A r**A\ AAA 

SAG1444 


490 


Droton/peptide sympo iter family protein 


ORF01610 


SAG1445 




MutT/nudix family protein, FRAMcSHIFT 


ORF01611 


SAG1446 


62 


hypothetical protein 


ORF01612 


SAG1447 


441 


conserved hypothetical protein 


ORF01613 


0> A /"* A\ A A O 

SAG1448 


502 


glycosyt transferase, group 1 family protein 


ORF01614 


O A A A Af\ 

SAG1449 


795 


preprotein translocase SecA subunit, putative 


ORF01615 


SAG1450 


330 


conserved domain protein 


ORF01617 


SAG 1451 


494 


conserved hypothetical protein 


ORF01618 


5AG1452 


514 


conserved hypothetical protein 


ORrQ1619 


oAvj14oo 


Ann 
409 


preprotein transiocase oecY lamiiy protein 


ORF01621 


SAG1454 


398 


conserved hypothetical protein 


ORF01622 


SAG1455 ' 


295 


glycosyl transferase, group 2 family protein 


ORF01623 


SAG1456 


312 


glycosyl transferase, family 8, degenerate 


ORF01624 


SAG1457 


129 


IS1 381 , transposase OrfB 


ORF01625 


SAG1458 


127 


IS1381, transposase OrfA 


ORF01626 


SAG1459 


413 | 


glycosyl transferase family 8 


ORF01627 


SAG1460 


401 


glycosyl transferase, family 8 


ORF01628 


SAG1461 


335 


conserved hypothetical protein 


ORF01630 


SAG1462 


970 


cell wall surface anchor family protein 


ORF01632 


SAG1463 




transcriptional regulator, RofA family POINT 
MUTATION 


ORF01634 


SAG1464 


663 


excinuclease ABC, B subunit 


ORF01635 


SAG1465 


306 


protease, putative 


ORF01636 


SAG1466 


727 


glutamine ABC transporter, glutamine-binding 
protein/perm ease protein, putative 


ORF01637 


SAG1467 


246 


glutamine ABC transporter, ATP-binding protein, GlnQ 
putative 


ORF01638 


SAG1468 


116 


conserved hypothetical protein 


ORF01639 


SAG1469 


52 


conserved hypothetical protein 


ORF01640 


SAG1470 


437 


GTP-binding protein, GTP1/Obg family 


ORF01641 


SAG 1471 


42 


conserved hypothetical protein 


ORF01643 


SAG1472 


413 


aminopeptidase PepS 


ORF01645 


SAG1473 


192 


cell wall surface anchor family protein 


ORF01646 


SAG1474 


680 


amidase family protein J 


ORF01647 


SAG1475 


240 


ribosomal small subunit pseudouridine synthase A 


ORF01648 


SAG1476 


280 


oxidoreductase, aldo/keto reductase family 


DKrO IDOU 


OMV3 14/ # 




niiror eauciase Family jjiuibjii 


ORF01651 


SAG1478 


| 130 


lactoylglutathione lyase 


ORF01652 


SAG1479 


308 


glycosyt transferase, group 2 family protein 


ORF01653 


SAG1480 


462 


amino acid permease 


ORF01654 


SAG1481 


155 


SsrA-binding protein 


ORF01655 


SAG1482 


801 


exoribonudease, VacB/Rnb family 


ORF01657 


SAG1483 


i 78 


preprot in translocase, SecG subunit 


ORF01658 


SAG1485 


389 


multi-drug resistance protein 


ORF01660 


SAG1486 


548 


hypothetical protein 


ORF01661 


SAG1487 


233 


ABC transporter, ATP binding protein 
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ORF R f No. 


SAGxxxx Ref No. 


aa 


Ann ota ti n 


ORF01662 


SAG 14 88 


195 


dephospho-CoA kinase 


OKrulooo 


SAG 1489 


273 


formamidopyrimidine-DNAglycosylase 


OKrOloDO 


SAG 1490 


282 


transcriptional regulator, MutR family 


ORP01666 


SAG1491 


530 


hypothetical protein 


ORF01 667 


SAG1492 


58 


hypothetical protein 


ORF01668 


SAG1493 




hypothetical protein j 


ORF01670 


SAG1494 


32 


hypothetical protein 


ORF01672 


SAG1495 


81 


protease, putative, POINT MUTATION 


ORF01673 


SAG1496 


110 


hypothetical protein 


ORF01674 


SAG1497 


37 


hypothetical protein 


ORF01675 


SAG1498 


133 


hypothetical protein 


ORF01677 


SAG1499 


299 


GTP-binding protein Era 


ORF01678 


SAG1500 


132 


diacylglycerol kinase 


ORF01679 


SAG1501 


161 


conserved hypothetical protein TIGR00043 


ORF01680 


SAG1502 


268 


tetracenomycin polyketide synthesis O- 
methyltransferase TcmP, putative 


ORF01681 


SAG1503 


39 1 


hypothetical protein 


ORF01682 


SAG1504 


38 


hypothetical protein 


ORF01683 


SAG1505 


158 


MutT/nudix family protein 


ORF01684 


SAG1506 


267 


hypothetical protein 


ORF01685 


SAG1507 


345 


PhoH family protein 


ORF01686 


SAG1508 


590 


67 kDa Myosin-crossreactive streptococcal antigen 


ORF01687 


SAG 1509 


71 


conserved hypothetical protein 


ORF01688 


SAG1510 


169 


peptide methionine sulfoxide reductase 


ORF01689 


SAG1511 


284 


conserved hypothetical protein 


ORF01690 


SAG1512 


185 


ribosome recycling factor 


ORF01691 


SAG1513 


242 


uridylate kinase 


ORF01692 


SAG 151 4 


226 


peptide ABC transporter, ATP-binding protein j 


ORF01693 


SAG1515 


262 


peptide ABC transporter, ATP-binding protein 


ORF01694 


SAG1516 


255 


peptide ABC transporter, permease protein j 


ORF01695 


SAG1517 


314 


peptide ABC transporter, permease protein 


ORF01696 


SAG1518 


525 


peptide ABC transporter, peptide-binding protein 


ORF01697 


SAG1519 


229 


ribosomal protein L1 


ORF01698 


SAG1520 


141 


ribosomal protein L1 1 


ORF01699 


SAG1521 


388 


transposase, 1S30 family, putative 


ORF01700 


SAG1522 


460 


transporter, major facilitator family 


ORF01702 


SAG1523 


404 


peptidase, M20/M25/M40 family 


ORF01703 


SAG1524 


294 


transcriptional regulator, LysR family 


ORF01704 


SAG1525 


117 


conserved hypothetical protein 


ORF01705 


SAG1526 


178 


IS861, transposase OrfA 


ORF01706 


SAG1527 


277 


IS861 , transposase OrfB 


ORF01707 


| SAG1528 


571 


chorismate binding enzyme 


ORF01708 


SAG1529 


785 


FtsK/SpolllE family protein 


ORF01709 


SAG1530 


267 


peptidyl-prolyl cis-trans isomerase, cyclophilin-type 


ORF01710 


SAG1531 


277 


manganese ABC transporter, permease protein 


ORF01711 


SAG1532 


238 


manganese ABC transporter, ATP-binding protein 


ORF01712 


SAG1533 


308 


manganese ABC transporter, manganese-binding ! 
adhesion liprotein 


ORF01713 


SAG1534 


215 


iron-dependent transcriptional regulator 


ORF01714 


SAG1535 


229 


5-m thytthioadenosin nucleosidas /S- 
adenosylhomocystein nucleosidase 


ORF01715 


SAG1536 


89 


conserved hypothetical protein 


ORF01716 


SAG1537 


184 


MutT/nudix family protein 
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ORF Ref No ! 




33 i 


Vnn tatlon 


ORF01718 


SAG 1538 


459 


JDP-N-ac tvlolucosamine DvrODhosDhorvlase 


ORF01719 


<5AG1539 


31 


hvnothetica! nrot in 




<»AG1540 


137 


nnn served hvoothetical nmtein 

wvllvwl f vV IIJpvuivUwQI UlWivlil 


ORF01721 


<3AG1541 t 


19*5 


ntvnvalase famitv orotein 


ORF01 799 


<3 AG 1*542 


318 


nyirforeductase Gfo/ldh/MnfiA familv 


OR FO. 1794. 


^ AG 1*543 




nnn*;prvpd hvnnthptifial nrntpin FRAMFRH1FT i 


ORFni79^ 
Utxru I / £0 




9^9 


y iuvaji laic s^uci lyuiuyciidot?, puixiu vts 






7ft 
I o 


rnncon/orl h\/rmthc*H^ol nmtoin 

wiiocivcu i iy|#uuicwccii pruitJiii 


PlDCfH 707 

UKrUl / £. ( 






conbervcu nypouioucai proiein 


ORF01729 


SAG 1547 


166 


acetyltransferase, GNAT family 


ORF01730 


*"n a .4 rift 

SAG 1548 


422 


glycosyl transferase, group 2 family protein 


ORF01731 


SAG 1549 


127 


lolool , transposase OrtA 


ORF01732 


SAG1 550 


129 


IS1381 , transposase OrfB 


ORF01733 


SAG 1551 


67 


hypothetical protein 


ORF01734 


SAG 1552 


719 


conserved hypothetical protein 


ORF01735 


SAG 1553 


477 


hypothetical protein 


ORF01736 


SAG1554 


225 


hypothetical protein 


ORF01737 


SAG 1555 


231 


hypothetical protein 


ORF01738 


SAG1556 


445 


branched-chain amino acid transport system II carrier 








protein 


ORF01739 


SAG1 557 


boo 


meinionyi-tKNA syntnetase 


ORF01740 


SAG 1558 


291 


tellurite resistance protein TehB 


ORF01741 


SAG 1559 


231 


membrane protein, putative 


ORF01742 


SAG1560 


40 


hypothetical protein 


ORF01743 


SAG1561 


405 


PTS system component, putative 


i ORF01744 


SAG1562 


280 


conserved hypothetical protein j 


ORF01745 


SAG1563 


275 


exodeoxyribonuclease 


ORF01746 


SAG 1564 


118 


conserved hypothetical protein 


ORF01747 


SAG1565 


158 


methylated-DNA— protein-cysteine S-methyitransferase 


ORFQ1 748 


oAolOOO 




u-isomer specmc ^-nyaroxyacia aenyurogenase Tainiiy 










ORFni74Q 




182 


a^ptvitranofAraQA f^N AT fomilv/ 
duCiyiuciiiotoiaOwi \jiiai laiiiiiy 


l nRFOi7*5n 


o A G1 568 




nho^nhoserine aminotransferase FRAMESHIFT 


UKrUi /OZ 


OAol QO«7 


^ 1 1 


copp@r nornBU5>uaoi5» piuicin v^uio, puiauvc 


\JKrUl too 






conservea nypoineucai protein 


ORF01754 


SAG1571 


53 


hypothetical protein 


ORF01755 


SAG1572 


287 


tetrapyrrole methylase family protein 


ORF01756 


SAG1573 


108 


conserved hypothetical protein 


ORF01758 


SAG1574 


287 


ONA polymerase III, delta prime subunit, putative 


ORF01759 


SAG1575 


211 


thymidilate kinase 


ORF01761 


! SAG1576 


267 


transposase, IS30 family, putative, truncation 


ORF01763 


SAG1577 


219 


AcuB family protein 


ORF01764 


SAG1578 


236 


branched-chain amino acid ABC transporter, ATP- 








binding protein 


ORF01765 


SAG1579 


254 


branched-chain amino acid ABC transporter, ATP- 








binding protein 


ORF01766 


SAG1580 


317 


branched-chain amino acid ABC transporter, 








permease protein 


ORF01767 


SAG1581 


289 


branched-chain amino acid ABC transporter, 








permease protein 


ORF01769 


SAG1582 


388 


branched-chain amino acid ABC transporter, amino 








acid-binding protein 


ORF01770 


SAG1583 


81 


conserved hypothetical protein 


ORF01772 


SAG1584 


377 


IS1548, transposase 
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1 ORF R f No 


^ AGWXX R f N . 


33 f. 


in notation 


j ORF01773 


SAG1585 


196 ; 


^TP-depend nt C!p protease, proteolytic subunit CIpP 


S ORF01774 


SAG1586 

VfVw 1 WWW 


209 


uracil phosphoribosyltransferase 


ORF01775 i 


SAG1587 

Wr\W 1 WW * 


389 


aminotransferase, class I 


1 ORF01 777 

1 vr\rll tiff 


SAG1 588 


182 


RNA methyltransferase, TrmH family, group 2 


I nRFO 177ft 


SAG1589 


450 


amino acid permease, putative 


I nRFfil 77Q 




449 


potassium uptake protein, Trk family 


\ r^DFfl17Rfl 
I Ur\rU I / OU 


QAG 1*591 


475 


cation uptake protein, Trk family 


I r*RFA17ft1 
| vJrxTU ISO) 


<5AG1 592 : 


83 


conserved hypothetical protein TIGR00278 [ 


I OR FO 17ft 2 


SAG1 593 


240 


ribosomal large subunit pseudouhdine synthase B 


1 ORF01783 


SAG 1594 


194 


conserved hypothetical protein TIGR00281 


| ORF01784 


SAG1595 


235 


Uncharacterized ACR, COG1354 


j ORF01785 


SAG1596 


246 


integrase/recombinase, phage integrase family j 


ORF01786 


SAG1597 


157 


CBS domain protein 


ORF01787 


SAG1598 


173 


conserved hypothetical protein 


| ORF01788 


SAG1599 


324 


HAM1 protein 


| ORF01789 


SAG1600 


264 


glutamate racemase 


j ORF01790 


SAG1601 


79 | 


conserved hypothetical protein 


I ORF017Q1 

J Ui\Tw 119 1 


SAG1602 


180 


membrane protein, putative 


1 ORF017Q2 


SAG1603 

Vj^V^^ * | www 


173 


transcriptional regulator, biotin repressor family 


t~ DRFDI 7Q^ 


SAG1604 


229 ! 


membrane protein, putative 


ORF01794 


SAG1605 


167 


conserved hypothetical protein 


I nocn'i 7Qc 
I OKr017yo 


OMvjIDUD 


2A7 


RNA m fit hvltransf erase TrmH familv 


| ORFQ1790 


CA<^1ftft7 
oAolDUf 


Q2 




| UKrUlfy/ 


OnU IOUO 


^10 

O IU 


mpmhranfi nrotein nutative 


1 UKrui /yy \ 


OMV3 IOU9 


221 


amino acid ABC transDorter permease protein 


i ad rr a «t onn 




285 


amino acid ABC transporter, substrate-binding protein 


1 nRFmsoi 

1 urvru iov i 


SAG1611 


486 


amidase family protein 


I nRFmftn? 


SAG1612 


160 


transcription elongation factor GreA 


1 ORF01 ftni 


SAG1613 


600 


Uncharacterized BCR, YceG family COG1559. putative 


! ORF01804 

$ XI W • WW 


SAG1614 


167 


acetyltransferase, GNAT family 


| ORF01805 


SAG1615 


443 


UDP-N-acetylmuramate— alanine ligase 


I ORF01806 


SAG1616 


205 


conserved hypothetical protein 


| ORF01807 


SAG1617 


32 


hypothetical protein 


j ORF01808 


SAG1618 


1032 


Snf2 family protein 


| ORF01810 


SAG1619 


377 


IS1548, transposase 


j ORF01811 


SAG1620 


436 


phosphoglycerate dehydrogenase-related protein 


I ORF01812 


SAG1621 


| 300 


primosomal protein Dnal 


ORF01813 


| SAG1622 


391 


conserved hypothetical protein 


ORF01814 


SAG1623 


j 159 


conserved hypothetical protein TIGR00244 


I ORF01815 


SAG1624 


501 


sensor histidine kinase CsrS 




SAG 1625 


229 


DNA-binding response regulator CsrR 


! ORF01817 


SAG1626 


177 


conserved hypothetical protein 


ORF01818 


SAG1627 


296 


heat shock protein HtpX 


I ORF01820 


SAG1628 


184 


lemA protein 


ORF01821 


SAG1629 


237 


glucose-inhibited division protein B 


ORF01822 


SAG1630 


459 


sodium transport family protein 


ORF01823 


SAG1631 


223 


potassium uptake protein, Trk family, putative 


ORF01824 


SAG1632 


276 


cobalt transport family protein 


ORF01825 


SAG1633 


558 


ABC transporter, ATP-binding protein 


ORF01826 


SAG1634 


212 


conserv d hypoth tlcal protein 


ORF01827 


SAG1635 


402 


sodium:dicarboxylate symporter family protein 
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ORF Ref No. 


SAGxxxx R f N . 


aa i 


\nn tation 


ORF01828 


SAG1636 


455 


branch ed-chain amino acid transport system II carrier 
Drotein 


UKrU i 529 


OAA4R17 

SAG! bo f 


OOl i 


aiconoi aenyarogenase, zinc-containing 


GKrUlooU 


oAbl boo 




Abu transporter, permease protein 


OKrOlool 


O AA4COO 

SAG 1 boy 


00b 


AdO transporcer, a i r-Dinuing protein 


rtOcn"( oo a 

ORF01 832 


O A /""»4 C4 A 

SAG1 040 


/ICQ 

4oo 


peptioase, ivu£U/ivizo/ivi40 tamuy 


ORF01833 i 


aa /~»4 C4 4 

SAG1641 


274 


lipoprotein .putative 


ORF01834 


SAG1 642 


0-7-7 
277 


Ado transporter, suDstrate-Dinding protein 


ORF01835 


SAG1b4o 


229 


glutamine ami dotransf erase, class 1 


ORF01 836 


O A /~* H C 4 4 

SAG1644 


37 


hypothetical protein 


ORF01837 


SAG1645 


000 
23o 


conservea nypotneticai protein iigkoiooo 


ORF01838 


SAG1 o4b 1 


00 
32 


hypothetical protein 


ORF01 839 


SAG1b4f 


000 
o2o 


dihydroxyacetone kinase family protein 


ORF01840 


O A A4fiJO 

SAG1648 


4 TO 

1 r o 


transcriptional regulator, TetR family, putative 


URF01o42 


SAG! 049 


Of 


hypothetical protein 


/~\ r~% r~nA CI A 1 

j ORF01 843 


O A ^> 4 CCA 

SAG 1650 j 


329 


dihydroxyacetone kinase family protein 


ORF01844 


SAG1 651 


192 


dihydroxyacetone kinase family protein 


ORF01 845 


SAG 1652 


404 

124 


conserved hypothetical protein 


ORF01 846 


SAG lb 53 


007 

23/ 


glycerol uptake facilitator protein 


ORF01847 


SAG1 654 


4 0 4 
134 


conserved hypothetical protein 


ORF01848 


SAG1 655 


007 

237 


transcriptional regulator, MerR family 


ORF01 849 


O A/"^4 CCC 

5AG1 bob 


oby 


conserved hypothetical protein 


ADCn,( oca 

ORF01 850 


oAGIbOf 


00 
00 


hypothetical protein 


ORF01851 


O A/">4 CCO 

SAG1 boo 


04 4 

244 


conserved hypothetical protein 


ORF01852 


O A /~*A CCA 

SAGlboy 


Ho 


iojap-related protein 


f~\I~)TT r\ A OCO 

ORF01853 


SAG1 bbO 


4 *70 

1 f O 


isochorismatase family protein 


rrr\4 oca 

ORF01854 


SAG1 bbl 


4 AC 

190 


aamaam ma*%.a*a\ Ut ia a4Ua4iaaI v\v#\4/\in TIODOrt>( OQ 

conservea nypotneticai protein i igkuu4oo 


ORF01855 


O A /"^ 4 CCO 

5AG1 6o2 


04 A 

210 


conservea nypotneticai protein i igkuu4o2 


ORF01856 


O A H CCO 

SAG 1 boo 


4 AC 
105 


conserved nypotneticai protein 1 iokuuzoo 


ORF01857 


O A /*"»4 CC4 

SAG1bo4 


0*70 

Of 2 


g 1 K-Dinoing protein 


ORF01858 


SAG 1665 


4 "7*7 

177 


hydrolase, haloacid dehalogenase-like family 


/*\npA4 OCft 

ORF01859 


SAG1 565 


one 
295 


membrane protein 


ORF01860 


O A r^A OCT 

SAG1 667 


A OA 

4o0 


glutamyi-tRNA(Gln) amidotransferase, B subunit 


ORF01861 


SAG1 6bo 


A OQ 

4oo 


glutamyl-tRNA(Gln) amidotransferase, A subunit 


I ORF01 862 


O A H CCA 

oAG1bb9 


4 AA 

1U0 


giutamyi-tKNA^oin; amiuotransierase, 0 suDunit 


\jKrUiobo 


oAGIbf U 


0.R1 
OOl 


pyruvate pnospnai© utKinaso 


vJKrll iob4 


oAbl b / 1 


97ft 
Zf O 


conservea nypovneucai protein 


UKrUlobO 


OAA4C70 


1 f U 


L/Do aomam proiein 


UKrU lOOD 


OAolOM 


177 
Of f 


^LhuHrAv\/QA»;LrV\A Hohurimnonsco familw r>mtoin 
o-nyui uxydiL'yi"OUA\ uci lyuiuyciiaoc laiiiiiy piutciii 


ADCA1 flft.7 


QAf24.ft.7A 




isocnorisrnataoc Tamuy pruioin 




i QA/^lf^e. 
oMolO/O 




francrrinti nnol ron i ilatAr r^ArlV ni ifotk/A 
UalloUiipuui lal loyuiaiur V-AJU 1 f putativo 


urviU i Of u 


C7C 
OnOl O f O 




ainil iL/UailoIci doc), Uaoo 1 


\jr\ru 1 0 / 1 


OMO I O f f 


1 0 f 


1 tni\/orcot c trace nmtain fomilv/ PRAMPfsUlPT 
univciodi oil coo pruicjii laiiiiiy rrvwiconir 1 


ORF01872 


SAG1 678 


4AA 

460 


hydrolase, haloacid dehalogenase-iike family 


ORF01 873 


O A 4 fi"TA 

SAG 1679 


OOA 

320 


asparaginase family protein 


HRFftl P/74 


OMO 1 OOU 




oi liivii 1 la to lyuiwyoi iaoc? 


ORF01875 


SAG1681 


304 


oxidoreductase, aldo/keto reductase family 


ORF01876 


SAG1682 


671 


ATP-dependent DNA helicase RecG 


ORF01877 


SAG1683 


512 


immunogenic secreted protein, putative 


ORF01878 


SAG1684 


366 


alanine racemase 


ORF01879 


! SAG1685 


119 


holo-(acyl-canier-protein) synthase 


ORF01880 


SAG1686 


335 


phospho-2-dehydro-o-deoxyheptonate aldolase 


ORF01881 


SAG1687 


842 


preprotein transl case, SecA subunit 


ORF01882 


SAG1688 


315 


mannose-6-phosphate isomerase, class 1 


ORF01883 


SAG1689 


293 


fructokinase ~! 
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Table 32: Conv rsion of ORF Ref Nos. with SAG Ref Nos. 



ORF Ref No. 


SAGxxxx R f No 


3a 


Ann tat ion 


ORF01885 


SAG1690 


639 


PTS system 1 1 ABC components 


ORF01886 


SAG1691 


479 


sucrose-6-phosphate hydrolase 


ORF01887 


SAG1692 


320 


sucrose operon repressor ScrR 


ORF01888 


SAG1693 


144 


N utilization substance protein B 


ORF01889 


SAG1694 


129 


conserved hvnothetioal nrotein 


ORF01 890 

VI XI V 1 www 


SAG 1695 

V"W 1 www 


186 


translation falnnnatlnn fan tor P 


I ORF01892 

VIM V 1 ww^ 


SAG1696 

wnv 1 ww w 


38 


hvnnthptinal nrotein 


ORF01893 * 


SAG1 697 

vnv 1 ww I 


•to 


i ly^jwU icuwcii |Jiulcin 


ORF01 804. 


SAG 1fi98 

vrtw 


QQ 

WW 


wuiiwwivwU iiypuuieuwai pruiein 


ORFO,18Q«5 

vr\ru 1 Ow«J 


OnO 1 wwv 




nypuiriwUCai pruiein 


wrvru 




78 

f w 


nypuuicsuwai uroioin 


ORF018Q7 


qagi701 




i iy uuu iciiLdi ui uiwin 




OnO 1 f UZ. 


41 


nypoineucai proiein 


ORF018QQ, 


vnv 1 » UO 


CM 
w*r 


Kv/nothotir'a! nrnfoin 
1 lyjJUuiQUbdi UlLHwlN 


urvru I9vu 


*xAf51704 


i^n 

1 WW 


wyuuinwacoxycyiiuyiaie aeaminas© lamiiy proiein 


ORFnion^ 

wrvrU 1 *3\J/L 


vnv I f vvl 




nontiHaco KAOA familu DHIMT KAl IT ATI OKI 


ORFOIQO^ 


Q AG 1708 
OnO | t ww 




uuiiQcivcu nypouieucai proiein 


ORF01Q04 


Q AG 1707 


4QQ 


H n in rocietanra tronennrfar PmrD/Oor>A famiki 

vJiuy rt^sisiance iransponer, ciTirD/uac/\ lamuy 


ORF01QO*5 


QAR1 70ft 


^8 


1 lyfJULI IcllUdl Ulwltiin 


vrvru 1 www 


QAG1709 

ono i r vj c7 


942 


OYrinnrloaco ADf* A enKimSt 
OAvlllUvlcaoQ nDO, n oUUUllll 


ORF01 907 

vrvrw 1 ww l 


SAG1710 


22^ 


wjiiocivcu i lypuu icuLdi pruiolli 


ORF01 908 


SAG 1711 

OAv 1 1 1 1 


314 


l llca^jl icolUl 1 1 UdIlo|JUI lei , OUIn Icllllliy 


ORF01 909 
wr\i v# i wv/w 


SAG1 71 2 


79 


IIUUOwlllCll JJIt-llCIII wlO 


ORF01910 


SAG1713 

X-J/ \X-/ If 1 w 


163 


sinale-stranri hindinn nrntein ! 

oinyio «u ai iu wiiiuniij |^i uivii i 


ORF01911 

W 1 Xl V 1 w 1 1 


SAG 1714 

vnv iii » 


95 


riho<5omal nrotpin SR 


ORF01912 ( 

X^l X* \J 9 <J 1 


SAG1715 

X^r*Xa* l * 1 


374 


A/G-soecific adenine nlvco^vla<>f> 


ORF01913 


SAG1716 


197 


transcriotianal reaulator Cro/CI familv 

U Ql Iwvl lUUwl Iwl 1 vMUImU/I f vlv/wl IwilllllV 


ORF01914 


SAG1717 

X*// VV If If 


104 


thiorednytn 

VI II VI vvUAII 1 


ORF01915 

W 1X1 w 1 w 1 W 


SAG1718 

WHV If • Kf 


166 


PAP2 famiiv nrntein 
i f\i i cm my \J i \J iw 1 1 1 


ORF01916 

w(XI W 1 w 1 w 


SAG1719 

vr^xj If 1 w 


779 


MntS2 familv nmtain 
iviuiv^ iciiiiiiy piuiwiii 


ORF01917 

VIM W 1 w 1 f 


SAG 1720 

vnw i f fcV/ 


180 


vUllOCSI VCU llypUUlCUlidl |JIULwlll 


ORF01918 


SAG1 721 

VnVJ 1 9 £m 1 


10^ 

1 Uv 


tui loci vcu iiy^wUiwUwdi fJiuitJiii 


ORF01919 

XVI XI \J I W 1 w 


SAG 1722 


297 


rihnntirlp9QP Mill 

1 IUUI IU vlwOOC 1 Mil 


ORF0192G 

XV 1 XI VI Wb w 


SAG 1723 

vnv 1 f <<W 


197 


wiyiiai po^uuaoo i 


ORF01921 

xvi xi w i Wk i 


SAG1724 


806 


helica^p> niitative 

1 IwllwOOC?, ^UlOUVO 


ORF01922 


SAG1725 
vnv i f ^w 


160 


uUI IOC?l Vt3vJ 1 lyfJwU IwUwOI JJIwlCIII 


ORF01923 


SAG1726 


364 


DNA-damanfl inducible omtein P 


ORF01924 

XV 1 XI V 1 w^~ 


SAG1727 

X^/^ V 1 Ifcl 


770 


formate apefvltran^fera^e 
i w 1 1 1 1 ci v w Qvviyiuai loivi aov 


ORF01925 


SAG1728 

X^#1XV 1 f 


124 


FMN-hindinn nrotein 

1 IVIM wlllUlllkJ plUlDIII 


1 ORF01926 


SAG 1729 

VrlV 1 f fcw 


309 


consen/ed hx/nnthetioal omtein 

vui loci vuu nypuMicuMii yti uioii i 


ORF01927 


SAG1730 


251 


nroteinase outative deaenerate FRAMESHIFT 


ORF01928 

XVI XI V 1 W*>U 


SAG 1731 

x^f»x^ i f w I 


298 


mpmhrane nrotein nntative 


ORF01929 
wr\r w i w^w 


I SAG 17^9 
vnv i / oil 


282 


nl\/r^erof i intake fanilitator nmfpln ntitsiti\/e 
yiyooivji UplaiVw laviHUaiui piULciii, puiauvv 


ORFOIQ^O 
Vvrxi U 1 30u 


QAG17*V* 
| OnO 1 / OO 


1^0 


universal siress proiein larniiy 


ORF01931 


SAG1734 


400 


transporter, putative 


ORF01 9^2 

Wrxr x* 1 ww 41 


SAG1 7**5 

OnO 1 l Ow 


I 219 


Udl loU IpUUilal 1 tiy UldLUI , vip/rlli Icllllliy 


ORF01933 


SAG1736 


761 


X-pro dipeptidyl-peptidase 


ORF01934 


SAG1737 


119 


hypothetical protein 


ORF01936 


SAG1738 


326 


polyprenyl synthetase family protein 


ORF01937 


SAG1739 


582 


ABC transporter, ATP-binding protein CydC 


ORF01938 


SAG1740 


572 


ABC transporter, ATP-binding protein CydD 


ORF01939 


SAG1741 


| 339 


cytochrome d ubiquinol oxidase, subunit II 


ORF01940 


SAG1742 


475 


cytochrome d oxidase, subunit 1 


ORF01941 


SAG1743 


402 


pyridine nucleotide-disuiphide oxidoreductase family 
protein 
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Tabl 32: Conv rsion of ORF R f Nos. with SAG Ref Nos. 



a\*"»^ ^> * Kt 

ORF Ref No. 


SAGxxxx Ref No. 


aa > 


\n notation I 


ORF01942 


A- A f> A "7 A A 

SAG1744 


299 


pr nyitransferas , UbIA family 


OKr01943 


O A f> «t "FA CZ 


148 


hypothetical protein 


ORF01944 


SAG 1746 


35 ! 


hypothetical protein 


ORF01945 


SAG1 747 


99 


con serve a nypotneticai protein i ivskuuiuo 


/•"vr"» rrrt 4 a a i 

ORF01946 


SAG 1748 J 


396 


cyclopropane-fatty-acyl-phosphoiipid synthase 


ORF01947 


SAG1749 


241 


transcriptional regulator, merR family 


ORF01948 


SAG1750 


195 


exonuclease 


ORF01949 


SAG1751 


178 


conserved hypothetical protein 


ORF01950 | 


SAG1752 


375 i 


conserved hypothetical protein TIGR00275 


ORF01951 


SAG1753 


260 


conserved hypothetical protein 


ORF01952 


SAG1754 


89 j 


ribosomal protein S14 


ORF01953 


SAG1755 


38 


hypothetical protein 


ORF01954 j 


SAG1756 


341 


conserved hypothetical protein 


ORF01957 


SAG1757 


336 


O-sialoglycoprotein endopeptidase family protein 


ORF01958 


SAG1758 


135 


ribosomal-protein-alanine acetyltransferase, putative 
. . . . 


/""»r^r~r\.4 Art a 

ORF01960 


SAG1 759 


230 


glyco protease family protein, putative 


ORF01961 ! 


SAG1 760 


76 


conserved hypothetical protein 


ORF01962 


SAG1761 


559 


metal lo-beta-lactamase superfamily protein 


AnpAJ AAA 

ORF01963 


O A TOO 

SAG1762 


169 


conserved hypothetical protein 


ORF01964 


SAG1 763 


A AO 

44 o 


glutamine synthetase, type I 


ORF01965 


SAG1764 




transcriptional regulator GlnR 


ORF01967 


A A /"*» 4 TOE 

SAG1 765 


A Tft 

179 


conserved hypothetical protein 


Ancnii A^r\ 

ORF01969 


O AA4TCC 

SAG1766 


39o 


I phosphogly cerate kinase 


ATA 

ORF01970 


SAG1 767 


AAA 

Zo9 


acid phosphatase 


ORF01971 


A A A TP rt 

SAG1768 


336 


glyceraldehyde diphosphate dehydrogenase 


ORF01972 


O A TFO A 

SAG1 769 


coo 
b92 


translation elongation factor G 


ORF01973 


A A /NJ » Jrt 

SAG 1770 


156 


ribosomal protein S7 


ORF01974 


SAG1771 


137 


ribosomal protein S12 


ORF01975 


A A *~>A 9 JO 

SAG1772 ! 


270 


pur operon repressor 


ORF01976 


SAG1773 


313 


HD domain protein 


ORF01977 


SAG 1774 


424 


conserved hypothetical protein 


ORF01978 


SAG 1775 


210 


conserved hypothetical protein 


ORF01979 


SAG1 776 


220 


ribulose-phosphate 3-epimerase 


ORF01980 


SAG1777 


290 


conserved nypotneticai protein iioKUUio/ 


ORF01981 


SAG 1778 


283 


rKNA (guanine-Ni-)-meinyitransTerase, putative 


! ORF01983 


SAG1779 


290 


dimethyladenosine transferase 


ORF01984 


A A /""» A "TOrt 

SAG 1780 


163 


hypothetical protein 


ORF01985 


SAG1781 


186 


primase-related protein 


ORF01987 


A a /-» j*tnn 

SAG1782 


260 


deoxyri bo nuclease, TatD family 


ORF01988 


A A A4700 

SAG1783 


OA 

90 


hypothetical protein 


ORF01989 


A A /"> <4 TO .4 

SAG 1784 


130 


hypothetical protein 


ORF01990 


SAG1785 


430 


hypothetical protein 


ORF01991 


SAG1786 


130 


hypothetical protein 


ORF01992 


SAG1787 


420 


dltO protein 




QAA4 TOO 




L>-aianyi earner pruiein 


ORF01994 


SAG1789 


421 


dltB protein 


ORF01996 


SAG1790 


511 


D-alanine-actlvating enzyme 


ORF01997 


SAG1791 


395 


sensor histidine kinase 


ORF01998 


SAG1792 


224 


DNA-binding response regulator 


ORF01999 


SAG1793 


44 


ribosomal protein L34 


ORF02000 


I SAG1794 


451 


membrane protein, putative 


ORF02001 


SAG1795 


368 


transp sas , IS30 family, putative 


ORF02002 


SAG1796 


575 


amino acid ABC transporter, permease protein 


ORF02004 


\ SAG1797 


407 


amino acid ABC transporter, ATP-blnding protein 
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Tabl 32: Conversion of ORF Ref Nos. with SAG Ref Nos. 



ORr Kef NO. ! 


SAGXXXX R T NO. 


aa i 


\nn tan n 


OKrUZUUO 


O A ^> 4 TO Q 

SAG 1 79 0 


39 


hypotn ticai protein j 


UKrU2Q0o 


SAG 1799 


792 


_ «l ■ «t>*. ^ C ril-iri i-ir-it->i-ifi-i 1 1 in 1 nf n r n £5 1"* r% r\ V\ ^\ ♦ /*\ 

xylulose-o-pnospnate/tructose-o-pnospnate j 
phosphoketolase 


UKrOZOOr 


SAG1 oUU 


000 


conserved hypothetical protein 


ORF020Q8 


SAG 1 801 


559 


transcriptional antiterminator» tigio Tamiiy 


ORF020Q9 


SAG1 802 


253 


conserved hypothetical protein 


ORFQ2010 


SAG 1803 


505 


carbonydrate Kinase, rGGY tamny 


ORF0201 1 


SAG 1804 


329 


hypothetical protein 


ORF02012 


SAG1 805 


483 


PTS system component, putative 


i ORF02015 


SAGIoOo 


318 


glyoxylate reductase, NADH-dependent 


ORF02016 


OAA4 0A7 

SAG1 807 


339 


hypothetical protein 


ORF0201 7 


O A /"X 4 O AO 

SAG 1808 


327 


sugar binding transcriptional regulator, Lacl family 


ORFft9ni8 


q AG1 80Q 


£, \ O 




ORFO,9mQ 


qagisio 

Ono 10 iu 


9*^8 


r*a rKrkh\/H rato iQAmoraco Aran/FnpA familv 
Ldi \J\J\ jyui die? loutncidoO, niai//ruV(A lamiiy 




*xAG181 1 
oao i 0 1 1 


987 


hovi tlr\cc»-R_nhoQr>hatQ icnmorsiQA mitntix/A 
I lcAUlUot3-D~JJI lUopilalo loUlllvladOi |JUldUVO 




OnO IO 16 


991 


hovi itriQO.R.nhrtcnhata cvntha^ft nutntivA 
I icAUiuoc U ^1 iuo|Ji la it? oyi iu icioc, puiauvo 




OnO IOIO 


181 
10 1 


DTC cuetom II A rnmnnnont 
1 I O oyoLtJlli, \\r\ lAJiiipui ICIH 




QAG1 R14 

OnO IO It 


Q9 ( 


DTC ewetom 1IR rnmnnnont 

i 1 O oyoidll, iid uui l ipui itJi ll 1 




<3AG1R1S 


47Q 


trancAArt nmtpin QnaT m itstiv/A 
UaiiopUii ^iuicm 1 oyoi , |juiciuvc 




QAf^1R1fi 




nypUU IcLIUdl piL/lClll 


ORFn9f19fi 






nypouicuutiii pruiein 


ORFn90,97 f 


QAG1R1R 




duel lyiUoUt/Oli la Lt3 oyilutclaoC 


ORF02028 


SAG1819 


340 


perfringolysin O regulator protein 


ORF02029 


SAG1 820 


AAl 

224 


conserved hypothetical protein 


ORF02030 


SAG1 821 


750 


glutamate— cysteine ligase-related protein 


ORF02031 


O A f~* A OOO 

SAG1 822 


272 


conserved hypothetical protein 


ORF02032 


5AG1 823 


4 4 O 
41 O 


conserved hypothetical protein 


ORF02033 


O A S"x<4 OOi 

SAG1 824 


291 


chaperonin, 33 kDa 


ORF02034 


OAA< OOC 

oAGI ozb 


<32o 


NiTKo/ommi ramiiy protein 


| ORFQ2035 


0A0I o2o 


21 0 


deoxynucleoside kinase family protein 


ORF02036 


O A A DOT 

SAG1 827 


4 CO 

153 


phosphinothricin N-acetyltransferase 


ORF02037 


SAG1 828 


i 04 c 


A I K-oepenaent uip protease, ai K-Dinomg suDunit 


ORF02038 


SAG1 R2Q 


154 


tran«5print}nnfll ronulntnr OtQR 

U Cll lOvl l|/UUI IOI | OUUICtlWI VlOI\ 


1 ORF0203Q 


SAG1 830 


153 


nnnsprvf^d hvnnthptical nrotpin 

VVl I9CI YCU 1 Ijpwil ICUvCII ^Ivlwlll 




CA(21 8^1 


346 


tranQlAfinn Alnnnatinn factor Tq 


ORF02041 


onvj 1 oot 


256 


rihnQnmsil nrntfiin 539 

1 iuuoui i ioi yji \j iv III 


ORF02042 


SAG1 833 


186 


alkvl hvdroDeroxide reductase sub unit C 


\ ORF02043 


SAG1 834 


510 


alkyi hydroperoxide reductase, subunit F 


ORF02044 


SAG1 835 


134 


conserved hvnothetical orotein 


ORF02045 


SAG1 836 


61 


conserved hvoothetical orotein 


ORF02046 


SAG1837 

wn\J 1 U«J f 


468 


Ivsin outative 

IV wit 1 , I/UWIm V W 




QA^I poo 


ma 


noiin, puiauve 




QQQ 

ooy 


1 0R 
TOO 


conserveu nypouieuccii proiein 


ORF02049 


SAG1840 


112 


hypothetical protein 


ORF02050 


SAG1841 


76 


conserved domain protein 


ORF02051 


SAG1842 


1224 


PbIB, putative 


ORF02053 


SAG1843 


i 240 


conserved hypothetical protein 


ORF02056 


SAG 1844 


911 


conserved hypothetical protein 


ORF02057 


SAG1845 


42 


hypothetical protein 


ORF02058 


SAG1846 


158 


hypothetical protein 


ORF02059 


SAG 1847 


227 


con8erv d hypothetical protein 


ORF02060 


SAG1848 


114 


conserv d hypothetical protein 


ORF02061 


SAG1849 


115 


hypothetical protein 
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Tabl 32: Conv rsion of ORF R f Nos. with SAG R f Nos. 



ORF Ref No. 


SAGxxxx R f No. 


aa t 


Annotation 




OnO 1 oju 




h\mnth«tir*nl nrntpin 




OnO i Ovi i 


111 

I I 1 


r*r\nc n/oH Hnmain nmtpln 

CO HO IVtJU vJUlllaltl piUlclll 






420 


r'nneorv/oH rinmsiin nmtpirt 
^Uliocivcu uuinaiii pi vlcii i 






180 


JiULcaotJ, JJUlaUVC 




OMOlOOH 


OOU 


conserveu nypumeuuai proiein 




OMOl OOO 


O/ VJ 


towwiwflea torn a ciihiinit mttotiv/A 

lerrninase large suounii, putative 


iriD prion ao 


OAolOOD 


lOl 


nypouieucai proiein 




Onbl OOO 


QC i 

yo 


hypothetical protein 


UKrU^Of i 


oAolooa 


lOU 


site-specific recombinase, phage integrase family 


ORF02072 


SAG1860 _J 


154 


conserved hypothetical protein 


UKrU^U7o 


oAblobl 


lis 


transcriptional regulator, Cro/CI family 


ad cnor»7c 


oAol oo^ 


oo 


hypothetical protein 


ADCf\On7C 


oAvslooo 


loo 


single-strand binding protein 


nocnon77 
\JKrU^U77 


oAbl OOH 


oo 


hypothetical protein 


/\n CnOH7Q 

tJKrU^Ur o 


oAb i ODD 


f H 


conserved hypothetical protein 


ADCnOH7Q 

\Jrsr\3Z\j f y 


oAVjI OOO 


-f no 
iuy 


conserved hypothetical protein 


r\p cnonfln 


OAolOOr 


lOO 


conserveo nypoineucai proiein 


UKrU^UOl 


oAblODO 


I OH 


nypouieucai proiein 




OAO 1 OOo 


4^7 
HO/ 


lyps ii uinm mouiiiCauon irieiriyiiransTerabo, puiouvtj 


ORF02083 


SAG1870 

X#f»XW 1 v f w 


273 


DNA reDlication orotein DnaC outative 


ORF02084 
r\i wkUU7 


SAG1871 


248 


conserved hvoothetical orotein 


ORF02085 


SAG 1872 


200 


hvoothetical Drotein 

1 *J pV U IwUvU I pi \#«W1I 1 


1 ORF02086 


SAG1873 


443 


replicative DNA helicase 


ORF02087 


SAG1874 


87 


hypothetical protein 


i ORF02088 


SAG1875 


94 


conserved hypothetical protein 


ORPnonftQ 


On w I O / O 


17R 

I/O 


niMn oiiuuiiuoicdoci idiiiiiy piuiwiii 




OMOlOf f 


4COO 


antiranraecAr r\ir\toin m if ofi\/o 
alJUlcpi cooUl piUiclM, puiaUVc 


ORFn9fiQ1 


OAf51 A7A 
OnO I O f O 


IU^ 


OUIlotJf VcjU UUIllalil pJUltJIJI 




oavj 10/ y 


•ICC 

l oo 


iiypuu itJuodi piuiciii 


Urxr U&U«7«3 


OrvJ I OOU 


OH 


liypuil loUUal piUldll 


ODCftonQA 


oMvalOOl 


Ol 


nypoineucdi proiein 


UKruzuyo 


oMul OOZ 


ion 


repressor proiein, putative 




OMVjlOOH 


I OH 


nypoxneucoi protein 




C Af^-I QOC 

OAU 1 OOO 


OOO 


sne-specinc recornuineioe, piiege iiuuyiaot) lamiiy 




SAG1886 


32 


hvoothetical Drotein 


\ ORF02101 


SAG1 887 

W#*XW 1 w » 


689 


Na+/H+ exchanger family protein 


ORF02102 


SAG1888 


78 


hypothetical protein 


ORF02103 


SAG1889 


317 


microcin immunity protein MccF, putative 


ORF02104 


SAG1 890 


631 


endopeptidase O 


ORF02105 

V^l XI Wfc 1 v#w 


SAG1891 


327 


oxidoreductase, Gfo/ldh/MocA family 




OAftl QQO 




mpmhrano nrntftln nutativA 
1 1 ici 1 1 ui di io piuioiti, puiauvo 




OAQ.IOQO. 

ono l OoO 




i %y pun icuuai piuiont 


ORF02109 


SAG1894 


214 


Cyclic nucleotide-binding domain protein 


ORF02110 


SAG1895 


204 


polypeptide deformylase 


ORF02111 


SAG1896 


333 


sugar binding transcriptional regulator RegR 


ORF02112 


SAG1897 


! 634 


conserved hypothetical protein 


ORF02113 


SAG1898 


271 


PTS system, IID component 


ORF02114 


| SAG1899 


288 


PTS system, 110 component 


ORF02115 


SAG1900 


164 


PTS system, HB component 


ORF02118 


8AG1901 


398 


glucuronyl hydrolase 


ORF02118 


SAG1902 


144 


PTS system, IIA component 


ORF02119 


SAG1903 


34 


hypothetical protein 
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Table 32: Conversi n of ORF Ref Nos. with SAG Ref Nos. 



ORF Ref No. 


SAGxxxx Ref No. 


aa i 


tanotati n 


ORF02120 


SAG1904 

) 


270 

f 


oxidoreductase, short-chain dehydrogenase/reductase 
c amily j 


ORF02121 


SAG1905 


212 


conserved hypothetical protein 


ORF02122 


SAG1906 


335 


carbohydrate kinase, PfkB family 


ORF02123 


SAG1907 


212 


2-dehydro-3-deoxyphosphogluconate aldolase/4- 
hydroxy-2-oxoglutarate aldolase 


ORF02124 


SAG1908 


499 | 


hypothetical protein 


ORF02125 


SAG1909 


204 


nitroreductase family protein 


ORF02126 


SAG1910 


141 


transcriptional regulator, MarR family 


ORF02127 


SAG1911 


1468 


DNA polymerase ill, alpha subunit, Gram-positive type 


ORF02128 


SAG1912 


194 


N-acetylmuramoyt-L-alanine amidase, family 4 protein 


ORF02129 


C"» A f \ A r\A o 

SAG1913 


617 


prolyl-tRNA synthetase 


ORF02130 


O jk /-\ A f\A A 1 

SAG1914 


419 


membrane-associated zinc metalloprotease, putative 






^0*f 


pnospnauoaie cyuayiyiiransieraso 


WrvPU^l o<£ 


Or\0 19 IO 




unuecciprenyi aipnospnaie synuiaotj 


1 Ur\ruZ 1 oo 


QAf^4Q17 
onO l ol f 


no 


preproiBin u ans iocaso, yajo suounn 


Ur\rUi lO** 


OnUlolO 


i 1/1 


conservea nypouieucai proiein 


Ur\rUt 1 oO 


ortoiy la 


JO/ 


rnsiiaie oxiuureauciciso 


Ur\rU4 TOO 


o/Ao i yzu 


A ACL 


ciuciie camsr proiciri, wvo laiiiiiy 


U T\r\j£.\ Of 


Onu 1 y^ 1 


QUO 


sensor nisuuine wndbt; lamiiy pruitjiii 


VJKrUZ JOO 




££9 


response reguiaior 




vSnbl y^o 


OO I 


uur^-giucose ^-epimerase 






coc 
OOO 


giucan i ,o-aipna-giucos>iaase 


DRFH91A1 




O/ # 


ci trior ARP trancnnrtpr AXO-Kinrlinn rtmti^in 




ono i y 




holiv fri irn.Holi v rfnmciin nmtoin fic_K/rto 
ilwIIA-lLiri I-IioILA UUlllalll pivJLUlll, llo-lyptS 


LJr\rU^l*frO 


0Mol96f 


OQQ 

ecu 


iacA proxein 


ORF02144 


SAG1928 


325 


tagatose 1 ,6-diphosphate aldolase 


ORF02145 


SAG1929 


310 


tagatose-6-phosphate kinase 


ORF02146 


SAG 1930 


171 


galactose-6-phosphate isomerase, LacB subunit 


ORF02147 


SAG 1931 


141 


galactose-6-phosphate isomerase, LacA subunit 


ORF02148 


SAG1932 


816 


neuraminidase 


ORF02149 


SAG1933 


482 


PTS system, HC component, putative 


t ORF02150 


SAG 1934 


101 


PTS system, t!B component, putative 


ORF02152 


SAG 1935 


157 


PTS system, HA component, putative 


ORF02153 


SAG1936 


258 


lactose phosphotransferase system repressor 


ORF02156 


O A f^A no*r 

SAG1937 




streptococcal histidine triad family protein, degenerate, 

CO AMCQUIICT 

rrvMvitonir 1 


ORpn^i *^7 


Onvj I 9jO 


OUi 


cSUilColUil lipuprULtfli I, pUlaUVO 






1 *T f 


lAJIloCIVcU I typUU IcLILrCll piCLOtll 1 lurVUUtJU 


ORF0.91*5Q 


O/AO 1 9HU 


7**R 
r 00 


V3 1 1 fjyiupiivJopiiu All loots 


nppnoi^n 

VJrvPU^lOU 




nnn 
ouu 


,o -cyciic-nucieouae c. -pnospnouiesieraso 


ORr0216i 


OA niA 

oA(51942 


151 


nrdl protein, putative 




oAo 1 y4o 


OHO 


conserved hypothetical protein 


ORF02163 


SAG1944 

V^r»>J 1 w " t 


165 


conserved hvDothetical nrotein 


ORF02164 


SAG1945 


345 


iron ABC transporter, iron-binding protein 


ORF02165 


SAG1946 


257 


DNA-binding response regulator 


ORF02166 


SAG1947 


549 


conserved hypothetical protein 


ORF02167 


SAG1948 


275 


PTS system, IID component 


ORF02168 


| SAG1949 


269 


PTS system, 110 component 


ORF02169 


SAG1950 


163 


PTS syst m, IIB component 


ORF02170 


SAG1951 


i 141 


PTS system, IIA component, putative 


ORF02171 


SAG1952 


353 


membrane protein, putative 


ORF02172 


SAG1953 


60 


hypothetical protein 
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ORF Ref No. 


SAGxxxxR fNo. 


aa j 


Annotation 


ORF02173 


SAG1954 


384 


hypothetical protein 


ORF02174 


SAG1955 


282 


ABC transporter, ATP-binding protein 


ORF02175 


SAG1956 


96 


conserved domain protein 


ORF02176 


SAG1957 


250 


response regulator 


ORF02177 


SAG1958 


276 


conserved hypothetical protein 


ORF02178 


SAG1959 


727 


PTS system, IIABC components 


ORF02179 I 


SAG1960 


551 


sensor histidine kinase 


ORF02180 


SAG1961 


225 


phosphate regulon response regulator PhoB 


ORF02181 


SAG1962 


218 


phosphate transport system regulatory protein PhoU, 
mutative 


ORF021 82 


O A A ft AO 

SAG1963 


ZOO 


ohosphate ABC transporter, ATP-binding protein 


^NQrftft4 AO 

ORF02183 


SAG1 964 


ftftft 

292 


shosphate ABC transporter, permease protein 


ORF021 84 


O A A ft A CT 

, SAG1965 


Zol 


phosphate ABC transporter, permease protein 


ORF021 86 


oAolybb 


OftO 

Zao 


hemolysin precursor, putative 


ORF021 87 


OA/"*4ftA*T 1 

SAG1 967 


4 ftC 


hypothetical protein 


ORF021 88 


oAolbbo 


ft>i ft 
Z4b 


conserved nypoineucai protein i iokuuu4o 


ORF021 89 


oAval 9b9 


Ol ( 


ribosomal protein L1 1 methyltransf erase 


/"■\r3rft04 nn 


O A /""» H ft "7 ft 


4 ftO 


conservea nypoineucai proiein 


APCAO«l ft4 

ORF02191 


SAo1971 


41 


hypothetical protein 


ORr 021 92 


©Aval 97Z 


OOQ 

Zoo 


transcriptional regulator, MerR family 


AOCno<( ft.4 

OKF021 94 


oAv3l9fo ! 


lob 


aceiyitransTerase, oinai lamny 


ORF02195 


SAG 1974 


loZ 


MufT/nudix family protein 


ORF02196 


SAG 1975 


4f 


hypothetical protein 


ORF02197 


SAG 1976 


4 CO 

loo 


conserved hypothetical protein 


ORF02198 


OA f**A f\'T ' J 

SAG 1977 


4 AO 

loo 


acetyl transferase, GNAT family 


; ORF02199 


C A A70 

SAG1978 


4ZZ 


ATPase, AAA family 


ORF02201 


O A 4 ft *Tft 

SAG1979 


253 


hypothetical protein 


ORF02202 


O A ^4 ft Oft 

SAG 1980 


Oftft 

oOO 


ABC transporter, ATP-binding protein 


ORF02203 


SA(?19o1 


AO 

bo 


hypothetical protein 


ORF02205 


O A <4 ft Oft 

SAG1 982 


OCA 

o59 


transcriptional regulator, Cro/CI family 


HDCAOAAC 

ORrOZZUo 


oAol&oo 


4AC 

1UO 


conserved hypothetical protein 


ORF02207 


SAG1984 


188 


conserved hypothetical protein T1GR00730 


ORF02208 


SAG1985 


51 


hypothetical protein 


ORF02209 


SAG1986 


375 


integrase, phage family, putative 


ORF02210 


SAG1987 


61 


conserved hypothetical protein 


ORF0221 1 


SAG 1988 


342 


conserved hypothetical protein 


ORF02212 


SAG1989 


139 


hypothetical protein 


ORF02213 


SAG1990 


127 


hypothetical protein 


I ORF02214 


SAG1991 


204 


transcriptional regulator, Cro/CI family 


ORF02215 


O A /■> 4 ft ft ft 

SAG1992 


C4 O 

518 


conserved hypothetical protein 


ORF02216 


O A *"*4 ftftO 

SAG1993 


373 


site-specific recombinase, phage integrase family 






I MO 


conservea nypuuieucai protein 


ORF02219 


A ^> 4 ftftC 

SAG1995 


210 


hypothetical protein 


ORF02221 


O A/"*4ftftA 

SAG1996 


263 


cell wall anchor protein-related protein 




OAfil QQ7 


1 Oil 


hv/ftftfVi aHaqI nrftfpin 

liypUU IC?ULrCli plUlBIII 


ORF02224 


SAG1998 


457 


hypothetical protein 


ORF02225 


SAG1999 


47 


hypothetical protein 


ORF02226 


SAG2000 


666 


membrane protein, putative 


ORF02227 


SAG2001 


756 


conjugal transfer protein, interruption-C 


ORF02228 


SAG2002 


[ 129 


IS1381, transposase OrfB 


ORF02229 


SAG2003 


127 


IS1381, transposase OrfA 


ORF02230 


3AG2005 


136 


conserved hypoth tidal protein 


ORF02231 


SAG2006 


88 


conserved hypothetical protein 


ORF02232 


| SAG2007 


317 


conserved hypothetical protein 
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ORF Ref No 1 


SAGxxxx Ref No. 


aa i 


tan tati n 


ORF02233 


SAG2008 i 


84 


conserv d hypothetical protein 


ORF02234 


SAG2009 


88 


conserved hypothetical protein 


ORF02235 


SAG2010 


157 


hypothetical protein 


ORF02236 


SAG201 1 


160 


conserved hypothetical protein 


ORF02237 


SAG2012 


90 


hypothetical protein 


ORF02238 


SAG2013 


189 


hvDOthetical Drotein 


ORF02239 


SAG2014 


449 


hvDOthetical Drotein 


ORF02240 


SAG2015 


99 


transcriptional regulator, Cro/CI family 








nypoineucai proiein 


\Jr\rU^Z4Z 


QAf^OfM "7 
OnOiU 1 / 


4^y 


iranscnpuonai reguiaiui, 010/01 icminy 


UKrU^Z4o 


OnOtUI 0 


ceo 

000 


riSrvopoiiiE: Tamuy pruiein 


<JrCrU^j£44 


oAb^Ul y 


100 


nypoineucai protein 


iJKrUZZ40 


QAf^onon 

OMbZUZU 


no 


nypoineucai protein 


ADCftOO/(ft 

VJKrU^Z4b 






ceil wan sun ace ancnor Tamuy proiein 


r\DCftOOA7 

vJKrU<£&4 # 




41 / 


iransposase, 10 lo rarniiy 


VJr\rU*uc4y 




CAR 
040 


mercunc reuuciao© 


Ur\r 


QA^9A9A 


IOU 


morr-nrir* racictonrA nnprnn roni ilatrtrv/ nmtoin MprP 
FTiwrouno rcoiouaiiuo upciwii loyuiaujiy pivjidii ivitsirx 


ORF02251 

1 XI VfcfcV 1 


SAG2025 


522 


Mn2+/Fe2+ transporter, NRAMP family 


ORF02252 


SAG2026 


240 


membrane protein, putative 


ORF02253 


SAG2027 


205 


ABC transporter, ATP-binding protein 


ORF02254 


SAG2028 


36 


conserved hypothetical protein 


ORF02255 


SAG2029 


284 


streptomycin resistance protein 


ORF02257 


SAG2030 


130 


hypothetical protein 


ORF02258 


SAG2031 


202 


hypothetical protein 


ORF02259 


SAG2032 


111 


conserved hypothetical protein 


ORF02260 


SAG2033 


162 


acetyltransferase, GNAT family 


ORF02261 


SAG2034 


247 


membrane protein, putative 


ORF02262 


SAG2035 


300 


ABC transporter, ATP-binding protein 


ORF02263 


SAG2036 


68 


hypothetical protein 


ORF02264 


SAG2037 


358 


transcriptional regulator, Cro/CI family 


ORF02265 

X^l XI V#^»fc\/W 


SAG2038 


204 


PAP2 family protein 


ORF02266 


SAG2039 


98 


conserved hypothetical protein 


wr\ru£&v # 




1 PR 


fvin<;pn"v/£>rl hvnnthptir^al nmtoin TirnRnft7'^0 


ORF02268 


SAG2041 


287 


protease, putative 


ad cnooeo 


oAlj^l/4^ 




rhodanese family protein 


UKrU^270 


5AG2043 


Ore 


camk tactor 


ORF02271 


SAG2044 


62 


hypothetical protein 


ORF02272 


SAG2045 


179 


DNA topology modulation protein FlaR, putative 


ORF02273 


SAG2046 


361 


glycerol dehydrogenase, putative 


ORF02274 


#X A ^X«#X ^ *9 

SAG2047 


235 


conserved hypothetical protein 


ORF02275 


fX A ^^#Xrt jt rt 

SAG2048 


614 


o^memyltetrahydrofolate— homocysteine 
methyltransf erase, putative 


ORF02276 


SAG2049 


745 


5-methyltetrahydropteroyItriglutamate--homocysteine 
meinyiiransTBrasB 


ORF02277 


SAG2050 


107 


conserved hypothetical protein 


ORF02278 


SAG2051 


230 


branched-chain amino acid transport protein AzlC, 
putative 


ORF02279 


SAG2052 


41 


hypothetical protein 


ORF02280 


SAG2053 


1570 


serine protease, subtilase family, putative 


ORF02281 


I SAG2054 


228 


DNA-binding response regulator 


ORF02282 


SAG2055 


462 


sensor histidine kinase 


ORF02283 


! SAG2056 


202 


chromos m assembly-related protein 


ORF02285 


SAG2057 


833 


leucyl-tRNA synthetase 


ORF02286 


SAG2058 


415 


major facilitator family protein 
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UKr KOT NO. 


SAGxxxx Ref No. 


aa i 


Annotation 


ORF02287 


SAG2059 


281 


conserved hypothetical protein 


ORF02288 


SAG2060 | 


398 


glycosyl transferase, family 8 


ORF02289 


SAG2061 


401 


glycosyl transferase, family 8 


ORF02290 


SAG2062 


179 


transcription antitemnination protein NusG 


ORF02291 


SAG2063 


630 


pathogenicity protein, putative 


ORF02292 | 


SAG2064 


57 


preprotein translocase, SecE subunit, putative 


ORF02293 


SAG2066 


773 


penicillin-binding protein 2A i 


ORF02294 


SAG2067 


294 


ribosomal large subunit pseudouridine synthase, RluD 
subfamily 


ORF02295 


oAv520oo 


546 


Lyme disease proteins of unknown function, putative 






H\JO 


nhnenhnn&nfAmi itocA 

pnuspnopenioiTiuiaow 




OrtOZU / u 




QcUAynuuoo**pnus>priaLo diuuidot? 






*tUU 


IMd" UcJJcllUclll NUOltJUolUtJ Udf lopUllUI 








UMUIIIC JJI lUo^JI IUI y IdoO 


ORF02301 | 


SAG2073 


245 


transcriptional regulator, GntR family 


CAOO AO 

UKrO^oO^ 


oAozU/4 


O40 


60 kda chaperonin 


UKrU^oUo 


OAOOA7R 


»4 


chaperonin, 10 kDa 


URr0<s30o 


O A POA7C 


ZOT 


ABC transporter, ATP-binding protein 




©Ao2U77 




ABC transporter, permease protein 


ORF02307 


SAG2078 


320 


lipoprotein, putative 


ORF02308 


SAG2079 


265 


hydrolase, haloacid dehalogenase-like family 


ORF02309 


SAG2080 


286 


glyoxalase family protein 


ORF02310 ' 


SAG2081 


243 


conserved hypothetical protein 


ORF02311 


SAG2082 


205 


anaerobic ribonucleoside-triphosphate reductase 
activating protein 


ORF0231 2 


SAG2083 


loo 


acetyltransferase, GNAT family 


ORF0231 3 


SAG2084 


310 


virulence factor MviM, putative 


ORF02314 


SAG2085 


47 


conserved hypothetical protein 


ORF02315 


SAG2086 


723 


anaerobic ribonucleoside-triphosphate reductase 


i ORF02316 


SAG2087 


495 


conserved hypothetical protein 


ORF0231 7 


SAG2088 


40 


hypothetical protein 


ORF0231 8 


SAG2089 


105 


conserved hypothetical protein 


ORF02319 


SAG2090 


136 


conserved hypothetical protein TIGR00250 


ORF02320 


SAG2091 


88 


conserved hypothetical protein 


ORF02321 


SAG2092 


132 


conserved hypothetical protein 


ORF02322 


SAG2093 


379 


recA protein 


ORF02323 


5AG2Q94 




competence/dam age-induclble protein CinA 

FRAMPQHIFT 

rrv\ivinonir i 




wnw £. \J O v> 


1 00 


l/in/A'O**! ucn iy lauci hi it? y i y uuoyiaoc i 


fiRFn9397 




1 570 


MnlliHax/ it motion ntsJA h^!1r*acA RnvA 


i ORFn?39ft 


SAGP0Q7 


418 




UKrUZO^b 


QA^OAQO 

oMu^uyo 




uinm mismaicn repair proiein nexo 


UKrUzooU 




, Jo 


hypothetical protein 


ORF02331 




67 


fiold shock nrntftin CSD famil\/ 


ORF02332 


SAG2101 


858 


DNA mismatch repair protein HexA 


ORF02333 


SAG2102 


145 


arginine repressor ArgR, putative 


ORF02334 


SAG2103 


563 


arginyl-tRNA synthetase 


ORF02335 


SAG2104 


102 


conserved hypothetical protein 


ORF02337 


SAG2105 


290 


conserved hypothetical protein 


ORF02338 


SAG2106 


314 


conserved hypothetical protein 


ORF02339 


SAG2107 


583 


aspartyMRNA synthetas 


ORF02340 


SAG2108 


426 


histidyl-tRNA synthetase 


ORF02341 


SAG2109 


60 


ribosomal protein L32 
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ORF Ref No. 


SAGxxxx Ref No. 


aa 


Annotation 


ORF02342 


SAG2110 


49 


ribosomal protein L33 


ORF02343 


SAG21 1 1 


173 


conserved hypothetical protein 


ORF02344 


SAG2112 


494 


site-specific recombinase, phage integrase family 




oA(j^i 1 0 




. 

conserved hypothetical protein 


UKrU^o4b 


oAWl 1 4 




conserved hypothetical protein 




oAo^l 1 0 


143 


hypothetical protein 


r\DCnoo >i rv 
OKrU^o49 


oAG21 1 0 


A C4 

151 


conserved hypothetical protein 


ODCAOQCA 

UKrU^ooU 


oAvj^l 1 r 


^ A 

71 


hypothetical protein 


tJKrUzool 


oAva^l 1 o 


ouo 


transcriptional regulator, Cro/CI family 


UKrU^ooZ 


oAvj^ny 




conserved domain protein 






ob 


hypothetical protein 


ORF02356 


SAG2121 


176 | 


hypothetical protein 


ORF02357 


SAG2122 


223 


DNA-binding response regulator 


ORF02358 


SAG2123 


454 | 


sensor histidine kinase 


ORF02359 


SAG2124 


517 


membrane protein, putative 


ORF02360 


SAG2125 


308 


carbamate kinase 


ORF02361 


SAG2126 


332 


ornithine carbamoyltransferase 


ORF02362 


SAG2127 


431 


sensor histidine kinase 


ORF02363 


SAG2128 


277 j 


response regulator 


ORF02364 


SAG2129 


240 


amino acid ABC transporter, ATP-binding protein 


ORF02365 


SAG2130 


504 


amino acid ABC transporter, permease and amino acid 
binding protein 


ORF02367 j 


A ^NO<t o 

SAG2131 


847 


membrane protein, putative 


ORF02368 


SAG2132 


247 


conserved hypothetical protein 


ORF02369 


SAG21 33 


118 ; 


conserved hypothetical protein 


\JKrUZ370 


SAG2134 


772 


membrane protein, putative 


ORF02371 


SAG2135 


179 


transcriptional regulator, TetR family, putative 


ORF02372 


SAG2136 


98 


conserved hypothetical protein 


ORF02373 


SAG2137 


203 


ribosomal protein S4 


ORF02374 


SAG2138 


95 


conserved hypothetical protein 


ORF02375 


SAG2139 


451 


replicative DNA helicase 


ORF02376 


SAG2140 


150 


ribosomal protein L9 


ORF02377 


SAG2141 


660 


DHH family protein 


ORF02378 


SAG2142 


613 


glucose inhibited division protein A 


ORF02379 


SAG2143 


203 


conserved hypothetical protein TIGR00427 


ORF02380 


SAG2144 


373 


tRNA (5-methylaminomethyl-2-thiouridylate)- 
methyltransferase 


ORF02381 


SAG2145 


222 


L-serine dehydratase, iron-sulfur-dependent, beta 
subuntt 


ORF02382 


SAG2146 


290 


L-serine dehydratase, iron-sulfur-dependent, alpha 
subunit 


ORF02383 


i SAG2147 


i 234 


conserved hypothetical protein 


ORF02384 


SAG2148 


179 


LysM domain protein 


ORF02385 


SAG2149 


264 


cobalt transport family protein 


ORF02386 


| SAG2150 


280 


ABC transporter, ATP-binding protein 


ORF02387 


SAG2151 


279 


ABC transporter. ATP-binding protein, FRAMESHIFT 


ORF02388 


SAG2152 


180 


CDP-diacylgIyceroI~glycerol-3-phosphate 3- 
phosphatidyltransferase 


ORF02389 


SAG2153 


! 427 


peptidase, M16 family 


ORF02390 


SAG2154 


414 


conserved hypothetical protein 


ORF02391 


SAG2155 


117 


conserv d hypothetical protein 


ORF02392 


| SAG2156 


369 


recF protein 


ORF02393 


SAG2157 


278 


transporter, putative 


ORF02395 


SAG2158 


220 


transcriptional regulator, Cro/CI family 
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33 


Ann ft f at I on 


ORF02396 


SAG2159 I 


493 


fnosine-5'-monoDhosDhate dehvdmoenase 


ORF02397 


SAG2160 i 


161 


transcriDtional reaulator AraR familv 

M en iQwi Ik* u wi »«i ■ wy mimVvi p # \i y i x i qi i hi y 


! ORF02398 


SAG2161 | 


226 


transcriptional regulator, Crp/Fnr family 


ORF02399 


SAG2162 \ 


234 


conserved hypothetical protein 


ORF02400 


SAG21 63 ! 


410 


arainine deiminase 


ORF02401 

X^IXI w fc^T w t 


SAG2164 


136 


acetvltransferase GNAT familv 


ORF02402 


SAG2165 


337 


ornithine carbamovltransferasp 


ORF02403 


SAG2166 


475 


arainine/ornithina antinorter 

qi yu in iv/vi • iih in iw c»i mpui iui 


ORF02404 I 


SAG21 67 


318 




ORF02405 


SAG2168 


341 


u y yj \\J yj i iai ly i u \i n/a oy i lu icictoo 


ORF02406 


SAG2169 


230 


conserved hypothetical protein 


L>r\rUZ4U ( 


OAVJ^I f U 


OQrt 


conserved hypothetical protein 


r\DEf\OAf\tl 




ooy 


ABC transporter, ATP-binding protein 


v*JKrU^4Uy 


oAvsZl f tt 


ooy 


ABC transporter, permease protein, putative 


L>KrUz4lU 




•f CO 

Toy 


conserved hypothetical protein TIGR00246 


<JKrU^4i1 


oAoiCl 74 


409 


serine protease 


UKrU^41^ 


oAQa^l /O 


*ioT 


partitioning protein, rare tamiiy 


L/Kr UZ41 o 


oA<3uUU1 


A CO 

45o 


chromosomal replication initiator protein DnaA 


UKp U^!41 o 


oACjUUUZ 




Ik 1 A - - ■- - III l»_.4._. ^. y L i 

DNA polymerase ill, beta subunit | 


\JKru^4lO 


oAtaUUUo 
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ribosomal protein L33 
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HNH endonuciease family protein 
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conserved hypothetical protein 
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ribosomal protein L33 
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conjugal transfer protein, interruption-N 
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gi|13621326|gb|AAK33146.1| 
gi|13621327|gb|AAK33147.1| 
gi|13621328|gb|AAK33148.1| 
gi|1 3621 329|gb|AAK331 49. 1 1 
gi|13621330|gb|AAK33150.1| 
gi|1 3621 331 |gb|AAK33151 .1 1 
gj|13621332Igb|AAK33152.1| 
gi|13621333|gb|AAK33153.1| 
gi|1 3621 334|gb|AAK331 54.1 1 
gi|1 3621 335|gb|AAK331 55.1 1 
gi|13621 337|gb|AAK331 56.1 j 
gi|13621340|gb|AAK33158.1 1 
gi|13621341|gb|AAK33159.1| 
gi|13621343]gb|AAK33160.1| 
gi|13621344|gb|AAK33161 .1 1 
gi|13621346|gb|AAK33163.1| 
gi|13621347|gb|AAK33164.1| 
gi|13621348Igb|AAK33165.1| 
gi|13621349|gb|AAK33166.1| 
gi|1 3621 350|gb|AAK331 67.1 1 
gi|1 3621 353|gb|AAK331 69.1 j 
gi|13621354|gb|AAK33170.1| 
gi|1 3621 355|gb|AAK331 71 .1 1 
gi|13621357|gb|AAK33173.1| 
gi|13621358|gb|AAK33174.1| 
gi|1 3621 359 |gb|AAK331 75. 1 1 
gi|1 3621 361 |gb|AAK331 76.1 1 
gi|1 3621 362|gbjAAK33177.1 1 
gi|1 362T363|gb|AAK331 78.1 1 
gi|1 3621 364|gb|AAK331 79.1 1 
gi|13621365|gb|AAK33180.1| 
gi|1 3621 366|gbjAAK331 81 .1 j 
gi|1 3621 367|gb|AAK331 82.1 1 
gi|13621368|gb(AAK33183.1| 
gi|1 3621 369|gb|AAK331 84.1 1 
gi|1 3621 370|gb|AAK331 85.1 1 
gi|1 3621 372|gb|AAK33186.1 1 
gi|13621 373|gb|AAK33187.1 1 
gi|1 3621 374|gb|AAK331 88. 1 1 
gi|1 3621 375|gb|AAK331 89.1 1 
gi|1 3621 376|gb|AAK331 90.1 1 
gi|1 3621 377|gb|AAK33191 .1 1 
gi|1 3621 378|gb|AAK33192.1 1 
gi|1 3621 379|gb|AAK331 93. 1 1 
gi|1 3621 380|gb|AAK331 94. 1 1 
gl|1 3621 382|gb|AAK331 96.1 1 
gi|1 3621 383|gb|AAK33197.1 1 
gi|13621384|gb|AAK33198.1| 
gi|1 3621 385|gb[AAK331 99.1 1 
gi|1 3621 386|gb|AAK33200.1 1 
gi|13621387|gb|AAK33201 .1 1 
gi|1 3621 388|gb|AAK33202. 1 1 
gi|1 3621 389|gb|AAK33203.1 1 
gi|13621390|gb|AAK33204.1| 
gi|13621391 |gb|AAK33205.1 1 
gi|13621392|gb|AAK33206.1| 



gi|13621393|gb|AAK33207.1 1 
gi|13621394|gb|AAK33208.1 1 
gi|13621397|gb|AAK33210.1| 
gi|13621398|gb|AAK3321 1.1| 
gi[13621 399|gb|AAK3321 2.1 j 
gi|13621401|gb|AAK33214.1| 
gi|13621403|gb|AAK33215.1| 
gi|13621404|gb|AAK33216.1| 
gi|13621405|gb|AAK33217.1| 
gi|13621407|gb|AAK33218.1| 
gi|13621408|gb|AAK33219.1| 
gi 1 13621 409|gb|AAK33220.1 1 
gi|13621413|gb|AAK33224.1| 
gi|13621415jgb|AAK33226.1 1 
gi|1 3621 41 6|gb|AAK33227.1 1 
gi| 1 3621 41 8|gb|AAK33229. 1 1 
gi| 1 3621 41 9|gb|AAK33230. 1 1 
gi 1 3621 424|gb|AAK33234. 1 1 
gi 13621425|gb|AAK33235.1| 
gi 13621426|gb|AAK33236.1| 
gl 13621434|gb|AAK33243.1| 
gi 13621450|gb|AAK33258.1| 
gi 13621455|gb|AAK33262.1| 
gi 13621456|gb|AAK33263.1| 
gi 13621457|gb|AAK33264.1| 
gi 13621467|gb|AAK33273.1| 
gi 13621468|gb|AAK33274.1| 
gi 13621469|gb|AAK33275.1| 
gi 13621470|gb|AAK33276.1| 
gi|1 3621 471 |gb|AAK33277.1 1 
gi|13621472|gb|AAK33278.1 1 
gi|1 3621 473 |gb| MK33279. 1 1 
gi|1 3621 476|gb|AAK33281 .1 1 
gi|13621477|gb|AAK33282.1| 
gi|13621 478|gb|AAK33283.1 1 
gi|13621480|gb|AAK33285.1| 
gi|13621481|gb|AAK33286.1| 
gi|13621491 |gb|AAK33295.1 1 
gi|1 3621 494|gb|AAK33298. 1 1 
gi|13621496|gb|AAK33299.1| 
gi|1 3621 501 |gb|AAK33304.1 1 
gi|13621502[gb|AAK33305.1| 
gi|1 3621 505|gb|AAK33307. 1 1 
gi|13621506|gb|AAK33308.1 1 
gi|13621 507|gb|AAK33309.1 1 
gi|1 3621 51 0|gb|AAK3331 2.1 1 
gi|13621 51 1 |gb|AAK3331 3.1 1 
gi|13621513|gb|AAK33315.1| 
gi|1 3621 51 6|gb|AAK3331 7.1 1 
gi|1 3621 51 8|gb|AAK3331 9.1 1 
gi|1 3621 521 |gb|AAK33322.1 1 
gi|13621522|gb|AAK33323.1| 
gi|13621 523|gb|AAK33324.1 1 
gi|1 3621 524|gb|AAK33325.1 1 
gi|13621 525|gb|AAK33326.1 1 
gi|1 3621 527|gb|AAK33327.1 1 
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gi|1 3621 528|gb|AAK33328.1 1 
gi|1 3621 529|gb|AAK33329.1 1 
gi|13621530|gb|AAK33330.1| 
gi|1 3621 531 |gb|AAK33331 .1 1 
gi|13621532|gb|AAK33332.1| 
gi|1 3621 533|gb|AAK33333.1 1 
gi|1 3621 534|gb|AAK33334. 1 1 
gi|13621535|gb|AAK33335.1 1 
gi|13621536|gb|AAK33336.1| 
gi|13621537|gb|AAK33337.1 1 
gi|13621539|gb|AAK33338.1| 
gi|13621540|gb|AAK33339.1| 
gi|1 3621 541 |gb|AAK33340.1 1 
gi|13621542|gb|AAK33341.1| 
gi|13621543|gb|AAK33342.1 1 
gi|1 3621 544|gb|AAK33343.1 1 
gi|13621546|gb|AAK33345.1| 
gi|1 3621 547|gb|AAK33346.1 1 
gi|1 3621 548|gb|AAK33347.1 1 
gi|13621550|gb|AAK33348.1 1 
gi)13621551 |gb|AAK33349.1 1 
gi|13621552|gb|AAK33350.1 1 
gi|1 3621 553|gb|AAK33351 .1 1 
gi|1 3621 554|gb|AAK33352.1 1 
gi|13621555|gb|AAK33353.1 1 
gi|13621557|gb|AAK33355.1 1 
gi|1 3621 559|gblAAK33356.1 1 
gi|13621 560|gb|AAK33357.1 1 
gi|13621561|gb|AAK33358.1| 
gi|1 3621 562 |gb|AAK33359.1 1 
gi|1 3621 563|gb|AAK33360.1 1 
gi|13621 564|gb|AAK33361 .1 1 
gi|1 3621 565|gb|AAK33362.1 1 
gi|13621566|gbIAAK33363.1 1 
gi|13621567|gb|AAK33364.1 1 
gi|13621 569|gb|AAK33365.1 1 
♦ gi|13621571|gb|AAK33367.1| 
gi|13621 572|gb|AAK33368.1 1 
gi|13621573|gb|AAK33369.1| 
gi|13621574|gb|AAK33370.1 1 
gi|13621 575|gb|AAK33371 .1 1 
gi|13621 576|gb|AAK33372.1 1 
gi|13621577|gb|AAK33373,1 1 
gi|13621 579|gb|AAK33374.1 1 
gi|13621581 |gb|AAK33376.1 1 
gl|13621 582|gb|AAK33377.1 1 
gi|13621 583|gb|AAK33378.1 1 
gi|13621584|gb|AAK33379.1 1 
gi|13621585|gb|AAK33380.1 1 
gi|13621586|gb|AAK33381 .1 1 
gi|1 3621 588|gb|AAK33383.1 1 
gi|1 3621 589|gb|AAK33384.1 1 
gi|1 3621 590|gb|AAK33385.1 1 
gi|13621592|gb|AAK33386.1 1 
gi|13621593|gb|AAK33387.1 1 
gi|13621594|gb|AAK33388.1| 



gill 3621 595|gb|AAK33389.1 1 
gi|13621 596|gb|AAK33390.1 1 
gi|1 3621 597|gb|AAK33391 .1 1 
gi|13621598|gbIAAK33392.1| 
gi|13621599|gb|AAK33393.1 1 
gi|13621600|gb|AAK33394.1| 
gi|13621602|gb|AAK33395.1 1 
gi|13621603|gb|AAK33396.1 1 
gi|13621604|gb|AAK33397.1 1 
gi|13621605|gb|AAK33398.1 1 
gi|13621606|gb|AAK33399.1| 
gi|1 3621 607|gb|AAK33400.1 1 
gi|13621608|gb|AAK33401.1| 
gi|13621609|gb|AAK33402.1 1 
gi|1362161 1 |gb[AAK33404.1 1 
gi|13621614|gb|AAK33406.1 1 
gi|13621615|gb|AAK33407.1| 
gi|13621616|gb|AAK33408.1| 
gi|13621617|gb[AAK33409.1 1 
gi| 1 3621 61 8 |gb| AAK334 1 0. 1 1 
gi|1 3621619|gb|AAK3341 1 .1 1 
gi|1 3621 620|gb[AAK3341 2. 1 1 
gi|1 3621 621 |gb|AAK33413.1 1 
gi|1 3621 622|gb|AAK3341 4.1 1 
gi|1 3621 623|gb|AAK3341 5. 1 j 
gi|1 3621624|gb|AAK3341 6.1 1 
gi|13621625|gb|AAK33417.1| 
gi|13621627|gb|AAK33419.1| 
gi|13621629|gb|AAK33420.1 1 
gi|13621630|gb|AAK33421 .1 1 
gi|13621631 |gb|AAK33422.1 1 
gi|1 3621 633|gb|AAK33424. 1 1 
gi|13621634|gb|AAK33425.1 1 
gi|1 3621 636lgb|AAK33427.1 1 
gi|1 3621 637|gb|AAK33428.1 1 
gi|1 3621 638|gb|AAK33429.1 1 
gi|13621640Igb|AAK33430.1 1 
gi|13621642Igb|AAK33432.1 1 
gi|1 3621 644|gb|AAK33434. 1 1 
gi|13621645|gb|AAK33435.1 1 
gi|1 3621 647|gb|AAK33437.1 1 
gi|1 3621 648|gb| AAK33438. 1 1 
gi|13621650|gb|AAK33440.1 1 
gi|13621 651 |gbjAAK33441 .1 1 
gi|1 3621 652|gb|AAK33442. 1 1 
gi|13621657|gb|AAK33446.1 1 
gi|1 3621 658|gb|AAK33447.1 1 
gi|13621660|gb|AAK33449.1 1 
gi|1 3621 670|gblAAK33458.1 1 
gi|1 3621 671 |gb|AAK33459.1 1 
gi|13621672|gb|AAK33460.1| 
gi|1 3621 675|gb|AAK33462.1 1 
gl|13621676|gb|AAK33463.1 1 
gi|13621678|gb|AAK33465.1| 
gi|13621680|gb|AAK33467.1| 
gi|1 3621 681 |gb|AAK33468.1 1 
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gi|1 3621 682|gb|AAK33469.1 1 
gi|13621683|gb|AAK33470.1 1 
gi|13621684|gb|AAK33471 .1 1 
gi|13621685|gb|AAK33472.1 1 
gi|13621688|gb|AAK33474.1 1 
gi|13621689|gb|AAK33475.1 1 
gi|1 3621 690|gb|AAK33476.1 1 
gi|13621691|gb|AAK33477.1| 
gi|13621692|gb|AAK33478.1 j 
gi|13621693|gb|AAK33479.1 1 
gi|13621694|gb|AAK33480.1 1 
gi|13621695|gb|AAK33481 .1 1 
gi|13621697|gb|AAK33483.1 1 
gi|13621698|gb|AAK33484.1 1 
gi|13621700|gb|AAK33485.1 1 
gi|1 3621 701 |gb|AAK33486.1 j 
gi|13621702|gb|AAK33487.1 1 
gi|13621714|gb|AAK33498.1 1 
gi|13621715|gb|AAK33499.1| 
gi|13621717|gb|AAK33501 .1 1 
gi|13621718|gb|AAK33502.1 [ 
gi|1 3621 71 9|gblAAK33503. 1 1 
gi|13621720|gb|AAK33504.1 1 
gi|13621726IgbIAAK33509.1 1 
gi|1 3621 727|gb|AAK3351 0.1 1 
gi|1 3621 729|gb|AAK3351 2.1 1 
gi|13621730|gb|AAK33513.1 1 
gi|13621731 |gb|AAK33514.1 1 
gi|13621732|gb|AAK33515.1 1 
gi|13621733|gb|AAK33516.1 1 
gi|13621734|gb|AAK33517.1| 
gi|13621735|gb|AAK33518.1| 
gi|1 3621 736|gb|AAK3351 9. 1 1 
gi|13621741 |gb|AAK33523.1 1 
gi|13621742Igb|AAK33524.1| 
gi|13621743|gb|AAK33525.1| 
gi|13621744|gb|AAK33526.1 1 
gi|13621745|gb|AAK33527.1| 
gi|13621747|gb|AAK33528.1 1 
gi|13621756|gb|AAK33537.1 1 
gi|1 3621 773|gb|AAK33552. 1 1 
gi|13621774|gb|AAK33553.1 1 
gi|13621775|gb|AAK33554.1 1 
gi|13621777|gb AAK33556.1 1 
gi|13621778|gb AAK33557.1 1 
gi|13621779|gb AAK33558.1 



gi|1 3621 781 |gb 



AAK33559.1I 



gi|1 3621 782|gb|AAK33560. 1 



gi|13621785|gb 
gi|13621786|gb 



gi|13621787|gb|AAK33565.1 



gi|13621788|gb 
gi|13621789|gb 
gi|13621790Igb 



gi|13621793|gbjAAK33571 .1 1 



gi|13621794|gb 



AAK33563.1| 
AAK33564.1I 



AAK33566.1| 
AAK33567.1| 
AAK33568.1| 



AAK33572.1| 



gi|13621796|gb|AAK33573.1| 
gi|13621797|gb|AAK33574.1 1 
gi|1 3621 799|gb|AAK33576. 1 1 
gi|13621800|gb|AAK33577,1| 
gi|13621802|gb|AAK33579.1 
gi|1 3621 806|gb|AAK33583. 1 
gi|13621808|gb|AAK33584.1 
gl|1 3621 809|gb|AAK33585. 1 
gi|13621810|gb|AAK33586.1 
gi|1362181 1 |gb|AAK33587.1 
gi| 1 3621 81 2|gb|AAK33588. 1 
gi|1 3621 81 3|gb|AAK33589. 1 
gi|13621814|gb|AAK33590.1 
gi|1 3621 81 7|gb|AAK33592.1 
gi| 1 3621 81 8|gb|AAK33593.1 
gi|13621819|gb|AAK33594.1 
gi|13621 820|gb|AAK33595.1 
gi|13621821 |gb|AAK33596.1 
gi|13621822|gb|AAK33597.1 
gi|1 3621 823|gb|AAK33598.1 
gi 1 3621 824|gb|AAK33599. 1 
gi 13621 825|gb|AAK33600.1 
gi 13621826|gb|AAK33601.1l 
gi 1 3621 828Igb|AAK33602. 1 1 
gi 13621829|gb|AAK33603.1| 
gi 13621830|gb|AAK33604.1 
gi 13621 831 |gb|AAK33605.1 
gi 13621834|gb|AAK33608.1 
gi 13621835|gb|AAK33609.1 
gi 13621836|gb|AAK33610.1 
gi 1 3621 837|gb|AAK3361 1.1 
gi 1 3621 839|gb|AAK3361 2.1 
gi 13621840|gb|AAK33613.1 
gi 13621 841 |gb|AAK33614.1 
gi 1 3621 842|gb|AAK3361 5.1 
gi 13621843|gb|AAK33616.1 
gi|1 3621 844|gb|AAK3361 7.1 
gi|1 3621 898|gb|AAK33667.1 
gi|13621901 |gb|AAK33670.1 
gi|13621902|gblAAK33671 .1 
gi|1 3621 904|gb|AAK33672.1 
gi|1 3621 907|gb|AAK33675. 1 
gi|13621908|gb|AAK33676.1 
gi|13621909|gb|AAK33677.1 
gi|13621910|gb|AAK33678.1 
gi|13621912|gb|AAK33680.1 
gi|13621924|gb|AAK33690.1 
gi|13621929|gb|AAK33694.1 
gi|1 3621 930Igb|AAK33695.1 1 
gi|1 3621 931 |gb|AAK33696.1 
gi|13621933|gb|AAK33698.1 
gi|13621934|gb|AAK33699.1 
gi|13621935|gb|AAK33700.1 1 
gi|13621936|gb|AAK33701.1| 
gi|1 3621 937|gb|AAK33702.1 1 
gi|13621938|gb|AAK33703.1| 
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gi|1 3621 939|gb|AAK33704.1 1 
gi|13621942|gb|AAK33706.1 1 
gi|13621944|gb|AAK33708.1| 
gi|13621945|gb|AAK33709.1 1 
gi|1 3621 946|gb|AAK3371 0.1 1 
gill 3621 950|gb|AAK3371 4.1 1 
gi|1 3621 953|gb|AAK3371 6.1 j 
gi|13621954|gb|AAK33717.1| 
gi|1 3621 955|gb|AAK3371 8.1 1 
gi|13621956|gb|AAK33719.1| 
gi|13621957|gb|AAK33720.1 1 
gi|13621958|gb|AAK33721.1 1 
gi|13621959|gb|AAK33722.1 1 
gi|13621961|gb|AAK33723.1 1 
gi|13621976|gb|AAK33736.1 1 
gi|13621977|gb|AAK33738.1 1 
gi|13621978|gb|AAK33739.1 j 
gi|13621979|gbjAAK33740.1 1 
gi|13621980|gb|AAK33741 .1 1 
gi|1 3621981 |gb|AAK33742.1 1 
gi|13621982|gb|AAK33743.1 1 
gi|1 3621 985|gb|AAK33745.1 j 
gi|1 3621 986|gb|AAK33746.1 j 
gi|1 3621 987|gb|AAK33747.1 1 
gi|13621989lgb|AAK33749.1 1 
gi|13621990|gblAAK33750.1 1 
gi|13621992|gb|AAK33752.1 1 
gi|1 3621 993|gb|AAK33753.1 1 
gi|1 3621 994|gb|AAK33754.1 1 
gi|13621996|gb|AAK33755.1 1 
gi|13621997|gb|AAK33756.1 1 
gi|13621998|gb|AAK33757.1 1 
gi|13621999|gb|AAK33758.1 1 
gi|1 3622000|gb|AAK33759.1 1 
gi|13622001|gb|AAK33760.1 1 
gi|13622002|gb|AAK33761 .1 1 
gi|13622003|gb|AAK33762.1 1 
*gi|13622004|gb|AAK33763.1 1 
gi|13622005|gb|AAK33764.1 1 
gi|13622006|gb|AAK33765.1 1 
gi|13622008|gb|AAK33766.1 1 
gi|13622009|gb|AAK33767.1 1 
gi|13622010|gb|AAK33768.1 1 
gi|1 362201 2|gb|AAK33770.1 1 
gi|13622013|gb|AAK33771 .1 1 
gi|13622017|gb|AAK33774.1 1 
gi|13622018|gb|AAK33775.1 1 
gi|1 362201 9|gb|AAK33776.1 1 
gi|13622020|gb|AAK33777.1 1 
gi|13622021 |gb|AAK33778.1 1 
gi|13622024|gb|AAK33781 .1 1 
gi|13622025|gb|AAK33782.1 1 
gi|1362202e|gb|AAK33783.1| 
gi|13622031 |gb|AAK33787.1 1 
gi|1 3622032|gb|AAK33788.1 1 
gi|13622033|gb|AAK33789.1| 



gi|13622034|gb|AAK33790.1 
gi|13622035Igb|AAK33791.1 
gi|13622039|gb|AAK33794.1 
gi|1 3622041 |gb|AAK33796.1 
gi|13622042|gb|AAK33797.1 
gi|1 3622043|gb|AAK33798.1 
gi|13622044|gb|AAK33799.1 
gi|13622045|gb|AAK33800.1 
gi|13622046|gb|AAK33801.1 
gi|1 3622048|gb|AAK33802.1 
gi|13622049|gb|AAK33803.1 
gi|13622050jgb|AAK33804.1 
gi|13622051 |gb|AAK33805.1 
gi|13622052|gb|AAK33806.1 
giI13622054|gbIAAK33808.1 
gl|13622055|gb|AAK33809.1 
gi|13622056|gb|AAK3381 0.1 
gi|13622058|gb|AAK33812.1 
gi| 1 3622060|gb|AAK3381 3.1 
gi|13622062|gb|AAK3381 5.1 
gi|13622064Igb|AAK33817.1 
gi|13622065Igb|AAK33818.1 
gi|13622068|gb|AAK33821.1 
gi|13622069|gb|AAK33822.1 
gi|13622070|gb|AAK33823.1 
gi|1 3622071 |gb|AAK33824.1 
gi|13622073|gb|AAK33825.1 
gi|1 3622074|gb|AAK33826.1 
gi|1 3622075|gb|AAK33827.1 
gi|1 3622077|gbjAAK33829.1 
gi|13622079|gb|AAK33831 .1 
gi|13622083|gb|AAK33834.1 
gi|13622085|gb|AAK33836.1 
gi|1 3622086|gb|AAK33837.1 1 
gi|13622087|gb|AAK33838.1 1 
gi|1 3622088lgb|AAK33839.1 1 
gi| 1 3622089|gb|AAK33840. 1 1 
gi 1 1 3622090|gb|AAK3384 1 . 1 1 
gi|13622091 |gb|AAK33842.1| 
gi|1 3622092|gb|AAK33843.1 1 
gi|13622093|gb|AAK33844.1 j 
gi|1 3622095|gb|AAK33845.1 1 
gi|13622096|gb|AAK33846.1 1 
gi|13622097|gb|AAK33847.1| 
gi|1 36221 62|gb|AAK33908.1 1 
gi|13622163|gb|AAK33909.1 1 
gi|1 36221 64|gb|AAK3391 0.1 1 
gi|1 36221 65|gb|AAK3391 1 .1 1 
gi|13622166|gb|AAK33912.1| 
gi|13622169|gb|AAK33914.1| 
gi|1 36221 70|gb|AAK3391 5.1 1 
gi|13622171|gb|AAK33916.1| 
gi|1 36221 72|gb|AAK3391 7.1 1 
gi|13622174|gb|AAK33919.1| 
gi|1 36221 75|gb|AAK33920. 1 1 
gi|1 36221 76|gb|AAK33921 .1 1 
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giI13622177|gb|AAK33922.1 
gi|1 36221 79|gb|AAK33923.1 
gi|13622180|gb|AAK33924.1 
gi|136221 81 |gb|AAK33925.1 
gi|1 36221 82|gb|AAK33926.1 
gi|1 36221 83|gb|AAK33927.1 
gi|1 36221 84|gb|AAK33928.1 
gi|13622185|gb|AAK33929,1 
gi|13622186|gb|AAK33930.1 
gi|1 36221 89|gb|AAK33932.1 
gl|13622190|gb|AAK33933.1 
gi|13622191 |gb|AAK33934.1 
gi|1 36221 92|gb|AAK33935. 1 
gi|1 36221 98|gb |AAK33940.1 
gi|1 3622200|gb|AAK33942.1 
giJ1 3622201 |gb|AAK33943.1 
gi|13622204|gb|AAK33946.1 
gi|13622205|gb|AAK33947.1 
gi|1 3622207|gb|AAK33949.1 
gi|1 3622208|gb|AAK33950.1 
gi|1 362221 1 |gb|AAK33952.1 
gi|13622213|gb|AAK33954.l 
gi|13622214|gb|AAK33955.1 
gi|13622215|gb|AAK33956.1 
gi|13622216|gb|AAK33957.1 
gi|1 362221 7|gbIAAK33958.1 
gi|1 362221 8|gb|AAK33959.1 
gi|13622219|gb|AAK33960.1 
gi|13622222|gb|AAK33962.1 
gi|13622223|gb|AAK33963.1 
gi|1 3622224|gb|AAK33964.1 
gi|13622233|gb|AAK33972.1 
gi|1 3622235|gb|AAK33974.1 
gi|13622236|gb|AAK33975.1 
gi|13622237|gb|AAK33976.1 
gi|13622239|gb|AAK33978.1 
gi|13622240|gb|AAK33979.1 
gi|13622241 |gb|AAK33980.1 
gi|13622242|gb|AAK33981 .1 
gi|1 3622243|gb|AAK33982.1 



gi 
gi 
gi 
gi 
gi 
gi 
gi 
gi 
gj 
gi 
gi 
gi 
gi 
gi 
gi 
gi 



13622244|gb|AAK33983.1 
1 3622250|gblAAK33988. 1 
1 3622252|gb|AAK33990.1 
1 3622253Igb|AAK33991 .1 
13622255|gb|AAK33993.1 
1 3622256|gb|AAK33994.1 
1 3622257|gb|AAK33995. 1 
1 3622259 jgb|AAK33996. 1 
1 3622260|gb|AAK33997. 1 
13622261 |gb|AAK33998.1 
1 3622262|gblAAK33999. 1 
1 3622263|gb|AAK34000.1 
13622264|gb|AAK34001 .1 
1 3622265|gb|AAK34002. 1 
1 3622266 |gb (AAK34003. 1 
1 3622268|gb|AAK34005. 1 



gi|13622269|gb|AAK34006.1 1 
gi!13622271 |gb|AAK34007.1 1 
gi|13622272Igb|AAK34008.1 1 
gi|13622273|gb|AAK34009.1 1 
gi|13622274|gb|AAK34010.1 j 
gi|13622275|gb|AAK3401 1.1 1 
gi|1 3622276|gb|AAK3401 2.1 1 
gl|1 3622277|gb|AAK3401 3.1 1 
gi|13622278|gb|AAK34014.1 1 
gi|1 3622279|gb|AAK3401 5.1 1 
gi|1 3622281 |gb|AAK34017,1 1 
gi|1 3622282|gb|AAK3401 8.1 1 
gi|1 3622283|gb|AAK3401 9.1 1 
gi|1 3622284 |gb|AAK34020.1 1 
gi| 1 3622285|gb|AAK34021 .1 1 
gi|1 3622287|gb|AAK34022.1 1 
gi|1 3622288|gb|AAK34023.1 1 
gi|13622289|gb|AAK34024.1 1 
gi|1 3622290|gb|AAK34025.1 1 
gi|13622294|gb|AAK34029.1 1 
gi|1 3622295|gb|AAK34030.1 1 
gi|13622296|gb|AAK34031.1| 
gi|13622297|gb|AAK34032.1 1 
gi|13622298|gb|AAK34033.1 1 
gi|13622299|gb|AAK34034.1 1 
gi|13622301 |gb|AAK34035.1 1 
gi|13622306|gb|AAK34040.1 1 
gi|1 3622326|gb|AAK34058.1 1 
gi|13622328|gb|AAK34060.1 1 
gi|13622329|gb|AAK34061 .1 1 
gi|1 3622330|gb|AAK34062.1 1 
gi|1 3622332|gb|AAK34064.1 1 
gi|1 3622333|gb|AAK34065.1 1 
giJ1 3622335|gb|AAK34066.1 1 
gi|1 3622338|gb|AAK34069.1 1 
gi|1 3622339|gb|AAK34070.1 1 
gi|13622340|gb|AAK34071 .1 1 
gi|13622341 |gb|AAK34072.1 1 
gi|1 3622343|gb|AAK34073.1 1 
gi|13622350|gb|AAK34080.1 1 
gi|13622351 |gb|AAK34081 .1 1 
gi|13622352|gb|AAK34082.1| 
gi|13622353|gb|AAK34083.1 1 
gi|13622355|gb|AAK34084.1| 
gi|1 3622356|gb|AAK34085.1 1 
gi|13622357|gb|AAK34086.1 1 
gi|1 3622358|gb|AAK34087.1 1 
gi|13622359|gb|AAK34088.1 1 
gi|13622360|gb|AAK34089.1 1 
gi|1 3622361 |gb|AAK34090.1 j 
gi|13622362|gb|AAK34091.1| 
gi|13622363|gb|AAK34092.1 1 
gi|13622364|gb|AAK34093.1 1 
gi|13622366Igb|AAK34094.1 1 
gi|13622367|gb|AAK34095.1 1 
gi|13622368|gb|AAK34096.1 1 
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gi|13622369|gb|AAK34097.1| ' 
gi|13622370|gb|AAK34098.1 1 
gi|13622371 |gb|AAK34099.1 1 
gi|13622372|gb|AAK34100.1| 
gi|1 3622373|gb|AAK341 01 .1 1 
gi|13622374|gb|AAK34102.1| 
gi|13622375|gb|AAK34103.1 1 
gi|1 3622376|gb|AAK341 04.1 1 
gi|13622377|gb|AAK34105.1| 
gi|13622378|gb|AAK34106.1 1 
gi|1 3622380|gb|AAK341 07.1 1 
gi|1 3622383|gb|AAK341 10.11 
gi|13622384|gb|AAK341 1 1.1| 
gi|13622387|gb|AAK341 14.1] 
gi|13622389|gb|AAK34116.1| 
gi|1 3622394|gb|AAK341 20.1 1 
gi|13622395|gb|AAK341 21 .1 1 
gi|13622396|gb|AAK34122.1| 
gi|13622398|gb|AAK34124.1| 
gi|13622399|gb|AAK34125.1 1 
gi|13622400|gb|AAK34126.1 1 
gi|1 3622401 |gb|AAK341 27.1 1 
gi|13622403|gb|AAK34128.1| 
gi| 1 3622405|gb|AAK341 30. 1 1 
gi|1 3622406Igb|AAK341 31 .1 1 
gi|13622407|gb|AAK34132.1| 
gi|13622408|gb|AAK34133.1 1 
gi|13622415|gb|AAK34139.1| 
gi|13622416|gb|AAK34140.1| 
gi|1362241 7|gb|AAK34141 .1 1 
gi|13622419|gb|AAK34143.1 1 
gi|13622420|gb|AAK34144.1 1 
gi|13622424|gb|AAK34147.1 1 
gi|13622425|gb|AAK34148.1 1 
gi|13622431 |gb|AAK34153.1 1 
gi|13622432|gb|AAK34154.1 1 
gi|13622433|gb|AAK34155.1 1 
gi|13622434|gb|AAK34156.1| 
gi|13622435|gb|AAK34157.1 1 
gi|13622436|gb|AAK341 58.1 1 
gi|13622437|gb|AAK34159.1 1 
gi|13622444|gb|AAK34165.1 1 
gi|13622447|gb|AAK34168.1 1 
gi|13622450|gb|AAK34170.1 1 
gi|1 3622451 |gb|AAK34171 .1 1 
gi|13622455|gb|AAK34175.1 1 
gi|13622457|gb|AAK34177.1 1 
gi|13622458|gb|AAK34178.1| 
gi|13622460|gb|AAK34179.1 1 
gi|13622461|gb|AAK34180.1| 
gi|13622462|gb|AAK34181 .1 1 
gi|13622463|gb|AAK34182.1 1 
gi|1 3622464|gb|AAK341 83.1 1 
gi|13622465|gb|AAK34184.1 1 
gi|13622467|gb|AAK34186.1| 
gi|1 3622468|gb|AAK341 87.1 1 



gi|1 3622471 |gb|AAK341 89.1 1 
giI13622473|gb|AAK34191.1| 
gi|1 3622474|gb|AAK341 92. 1 1 
gi|13622477|gb|AAK34195.1| 
gi|13622478|gb|AAK34196.1 1 
gi|13622479|gb|AAK34197.1 1 
gi|1 3622481 |gb|AAK341 98. 1 1 
gi|13622482|gb|AAK34199.1| 
gi|1 3622483|gb|AAK34200.1 1 
gi|13622484|gb|AAK34201 .1 1 
gi|13622485|gb|AAK34202.1 1 
gi|1 3622486|gb|AAK34203.1 1 
gi|13622491 |gb|AAK34207.1 1 
gi|13622492|gb|AAK34208.1 1 
gi|13622493|gb|AAK34209.1 1 
gi|1 3622494|gb|AAK3421 0.1 1 
gi|1 3622495|gb|AAK3421 1 .1 1 
gi|13622496|gb|AAK34212.1 1 
gi|13622497|gb|AAK3421 3.1 1 
giI13622499|gb|AAK34214.1 1 
gi|13622500|gb|AAK3421 5.1 1 
gi| 13622501 |gb|AAK34216.1 1 
gi| 1 3622506 |gb|AAK3422 1 . 1 1 
gi|13622507|gb|AAK34222.1 1 
gi|13622508|gb|AAK34223.1 1 
gi|1 3622509|gb|AAK34224. 1 1 
gi|1 362251 1 |gb|AAK34225.1 1 
gi|1 362251 2|gb|AAK34226.1 1 
gi|1 362251 3|gb|AAK34227.1 1 
gi|1 362251 5|gb|AAK34229.1 1 
gi|1 362251 6|gblAAK34230.1 1 
gi|1 362251 7|gb|AAK34231 .1 1 
gi|1 362251 8|gb|AAK34232.1 1 
gi|13622520|gb|AAK34233.1 1 
gi|13622521|gblAAK34234.1i 
gi|1 3622523|gb|AAK34236.1 1 
gi|13622524|gb|AAK34237.1 1 
gi|13622525|gb|AAK34238.1 1 
gl|13622526|gb|AAK34239.1 1 
gi|13622527|gb|AAK34240.1 1 
gi|13622579|gb|AAK34289.1 1 
gi|13622583|gblAAK34292.1 1 
gi|13622585|gb|AAK34294.1 1 
gi|13622587|gb|AAK34296.1 1 
gi|1 3622588|gb]AAK34297.1 1 
gi|1 3622590|gblAAK34299.1 1 
gi|1 3622591 |gb|AAK34300.1 1 
gi| 1 3622593|gb|AAK34301 .1 1 
gi|13622595|gb|AAK34303.1 1 
gi|1 3622596|gb|AAK34304.1 1 
gi|13622597|gb[AAK34305.1 1 
gi|1 3622598|gb|AAK34306.1 1 
gi|13622599|gbIAAK34307.1| 
gi|13622600|gb|AAK34308.1| 
gi|1 3622601 |gb|AAK34309.1 1 
gi| 1 3622603|gb|AAK3431 0. 1 1 
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gi|1 3622604|gb|AAK3431 1 .1 1 
gi|13622606|gb|AAK34313.1| 
gi|13622607|gb|AAK34314.1| 
gi|1 3622608|gb|AAK3431 5.1 1 
gi|13622609|gb|AAK3431 6.1 1 
gi|1 362261 0|gb|AAK3431 7.1 1 
gi|1 362261 1 |gb|AAK3431 8.1 1 
gi|1 362261 2|gb|AAK3431 9.1 1 
gi|1362261 5|gb|AAK34321 .1 1 
gi|1 362261 6|gb|AAK34322.1 1 
gi|13622617|gb|AAK34323.1| 
gi|13622618|gb|AAK34324.1 1 
gi|1 3622621 |gb|AAK34327.1 1 
gi|13622622|gb|AAK34328.1 1 
gl|13622623|gb|AAK34329.1 1 
gl|13622624|gb|AAK34330.1 1 
gi|13622625Igb|AAK34331 .1 1 
gi|13622626|gb|AAK34332.1 1 
gi|13622628|gb|AAK34333.1 1 
gi|13622629Igb|AAK34334.1 1 
gi|13622630|gb|AAK34335.1 1 
gi|1 3622631 |gblAAK34336.1 1 
gi|13622632|gb|AAK34337.1 1 
gi|13622634|gb|AAK34339.1 1 
gi|13622636|gb|AAK34341.1| 
gi|1 3622640|gb|AAK34344.1 1 
giI13622641 |gb|AAK34346.1 1 
gi|13622652|gb|AAK34355.1 
gi|13622653|gb|AAK34356.1 
gi|1 3622654|gb|AAK34357.1 
gi|13622656|gb|AAK34359.1 
gi|13622660|gb|AAK34363.1 
gi|13622665|gb|AAK34367.1 
gi|13622668|gb|AAK34370.1 
gi|13622675|gb|AAK34376.1 
gi|13622676|gb|AAK34377.1 
gi|13622683|gb|AAK34383.1 
gi|1 3622684|gb|AAK34384.1 
gi|13622685|gb[AAK34385.1 
gi|13622688|gb|AAK34387.1 
gi|13622689|gb|AAK34388.1 
gi|13622690|gblAAK34389.1 
gi|1 3622691 |gb|AAK34390.1 
gi|13622692|gb|AAK34391 .1 
gi|13622693Igb|AAK34392.1 
gi|13622694|gb|AAK34393.1 
gi|1 3622695|gb|AAK34394.1 
gi|1 3622696|gb|AAK34395.1 
gi|13622698|gb|AAK34396.1 
gi|13622699|gb|AAK34397.1 
gi|13622700|gb|AAK34398.1 
gi|13622701|gb|AAK34399.1 
gi|13622702|gb|AAK34400.1 
gi|13622703|gb|AAK34401 / 
gi|13622704|gb|AAK34402.' 
gi|13622705|gb|AAK34403.' 



gl|1 362271 1 |gb|AAK34408.1 1 
gi|13622713|gb|AAK34410.1 1 
gi|13622714|gb|AAK3441 1 .1 1 
gi|1 362271 5|gb|AAK3441 2.1 1 
gi| 1 362271 8|gblAAK3441 4.1 1 
giI13622719|gb|AAK34415.1| 
gi|13622720|gb|AAK34416.1 1 
gi|1 3622721 |gb[AAK3441 7.1 1 
gi|13622722|gb|AAK34418.1| 
gi|13622723|gb|AAK34419.1 1 
gi|13622727|gb(AAK34422.1 1 
gi|13622728|gb|AAK34423.1 1 
gi|13622729|gb|AAK34424.1 1 
gi| 1 3622730|gb|AAK34425. 1 1 
gi|13622731|gblAAK34426.1| 
gi|13622733|gb|AAK34428.1 j 
gi|13622734|gb|AAK34429.1 1 
gi]1 3622735|gb[AAK34430. 1 1 
gi|1 3622736|gb|AAK34431 .1 1 
gi|13622737|gb|AAK34432.1 1 
gi|13622740|gb[AAK34434.1 1 
gi|1 3622741 |gb|AAK34435.1 1 
gi|13622742|gb|AAK34436.1 j 
gi|1 3622744|gb[AAK34438.1 1 
gi|1 3622746|gb|AAK34439.1 1 
gi|13622746|gb|AAK34440.1 1 
gi|1 3622749|gb[AAK34442.1 1 
gi|1 3622750|gb|AAK34443.1 1 
gi|1 3622751 |gb|AAK34444.1 1 
gi|13622752|gb|AAK34445.1| 
gi|1 3622753|gb|AAK34446. 1 1 
gi|1 3622754|gb|AAK34447.1 1 
gi|1 3622760|gb|AAK34452.1 1 
gi|1 3622762|gb|AAK34454.1 j 
gi|1 3622763|gb|AAK34455.1 1 
gi|13622764|gb|AAK34456.1 1 
gi|1 3622765|gb|AAK34457. 1 j 
gi| 1 3622766|gb|AAK34458. 1 1 
gi|13622767|gb|AAK34459.1 1 
gi|13622768|gb|AAK34460.1 1 
gi| 1 3622770|gb|AAK34462. 1 1 
gi|1 3622771 |gb|AAK34463.1 1 
gi|13622774|gb|AAK34465.1 1 
gi|13622775|gb|AAK34466.1 1 
gi|1 3622776|gb|AAK34467.1 1 
gi|1 3622777|gb[AAK34468.1 1 
gi|13622778|gb|AAK34469.1 1 
gi|13622779|gb|AAK34470.1 1 
gi|1 3622780|gb|AAK34471 .1 1 
gi|13622781 |gb|AAK34472.1 1 
gi|13622782|gb|AAK34473.1| 
gi|13622783|gb|AAK34474.1 1 
gi|13622785|gb|AAK34475.1 1 
gi|13622787|gb|AAK34477.1| 
gl|13622789|gb|AAK34479.1| 
gi| 1 3622790|gb|AAK34480. 1 1 
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gi|1 3622791 |gb|AAK34481 .1 1 
gi|13622792|gb|AAK34482.1| 
gi|1 3622793|gb|AAK34483.1 1 
gi|1 3622794|gb|AAK34484.1 1 
gi|13622795|gb|AAK34485.1 1 
gil13622796|gb|AAK34486.1 1 
gi|1 3622798|gb|AAK34487.1 1 
gi|13622799|gb|AAK34488.1 1 
gi|13622800|gb|AAK34489.1 1 
gi|13622801 |gb|AAK34490.1 1 
gi|1 3622802|gb|AAK34491 .1 1 
gi|1 3622803|gb|AAK34492.1 1 
gi|13622804|gb|AAK34493.1 1 
gi| 1 3622805|gb|AAK34494. 1 
gi|13622806|gb|AAK34495.1 
gi|1 3622807|gb|AAK34496.1 
gi|13622808|gb|AAK34497.1 
gi|13622809|gb|AAK34498.1 
gi|13622810|gb|AAK34499.1 
gi|13622812|gb|AAK34500.1 
gi|1 362281 3|gb|AAK34501 .1 
gi|13622814|gb|AAK34502.1 
gi|1 362281 5|gb|AAK34503.1 
gi|1 362281 8|gb|AAK34506.1 
gi|1 3622821 |gb|AAK34509.1 
gi|1 3622822|gb|AAK3451 0.1 
gi|13622823|gb|AAK3451 1 .1 
gi|13622825|gb|AAK34512.1 
gi|13622826|gb|AAK3451 3.1 
gi|1 3622827|gb|AAK3451 4.1 
gij 1 3622828|gb|AAK3451 5. 1 1 
gi|1 3622829|gb|AAK3451 6.1 1 
gi|13622830|gb|AAK34517.1| 
gi|13622833|gb|AAK34520.1 1 
gi|1 3622838|gb|AAK34524.1 1 
gi|13622839|gb|AAK34525.1 1 
gi|1 3622840|gb|AAK34526.1 1 
gi|1 3622841 |gb|AAK34527.1 1 
gi|13622847[gb|AAK34532.1 1 
gi|13622848|gb|AAK34533.1 1 
gi|1 3622849|gb|AAK34534.1 1 
gi|13622853Igb|AAK34537.1 1 
gi|13622854|gb|AAK34638.1| 
gi|1 3622856|gb|AAK34640. 1 1 
gi|1 3622857|gb|AAK34541 .1 1 
gi|13622858|gb|AAK34542.1 1 
gi|1 3622860|gb|AAK34543.1 1 
gi|1 3622861 |gb|AAK34544.1 1 
gi|1 3622662|gb|AAK34545.1 1 
gi|13622863|gb|AAK34546.1| 
gi|13622864|gb|AAK34547.1| 
gi|1 3622865|gb|AAK34548.1 1 
gi|13622866|gb|AAK34549.1 1 
gi|1 3622867|gb|AAK34650.1 1 
gi|1 3622868|gb|AAK34551 .1 1 
gi|1 3622869Igb|AAK34552.1 1 



gi|13622870|gb|AAK34553.1 1 
gi|1 3622873|gb[AAK34555.1 
gl|13622875|gb|AAK34557.1 
gi|13622876|gb|AAK34558.1 
gi|13622877|gb|AAK34559.1 
gi|13622878|gb|AAK34560.1 
gi|1 3622879|gb|AAK34561 .1 
gi|1 3622880|gb|AAK34562. 1 
gi|13622881 |gb|AAK34563.1 
gi|1 3622882|gbIAAK34564.1 
gi|13622885|gb|AAK34566.1 
gi|13622886|gb|AAK34567.1 
gl|1 3622887|gb|AAK34568.1 
gi|1 3622888|gb|AAK34569.1 
gi|13622890|gb|AAK34671 .1 
gi|13622893|gb|AAK34574.1 
gi|13622896|gb|AAK34576.1 
gi|13622898|gb|AAK34578.1 
gi|13622899|gb|AAK34579.1 
gi|1 3622900|gb|AAK34580.1 1 
gi|13622901 |gb|AAK34581 .1 1 
gi|13622903|gb|AAK34583.1 1 
gi|13622905|gb|AAK34585.1 1 
gi|13622906|gb|AAK34586.1 j 
gi|13622907|gb|AAK34587.1 1 
gi|13622908|gb|AAK34588.1 1 
gi|13622910|gb|AAK34589.1 1 
gi[1 362291 1 |gb|AAK34590.1 1 
gi|1 362291 2|gb|AAK34591 .1 1 
gi|1 362291 3|gb|AAK34592.1 1 
gi|13622914|gb|AAK34593.1 1 
gi|1 362291 5|gb|AAK34594.1 1 
gi|13622917|gb|AAK34596.1| 
gi|1 362291 8|gb|AAK34597.1 1 
gi|13622919|gb|AAK34598.1 
gi|13622921 |gb|AAK34599.1 
gi|1 3622922|gb|AAK34600.1 
gi|1 3622924|gb|AAK34602.1 
gi|13622925|gb|AAK34603.1 
gi|1 3622926|gb|AAK34604.1 
gi|13622927|gb|AAK34605.1 
gi|13622928|gb|AAK34606.1 
gi|13622929|gb|AAK34607.1 



9i 

gi 
gi 
gi 
gi 
gi 
gi 
gi 
gi 
gi 
gi 
gi 
gi 



1 3622930 lgblAAK34608.1 
13622931 |gb|AAK34609.1 
13622933|gb|AAK34610.1 
13622941 lgb|AAK34617.1 
1 3622944|gb|AAK34620.1 
13622946|gb|AAK34621 .1 
1 3622947|gb|AAK34623.1 
1 3622948Igb|AAK34624.1 
1 3622949|gb |AAK34625.1 1 
13622950|gb|AAK34626.1 1 
1 3622952|gb|AAK34627.1 1 
13622955|gb|AAK34630.1 1 
1 3622956|gb|AAK34631 .1 1 



713 



WO 2004/018646 



PCT/US2003/026827 



Table 33: List of GAS ORFs which are shared with GBS and Spn 



gi|13622959|gb|AAK34634.1 1 
gi|1 3622961 |gb|AAK34636.1 1 
gi|1 3622963igb|AAK34638.1 1 
gi|1 3622964|gb|AAK34639.1 1 
gi|1 3622967|gb|AAK34641 .1 1 
gi|13622969|gb|AAK34643.1 1 
gi|1 3622971 |gb|AAK34646.1 1 
gi(1 3622973|gb|AAK34647.1 1 
gi|13622974|gb|AAK34648.1 1 
gi|1 3622977Igb|AAK34651 .1 1 
gi|13622981 |gb|AAK34654.1 1 
gi|13622982|gb|AAK34655.1 1 
gi|13622983|gb|AAK34656.1 1 
gi|1 3622984|gb|AAK34657.1 j 
gi|13622985|gb|AAK34658.1 1 
gi|13622989|gb|AAK34661 .1 1 
gi|1 3622990|gb|AAK34662.1 1 
gi|13622991|gb|AAK34663.1| 
gi|1 3622992|gb|AAK34664.1 1 
gi|13622995|gb|AAK34666.1| 
gi|1 3622996|gb|AAK34667.1 1 
gi)13622998|gb|AAK34669.1 1 
gi|13622999|gb|AAK34670.1 1 
gi|13623000|gb|AAK34671 .1 1 
gi|1 3623001 |gb|AAK34672.1 1 
gi|13623002|gb|AAK34673.1 1 
gi|1 3623004Igb|AAK34674.1 1 
gi|1 3623005|gb|AAK34675.1 1 
gi|1 3623006|gb|AAK34676.1 1 
gi|13623007|gb|AAK34677.1 1 
gi|1 3623009|gb|AAK34679.1 1 
gi|1 3623019|gb|AAK34688.1 1 
gi|13623020|gb|AAK34689.1 1 
gi|13623030|gb|AAK34698.1 1 
gi|1 3623031 |gb|AAK34699.1 1 
gi|1 3623032|gb|AAK34700.1 1 
gi|13623033|gb|AAK34701 .1 j 
gi|1 3623038|gb|AAK34705. 1 1 
gi|1 3623045|gb|AAK34712.1 j 
gi|1 3623046|gb|AAK3471 3.1 1 
gi|13623047|gb|AAK34714.1 1 
gi|13623049|gb|AAK34715.1 1 
gi|1 3623050|gb|AAK34716.1 1 
gi|1 3623051 |gb|AAK3471 7.1 1 
gi|1 3623052|gb|AAK3471 8.1 1 
gi|13623053|gb|AAK34719.1 1 
gi|13623054|gb|AAK34720.1| 
gi|13623056|gb|AAK34722.1 1 
gi|13623058|gb|AAK34724.1 1 
gi|13623062|gb|AAK34727.1 1 
gi|13623064|gblAAK34729.1| 
gi|1 3623065|gb|AAK34730. 1 1 
gj|1 3623069|gb|AAK34733.1 1 
gi|13623074|gb|AAK34738.1 1 
gl|1 3623081 |gb|AAK34744.1 1 
gi|13623082|gb|AAK34745.1| 



gi|13623083|gb|AAK34746.1 1 
gi|1 3623085|gb|AAK34747.1 1 
gi|13623086|gb|AAK34748.1 1 
gi|13623088|gb|AAK34750.1 1 
gi|1 3623089|gb|AAK34751 .1 1 
gi|13623090|gb|AAK34752.1 1 
gi|1 3623091 |gb|AAK34753. 1 1 
gi|13623093|gb|AAK34755.1| 
gi|13623095|gb|AAK34756.1 1 
gi|13623096|gb|AAK34757.1 1 
gi|13623098|gb|AAK34769.1 1 
gi|13623099|gb|AAK34760.1 1 
gi j 1 3623 1 00 jgb | AAK3476 1 . 1 j 
gl|1 36231 02|gb|AAK34763.1 1 
gi|13623103|gb|AAK34764.1| 
gi 1 1 3623 1 05|gb|AAK34766. 1 j 
gill 36231 07|gb|AAK34767.1 1 
gi|13623128|gb|AAK34787.1 1 
gi|13623129|gb|AAK34788.1 1 
gi|13623131|gb|AAK34790.1 
gi|1 36231 32|gb|AAK34791 .1 
gi|136231 33|gb|AAK34792.1 
giI13623134|gb|AAK34793.1 
gi(1 36231 36|gblAAK34794.1 
gi|1 3623 1 38|gb|AAK34796. 1 
gi|1 36231 39|gb AAK34797.1 
gi|13623150|gb AAK34807.1 
gi|13623151|gb|AAK34808.1 
gi|13623152|gb AAK34809.1| 
gi|1 36231 54|gb AAK3481 1 .1 
gi|1 36231 55|gb AAK34812.1 
gi|1 36231 56|gb AAK34813.1 
AAK34814.1 
AAK34815.1 
AAK34817.1 
AAK34818.1 
AAK34819.1 
AAK34821.1 
AAK34822.1 
AAK34823.1 
AAK34824.1 



gi|1 36231 57|gb 
gi|13623159|gb 
gi|13623161|gb 
gi|1 36231 62|gb 
gi|13623163|gb 
gi|1 36231 65|gb 
gi|1 36231 66 |gb 
gi|1 36231 67|gb 
gi|13623168|gb 
gi|1 36231 70|gb AAK34826.1 
gi|13623171|gb AAK34827.1 
gi|1 36231 75|gb|AAK34830.1 
gi|1 36231 76|gb AAK34831.1 
gi|13623177|gb|AAK34832.1 
gi|1 36231 79|gb|AAK34834.1 
gi|1 36231 80|gb|AAK34835.1 
gi|1 36231 82|gb|AAK34836.1 1 
gi|13623183|gb|AAK34837.1| 
gi|13623184|gb|AAK34838.1 1 
gi|1 36231 85|gb|AAK34839.1 1 
gi|1 36231 86|gb|AAK34840.1 1 
gi|1 36231 87|gb|AAK34841 .1 1 
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Table 34: List of GAS ORF's which are shared with GBS but not with Spn 



gi|13621 381 |gb|AAK331 95.1 1 
gi|13621423|gb|AAK33233.1 1 
gf |1 3621 440|gb|AAK33249.1 1 
gi|13621443|gb|AAK33251 .1 1 
gi|13621453|gb|AAK33260.1 1 
gi|1 3621 454|gb|AAK33261 .1 1 
gi|13621479|gb|AAK33284.1| 
gi|13621482|gb|AAK33287.1 1 
gi|1 3621 492|gb|AAK33296.1 1 
gi|1 3621 493|gbJAAK33297.1 1 
gi|13621497|gb|AAK33300.1 1 
gi|13621498|gb|AAK33301.1| 
giI13621512|gb|AAK33314.1| 
gi|1 3621 51 4|gb|AAK3331 6.1 1 
gi|13621556|gb|AAK33354.1| 
gi|1 3621 570|gb|AAK33366.1 1 
gi|13621 587|gb[AAK33382.1 1 
gi|13621610|gblAAK33403.1| 
gi|13621613|gblAAK33405.1| 
gi|13621 626|gb]AAK3341 8. 1 1 
gi|13621632|gb|AAK33423.1 1 
gi|1 3621 635|gb | AAK33426. 1 1 
gj|13621643|gb|AAK33433.1 1 
gi]1 3621 655|gb|AAK33444.1 1 
gil13621656|gb|AAK33445.1| 
gi|13621659|gb|AAK33448.1 1 
gi|13621673|gb|AAK33461 .1 1 
gi|13621686|gb|AAK33473.1 1 
gi|13621696|gb|AAK33482.1 1 
gi|13621703|gb|AAK33488.1| 
gi|1 3621 712|gblAAK33497.1 1 
gi|13621728|gb|AAK3351 1 .1 j 
gi|13621738|gb|AAK33520.1 1 
gi|1 3621 739|gb|AAK33521 .1 1 
gi|1 3621 740|gb|AAK33522.1 1 
gi|13621 772|gb|AAK33551 .1 1 
gi|13621 776|gb|AAK33555.1 1 
gi|1 3621 791 |gb|AAK33569.1| 
gi|1 3621 798|gb|AAK33575.1 1 
gi|1 3621 801 |gb|AAK33578.1 1 
gi|1 3621 803|gb|AAK33580.1 1 
gi|1 3621 804|gb|AAK33581 .1 ( 
gi|13621832|gb|AAK33606.1 1 
gi| 1 3621 833|gb|AAK33607. 1 1 
gi|1 3621 896|gb|AAK33665.1 1 
gi|13621897|gb|AAK33666.1| 
gi|1 3621 906|gb|AAK33674.1 1 
gi|1362191 1 |gb|AAK33679.1 1 
gi|1 3621 949|gb|AAK3371 3.1 1 
gi|13621951|gb|AAK33715.1| 
gi|1 3621 962|gb|AAK33724.1 1 
gi|1 3621 963|gb|AAK33725.1 1 
gi|1 3621 964|gb|AAK33726.1 1 
gi|13621971 |gb|AAK33732.1 1 
gi|13621976|gb|AAK33737.1 1 
gi|1 3621 983|gb|AAK33744.1 1 



gi|13621988|gb|AAK33748.1 1 
gl|13622014|gb|AAK33772.1| 
gi|1 362201 5|gb|AAK33773. 1 1 
gi|13622022|gb|AAK33779.1 1 
gi|13622023|gb|AAK33780.1 1 
gi|13622028|gb|AAK33784.1 1 
gi|1 3622029|gb|AAK33785.1 1 
gill 3622037|gb|AAK33792. 1 1 
gi|13622038Igb|AAK33793.1 1 
gi|13622040|gb|AAK33795.1 1 
gi|13622057|gb|AAK3381 1 .1 1 
gi|13622061 |gb|AAK33814.1 1 
gi|13622063|gbIAAK33816.1 1 
gi|1 3622066|gb|AAK3381 9.1 1 
gi|13622067|gb|AAK33820.1 1 
gi|13622076|gb|AAK33828.1 1 
gi|13622078|gb|AAK33830.1 1 
gi|13622084|gb|AAK33835.1 1 
gi|13622098|gb|AAK33848.1 1 
gi|13622099|gb|AAK33849.1 1 
gi|13622100|gb|AAK33850.1 1 
gi|13622104|gb|AAK33854.1| 
gi|136221 10|gb|AAK33859.1 1 
gi|1 36221 16|gb|AAK33865.1 1 
gi|1 36221 24 |gb|AAK33873.1 1 
gi|136221 59|gb|AAK33905.1 1 
gi|1 36221 93|gb|AAK33936.1 1 
gi|13622194|gb|AAK33937.1| 
gi|13622195|gb|AAK33938.1|' 
gi| 1 36221 96|gb|AAK33939. 1 1 
gl|13622202|gb|AAK33944.1 1 
gi|13622203|gb|AAK33945.1 1 
gi|1 3622206|gb|AAK33948.1 1 
gi|1 362221 0|gb|AAK33951 .1 1 
gi|1 3622221 |gb|AAK33961 .1 1 
gi|1 3622231 |gb|AAK33971 .1 1 
gi|13622234|gb|AAK33973.1| 
gi|1 3622238|gb|AAK33977. 1 1 
gi|13622245|gb|AAK33984.1 1 
gi|13622246|gb|AAK33985.1 1 
gi|13622248|gb|AAK33986.1| 
gi|13622249[gb|AAK33987.1 1 



gi|1 3622251 |gb 
gi|13622254|gb 
gi|13622267|gb 



AAK33989.1| 
AAK33992.1| 
AAK34004.1I 



gi|1 3622291 |gb|AAK34026.1 1 



gi|13622302|gb 
gi|13622303|gb 
gi|13622304|gb 



gi|13622327|gb AAK34059.1 



gi|13622344|gb 
gi|13622345|gb 
gi|13622346|gb 



gi|13622347|gb[AAK34077.1 1 
gi|13622348|gb AAK34078.1| 



gi|13622349|gb 



AAK34036.1| 
AAK34037.1| 
AAK34038.1| 



AAK34074.1| 
AAK34075.1 1 
AAK34076.1| 



AAK34079.1| 
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Tabl 34: List of GAS ORPs which 



gi|1 3622382|gb|AAK341 09. 1 1 
gi|1 3622386|gb|AAK341 1 3.1 1 
gi|1 3622391 |gb|AAK341 18.1| 
gi|1 3622392|gb|AAK341 1 9.1 1 
gi|13622397|gb|AAK34123.1| 
gi|1 3622404|gb|AAK34129.1 1 
gi|1 362241 2|gb|AAK341 36.1 1 
gi| 1 362241 3|gb|AAK341 37.1 1 
gi|13622414|gb|AAK34138.1| 
gi|13622418|gb|AAK34142.1| 
gi|1 3622430|gb|AAK341 52. 1 1 
gl|13622446Igb|AAK34167.1| 
gi|1 3622449|gb|AAK341 69.1 1 
gi|13622463|gb|AAK34173.1| 
gi|1 3622470|gb|AAK341 88. 1 1 
gi|1 3622487|gb|AAK34204.1 1 
gi|1 3622490|gb|AAK34206. 1 1 
giJ1 3622502|gb|AAK3421 7.1 1 
gi|1 3622503|gb|AAK3421 8.1 1 
gi|13622514|gblAAK34228.1 1 
gi|1 3622528|gb|AAK34241 . 1 1 
gi|13622540|gb|AAK34252.1 1 
gi|1 3622541 Igb|AAK34253.1 1 
gi|13622544|gb|AAK34255.1| 
gi|13622545|gb|AAK34256.1 1 
gi|13622546|gb|AAK34257.1 1 
gi|1 3622547|gb|AAK34258. 1 1 
gi|13622548|gb|AAK34259.1 1 
gi|13622550|gb|AAK34261 .1 1 
gi|13622551 |gb|AAK34262.1 1 
gi|13622552|gb|AAK34263.1 1 
gi|1 3622556|gb|AAK34267.1 1 
gi|13622557|gb|AAK34268.1 1 
gi|13622558|gb|AAK34269.1 1 
gi|13622559|gb|AAK34270.1 1 
gi|1 3622563|gb|AAK34273.1 1 
gi|13622571igb|AAK34281 .1| 
gi|1 3622576|gb|AAK34286.1 1 
gi|1 3622581 jgb|AAK34290.1 1 
gi|13622582|gb|AAK34291 .1 1 
gi|13622586|gb|AAK34295.1| 
gi|13622589|gb|AAK34298.1| 
gi|1 3622605|gb|AAK3431 2. 1 1 
gi| 1 3622633|gb|AAK34338. 1 1 
gi|1 3622635|gb|AAK34340.1 1 
gi| 1 3622637|gb|AAK34342. 1 1 
gi|1 3622638|gb|AAK34343.1 1 
gi|1 3622657|gb|AAK34360. 1 1 
gi|1 3622707|gb|AAK34404.1 1 
gi|1 362271 6|gb|AAK3441 3.1 1 
gi|1 3622724|gb|AAK34420. 1 1 
gi|1 3622732|gb|AAK34427.1 1 
gi| 1 3622743|gb|AAK34437.1 1 
gi|1 3622761 |gb|AAK34453.1 1 
gl|13622773|gb|AAK34464.1| 
gi|1 3622788|gb|AAK34478.1 1 



shared with GBS but n t with Spn 



gi|1 362281 6|gb|AAK34504.1 1 
gi|1 362281 7|gbIAAK34505.1 1 
gi|13622846|gb|AAK34531 .1 1 
gi|13622852|gb|AAK34536.1 1 
gi|13622874|gb|AAK34556.1 1 
gi|13622889|gb|AAK34570.1 1 
gi|13622891 |gb|AAK34572.1 1 
gi|1 3622892|gb|AAK34573. 1 1 
gi|13622897|gb|AAK34577.1 1 
gi|13622902|gb|AAK34582.1 1 
gi|13622904|gb|AAK34584.1 1 
gi|13622916|gb|AAK34595.1| 
gi|13622923tgb|AAK34601 .1 1 
gij 1 3622934|gb|AAK3461 1 . 1 1 
gi|13622953|gb|AAK34628.1 1 
gi|13622954|gb|AAK34629.1 1 
gi|13622960|gb|AAK34635.1 1 
gi|13622968Igb|AAK34642.1| 
gi|13622980(gb|AAK34653.1 1 
giI13622987|gb|AAK34659.1 1 
gi|13623012|gb|AAK34682.1 1 
gl|13623013|gb|AAK34683.1 1 
gi|13623014|gb|AAK34684.1 1 
gi|1362301 5|gb|AAK34685.1 1 
gi|13623016|gb|AAK34686.1 1 
gi|1 362301 8|gb|AAK34687. 1 1 
gi|13623022|gb|AAK34691.1 1 
gi| 1 3623029|gb|AAK34697. 1 1 
gi|13623037jgb|AAK34704.1 1 
gi(1 3623055|gb|AAK34721 .1 1 
gi|13623060|gbIAAK34725.1 1 
gi|13623061 |gb|AAK34726.1 1 
gi|13623063|gb|AAK34728.1 1 
gi|1 3623066|gb|AAK34731 .1 1 
gi|13623068|gb|AAK34732.1 1 
gi|13623092|gb|AAK34754.1 1 
gi|13623097|gb|AAK34758.1| 
gi|13623104|gb|AAK34765.1 1 
gi|1 36231 26|gb|AAK34785.1 1 
gi|136231 30|gb]AAK34789.1 1 
gi|13623137Igb|AAK34795.1| 
gi| 1 36231 53Igb|AAK3481 0.1 1 
gi| 1 36231 64|gb|AAK34820. 1 1 
gi|136231 78|gb|AAK34833.1 1 
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Table 35: GAS ORFs which are shared with pneumococcus 

but not with GBS 



gi|13621338|gb|AAK33157.1| 
gi|13621352|gb|AAK33168.1| 
gi|13621410|gb|AAK33221.1 1 
gi|13621433|gb|AAK33242.1 1 
gi|13621445|gb|AAK33253.1 1 
gi|13621446|gb|AAK33254.1| 
gi|13621447|gb|AAK33255.1 1 
gi|13621448|gblAAK33256.1 1 
gi|13621449|gb|AAK33257.1 1 
gi|13621451 |gb|AAK33259.1 j 
gi|13621460|gb|AAK33267.1 1 
gi|13621466|gb|AAK33272.1 1 
gi|13621489|gb|AAK33293.1 1 
gi|13621490|gb[AAK33294.1 1 
gi|13621 519|gb|AAK33320.1 1 
gi|1 3621 520|gb|AAK33321 .1 1 
gi|13621653|gb|AAK33443.1 1 
gi|13621722|gb|AAK33506.1| 
gi|13621723|gb|AAK33507.1| 
gi|13621724Igb|AAK33508.1| 
gi|13621805|gb|AAK33582.1 1 
gi|13621900|gb|AAK33669.1 1 
gi|1 362201 1 |gb|AAK33769.1 1 
gi|13622212|gb|AAK33953.1| 
gi|13622280|gb|AAK34016.1 1 
gi|13622381|gb|AAK34108.1| 
gi|13622409|gb|AAK34134.1 1 
gi|13622410|gb|AAK34135,1! 
gi|13622423|gb|AAK34146.1| 
gi|13622428|gb|AAK34151 .1 1 
gi|1 3622441 |gb|AAK341 62.1 1 
gi|1 3622442|gb|AAK341 63. 1 
gi|13622454|gb|AAK341 74.1 
gi|13622456|gb|AAK34176.1 ! 
gi|1 362261 9|gb|AAK34325.1 
gi|13622642|gb[AAK34346.1 
gi|13622643|gb|AAK34347.1 1 
gi|13622664|gb|AAK34366.1 
gi|13622666|gb|AAK34368.1 
gi|1 3622667|gb|AAK34369.1 
gi|13622671 |gb|AAK34372.1 
gi|1 3622672|gb|AAK34373.1 
gI|13622673|gb|AAK34374.1 
gi|13622674|gb|AAK34375.1 
gi|1 3622679|gb|AAK34380.1 
gi|1 3622680|gb|AAK34381 .1 
gi|13622682|gbIAAK34382.1 
gi|13622755|gb|AAK34448.1 
gi|13622758|gb|AAK34450.1 
gi|13622759|gb|AAK34451 .1 
gl|13622835|gb|AAK34521 .1 
gi|13622837|gb|AAK34523.1 
gi|13622937|gb|AAK34614.1 
gi|13622942|gb|AAK34618.1 
gi|1 3622946|gb|AAK34622.1 
gi|13622978|gb|AAK34652.1 



gi|1 3623027|gb[AAK34695.1 
gi|13623087|gb|AAK34749.1 
gi|13623101 |gb|AAK34762.1 
gj|13623144|gb|AAK34802.1 
gi|13623146|gb|AAK34804.1 
gi|13623147|gb|AAK34805.1 
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Table 36: Spn ORF's are shared with GBS and GAS 



SP0001 


SP0158 


SP0254 


SP0385 


SP0002 


SP0173 


SP0259 


SP0386 


SP0003 


SP0179 


SP0261 


SP0387 


SP0004 


SP0180 


SP0262 


SP0400 


SP0005 


SP0184 


SP0263 


SP0401 


SP0006 


SP0185 


SP0264 


SP0402 


SP0007 


SP0186 


SP0265 


SP0403 


SP0008 


SP0187 


SP0266 


SP0404 


SP0010 


SP0189 


SP0268 


SP0405 


SP001 1 


SP0192 


SP0271 


SP0406 


SP0013 


SP0194 


SP0272 


SP0408 


SP0014 


SP0197 


SP0273 


SP0410 


SP0019 


SP0199 


SP0274 


SP0411 


SP0021 


SP0202 


SP0280 


SP0412 


SP0024 


SP0204 


SP0281 


SP0415 


SP0027 


SP0205 


SP0282 


SP0416 


SP0032 


SP0208 


SP0283 


SP0417 


SP0033 


SP0209 


SP0284 


SP0418 


SP0034 


SP0210 


SP0285 


SP0419 


SP0035 


SP0211 


SP0286 


SP0420 


SP0036 


SP0212 


SP0287 


SP0421 


SP0037 


SP0213 


SP0289 


SP0422 


SP0042 


SP0214 


SP0290 


SP0423 


SP0044 


SP0215 


SP0291 


SP0424 


SP0045 


SP0216 


SP0292 


SP0425 


SP0046 


SP0217 


SP0294 


SP0426 


SP0047 


SP0218 


SP0295 


SP0427 


SP0048 


SP0219 


SP0303 


SP0433 


SP0051 


SP0220 


SP0310 


SP0434 


SP0053 


SP0221 


SP0314 


SP0435 


SP0054 


SP0222 


SP0317 


SP0436 


SP0056 


SP0224 


SP0318 


SP0437 


SP0063 


SP0225 


SP0319 


SP0438 


SP0073 


SP0226 


SP0320 


SP0439 


SP0074 


SP0227 


SP0321 


SP0441 


SP0078 


SP0228 


SP0322 


SP0442 


SP0079 


SP0229 


SP0323 


SP0443 


SP0083 


SP0230 


SP0324 


SP0452 


SP0084 


* SP0231 


SP0325 


SP0453 


SP0085 


SP0232 


SP0327 


SP0454 


SP0095 


SP0233 


SP0330 


SP0457 


SP0105 


SP0234 


SP0334 


SP0458 


SP0106 


SP0235 


SP0336 


SP0459 


SP0111 


SP0236 


SP0337 


SP0461 


SP0112 


SP0240 


SP0338 


SP0466 


SP0118 


SP0242 


SP0340 


SP0467 


SP0120 


SP0243 


SP0342 


SP0474 


SP0121 


SP0245 


SP0369 


SP0477 


SP0122 


SP0246 


SP0370 


SP0478 


SP0127 


SP0247 


SP0371 


SP0483 


SP0128 


SP0248 


SP0373 . 


SP0486 


SP0129 


SP0249 


SP0374 


SP0488 


SP0148 


SP0250 


SP0381 


SP0489 


SP0149 


SP0251 


SP0382 


SP0493 


SP0151 


SP0252 


SP0383 


SP0494 


SP0152 


SP0253 


SP0384 


SP0499 
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Tabl 36: Spn ORF's are 



SP0500 


SP0652 


SP0501 


SP0657 


SP0502 


SP0660 


SP0515 


SP0662 


SP0516 


SP0663 


SP0517 


SP0665 


SP0519 


SP0668 


SP0521 


SP0669 


SP0522 


SP0671 


SP0523 


SP0672 


SP0526 


SP0673 


SP0549 


SP0674 


SP0550 


SP0675 


SP0552 


SP0676 


SP0553 


SP0678 


SP0554 


SP0680 


SP0555 


SP0681 


SP0556 


SP0687 


SP0557 


SP0688 


SP0563 


SP0689 


SP0567 


SP0690 


SP0568 


SP0701 


SP0576 


SP0702 


SP0577 


SP0709 


SP0578 


SP0713 


SP0579 


SP0726 


SP0581 


SP0727 


SP0588 


SP0729 


SP0589 


SP0735 


SP0591 


SP0736 


SP0592 


SP0741 


SP0593 


SP0744 


SP0603 


SP0745 


SP0604 


SP0746 


SP0605 


SP0756 


SP0608 


SP0757 


SP0610 


SP0758 


SP0611 


SP0760 


SP0613 


SP0761 


SP0614 


SP0762 


SP0615 


SP0764 


SP0616 


SP0765 


SP0618 


SP0766 


SP0620 


SP0767 


SP0622 


SP0768 


SP0623 


SP0770 


SP0624 


SP0771 


SP0626 


SP0775 


SP0630 


SP0776 


SP0631 


SP0778 


SP0636 


SP0779 


SP0637 


SP0780 


SP0638 


SP0782 


SP0645 


SP0784 


SP0646 


SP0785 


SP0647 


SP0786 
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shar d with GBS and GAS 



SP0787 


SP0895 


SP0788 


SP0896 


SP0792 


SP0897 


SP0793 


SP0904 


SP0797 


SP0905 


SP0798 


SP0908 


SP0799 


SP0909 


SP0801 


SP0912 


SP0802 


SP0923 


SP0803 


SP0927 


SP0805 


SP0928 


SP0806 


SP0929 


SP0807 


SP0931 


SP0816 


SP0932 


SP0817 


SP0933 


SP0820 


SP0935 


SP0822 


SP0936 


SP0823 


SP0937 


SP0824 


SP0938 


SP0825 


SP0943 


SP0828 


SP0944 


SP0829 


SP0945 


SP0831 


SP0946 


SP0835 


SP0947 


SP0837 


SP0948 


SP0838 


SP0954 


SP0839 


SP0955 


SP0841 


SP0959 


SP0843 


SP0960 


SP0844 


SP0961 


SP0845 


SP0962 


SP0846 


SP0964 


SP0847 


SP0966 


SP0848 


SP0967 


SP0851 


SP0968 


SP0852 


SP0969 


SP0855 


SP0970 


SP0856 


SP0971 


SP0862 


SP0972 


SP0864 


SP0974 


SP0865 


SP0975 


SP0867 


SP0976 


SP0868 


SP0978 


SP0869 


SP0979 


SP0870 


SP0980 


SR0871 


SP0981 


SP0872 


SP0984 


SP0873 


SP0985 


SP0875 


SP0987 


SP0876 


SP0988 


SP0877 


SP0989 


SP0878 


SP0991 


SP0880 


SP0992 


SP0881 


SP0993 


SP0893 


SP1002 


SP0894 


SP1003 
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Table 36: Spn ORF's are shared with GBS and GAS 



SP1004 • 


SP1117 


SP1242 


SP1387 


SP1008 


SP1118 


SP1244 


SP1388 


SP1010 


SP1119 


SP1245 


SP1389 


SP1012 


SP1128 


SP1246 


SP1390 


SP1016 


SP1151 


SP1247 


SP1393 


SP1017 


SP1152 


SP1248 


SP1394 


SP1018 


SP1155 


SP1249 


SP1395 


SP1020 


SP1156 


SP1260 


SP1396 


SP1021 


SP1157 


SP1263 


SP1397 


SP1022 


SP1159 


SP1266 


SP1398 


SP1024 


SP1160 


SP1275 


SP1399 


SP1025 


SP1161 


SP1276 


SP1400 


SP1026 


SP1162 


SP1277 


SP1402 


SP1029 


SP1163 


SP1278 


SP1403 


SP1033 


SP1164 


SP1279 


SP1404 


SP1034 


SP1167 


SP1280 


SP1405 


SP1035 


SP1168 


SP1283 


SP1406 


SP1045 


SP1169 


SP1284 


SP1407 


SP1056 


SP1174 


SP1285 


SP1408 


SP1067 


SP1175 


SP1286 


SP1409 


SP1068 


SP1176 


SP1287 


SP1411 


SP1069 


SP1177 


SP1288 


SP1412 


SP1070 


SP1178 


SP1289 


SP1413 


SP1071 


SP1179 


SP1290 


SP1414 


SP1072 


SP1180 


SP1291 


SP1415 


SP1073 


SP1182 


SP1293 


SP1416 


SP1074 


SP1184 


SP1297 


SP1420 


SP1076 


SP1185 


SP1298 


SP1421 


SP1079 


SP1187 


SP1299 


SP1427 


SP1081 


SP1190 


SP1308 


SP1428 


SP1082 


SP1191 


SP1316 


SP1429 


SP1083 


SP1192 


SP1324 


SP1434 


SP1084 


SP1193 


SP1329 


SP1435 


SP1087 


SP1197 


SP1330 . 


SP1445 


SP1088 


SP1200 


SP1331 


SP1446 


SP1089 


SP1202 


SP1336 


SP1448 


SP1090 


SP1204 


SP1341 


SP1449 


SP1093 


SP1205 


SP1354 


SP1450 


SP1094 


SP1207 


SP1355 


SP1452 


SP1095 


SP1208 


SP1357 


SP1453 


SP1096 


SP1212 


SP1358 


SP1456 


SP1097 


SP1213 


SP1359 


SP1457 


SP1098 


SP1218 


SP1362 


SP1458 


SP1099 


SP1219 


SP1368 


SP1460 


SP1100 


SP1220 


SP1370 


SP1461 


SP1102 


SP1225 


SP1371 


SP1462 


SP1105 


SP1226 


SP1372 


SP1465 


SP1106 


SP1227 


SP1374 


SP1466 


SP1107 


SP1228 


SP1375 


SP1469 


SP1110 


SP1229 


SP1376 


SP1470 


SP1111 


SP1230 


SP1377 


SP1473 


SP1112 


SP1231 


SP1378 


SP1474 


SP1113 


SP1232 


SP1380 


SP1475 


SP1114 


SP1233 


SP1381 


SP1478 


SP1115 


SP1238 


SP1383 


SP1479 


SP1116 


SP1241 


SP1386 


SP1482 
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Table 36: Spn ORF's are shared with GBS and GAS 



SP1483 


SP1580 


SP1685 


SP1857 


SP1485 


SP1583 


SP1688 


SP1858 


SP1489 


SP1584 


SP1689 


SP1860 


SP1491 


SP1586 


SP1697 


SP1861 


SP1498 


SP1587 


SP1698 


SP1865 


SP1500 


SP1588 


SP1699 


SP1871 


SP1501 


SP1589 


SP1702 


SP1873 


SP1502 


SP1590 


SP1709 


SP1874 


SP1504 


SP1591 


SP1711 


SP1875 


SP1505 


SP1597 


SP1712 


SP1876 


SP1507 


SP1598 


SP1713 


SP1877 


SP1508 


SP1599 


SP1714 


SP1878 


SP1509 


SP1602 


SP1717 


SP1879 


SP1510 


SP1603 


SP1721 


SP1880 


SP1511 


SP1606 


SP1722 


SP1881 


SP1512 


SP1608 


SP1724 


SP1883 


SP1513 


SP1609 


SP1725 


SP1884 


SP1517 


SP1610 


SP1726 


SP1887 


SP1518 


SP1615 


SP1727 


SP1888 


SP1519 


SP1616 


SP1732 


SP1889 


SP1521 


SP1617 


SP1733 


SP1890 


SP1522 


SP1624 


SP1734 


SP1895 


SP1523 


SP1625 


SP1735 


SP1896 


SP1529 


SP1626 


SP1736 


SP1900 


SP1530 


SP1631 


SP1737 


SP1901 


SP1534 


SP1633 


SP1738 


SP1902 


SP1535 


SP1638 


SP1739 


SP1903 


SP1536 


SP1644 


SP1742 


SP1906 


SP1537 


SP1645 


SP1743 


SP1908 


SP1538 


SP1646 


SP1744 


SP1909 


SP1539 


SP1647 


SP1746 


SP1916 


SP1540 


SP1648 


SP1747 


SP1918 


SP1541 


SP1649 


SP1748 


SP1922 


SP1542 


SP1650 


SP1749 


SP1940 


SP1544 


SP1652 


SP1750 


SP1942 


SP1547 


SP1653 


SP1752 


SP1944 


SP1549 


SP1655 


SP1759 


SP1953 


SP1551 


SP1659 


SP1776 


SP1957 


SP1552 


SP1661 


SP1780 


SP1960 


SP1553 


SP1662 


SP1781 


SP1961 


SP1554 


SP1664 


SP1782 


SP1963 


SP1557 


SP1665 


SP1785 


SP1964 


SP1558 


SP1666 


SP1790 


SP1966 


SP1559 


SP1667 


SP1795 


SP1967 


SP1560 


SP1668 


SP1799 


SP1968 


SP1561 


SP1670 


SP1804 


SP1969 


SP1563 


SP1671 


SP1816 


SP1970 


SP1564 


SP1672 


SP1817 


SP1972 


SP1565 


SP1674 


SP1825 


SP1973 


SP1566 


SP1675 


SP1839 


SP1974 


SP1568 


SP1676 


SP1840 


SP1975 


SP1569 


SP1677 


SP1845 


SP1976 


SP1571 


SP1681 


SP1847 


SP1979 


SP1574 


SP1682 


SP1848 


SP1980 


SP1575 


SP1683 


SP1851 


SP1981 


SP1577 


SP1684 


SP1855 


SP1982 
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Table 36: Spn ORF's are shared with GBS and GAS 



SP1983 


SP2085 


SP2206 


SP1984 


SP2086 


SP2207 


SP1985 


SP2087 


SP2208 


SP1987 


SP2088 


SP2209 


SP1989 


SP2090 


SP2210 


SP1990 


SP2091 


SP2214 


SP1991 


SP2092 


SP2215 


SP1993 


SP2094 


SP2216 


SP1994 


SP2099 


SP2219 


SP1996 


SP2100 


SP2220 


SP1997 


SP2101 


SP2221 


SP1998 


SP2106 


SP2222 


SP1999 


SP2107 


SP2224 


SP2006 


SP2108 


SP2225 


SP2007 


SP2109 


SP2226 


SP2010 


SP2110 


SP2227 


SP201 1 


\ SP2112 


SP2228 


SP2012 


SP2113 


SP2229 


SP2020 


SP2114 


SP2230 


SP2021 


SP2119 


SP2231 


SP2022 


SP2121 


SP2233 


SP2027 


SP2129 


SP2234 


SP2028 


SP2131 


SP2235 


SP2030 


SP2135 


SP2238 


SP2031 


SP2142 


SP2239 


SP2032 


SP2148 


SP2240 


SP2033 


SP2150 




SP2034 


SP2151 




SP2035 


SP2152 




SP2036 


SP2153 




SP2037 


SP2156 




SP2038 


SP2161 




SP2040 


SP2162 




SP2041 


SP2169 




SP2042 


SP2170 




SP2044 


SP2171 




SP2045 


SP2172 




SP2048 


SP2173 




SP2052 


SP2174 




SP2053 


SP2175 




SP2054 


SP2176 




SP2055 


SP2184 


* 


SP2056 


SP2185 




SP2057 


SP2186 




SP2058 


SP2187 




SP2063 


SP2188 




SP2065 


SP2189 




SP2069 


SP2191 




SP2070 


SP2192 




SP2072 


SP2193 




SP2073 


SP2194 




SP2075 


SP2195 




SP2077 


SP2202 




SP2078 


SP2203 




SP2082 


SP2204 




SP2083 


SP2205 
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Table 37: Spn ORF's which are shared with GBS but not with GAS 



SP0012 


SP0725 


SP1360 


SP1927 


SP0020 


SP0730 


SP1361 


SP1928 


SP0039 


SP0739 


SP1365 


SP1943 


SP0050 

1 ww 


SP0749 


SP1382 


SP1959 


SP0082 


SP0750 

\ufl V I WW 


SP1384 


SP2001 


SP0107 


SP0751 


SP1392 


SP2002 


SP0113 


SP0752 


SP1447 


SP2009 

S-J l fcwww 


SP0119 


SP0753 


SP1451 


SP2026 


SP0146 


SP0754 


SP1463 


SP2029 


SP0150 

ur w i ww 


SP0769 


SP1464 


SP2039 


SP0175 


SP0789 


SP1471 


SP2061 


SP0176 


SP0791 


SP1472 


SP2064 


SP0177 


SP0826 

*-M WWfc.W 


SP1524 


SP2066 

V^l W W W 


SP0178 


SP0900 

W» WWWW 


SP1527 ' 


SP2079 


SP0237 


SP0913 

urU5 1 w 


vji 1 www 


SP2084 

fcV/W"T 


SP0255 


SP0914 


SP1605 


SP2095 

wr £.www 


SP0260 


SP0939 

Kj% WWW w 


SP1607 


SP2096 


SP0267 


SP0941 


SP1632 


SP2098 


SP0278 


SP0942 


SP1634 


SP2103 


SP0288 


SP0953 


SP1651 


SP2127 


SP0346 


SP0973 

VJl WW I w 


SP1673 


SP2128 


SP0347 


SP0977 


SP1680 

1 WWW 


SP2130 


SP0348 


SP1011 


SP1695 

VI 1 WWW 


SP2134 


SP0349 


SP1013 


SP1700 


SP2137 


SP0366 

VI WWWW 


SP1027 


SP1701 


SP2138 


SP0376 

W* WWf w 


SP1054 


SP1720 


SP2157 

vr c i %j t 


SP041 3 


SP1055 

l www 


SP1729 


SP2196 


SP0445 


SP1080 


SP1740 




SP0462 


SP1086 


SP1741 




SP0463 


SP1121 


SP1745 




SP0479 


SP1122 


SP1751 




SP0480 


SP1123 


SP1757 




SP0482 


SP1124 


SP1758 




SP0484 


SP1126 


SP1761 




SP0537 


SP1127 


SP1762 




SP0538 


SP1137 


SP1763 




SP0566 


SP1166 


SP1764 




SP0580 


SP1173 


SP1765 




SP0585 


SP1194 


SP1766 




SP0599 


SP1195 


SP1767 




SP0600 


SP1215 


SP1768 




SP0601 


SP1240 


SP1770 




SP0806 


SP1256 


SP1771 




SP0607 


SP1261 


SP1772 




SP0609 


SP1271 


SP1783 




SP0617 


SP1272 


SP1802 




SP0627 


SP1273 


SP1828 




SP0655 


SP1274 


SP1856 




SP0656 


SP1306 


SP1867 




SP0710 


SP1310 


SP1869 




SP0711 


SP1332 


SP1870 




SP0717 


SP1333 


SP1872 




SP0718 


SP1334 


SP1891 




SP0720 


SP1346 


SP1907 




SP0723 


SP1348 


SP1910 




SP0724 


SP1350 


SP1911 
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Table 38: Spn ORF's which are shared with GAS but no with GBS 



SP0065 


SP1754 


SP0075 


SP1797 


SP0090 


SP1798 


SP0091 


SP1800 


SP0092 


SP1885 


SP0099 


SP1919 


SP0100 


SP1923 


SP0153 


SP1941 


SP0155 


SP1950 


SP0156 


SP2016 


SP0200 


SP2017 


SP0306 


SP2051 


SP0313 


SP2060 


SP0341 


SP2111 


SP0476 


SP2143 


SP0496 


SP2144 


SP0509 


SP2201 


SP0527 


SP2236 


SP0648 




SP0658 




SP0659 




SP0661 




SP0677 




SP0715 




SP0742 




SP0743 




SP0858 




SP0859 




SP0860 




SP0910 




SP0986 




SP0994 




SP0999 




SP1000 




SP1001 




SP1023 




SP1075 




. SP1129 




SP1147 




SP1171 




SP1186 




SP1315 




SP1317 




SP1319 




SP1320 




SP1321 




SP1322 




SP1438 




SP1442 




SP1525 




SP1546 




SP1570 




SP1572 




SP1578 




SP1604 




SP1715 
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Table 40: Comparative Sequences relating to SAG0635 



SEQ ZD HO 4001 i SAGO 6 S3 PROM THE 2603 V/R GBS TYPE V STRAIN 

ATGAAGAAAGTGTTAGTGAGTAGTCTTTTCGTT^ 

ACGTTACAAACAGTAGTTGAGGCTrAAGGGGCCAAAAGTAG CTrrATACACAAGAGGGAATG 
ACTGCTC1TTCGGACACAAATAAAGATAAAGTCACTACT 

AAAAG CTTAGAAGGTAAGAAGCCGATTACTGTTAGTTTTG^ CTT 

TTCAGTAGTCAATATTTTCAATATGGTAAAGAA 

CTTCATAAACAAAAATTCTGGGATCTTGTTGC^^ 

AAAGAATATG CTAAAAAATTAATTG CTATGCATCAAAAACGAGGAGATAAAATTGTTTTT 
AT AACAGGTAGGACAAGAGGGTCAATGTAT AAGGAGGG CG AGGTTGATAAAACAG CT AAA 
GCCTTAG CTAAAGATTTTAAATTAGACAAACCAATTG CTGTAAATTATACAGGCGATAAA 
CCTAAAAAGCCATACAAATATGATAAATCATATTATATTAAGAAATATGGTTC^ 
CATTATGGAQATAGTGATGACX1AT ATTCATGCAG CTAGGGAGGCCGGTG CTAGACCAATT 
AGAATTTTAAGAGCACCTAATTCTACAARTCTACCTTTACCA 
GAAGAGGTTCTCGAAAATTCAGCTTAC 

SEQ ID NO 4002 i SAG0653 FROM THE 090 GBS TYPE XXX STRAIN 

AAGGGGCCAAAAGTAGCTTATACACAAGAGGGAATGAC 

TGCTCTTTCGGACACAAATAAAGATAAAGTCACTACTATTrCTATTG^ 

AGATTCAAAAAAGCTTAGAAGGTAAGAAGCCGATC 

ATTGATGATACACTACTTTTCAGTAGTCAAT^ 

ATATGTAACTCCTGGATCGTTTGATTTTCrTCATAA^ 

ATCTTGTTG CAAAACGAGGAGATCAAGATTCCATTCCCAAAGAATATGCT 

AAAAAATTAATTGCTATGC^TCAAAAACX3AGGAGATAAAATlXJ , l , rri"rAT 

AACAGGTAGGACAAGAGGGTCAATGTATAAGGAGGGCGAGGTTGATAAAA 

CAG CTAAAG CCTTAG CTAAAGATTTTAAATTAGACAAACCAATTGCTGTA 

AATTATACAGGCGATAAACCTAAAAAG CCATACAAATATG ATAAATCATA 

TTATATTAAGAAATATGGTTCAGACATTCATTATC 

ATATTCATGCAGCTAGGGAGGCCGGTGCTAGACCAATTAGAATTTTAAGA 

GCACCTAATTCTACAAATCTACCTTTACCAGAAGCTGGAGGCT^ 

AGAGGTTCTCGAAAATTCAGCTTAC 

SEQ ID NO 4003 i SAG0653 FROM THE A909 GBS TYPE X& STRAIN 
AAGGGGCGAAAAGTAGCTTATACACA 

AGAGGGAATGACTGCTCTTTCGGACACAAATAAAGATAAAGTCACT 

TTTCT ATTGA OGAGATTCAAAAAAGCTTAGAAGGTAAGAAGCC 

GTTAGl'iU'rGATATTGATGATA 

ATATGGTAAAGAATATGTAACTCCTGGATCGTTTGATTT^ 

AAAGAATATG CTAAAAAATTAATTGCTATGCATCAAAAACGAGGAGATAA 
AATTGTTTTTATAACAGGTAGGACAAGAGGGTCAATGTATAAGGAGGGCG 
AGGTTGATAAAACAGCTAA7VGCCTTAGCTAAAGATTTTA 
CCAATTGCTGTAAATTATAC^GGCGATAAACCTAAAAAGCCATACAAATA 
TGATAAATCATATT'ATATTAAGAAATATGGTTCAGACATTCATTATGGAG 
AT AGTGATGACG ATATTCATGCAG CTAGG GAGG C CGGTG CTAGACCAATT 
AGAATTTTAAGAGCACCTAATTCTACAAAT CTACCTTTACCAGAAGCTGG 
AGGCTACGGTGAAGAGGTTCTCGAAAATTCAG CTTAC 

SEQ ID NO 4004 : SAGO 65 3 FROM THE 18RS21 GBS TYPE IX STRAIN 

AAGGGGCCAAAAGTAG CTTATACACAAGA 

GGGAATGACTGCTCTTTCGGACACAAATAAAGATAAAGTCACT^ 

CTATTGACGAGATTCAAAAAAGCTTAGAAGGTAAGAAGCCGATTAC^ 

AGTITTGATATTGATGATACACTGCITTTCAGTAGTC^ 

TGGTAAAGAATATGTAACTCCTGGATCGTTTG 

AATTCTGGGATCTTGTTGCAAAACGAGGAGATCAAGATTCCAT^ 

GAATATGCTAAAAAATTAATTGCTATGCATCAAAAACGAGGAGATAAAAT 

TGTTTTTAT AACAGGTAGGACAAGAGGGTCAATGTATAAGGAGGG CGAGG 

TTGATAAAACAGCTAAAGCCTTAGCTAAAGATTTTAAATTAGACAAA^ 

ATTGCTGT AAATTATACAGG CG AT AAACCT AAAAAG CCATACAAATATGA 

TAAATCATATTATATTAAGAAATATGGTTCAGACATTCATTATGGAGATA 

GTGATGACGATATTCATGCAGCTAGGGAGG CCGGTGCTAGACCAATTAGA 

ATTTTAAGAGCACCTAATTCTACAAATCTACCTT^ 

CTACGGTGAAGAGGTTCTCGAAAATTCAG CTTAC 

SEQ ID NO 4005 i SAGO 653 FROM THE M732 GBS TYPE III STRAIN 

AAGGGGCCAAAAGTAGCTTATACACAAQA 

GGGAATGACTGCTCTTTCXSGACACAAATAAAGATAAAG^ 

CTATTGACGAGATTCAAAAAAGCTTAGAAGGTAAGAAGCCGAT^ 

AGTTTTGATATTGATGATACACTGCTTTTGAGW 

TGGTAAAGAATATGTAACTCCTGGATCGTTTG^ 

AATTCTGGGATCTTGTTG CAAAACGAGGAGATCAAGATTCCATTCCX!AAA 
GAATATG CTAAAAAATTAATTG CT ATG CATCAAAAACGAGGAGAT AAAAT 
TGTTTTTATAACAGGTAGGACAAGAGGGTCAATGTATA^ 
TTGATAAAACAGCTAAAGCCTTAGCEAAAGATTT^ 

ATTGCTGTAAATTAT ACAGG CG AT AAAC CT AAAAAG CCATACAAATATGA 
TAAATCATATTATATTAAGLAAATATGGTTCAGA 

GTGATGACXIATATTGATGCAGCrAGGGAGG CXXXnt5CTAGACCAATTAGA 

A TTTTA AQAGCACCTAATTCTACAAATC 

CTACGGTGAAGAGGTTCTCGAAAATTCAGCTTAC 

SEQ ID NO 4006 t SAG0653 FROM THE COH1 GBS TYPE III STRAIN 
AAGGGGCCAAAAGTAG CTT ATACACAAGAGGGAATGACT 
GCTCTTTCGGACACAAATAAAGATAAAGTCACTACTATTTCTAT^ 
GATTCAAAAAAGCTTAGAAGGTAAGAAGCCGATTACTGTTA^ 
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TTGATGATAC^CTGCTITTCACyrAGTCAATATTTTC 

TATGTAACTCCTGGATCGTTTGATTTTCTTCATAAACA^ 

TCTTGTTtKIAAAACGAGGAGATCAAGATTCCATTCCCA 

AAAAATTAATTGCTATGCATCAAAAACGAG^GATAAAATlXil'l'iTTATA 

ACAGGTAGGACAAGAGGGTCAATGTATAAGGAGGGCGAGGTTGATAAAAC 

AGCTAAAGCCTTAGCTAAAGATTTTAAATTAGACAAACC 

ATTATACAGGCGATAAACCTAAAAAGCCATACAAATATGATAAATCATAT 

TATATTAAGAAATATGGTTCAGACATTCATTATGGAGATAGTGATGAa^ 

TATTCATGCAGCTAGGGAGGCCGGTGCTAGACCAATTA^AATTTTAAG^ 

CACCTAATTCTACAAATCTACCTTTACCAGAAGCTGGAGGCTACGGTGAA 

GAGGTTCTCGAAAATTCAGCTTAC 

SEQ ID NO 4007 i SAGO 653 FROM THE M781 GBS TYPE XXZ STRAIN 
AAGGGGCCAAAAGTAGCTTATACACA 

AGAGGGAATGACTG CTCTTTCGGACACAAATAAAGATAAAGTCACTACTA 

TTTC TATT6R 0GAGATTCAAAAAAGCIT 

GTTAGTTTTGATATTGATGATACACTGCTTTTC^ 

ATATGGTAAAGAATATGTAACTCCTGGATCGTTTGATTT^ 

AAAAATTCTGGGATCTTGTTGCAAAACGAGGAGATCA^ 

AAAGAATATGCTAAAAAATTAATTGCTATG CATCAAAAACGAGGAGATAA 

AATTGTTTTTATAACAGGTAGGACAAGAG GGTCAATGTATAAGGAGGGCG 

AGGTTGATAAAACAGCT AAAG C CTT AG CT AAAGATTTTAAATT AGACAAA 

OCAATTGCTGTAAATTATACAGG CGATAAACCTAAAAAGCCATACAAATA 

TGATAAATCATATTATATTAAGAAATATGGTTCAGAC 

ATAGTGATGACGATATTCATGCAGCrAGGGAGGCCGGTGCTAGA 

AGAATTTTAAGAGCACCTAATTCTAOVAATCTACCTTTACC^ 

AGGCTACGGTGAAGAGGTTCTCGAAAATTCAGCTTAC 

SEQ ID NO 4008 t SAGO 653 FROM THE CJB110 GBS NONTYPBABLE STRAIN 

AAGGGGCCAAAAGTAGCTTATACACAAGA 

GGGAATGACTGCTCTTTCGGACACAAATAAAGATAAACT 

CT ATTGA CGAGATTCAAAAAAGCT TAGAA GGTAAGAAGCCGATTA 

AGTTTTGATATTGATGATACACTGCTT^ 

TGGTAAAGAATATGTAACTCCTCGATCGT 

AATTCTGGGATCITGTTGCAAAACGAGGAGATCAAGATT^ 

GAATATGCTAAAAAATTAATTGCTATGCATCAAAAACGAGGAGATAAAAT 

TGTTTTTATAACAGGTAGGACSUiGAGGGTCAATGT^ 

TTGATAAAACAG CTAAAGCCTTAG CTAAAG ATTTTAAATTAGACAAACCA 

ATTGCTGTAAATTATACAGGCGATAAACCTAAAAAGCCATACAAATATGA 

TAAATCATATTATATTAAGAAATATGGTTCAGACATTCATTATGGAGATA 

ATTTTAAGAGCACCTAATTCTACARATCTACCTTTACCAGAM 
CTACGGTGAAGAGGTTCTCGAAAATTCAGCTTAC 

SEQ ID NO 4009 i SAG0653 FROM THE JM3130013 GBS TYPE VIZI STRAIN 

AAGGGGCCAAAAGTAGCTTATACACAAGAGGGAAT 

GACTGCTCTTTCGGACACAAATAAAGATAAAGTCACT^ 

ACGAGATTCAAAAAAGCTT AGAAGGTAAGAAG CCGATTACTGTTAGTTTT 

GATATTGATGATACACTG CTTTTCAGTAGTCAATATTTTCAATATGGTAA 

AGAATATGTAACTGCTGGATCGTTTGATTTTCTTCA 

GGGATC*i'lXil"lGCAAAACGAGGAGATCAAGATTCCATTCCCAAAGAATAT 

GCTAAAAAATTAATTG CTATGCATCAAAAAOGAGGAGATAAAATTGTTTT 

TATAACAGGTAGGACAAGAGGGTCAATGTATAAGGAGGGCGAGGTTGATA 

AAACAGCTAAAGCCTTAGCTAAAGATTTTAAATTA^ 

GTAAATTATACAGG CGATAAACCTAAAAAGCCATACAAAT ATGATAAATC 

ATATTATATTAAGAAATATGGTTCAGACATTCATTATGGAGATAGTGATG 

ACGATATTCATGCAGCTAGGGAGGCCGGTGCTAGACCAATTAGAATTTT 

AGAGCACCTAATTCTACAAATGTACCTTTACCAGAAGCTGGAGGCTACGG 

TGAAGAGGTTCTCGAAAATTCAGCTTAC 
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PRETTY of: /biotmp/msa20031.2{*} August S, 2002 07»05 



msa2 0031 . 2 { 100_1BRS21 
msa20031 . 2 ( 100_2603 
msa2 0 03 1 . 2 { 10 0_A9 09 
msa20031 . 2 { 100_CJB110 
ms a20 03 1 . 2 { 1 0 0_OOH1 
msa20031.2{l00 JM9130013 
msa20031.2fl00_M732 
msa20031 . 2 { 100_M781 
msa2 003 1.2 {100.090 
Consensus 



AAGGGGCCAA 
AAGGGGCCAA 
AAGGGGCCAA 
AAGGGGCCAA 
AAGGGGCCAA 
AAGGGGCCAA 
AAGGGGCCAA 
AAGGGGCCAA 
AAGGGGCCAA 



AAGTAGCTTA 
AAGTAGCTTA 
AAGTAGCTTA 
AAGTAGCTTA 
AAGTAGCTTA 
AAGTAGCTTA 
AAGTAGCTTA 
AAGTAGCTTA 
AAGTAGCTTA 



TACACAAGAG 
TACACAAGAG 
TACACAAGAG 
TACACAAGAG 
TACACAAGAG 
TACACAAGAG 
TACACAAGAG 
TACACAAGAG 
TACACAAGAG 



GGAATGACTG 
GGAATGACTG 
GGAATGACTG 
GGAATGACTG 
GGAATGACTG 
GGAATGACTG 
GGAATGACTG 
GGAATGACTG 
GGAATGACTG 



' 50 
CTCTTTCGGA 
CTCTTTCGGA 
CT CTTT CGGA 
CTCTTTCGGA 
CTCTTTCGGA 
CTCTTTCGGA 
CTCTTTCGGA 
CTCTTTCGGA 
CTCTTTCGGA 



msa2 0031.2(100 18RS21 
ms a2 0 0 3 1 . 2 { 1 0 0_2 6 03 
msa20031.2{100 A909 
msa20031 . 2 { 100_CJB110 
msa2 0 03 1 . 2 { 10 0_COH1 
msa20031.2{lOO_JM9130013 
msa20031.2(l00 M732 
msa20031 . 2 { 100~M781 
msa20031 . 2 { 100_090 
Consensus 



51 

CACAAATAAA 
CACAAATAAA 
CACAAATAAA 
CACAAATAAA 
CACAAATAAA 
CACAAATAAA 
CACAAATAAA* 
CACAAATAAA 
CACAAATAAA 



GATAAAGTCA 
GATAAAGTCA 
GATAAAGTCA 
GATAAAGTCA 
GATAAAGTCA 
GATAAAGTCA 
GATAAAGTCA 
GATAAAGTCA 
GATAAAGTCA 



CTACTATTTC 
CTACTATTTC 
CTACTATTTC 
CTACTATTTC 
CTACTATTTC 
CTACTATTTC 
CTACTATTTC 
CTACTATTTC 
CTACTATTTC 



TATTGACGAG 
TATTGACGAG 
TATTGACGAG 
TATTGACGAG 
TATTGACGAG 
TATTGACGAG 
TATTGACGAG 
TATTGACGAG 
TATTGACGAG 



100 

ATTCAAAAAA 
ATTCAAAAAA 
ATTCAAAAAA 
ATTCAAAAAA 
ATTCAAAAAA 
ATTCAAAAAA 
ATTCAAAAAA 
ATTCAAAAAA 
ATTCAAAAAA 



msa20031.2{lOO_18RS21 
msa2 0031.21 100_2603 
msa20031.2{100 A909 
msa20031.2{lOO CJB110 
msa20031 . 2{ 100_COH1 
msa20031 . 2 {100_JM9130013 
msa20031 .2f 100_M732 
msa20031 . 2 { 100J4781 
msa20031 . 2 { 100_090 
Consensus 



101 

GCTTAGAAGG 
GCTTAGAAGG 
GCTTAGAAGG 
GCTTAGAAGG 
GCTTAGAAGG 
GCTTAGAAGG 
GCTTAGAAGG 
GCTTAGAAGG 
GCTTAGAAGG 



TAAGAAGCCG 
TAAGAAGCCG 
TAAGAAGCCG 
TAAGAAGCCG 
TAAGAAGCCG 
TAAGAAGCCG 
TAAGAAGCCG 
TAAGAAGCCG 
TAAGAAGCCG 



ATTACTGTTA 
ATTACTGTTA 
ATTACTGTTA 
ATTACTGTTA 
ATTACTGTTA 
ATTACTGTTA 
ATTACTGTTA 
ATTACTGTTA 
ATTACTGTTA 



GTTTTGATAT 
GTTTTGATAT 
GTTTTGATAT 
GTTTTGATAT 
GTTTTGATAT 
GTTTTGATAT 
GTTTTGATAT 
GTTTTGATAT 
GTTTTGATAT 



150 

TGATGATACA 
TGATGATACA 
TGATGATACA 
TGATGATACA 
TGATGATACA 
TGATGATACA 
TGATGATACA 
TGATGATACA 
TGATGATACA 



rasa20031 . 2 { 100_18RS21 
msa20031.2{l00_2603 
msa20031 . 2 { 100_A909 
msa20031 . 2 { 100_CJB110 
msa20031.2{l00 COH1 
msa20031 . 2 { 10 0__JM9 130013 
msa2 0031 . 2 { 100_M732 
msa20031 . 2 {100_M781 
msa20031.2{l00_090 
Consensus 



151 

CTgCTTTTCA 
CTgCTTTTCA 
CTg CTTTT CA 
CTgCTTTTCA 
CTgCTTTTCA 
CTgCTTTTCA 
CTgCTTTTCA 
CTgCTTTTCA 
CTaCTTTTCA 



GTAGTCAATA 
GTAGTCAATA 
GTAGTCAATA 
GTAGTCAATA 
GTAGTCAATA 
GTAGTCAATA 
GTAGTCAATA 
GTAGTCAATA 
GTAGTCAATA 



TTTTCAATAT 
TTTTCAATAT 
TTTTCAATAT 
TTTTCAATAT 
TTTTCAATAT 
TTTTCAATAT 
TTTTCAATAT 
TTTTCAATAT 
TTTTCAATAT 



GGTAAAGAAT 
GGTAAAGAAT 
GGTAAAGAAT 
GGTAAAGAAT 
GGTAAAGAAT 
GGTAAAGAAT 
GGTAAAGAAT 
GGTAAAGAAT 
GGTAAAGAAT 



200 

ATGTAACTCC 
ATGTAACTCC 
ATGTAACTCC 
ATGTAACTCC 
ATGTAACTCC 
ATGTAACTCC 
ATGTAACTCC 
ATGTAACTCC 
ATGTAACTCC 



msa2003 1 . 2 { 100_18RS2 1 
msa20031.2fl00_2603 
msa2 0 03 1 . 2 { 1 0 0_A909 
msa20031 . 2 { 100_CJB110 
msa20031.2{l00_COHl 
msa20031 . 2 {l00_JM9130013 
msa20031 . 2 ( 100_M732 
msa20031 .2 { 100_M781 
msa20031 . 2 { 100_090 
Consensus 



201 

TGGATCGTTT 
TGGATCGTTT 
TGGATCGTTT 
TGGATCGTTT 
TGGATCGTTT 
TGGATCGTTT 
TGGATCGTTT 
TGGATCGTTT 
TGGATCGTTT 



GATTTTCTTC 
GATTTTCTTC 
GATTTTCTTC 
GATTTTCTTC 
GATTTTCTTC 
GATTTTCTTC 
GATTTTCTTC 
GATTTTCTTC 
GATTTTCTTC 



ATAAACAAAA 
ATAAACAAAA 
ATAAACAAAA 
ATAAACAAAA 
ATAAACAAAA 
ATAAACAAAA 
ATAAACAAAA 
ATAAACAAAA 
ATAAACAAAA 



ATTCTGGGAT 
ATTCTGGGAT 
ATTCTGGGAT 
ATTCTGGGAT 
ATTCTGGGAT 
ATTCTGGGAT 
ATTCTGGGAT 
ATTCTGGGAT 
ATTCTGGGAT 



250 

CrTGTTGCAA 
CTTGTTGCAA 
CTTGTTGCAA 
CTT GTTGCAA 
CTTGTTGCAA 
CTTGTTGCAA 
CTTGTTGCAA 
CTTGTTGCAA 
CTTGTTGCAA 



msa20031 . 2 { 100_18RS21 
msa20031.2(l00 2603 
msa2003 1 . 2 (100JV9O9 
msa20031 . 2 { 100_CJB110 
msa20031 . 2 { 100_COH1 
msa2O03 1 . 2 {100_JM9 130013 
msa20031.2(100_M732 
msa2 0 03 1 . 2 { 10 0_M7 8 1 
msa20031.2{l00_090 
Consensus 



251 

AACGAGGAGA 
AACGAGGAGA 
AACGAGGAGA 
AACGAGGAGA 
AACGAGGAGA 
AACGAGGAGA 
AACGAGGAGA 
AACGAGGAGA 
AACGAGGAGA 



TCAAGATTCC 
TCAAGATTCC 
TCAAGATTCC 
TCAAGATTCC 
TCAAGATTCC 
TCAAGATTCC 
TCAAGATTCC 
TCAAGATTCC 
TCAAGATTCC 



ATTCCCAAAG 
ATTCCCAAAG 
ATTCCCAAAG 
ATTCCCAAAG 
ATTCCCAAAG 
ATTCCCAAAG 
ATTCCCAAAG 
ATTCCCAAAG 
ATTCCCAAAG 



AATATGCTAA 
AATATGCTAA 
AATATGCTAA 
AATATGCTAA 
AATATGCTAA 
AATATGCTAA 
AATATGCTAA 
AATATGCTAA 
AATATGCTAA 



300 

AAAATTAATT 
AAAATTAATT 
AAAATTAATT 
AAAATTAATT 
AAAATTAATT 
AAAATTAATT 
AAAATTAATT 
AAAATTAATT 
AAAATTAATT 



msa20031 . 2 { 100_18RS21 
msa20031 . 2 f 100_2603 
msa2 0 03 1 . 2 ( 100_A9 0 9 

rasa2003 1 . 2 { 100_CJB110 
msa20031.2{l00 COH1 
msa20031 . 2 { 100_JM9130013 
msa20031. 2(100 M732 
msa2 003 1 . 2 { 100~M78 1 



301 

GCTATGCATC 
GCTATGCATC 
GCTATGCATC 
GCTATGCATC 
GCTATGCATC 
GCTATGCATC 
GCTATGCATC 
GCTATGCATC 



AAAAACGAGG 
AAAAACGAGG 
AAAAACGAGG 
AAAAACGAGG 
AAAAACGAGG 
AAAAACGAGG 
AAAAACGAGG 
AAAAACGAGG 



AGATAAAATT 
AGATAAAATT 
AGATAAAATT 
AGATAAAATT 
AGATAAAATT 
AGATAAAATT 
AGATAAAATT 
AGATAAAATT 



GTTTTTATAA 
GTTTTTATAA 
GTTTTTATAA 
GTTTTTATAA 
GTTTTTATAA 
GTTTTTATAA 
GTTTTTATAA 
GTTTTTATAA 



350 

CAGGTAGGAC 
CAGGTAGGAC 
CAGGTAGGAC 
CAGGTAGGAC 
CAGGTAGGAC 
CAGGTAGGAC 
CAGGTAGGAC 
CAGGTAGGAC 
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msa20031.2{l00_090) 
Consensus 



GCTATGCATC AAAAACGAGG AGATAAAATT GTTTTTATAA CAGGTAGGAC 



msa20031 ,2{l00_18RS21 
TO3a20031. 2(100 2603 
msa20031 . 2 (100~A909 
msa2 003 1 . 2 ( 100_CJB110 
msa20031 . 2 { 100_COH1 
tnsa20031.2{l00_JM9130013 
msa20031 . 2 ( 100_M732 
msa20031.2{100_M781 
msa20031.2{l00_090 
Consensus 



351 

AAGAGGGTCA 
AAGAGGGTCA 
AAGAGGGTCA 
AAGAGGGTCA 
AAGAGGGTCA 
AAGAGGGTCA 
AAGAGGGTCA 
AAGAGGGTCA 
AAGAGGGTCA 



ATGTATAAGG 
ATGTATAAGG 
ATGTATAAGG 
ATGTATAAGG 
ATGTATAAGG 
ATGTATAAGG 
ATGTATAAGG 
ATGTATAAGG 
ATGTATAAGG 



AGGGCGAGGT 
AGGGCGAGGT 
AGGGCGAGGT 
AGGGCGAGGT 
AGGGCGAGGT 
AGGGCGAGGT 
AGGGCGAGGT 
AGGGCGAGGT 
AGGGCGAGGT 



TGATAAAACA 
TGATAAAACA 
TGATAAAACA 
TGATAAAACA 
TGATAAAACA 
TGATAAAACA 
TGATAAAACA 
TGATAAAACA 
TGATAAAACA 



400 

GCTAAAGCCT 
GCTAAAGCCT 
GCTAAAGCCT 
GCTAAAGCCT 
GCTAAAGCCT 
GCTAAAGCCT 
GCTAAAGCCT 
GCTAAAGCCT 
GCTAAAGCCT 



msa20031 . 2 { 100_18RS21 
msa20031.2(l00_2603 
msa20031.2{100_A909 
msa2 0031.2(100 CJB110 
msa20031 . 2 { 100_COH1 
msa20031.2(lOO_JM9130013 
msa20031.2{l00_M732 
msa20031.2(100_M781 
msa20031 . 2 { 100_090 
Consensus 



401 

TAGCTAAAGA 
TAGCTAAAGA 
TAGCTAAAGA 
TAGCTAAAGA 
TAGCTAAAGA 
TAGCTAAAGA 
TAGCTAAAGA 
TAGCTAAAGA 
TAGCTAAAGA 



TTTTAAATTA 
TTTTAAATTA 
TTTTAAATTA 
TTTTAAATTA 
TTTTAAATTA 
TTTTAAATTA 
TTTTAAATTA 
TTTTAAATTA 
TTTTAAATTA 



GACAAACCAA 
GACAAACCAA 
GACAAACCAA 
GACAAACCAA 
GACAAACCAA 
GACAAACCAA 
GACAAACCAA 
GACAAACCAA 
GACAAACCAA 



TTGCTGTAAA 
TTGCTGTAAA 
TTGCTGTAAA 
TTGCTGTAAA 
TTGCTGTAAA 
TTGCTGTAAA 
TTGCTGTAAA 
TTGCTGTAAA 
TTGCTGTAAA 



450 

TTATACAGGC 
TTATACAGGC 
TTATACAGGC 
TTATACAGGC 
TTATACAGGC 
TTATACAGGC 
TTATACAGGC 
TTATACAGGC 
TTATACAGGC 



msa20031 . 2{ 100_18RS21 
msa2 0 03 1 . 2 ( 10 0_2 6 03 
msa20031.2(lOO_A909 
msa2 0031 . 2 { 100_CJB110 
msa20031 . 2 { 100_C0H1 
msa20031.2{l00 JM9130013 
msa2 0 03 1 . 2 { 10 0_M7 3 2 
msa20031 . 2 { 100_M781 
msa2 003 1 . 2 { 1 00_0 9 0 
Consensus 



451 

GATAAACCTA 
GATAAACCTA 
GATAAACCTA 
GATAAACCTA 
GATAAACCTA 
GATAAACCTA 
GATAAACCTA 
GATAAACCTA 
GATAAACCTA 
********** 



AAAAGCCATA 
AAAAGCCATA 
AAAAGCCATA 
AAAAGCCATA 
AAAAGCCATA 
AAAAGCCATA 
AAAAGCCATA 
AAAAGCCATA 
AAAAGCCATA 
********** 



CAAATATGAT 
CAAATATGAT 
CAAATATGAT 
CAAATATGAT 
CAAATATGAT 
CAAATATGAT 
CAAATATGAT 
CAAATATGAT 
CAAATATGAT 
********** 



AAATCATATT 
AAATCATATT 
AAATCATATT 
AAATCATATT 
AAATCATATT 
AAATCATATT 
AAATCATATT 
AAATCATATT 
AAATCATATT 
********** 



500 

ATATTAAGAA 
ATATTAAGAA 
ATATTAAGAA 
ATATTAAGAA 
ATATTAAGAA 
ATATTAAGAA 
ATATTAAGAA 
ATATTAAGAA 
ATATTAAGAA 
********** 



msa20031.2{l00_18RS21 
msa20031.2fl00_2603 
msa2 003 1 . 2 { 10 0_A90 9 
msa20031.2{lOO_CJB110 
msa20031.2{l00 COH1 
rasa2 003 1 . 2 { 100_JM9 130013 
maa2 0 03 1 . 2 { 10 0J47 3 2 
msa20031.2(100_M781 
msa20031.2{l00_090 
Consensus 



501 

ATATGGTTCA 
ATATGGTTCA 
ATATGGTTCA 
ATATGGTTCA 
ATATGGTTCA 
ATATGGTTCA 
ATATGGTTCA 
ATATGGTTCA 
ATATGGTTCA 



GACATTCATT 
GACATTCATT 
GACATTCATT 
GACATTCATT 
GACATTCATT 
GACATTCATT 
GACATTCATT 
GACATTCATT 
GACATTCATT 



ATGGAGATAG 
ATGGAGATAG 
ATGGAGATAG 
ATGGAGATAG 
ATGGAGATAG 
ATGGAGATAG 
ATGGAGATAG 
ATGGAGATAG 
ATGGAGATAG 



TGATGACGAT 
TGATGACGAT 
TGATGACGAT 
TGATGACGAT 
TGATGACGAT 
TGATGACGAT 
TGATGACGAT 
TGATGACGAT 
TGATGACGAT 



550 

ATTCATGCAG 
ATTCATGCAG 
ATTCATGCAG 
ATTCATGCAG 
ATTCATGCAG 
ATTCATGCAG 
ATTCATGCAG 
ATTCATGCAG 
ATTCATGCAG 



msa2 003 1 . 2 { 100_18RS2 1 
msa20031 . 2 (l00_2603 
msa20031 . 2 { 100_A909 
msa20031.2{l00 CJB110 
msa2 003 1.2(100 COH1 
msa20031.2{l00 JM9130013 
msa20031.2{lOO_M732 
msa20031.2{l00_M781 
msa20031.2{l00_090 
Consensus 



551 

CTAGGGAGGC 
CTAGGGAGGC 
CTAGGGAGGC 
CTAGGGAGGC 
CTAGGGAGGC 
CTAGGGAGGC 
CTAGGGAGGC 
CTAGGGAGGC 
CTAGGGAGGC 



CGGTGCTAGA 
CGGTGCTAGA 
CGGTGCTAGA 
CGGTGCTAGA 
CGGTGCTAGA 
CGGTGCTAGA 
CGGTGCTAGA 
CGGTGCTAGA 
CGGTGCTAGA 



CCAATTAGAA 
CCAATTAGAA 
CCAATTAGAA 
CCAATTAGAA 
CCAATTAGAA 
CCAATTAGAA 
CCAATTAGAA 
CCAATTAGAA 
CCAATTAGAA 



TTTTAAGAGC 
TTTTAAGAGC 
TTTTAAGAGC 
TTTTAAGAGC 
TTTTAAGAGC 
TTTTAAGAGC 
TTTTA AGAGC 
TTTTAAGAGC 
TTTTAAGAGC 



600 

ACCTAATTCT 
ACCTAATTCT 
ACCTAATTCT 
ACCTAATTCT 
ACCTAATTCT 
ACCTAATTCT 
ACCTAATTCT 
ACCTAATTCT 
ACCTAATTCT 



msa20031 .2{ 100_18RS21 
msa20031 . 2 { 100_2603 
msa2 0 03 1 . 2 ( 10 0_A9 0 9 
msa20031 . 2 { 100_CJB110 
msa20031.2{lOO_COHl 
rasa20031.2{l00 JM9130013 
msa20031.2(l00_M732 
msa20031 . 2 { 100__M78 1 
msa20031.2{!00_090 
Consensus 



601 

ACAAATCTAC 
ACAAATCTAC 
ACAAATCTAC 
ACAAATCTAC 
ACAAATCTAC 
ACAAATCTAC 
ACAAATCTAC 
ACAAATCTAC 
ACAAATCTAC 



CTTTACCAGA 
CTTTACCAGA 
CTTTA CCAGA 
CTTTACCAGA 
CTTTACCAGA 
CTTTA CCAGA 
CTTTACCAGA 
CTTTACCAGA 
CTTTACCAGA 



AGCTGGAGGC 
AGCTGGAGGC 
AGCTGGAGGC 
AGCTGGAGGC 
AGCTGGAGGC 
AGCTGGAGGC 
AGCTGGAGGC 
AGCTGGAGGC 
AGCTGGAGGC 



TACGGTGAAG 
TACGGTGAAG 
TACGGTGAAG 
TACGGTGAAG 
TACGGTGAAG 
TACGGTGAAG 
TACGGTGAAG 
TACGGTGAAG 
TACGGTGAAG 



650 

AGGTTCTCGA 
AGGTTCTCGA 
AGGTTCTCGA 
AGGTTCTCGA 
AGGTTCTCGA 
AGGTTCTCGA 
AGGTTCTCGA 
AGGTTCTCGA 
AGGTTCTCGA 



msa20031 . 2 { 100_18RS21 
msa20031 . 2{ 100_2603 
msa20O31.2(l0O_A9O9 
msa20031. 2(100 CJB110 
ms a2 0 03 1 . 2 { 100_COH1 
msa20031.2{l00 JM9130013 
msa20031.2{100 M732 



651 663 
AAATTCAGCT TAC 
AAATTCAGCT TAC 
AAATTCAGCT TAC 
AAATTCAGCT TAC 
AAATTCAGCT TAC 
AAATTCAGCT TAC 
AAATTCAGCT TAC 
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msa20031.2{l00_M78l) AAATTCAGCT TAG 
msa20031.2{l00_090} AAATTCAGCT TAC 
Consensus ********** *** 

SEQ ID NO 4010 s SAGO 6 53 FROM THE 2603 V/R GBS TYPE V STRAIN 
RGPKVAYTQEGMTALSDTNKDKVTTI S I DE I QKSLEGKKPITVS FD I DDTLLFS SQYFQY 
GKEYVTPGSFDFLHKQKFWDLVAKRGDQDSIPKEYAKKLIAMHQKRGDKIVFITG 
MYKEGEVDKTAKAIJUOFKIJJKPIAVNYTGDKPK^^ 
IHAAREAGARPIRI LRAPNSTNLPLPEAGGYGEEVLENSAY 

SEQ ZD NO 4011 < SAGO 653 FROM THE 090 GBS TYPE III STRAIN 

KGPKVAYTQEGMTALSDTNKDKVTTISIDEIQKSLEGK^ 

GKKYVTPGSFDFLHKQKPWDLVAKRGIXJDSIPKEYAKKLIAMHQKRGDKIVPITGRT 
MYKEGEVDKTAKALAKDFKLDKPI AVNYTGDKPKKFnCTO 
IHAAREAGARPI RI LRAPNSTNLPLPEAGGYGEEVLENSAY 

SEQ ZD NO 4012 : SAG0653 FROM THE A909 GBS TYPE Za STRAIN 
KGPKVAYTQEC34TALSDTNKDKVTT I S I DEI QKSLEGKKPITVSFDIDDTLLFSS QYFQY 
GKBYVTPGSFDFI^QKFWDLVAKRGDQDSIPKEYAKKLIAMHQKRGDKIVFITGRTRGS 
MYKEGEVDKTAKALAKDFKLDKPI AVNYTGDKPKKPYRYDKSYYI KKYG SD I HYGDSDDD 
IHAAREAGARPIRI LRAPNSTNLPLPEAGGYGEEVLENSAY 

SEQ ZD NO 4013 t SAG0653 FROM THE 18RS21 GBS TYPE ZZ STRAIN 
KGPKVAYTQEGMTALSDTNKDKVTTI S IDEIQKSLBGKKPITVSFDIDDTLLFSSQYFQY 
GKEYVTPGS FDFLHKQKFWDLVAKRGDQDS I PKBYAKKLI AMHQKRGDKI VFI TGRTRGS 
WYKEGBVDKTAKALAKDFKLDKPIAVNYTGDKPKKPYKYDKSYYI KKYGSD I HYGDSDDD 
IHAAREAGARPI RI LRAPNSTNLPLPEAGGYGEEVLENSAY 

SEQ ZD NO 4014 t SAGO 653 FROM THE COH1 GBS TYPE ZZZ STRAIN 

KGPKVAYTQEGMTALSDTNKDKVTT I S I DE I QKSLEGKKP ITVS FDI DDTLLFS SQYFQY 
GKEYVTPGSFDFLHKQKFWDLVAKRGDQDS I PKEYAKKLIAMHQKRGDKI VFITGRTRGS 
MYKEGEVDKTAKALAKDFKLDKP IAVNYTGDKPKKPYKYDKSYYI KKYGSD I HYGDSDDD 
I HAAREAGARPI RI LRAPNSTNLPLPEAGGYGEEVLENSAY 

SEQ ZD NO 4015 : SAG0653 FROM THE M781 GBS TYPE ZZZ STRAIN 

KG PKVAYTQEGMTAL SDTNKDKVTT I S IDEIQKSLEGKKP ITVS FDIDDTLLFSSQYFQY 
GKEYVTPGSFDFLHKQKFWDLVAKRGDQDS I PKEYAKKL I AMHQKRGDKI VF ITGRTRGS 
MYKEGEVDKTAKALAKDFKLDKPIAVNYTGDKPKKPYKYDKS YY I KKYGSD I HYGDSDDD 
IHAAREAGARP I RI LRAPNSTNLPLPEAGGYGEEVLENSAY 

SEQ ZD NO 4016 t SAGO 6 53 FROM THE CJB110 GBS NONTYPEABLE STRAIN 
KGPKVAYTQEGMTALSDTNKDKVTTIS IDEIQKSLEGKKPITVSFDIDDTLLFSSQYFQY 
GKEYVTPGS FDFLHKQKFWDL VAKRGDQD S I PKEYAKKLIAMHQKRGDKI VF I TGRTRGS 

IHAAREAGARPIRI LRAPNSTNLPLPEAGGYGEEVLENSAY 

SEQ ZD NO 4017 t SAGO 653 FROM THE JM 9 13 00 13 GBS TYPE VIII STRAIN 
KGPKVAYTQEGMTALSDTNKDKVTT I S IDE I QKSLEGKKP I TVS FD I DDTLL FS SQYFQY 
GKEYVTPGSFDFLHKQKFWDLVAKRGDQDSI PKEYAKKLIAMHQKRGDKI VFITGRTRGS 
MYKEGEVDKTAKALAKDFKLDKPI AVNYTGDKPKKPYKYDKSYYI KKYGSDIHYGDSDDD 
IHAAREAGARPI RI LRAPNSTNLPLPEAGGYGEEVLENSAY 

SEQ ZD NO 4018 * SAG0653 FROM THE M732 GBS TYPE ZZZ STRAIN 
KGPKVAYTQEGMTALSDTNKDKVTT I S I DE I QKSLEGKKP I TVS FD I DE>TLLFSSQYFQY 
GKEYVTPGS FDFLHKQKFWDLVAKRGDQDS I PKEYAKKLIAMHQKRGDKI VF ITGRTRGS 
MYKEGEVDKTAKALAKDFKLDKP lAVNYTGDKPKKPYKYDKSYYIKK^ 
IHAAREAGARPI RI LRAPNSTNLPLPEAGGYGEEVLENSAY 
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PRETTY Of i /biotmp/msa25122.2{*} August 5, 2002 07s 09 



. msa25122.2{l00__090 
msa25122.2{l00JL8RS21 
msa2 5122 . 2 [ 100_2603 
msa25122.2{lOO_A909 
msa25122 . 2 { 100_CJB110 
msa25122.2{l00 COH1 
tnsa25122.2{100 JM9130013 
rasa25122.2fl00_M732 
msa25122 . 2 { 100_M781 
Consensus 



KGPKVAYTQB 
KGPKVAYTQE 
KGPKVAYTQB 
KGPKVAYTQB 
KGPKVAYTQB 
KGPKVAYTQB 
KGPKVAYTQB 
KGPKVAYTQE 
KGPKVAYTQE 



GMTALSDTNK 
GMTALSDTNK 
GMTALSDTNK 
GMTALSDTNK 
GMTALSDTNK 
GMTALSDTNK 
GMTALSDTNK 
GMTALSDTNK 
GMTALSDTNK 



DKVTTISIDB 
DKVTTISIDE 
DKVTTISIDB 
DKVTTISIDE 
DKVTTISIDB 
DKVTTISIDE 
DKVTTISIDE 
DKVTTISIDB 
DKVTTISIDB 



IQKSLEGKKP 
IQKSLEGKKP 
IQKSLEGKKP 
IQKSLEGKKP 
IQKSLEGKKP 
IQKSLEGKKP 
IQKSLEGKKP 
IQKSLEGKKP 
IQKSLEGKKP 



50 

ITVSFDIDDT 
I TVS FD I DDT 
ITVSFDIDDT 
ITVSFDIDDT 
ITVSFDIDDT 
ITVSFDIDDT 
ITVSFDIDDT 
ITVSFDIDDT 
ITVSFDIDDT 



msa25122.2{l00_090 
msa2S122 . 2 { 100_18RS21 
msa2512 2 . 2 ( 100_2603 
rasa25122 . 2 {100_A909 
rasa25122 . 2 { 100_CJB110 
msa25122.2{l00_COKl 
msa25122.2{l00 JM9130013 
rasa25122 . 2[ 100_M732 
msa2S122 . 2 { 100_M781 
Consensus 



51 

LLFSSQYFQY 
LLFSSQYFQY 
LLFSSQYFQY 
LLFSSQYFQY 
LLFSSQYFQY 
LLFSSQYFQY 
LLFSSQYFQY 
LLFSSQYFQY 
LLFSSQYFQY 



GKBYVTPGSF 
GKEYVTPGSF 
GKBYVTPGSF 
GKEYVTPGSF 
GKBYVTPGSF 
GKBYVTPGSF 
GKBYVTPGSF 
GKEYVTPGSF 
GKEYVTPGSF 



DFLHKQKFWD 
DFLHKQKFWD 
DFLHKQKFWD 
DFLHKQKFWD 
DFLHKQKFWD 
DFLHKQKFWD 
DFLHKQKFWD 
DFLHKQKFWD 
DFLHKQKFWD 



LVAKRGDQDS 
LVAKRGDQDS 
LVAKRGDQDS 
LVAKRGDQDS 
LVAKRGDQDS 
LVAKRGDQDS 
LVAKRGDQDS 
LVAKRGDQDS 
LVAKRGDQDS 



100 

IPKEYAKKLI 
IPKEYAKKLI 
IPKEYAKKLI 
IPKEYAKKLI 
IPKEYAKKLI 
IPKEYAKKLI 
IPKEYAKKLI 
IPKEYAKKLI 
IPKEYAKKLI 



msa25122 . 2 { 100_090 
msa2 5122 . 2 { 100_18RS21 
msa25122.2(l00_2603 
msa25122 . 2 { 100_A909 
msa25122 . 2 { 100_CJB110 
ms a2 5 12 2 . 2 { 100_COH1 
msa25122 . 2 { 100_JM9130013 
msa25122 . 2 f 100_M732 
msa2 512 2 . 2 { 1 0 0_M7 8 1 
Consensus 



101 

AMHQKRGDKI 
AMHQKRGDKI 
AMHQKRGDKI 
AMHQKRGDKI 
AMHQKRGDKI 
AMHQKRGDKI 
AMHQKRGDKI 
AMHQKRGDKI 
AMHQKRGDKI 



VFITGRTRGS 
VFITGRTRGS 
VFITGRTRGS 
VPITGRTRGS 
VFITGRTRGS 
VFITGRTRGS 
VFITGRTRGS 
VFITGRTRGS 
VFITGRTRGS 



MYKEGEVDKT 
MYKEGEVDKT 
MYKEGEVDKT 
MYKEGEVDKT 
MYKEGEVDKT 
MYKEGEVDKT 
MYKEGEVDKT 
MYKEGEVDKT 
MYKEGEVDKT 



AKALAKDFKL 
AKALAKDFKL 
AKALAKDFKL 
AKALAKDFKL 
AKALAKDFKL 
AKALAKDFKL 
AKALAKDFKL 
AKALAKDFKL 
AKALAKDFKL 



150 

DKPIAVNYTG 
DKPIAVNYTG 
DKPIAVNYTG 
DKPIAVNYTG 
DKPIAVNYTG 
DKPIAVNYTG 
DKPIAVNYTG 
DKPIAVNYTG 
DKPIAVNYTG 



msa25122.2{!00_090 
msa25122 . 2 { 100_18RS21 
msa25122 . 2f 100_2603 
msa25122 . 2 { 100_A909 
msa25122 . 2 { 100_CJB110 
msa25122 . 2 { 100_COH1 
msa25122 . 2 { 100__JM9130013 
msa25122 . 2 { 100_M732 
msa2S122 . 2 { 100_M781 
Consensus 



151 

DKPKKPYKYD 
DKPKKPYKYD 
DKPKKPYKYD 
DKPKKPYKYD 
DKPKKPYKYD 
DKPKKPYKYD 
DKPKKPYKYD 
DKPKKPYKYD 
DKPKKPYKYD 



KSYYIKKYGS 
KSYYIKKYGS 
KSYYIKKYGS 
KSYYIKKYGS 
KSYYIKKYGS 
KSYYIKKYGS 
KSYYIKKYGS 
KSYYIKKYGS 
KSYYIKKYGS 



DIHYGDSDDD 
DIHYGDSDDD 
DIHYGDSDDD 
DIHYGDSDDD 
DIHYGDSDDD 
DIHYGDSDDD 
DIHYGDSDDD 
DIHYGDSDDD 
DIHYGDSDDD 



IHAARBAGAR 
IHAAREAGAR 
IHAARBAGAR 
IHAAREAGAR 
IHAARBAGAR 
IHAAREAGAR 
IHAAREAGAR 
IHAAREAGAR 
IHAAREAGAR 



200 

PIRILRAPNS 
PIRILRAPNS 
PIRILRAPNS 
PIRILRAPNS 
PIRILRAPNS 
PIRILRAPNS 
PIRILRAPNS 
PIRILRAPNS 
PIRILRAPNS 



msa25122 . 2 { 100_090 
msa25122 . 2 { 100_18RS21 
rasa25122 . 2 { 100_2603 
msa25122 . 2 { 100_A909 
msa2 5122 . 2 { 100_CJB110 
msa25122 . 2 { 100_COH1 
rasa25122.2{lOO_JM9130013 
msa25122 . 2 f 100J4732 
msa25122 . 2 {100_M781 
Consensus 



201 

TNLPLPEAGG 
TNLPLPEAGG 
TNLPLPEAGG 
TNLPLPEAGG 
TNLPLPEAGG 
TNLPLPEAGG 
TNLPLPEAGG 
TNLPLPEAGG 
TNLPLPEAGG 
********** 



221 

YGEEVLENSA Y 
YGEEVLENSA Y 
YGEEVLENSA Y 
YGEEVLENSA Y 
YGEEVLENSA Y 
YGEEVLENSA Y 
YGEEVLENSA Y 
YGEEVLENSA Y 
YGEEVLENSA Y 
********** * 
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Table 41: Comparative Sequences relating to SAG0649 



SBQ ID HO. 4101 1 SAG0649 FROM 2603 V/R GBS TYPE V STRAIN 
ATGAAAAAGAGACAAAAAATA 

TGGAGAGGGTTATCAGTTACTTTACTAATCCTGTCCCAAAT^ 

CAAGGTGAAACCCAAGATACCAATCAAG CACITGGAAAAGTAATTGTTAAAAAAACGGGA 
GACAATG CT ACACCATTAGG CAAAG CX1ACTTTTGTGTTAAAAAATGACAATGATAAGTCA 
. GAAACAAGTCACGAAACGGTAGAGGGTTCTCGAGAAGCAACCTIT^ 
GGAGACTACACATTAAGAGAAGAAAC^GCACCAATTGGTTATAAAAAAACTGA 
TGGAAAGTT AAAGTTG CAG AT AACGGAG CAACAAT AATCG AGGGT ATGGATG CAGATAAA 
GC^GAGAAACGAAAAGAAGTTTTGAATGCCCAATATCCAAAATCAGCT 
ACAAAAGAAAATTAC<XIATTAG1TAATGTAGAGGGTTCG^ 
GCATTGAATCCAATAAATGGAAAAGATGGTCGAAGAGAGATTGCT^ 
AAAAAAATTACAGGGGTCAATGATCTCGATAAGAATAAATATAAAATTGAAT^ 
GAGGGTAAAACCACTGTTGAAACGAAAGAACTTAATCAACCACTAGATGTC^ 
TTAGATAATTCAAATAGTATGAATAATGAAAGAGCCAATAATTCT^ 
GCTGMSGGAAGCAGTTGAAAAGCTGATTGATAAAATTACATCAAATAAAG^ 
GCTCTTGTGACATATGCCTCAACCATTTTTGATGOT 

GTTGCCGATCAAAATGGTAAAGCGCTGAATGATAGTGTATCATGGGATTAT^ 
ACTTTTACAG C^^CTACACATAATTACAGTTATTTAAATTTAACAAATGATGCTAACGAA 
GTTAATATTCTAAAGTCAAGAATTCCAAAGGAAGCGGAGCATATAAATGGGGATCGC^ 
CTCTATCAATTTGGTGCGACATTTACTCAAAAAGCTCTAATG 

GAGACACAAAGTTCTAATG CT AGAAAAAAACTTATTTTTCACGTAACTGATGGTGTCCCT 

ACGATGTCTTATGCCATAAATTTTAATCXnTATATA 

AATTCrTTTTTAAATAAAATACCAGATAGAAGTGGTATTCTCC!AAGAGG^ 

AATGGTGATGATTATCAAATAGTAAAAGGAGATGGAGAGAGTTTTAA^ 

AGAAAAGTT C CTGTT ACTGG AGGAACG ACACAAG CAGCTT AT CGAGT AC CGCAAAAT CAA 

CTCTCTGTAATGAGTAATGAGGGATATGCAATTAATAGTXSGATATATT^ 

AGAGATTACAACTGGGTCTATCCATTTGATCXrrAAGA 

CAAATCAAAACTCATGGTGAGCCAACAACyVTTATACTTTAATXMAA^ 

GGTTATGACATTTTTACTGTTGGGATTGGTG^ 

GAAGCTGAGAAATTTATGCAATCAATATCAAGTAAAACAGAAAAT^ 

GATACAAAT AAAATTTATGATGAG CTAAATAAATACITTAAAAGAATTGTTGAG GAAAAA 

CAT*rCTATTGTTGATGGAAATGTGACTGATCCTAT13G^ 

AAAAATGCTCAAAGTTTTACACATGATGATTAOGTT^^ 

TTAAAAAATGK3TGTGGL?lVi u lGGTG 

ACAGTGACTTATGATAAGACATCrcAAACCATCAAAAT^ 

GGACAAAAAGTAGTTCTTACCTATGATCTACGTTTAAAAGATAACTATATAW 

TTTTAC^TACAAATAATCGTACAACGCTAAGTCCGAAGAGTGAAAAAGAACCA 

ATTCGTGATTTCCCIAATrCCCAAA 

AGTAATCAGAAGAAAATGGGTGAGGTTGAATTTATTAAAGTTA^ 

GAATCGCTT^TTGGGAGCTAAGTTTGAACTT 

CAATTTGTTC CAGAGGGAAGTGATGTT ACAA.CAAAGAAT 

G CACTT CAAG ATGGTAACT AT AAATTAT ATGAAATTT CAAGT CCAGATGG CTAT AT AGAG 
GTTAAAACGAAACCIGTTGTCACATTTACA^ 

GCAGATCCAAATGCTAATAAAAATCAAATCGGGTATCTTGAAGGAAATGGTAAACATCT^ 
ATTACCAACACTCCCAAACG CCCACCAGGTGTTTTTGCTAAAACAGGGGGAATTXjGTACA 
ATTGTCTATATATTAGTTGGTTCTACTTTTATGATACTTACGAT^ 
AAACAATTG 



SBQ ID NO. 4102: SAG0649 FROM 090 GBS TYPE In STRAIN 

GGTGAAACCCAAGATACCAATCAAG CACTTGGAAAAG 

TAATTGTTAAAAAAACGGGAGACAATGCTACACGATTAGGCAAAGCGACT 

'l-riXjlXjrrAAAAAATGACAATGATAAGTCAGAAACAAGTCACGAAACGGT 

AGAGGGTTCTGGAGAAGCAAOTTTGAAAACATAAAAC^ 

CATTAAGAGAAGAAACAGCACCAATTGGTTATAAAAAAACTGATAAAACC 

TGGAAAGTTAAAGTTGCAGATAACGGAGCAACAATAATCGAGGGTATGGA 

TGCAGATAAAGC^^GAAACGAAAAGAAGTTTTGAATGCGCAATATCCAA 

AATCAGCTATTTATGAGGATACAAAAGAAAATTACCCATTAGTrAATGTA 

GAGGGTTCCAAAGTTGGTG AACAAT ACAAAG CATTGAATCCAATAAATGG 

AAAAGATGGTCGAAGAGAGATTG CTGAAGGTTGGTTATCAAAAAAAATT A 

CAGGGGTCAATGATCTCGATAAGAATAAATATAAAATTGAATTAACTGTT 

GAGGGTAAAACCACTGTTGAAACGAAAGAACTTAATCAACCACTAGATGT 

CGTTGTG CTATTAGATAATTCAAATAGTATGAATAATGAAAGAGCCAATA 

ATTCTCAAAGAGCATTAAAAGCTGGGGAAGC^TrT^ 

AAAATTACATCAAATAAAGACAATAGAGTAGCTGrrTGTGACATATGCCTC 

AA CCATTTTTGATGGT ACTG AAGCG ACCGT AT CAAAGGG AGTTG CCGATC 

AAAATGGTAAAG CG CTGAATGATAGTGTATCATGGGATTATCATAAAACT 

ACTTITACAGCAACriACACATAATTACAGTTATT^ 

TGCTAACX3AAGTTAATATTCTAAAGTCAAGAATTCCAAAGGAAGCGGAGC 

ATATAAATGGGGATCGCACGCTCTATCAATTTGGTGCGACATT^A 

AAAGCTCTAATQAAAGCAAATGAAATTTTAGAGACACAAAGTTCTAATG 

TAGAAAAAAACTTATTTTTCACGTAACTGATGGTGTCCCT 

A3X3CCATAAATTTTAATCCTTATATATCAACATCTTACCAAAA 

AATTCTTTTTTAAATAAAATACCAGATAGAAGTGGTATTCTCCAAGAGGA 

TTTTATAATCAATGGTX^TGATTATCAAATAGTAAAAG 

GTTTTAAACrrGTTTTCGGAT AGAAAAGTTC CTGTT ACTGG AG GAACGACA 

CAAGCAGCTTATCGAGTACCGCAAAATCAACTCTCTGTAATGAGTAATGA 

GGGATATGCAATTAATAGTGGATATATTTaTCTCTATTGGAGAGATTACA 

ACTGGGTCTATCCATTTGATCCIAAGACAAAGAAAGTTTCTC 

CAAATCAAAACT CATGGTGAGCX^CAACATTATACTTTAATGGAAATAT 

AAGACCTAAAGGTTATGACATTTTTACTGTTGGGATTGG 

ATCCTGGTCCAACTCCTCTTGAAGCTGAGAAATTC 

AGTAAAACAOAAAATTATACTAATGTTGATGATACAAATAAAATTTATGA 
TGAGCTAAATAAATACTTTAAAACAATTGTTGAGGAAAA^ 
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TTGATGGAAATGTGACTGATCCTATGGGAGAGATGATTG^^ 
AAAAATGGTCAAAGTTTTACACATGATGM^CXS tTTTQG tTGGAAATGA 

GGGGAATTTTAAAAGATGTTACAGTGACT^ 

ATCAAAATCAATCATTTGAACTrAGGAAGTGGACAAAAAGTAGTTC^ 
CTATGATGTACGTTTAAAAGATAACTATATAACT 

CAAATAATCGTACAACXSCTAAOTCCGAAGAiGTGAAAAAGAACCAAATACT 

ATTCGTGATTTCCCAATTCCCAAAATTCGTGATC 

ACTAACCATCAGTAATCAGAAGAAAA TGGGT GAGGTT^ 

TTAATAAAGACAAACATTCAGAATCGCTTTT^ 

CAGATAGAAAAAGATTTTTCTCGCTATAAGCAATT 

TGATGTTACAACAAAGAATGATGGTAAAATTTA^ 

ATGGTAACTATAAATTATATGAAATTTCAAGTCCAGATGGCTATATAGAG 

GTTAAAACGAAACCTGTTGTGACATTTACAATTCAAAAT^^ 

GAACCTGAAAGCAGATCCAAATGCTAATAAAAATaU^TCGG 

AAGGAAATGGTAAACATCTTATTACCAACACTCCCAAACGCCCACCAGGT 

GTT 

SBQ ID NO. 4103: SAG0649 PROM A909 GBS TYPE la STRAIN 

GGTGAAACCCAAGATACCAATCAAGCACTTGGAAAA 

GTAATTGTTAAAAAAACGGGGGACAATGCTACACCATTAGGCAAAGCGAC 

TTTTGTGTTAAAAAATGACAATGATAAGTCAgAAAC 

TAGAGGGTT CTGGAG AAgCAACCHTTGAAAACAT AAAACCTG GAGACTAC 

ACATTAAGAGAAGAAACAGCACCAATTGGTTATAAAAAAACTGATAAAAC 

CTGGAAAGTTAAAGTTCCAGATAACGGAGCAACAATAATCGAGGGTATG^ 

ATGCAGATAAAGCAGAGAAACGAAAAGAA.GTTTTGAATGCCC?^TATCCA 

AAATCAG CTATTTATGAGGATACAAAAGAAAATTACCCATTAgTTAATGT 

AGAGGGTTCCAAAGTTGGTGAACAATACAAAGCATTGA^ 

GAAAAGATGGTCGAAGAGAGATTG CTGAAGGTTGGTTATCAAAAAAAATT 

ACAGGGGTCAATGATCTCX^TAAGAATAAATATAAAATTGAATTAA 

TGAGGGTAAAACCACTGTTGAAACGAAAGAACTTAATCAACCACT 

TCGTTGTGCTATTAGATAATTCAAATAGTATGAA 

AATTCTCAAAGAGCATTAAAAGCTGGGGAAGCAGTTGA 

TAAAATTACATCAAATAAAGACAATAGAGTAGCTCITGTGACATATC 

CAACCATTTTTGATGGTACTGAAGCX^CCGTATCA^ CCGAT 

CAAAATGGTAAAGCGCTGAATGATAGTGTATCATGGGATTATCATAAAAC 

TACTTTTACAGCAACTACACATAATTAC3\GTTA 

ATGCTAACGAAGTTAATATTCTAAAGTCAAGAATC^ 

CATAT AAATGGGGATCXa CACG CTCTATCAATTTGGTG CGACATTTACTCA 

AAAAGCTCTAATGAAAGCAAATGAAATTTTAGAGACACAAAGTTC^ 

CTAGAAAAAAACTTATTTTTCACX^AACrGATGGTGT 

TATGCCATAAATTTTAATCCTTATATATCAAC^^ 

TAATTCTTTTTTAAATAAAATACCAGATAGAAGTGGTATTCT 

ATTTTATAATCAATGGTGATGATTATCAAATAGT^ 

AGTTTTAAACTGTTTTCGGATAGAAAAGTTCCTGT^ 

ACAAGCAGCTTATCX3AGTACCGCAAAATCAACTCT 

AGGGATATGCAATTAATAGTGGATATATTTATCTCTATTGGAGAGATTAC 
AACTGGGTCTATCCATTTGATCCTAAGAC^ 

ACAAATCAAAACTCATGGTGAGCCAACAACATTATACTTTAATG^ 

TAAGACCTAAAGGTTATGACATTTTTACT^ 

GATCCTGGTGCAACTCCTKrrTGAAGCrrGAGAAAT^ 

AAGTAAAACAGAAAATTATACTAATGTTGATGATACAAATAAAATTTATG 

ATGAGCTAAATAAATACTTTAAAACAATTGTTGAGGAAAA^ 

GTTGATGGAAATGTGACTGATCCrATGGGA 

AAAAAATGGTCAAAGTTTT ACACATGATGATT ACG t TTTGG t TGGAAATG 

At GGCAGTCAATTAAAAAATGGTGTGGCrrCTTGGTGGACG 

GGGGGAATTTTAAAAGATGTTACAGTGACTTATGATAAG 

CATCAAAATCAATCATTTQAACrriAGGAAQTG^ 

CXrTATGATGTACGTTTAAAAGATAACTATATAAGTAACAAATTTTA 

ACAAATAATCGTACAACGCTAAGTCQ3AAGAGTQAAAAAG 

TATTCGTGATTTCCCAATTCCCAAAATTCGTGATGTTOGT^ 

TACTAACCATCAGTAATCAGAAGAAAATGGGTGAGGTTGAATTTA 

GTTAATAAAGACAAACATTOVGAATCGCTTTTO 

TCAGATAGAAAAAGATTTTTCTGGGTATAAGCAATTTGTT 

GTGATGTTACAACAAAGAATGATGGTAAAATTTATTTTAA^ 

GATGGTAACTATAAATTATATGAAATTTCAAGTCCAGATGGCT^ 

GGTTAAAACGAAACCTCTTGTGACATTTA 

CGAACCTGAAAG CAGATCX1AAATGCTAATAAAAATCAAATCGGGTATCTT 

GAAGGAAATGGTAAACATCTTATTACCAACACTCCCAA^ 

TGTT 

SBQ ID NO. 4104i SAG0649 FROM 18RS21 GBS TYPE II STRAIN 

GGTGAAACCCAAGATACCAATCAAGCAC 

TTGGAAAAGTAATTGTTAAAAAAACGGGAGACAaTGC^ 

AAAGCGACTTTTGTGTTAAAAAATGACAATGA 

CGAAACGGTAGAGGGTTCTGGAGAAgCAACCTTT^ 

GAGACTACACATTAAGAGAAGAAACAGCACCAATTGGTT 

GATAAAACCTKX1AAAGTTAAAGTTGCAGATAACGG 

GGGTATGGATGCAGATAAAGCAGAGAAACGAAaAGAAGTTTTGA 

AATATCCAAAATCAGCTATTTATGAGGATACAAAAGAAAATTACCCATTA 

GTTAATGTAGAGGGTTCCAAAGTTGGTGAACAATACA^ 

AATAAATGGAAAAGATGGTCGAAGAGAGATTGCTGAAGGTTG 

AAAAAATTa CaGGGGTCAATGATCTCGAT AAGAATAAATATAAARTTGAA 
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TTAACTGTTGAGGXaTAAAACCACTO 

ACTAGATGTCGTTGTGCTATTAGATAATTCAAATA^ 

GAGCCAATAATTCTCAAAGAGCATTAAAAG CTGGGGAAGCAGTTGAAAAG 

CTGATTGATAAAATTACATCAAATAAAGACAATAGAGTAGCTCTTGTGAC 

ATATGCCTCAACCATTTTTGATGGTACTGAAG CGACCGTATCAAAGGGAG 

TIGCCGATCAAAATGGTAAAGCGCTGAATGATAGTGTATCATGGGATTAT 

CATAAAACTACTTTTACAGCAACTACACATAAT^ 

AACAAATGATGCTAAGGAAGTTAATATTCTAAAGTCAAGAATTCCAAAGG 
AAGCGGAGCATATAAATGGGGATCGCACGC1CTATCAATTTGGTGCGACA 
TTTACTCAAAAAGCTCTAATGAAAGCAAATGAAATTTTAG 
TTCTAATGCTAGAAAAAAACirATTTTTCACGTAACTGA 

AACXIA G'lU ' r AA TlVlVlTlTA AATAAAATACCAGATAGAAGTGGTATTCT 

CCAAGAGGA l ' lTrA TAATCAATGGTGATGATTATCAAATAGTAAAAGGAO 

A3X3GAGAGAGTITTAAACIGTITTCGGATAGAAA 

GGAACGACACAAG CAGCITATCGAGTACGGCAAAATC^^ 

GAGTAATGAGGGATATGCAATTAATAGTGGATATATTTATCTCTATTGGA 

GAGATTACAACIGGGTCTATCCATTTGATCCTAAGACAAAGAA^ 

GCAACCAAACAAATCAAAACTCATGGTG AGCCAA CA 

TGGAAATATAAGACCTAARGGTTATGACATTrT^ 

TAAACGGAGATCCTGGTG CAACTCL'l'Cl'lXSAAGCTGAGAAATTTATGCAA 

TC^TATCAAGTAAAACAGAAAATTATACTAATGTTGATGATACAAATAA 

AATTTATGATGAGCTAAATAAATACTTTAAAACAATrG^ 

ATTCTATTGTTGATGGAAATGTGACTGATCCTATGGGAGAGA 

TTCCAATTAAAAAATGGTCAAAGTTTTACACATGATGATTACvri-i-i iGGT 

TGGAAATGATGGCAGTCAATTAAAAAATGGTGTGGCTCTTGGT^ 

ACAGTGATGGGGGAATTTTAAAAGATGTTACAGTGACT^ 

TCTCAAACCATCAAAAT CAATCATTTGAACI^AGGAAGTGGACATUUUVGT 

AGTTCTTACCTATGATGTACGTTTAAAAGATAACTATATAAGTAACAAAT 

TTTACAATACAAAT AATCGTACAACG CTAAGTCCGAAGAGTGAAAAAGAA 

CCAAATACTAT t cG t gATT t CCCAATTCCCAAAATTCGTGATGTTCGTGA 

GTTTCCX^^ACTAACCATCAGTAATCAGAAGAAAATGGGTGAGGTTGAAT 

TTATTAAAGTTAATAAAGACAAACATTCAGAATCGurx-i-iGGGAGCTA^ 

TTTCAACTTCAGATAGAAAAAGATTTTTCTGGGTATAAG 

AGAGGGAAGTGATGTTACAACAAAGAATGATGGTAAAATTTA^ 

CACTTCAAGATGGT AACTATAAATTATATGAAATTTCAAGTCCAGATGG C 

TATATAGAGGTTAAAACGAAACCTGTTGTGACATTTACAAT^ 

AGAAGTTACX^CCTGAAAGCAGATCCAAATGCTAATAAAAATCAAATCG 

GGTATCTTGAAGGAAATGGTAAACATCrrTATTACCAACACTCCCAAACGC 

CCACCAGGTGTT 

SEQ ZD NO. 4105: SAGO 649 FROM M732 GBS TYPE III STRAIN 



TGGAAAAGTAATTGTTAAAAAAACGGGAGACAaTGCTACACCATTAGGCA 

AAGCGAC^TTIGTGTTAAAAAATGACAATGATAAGTCAGAAACAAGTCAC 

GAAACGGTAGAGGGTTCTGGAGAAGCAACCTTTGAAAACATAAAAC^ 

AGACT ACACATTAAG AGAAGAAACAG CACCAATTGGTTATAAAAAAACTG 

ATAAAACCTGGAAAGTTAAAGTTGCAGATAACGGAGCAACAATAATCGAG 

GGTATGG ATG CAGATAAAG CAG AGAAACGAAAAGAAGTTTTGAATGCCCA 

ATATCCAAAATCAGCTATTTATGAGGATACAAAAGAAAATTACXZCATTAg 

TTAATGTAGAGGGTTCCAAAGTTGGTGAACAATACAAAG CATTGAATCCA 

AT AAATGGAAAAGATGGT CGAAGAGAGATTG CTG AAGGTTGG TT ATCAAA 

AAAAAaTaC^GGGGTCAATGATCTCGATAAGAATAAATATAAAATTGAAT 

TAACTGTTGAGGGTAAAACCACTGTTGAAACGAAAGAACTTAATCAACCA 

CrAGATGTCGTTGTGCTATTAGATAATTCAAATA^ 

AGCGAATAATTCTGAAAGAGCATTAAAaGCTGGGGAAGCAGTTC 

TGATTGATAAAATTACATCAAATAAAGACAATAGAGTA^ 

TATGCCTCAACGATTTTTGATGGTACTX2AAGCGAC 

TGCCQATCAAAATGGTAAAGCGCTGAATGATAGTGTATCATGGGATTATC 

ATAAAACTACTTTTACAGCAACTACACATAATTACAGTTATITAAATTTA 

ACAAATGATG CTAACGAAGTTAATATTCTAAAGTCAAGAATTCCAAAGGA 

AGCX3GAGCATATAAATGGGGATCGCACX3CTCrATCAATTTGGTGCGACAT 

TTACTCAAAAAGCTCTAATGAAAGCAAATGAAATTTTAGAGACACAAAGT 

TCTAATGCTAGAAAAAAACTrATTTTTCACXjrAACTGATGGT 

GATGTCTTATGCX^TAAATTTTAATCCTTATATATCAACATC^ACX^^ 

ACCAGTTTAATTCTTTTTTAAATAAAATACCAGATAGAAGTG 

CAAGAGGATTTTATAATCAATGGTGATGATTATCAAATAGTAAAAGGAGA 

TGGAGAGAG TlTrA AAC lGlT l T CGGATAGAAAAGTTCCIGTrACTGQAG 

GAACGAGACAAGCAG CTTATCGAGTACCGCAAAAT CAACTCTCTGTAATG 

AGTAATGAGGGATATGCAATTAATAGTGGATATATTTATCTCTATTGGAG 

AGATTACAACTGGGTCTATCCATTTGATCXTrAAGAC 

CAACQAAACAAATCAAARCTCATGGTGAGCCAACAACATTATACTTTAAT 

GGAAATATAAGACCTAAAGGTTATGACAl-i-lu-AAC^\i-l-lGGGATTGGTGT 

AAACGGAGATCCTGGTGCAACTCCTCTTGAAGGTGAGAAATTTTAT^ 

CAATATCAAGTAAAACAGAAAATTATACTAATGTTGATGATACAAATAAA 

ATTTATGATGAGCTAAATAAATACTTTAAAACAATTGTTGAGGAAAAACA 

TTCTATTGTTGATGGAAATGTGACTGATCCTAT^ 

TCCAATTAAAAAATGGTCAAAGTTTTACACATGATGATTAOG tTTTGG tT 

GGAAATGAtGGCAGTCAATTAAAAAATGGTGTGGCTCTT^ 

CAGTGATGGGGGAATTTTAAAAGATGTTAGAGTGACTTA^ 

CTCAAACCATCAAAATCAATCATTTGAACrTAGGAAGTGGACAAAAAGTA 

GTTCTTACCTATGATGTACGTTTAAAAGATAACTATATAAGTAACAAATT 

TT ACAATAGAAATAATCGT ACAa CG CTAAGTCCGAAGAGTGAAAAAGAAC 
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CAAATACTATTCGTGATTTCCCftATTCCCA^ 

TTTCCGGTACTAACCATCAGTAATCAGAAGA?VAATGGGTGAGGTTGA^ 

TATTAAAGTTAATAAAGACAAACATTCAGAATOGCnTO 

TTCAACTTCAGATAGAAAAAGATTTTTCTGGGTATAAGCAA^ 

GAGGGAAGTGATGTTACAACAAAGAATGATGGTAAAATTTATTTT AAAG C 

ACTTCAAGATGCTAACTATAAATTATATGAAA 

ATATAGAGGTTAAAACBAAACCTGTTGTG^ 

GAAGTTACG AACCTGAAAG CAGATCCAAATG CTAATAAAAATCAAATCGG 

GTATCTTCAAGGAAATGGTAAACATCrrATTACCAA 

CACCAGGTGTT 

SEQ ID HO. 4106 1 SAGO 649 FROM COHL GBS TYPE IZZ STRAIN 

GGTGAAACGCAAGATACCAATCAAGCACTTGGAAAAG 
TAATTGTTAAAAAAACGGGAGACAaTGCTACACCATTAG<3CAAAGC^ 
TTTGTGTTAAAAAATGAjCAATGATAAGTCA 
AGAGGGTTCTCGArAAGCAAOTTTGAAAACA^ 

C^TTAAGAGAAGAAACAGCACCAATTGGTTATAAAAAAACTGATAAAACC 

TGGAAAGTTAAAGTTGCAG ATAACGGAG CAACAATAATCGAGGGTATGG A 

TGCAGATAAAGCAGAGAAACGAAAAGAAGTTTTGAATGCCCAATATC 

AATCAGCTATTTATGAGGATACAAAAGAAAATTACCCATTAgTTAATGTA 

GAGGGTTCCAAAGTTGGTGAACAATaCAAAGCATTGAATCCAATAAATGG 

AAAAGATG6TOGAAGAGAGATTGCTGAAGGTTGGTTATCAAA 

CAGGGGTCAATGATCTC3ATAAGAATAAATATAAAATTGAATTAACTGTT 

GAGGGTAAAACCACTGTTGAAACGAAAGAACTTAATCAACCACTAGATGT 

CGTTGTGCTATTAGATAATTCAAATAGTATGAATAATGAAAGAGCCAATA 

ATTCTCAAAGAGCATTAAAAGCTQ3GGAAGCAGTTGAAA 

AAAATTACATC7VAATAAAGACAATAGAGTAGCTCTTGTGACATATGCCTC 

AACCATTTTTGATGGTACTGAAGCGACCGTATCAAA 

AAAATGGTAAAG CGCTGAATGATAGTGTATCATGGGATTATCATAAAACT 

ACTTTTACAGCAACTACACATAATTACAGTTATTTAAATTT^ 

TGCTAACGAAGTTAATATTCrrAAAGTCAAGAATTCCAAAGGAAG CGGAG C 

ATATAAATGGGGATCGCACGCTCTATCAATTTGGTGCG 

AAAGCTCTAATGAAAGCAAATGAAATITTAGAGACACAAAGTTCT 

TAGAAAAAAACTTATTTTTCACGTAACTGATGGTGTCCXrrACGATGT^ 

ATGCCATAAATTTTAATCCTTATATATCAACATCTTACCAAAACCAGTTT 

AATTCriTl^ M iAAATAAAATACCAGATAGAAGTGGTATTCTCCAAGAGGA 

TTTTATAATCAATGGTGATGATTATCAAATAGTAAAAGGAGATGGAGAGA 

GTTTTAAACTGTTTTCXaGATAGAAAAGTTCCTGTTAC^ 

CAAGCAG CTTATCGAGTACCG CAAAATCAACTCTCTGTAATGAGTAATGA 

GGGATATGCAATTAATAGTGGATATATTTATCTCTATTGGAGAGATTAC^ 

ACTGGGTCTATCCATTTGATCCTAAGACAAAGAAA^ 

CAAATCAAAACTCATGGTGAGCCAACAACATTATACTrTTAA 

AAGACCTAAAGGTTATGACATTTTTACT^^ 

ATCCTGGnXSCAACTCCTCITGAAGCTGAGAAATT^ 

AGTAAAACAGAAAATTATACTAATGTTGATGATACAAATAAAATTTATGA 
TGAG CTAAATAAATACTTTAAAACAATTGTTGAGGAAAAACATTCTATTG 
TTGATGGAAATGTGACTGATCCTATGGGAGAGATGATTGAAT^ 
AAAAATGGTCAAAGTTTTACACATGATGA 
TGGCAGTOUITTAAAAAATGGTGTGGCTCTTGGTG 

GGGGAATTTTAAAAGATGTTACAGTGAC7ITATGATAAGACATCTCAAACC 
. ATCAAAATCAATCATTTG AACTTAGGAAGTGGACAAA 
CTATGATGTACGTITAAAAGATAACTATATAAGTAACAAATTTTACAATA 
CAAATAATCGTACAACGCTAAGTCCGAAGAGTGAAAAAGAACCAAATACT 
ATTCGTGATTTCCGAATTCCXAAAATTCGTGATG 
ACTAACX^TCAGTAATCAGAAGAAAATGGGTGAGGTTGAATTT^ 
TTAATAAAG ACAAACATTCAgAATCG CTTTTG GG AGCTAAGTTTCAACTT 
CAGATAGAAAAAGA1"I*I"1U'CTGGGTATAAGCAATTTGTTCCAGAGGGAAG 
TGATGTTACAACAAAGAATGATGGTAAAATTTATTTTAAAGCACTT^ 
ATGGTAACTATAAATTATATGAAATTTCAAGTCCAgATGG CTATATAGAG 
GTTAAAACGAAACCTGTTGTGACATTTACAATTCA 
GAACCTGAAAGCAGATCCAAATGCTAATAAAAATGAAATCGGGTAT^ 
AAGGAAATGGTAAACATCTTATTACCAACACTCCCAAACGCCCACCAGGT 
GTT 

SEQ ID NO. 4107 1 SA60649 FROM M781 GBS TYPE III STRAIN 

TTGGAAAACTAATTGTTAAAAAAACGGGAGACACTGCTACA 

AAAGCGACTTTTGTGTTAAAAAATGACAATGATAACT 

CGAAACGGTAGAGGGTTCTGGAAAAGCAACCTTTGAAAACATAAAACCTG 

GAGACTACACATTAAGAGAAGAAACAGCACCAATTGGTTATAAAAAAACT 

GATAAAACXTGGAAAGTTAAAGlTGCAGATAAOGGAGCAm 

GGGT ATGGATGCAGATAAAG CAGAG AAACX3 AAAAGAAGTTTTGAATG CC C 

AATATCCAAAATCAGCTATTTATGAGGATACAAA^ 

gTTAATGTAGAGGGTTCCAAAGTTGGTG^ 

AATAAATGGAAAAGATGGTCgAAGAGAGATTGCraAA^ 

AAAAAATTACaGGGGTCAATGATCTCGATAAGAATAAATATAAAATTGAA 

TTAACTGTTGAGGGTAAAACCACTGTTGAAACgAAAGAACTTAAT^ 

ACTAGATGTCGTTGTGCTATTAGATAATTCAAATAGTATGAATAATGAAA 

GAGCCAATAATTCTCAAAGAGCATTAAAAGCTGGGGAAGC7VGTTGAA 

CTGATTGATAAAA TTACAT CAAATAAAGACAATAGAGTAGG'l'C'l'l'G'l'GAC 

ATATG CCTCAACCAlTl"i L lGATGK3TACTGAAGC^ACCGTATCAAAGGGAG 

TTGCCGATCAAAATGgTAAAGCGCTQAATGATAGTO 

CATAAAACTACTTTTACAGCAACrACACATAATTACAGTTATTTAAAT^ 

AACAAATGATGCTAACXIAAGTTAATATTCTAAAGTCAAGAATTC^ • 
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AAGCGGAGCATATAAATGGGGATCGCA.CGCTCTATCAATTTGGTC 
TTTACTCAAAAAG CTCTAATGAAAG CAAATGAAATITT AGAGACACAAAG 
TTCTAATGCTAGAAAAAAACTTATTTTTCAOGTAAC^ 
OCSATGTCTTATGCCATAAATTTTAATCCTTArAT^ 

AACCAGTTTAAlTL"l'l"l"l"rrAAATAAAATACGAGATAGAAGTGGTAiu\jr 

CCAAGAGGATTTTATAATCAATGGTGATGATTATCAAATA 

ATGGAGAGAGTTTTAAACTGTTTTCXSGATAGAAAAGflTC 

GGAACGACACAAGCAGCTTATCGACTACCGCAAAATCAACTCT^ 

GAGTAATGAGGGATATGCAATTAATAGTGGATATATTTATCTCT 

GAGATTACAACTGGGTCTATCCATTTGATCCTAAGAC^ 

GCAACXSAAACAAATCAAAACTCATGGTGAGCCAACAAC^ 

TGGAAATATAAGACCTAAAGGTTATGACATTTTTACT^ 

TAAA0GGAGATCCTGG7GCAACTCCrCTTGAAGCTGAG 

TCAATATCAAGTAAAACAGAAAAT TATA CTAATGTTGA^ 

AATTTATGATGAG CTAAATAAATA CTTTAAAACAATTGTTGAGGAAAAAC 

ATTCTATTGTTGATGGAAATGTGACTGATCCTATGGGAGAG 

TTCCAATTAAAAAATGGTCAAAGTTTTACACATGA^ 

TGGAAATGATGGCAGTCAATTAAAAAATGGTGra 

ACAGTGATGGGGGAATTTTAAAAGATGTTACAGTGACTTATGATAAGACA 
TCTCAAACCATCAAAATCAA TCAT TT^ 

AGTTCTTAC CTATGATGTACGTTTAAAAGATAACTATATAAGTAACAAAT 

TTTACAATACAAATAATCGTACAACGCTAAGTCXX3AAGAGTGAAAAAGAA 

CCAAATACTATTCXSTGATTTCCCAATTCCCAAAATTCGTG^ 

G"iU'l'CCX3GTACTAAC<^TCAGTAATCAGAAGAAAATG<X3TGAGGTTGAA^ 

TTATTAAAGTTAATAAAGACAAACATTCAGtfATOGCTT^ 

TTTCAACTTCAGATAGAAAAAGATTTTTCTGGXTTATAA 

AGAGGGAAGTGATGTTACAACAAAGAATGATGGTAAAATTTATTTTAAAG 

CACTTCAAGATGGTAACTATAAATTATATGAAATTTCAAGTCCAGATGGC 

TATATAGAGGTTAAAACGAAACCTG1TGTGACATTTACM1TCAAAATGG 

AGAAGTTACGAAXXTGAAAGCAGATCCAAATGCTAATAAAAATCAAATCG 

GGTATCTTGAAGGAAATGGTAAACATCTTATTACCAACACTCCCAAACGC 

CCACCAGGTGTT 

SEQ ZD NO. 4108: SAGO 64 9 FROM COB GBS NONTYPEABLE STRAIN 

GGTGAAACCCAAGATACCAATCAAGCACTTGGAAAAGT 
AATTGTTAAAAAAACGGGAGACAaTGCTACACCATT^ 
TTGTG^AAAAAATGACAATGATAAGTCAGAAACAAGTCACGAAACGGTA ' 
GAGGGTTCTGGArAAGCAACCTTTGAAAACATAAAACCTGGAGACTAC^ 
. ATTAAGAGAAGAAACAGCACCAATTGGTTATAAAAAAACTGATAAAACCT 
GGAAAGTTAAAGTrcCAGATAACGGAGCAACAATAATCGAGGGTATGGAT 
GCAGATAAAGCAGAGAAACGAAAAGAAGflTTIGAATGCCCAATATCCAAA 
ATCAGCTATTTATGAGGATACAAAAGAAAATTAC<XZATTAgTrAATGTAG 
AGGGTTCCAAAGTTGGTGAACAATACAAAGCATTGAATCCAAT 
AAAGATGGTCGAAGAGAGATTG CTGAAGGTTGGTTATCAAAAAAAATTAC 
aGGGGTCAATGATCTCGATAAGAATAAATATAAAATTGAATTAACTGTTG 
AGGGTAAAACCACTGTTGAAACGAAAGAACTTAATCT^CCACTAGATGTC 
GTTGTG<rrATTAgATAATrcAAATAGn?ATGAATAATGAAAGAGCCAATAA 
TTCTCAAAGAGCATTAAAAGCIXX3GGAAGCAGTTGAAAAGCTGA 
AAATTACATCAAATAAAGACAATAGAGTAGCTCTTGTGACATATGCCTCA 
AC<^TTTTTGATGGTACTGAAGCGACCGTATCAAAGGG^ 
AAATGGTAAAGCGCTGAATGATAGTGTATCATGGGATT^ 
CTTTTACAGCAACTACACATAATTACAGTT^ 

GCTAACGAAGTTAATATTCTAAAGTCAAGAATTCCAAAGGAAGCX3 GAG CA 

TATAAATGGGGATCGCACGCTCTATCAATTIXSGTG^ 

AAGCTCTAATGAAAGCAAATGAAATTTTAGAG 

AGAAAAAAACTTATTTTTCACGTAACTGATGGTGT 

TGCCATAAATTTTAATCCITArATATCAACATCTTACCAAA^ 

ATTCTTTTITAAATAAAATACOVGATAGAAGTGGTATTCT 

TTTATAATCAATGGTGATGATTATCAAAT AGTAAA AGG^ 

TTTTAAACTGTrTTOGGATAGAAAAGTTCCIGTr 

AAGCAGCITATCGAGTACOGCAAAATCAACTCTCIXniAA 

GGATATGCAATTAATAGTGGATATATTTATCTCTATTGGAGAGATTACAA 

CTGGGTCTATCCATTTGATCCTAAGAQ^ 

AAATCAAAACTCATGGTGAGCCAACAACATTATACTrTAATGGAAATATA 

AGACCTAAAGGTTATGAC^TTTTTACTGTTG 

TCCTGGTGCAACTCCTCTTGAAGCTGAGAAATTTATGC 

GTAAAACAGAAAATTATACTAATGTTGATGATACAAATAAAATTTATGAT 

GAGCTAAATAAATACTTTAAAACAATTGTTGAGGAAAAACATTCT 

TGATGGAAATGTGACTX1ATCCTATGGGAGAGATGATTGAA 

AAAATGGTCAAAGTTTTACACATGATGATrA 

GGCAGTCAATTAAAAAATGGTffTGGCTCrTGG^ 

GGXSAATTTTAAAAGATGTTACAGTGACTrATGAT^ 

TCAAAATCAATCATTTGAACTTAGGAAGTGGACAAAAAOTAG 

TATGATGTACGTTTAAAAGATAAGTATATAAGTAACAAATITTACAATAC 

AAATAA T CGT ACAACG CT AAGTC CG AAGAGTGAAAAAGAACCAAATACTA 

TTCGTGATTTCCCAATtCCCAAAATTCGTGATGTTC 

CTAACCATCAGTAATCAGAAGAAAATGGGTGAGGTTGAATTTATTAAAGT 

TAATAAAGACAAACATTCAGAATCG GTTTTGGGA.GCTAAGTTTCAACTTC 

AGATAGAAAAAG ATrri ' i CrGQGTATAA GCAATTTQT TCCAGAG 

GATGTTACAACAAAGAATGATGGTAAAATTTATTTTAAAGCACTTCA 

TGGTAACTATAAATTATATGAAATTTCAAGTCCAGATGGCTATATAGAGG 

TTAAAACGAAACCTGTTGTGACATTTACAATTCAaAATG 

AACCTGAAAGCAGATCCAAATG CTAATAAAAATCAAATCGGGTATCTTGA 
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AGGAAATGGTAAACATCTTATTACCAACACT 
TT 

SEQ ZD HO. 4109 1 SA60649 FROM JM9130013 GBS TYPE VZXI STRAIN 

GGTGAAACCCAAGATACCAATCAAGCACTTGGAAAAG 

TAATTGTTAAAAAAACGGGAGACAATGCTACACCATrAGG CAAAGCGACT 

TTTGTGTTAAAAAATGACAATGATAAGTCAGAAACA^ 

AG AGG GTTCT GG AGAAG CAACCTTTGAAAACATAAAACCTGGAGACT ACA 

CATTAAGAGAAGAAAC^CACCAATTGGTTATAAAAAAACTGATAAAACC 

TGGAAAGTTAAAGTTGCAGATAACGGAGCAACAATAATCGAGGGTATGGA 

TGCAGATAAAGCAGAGAAACX3AAAAGAAGTTITGAAT<^ 

AATCAGCTATTT ATG AGG AT ACAAAAG AAAATTAC CCATT AGTTA 

GAGGGTTCCAAAGTTGGTGAACAATACAAAGCATTGAAT^ 

AAAAGATGGTCGAAGAGAGATTGCIXSAAGGTTGGTTATC^AAAAAAATTA 

CAGGGGrrCAATGATCTCGATAAGAATAAATATAAAATTGAATTAACTGTT 

GAGGGTAAAACCACTGTTGAAACGAAAGAACTTAATCAACCACTAGATGT 

CGTTGTGCTATTAGATAATTGAAATAGTATX3A^ 

ATTCTCAAAGAG CATTAAAAG CTGGGG AAG CAGTTGAAAAG CTG ATTGAT 

AAAATTACATCAAATAAAGACAATAGAGTAGCTCTTGTGACATATGCCTC 

AACCATTTTTGATGGTACTOAAGC<^CCGTATCAAAG^ 

AAAATGGTAAAGCX3CK5AATGATAGTCTATCATGGGATTATCATAAAACT 

ACTTTTACAG CAACTACACATAATTACAGTTATITAAATTTAACAAATGA 

TG CTAACGAAGTTAATATTCTAAAGTCAAG AATTCCAAAGGAAG CGGAG C 

ATATAAATGGGGATCX3CACGCTCTATCAATTTGGTC 

AAAGCTCTAATGAAAGCAAATGAAATTTTAGAGACA^ 

TAGAAAAAAACTTATTTTTCACGTAACTGAT 

ATGCCATAAATTTTAATCCTTATATATCAACATCTTACCAAAACC 
AATTCTTTTTTAAATAAAATACCAGATAGAAGTGGTATTCTCCA 
TTTTAT AATCA ATGG TGATGATTATCAAATAGTAAAAGGA 
GTTTTAAACTGTTTTC13GATAGAAAAGTTCCTG 

CAAG CAG CTT AT CGAGT AC CG CAAAATCAACT CTCTGTAATG AGT AATG A 

GGGATATGCAATTAATAGTGGATATATTTATCTCTA^ 

ACTCGGTCTATCCATTTGATCXrrAAGACAAAG^ 

CAAATCAAAACTCATGGTGA G^XIAA CAACATTATACTT^ 

AAGACCTAAAGGTTATGAGATTTTTACTGTTGGGATTTC 

ATCCTGGTGCAACTCCTCTTGAAG CTGAGAAATTT ATGCAATCAATATCA 

AGTAAAACAGLAAAATTATACTAATGTTGATGATACJ^ 

TGAG CTAAATAAAT ACTTTAAAACAATTGTTGAGGAAAAACATTCTATTO 

TTXSATGGAAATGTGACTGATCCTATGGGAGAGA^ 

AAAAATGGTCAAM5TTTTACACATGATt3ATTACT 

TGGCAGT CAATTAAAAAATGGTGTGG CTCTTGGTGGACCAAACA^ 

GGGGAATTTTAAAAGATGTTACAGTGACTTATGAT^ 

ATCAAAATCAATCATTTGAACITAGGAAGTGGACAAAAACT^ 

CTATGATGTACGTITAAAAGATAACTATATAAGTAACAAATTTTACAATA 

CAAATAATCGTACAACG CTAAGTCCGAAGAGTGAAAAAGAACCAAATACT 

ATTCGTGATTTCCCAATTCCCAAAATTCXy^ 

ACTAACCATCAGTAATCAAAAGAAAATGGGTCAGGTTGAATTTA 

TTAATAAAGACAAACATTCAGAATC13CTTTTGGGAG CTAAGTTTCAACTT 

CAGATAAAAAAAGATTTTTCTGGGTATAAGCAATTTXjrTC 

TGATGTTACAACAAAGAATGATGGTAAAATTTATTT^ 

ATGGTAACTATAAATTATATGAAATTrCAAGTCX^GATGGCTATATAGAG 

GTTAAAACGAAACCTGTTGTGACATTTACAATTC^ 

GAACCTGAAAGCAGATCCAAATGCTAATAAAAATCAAATGGGCT 

AA 
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PRETTY of: /biotmp/msa 178297 . 2 {* } May 12, 2003 09»22 



msal78297 .2(104 090 
msal78297.2{l04_18RS21 
msal78297 . 2{ 104_2603 
rasal78297 . 2 { 104_CJB110 
maal78297 . 2 { 104_COH1 
tnsal78297 .2(104_M732 
msal78297.2(104_A909 
maal78297 . 2 { 104_M78 1 
msal78297 . 2 { 104_JM9130013 
Consensus 



50 



atgaaaaaga gacaaaaaat atggagaggg ttatcagtta ctttactaat 



msal78297. 2(104 090 
rasal78297.2(l04_18RS21 
msal78297.2{l04_2603 
msal78297.2(l04_CJB110 
msa!78297 . 2 ( 104_COH1 
msal78297 . 2 ( 104_M732 
rasal78297.2(104_A909 
n»al78297 . 2 { 104_M78 1 
msal782 97 . 2 { 104_JM913 0013 
Consensus 



51 100 

ggtgaa acccaagata 

. . ggtgaa acccaagata 

cctgtcccaa attccatttg gtatattggt acaaggtgaa acccaagata 

-~ — —.--ggtgaa acccaagata 

— — --—ggtgaa acccaagata 

— — — ggtgaa acccaagata 

— _ ggtgaa acccaagata 



--ggtgaa acccaagata 



msal78297 . 2 { 104_090 
msal78297 . 2 { 104_18RS2 1 
msal78297 . 2 { 104_2603 
msal78297 .2 { 104_CJB110 
rasal78297 . 2 ( 104_COH1 
msal78297 . 2 ( 104_M732 
rosal7B297 . 2( 104_A909 
msal78297.2(l04_M781 
tnsal78297.2(l04_JM9130013 
Consensus 



101 

ccaatcaagc 
ccaatcaagc 
ccaatcaagc 
ccaatcaagc 
ccaatcaagc 
ccaatcaagc 
ccaatcaagc 

ccaatcaagc 



acTTGGAAAA 
acTTGGAAAA 
acTTGGAAAA 
acTTGGAAAA 
acTTGGAAAA 
acTTGGAAAA 
acTTGGAAAA 
— TTGGAAAA 
acTTGGAAAA 



GTAATTGTTA 
GTAATTGTTA 
GTAATTGTTA 
GTAATTGTTA 
GTAATTGTTA 
GTAATTGTTA 
GTAATTGTTA 
GTAATTGTTA 
GTAATTGTTA 



AAAAAACGGG 
AAAAAACGGG 
AAAAAACGGG 
AAAAAACGGG 
AAAAAACGGG 
AAAAAACGGG 
AAAAAACGGG 
AAAAAACGGG 
AAAAAACGGG 



150 

aGACAaTGCT 
aGACAaTGCT 
aGACAaTGCT 
aGACAaTGCT 
aGACAaTGCT 
aGACAaTGCT 
gGACAaTGCT 
aGACAcTGCT 
aGACAaTGCT 



msal78297 . 2 { 104_090 J 
msal7B297 . 2 { 104_18RS21 } 
msal78297 . 2 { 104_2603 } 
msal78297 . 2 { 104_CJB110 ) 
rosal78297 . 2 { 104_COH1} 
rasal78297 . 2 { 104_M732 } 
tnsal78297. 
msal7B297 4 
rosal78297.2{l04_ 

Consensus 



151 

ACACCATTAG 
ACACCATTAG 
ACACCATTAG 
ACACCATTAG 
ACACCATTAG 
ACACCATTAG 
ACACCATTAG 
ACACCATTAG 
ACACCATTAG 



GCAAAGCGAC 
GCAAAGCGAC 
GCAAAGCGAC 
GCAAAGCGAC 
GCAAAGCGAC 
GCAAAGCGAC 
GCAAAGCGAC 
GCAAAGCGAC 
GCAAAGCGAC 



'A 

TTTTGTGTTA 
TTTTGTGTTA 
TTTTGTGTTA 
TTTTGTGTTA 
TTTTGTGTTA 

TTTTGTGTTA 
TTTTGTGTTA 



AAAAATGACA 
AAAAATGACA 
AAAAATGACA 
AAAAATGACA 
AAAAATGACA 
AAAAATGACA 
AAAAATGACA 
AAAAATGACA 
AAAAATGACA 



200 

ATGATAAGTC 
ATGATAAGTC 
ATGATAAGTC 
ATGATAAGTC 
ATGATAAGTC 
ATGATAAGTC 
ATGATAAGTC 
ATGATAAGTC 
ATGATAAGTC 



msal78297 .2(104 090 
msal78297 . 2 { 104_18RS21 
msa!78297 . 2 { 104_2603 
tnsal78297 . 2 { 104_CJB110 
msal78297 . 2{104_COH1 
nisal78297.2{l04_M732 
tnsal78297 . 2 { 104_A909 
msal78297 . 2 { 104_M781 
msal782 97 . 2 { 104_JM913 0013 
Consensus 



201 

AGAAACAAGT 
AGAAACAAGT 
AGAAACAAGT 
AGAAACAAGT 
AGAAACAAGT 
AGAAACAAGT 
AGAAACAAGT 
AGAAACAAGT 
AGAAACAAGT 



CACGAAACGG 
CACGAAACGG 
CACGAAACGG 
CACGAAACGG 
CACGAAACGG 
CACGAAACGG 
CACGAAACGG 
CACGAAACGG 
CACGAAACGG 



TAGAGGGTTC 
TAGAGGGTTC 
TAGAGGGTTC 
TAGAGGGTTC 
TAGAGGGTTC 
TAGAGGGTTC 
TAGAGGGTTC 
TAGAGGGTTC 
TAGAGGGTTC 



TGGAgAAGCA 
TGGAgAAGCA 
TGGAgAAGCA 
TGGArAAGCA 
TGGArAAGCA 
TGGAgAAGCA 
TGGAgAAGCA 
TGGAaAAGCA 
TGGAgAAGCA 



250 

ACCTTTGAAA 
AC CTTTGA AA 
ACCTTTGAAA 
ACCTTTGAAA 
ACCTTTGAAA 
ACCTTTGAAA 
ACCTTTGAAA 
ACCTTTGAAA 
ACCTTTGAAA 



msal78297 
msal78297.2{ 

maal78297 
msal78297.2{ 
msal76297. 
maal78297 
msal7B297 
msal78297 
msal78297. 2(104 



.2{104_090 
104_18RS21 
2{104_2603 
104_CJB110 
2 {104 COH1 
2(10431732 
2(104 A909 
2{104"M781 
JM9130013 
Consensus 



2S1 

ACATAAAACC 
ACATAAAACC 
ACATAAAACC 
ACATAAAACC 
ACATAAAACC 
ACATAAAACC 
ACATAAAACC 
ACATAAAACC 
ACATAAAACC 



TGGAGACTAC 
TGGAGACTAC 
TGGAGACTAC 
TGGAGACTAC 
TGGAGACTAC 
TGGAGACTAC 
TGGAGACTAC 
TGGAGACTAC 
TGGAGACTAC 



ACATTAAGAG 
ACATTAAGAG 
ACATTAAGAG 
ACATTAAGAG 
ACATTAAGAG 
ACATTAAGAG 
ACATTAAGAG 
ACATTAAGAG 
ACATTAAGAG 



AAGAAACAGC 
AAGAAACAGC 
AAGAAACAGC 
AAGAAACAGC 
AAGAAACAGC 
AAGAAACAGC 
AAGAAACAGC 
AAGAAACAGC 
AAGAAACAGC 



300 

ACCAATTGGT 
ACCAATTGGT 
ACCAATTGGT 
ACCAATTGGT 
ACCAATTGGT 
ACCAATTGGT 
ACCAATTGGT 
ACCAATTGGT 
ACCAATTGGT 



msal78297 
msal78297.2{ 

msal78297 
msal78297.2{ 

msal78297 

msal78297. 

msal78297 . 

msal78297. 



2 ( 104_090 
104_18RS21 
2(104 2603 
104_CJB110 
2(104 COH1 
2(104*"M732 
2(1043a909 
2(104 M781 



301 

TATAAAAAAA 
TATAAAAAAA 
TATAAAAAAA 
TATAAAAAAA 
TATAAAAAAA 
TATAAAAAAA 
TATAAAAAAA 
TATAAAAAAA 



CTGATAAAAC 
CTGATAAAAC 
CTGATAAAAC 
CTGATAAAAC 
CTGATAAAAC 
CTGATAAAAC 
CTGATAAAAC 
CTGATAAAAC 



CTGGAAAGTT 
CTGGAAAGTT 
CTGGAAAGTT 
CTGGAAAGTT 
CTGGAAAGTT 
CTGGAAAGTT 
CTGGAAAGTT 
CTGGAAAGTT 



AAAGTTGCAG 
AAAGTTGCAG 
AAAGTTGCAG 
AAAGTTGCAG 
AAAGTTGCAG 
AAAGTTGCAG 
AAAGTTGCAG 
AAAGTTGCAG 



350 

ATAACGGAGC 
ATAACGGAGC' 
ATAACGGAGC 
ATAACGGAGC 
ATAACGGAGC 
ATAACGGAGC 
ATAACGGAGC 
ATAACGGAGC 



737 



WO 2004/018646 



PCT/US2003/026827 



Table 41: Comparative Sequences relating to SAG0649 



msal78297 ,2{l04_JM913O013) 
Consensus 



TATAAAAAAA CTGATAAAAC CTGGAAAGTT AAAGTTGCAG ATAACGGAGC 



msal78297 .2 { 104_090 
msal78297 . 2 { 104JL8RS21 
msal78297.2{l04 2603 
msal78297.2{l04 CJB110 
msal78297 .2{l04_COHl 
msal78297 . 2 f 104_M732 
msal78297 . 2 f 104_A909 
msal78297 .2{104_M781 
msal78297 . 2 { 104_JM9130013 
**" Consensus 



351 

AaCAATAATC 
AaCAATAATC 
AaCAATAATC 
AaCAATAATC 
AaCAATAATC 
AaCAATAATC 
AaCAATAATC 
AmCAATAATC 
AaCAATAATC 



GAGGGTATGG 
GAGG6TATGG 
GAGGGTATGG 
GAGGGTATGG 
GAGGGTATGG 
GAGGGTATGG 
GAGGGTATGG 
GAGGGTATGG 
GAGGGTATGG 



ATGCAGATAA 
ATGCAGATAA 
ATGCAGATAA 
ATGCAGATAA 
ATGCAGATAA 
ATGCAGATAA 
ATGCAGATAA 
ATGCAGATAA 
ATGCAGATAA 



AGCAGAGAAA 
AGCAGAGAAA 
AGCAGAGAAA 
AGCAGAGAAA 
AGCAGAGAAA 
AGCAGAGAAA 
AGCAGAGAAA 
AGCAGAGAAA 
AGCAGAGAAA 



400 

CGAAAAGAAG 
CGAAAAGAAG 
CGAAAAGAAG 
CGAAAAGAAG 
CGAAAAGAAG 
CGAAAAGAAG 
CGAAAAGAAG 
CGAAAAGAAG 
CGAAAAGAAG 



msal78297 . 2 { 104_090 
rasal78297 . 2 { 104_18RS21 
msal78297 . 2 { 104_2603 
msal76297 . 2 { 104_CJB110 
msal78297.2(l04 COH1 
Itisal78297 . 2 { 104~M732 
rasal78297 . 2 f 104_A909 
msal78297 . 2 { 104_M781 
msal78297.2{l04_JM9130013 
Consensus 



401 

TTTTGAATGC 
TTTTGAATGC 
TTTTGAATGC 
TTTTGAATGC 
TTTTGAATGC 
TTTTGAATGC 
TTTTGAATGC 
TTTTGAATGC 
TTTTGAATGC 



CCAATATCCA 
CCAATATCCA 
CCAATATCCA 
CCAATATCCA 
CCAATATCCA 
CCAATATCCA 
CCAATATCCA 
CCAATATCCA 
CCAATATCCA 



AAATCAGCTA 
AAATCAGCTA 
AAATCAGCTA 
AAATCAGCTA 
AAATCAGCTA 
AAATCAGCTA 
AAATCAGCTA 
AAATCAGCTA 
AAATCAGCTA 



TTTATGAGGA 
TTTATGAGGA 
TTTATGAGGA 
TTTATGAGGA 
TTTATGAGGA 
TTTATGAGGA 
TTTATGAGGA 
TTTATGAGGA 
TTTATGAGGA 



450 

TACAAAAGAA 
TACAAAAGAA 
TACAAAAGAA 
TACAAAAGAA 
TACAAAAGAA 
TACAAAAGAA 
TACAAAAGAA 
TACAAAAGAA 
TACAAAAGAA 



msal78297.2{l04_090 
msal78297 . 2 { 104_18RS21 
msal78297.2{l04 2603 
msal7B297 . 2 { 104_CJB110 
msal78297 . 2 { 104__COH1 
msal78297 .2(104 M732 
msal78297 . 2 ( 104~A909 
msal78297 . 2 { 104_M78 1 
msal782 97 . 2 { 104_JM913 0013 
Consensus 



451 

AATTACCCAT 
AATTACCCAT 
AATTACCCAT 
AATTACCCAT 
AATTACCCAT 
AATTACCCAT 
AATTACCCAT 
AATTACCCAT 
AATTACCCAT 



TAGTTAATGT 
TAGTTAATGT 
TAGTTAATGT 
TAGTTAATGT 
TAGTTAATGT 
TAGTTAATGT 
TAGTTAATGT 
TAGTTAATGT 
TAGTTAATGT 



AGAGGGTTCC 
AGAGGGTTCC 
AGAGGGTTCC 
AGAGGGTTCC 
AGAGGGTTCC 
AGAGGGTTCC 
AGAGGGTTCC 
AGAGGGTTCC 
AGAGGGTTCC 



AAAGTTGGTG 
AAAGTTGGTG 
AAAGTTGGTG 
AAAGTTGGTG 
AAAGTTGGTG 
AAAGTTGGTG 
AAAGTTGGTG 
AAAGTTGGTG 
AAAGTTGGTG 



500 

AACAATACAA 
AACAATACAA 
AACAATACAA 
AACAATACAA 
AACAATACAA 
AACAATACAA 
AACAATACAA 
AACAATACAA 
AACAATACAA 



msa!78297 . 2 { 104_090 
msal78297.2{l04_18RS21 
msal78297 . 2 { 104_2603 
msal78297 . 2 { 104_CJB110 
msal78297 . 2 { 104_COH1 
rasal78297 .2 104_M732 
msal78297 .2 104_A909 
msal78297.2{l04_M781 
msal78297.2{l04_JM9130013 
Consensus 



501 

AGCATTGAAT 
AGCATTGAAT 
AGCATTGAAT 
AGCATTGAAT 
AGCATTGAAT 
AGCATTGAAT 
AGCATTGAAT 
AGCATTGAAT 
AGCATTGAAT 



CCAATAAATG 
CCAATAAATG 
CCAATAAATG 
CCAATAAATG 
CCAATAAATG 
CCAATAAATG 
CCAATAAATG 
CCAATAAATG 
CCAATAAATG 



GAAAAGATGG 
GAAAAGATGG 
GAAAAGATGG 
GAAAAGATGG 
GAAAAGATGG 
GAAAAGATGG 
GAAAAGATGG 
GAAAAGATGG 
GAAAAGATGG 



TCGAAGAGAG 
TCGAAGAGAG 
TCGAAGAGAG 
TCGAAGAGAG 
TCGAAGAGAG 
TCGAAGAGAG 
TCGAAGAGAG 
TCGAAGAGAG 
TCGAAGAGAG 



550 

ATTGCTGAAG 
ATTGCTGAAG 
ATTGCTGAAG 
ATTGCTGAAG 
ATTGCTGAAG 
ATTGCTGAAG 
ATTGCTGAAG 
ATTGCTGAAG 
ATTGCTGAAG 



msal78297 .2 { 104_090 
msal78297 . 2 { 104_18RS21 
msal78297 . 2{ 104_2603 
msal78297 . 2 { 104_CJB110 
msal78297 . 2 { 104_COHl 
msal78297.2(l04 M732 
msal78297 . 2 { 104JV909 
rasal78297 . 2 { 104_M781 
msal7B297 ,2{l04_JM9 130013 
Consensus 



551 

GTTGGTTATC 
GTTGGTTATC 
GTTGGTTATC 
GTTG GTTATC 
GTTGGTTATC 
GTTGGTTATC 
GTTGGTTATC 
GTTGGTTATC 
GTTGGTTATC 



AAAAAAAAtT 
AAAAAAAAtT 
AAAAAAAAtT 
AAAAAAAAtT 
AAAAAAAAaT 
AAAAAAAAaT 
AAAAAAAAtT 
AAAAAAAAtT 
AAAAAAAAtT 



ACAGGGGTCA 
ACAGGGGTCA 
ACAGGGGTCA 
ACAGGGGTCA 
ACAGGGGTCA 
ACAGGGGTCA 
ACAGGGGTCA 
ACAGGGGTCA 
ACAGGGGTCA 



ATGATCTCGA 
ATGATCTCGA 
ATGATCTCGA 
ATGATCTCGA 
ATGATCTCGA 
ATGATCTCGA 
ATGATCTCGA 
ATGATCTCGA 
ATGATCTCGA 



600 

TAAGAATAAA 
TAAGAATAAA 
TAAGAATAAA 
TAAGAATAAA 
TAAGAATAAA 
TAAGAATAAA 
TAAGAATAAA 
TAAGAATAAA 
TAAGAATAAA 



msal78297.2{l04 090 
msal78297.2{l04 18RS21 
msal78297 .2(104 2603 
msal78297 . 2 { 104_CJB110 
msal78297.2(l04 C0H1 
msal7B297 .2 104~M732 
msal78297.2 104JV909 
msal78297.2{104_M781 
msal78297 . 2 { 104_JM9130013 
Consensus 



601 

TATAAAATTG 
TATAAAATTG 
TATAAAATTG 
TATAAAATTG 
TATAAAATTG 
TATAAAATTG 
TATAAAATTG 
TATAAAATTG 
TATAAAATTG 



AATTAACTGT 
AATTAACTGT 
AATTAACTGT 
AATTAACTGT 
AATTAACTGT 
AATTAACTGT 
AATTAACTGT 
AATTAACTGT 
AATTAACTGT 



TGAGGGTAAA 
TGAGGGTAAA 
TGAGGGTAAA 
TGAGGGTAAA 
TGAGGGTAAA 
TGAGGGTAAA 
TGAGGGTAAA 
TGAGGGTAAA 
TGAGGGTAAA 



ACCACTGTTG 
ACCACTGTTG 
ACCACTGTTG 
ACCACTGTTG 
ACCACTGTTG 
ACCACTGTTG 
ACCACTGTTG 
ACCACTGTTG 
ACCACTGTTG 



650 

AAACGAAAGA 
AAACGAAAGA 
AAACGAAAGA 
AAACGAAAGA 
AAACGAAAGA 
AAACGAAAGA 
AAACGAAAGA 
AAACGAAAGA 
AAACGAAAGA 



msal78297.2{!04_090 
msal78297 .2 { 104 - 18RS2 1 
msal78297.2{l04 2603 
msal78297 . 2 { 104_CJB110 
msal78297 . 2 { 104_COH1 
msal78297 . 2 f 104_M732 
msal7B297 . 2 { 104_A909 



651 

A CTTA ATCAA 
ACTTAATCAA 
ACTTAATCAA 
ACTTAATCAA 
ACTTAATCAA 
ACTTAATCAA 
ACTTAATCAA 



CCACTAGATG 
CCACTAGATG 
CCACTAGATG 
CCACTAGATG 
CCACTAGATG 
CCACTAGATG 
CCACTAGATG 



TCGTTGTGCT 
TCGTTGTGCT 
TCGTTGTGCT 
TCGTTGTGCT 
TCGTTGTGCT 
T CGTTG TGCT 
TCGTTGTGCT 



ATTAGATAAT 
ATTAGATAAT 
ATTAGATAAT 
ATTAGATAAT 
ATTAGATAAT 
ATTAGATAAT 
ATTAGATAAT 



700 

TCAAATAGTA 
TCAAATAGTA 
TCAAATAGTA 
TCAAATAGTA 
TCAAATAGTA 
TCAAATAGTA 
TCAAATAGTA 



738 



WO 2004/018646 



PCT7US2003/026827 



Table 41: Comparative Sequences relating to SAG0649 

maal7B297 . 2 { 104_M78 1 } ACTTAATCAA CCACTAGATG TCGTTGTGCT ATTAGATAAT TCAAATAGTA 
msal782 97 .2(104 _JM913 0013) ACTTAATCAA CCACTAGATG TCGTTGTGCT ATTAGATAAT TCAAATAGTA 
~~ Consensus ********** ********** ********** ********** ********** 



rosal78297.2{l04_090l 
msal78297 . 2 { 104 JL8RS21 } 
msal78297 . 2 { 104__2603 \ 
msal78297 . 2 { 104_CJB110 J 
maal78297 . 2 f 104JCOH1 I 
msal782 97 . 2 f 104_M732 ) 
msal78297 . 2 f 104_A909 } 
tnsal78297 .2(104 M78l) 
ms al7 8 2 97 . 2 { 1 0 4_JM9 13 0 0 13 } 
Consensus 



701 

TGAATAATGA 
TGAATAATGA 
TGAATAATGA 
TGAATAATGA 
TGAATAATGA 
TGAATAATGA 
TGAATAATGA 
TGAATAATGA 
TGAATAATGA 



AAGAGCCAAT 
AAGAGCCAAT 
AAGAGCCAAT 
AAGAGCCAAT 
AAGAGCCAAT 
AAGAGCCAAT 
AAGAGCCAAT 
AAGAGCCAAT 
AAGAGCCAAT 



AATTCTCAAA 
AATTCTCAAA 
AATTCTCAAA 
AATTCTCAAA 
AATTCTCAAA 
AATTCTCAAA 
AATTCTCAAA 
AATTCTCAAA 
AATTCTCAAA 



GAGCATTAAA 
GAGCATTAAA 
GAGCATTAAA 
GAGCATTAAA 
GAGCATTAAA 
GAGCATTAAA 
GAGCATTAAA 
GAGCATTAAA 
GAGCATTAAA 



750 

AGCTGGGGAA 
AGCTGGGGAA 
AGCTGGGGAA 
AGCTGGGGAA 
AGCTGGGGAA 
AGCTGGGGAA 
AGCTGGGGAA 
AGCTGGGGAA 
AGCTGGGGAA 



msal78297.2{l04_090 
msal78297 . 2 { 104_18RS21 
msal7B297.2{l04_2603 
msal78297 . 2 { 104_CJB110 
msal78297.2{l04 COH1 
msal78297.2{104~M732 
msal78297 . 2 { 104_A909 
maal78297 . 2 { 104J4781 
msal78297 . 2 { 104_JM9130013 
Consensus 



751 

GCAGTTGAAA 
GCAGTTGAAA 
GCAGTTGAAA 
'GCAGTTGAAA 
GCAGTTGAAA 
GCAGTTGAAA 
GCAGTTGAAA 
GCAGTTGAAA 
GCAGTTGAAA 



AGCTGATTGA 
AGCTGATTGA 
AGCTGATTGA 
AGCTGATTGA 
AGCTGATTGA 
AGCTGATTGA 
AGCTGATTGA 
AGCTGATTGA 
AGCTGATTGA 



TAAAATTACA 
TAAAATTACA 
TAAAATTACA 
TAAAATTACA 
TAAAATTACA 
TAAAATTACA 
TAAAATTACA 
TAAAATTACA 
TAAAATTACA 



TCAAATAAAG 
TCAAATAAAG 
TCAAATAAAG 
TCAAATAAAG 
TCAAATAAAG 
TCAAATAAAG 
TCAAATAAAG 
TCAAATAAAG 
TCAAATAAAG 



800 

ACAATAGAGT 
ACAATAGAGT 
ACAATAGAGT 
ACAATAGAGT 
ACAATAGAGT 
ACAATAGAGT 
ACAATAGAGT 
ACAATAGAGT 
ACAATAGAGT 



msal78297 
msal78297.2{ 
msal78297 . 
msal78297.2{ 
msal78297 
msal78297 
msa!78297 
msal78297 
msa!78297.2{l04 



2{l04_090 
104_18RS21 
2{104_2603 
104_CJB110 
2fl04_COHl 
2fl04_M732 
2(104_A909 
2{104_M781 
JM9130013 
Consensus 



801 

AGCT CTTGTG 
AGCTCTTGTG 
AGCTCTTGTG 
AGCTCTTGTG 
AGCTCTTGTG 
AGCTCTTGTG 
AGCTCTTGTG 
AGCTCTTGTG 
AGCTCTTGTG 



ACATATGCCT 
ACATATGCCT 
ACATATGCCT 
ACATATGCCT 
ACATATGCCT 
ACATATGCCT 
ACATATGCCT 
ACATATGCCT 
ACATATGCCT 



CAACCATTTT 
CAACCATTTT 
CAACCATTTT 
CAACCATTTT 
CAACCATTTT 
CAACCATTTT 
CAACCATTTT 
CAACCATTTT 
CAACCATTTT 



TGATGGTACT 
TGATGGTACT 
TGATGGTACT 
TGATGGTACT 
TGATGGTACT 
TGATGGTACT 
TGATGGTACT 
TGATGGTACT 
TGATGGTACT 



850 

GAAGCGACCG 
GAAGCGACCG 
GAAGCGACCG 
GAAGCGACCG 
GAAGCGACCG 
GAAGCGACCG 
GAAGCGACCG 
GAAGCGACCG 
GAAGCGACCG 



msal78297 
msal78297.2{ 
msal78297. 
msal78297 .2{ 
msal78297 
msa!78297. 
msal78297 
tnsal78297 . 
tnsal78297.2{l04 



2{104_090 
104_18RS21 
2{104_2603 
104_CJB110 
2{104_COH1 
2{l04_M732 
2(104_A909 
2(l04_M781 
JM9130013 
Consensus 



851 

TATCAAAGGG 
TATCAAAGGG 
TATCAAAGGG 
TATCAAAGGG 
TATCAAAGGG 
TATCAAAGGG 
TATCAAAGGG 
TATCAAAGGG 
TATCAAAGGG 



AGTTGCCGAT 
AGTTGCCGAT 
AGTTGCCGAT 
AGTTGCCGAT 
AGTTGCCGAT 
AGTTGCCGAT 
AGTTGCCGAT 
AGTTGCCGAT 
AGTTGCCGAT 



CAAAATGGTA 
CAAAATGGTA 
CAAAATGGTA 
CAAAATGGTA 
CAAAATGGTA 
CAAAATGGTA 
CAAAATGGTA 
CAAAATGGTA 
CAAAATGGTA 



AAGCGCTGAA 
AAGCGCTGAA 
AAGCGCTGAA 
AAGCGCTGAA 
AAGCGCTGAA 
AAGCGCTGAA 
AAGCGCTGAA 
AAGCGCTGAA 
AAGCGCTGAA 



900 

TGATAGTGTA 
TGATAGTGTA 
TGATAGTGTA 
TGATAGTGTA 
TGATAGTGTA 
TGATAGTGTA 
TGATAGTGTA 
TGATAGTGTA 
TGATAGTGTA 



msal78297 .2{l04_090 
msal78297 . 2 { 104_18RS21 
rasal78297 . 2 { 104_2603 
rasal78297 . 2 { 104_CJB110 
rasal782 97 . 2 { 104_COH1 
msal78297.2(l04 M732 
ms al7 8 2 97 . 2 { 104~A9 0 9 
msal78297.2(104__M781 
msal78297.2{l04_JM9130013 
Consensus 



901 

TCATGGGATT 
TCATGGGATT 
TCATGGGATT 
TCATGGGATT 
TCATGGGATT 
TCATGGGATT 
TCATGGGATT 
TCATGGGATT 
TCATGGGATT 



ATCATAAAAC 
ATCATAAAAC 
ATCATAAAAC 
ATCATAAAAC 
ATCATAAAAC 
ATCATAAAAC 
ATCATAAAAC 
ATCATAAAAC 
ATCATAAAAC 



TACTTTTACA 
TACTTTTACA 
TACTTTTACA 
TACTTTTACA 
TACTTTTACA 
TACTTTTACA 
TACTTTTACA 
TACTTTTACA 
TACTTTTACA 



GCAACTACAC 
GCAACTACAC 
GCAACTACAC 
GCAACTACAC 
GCAACTACAC 
GCAACTACAC 
GCAACTACAC 
GCAACTACAC 
GCAACTACAC 



950 

ATAATTACAG 
ATAATTACAG 
ATAATTACAG 
ATAATTACAG 
ATAATTACAG 
ATAATTACAG 
ATAATTACAG 
ATAATTACAG 
ATAATTACAG 



msal78297 
msal78297.2{ 

msal78297 
msal78297.2{ 
tnsal78297 
tnsal78297 
msal78297 
maal78297 
msal78297.2{!04 



2{104_090 
104_18RS21 
2(104_2603 
104 CJB110 
2{104_COH1 
2{104_M732 
2(104_A909 
2(104_M781 
JM9130013 
Consensus 



951 

TTATTTAAAT 
TTATTTAAAT 
TTATTTAAAT 
TTATTTAAAT 
TTATTTAAAT 
TTATTTAAAT 
TTATTTAAAT 
TTATTTAAAT 
TTATTTAAAT 



TTAACAAATG 
TTAACAAATG 
TTAACAAATG 
TTAACAAATG 
TTAACAAATG 
TTAACAAATG 
TTAACAAATG 
TTAACAAATG 
TTAACAAATG 



ATGCTAACGA 
ATGCTAACGA 
ATGCTAACGA 
ATGCTAACGA 
ATGCTAACGA 
ATGCTAACGA 
ATGCTAACGA 
ATGCTAACGA 
ATGCTAACGA 



AGTTAATATT 
AGTTAATATT 
AGTTAATATT 
AGTTAATATT 
AGTTAATATT 
AGTTAATATT 
AGTTAATATT 
AGTTAATATT 
AGTTAATATT 



1000 
CTAAAGTCAA 
CTAAAGTCAA 
CTAAAGTCAA 
CTAAAGTCAA 
CTAAAGTCAA 
CTAAAGTCAA 
CTAAAGTCAA 
CTAAAGTCAA 
CTAAAGTCAA 



rasal78297. 2(104 090 
msal78297. 2(104 18RS21 
msal7 8 2 97 . 2 { 104_2 6 03 
msal78297.2{l04 CJB110 
msal7B297 . 2 ( 104_OOH1 
maal78297 . 2 ( 104_M732 



1001 

GAATTCCAAA 
GAATTCCAAA 
GAATTCCAAA 
GAATTCCAAA 
GAATTCCAAA 
GAATTCCAAA 



GGAAGCGGAG 
GGAAGCGGAG 
GGAAGCGGAG 
GGAAGCGGAG 
GGAAGCGGAG 
GGAAGCGGAG 



CATATAAATG 
CATATAAATG 
CATATAAATG 
CATATAAATG 
CATATAAATG 
CATATAAATG 



GGGATCGCAC 
GGGATCGCAC 
GGGATCGCAC 
GGGATCGCAC 
GGGATCGCAC 
GGGATCGCAC 



1050 
GCTCTATCAA 
GCTCTATCAA 
GCTCTATCAA 
GCTCTATCAA 
GCTCTATCAA 
GCTCTATCAA 



739 



WO 2004/018646 



PCT7US2003/026827 



Table 41: Comparative Sequences relating to SAG0649 



msal78297.2f 104 A909J GAATTCCAAA GGAAGCGGAG CATATAAATG GGGATCGCAC GCTCTATCAA 

rasal78297.2{l04~M781) GAATTCCAAA GGAAGCGGAG CATATAAATG GGGATCGCAC GCTCTATCAA 

maal78297.2{l04_JM9130013} GAATTCCAAA GGAAGCGGAG CATATAAATG GGGATCGCAC GCTCTATCAA 

Consensus ********** ********** ********** ********** ********** 



msal78297.2{l04 090 
msal78297 . 2 { 104_18RS21 
rasal78297 . 2 { 104_2603 
msal78297 .2{lO4_CJB110 
msal78297 . 2 { 104_COH1 
msal78297 . 2 { 104_M732 
msal782 97 . 2 { 104_A909 
msal782 97 . 2 { 104_M78 1 
msal7 82 97 . 2 { 104_JM9130013 
Consensus 



1051 

TTTGGTGCGA 
TTTGGTGCGA 
TTTGGTGCGA 
TTTGGTGCGA 
TTTGGTGCGA 
TTTGGTGCGA 
TTTGGTGCGA 
TTTGGTGCGA 
TTTGGTGCGA 



CATTTACTCA 
CATTTACTCA 
CATTTACTCA 
CATTTACTCA 
CATTTACTCA 
CATTTACTCA 
CATTTACTCA 
CATTTACTCA 
CATTTACTCA 



AAAAGCTCTA 
AAAAGCTCTA 
AAAAGCTCTA 
AAAAGCTCTA 
AAAAGCTCTA 
AAAAGCTCTA 
AAAAGCTCTA 
AAAAGCTCTA 
AAAAGCTCTA 



ATGAAAGCAA 
ATGAAAGCAA 
ATGAAAGCAA 
ATGAAAGCAA 
ATGAAAGCAA 
ATGAAAGCAA 
ATGAAAGCAA 
ATGAAAGCAA 
ATGAAAGCAA 



1100 
ATGAAATTTT 
ATGAAATTTT 
ATGAAATTTT 
ATGAAATTTT 
ATGAAATTTT 
ATGAAATTTT 
ATGAAATTTT 
ATGAAATTTT 
ATGAAATTTT 



msa!78297 . 2 { 104_090 } 
msal78297.2{l04 18RS21* 
msal78297 .2{104_2603 
msal78297 . 2{l04_CJB110] 
msal78297 . 2 { 104_COH1 j 
rasal78297 . 2 f 104_M732 
msal78297 .2(104_A909] 
msal78297 .2(104_M781 
maal78297 . 2 { 104_JM9 130013 , 
Consensus 



1101 

AGAGACACAA 
AGAGACACAA 
AGAGACACAA 
AGAGACACAA 
AGAGACACAA 
AGAGACACAA 
AGAGACACAA 
AGAGACACAA 
AGAGACACAA 



AGTTCTAATG 
AGTTCTAATG 
AGTTCTAATG 
AGTTCTAATG 
AGTTCTAATG 
AGTTCTAATG 
AGTTCTAATG 
AGTTCTAATG 
AGTTCTAATG 



CTAGAAAAAA 
CTAGAAAAAA 
CTAGAAAAAA 
CTAGAAAAAA 
CTAGAAAAAA 
CTAGAAAAAA 
CTAGAAAAAA 
CTAGAAAAAA 
CTAGAAAAAA 



ACTTATTTTT 
ACTTATTTTT 
ACTTATTTTT 
ACTTATTTTT 
ACTTATTTTT 
ACTTATTTTT 
ACTTATTTTT 
ACTTATTTTT 
ACTTATTTTT 



1150 
CACGTAACTG 
CACGTAACTG 
CACGTAACTG 
CACGTAACTG 
CACGTAACTG 
CACGTAACTG 
CACGTAACTG 
CACGTAACTG 
CACGTAACTG 



msal78297.2{l04 090 
msal78297 ,2{104_18RS21 
msal7 82 97 . 2 { 104_2603 
msal78 297 . 2 { 104_CJB110 
msal78297 . 2 { 104JCOH1 
msal78297 . 2 (l04_M732 
msa!78297 . 2 f 104_A909 
msal78297.2(104_M781 
sal78297 . 2 { 104_JM9130013 
*~ Consensus 



1151 

ATGGTGTCCC 
ATGGTGTCCC 
ATGGTGTCCC 
ATGGTGTCCC 
ATGGTGTCCC 
ATGGTGTCCC 
ATGGTGTCCC 
ATGGTGTCCC 
ATGGTGTCCC 
********** 



TACGATGTCT 
TACGATGTCT 
TACGATGTCT 
TACGATGTCT 
TACGATGTCT 
TACGATGTCT 
TACGATGTCT 
TACGATGTCT 
TACGATGTCT 
********** 



TATGCCATAA 
TATGCCATAA 
TATGCCATAA 
TATGCCATAA 
TATGCCATAA 
TATGCCATAA 
TATGCCATAA 
TATGCCATAA 
TATGCCATAA 
********** 



ATTTTAATCC 
ATTTTAATCC 
ATTTTAATCC 
ATTTTAATCC 
ATTTTAATCC 
ATTTTAATCC 
ATTTTAATCC 
ATTTTAATCC 
ATTTTAATCC 
********** 



1200 
TTATATATCA 
TTATATATCA 
TTATATATCA 
TTATATATCA 
TTATATATCA 
TTATATATCA 
TTATATATCA 
TTATATATCA 
TTATATATCA 
********** 



rasal78297 . 2 { 104_090 
msal78 2 97 - 2 { 104_18RS2 1 
msal78297 .2 { 104_2603 
rasal78297 . 2 { 104_CJB11 0 
msal78297 ,2{l04_COHl 
msal7 8297 . 2 f 104J4732 
msal78297 . 2 { 104_A909 
msal782 97 . 2 { 104_M78 1 
rasal78297.2{l04_JM9130013 
Consensus 



1201 

ACATCTTACC 
ACATCTTACC 
ACATCTTACC 
ACATCTTACC 
ACATCTTACC 
ACATCTTACC 
ACATCTTACC 
ACATCTTACC 
ACATCTTACC 



AAAACCAGTT 
AAAACCAGTT 
AAAACCAGTT 
AAAACCAGTT 
AAAACCAGTT 
AAAACCAGTT 
AAAACCAGTT 
AAAACCAGTT 
AAAACCAGTT 



TAATTCTTTT 
TAATTCTTTT 
TAATTCTTTT 
TAATTCTTTT 
TAATTCTTTT 
TAATTCTTTT 
TAATTCTTTT 
TAATTCTTTT 
TAATTCTTTT 



TTAAATAAAA 
TTAAATAAAA 
TTAAATAAAA 
TTAAATAAAA 
TTAAATAAAA 
TTAAATAAAA 
TTAAATAAAA 
TTAAATAAAA 
TTAAATAAAA 



1250 
TACCAGATAG 
TACCAGATAG 
TACCAGATAG 
TACCAGATAG 
TACCAGATAG 
TACCAGATAG 
TACCAGATAG 
TACCAGATAG 
TACCAGATAG 



msal78297 . 2 { 104_090 
msal782 97 . 2 { 104_18RS2 1 
rasal78297 . 2 { 104_2603 
msal78297.2{l04_CJB110 
msal78 2 97 . 2 ( 104_COH1 
msal78297.2{l04 M732 
msal78297.2(l043A909 
msal78297.2(104_M781 
msal78297 . 2 { 104_JM9130013 
Consensus 



1251 

AAGTGGTATT 
AAGTGGTATT 
AAGTGGTATT 
AAGTGGTATT 
AAGTGGTATT 
AAGTGGTATT 
AAGTGGTATT 
AAGTGGTATT 
AAGTGGTATT 



CTCCAAGAGG 
CTCCAAGAGG 
CTCCAAGAGG 
CTCCAAGAGG 
CTCCAAGAGG 
CTCCAAGAGG 
CTCCAAGAGG 
CTCCAAGAGG 
CTCCAAGAGG 



ATTTTATAAT 
ATTTTATAAT 
ATTTTATAAT 
ATTTTATAAT 
ATTTTATAAT 
ATTTTATAAT 
ATTTTATAAT 
ATTTTATAAT 
ATTTTATAAT 



CAATGGTGAT 
CAATGGTGAT 
CAATGGTGAT 
CAATGGTGAT 
CAATGGTGAT 
CAATGGTGAT 
CAATGGTGAT 
CAATGGTGAT 
CAATGGTGAT 



1300 
GATTATCAAA 
GATTATCAAA 
GATTATCAAA 
GATTATCAAA 
GATTATCAAA 
GATTATCAAA 
GATTATCAAA 
GATTATCAAA 
GATTATCAAA 



msal78297 . 2 { 104_090 
maal78297.2{l04_18RS21 
msal78297 . 2 { 104_2603 
msal78297 .2(104 CJB110 
msal7 8297 . 2 f 104_COH1 
msal78297 . 2 { 104 _M732 
msal78297 . 2 { 104_A909 
maal78297.2{104_M781 
msal78297 . 2 { 104_JM9130013 
Consensus 



1301 

TAGTAAAAGG 
TAGTAAAAGG 
TAGTAAAAGG 
TAGTAAAAGG 
TAGTAAAAGG 
TAGTAAAAGG 
TAGTAAAAGG 
TAGTAAAAGG 
TAGTAAAAGG 



AGATGGAGAG 
AGATGGAGAG 
AGATGGAGAG 
AGATGGAGAG 
AGATGGAGAG 
AGATGGAGAG 
AGATGGAGAG 
AGATGGAGAG 
AGATGGAGAG 



AGTTTTAAAC 
AGTTTTAAAC 
AGTTTTAAAC 
AGTTTTAAAC 
AGTTTTAAAC 
AGTTTTAAAC 
AGTTTTAAAC 
AGTTTTAAAC 
AGTTTTAAAC 



TGTTTTCGGA 
TGTTTTCGGA 
TGTTTTCGGA 
TGTTTTCGGA 
TGTTTTCGGA 
TGTTTTCGGA 
TGTTTTCGGA 
TGTTTTCGGA 
TGTTTTCGGA 



1350 
TAGAAAAGTT 
TAGAAAAGTT 
TAGAAAAGTT 
TAGAAAAGTT 
TAGAAAAGTT 
TAGAAAAGTT 
TAGAAAAGTT 
TAGAAAAGTT 
TAGAAAAGTT 



msal78297 . 2 { 104_090 
msal78297.2{l04 18RS21 

msal78297.2{l04_2603 
msal78297. 2(104 CJB110 

msal7B297.2(l04 C0H1 



1351 

CCTGTTACTG GAGGAACGAC 
CCTGTTACTG GAGGAACGAC 
CCTGTTACTG GAGGAACGAC 
CCTGTTACTG GAGGAACGAC 
CCTGTTACTG GAGGAACGAC 



ACAAGCAGCT TATCGAGTAC 
ACAAGCAGCT TATCGAGTAC 
ACAAGCAGCT TATCGAGTAC 
ACAAGCAGCT TATCGAGTAC 
ACAAGCAGCT TATCGAGTAC 



1400 
OGCAAAATCA 
CGCAAAATCA 
OGCAAAATCA 
CGCAAAATCA 
CGCAAAATCA 
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Table 41: Comparative Sequences relating to SAG0649 



msal7B297.2{l04_M732 
msal78297.2(l04 A909 
tnsal78297 . 2 { 10434781 
msal78297 . 2 {104_JM9130013 
~" Consensus 



CCTGTTACTG GAGGAACGAC ACAAGCAGCT TATCGAGTAC CGCAAAATCA 
CCTGTTACTG GAGGAACGAC ACAAGCAGCT TATCGAGTAC CGCAAAATCA 
CCTGTTACTG GAGGAACGAC ACAAGCAGCT TATCGAGTAC CGCAAAATCA 
CCTGTTACTG GAGGAACGAC ACAAGCAGCT TATCGAGTAC CGCAAAATCA 



1401 

msal78297.2{l04_090) ACTCTCTGTA 

msal78297.2{l04_18RS21 f ACTCTCTGTA 

msal7B297.2{l04_2603} ACTCTCTGTA 

msal78297.2{l04 CJB110) ACTCTCTGTA 

msal78297 . 2 f 104_COH1 J ACTCTCTGTA 

msal78297.2 104_M732> ACTCTCTGTA 

msal78297.2(104_A909> ACTCTCTGTA 

msal78297.2{l04_M781> ACTCTCTGTA 

rasal78297.2{l04_JM9130013) ACTCTCTGTA 

Consensus ********** 



ATGAGTAATG 
ATGAGTAATG 
ATGAGTAATG 
ATGAGTAATG 
ATGAGTAATG 
ATGAGTAATG 
ATGAGTAATG 
ATGAGTAATG 
ATGAGTAATG 



AGGGATATGC 
AGGGATATGC 
AGGGATATGC 
AGGGATATGC 
AGGGATATGC 
AGGGATATGC 
AGGGATATGC 
AGGGATATGC 
AGGGATATGC 



AATTAATAGT 
AATTAATAGT 
AATTAATAGT 
AATTAATAGT 
AATTAATAGT 
AATTAATAGT 
AATTAATAGT 
AATTAATAGT 
AATTAATAGT 



1450 
GGATAT ATTT 
GGATATATTT 
GGATATATTT 
GGATATATTT 
GGATATATTT 
GGATATATTT 
GGATATATTT 
GGATAT ATTT 
GGATATATTT 



1451 

msal78297.2{l04_090> ATCTCTATTG GAGAGATTAC 

msal78297.2{l04_18RS21/ ATCTCTATTG GAGAGATTAC 

tnsal78297 ,2{l04_2603 > ATCTCT ATTG GAGAGATTAC 

msal78297.2{l04_CJB110} ATCTCTATTG GAGAGATTAC 

msal78297.2{l04_COHl) ATCTCTATTG GAGAGATTAC 

tnsal78297 .2{104_M732'» ATCTCTATTG GAGAGATTAC 

msal78297 .2(104 A909/ ATCTCTATTG GAGAGATTAC 

rasal78297 .2{104~M7B1) ATCTCT ATTG GAGAGATTAC 

msal78297 .2{l04 > _JM9130013} ATCTCTATTG GAGAGATTAC 

"~ Consensus ********** ********** 



AACTGGGTCT 
AACTGGGTCT 
AACTGGGTCT 
AACTGGGTCT 
AACTGGGTCT 
AACTGGGTCT 
AACTGGGTCT 
AACTGGGTCT 
AACTGGGTCT 



ATCCATTTGA 
ATCCATTTGA 
ATCCATTTGA 
ATCCATTTGA 
ATCCATTTGA 
ATCCATTTGA 
ATCCATTTGA 
ATCC ATTTG A 
ATCCATTTGA 



1500 
TCCTAAGACA 
TCCTAAGACA 
TCCTAAGACA 
TCCTAAGACA 
TCCTAAGACA 
TCCTAAGACA 
TCCTAAGACA 
TCCTAAGACA 
TCCTAAGACA 



1501 

msal78297.2{l04_090} AAGAAA GTTT 

msal78297,2{l04 18RS21 AAGAAAGTTT 

tnsal78297.2{l04_2603 AAGAAAGTTT 

msal78297 .2(104 CJB110 \ AAGAAA GTTT 

msal7 8 2 97 . 2 { 104_COH1 \ AAGAAAGTTT 

msal78297.2{104_M732 AAGAAA GTTT 

rasal78297.2<104_A909' AAGAAA GTTT 

msal78297.2{104_M781; AAGAAA GTTT 

msal78297.2{l04_jJM9130013| AAGAAAGTTT 

Consensus ********** 



CTGCAACGAA 
CTGCAACGAA 
CTGCAACGAA 
CTGCAACGAA 
CTGCAACGAA 
CTGCAACGAA 
CTGCAACGAA 
CTGCAACGAA 
CTGCAACGAA 



ACAAATCAAA 
ACAAATCAAA 
ACAAATCAAA 
ACAAATCAAA 
ACAAATCAAA 
ACAAATCAAA 
ACAAATCAAA 
ACAAATCAAA 
ACAAATCAAA 



ACTCATGGTG 
ACTCATGGTG 
ACTCATGGTG 
ACTCATGGTG 
ACTCATGGTG 
ACTCATGGTG 
ACTCATGGTG 
ACTCATGGTG 
ACTCATGGTG 



1550 
AGCCAACAAC 
AGCCAACAAC 
AGCCAACAAC 
AGCCAACAAC 
AGCCAACAAC 
AGCCAACAAC 
AGCCAACAAC 
AGCCAACAAC 
AGCCAACAAC 



1551 

msal78297 .2{l04_090} ATTATACTTT AATGGAAATA 

msal78297.2{l° 4 _ 18RS21 } ATTATACTTT AATGGAAATA 

msal78297.2{l04_2603 I ATTATA CTTT AATGGAAATA 

msal78297.2{l04jCJB110j ATTATACTTT AATGGAAATA 

msal78297.2{ 104_COH1> ATTATA CTTT AATGGAAATA 

msal78297.2{l04_M7321 ATTATACTTT AATGGAAATA 

msal78297.2(104_A909l ATTATA CTTT AATGGAAATA 

msal78297.2{104_M781J ATTATACTTT AATGGAAATA 

msal78297.2{l04_JM9130013) ATTATACTTT AATGGAAATA 

Consensus ********** ********** 

1601 

msal78297.2{l04_090) TTGGGATTGG TGTAAACGGA 

msal78297.2{!04 18RS21 TTGGGATTGG TGTAAACGGA 

msal7B297.2{l04_2603J TTGGGATTGG TGTAAACGGA 

cnsal78297.2{l04jCJB110J TTGGGATTGG TGTAAACGGA 

msal78297.2{l04_C0Hl' TTGGGATTGG TGTAAACGGA 

msal78297.2 104 M732 TTGGGATTGG TGTAAACGGA 

msal78297.2 104_A909 • TTGGGATTGG TGTAAACGGA 

msal78297.2{104_M781 ) TTGGGATTGG TGTAAACGGA 

msal78297.2{104_JM9130013} TTGGGATTGG TGTAAACGGA 

Consensus ********** ********** 



TAAGACCTAA 
TAAGACCTAA 
TAAGACCTAA 
TAAGACCTAA 
TAAGACCTAA 
TAAGACCTAA 
TAAGACCTAA 
TAAGACCTAA 
TAAGACCTAA 



AGGTTATGAC 
AGGTTATGAC 
AGGTTATGAC 
AGGTTATGAC 
AGGTTATGAC 
AGGTTATGAC 
AGGTTATGAC 
AGGTTATGAC 
AGGTTATGAC 



1600 
ATTTTTACTG 
ATTTTTACTG 
ATTTTTACTG 
ATTTTTACTG 
ATTTTTACTG 
ATTTTTACTG 
ATTTTTACTG 
ATTTTTACTG 
ATTTTTACTG 



GATCCTGGTG 
GATCCTGGTG 
GATCCTGGTG 
GATCCTGGTG 
GATCCTGGTG 
GATCCTGGTG 
GATCCTGGTG 
GATCCTGGTG 
GATCCTGGTG 



CAACTCCTCT 
CAACTCCTCT 
CAACTCCTCT 
CAACTCCTCT 
CAACTCCTCT 
CAACTCCTCT 
CAACTCCTCT 
CAACTCCTCT 
CAACTCCTCT 



1650 
TGAAGCTGAG 
TGAAGCTGAG 
TGAAGCTGAG 
TGAAGCTGAG 
TGAAGCTGAG 
TGAAGCTGAG 
TGAAGCTGAG 
TGAAGCTGAG 
TGAAGCTGAG 



msal78297.2{l04_090 
msal7B297.2{l04_18RS21 
msal78297 .2{104_2603 
msal78297.2{l04 CJB110 
msal78297.2(l04 COH1 
msal78297 . 2 104_M732 
tnsal78297 . 2 104 A909 
msal7B2 97 . 2 { 104_M78 1 
msal78297 .2{104_JM9130013 
Consensus 



maal78297.2{lO4_O90} 
msal78297 . 2 { 104JL8RS21J 
msal78297.2{l04_2603) 
msa!78297 . 2 { 104_CJB110 } 



1651 

AAATTTATGC 
AAATTTATGC 
AAATTTATGC 
AAATTTATGC 
AAATTTATGC 
AAATTTATGC 
AAATTTATGC 
AAATTTATGC 
AAATTTATGC 



AATCAATATC 
AATCAATATC 
AATCAATATC 
AATCAATATC 
AATCAATATC 
AATCAATATC 
AATCAATATC 
AATCAATATC 
AATCAATATC 



AAGTAAAACA 
AAGTAAAACA 
AAGTAAAACA 
AAGTAAAACA 
AAGTAAAACA 
AAGTAAAACA 
AAGTAAAACA 
AAGTAAAACA 
AAGTAAAACA 



GAAAATTATA 
GAAAATTATA 
GAAAATTATA 
GAAAATTATA 
GAAAATTATA 
GAAAATTATA 
GAAAATTATA 
GAAAATTATA 
GAAAATTATA 



1700 
CTAATGTTGA 
CTAATGTTGA 
CTAATGTTGA 
CTAATGTTGA 
CTAATGTTGA 
CTAATGTTGA 
CTAATGTTGA 
CTAATGTTGA 
CTAATGTTGA 



1701 1750 
TGATACAAAT AAAATTTATG ATGAGCTAAA TAAATACTTT AAAACAATTG 
TGATACAAAT AAAATTTATG ATGAGCTAAA TAAATACTTT AAAACAATTG 
TGATACAAAT AAAATTTATG ATGAGCTAAA TAAATACTTT AAAACAATTG 
TGATACAAAT AAAATTTATG ATGAGCTAAA TAAATACTTT AAAACAATTG 
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msal78297.2 
msal78297.2 
msal78297.2 
msal78297.2 



104_COH1 
104_M732 
104_A909 
104 M781 



msal78297 . 2 { 104_JM9130013 



TQATACAAAT AAAATTTATG ATGAGCTAAA TAAATACTTT AAAACAATTQ 
TGATACAAAT AAAATTTATG ATGAGCTAAA TAAATACTTT AAAACAATTG 
TGATACAAAT AAAATTTATG ATGAGCTAAA TAAATACTTT AAAACAATTG 
TGATACAAAT AAAATTTATG ATGAGCTAAA TAAATACTTT AAAACAATTG 
TGATACAAAT AAAATTTATG ATGAGCTAAA TAAATACTTT AAAACAATTG 



Consensus 



msal78297 . 2 { 104_090 ] 
msal78297 . 2 { 104_18RS21 
msal78297 . 2 { 104_2603 
msal78297 .2 { 104_CJB110 
msal78297 . 2 { 104_COH1 
msal78297.2{104_M732 
msal78297 . 2 j 104_A909 
msal78297.2(104_M781 
msal78297.2{l04_JM9130013 
Consensus 



1751 

TTGAGGAAAA 
TTGAGGAAAA 
TTGAGGAAAA 
TTGAGGAAAA 
TTGAGGAAAA 
TTGAGGAAAA 
TTGAGGAAAA 
TTGAGGAAAA 
TTGAGGAAAA 



ACATTCTATT 
ACATTCTATT 
ACATTCTATT 
ACATTCTATT 
ACATTCTATT 
ACATTCTATT 
ACATTCTATT 
ACATTCTATT 
ACATTCTATT 



GTTGATGGAA 
GTTGATGGAA 
GTTGATGGAA 
GTTGATGGAA 
GTTGATGGAA 
GTTGATGGAA 
GTTGATGGAA 
GTTGATGGAA 
GTTGATGGAA 



ATGTGACTGA 
ATGTGACTGA 
ATGTGACTGA 
ATGTGACTGA 
ATGTGACTGA 
ATGTGACTGA 
ATGTGACTGA 
ATGTGACTGA 
ATGTGACTGA 



1800 

TCCTATGGGA 
TCCTATGGGA 
TCCTATGGGA 
TCCTATGGGA 
TCCTATGGGA 
TCCTATGGGA 
TCCTATGGGA 
TCCTATGGGA 
TCCTATGGGA 



msal78297.2{l04_090 
nisal78297.2{l04_18RS21 
** msal78297.2{!04_2603 
msal78297 . 2 { 104_CJB110 
msal78297.2{l04_COHl 
msal78297.2 104_M732 
insal78297.2^ 104_A909 
msal78297.2{104 M781 
msal78297 . 2 { 104_JM9130013 
Consensus 



1801 

GAGATGATTG 
GAGATGATTG 
GAGATGATTG 
GAGATGATTG 
GAGATGATTG 
GAGATGATTG 
GAGATGATTG 
GAGATGATTG 
GAGATGATTG 
********** 



AATTCCAATT 
AATTCCAATT 
AATTCCAATT 
AATTCCAATT 
AATTCCAATT 
AATTCCAATT 
AATTCCAATT 
AATTCCAATT 
AATTCCAATT 
********** 



AAAAAATGGT 
AAAAAATGGT 
AAAAAATGGT 
AAAAAATGGT 
AAAAAATGGT 
AAAAAATGGT 
AAAAAATGGT 
AAAAAATGGT 
AAAAAATGGT 
********** 



CAAAGTTTTA 
CAAAGTTTTA 
CAAAGTTTTA 
CAAAGTTTTA 
CAAAGTTTTA 
CAAAGTTTTA 
CAAAGTTTTA 
CAAAGTTTTA 
CAAAGTTTTA 
********** 



1850 
CACATGATGA 
CACATGATGA 
CACATGATGA 
CACATGATGA 
CACATGATGA 
CACATGATGA 
CACATGATGA 
CACATGATGA 
CACATGATGA 
********** 



msal78297 .2 {l04_090} 
msal78297.2{l04_18RS21) 
msal7 8297 . 2 { 104_2603 J 
msal7B297 .2{l04_CJB110) 
msal7 82 97 . 2 f 104_COH1 J 
msal78297.2i 104_M732> 
msal78297.2 104_A909> 
msal7 82 97 . 2 { 104_M78 1 } 
msal78297 . 2 { 104_JM9130013 } 
Consensus 



1851 

TTACGTTTTG 
TTACGTTTTG 
TTACGTTTTG 
TTACGTTTTG 
TTACGTTTTG 
TTACGTTTTG 
TTAC GTTT TG 
TTACGTTTTG 
TTACGTTTTG 



GTTGGAAATG 
GTTGGAAATG 
GTTGGAAATG 
GTTGGAAATG 
GTTGGAAATG 
GTTGGAAATG 
GTTGGAAATG 
GTTGGAAATG 
GTTGGAAATG 



ATGGCAGTCA 
ATGGCAGTCA 
ATGGCAGTCA 
ATGGCAGTCA 
ATGGCAGTCA 
ATGGCAGTCA 
ATGGCAGTCA 
ATGGCAGTCA 
ATGGCAGTCA 



ATTAAAAAAT 
ATTAAAAAAT 
ATTAAAAAAT 
ATTAAAAAAT 
ATTAAAAAAT 
ATTAAAAAAT 
ATTAAAAAAT 
ATTAAAAAAT 
ATTAAAAAAT 



1900 

GGTGTGGCTC 
GGTGTGGCTC 
GGTGTGGCTC 
GGTGTGGCTC 
GGTGTGGCTC 
GGTGTGGCTC 



GGTGTGGCTC 



msal78297 . 2 { 104_09 0 
rasal78297 . 2 { 104_18RS21 
msal78297 . 2 { 104_2603 
msal78297. 2(104 CJB110 
tnsal782 97 . 2 ( 104_C0H1 
msal7B297 . 2 j 104_M732 
msal78297.2(l04 A909 
msal78297 . 2 { 104~M78 1 
rasal78297.2{l04_JM9130013 
Consensus 



msal78297 . 2 { 104_090 
msal78297 . 2 { 104_18RS21 1 
msal78297 ,2{104_2603 
msal78297 . 2 { 104_CJB110 
msal78297 .2{104__COH1 
msal78297 . 2 { 104_M732 
msal78297. 2(104 A909 
msal78297.2{104_M781 
msal78297.2{l04_JM9130013 
Consensus 



1901 

TTGGTGGACC 
TTGGTGGACC 
TTGGTGGACC 
TTGGTGGACC 
TTGGTGGACC 
TTGGTGGACC 
TTGGTGGACC 
TTGGTGGACC 
TTGGTGGACC 



AAACAGTGAT 
AAACAGTGAT 
AAACAGTGAT 
AAACAGTGAT 
AAACAGTGAT 
AAACAGTGAT 
AAACAGTGAT 
AAACAGTGAT 
AAACAGTGAT 



GGGGGAATTT 
GGGGGAATTT 
GGGGGAATTT 
GGGGGAATTT 
GGGGGAATTT 
GGGGGAATTT 
GGGGGA ATTT 
GGGGGAATTT 
GGGGGAATTT 



TAAAAGATGT 
TAAAAGATGT 
TAAAAGATGT 
TAAAAGATGT 
TAAAAGATGT 
TAAAAGATGT 
TAAAAGATGT 
TAAAAGATGT 
TAAAAGATGT 



1950 
TACAGTGACT 
TACAGTGACT 
TACAGTGACT 
TACAGTGACT 
TACAGTGACT 
TACAGTGACT 
TACAGTGACT 
TACAGTGACT 
TACAGTGACT 



1951 

TATGATAAGA 
TATGATAAGA 
TATGATAAGA 
TATGATAAGA 
TATGATAAGA 
TATGATAAGA 
TATGATAAGA 
TATGATAAGA 
TATGATAAGA 



CATCTCAAAC 
CATCTCAAAC 
CATCTCAAAC 
CATCTCAAAC 
CATCTCAAAC 
CATCTCAAAC 
CATCTCAAAC 
CATCTCAAAC 
CATCTCAAAC 



CATCAAAATC 
CATCAAAATC 
CATCAAAATC 
CATCAAAATC 
CATCAAAATC 
CATCAAAATC 
CATCAAAATC 
CATCAAAATC 
CATCAAAATC 



AATCATTTGA 
AATCATTTGA 
AATCATTTGA 
AATCATTTGA 
AATCATTTGA 
AATCATTTGA 
AATCATTTGA 
AATCATTTGA 
AATCATTTGA 



2000 
ACTTAGGAAG 
ACTTAGGAAG 
ACTTAGGAAG 
ACTTAGGAAG 
ACTTAGGAAG 
ACTTAGGAAG 
ACTTAGGAAG 
ACTTAGGAAG 
ACTTAGGAAG 



msal78297 .2{l04_090 
msal78297 . 2 { 104_18RS21 
msal78297.2{l04 2603 
msal78297.2(l04 CJB110 
msal7 8297 . 2 1 104_COH1 
msal78297.2 104 M732 
msal78297.2{l04 A909 
msal78297 . 2 { 104_M781 
msal78297 .2{l04_JM9130013 
Consensus 



2001 

TGGACAAAAA 
TGGACAAAAA 
TGGACAAAAA 
TGGACAAAAA 
TGGACAAAAA 
TGGACAAAAA 
TGGACAAAAA 
TGGACAAAAA 
TGGACAAAAA 



GTAGTTCTTA 
GTAGTTCTTA 
GTAGTTCTTA 
GTAGTTCTTA 
GTAGTTCTTA 
GTAGTTCTTA 
GTAGTTCTTA 
GTAGTTCTTA 
GTAGTTCTTA 



CCTATGATGT 
CCTATGATGT 
CCTATGATGT 
CCTATGATGT 
CCTATGATGT 
CCTATGATGT 
CCTATGATGT 
CCTATGATGT 
CCTATGATGT 



ACGTTTAAAA 
ACGTTTAAAA 
ACGTTTAAAA 
ACGTTTAAAA 
ACGTTTAAAA 
ACGTTTAAAA 
ACGTTTAAAA 
ACGTTTAAAA 
ACGTTTAAAA 



2050 
GATAACTATA 
GATAACTATA 
GATAACTATA 
GATAACTATA 
GATAACTATA 
GATAACTATA 
GATAACTATA 
GATAACTATA 
GATAACTATA 



2051 2100 
msal782 97. 2 { 104_090} TAAGTAACAA ATTTTACAAT ACAAATAATC GTACAACGCT AAGTCCGAAG 
msal7B297.2{l04_18RS2l] TAAGTAACAA A TTTT ACAAT ACAAATAATC GTACAACGCT AAGTCCGAAG 
msal78297.2{l04 2603} TAAGTAACAA ATTTTACAAT ACAAATAATC GTACAACGCT AAGTCCGAAG 



742 



WO 2004/018646 



PCT7US2003/026827 



Table 41: Comparative Sequences relating to SAG0649 



msal78297 .2{l04_CJB110 
msal78297 . 2{ 104_COH1 
rasal7B297.2{104_M732 
msal7 82 97 . 2 j 104_A909 
msal78297.2{l04_M781 
msal78297 . 2'[ 104_JM9130013 
Consensus 



TAAGTAACAA 
TAAGTAACAA 
TAAGTAACAA 
TAAGTAACAA 
TAAGTAACAA 
TAAGTAACAA 



ATTTTACAAT 
ATTTTACAAT 
ATTTTACAAT 
ATTTTACAAT 
ATTTTACAAT 
ATTTTACAAT 



ACAAATAATC 
ACAAATAATC 
ACAAATAATC 
ACAAATAATC 
ACAAATAATC 
ACAAATAATC 



GTACAACGCT 
GTACAACGCT 
GTACAACGCT 
GTACAACGCT 
GTACAACGCT 
GTACAACGCT 



AAGTCCGAAG 
AAGTCCGAAG 
AAGTCCGAAG 
AAGTCCGAAG 
AAGTCCGAAG 
AAGTCCGAAG 



msal78297.2{l04_090 
msal78297 . 2 { 104_18RS21 
rasal78297.2{l04_2603 
tnsal7B297 . 2 {104_CJB110 
msal78297 . 2 f 104_COH1 
msal78297 .2?104_M732 
msal78297 .2{104_A909 
msal78297.2{104_M781 
msal78297 . 2 { 104_JM9130013 
Consensus 



2101 

AGTGAAAAAG 
AGTGAAAAAG 
AGTGAAAAAG 
AGTGAAAAAG 
AGTGAAAAAG 
AGTGAAAAAG 
AGTGAAAAAG 
AGTGAAAAAG 
AGTGAAAAAG 



AACCAAATAC 
AACCAAATAC 
AACCAAATAC 
AACCAAATAC 
AACCAAATAC 
AACCAAATAC 
AACCAAATAC 
AACCAAATAC 
AACCAAATAC 



TATTCGTGAT 
TATTCGTGAT 
TATTCGTGAT 
TATTCGTGAT 
TATTCGTGAT 
TATTCGTGAT 
TATTCGTGAT 
TATTCGTGAT 
TATTCGTGAT 



TTCCCAATTC 
TTCCCAATTC 
TTCCCAATTC 
TTCCCAATTC 
TTCCCAATTC 
TTCCCAATTC 
TTCCCAATTC 
TTCCCAATTC 
TTCCCAATTC 



2150 
CCAAAATTCG 
CCAAAATTCG 
CCAAAATTCG 
CCAAAATTCG 
CCAAAATTCG 
CCAAAATTCG 
CCAAAATTCG 
CCAAAATTCG 
CCAAAATTCG 



msal78297 .2 (l04_090> 
msal7B297 . 2 { 104_18RS21) 
msal78297 . 2 { 104_2603 [ 
msal78 2 97 . 2 { 104_CJB1 10 
tnsal78297.2(l04 COH1 
msal78297 . 2 { 104J4732 
maal78297 . 2 f 104_A909 
msal78297 . 2 { 104_M781 
msal78297 . 2 { 104_JM9130013 
Consensus 



2151 

TGATGTTCGT 
TGATGTTCGT 
TGATGTTCGT 
TGATGTTCGT 
TGATGTTCGT 
TGATGTTCGT 
TGATGTTCGT 
TGATGTTCGT 
TGATGTTCGT 



GAGTTTCCGG 
GAGTTTCCGG 
GAGTTTCCGG 
GAGTTTCCGG 
GAGTTTCCGG 
GAGTTTCCGG 
GAGTTTCCGG 
GAGTTTCCGG 
GAGTTTCCGG 



TACTAACCAT 
TACTAACCAT 
TACTAACCAT 
TACTAACCAT 
TACTAACCAT 
TACTAACCAT 
TACTAACCAT 
TACTAACCAT 
TACTAACCAT 



CAGTAATCAg 
CAGTAATCAg 
CAGTAATCAg 
CAGTAATCAg 
CAGTAATCAg 
CAGTAATCAg 
CAGTAATCAg 
CAGTAATCAg 
CAGTAATCAa 



2200 
AAGAAAATGG 
AAGAAAATGG 
AAGAAAATGG 
AAGAAAATGG 
AAGAAAATGG 
AAGAAAATGG 
AAGAAAATGG 
AAGAAAATGG 
AAGAAAATGG 



msal78297 .2(104 090 
msal78297.2{l04_18RS21 
msal78297 . 2{ 104_2603 
msal78297.2{l04_CJB110 
rasal78297 . 2{ 104_COH1 
msal78297 . 2( 104_M732 
msal78297.2(104 A909 
msal78297 . 2{ 1043-17B1 
msal78297 ,2{104_JM9130013 
Consensus 



2201 

GTGAGGTTGA 
GTGAGGTTGA 
GTGAGGTTGA 
GTGAGGTTGA 
GTGAGGTTGA 
GTGAGGTTGA 
GTGAGGTTGA 
GTGAGGTTGA 
GTGAGGTTGA 



ATTTATTAAA 
ATTTATTAAA 
ATTTATTAAA 
ATTTATTAAA 
ATTTATTAAA 
ATTTATTAAA 
ATTTATTAAA 
ATTTATTAAA 
ATTTATTAAA 



GTTAATAAAG 
GTTAATAAAG 
GTTAATAAAG 
GTTAATAAAG 
GTTAATAAAG 
GTTAATAAAG 
GTTAATAAAG 
GTTAATAAAG 
GTTAATAAAG 



ACAAACATTC 
ACAAACATTC 
ACAAACATTC 
ACAAACATTC 
ACAAACATTC 
ACAAACATTC 
ACAAACATTC 
ACAAACATTC 
ACAAACATTC 



2250 
AGAATCGCTT 
AGAATCGCTT 
AGAATCGCTT 
AGAATCGCTT 
AGAATCGCTT 
AGAATCGCTT 
AGAATCGCTT 
AGAATCGCTT 
AGAATCGCTT 



msal78297 
msal78297.2{ 
msal78297. 
msal7B297.2{ 
msal78297 
msal78297 
msal78297. 
msal78297. 
msal78297.2{l04 



2{104_090 
104_18RS21 
2{l04_2603 
104_CJB110 
2(104 COH1 
2 f 1043-1732 
2(104_A909 
2(104_M781 
JM9 130013 
Consensus 



2251 

TTGGGAGCTA 
TTGGGAGCTA 
TTGGGAGCTA 
TTGGGAGCTA 
TTGGGAGCTA 
TTGGGAGCTA 
TTGGGAGCTA 
TTGGGAGCTA 
TTGGGAGCTA 



AGTTTCAACT 
AGTTTCAACT 
AGTTTCAACT 
AGTTTCAACT 
AGTTTCAACT 
AGTTTCAACT 
AGTTTCAACT 
AGTTTCAACT 
AGTTTCAACT 



TCAGATAgAA 
TCAGATAgAA 
TCAGATAgAA 
TCAGATAgAA 
TCAGATAgAA 
TCAGATAgAA 
TCAGATAgAA 
TCAGATAgAA 
TCAGATAaAA 



AAAGATTTTT 
AAAGATTTTT 
AAAGATTTTT 
AAAGATTTTT 
AAAGATTTTT 
AAAGATTTTT 
AAAGATTTTT 
AAAGATTTTT 
AAAGATTTTT 



2300 
CTGGGTATAA 
CTGGGTATAA 
CTGGGTATAA 
CTGGGTATAA 
CTGGGTATAA 
CTGGGTATAA 
CTGGGTATAA 
CTGGGTATAA 
CTGGGTATAA 



msal78297 .2{l04_090 
msal78297 . 2 { 104_18RS21 
ntsa!78297.2{l04 2603 
msal7B297 . 2 { 104_CJB110 
msal78297 . 2 { 104_COH1 
msal78297 . 2 { 104 J4732 
msal7B297 . 2{ 104_A909 
msal78297.2{l04_M781 
msal78297 . 2 { 104_JM9130013 
Consensus 



2301 

GCAATTTGTT 
GCAATTTGTT 
GCAATTTGTT 
GCAATTTGTT 
GCAATTTGTT 
GCAATTTGTT 
GCAATTTGTT 
GCAATTTGTT 
GCAATTTGTT 



CCAGAGGGAA 
CCAGAGGGAA 
CCAGAGGGAA 
CCAGAGGGAA 
CCAGAGGGAA 
CCAGAGGGAA 
CCAGAGGGAA 
CCAGAGGGAA 
CCAGAGGGAA 



GTGATGTTAC 
GTGATGTTAC 
GTGATGTTAC 
GTGATGTTAC 
GTGATGTTAC 
GTGATGTTAC 
GTGATGTTAC 
GTGATGTTAC 
GTGATGTTAC 



AACAAAGAAT 
AACAAAGAAT 
AACAAAGAAT 
AACAAAGAAT 
AACAAAGAAT 
AACAAAGAAT 
AACAAAGAAT 
AACAAAGAAT 
AACAAAGAAT 



2350 
GATGGTAAAA 
GATGGTAAAA 
GATGGTAAAA 
GATGGTAAAA 
GATGGTAAAA 
GATGGTAAAA 
GATGGTAAAA 
GATGGTAAAA 
GATGGTAAAA 



msal78297 . 2 { 104_090 
msal78297 . 2 { 104_18RS21 
insal78297 . 2 { 104J2603 
msal78297 . 2 { 104_CJB110 
tnsal7 8 2 97 . 2 { 104_COH1 
msal7B297.2{l04 M732 
msal78297 . 2 ( 104_A909 
maal78297 . 2{ 104_M781 
msal78297 . 2 { 104_JM9130013 
Consensus 



2351 

TTTATTTTAA 
TTTATTTTAA 
TTTATTTTAA 
TTTATTTTAA 
TTTATTTTAA 
TTTATTTTAA 
TTTATTTTAA 
TTTATTTTAA 
TTTATTTTAA 



AGCACTTCAA 
AGCACTTCAA 
AGCACTTCAA 
AGCACTTCAA 
AGCACTTCAA 
AGCACTTCAA 
AGCACTTCAA 
AGCACTTCAA 
AGCACTTCAA 



GATGGTAACT 
GATGGTAACT 
GATGGTAACT 
GATGGTAACT 
GATGGTAACT 
GATGGTAACT 
GATGGTAACT 
GATGGTAACT 
GATGGTAACT 



ATAAATTATA 
ATAAATTATA 
ATAAATTATA 
ATAAATTATA 
ATAAATTATA 
ATAAATTATA 
ATAAATTATA 
ATAAATTATA 
ATAAATTATA 



2400 
TGAAATTTCA 
TGAAATTTCA 
TGAAATTTCA 
TGAAATTTCA 
TGAAATTTCA 
TGAAATTTCA 
TGAAATTTCA 
TGAAATTTCA 
TGAAATTTCA 



msal78297.2{l04 090) 
rasal78297 . 2 { 104_18RS21J 



2401 2450 
AGTCCAGATG GCTATATAGA GGTTAAAACG AAACCTGTTG TGACATTTAC 
AGTCCAGATG GCTATATAGA GGTTAAAACG AAACCTGTTG TGACATTTAC 



743 



WO 2004/018646 



PCT/US2003/026827 



Table 41: Comparative Sequences relating to SAG0649 



msal78297 . 2 { 104_2603 
maal78297 . 2 { 104_CJB110 
msal78297 . 2 ( 104_COH1 
msal78297 . 2* 104__M732 
msal7B297.2{104 A909 
maal78297 . 2 (104_M781 
tnsal78297.2{l04_JM9130013 
Consensus 



msal78297 . 2 { 104_090 
msal78297 . 2 { 104_18RS21 
msal78297 . 2 { 104_2603 
msa!78 297 . 2 { 104_CJB110 
maal78297.2(l04_COHl \ 
msal78297.2 104_M732* 
. msal78297.2 i>O4_A909 
msal78297 . 2(104 M781 
rasal782 97 . 2 { 104_JM9130013 
" Consensus 



msal78297 . 2 {104_090 \ 
msal78297.2{l04 18RS21, 
msal78297.2{l04_2603 i 
msal78297 . 2 { 104_CJB110 
msal78297.2{l04 COH1 
msal78297.2(l04_M732 
tnsal78297.2{l04 A909 
msal78297.2{l04"M781 
msal78297.2{l04_JM9130013 
Consensus 



msal78297 . 2 { 104_O90 
msal78297 . 2 { 104_18RS21 
msal78297 . 2 { 104_2603 
msal78297 . 2 { 104_CJB110 



AGTCCAGATG 
AGTCCAGATG 
AGTCCAGATG 
AGTCCAGATG 
AGTCCAGATG 
AGTCCAGATG 
AGTCCAGATG 



maaX78297.2 
msal78297.2 
msal78297.2 
msal78297.2 



104_COH1 
104_M732 
104_A909 
104 M781 



GCTATATAGA 
GCTATATAGA 
GCTATATAGA 
GCTATATAGA 
GCTATATAGA 
GCTATATAGA 
GCTATATAGA 



GGTTAAAACG 
GGTTAAAACG 
GGTTAAAACG 
GGTTAAAACG 
GGTTAAAACG 
GGTTAAAACG 
GGTTAAAACG 



AAACCTGTTG 
AAACCTGTTG 
AAACCTGTTG 
AAACCTGTTG 
AAACCTGTTG 
AAACCTGTTG 
AAACCTGTTG 



TGACATTTAC 
TGACATTTAC 
TGAC ATTTA C 
TGACATTTAC 
TGACATTTAC 
TGACATTTAC 
TGACATTTAC 



2451 

AATTCAAAAT 
AATTCAAAAT 
AATTCAAAAT 
AATTCAAAAT 
AATTCAAAAT 
AATTCAAAAT 
AATTCAAAAT 
AATTCAAAAT 
AATTCAAAAT 



GGAGAAGTTA 
GGAGAAGTTA 
GGAGAAGTTA 
GGAGAAGTTA 
GGAGAAGTTA 
GGAGAAGTTA 
GGAGAAGTTA 
GGAGAAGTTA 
GGAGAAGTTA 



CGAACCTGAA 
CGAACCTGAA 
CGAACCTGAA 
CGAACCTGAA 
CGAACCTGAA 
CGAACCTGAA 
CGAACCTGAA 
CGAACCTGAA 
CGAACCTGAA 



AGCAGATCCA 
AGCAGATCCA 
AGCAGATCCA 
AGCAGATCCA 
AGCAGATCCA 
AGCAGATCCA 
AGCAGATCCA 
AGCAGATCCA 
AGCAGATCCA 



2500 
AATGCTAATA 
AATGCTAATA 
AATGCTAATA 
AATGCTAATA 
AATGCTAATA 
AATGCTAATA 
AATGCTAATA 
AATGCTAATA 
AATGCTAATA 



2501 

AAAATCAAAT 
AAAATCAAAT 
AAAATCAAAT 
AAAATCAAAT 
AAAATCAAAT 
AAAATCAAAT 
AAAATCAAAT 
AAAATCAAAT 
AAAATCAAAT 



msal78297.2{L04_JM9130013 
Consensus 



msal78297 . 2 { 104_090 \ 
msal78297 . 2 {104_18RS21 
msal78297 .2{104_2603 
meal78297 . 2 { 104_CJB110 
ntsal78297 . 2 f 104 COH1 
msal78297 . 2 (104_M732 
msal782 97.21 104_A90 9 
msal78 297 . 2 { 104_M781 
maal78297 .2{104_JM9130013 
*~ Consensus 



CGGGTATCTT 
CGGGTATCTT 
CGGGTATCTT 
CGGGTATCTT 
CGGGTATCTT 
CGGGTATCTT 
CGGGTATCTT 
CGGGTATCTT 
CGGGTATCTT 



GAAggaaatg 
GAAggaaatg 
GAAggaaatg 
GAAggaaatg 
GAAggaaatg 
GAAggaaatg 
GAAggaaatg 
GAAggaaatg 
GAA 



gtaaacatct 
gtaaacatct 
gtaaacatct 
gtaaacatct 
gtaaacatct 
gtaaacatct 
gtaaacatct 
gtaaacatct 



2550 
tattaccaac 
tattaccaac 
tattaccaac 
tattaccaac 
tattaccaac 
tattaccaac 
tattaccaac 
tattaccaac 



2551 2600 

actcccaaac gcccaccagg tgtt — - 

actcccaaac gcccaccagg tgtt-- — 

actcccaaac gcccaccagg tgtttttcct aaaacagggg gaattggtac 

actcccaaac gcccaccagg tgtt 

actcccaaac gcccaccagg tgtt 

actcccaaac gcccaccagg tgtt — 

actcccaaac gcccaccagg tgtt-— — - ---- — -— - 

actcccaaac gcccaccagg tgtt— 



2601 



2650 



aattgtctat atattagttg gttctacttt tatgatactt accatttgtt 



msal78297 . 2 { 104_090 \ 
msal78297.2{l04 18RS21 
msal78297 . 2 { 104_2603 
msal78297.2{l04 CJB110 
msal78297.2{ 104_COH1 
msal78297. 2(104 M732 
msal7B297 . 2 { 104~A909 
msal78297 .2{104_M781 
maal78297 . 2 { 104_JM9130013 
Consensus 



2651 



2670 



ctttccgtcg taaacaattg 



744 



WO 2004/018646 



Table 41: Comparative Sequences relating to SAG0649 



SEQ ZD HO. 4110 s SAG0649 FROM 2603 V/R GBS TYPE V STRAIN 
MKKRQKI WRGLSVTLLI LSQ I PFG I LVQGETQDTNQALGKVI VKKTGDNATPLGKATFVL 
KNDNDKSETSHETVEGSGEATFF^I KPGDYTLREETAPIGYKKTDOT I 
EGMDADKAEKRKEVLNAQYPKSAIYEDTKENYPLVNVEGSKVGEQY^ 
IAEGWLSKKITGVNDLDKNKYKI BLTVEGKTTVBTKBLNQPLDVVVLLDNSNSMNNERAN 
NS QRALKAGEAVEKL I D KI T SNKDNRVALVTY AST I FDGTEATVS KGVADQNGKALNDS V 
SWDYHKTTFTATTHNYSYLNLTNDANEVN I LKSRI PKEAEHINGDRTLYQFGATFTQKAL 
MKANE I LETQSSNARKKLI FHVTDGVPTM S YAINFNPYI STSYQNQFNSFLNKI PDRSGI 
LQEDFI INGDDYQIVKGDGESFKLPSDRKVPVTGGTTOAAYRVPQNQLSVMSNEGYAINS 
GYI YLYWRDYNWWP FDPKTKKVSATKQI KTHGEPTTLYFNGN I RPKGYDI FTVGI GVNG 
DPGATPLEAEKFMQS I SSKTBNYTNVDDTNIU YDELNKYFKT I VBEKHS I VDGNVTDPMG 
EM I E FQL KNGQ S FTHDD YVLVGNDG SQLKNGVALGGPNSDGG I LKDVTVTYDKTS QT I KI 
NHLNI/3SGQKVVLTYDVRLKDNYI SNKFYNTNNRTTLSPKSEKEPNTI RDFPI PKI RDVR 
EFPVLTI SNQKKMGEVEFI KVNKDKHSESLLGAKFQLQI EKDFSGYKQFVPEGSDVTTKN 
DGKI YFKALQDGNYKIjYEI SSPDGY I EVKTKPVVTFT IQNGEVTHLKADPNANKNQI GYL 
EGNGKHLITNTPKRPPGVFPKTGGIGTIVYILVGSTFMILTICSFRRKQL 

SEQ ID NO. 4111: SAG0649 FROM 090 GBS TYPE la STRAIN 
GBTQDTNQALGKVI VKKTGDNATPLGKATFVIiKNDNDKSBTSHBTVEGSGEATFENI KPG 
DYTLREETAP I GYKKTD KTWKVKVADNGAT 1 1 EGMDADKAEKRKEVLNAQYPKSAI YEDT 
KENYPXjVNVEGSKVGEQYKALNPINGKDGRREIAEGWLSKKITGVNDIiD 
GKTTVETKELNQ PLDVVVLLDN SNSMNNERANNS QRALK^ 

LVTYAST I FDGTEATVS KGVADQNG KALNDSVS WD YHKTT FTATTHNYS YLNLTNDANEV 
N I LKSRI PKEAEHI NGDRTLYQFGATFTQ KALMKANE I LETQS SNARKKLI FHVTDG VPT 
MS YA I NFNPY I STSYQNQFNSFLNKI PDRSGI LQEDF I INGDDYQ I VKGDGESFKLFSDR 
KVPVTGGTTQAAYRVPQNQLSVMSNEGYAINS<?YIYLYWRDYNWV^ 
I KTHGEPTTLYFNGNI RPKGYDI FTVGIGVNGDPGATPLEAEKFMQS I SSKTENYTNVDD 
TNKJYDBLNKYFKTIVEEKHSIVDGNVTDPMGEMIEFQLKNGQSFTHDDY^^ 
KNGVALGGPNSDGGILKDVTVTYDKTSQTI KINHLNLGSGQKVVLTYDVRLKDNYISNKF 
YNTNNRTTLSPKSEKEPNTIRDFPI PKIRDVREFPVIiTI SNQKKMGEVEFI KVNKDKHSE 
SLI/SAKFQLQIEKDFSGYKQFVPEGSDVTTKNDGKIYFKAIiQDGNYKLYEI SSPDGYIEV 
KTKPWTFTI QNGBVTNLKADPNANKNQI GYLEGNGKHL ITNTPKRPPGV 

SEQ ID NO. 4112: SAGO 649 FROM A909 GBS TYPE la STRAIN 

GBTQDTNQALGKVI VKKTGDNATPLGKATFVLKNDNDKSETSHETVEGSGEATFENI KPG 
DYTLFJ2ETAP I GYKKTD KTWKVKVADNGAT 1 1 EGMDADKAEKRKEVLNAQYPKSAIYEDT 
KENYPLVNVEGS KVGEQYKALNP I NGKDGRRE I AEGWLS KKI TGVNDLDKNKYKI ELTVE 
GKTTVETKELNQPLDVVVLI^NSNSMNNERANNSQRAIiK^^ 

LVTYAST I FDGTEATVSKGVADQNGKALNDSV SWDYHKTTFTATTHNYS YLNLTNDANEV 
N I LKSRI PKEAEH I NGDRTLYQFG ATFTQKALMKANE I LETQSSNARKKLI FHVTDG VPT 
MSYAINFNPYI STS YQNQFNSFLNKI PDRSGI LQEDFI I NGDDYQI VKGDGESFKLFSDR 
KVPVTGGTTQAAYRVPQNQLSVMSNEGYAINSGY I YLYWRDYNWVYP FDPKTKKVSATKQ 
I KTHGEPTTLYFNGNI RPKGYD I FTVGIGVNGDPGATPLEAEKFMQS I SSKTENYTNVDD 
TNKI YDELNKYFKTI VEEKHS I VDGNVTDPMGEM I E FQLKNGQS FTHDDYVLVGNDGSQL 
KNGVALGGPN SDGG I LKDVTVTYD KTSQT I KI NHLNLGSGQKVVLTYDVRLKDNY I S NKF 
YNTNNRTTLSPKSEKEPNT I RDFP I PKI RDVREFPVLTI SNQKKMGEVEFI KVNKDKHSE 
SLLGAKFQLQ I EKDFSGYKQFVPEGSDVTTKNDGKI YFKALQDGNYKLYEI SSPDGY I EV 
KTKPWTFT I QjHGEVTNLKADPNANKNQI GYLEGNGKHL ITNTPKRPPGV 

SEQ ID NO. 4113: SAG0649 FROM 18RS21 GBS TYPE II STRAIN 

GETQDTNQALGKVI VKKTGDNATPLGKATFVLKNDNDKSF/TSHETVEGSGEATFENI KPG 

DYTLREETAP I GYKKTD KTWKVKVADNGATI I EGMDADKAEKRKEVLNAQYPKSAIYEDT 

KENY PLVNVEGS KVGEQYKALNP I NGKDGRRE I AEGWLS KKI TG VNDLDKNKYKI ELTVE 

GKTl'VKl'KELNQPLDVVVLLDNSNSMNNERANNSQRALKAGEAVE 

LVTYAST I FDGTFJ\TVSKEVADQNGKALNDSVSWDYHKTTFTATTHNYSY 

NI LKSRI PIG2AEHINGDRTLYQEGATFTQKALMKANEI LETQSSNARKKLI FHVTDGVPT 

MS YAI NFNPY I STSYQNQFNS FLNKI PDRSGI LQEDF I INGDDYQI VKGDGESFKLFSDR 

KVPVTGGTTQAAYRVPQNQLSVMSNEGYA INSGY I YLYWRDYNWVYP FD PKTKKV SATKQ 

I KTHGEPTTLYFNGNI RPKGYD I FTVG IGVNGD PGATPLEAEKFMQS I SSKTENYTNVDD 

TNKIYDBLinCYFKTIVBEKHSIVDGNVTDPMGEMIBFQLKNGQ 

KNGVALGGPNSDGG I LKDVTVTYDKTSQT I KINHLNLGSGQKVVLTYDVRLKDNYI SNKF 
YNTNNRTTLS PKSEKEPNT I RDFP I PKI RDVREFPVLTI SNQKKMGEVEFI KVNKDKHSE 
SLLGAKFQLQ I EKDFSGYKQFVPEGSDVTTKNDGKI YFKAI^DGNYKLYEI SS PDGYI EV 
KTKPWT FT I QNGEVTNLKADPNANKNQ I G YLEGNGKHL I TNTP KRPPGV 

SEQ ID NO. 4114 1 SAGO 649 FROM M732 GBS TYPE III STRAIN 
GETQDTNOAIiGKVIVKKTGDNATPLGKATFVLKNDND KPG 
DYTLREETAP I GYKKTD KTWKVKVADNGAT 1 1 EGMDADKAEKRKEVLNAQYPKSAIYEDT 
KENYPLVNVEGS KVGEQY KALN P I NGKDGRRE I AEGWLS KKNTGVNDLDKNKYKI ELTVE 
G K.TT V KT K ELNQPLDWVLLDNSNSMNNE RANNSQ RALKAGEAVBKL I DKI TSNKDNRVA 
LVTYAST I F DGTEATVS KG VADQNG KALNDSVS WD YHKTTFTATTHNYS YLNLTNDANEV 
NI LKSRI PKEAEHINGDRTLYQFGATFTQKALMKANE I LETQSSNARKKLI FHV^^ 
MSYAINFNPYISTSYQNQFNSFLNKIPDRSGILQEDFIINGDDYQIVKGDGESFKLFSDR 
KVPVTGGTTQAAYRVPQNQLSVMSNEGYAINSGY I YLYWRDYNWVYP FD PKT KKVSATKQ 
IKTHGEPTTLYFNGNIRPKGYDIFTVGIGWGDPGATPIiBAEKFMQSIS 
TNK3 YDBINKYFKTI VBEKHSI VDGNVTDPMGEM I EFQLKNGQS FTHDDYVLVGNDGSQL 
KNGVALGGPNSDGG I LKDVTVTYDKTSQT I KINHLNIX3SGQKVVLTYDVRLKTJNYT SNKF 
YNTNNRTTLS PKSEKEPNT I RDFP I PKI RDVREFPVLT I SNQKKMGEVEFI KVNKDKHSE 
SLLGAKFQLQ I EKDFSGYKQFVPEGSDVTTKNDGKIYFKAI^DGNYKLYE I SSPDGYIF^ 
KTKPVVTFTIQNGEVTNLKADPNANKNQIGYLBGNGK^ 

SEQ ID NO. 4115: SAG0649 FROM COH1 GBS TYPE III STRAIN 

GETQDTNQAIX5KVIVKKTGDNATPLGKATFVLKNDNDKSBT 
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DYTLREBTAP I GYKKTDKTWKVKVADNGAT 1 1 EGMDADKAEKRKEVLNAQYPKSAI YEDT 

KENYPLVNVEGSKVGEQYKALNPINGKTXSRREIAEGWLSKKNTG^ ELTVB 

GKTTVETKBUIQPLDVVVLLDNSNSMNNERANNSQRAIJCAG 

LVTYASTI FDGTEATVSKGVADQNGKALNDSVSWDYHKTTFTATTHNYSYL^ 

NI LKSRI PKEAEHINGDRTLYQFGATFTQKALMKANBII»ETQSSNARKKLI PHVTDGVPT 

MS YAI NFNPY I STS YQNQFNSFLNKI PDRSGILQEDPI INGDDYQIVKGDGESFKLFSDR 

KVPVTGGTTQAAYRVPQNQLSVMSNEGYAINSGYIYL^ 

IKTHGEPTTLYFNGNI RPKGYD I FTVG I GVNGDPG AT PLEAEKPMQS I SSKTENYTNVDD 
TNKI YDBLNKYFKT I VEEKHS I VDGNVTDPMGEM I EFQLKNGQS FTHDDYVLVGNDGSQL 
KNGVALGGPNSDGG I LKDVTVTYDKTSQT I KI NHLNIiGSGQKWLTYDVRLKDNYI SNKF 
YNTNNRTTIJSPKSEKEPOTIRDFPIPK1RDVREFPVLTISNQKKMGEVEFIKV^^<DKHSE 
SLLGAKFQLQIEKDFSGYKQFVPEGSDVTTKNIX3KIYFKAIX3IX3NYK^ 
KTKP WTFT I QNGEVTNLKADPNANKNQI GYLEGNGKHLI TNTPKRPPGV 

SBQ ID MO. 4115 s SAG0649 FROM M781 GBS TYPE ZZX STRAIN 

CnCVIVKKTGDTATPLGKATFVLKNDNDKSETSHETVEGSGKATFENI KPGDYTLREETAP 
IGYKKTDKTWKVKVADNGAX 1 1 EGMDADKAEKRKEVLNAQ YPKSAI YEDTKENYPLVNVE 
GSKVGEQYKALNPI NGKDGRRBIAEGWLSKKITGVNDLDKNKYKI ELTVEGKTTVETKEL 
NQPLD WVLLDNSNSMNNERANNSQRALKAGEAVEKL I DKITSNKDNRVALVTYAST I FD 
GTEATVS KGVADQNGKALND SVSWD YHKTTFTATTHNYS YliNLTNDANEVNI LKS R I PKE 
AEHI NGDRTLYQFGATFTQKALMKANB I LETQS SNARKKL I FHVTDGVPTMSYAINFNPY 
I STS YQNQFNSFLNKI PDRSGI LQEDF I INGDDYQ IVKGDGESFKLFSDRKVFVTGGTTQ 
AAYRVPQNQLSVMSNEGYAINSGYI YLYWRDYNWVYP FDPKTKKVSATKQI KTHGEPTTL 
YFNGN I RPKGYD I FTVG I GVNGDPGATPLEAE KFMQS I S S KTENYTNVDDTNKI YDELNK 
YFKTI VBBKHS I VDGNVTDPMGEM I EFQLKNGQS FTHDDYVLVGNDGSQLKNGVAI/3GPN 
SDGGILKDVTVTYDKTSQTI KI NHLNLGSGQKVVLTYDVRLKDNY I SNKFYNTNNRTTLS 
PKSEKEPNTIRDFPIPKIRDVRBFPVLTISNQKKMGEVEFIKVNKDKHSESLLGAKFQLQ 
I EKDFSGYKQFVPEGSDVTTKNDGKI YFKALQDGNYKLYE I SSPDGY I EVKTKPWTFTI 
QNGEVTNLKADPNANKNQIGYLEGNGKHLITOTPKRPPGV 

SEQ ID NO. 4117 a SAGO 649 FROM CJB110 GBS NONTYPEABLE STRAIN 

GETQDTNQALGKVI VKKTGDNATPLGKAT FVLKNDNDKSETSHETVEGSGXATFEN I KPG 
DYTLREBTAPI GYKKTDKTWKVKVADNGATI I EGMDADKAEKRKEVLNAQYPKSAI YEDT 
KENYPLVNVEGSKVGEQYKAIiNPINGKDGRREIAEGWLSKKIT 

G KTI'V KT KBLNQPLDVWLLDN SNSMNNE RANNSQRALKAGEAVE KLIDKI TSNKDNRVA 

LVTYAST I FDGTEATVSKGVADQNGKALNDSVSWDYHKTTFTATTHNYSYLNL^ 

NI LKSRI PKEAEHINGDRTLYQFGATFTQKALMKANE I LETQSSNARKKLI FHVTDGVPT 

MSYAINFNPY I STS YQNQFNSFLNKI PDRSGI LQBDPI INGDDYQIVKGDGESFKLFSDR 

KVPVTGGTTQAAYRVPQNQLSVMSNEGYAINSGYIYLYWRDYNWVYPFDPOT 

I KTHGEPTTLYFNGNI RPKGYD I FTVGIGVNGDPGATPLEAEKFMQS I SSKTENYTNVDD 

TNKIYDBLNKYFKTIVEEKHSIVDGNVTDPMGEMIEFQIjKNG 

KNGVALGGPNSDGGI LKDVTVTYDKTSQT I KI NHLNLGSGQKVVLTYDVRLKDNY I SNKF 
YNTNNRTTLSPKSEKEPNTIRDFPIPKIRDVREFPVLTISNQKKMGETO 
SLLGAKFQljQIEKDFSGYKQFVPEGSDVTTKNDGKIYFKALQDGNYKLYEISSPDGYIEV 
KTlO?VVTFTIQNGEVTNLKADPNANKNQIGYLEGNGKHLITNTPKRPPGV 

SEQ ID NO. 4118* SAG0649 FROM JM9130013 GBS TYPE VIII STRAIN 

GETQDTNOALGKVIVKKIX3DNATPLGKATFVLKNDN KPG 
DYTLRBETAPIGYKKTDKTWKVKVADNGATI I EGMDADKAEKRKEVLNAQYPKSAI YEDT 
KENYPLVNVEGSKVGEQYKALNPINGKDGRREIAEGWLSKKITGVNDLDK^ 
GKTTVETKELNQPIJ3VVVLLDNSNSMNNEPJtt^ 

LVTYASTI FDGTEATVSKGVADQNGKAIiNDSVSWDYHKTTFTATTHNYS YLNLTNDANEV 
NI LKSRI PKEAEH I NGDRTLYQFGATFTQKALMKANB I LBTQSSNARKKL I FHVTDGVPT 
MSYA I NFNPY I STSYQN QFNS FLNKI PDRSG I LQEDF 1 1 NGDD YQ I VKGDGE SFKLF SDR 
KVPVTGGTTQAAYRVPQNQLSVMSNEGYAINSGY I YLYWRDYNWVYP FDPKTKKVSATKQ 
I KrHGEPTTLYFNGNIRPKGYD I FTVG IGVNGDPGATPLEAEKFMQS I SSKTENYTNVDD 
TNKIYDELNKYFKTIVEEKHSIVDGNVTDPMGEMI EFQLKNGQSFTHDDYVLVGNDGSQL 
KNGVALGGPNSDGGILKDVTVTYDKTSQTI KINHLNLGSGQKVVLTYDVRLKDNY I SNKF 
YNTNNRTTLS PKSEKEPNT I RDFP I PKI RDVREF PVLTI SNQKKMGEVBF I KVNKDKHSE 
SLIiGAKF^LQIKKDFSGYKQFVPEGSDVTTKNDGKI YFKALQDGNYKLYEI SSPDGYIBV 
KTKP WTFT I QNGE VTNLKADPNANKNQI GYLE 
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PRETTY o£i /biotmp/msal78371.2{*} May 12, 2003 09x25 



1 50 

ge tqdtnqalGK VIVKKTGDnA 

GK VIVKKTGDtA 

ge tqdtnqalGK VIVKKTGDnA 

ge tqdtnqalGK VIVKKTGDnA 

ge tqdtnqalGK VIVKKTGDnA 

ge tqdtnqalGK VIVKKTGDnA 

mkkrqkiwrg- lsvtllilsq ipfgilvqge tqdtnqalGK VIVKKTGDnA 

2{l04~A909} ge tqdtnqalGK VIVKKTGDnA 

msal78371.2{l04_JM9130013} ^V^-l** Y**l^**^ 



maal78371.2{l04_CJB110} 
msal78371 . 2 { 104_M781 > 
msal78371 . 2 { 104_COK1 J 
msal78371.2{104_M732J 
rasal7 8 37 1 . 2 { 104_0 9 0 J 
msal78371.2{l04_18RS21> 
msal78371 . 2 { 104_2603 } 
msal78371 . 2 { 104_A909 } 



Consensus 

51 

msal7B371.2{l04_CJB110} TPLGKATFVL 

msal78371.2{l04_M78l) TPLGKATFVL 

l«sal78371 . 2 { 104_COHlj TPLGKATFVL 

rasal78371.2{104_M732) TPLGKATFVL 

msal7 8 3 7 1 . 2 { 1 04_09 0 ) TPLGKATFVL 

msal78371 . 2 { 104_18RS21 TPLGKATFVL 

msal78371.2(l04_2603 * TPLGKATFVL 

msal78371.2{104_A909 > TPLGKATFVL 

msal78371.2{l04_JM9130013) TPLGKATFVL 

Consensus ********** 



KNDNDKSETS 
KNDNDKSETS 
KNDNDKSETS 
KNDNDKSETS 
KNDNDKSETS 
KNDNDKSETS 
KNDNDKSBTS 
KNDNDKSETS 
KNDNDKSBTS 



HETVEGSGxA 
HBTVEGSGkA 
HETVEGSGxA 
HETVEGSGeA 
HBTVEGSGeA 
HETVEGSGeA 
HETVEGSGeA 
HETVEGSGeA 
HETVEGSGeA 



TFENIKPGDY 
TFENIKPGDY 
TFENIKPGDY 
TFENIKPGDY 
TFENIKPGDY 
TFENIKPGDY 
TFENIKPGDY 
TFENIKPGDY 
TFENIKPGDY 



100 

TLREETAPIG 
TLREBTAPIG 
TLREETAPIG 
TLREBTAPIG 
TLREBTAPIG 
TLREBTAPIG 
TLREETAPIG 
TLREBTAPIG 
TLREETAPIG 



msal78371 . 2 { 104_CJB110 
msa!78371 . 2 { 104_M781 . 
msal78371.2(l04_COHl f 
msal78371.2{104_M732 \ 
msal78371.2{l04_090 x 
rasal78371.2{l04_18RS21 
msal78371.2fl04_2603 
msal78371 . 2 { 104JV909 
msal78371 . 2 { 104_OM9130013 
Consensus 



101 

YKKTDKTWKV 
YKKTDKTWKV 
YKKTDKTWKV 
YKKTDKTWKV 
YKKTDKTWKV 
YKKTDKTWKV 
YKKTDKTWKV 
YKKTDKTWKV 
YKKTDKTWKV 



KVADNGAt I I 
KVADNGAxI I 
KVADNGAt I I 
KVADNGAt I I 
KVADNGAt I I 
KVADNGAt I I 
KVADNGAt I I 
KVADNGAt 1 1 
KVADNGAt I I 



EGMDADKAEK 
EGMDADKAEK 
EGMDADKAEK 
EGMDADKAEK 
EGMDADKAEK 
EGMDADKAEK 
EGMDADKAEK 
EGMDADKAEK 
EGMDADKAEK 



RKBVLNAQYP 
RKEVLNAQYP 
RKEVLNAQYP 
RKEVLNAQYP 
RKEVLNAQYP 
RKEVLNAQYP 
RKEVLNAQYP 
RKEVLNAQYP 
RKBVLNAQYP 



150 

KSAIYEDTKB 
KSAIYEDTKB 
KSAIYEDTKB 
KSAIYEDTKB 
KSAIYEDTKB 
KSAIYEDTKB 
KSAIYEDTKB 
KSAIYEDTKB 
KSAIYEDTKB 



151 

msal78371.2{l04_CJB110j NYPLVNVEGS 

msal7B371.2{l04J478l' NYPLVNVEGS 

msal78371.2ll04 COH1 NYPLVNVEGS 

msal7B371.2{104~M732) NYPLVNVEGS 

msal78371.2{l04_090 NYPLVNVEGS 

msal78371.2{l04_18RS21 NYPLVNVEGS 

tnsal78371. 2(104 2603 NYPLVNVEGS 

msal78371.2{l04_A909 NYPLVNVEGS 

msal78371.2{l04_JM9130013J NYPLVNVEGS 

Consensus ********** 



KVGEQYKALN 
KVGEQYKALN 
KVGEQYKALN 
KVGEQYKALN 
KVGEQYKALN 
KVGEQYKALN 
KVGEQYKALN 
KVGEQYKALN 
KVGEQYKALN 



PINGKDGRRE 
PINGKDGRRB 
PINGKDGRRE 



PINGKDGRRE 
PINGKDGRRE 
PINGKDGRRE 
PINGKDGRRE 
PINGKDGRRE 



lAEGWLSKKi 
lAEGWLSKKi 
IAEGWLSKKn 
lAEGWLSKKn 
lAEGWLSKKi 
lAEGWLSKKi 
lAEGWLSKKi 
lAEGWLSKKi 
lAEGWLSKKi 



200 

TGVNDLDKNK 
TGVNDLDKNK 
TGVNDLDKNK 
TGVNDLDKNK 
TGVNDLDKNK 
TGVNDLDKNK 
TGVNDLDKNK 
TGVNDLDKNK 
TGVNDLDKNK 



msal78371 . 2 { 104_CJB110 \ 
msal78371 . 2 ( 104_M78 1 
msal78371 . 2 { 104_COHl 
msal7 83 71 . 2 { 10 4_M732 
msal78371 . 2 {104_090 
msa!78371 .2 {104_18RS21 
msal78371.2fl04_2603 
msal78371 . 2{104_A909 
msal78371 . 2{ 104_JM9130013 . 

Consensus 



msal78371 . 2 { 104_CJB110 
msal78371.2fl04_M78i; 
msal78371.2{l04_COHl i 
msal783 71 . 2 { 104_M732 , 
msal7B371 . 2 { 104_090 
msal78371.2{l04_18RS21 
msal78371 . 2 (l04_2603 
msal78371 . 2 { 104JV909 
msal78371 . 2 { 104_JM9130013 
Consensus 



Bisal7837 1 . 2 { 104_CJB110 J 
msal78371.2(l04_M781 
msal78371.2(l04_COHl 
msal78371.2{104_M732 
msal78371.2{lO4_O90 

msal78371.2{l04_18RS21 
msal78371.2{l04_2603 
msal78371 . 2 { 104_A909 



201 

YKI ELTVEGK 
YKIELTVEGK 
YKI ELTVEGK 
YKIELTVEGK 
YKIELTVEGK 
YKIELTVEGK 
YKIELTVEGK 
YKIELTVEGK 
YKIELTVEGK 



TTVETKELNQ 
TTVETKELNQ 
TTVETKELNQ 
TTVETKELNQ 
TTVETKELNQ 
TTVETKELNQ 
TTVETKELNQ 
TTVETKELNQ 
TTVETKELNQ 



PLDVWLLDN 
PLDVWLLDN 
PLDVWLLDN 
PLDVWLLDN 
PLDVWLLDN 
PLDVWLLDN 
PLDVWLLDN 
PLDVWLLDN 
PLDVWLLDN 



SNSMNNERAN 
SNSMNNERAN 
SNSMNNERAN 



SNSMNNERAN 
SNSMNNERAN 
SNSMNNERAN 
SNSMNNERAN 



250 

NSQRALKAGE 
NSQRALKAGB 
NSQRALKAGE 
NSQRALKAGE 
NSQRALKAGE 
NSQRALKAGB 
NSQRALKAGE 
NSQRALKAGB 
NSQRALKAGE 



251 

AVEKLIDKIT 
AVEKLIDKIT 
AVEKLIDKIT 
AVEKLIDKIT 
AVEKLIDKIT 
AVEKLIDKIT 
AVEKLIDKIT 
AVEKLIDKIT 
AVEKLIDKIT 



SNKDNRVALV 
SNKDNRVALV 
SNKDNRVALV 
SNKDNRVALV 
SNKDNRVALV 
SNKDNRVALV 
SNKDNRVALV 
SNKDNRVALV 
SNKDNRVALV 



TYASTIFDGT 
TYASTIFDGT 
TYASTIFDGT 
TYASTIFDGT 
TYASTIFDGT 
TYASTIFDGT 
TYASTIFDGT 
TYASTIFDGT 
TYASTIFDGT 



EATVSKGVAD 
EATVSKGVAD 
EATVSKGVAD 
EATVSKGVAD 
EATVSKGVAD 
EATVSKGVAD 
EATVSKGVAD 
EATVSKGVAD 
EATVSKGVAD 



300 

QNGKALNDSV 
QNGKALNDSV 
QNGKALNDSV 
QNGKALNDSV 
QNGKALNDSV 
QNGKALNDSV 
QNGKALNDSV 
QNGKALNDSV 
QNGKALNDSV 



301 

SWDYHKTTFT 
SWDYHKTTFT 
SWDYHKTTFT 
SWDYHKTTFT 
SWDYHKTTFT 
SWDYHKTTFT 
SWDYHKTTFT 
SWDYHKTTFT 



ATTHNYSYLN 
ATTHNYSYLN 
ATTHNYSYLN 
ATTHNYSYLN 
ATTHNYSYLN 
ATTHNYSYLN 
ATTHNYSYLN 
ATTHNYSYLN 



LTNDANBVNI 
LTNDANBVNI 
LTNDANBVNI 
LTNDANBVNI 
LTNDANBVNI 
LTNDANBVNI 
LTNDANBVNI 
LTNDANBVNI 



LKSRIPKBAE 
LKSRIPKBAE 
LKSRIPKBAE 
LKSRIPKBAE 
LKSRIPKBAE 
LKSRIPKBAE 
LKSRIPKBAE 
LKSRIPKBAE 



350 

HINGDRTLYQ 
HINGDRTLYQ 
HINGDRTLYQ 
HINGDRTLYQ 
HINGDRTLYQ 
HINGDRTLYQ 
HINGDRTLYQ 
HINGDRTLYQ 
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msal78371.2{l04_JM9130013) SWDYHKTTFT ATTHNYSYLN LTNDANEVNI LKSRIPKEAE HINGDRTLYQ 
*~ Consensus ********** ********** ********** ********** ********** 



msal78371 . 2 { 104_CJB110 
msal78371.2(l04 M781 
msal78371.2(104~COHl 
Ittsal78371 . 2 { 104J473 2 
msal78371 . 2 { 104_090 
msal78371.2{l04 16RS21 
rasal78371 . 2 { 104_2603 
msal7B371.2{104_A909 
msal78371.2{l04_JM9130013 
Consensus 



351 

FGATFTQKAL 
FGATFTQKAL 
FGATFTQKAL 
FGATFTQKAL 
FGATFTQKAL 
FGATFTQKAL 
FGATFTQKAL 
FGATFTQKAL 
FGATFTQKAL 



MKANBILETQ 
MKANBILETQ 
MKANBILETQ 
MKANBILETQ 
MKANEILETQ 
MKANBILETQ 
MKANBILETQ 
MKANBILETQ 
MKANEILETQ 



SSNARKKLIF 
SSNARKKLIF 
SSNARKKLIF 
SSNARKKLIF 
SSNARKKLIF 
SSNARKKLIF 
SSNARKKLIF 



SSNARKKLIF 



HVTDGVPTMS 
HVTDGVPTMS 
HVTDGVPTMS 
HVTDGVPTMS 
HVTDGVPTMS 
HVTDGVPTMS 
HVTDGVPTMS 
HVTDGVPTMS 
HVTDGVPTMS 



400 

YAINFNPYIS 
YAINFNPYIS 
YAINFNPYIS 
YAINFNPYIS 
YAINFNPYIS 
YAINFNPYIS 
YAINFNPYIS 
YAINFNPYIS 
YAINFNPYIS 



msal78371 .2 { 104_CJB110 
msal78371 . 2 ( 104_M781 
rasal7B371 . 2 ( 104_C0H1 
msal78371.2{104 M732 
msal78371.2{l04J>90 
msal78 371 . 2 { 104_18RS21 
tnsal78371.2f 104 2603 
msal78371 . 2 { 104~A909 
msal78371 . 2{ 104_JM9130013 
Consensus 



401 

TSYQNQFNSF 
TSYQNQFNSF 
TSYQNQFNSF 
TSYQNQFNSF 
TSYQNQFNSF 
TSYQNQFNSF 
TSYQNQFNSF 
TSYQNQFNSF 
TSYQNQFNSF 



LNKIPDRSGI 
LNKIPDRSGI 
LNKIPDRSGI 
LNKIPDRSGI 
LNKIPDRSGI 
LNKIPDRSGI 
LNKIPDRSGI 
LNKIPDRSGI 
LNKIPDRSGI 



LQEDFIINGD 
LQEDFIINGD 
LQEDFIINGD 
LQEDFIINGD 
LQEDFIINGD 
LQEDFIINGD 
LQEDFIINGD 
LQEDFIINGD 
LQEDFIINGD 



DYQIVKGDGE 
DYQIVKGDGE 
DYQIVKGDGE 
DYQIVKGDGE 
DYQIVKGDGE 
DYQIVKGDGE 
DYQIVKGDGE 
DYQIVKGDGE 
DYQIVKGDGE 



450 

SFKLFSDRKV 
SFKLFSDRKV 
SFKLFSDRKV 
SFKLFSDRKV 
SFKLFSDRKV 
SFKLFSDRKV 
SFKLFSDRKV 
SFKLFSDRKV 
SFKLFSDRKV 



msal78371.2{ 
msal78371. 
rosal78371. 
msal78371. 
msal78371 
msa!78371.2{ 
msal78371 
msal78371 
msal78371.2{!04 



104_CJB110 
2{104_M781 
2(l04_COHl] 
2{104__M732 
2{104_090 
104_18RS21 
2{l04_2603 
2{104 A909> 
PM9130013} 
" Consensus 



451 

PVTGGTTQAA 
PVTGGTTQAA 
PVTGGTTQAA 
PVTGGTTQAA 
PVTGGTTQAA 
.PVTGGTTQAA 
PVTGGTTQAA 
PVTGGTTQAA 
PVTGGTTQAA 



YRVPQNQLSV 
YRVPQNQLSV 
YRVPQNQLSV 
YRVPQNQLSV 
YRVPQNQLSV 
YRVPQNQLSV 
YRVPQNQLSV 
YRVPQNQLSV 
YRVPQNQLSV 



MSNEGYAINS 
MSNEGYAINS 
MSNEGYAINS 
MSNEGYAINS 
MSNEGYAINS 
MSNEGYAINS 
MSNEGYAINS 
MSNEGYAINS 
MSNEGYAINS 



GYI YLYWRDY 
GYIYLYWRDY 
GYI YLYWRDY 
GYIYLYWRDY 
GYIYLYWRDY 
GYIYLYWRDY 
GYIYLYWRDY 
GYIYLYWRDY 
GYIYLYWRDY 



500 

NWVYPFDPKT 
NWVYPFDPKT 
NWVYPFDPKT 
NWVYPFDPKT 
NWVYPFDPKT 
NWVYPFDPKT 
NWVYPFDPKT 
NWVYPFDPKT 
NWVYPFDPKT 



msal78371 . 2 { 104_CJB110 
msal78371.2(l04_M781 
msal78371 . 2 { 104_COH1 
msal78371.2{104_M732 
msal78371.2{l04_090 
It»sal78371 . 2 { 104_18RS2 1 
msal78371 . 2 ( 104_2603 
tnsal78371 . 2 { 104_A909 
msal78371 . 2 { 104_JM9 130013 
Consensus 



501 

KKVSATKQIK 
KKVSATKQI K 
KKVSATKQIK 
KKVSATKQIK 
KKVSATKQIK 
KKVSATKQIK 
KKVSATKQIK 
KKVSATKQIK 
KKVSATKQIK 



THGBPTTLYF 
THGEPTTLYF 
THGBPTTLYF 
THGEPTTLYF 
THGEPTTLYF 
THGEPTTLYF 
THGEPTTLYF 
THGEPTTLYF 
THGBPTTLYF 



NGNIRPKGYD 
NGNIRPKGYD 
NGNIRPKGYD 
NGNIRPKGYD 
NGNIRPKGYD 
NGNIRPKGYD 
NGNIRPKGYD 
NGNIRPKGYD 
NGNIRPKGYD 



IFTVGIGVNG 
IFTVGIGVNG 
IFTVGIGVNG 
IFTVGIGVNG 
IFTVGIGVNG 
IFTVGIGVNG 
IFTVGIGVNG 
IFTVGIGVNG 
IFTVGIGVNG 



550 

DPGATPLEAB 
DPGATPLEAE 
DPGATPLEAB 
DPGATPLEAE 
DPGATPLEAE 
DPGATPLEAE 
DPGATPLEAB 
DPGATPLEAE 
DPGATPLEAE 



msal78371.2{l04 CJB110 
msal7B371 . 2{ 104_M781 
msal78371 . 2 { 104_COH1 
msal78371 . 2 { 104_M732 
msal78371.2{l04 090 
msal7B371.2{l04 18RS21 
msal7B371 . 2 { 104_2603 
msal78371 . 2 { 104~A909 
msal7B371 . 2 { 104_JM9130013 
Consensus 



551 

KFMQSI SSKT 
KFMQSISSKT 
KFMQSI SSKT 
KFMQSISSKT 
KFMQSISSKT 
KFMQSISSKT 
KFMQSISSKT 
KFMQSISSKT 
KFMQSISSKT 



ENYTNVDDTN 
ENYTNVDDTN 
ENYTNVDDTN 
ENYTNVDDTN 
ENYTNVDDTN 
ENYTNVDDTN 
ENYTNVDDTN 
ENYTNVDDTN 
ENYTNVDDTN 



KIYDELNKYF 
KIYDELNKYF 
KIYDELNKYF 
KIYDELNKYF 
KIYDELNKYF 
KIYDELNKYF 
KIYDELNKYF 
KIYDELNKYF 
KIYDELNKYF 



KTIVEBKHSI 
KTIVEBKHSI 
KTIVEBKHSI 
KTIVEBKHSI 
KTIVEBKHSI 
KTIVEBKHSI 
KTIVEBKHSI 
KTIVEBKHSI 
KTIVEBKHSI 



600 

VDGNVTDPMG 
VDGNVTDPMG 
VDGNVTDPMG 
VDGNVTDPMG 
VDGNVTDPMG 
VDGNVTDPMG 
VDGNVTDPMG 
VDGNVTDPMG 
VDGNVTDPMG 



msal78371.2{l04_CJB110 
msal78371.2{l04 M781 
msal78371 . 2 { 104""COH1 
msal78371 . 2 { 104~M732 
msal78371.2{l04_090 
msal78371 . 2 { 104_18RS21 
msal78371. 2(104 2603 
msal78371.2{104_A909 
msal78371.2{l04_JM9130013 
Consensus 



601 

EMIEFQLKNG 
EMIEFQLKNG 
EMIEFQLKNG 
EMIEFQLKNG 
EMIEFQLKNG 
EMIEFQLKNG 
EMIEFQLKNG 
EMIEFQLKNG 
EMIEFQLKNG 



QSFTHDDYVL 
QSFTHDDYVL 
QSFTHDDYVL 
QSFTHDDYVL 
QSFTHDDYVL 
QSFTHDDYVL 
QSFTHDDYVL 
QSFTHDDYVL 
QSFTHDDYVL 



VGNDGSQLKN 
VGNDGSQLKN 
VGNDGSQLKN 
VGNDGSQLKN 
VGNDGSQLKN 
VGNDGSQLKN 
VGNDGSQLKN 
VGNDGSQLKN 
VGNDGSQLKN 



GVALGGPNSD 
GVALGGPNSD 
GVALGGPNSD 
GVALGGPNSD 
GVALGGPNSD 
GVALGGPNSD 
GVALGGPNSD 
GVALGGPNSD 
GVALGGPNSD 



650 

GGILKDVTVT 
GGILKDVTVT 
GGILKDVTVT 
GGILKDVTVT 
GGILKDVTVT 
GGILKDVTVT 
GGILKDVTVT 
GGILKDVTVT 
GGILKDVTVT 



msal78371.2{ 

msal78371. 

rasal78371. 

msal78371. 
rasal78371 
msal78371.2{ 

msal78371. 



104_CJB110 
2(104 M7B1 
2(104~COH1 
2{104_M732 
2(104^090 
104 18RS21 
2{104_2603 



651 

YDKTSQTIKI 
YDKTSQTIKI 
YDKTSQTIKI 
YDKTSQTIKI 
YDKTSQTIKI 
YDKTSQTIKI 
YDKTSQTIKI 



NHLNLGSGQK 
NHLNLGSGQK 
NHLNLGSGQK 
NHLNLGSGQK 
NHLNLGSGQK 
NHLNLGSGQK 
NHLNLGSGQK 



WLTYDVRLK 
WLTYDVRLK 
WLTYDVRLK 
WLTYDVRLK 
WLTYDVRLK 
WLTYDVRLK 
WLTYDVRLK 



DNYISNKFYN 
DNYISNKFYN 
DNYISNKFYN 
DNYISNKFYN 
DNYISNKFYN 
DNYISNKFYN 
DNYISNKFYN 



700 

TNNRTTLSPK 
TNNRTTLSPK 
TNNRTTLSPK 
TNNRTTLSPK 
TNNRTTLSPK 
TNNRTTLSPK 
TNNRTTLSPK 
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Table 41: Comparative Sequences relating to SAG0649 



Risal78371.2{l04 A909} YDKTSQTIKI NHLNLGSGQK WLTYDVRLK DNYISNKPYN TNNRTTLSPK 
msal78371.2{l04_JM9130013} YDKTSQTIKI NHLNLGSGQK WLTYDVRLK DNYISNKPYN TNNRTTLSPK 
~" Consensus ********** ********** ********** ********** ********** 



701 

rasal78371.2{l04_CJB110l SEKEPNTIRD 

msal7837 1.2(104 M781 > SEKEPNTIRD 

nuaal78371.2<104~COHl> SEKEPNTIRD 

msal78371.2{104_M732j SEKEPNTIRD 

msal78371.2{l04_090} SEKEPNTIRD 

msal78371.2{l04_18RS21 SEKEPNTIRD 

msal78371.2{l04_2603 SEKEPNTIRD 

msal78371.2{104JV909) SEKEPNTIRD 

msal78371.2{l04_JM9130013) SEKEPNTIRD 

Consensus ********** 



FPIPKIRDVR 
PPIPKIRDVR 
FPIPKIRDVR 
FPIPKIRDVR 
FPIPKIRDVR 
FPIPKIRDVR 
FPIPKIRDVR 
FPIPKIRDVR 
FPIPKIRDVR 



EFPVLTISNQ 
EFPVLTISNQ 
EFPVLTISNQ 
EFPVLTISNQ 
EFPVLTISNQ 
EFPVLTISNQ 
EFPVLTISNQ 
EFPVLTISNQ 
EFPVLTISNQ 



KKMGBVEFIK 
KKMGBVEFIK 
KKMGBVEFIK 
KKMGBVEFIK 
KKMGBVEFIK 
KKMGBVEFIK 
KKMGBVEFIK 
KKMGBVEFIK 
KKMGBVEFIK 



750 

VNKDKHSESL 
VNKDKHSESL 
VNKDKHSESL 
VNKDKHSESL 
VNKDKHSESL 
VNKDKHSESL 
VNKDKHSESL 
VNKDKHSESL 
VNKDKHSESL 



msal78371 . 2 { 104_CJB110 
msal78371.2(l04 M781 
msal78371.2{l04~COHl 
msal78371.2{104 M732 
msal78371 . 2 { 104_090 
msal78371 . 2 { 104_18RS21 
msal78371 . 2( 104_2603 
msal7 8 3 7 1 . 2 { 104_A90 9 
msal78371.2{l04_OM9130013 
Consensus 



msal78371 . 2 { 104_CJB110 
cnsal78371.2(l04_M781 
maal78371 . 2 { 104_COH1 
msal7B371 . 2 (104_M732 
msal78371.2{l04_090 
msal78371 . 2 { 104_18RS21 
msal78371.2fl04 2603 
msal78371 . 2 { 104_A909 
msal78371 . 2 { 104_JM9130013 
*~ Consensus 



msal78371 . 2 { 104_CJB110 
msal78371 . 2 { 104_M781 
msa!78371 . 2 { 104_COH1 
msal7 B371.2{ 104_M732 
msal78371.2{l04_090 
msal78371 . 2 { 104_18RS21 
msal78371 . 2 ( 104_2603 
msal78371.2{104_A909 
tnsal78371 . 2 { 104JJM9130013 
Consensus 



751 

LGAKFQLQIe 
LGAKFQLQIe 
LGAKFQLQIe 
LGAKFQLQIe 
LGAKFQLQIe 
LGAKFQLQIe 
LGAKFQLQIe 
LGAKFQLQIe 
LGAKFQLQIk 



KDFSGYKQFV 
KDFSGYKQFV 
KDFSGYKQFV 
KDFSGYKQFV 
KDFSGYKQFV 
KDFSGYKQFV 
KDFSGYKQFV 
KDFSGYKQFV 
KDFSGYKQFV 



PEGSDVTTKN 
PEGSDVTTKN 
PEGSD VTTKN 
PEGSDVTTKN 
PEGSDVTTKN 
PEGSDVTTKN 
PEGSDVTTKN 
PEGSDVTTKN 
PEGSDVTTKN 



DGKIYFKALQ 
DGKIYFKALQ 
DGKIYFKALQ 
DGKIYFKALQ 
DGKIYFKALQ 
DGKIYFKALQ 
DGKIYFKALQ 
DGKIYFKALQ 
DGKIYFKALQ 



800 

DGNYKLYEIS 
DGNYKLYEIS 
DGNYKLYEIS 
DGNYKLYEIS 
DGNYKLYEIS 
DGNYKLYEIS 
DGNYKLYEIS 
DGNYKLYEIS 
DGNYKLYEIS 



801 

SPDGYIEVKT KPWTFTIQN GEVTNLKADP NANKNQIGYL 
SPDGYIEVKT KPWTFTIQN GEVTNLKADP NANKNQIGYL 
SPDGYIEVKT KPWTFTIQN GEVTNLKADP NANKNQIGYL 
SPDGYIEVKT KPWTFTIQN GEVTNLKADP NANKNQIGYL 
SPDGYIEVKT KPWTFTIQN GEVTNLKADP NANKNQIGYL 
SPDGYIEVKT KPWTFTIQN GEVTNLKADP NANKNQIGYL 
SPDGYIEVKT KPWTFTIQN GEVTNLKADP NANKNQIGYL 
SPDGYIEVKT KPWTFTIQN GEVTNLKADP NANKNQIGYL 
SPDGYIEVKT KPWTFTIQN GEVTNLKADP NANKNQIGYL 

851 890 

tpkrppgv — ' 

tpkrppgv 

tpkrppgv 

tpkrppgv 

tpkrppgv 

tpkrppgv 

tpkrppgvfp ktggigtivy ilvgstfmiX ticsfrrkql 
tpkrppgv 



850 

Egngkhlitn 
Egngkhlitn 
Egngkhlitn 
Egngkhlitn 
Egngkhlitn 
Egngkhlitn 
Egngkhlitn 
Egngkhlitn 
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Table 42: Comparative Sequences relating to SAG 0764 



SEQ ID NO. 4201: 2603 V/R STRAIN 

ATGGTAAAATTAGTATTCGCACGCCACGGTGAATCT^^ 
ACIGGATGGGCTGACGTAGATCTTTCAQAAAAAGGTA^ 
AAATTAATTCAAGCAGCAGGTATTGAGT^ 

GCCATCAAAACAACTAACCTTGCCCTTGAAGCAG CTGATCAACTTTGGGTACCAGTTGAA 
AAATCATGGCGCTTGAACGAACCTCATTACGGTG GATT GACAGGA 

CCTCCAGATATGGCTAAAGATGATG^CATTCA^ 
CTAGATGATTXrPGTTATTCCAGATGCAGAAAACCT 

CCTTTCTGGGAAGATAAAATTG CTCCTGCTCIT AAAGATGGTAAAAATGTGTTTGTTGGT 
GCACACGGTAACrrGWVTCCGTGCrCTTGTAAAACATATCAA^ 
ATCATGGACGTTQAAATTCCTAACTTCCCACCACrTGTTO 
AACCTTGTTTCAGAATATTACTTAGGTAAA 

SEQ ID NO. 4202 x 090 STRAIN 

GTAAAATTAGTATTCGCACG CX^CGGTGAATCTGAGTG 

GAATAAAGCTAACCTTTTCACTGQATGGGCrGACGTAGA 

AAGGT ACACAACAAGCTATTGATG CTGGGAAATTAATTCAAG CAGCAGGT 

ATTGAGTTCGACCTTGCTTTTACATCAGTTCTTAAACX3TGCCAT 

AACTAACCTTGCCCTTGAAGCAGCTGATCAACTTTG^ 

AATCATGGCGCTTGAACIGAACXrPCATTACGGTGGATTGAC^ 

AAAGCAGAAGCAGCTGAACAATTTGGTGATGAGCAAGTTCATATTTC 

TCGTTCATATGATGTATTGCCTCCAGATATGGCTAAAGATGA 

CAGCACATACTGATQaTCQCTATGCTTCACTAGATGAT^ 

GATGCAGAAAACCTAAAAGTTACITTAGAGCXSTGCTCTTC^ 

AGATAAAATTGCTCCTGCTCTTAAAGATGGTAAAAATGTO 

CACACCIGTAACTO^TCOGTGCTCTTGTAAAACAT^ 

GATGATGAAATC^TGGACGTTGAAATTCCTAACT 

CGAATTTGATCAAAAATTAAACCTTGTTraVGAAT 

SEQ ID NO. 4203i A909 STRAIN 

GTAAAATTAGTATTOSCACGCCACGGTGAATCrrGAGTGG 

AATAAAGCTAACCTTTT CACTGGATGGGCTGACX^ AGATCTTTCAGAAAA 

AGGTACACAACAAGCTATTGATGCTGGGAAATTAA^ 

TTGAGTTCXSACCTTCCTTTmCATCAGT^ 

ACTAACCTTGCCCITGAAGCAGCTGATCAACTTTGG 

ATCATGGCGCITAAACGAACGTCATTACGGTGGATTGACAGG 

AAGCAGAAGCAGCTCAACAATTTGGTGATGAGCAAG^ 

CGTTCATATGATGTATTGCCTCCyVGATAT^^ 

AGC^CATACTGATOGTCGCTATGCTTCACTAGATGATTCT 

ATGCAGAAAACCTAAAAGTTACTTTAGAGCGTC 

GATAAAATTGCTCCTGCTCTTAAAGATGGT^ 

ACAOGGTAACTCAATCXXSTGCTCTTGTAAAACATATCAAACAAT ^ 

ATGATGAAATCATGGACGTTGAAATTCCnAACITC 

GAATTTGATGAAAAATTAAACCTTGTTTC»GA 

SEQ ID NO. 4204s B36B STRAIN 

GTAAAATTAGTATTCGCAOGCCACGGTGAATCTGAG 

TGGAATAAAGCTAACCTTTTCACTGGATGGGCTGACGT^ 

AAAAGGTACACAACAAGCTATTGATG-CTGGGAAAT^^ 

GTATTGAGTTOGACCTTGCTTTOAjCATC 

ACAACTAACCTTGCCCTTGAAGCAGCTGATCAACT^ 

AAAATCATGGCG CTTGAACGAACGTCATTACGGTGG^ 

ATAAAGCAGAAGCAGCTGAACAATTTGGTGATGAGCAAGTTCATA 

CGTCGTTCATATGATGTATTGCCTCCAGATATGG CTAAAGATGATGAACA 

TTCAGCACATACTGATCGTCGCTATGCTTCACT 

CAGATGCAQAAAACCTAAAAGTTACTTTAGAGCGTG irj.y-i~iCu~JL~i~J.CTGG 

GAAGATAAAATTGCTCC'lXaCU^rrAAAGATGGTAAAAA 

TGCACACGGTAACTCAATCOGTGCTCTTGTAAA^ 

CAGATGATGAAATCATGGACGTTGAAATTCCTAACTTCC^ 

TTCGAATTTGATGAAAAATTAAAOTITGTTTCA^ 

A 

SEQ ID NO. 4205s 18RS21 STRAIN 

GTAAAATTAGTATTCGCACGCCACGGTGAATCIX^GTGG 

AATAAAGCTAACCTTTTCACTGGATGGGCTGACCT 

AGGTACACAACAAGCTATTGATGCTGGGAAATTAATTCTU^ 

TTGAGTTCGACCTTGCTTTTACATCAGTTCTTA^ CCATCAAAACA 

ACTAACCTTGCCCTTGAAGCAGCTGATCAACTTT 

ATCATGGOGCTTGAAOGAAOGTCATrACGGTGGATTGA 

AAGCAGAAGCAGCTGAACAATTTGGTGATGAGCAAGTT^ 

CGTTCAT ATGATGTATTGCCTCCAGATATGG CTAAAGATGATGAACATT C 

AGCACATACTGATCGTCGCTATGCTTCACTAGATGATT^ 

ATGaVGAAAACCTAAAAGTTACTTTAGAGOGTGCT CTTC 

GATAAAATTGCTCCTGCTCTTAAAGATGGTAA 

ACACX3GTAACTCAATCCGTG CT CTTGTAAAACATATCAAACAATTGTCAG 

ATGATGAAATCATGGACGTTGAAATTCCTAACTTCCCACCA 

GAATTTGATGAAAAATTAAACCTTGTTTCAGAATATTACTTA^ 

SEQ ID NO. 4206 1 M732 STRAIN 

GTAAAATTAGTATTCGCACGCCACGGTGAATCTGAGTGG 
AATAAAGCTAACCrTTTCACTGGATGGGCTGACGTAGA^ 
AGGT ACACAACAAGCTATTGATG CTGGGAAATTAATTCAAGCAGCAGGTA 
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TTPGAGTTCGACCTTGCTTTTACATCAGTTCT 

ACTAACCTTGCCCTTGAAGCAGCTGATCAACT 

ATCATGGOGCTTQAAOGAACGTCATTAOGGTGQATTGACAGG 

AAGCAGAAGCAGCTGAACAATTTGGTGATGAG CAAGTTCATATTTGG CGT 

CGTTCATATGATGTATTGCCTCCAGA^ 

AGCACATACTGATCGTCGCTATGCTTCACTAGAT^ 

ATGCAGAAAACCEAAAAGTTACITTAGAGCGTOT 

GATAAAMTGOTCCTGCTOTAA^ 

ACACGGTAACTCAATCCGTGCTCTTGTAAAAC^ 

ATGATGAAATCATGGACGTTCSAAATTCCrAACTTCCCACCA 

GAATTTGATGAAAAATTAAAOCTTGTTTCAGA 

SEQ ID NO. 4207* COH1 STRAIN 

GTAAAATTAGTATTCGCACGCCACGG 

TGAATCTGAGTGGAATAAAGCTAACCTTTTCACTGGATGGGCT^ 
ATCTTTCAGAAAAAGGTACACAACAAGCTAT^^ 

CAAGCAGCAGGTA'rrGAGTT OGACCTTGCTTTTACATCAGTrCrTAAACG 

TGCCATCAAAACAACTAACCTTGCCCTTGAAGCAGCI^ 

TACCAGTTGAAAARTCATGGCGCTTGAACGAACGTCATTACGGT^ 

ACAGGAAAAAATAAAGCAGAAGCAG CTGAACAATTTGGTGATGAGCAAGT 

TCATATTTGGCGTCX3TTCATATGATGTATTGCCTCCAGATATGGCT 

ATGATGAAC^TTCAGCACATACTGATCGTCGCTATGCTTCACT 

TCK3TTATTCCAGATGCAGAAAACCTAAAAGTTACITTAG 

XCCTTTCTG<3GAAGATAAAATTGCTCCTGCTCTTAAAGATG 

TGTTTGTTGGTGCACACGGTAACTCA^ 

AAACAATTGTCAGATGATGAAATCATGGACGTTGAAATTCCT 

ACCft CTTGTTTT OGftftXTTGATGAAAAATT^ 

ACTTAGGTAAA 

SBQ ID HO. 4208 1 CJB110 STRAIN 

GTAAAATTAGTATTCGCACGCCACGG 

TGAATCTGAGTGGAATAAAGCTAACCTTTTCACTCGA 

ATCTTTCAGAAAAAGGTACACAACAAGCTAra 

CAAGCAGCAGGTATTGAGTTCGACCTTGCT 

TGCCATCAAAACAACTAACCTTGCCC^TGAAGCAG 

TACCAGTTGAAAAATCATGGCX3CTTGAACX3AACX^ 

ACAGGAAAAAATAAAGCAGAAGCAGCTGAACAATT^ 

TCATATTTGGCGTCGTTCATATGATGTATTGCCTCCA 

ATGATGAACATICAGCACATACTGATCGTCGCTATGCT^ 

TCTGTTATTCCAGATGCAGAAAACCTAAAAGTTA 

TarTTTCTGGGAAGATAAAATTGCTCXTO 

^XnTTGTrGGTGCACACGGTAACrCAA^^ 

AAACAATTGTCAGATGATGAAATCATGG^ 

AXICA CTTGTrrT CQAATTTOATGAAAAATTA 

ACTTAGGTAAA 

SBQ ID NO. 4209 x 1169NT STRAIN 

AGTATTCGCACGCCAOSGTGAATCTGAGT^ 
CTGGATGGGCTGACGTAGATCTTTCAGAAAAAGGTA 
GATGCTGGGAAATTAATTCAAGCAGCAGGTATTGAGTTC^ 
TACATCAGTTCTTAAACX3TGCCAT CAAAACAACTAACCITGCCCTTGAAG 
CAGCrGATCAACTTTGGGTACCAGTTGA 

CGTCATTACGGTGGATTCACAGGAAAAAATAAAGCAGAAGCAGC^ 

ATTTGGTGATGAGCAAGTTCATATTTGGCGTCG^ 

CTCCAGATATGGCTAAAGATGATGAACATTCAGC^ 

TATGCTTCACTAGATGATTCIGTTATTCCAGATGC3U3A 

TACTTTAGAG CGTGCTCTTCCTTTCTGGGAAGATAAAAT^ 

TTAAAGATGGTAAAAATGTGTTTGTTGGTGCACACG 

GCTCTTGTAAAACATATCAAACAATTGTCAGATGAT^ 

TGAAATTCCTAACTTCCCA<X!ACrTGTTTTCG^ 

ACCTTGTTTCAGAATATTACTTAGGTAAA 

SEQ ID NO. 4210 1 K781 STRAIN 

GTAAAATTAGTATTCGCACG CCACGGT 

GAATCTGAGTGGAATAAAG CT AACCTTTTCACTGGATGGGCTGACGTAGA 

TCTTTCAGAAAAAGGTACACAACAAGCrATTGATGCTGGG^ 

AAGCAGCAGGTATTGAGTTCGACCTTGCTTT^ 

GCCATCAAAAa^ACTAACXrrTGCCCTTGAAGC^ 

^CCAGTTGAAAAATCATGGCGCTTGAACXIAA 

CAGGAAAAAATAAAGCAGAAGCAGCTGAACAATTTGG^ 

CATATTTGGCGTCGTTCATATGATGTATTGCCrcCAGATATC 

TGATGAACATTCAGCACATACTGATCGTCGCTAT^ 

CTGTTATTCCAGATGCAGAAAACrCTAAAAGTTACT^ 

CCTTTCTGGGAAGATAAAATTG CTCCTGCTCTTAAAGATGGTAAAAATGT 

GTTTGTTGGTGCACACGGTAACTCAATCCGTGCTCTTCT 

AAC^TTGTCAGATGATGAAATCATGGACGTTGAAA 

CCACrTGTTTTCGAATTTGATGAAAAATTA 

CTTAGGTAAA 

SEQ ID NO. 4211i JM930013 STRAIN 

GTAAAATTAGTATTCGCACGCCACGGTGAATCT 

GAGTGGAATAAAGCTAACCTTTTCACTG<^TGGGCTGACCT 
AGAAAAAGGTACACAACAAGCTATTGATGCTGGGAAATTAATTCA 
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CAGGTATTGAGTTCGACCTTGCTTTTACATCAG^ 

AAAACAACTAACCTTGCCCTTGAAG CAGCTGATCAACTTTGGGTACCAGT 
TGAAAAATCATGGCGCTTGAACGAACGTCA 

AAAAT AAAG CAGAAG CAG CTGAACAATTTGGTGATGAG CAAGTTCATATT 

TGGCGTCGTTCATATGATGTATTGCCTCCAGAXATGGCT 

ACATTCAGCACATACTGATCGTCGCTATGCTTCACTAflATGATTCT 

TTCCAGATGCAG AAAACCTAAAAGTTACTTTAGAGCXnXS CT 

TGGGAAGATAAAATTGCTCCrcCTCTTAAAGATGGTAAAAATGTO 

TGGTGCACAOTGTAACTCAATCCGTGCTCTTGTAAAACATATCAAACAA^ 

TGTCAGATGATGAAATCATGGACGTTGAAATTC^ 

GTTTTCGAATTTGATGAAAAATTAAACCTTGT^ 

TAAA 



PRETTY of: /biotrap/rasa63264 .2{*} March 10, 2003 09i30 



msa63264 . 2 { 110_090 
msa63264.2(ll0 1169NT 
msa63264 . 2 { 1 10~18RS21 
ms a63264 . 2 { 110_2603 
cnsa63264 . 2 ( 110_CJB110 
msa63264 . 2 f 110_COH1 
rosa63264 . 2 ( 110_H36B 
msa63264 . 2 { 110_JM9130013 
msa63264.2(ll0_M732 
msa63264.2{110_M781 
msa63264 . 2 { 110_A909 
Consensus 



gtaaaat 

gtaaaat 

atggtaaaat 

gtaaaat 

— -gtaaaat 

gtaaaat 

gtaaaat 

gtaaaat 

gtaaaat 

gtaaaat 



tAGTATTCGC 
-AGTATTOGC 
tAGTATTCGC 
tAGTATTCGC 
tAGTATTCGC 
tAGTATTCGC 
tAGTATTCGC 
tAGTATTCGC 
tAGTATTCGC 
tAGTATTCGC 
tAGTATTCGC 



ACGCCACGGT 
ACGCCACGGT 
ACGCCACGGT 
ACGCCACGGT 
ACGCCACGGT 
ACGCCACGGT 
ACGCCACGGT 
ACGCCACGGT 
ACGCCACGGT 
ACGCCACGGT 
ACGCCACGGT 



GAATCTGAGT 
GAATCTGAGT 
GAATCTGAGT 
GAATCTGAGT 
GAATCTGAGT 
GAATCTGAGT 
GAATCTGAGT 
GAATCTGAGT. 
GAATCTGAGT 
GAATCTGAGT 
GAATCTGAGT 



50 

GGAATAAAGC 
GGAATAAAGC 
GGAATAAAGC 
GGAATAAAGC 
GGAATAAAGC 
GGAATAAAGC 
GGAATAAAGC 
GGAATAAAGC 
GGAATAAAGC 
GGAATAAAGC 
GGAATAAAGC 



* + * * 



msa63264 
msa63264 
msa63264 

msa63264 
rasa63264.2{ 
msa63264 . 
msa63264. 
msa63264.2{H0 
msa63264 
msa63264 
maa63264 . 



.»,.2{ll0_090 
.2lll0_1169NT 
.2{110_18RS21 
2{ll0_2603 | 
110_CJB110 
2{110_COH1 
2{110_H36B 
_JM9130013 
2(ll0_M732 
2{110_M781 
2{110_A909 
Consensus 
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TAACCTTTTC 
TAACCTTTTC 
TAACCTTTTC 
TAACCTTTTC 
TAACCTTTTC 
TAACCTTTTC 
TAACCTTTTC 
TAACCTTTTC 
TAAC CTTTT C 
TAACCTTTTC 
TAACCTTTTC 



ACTGGATGGG 
ACTGGATGGG 
ACTGGATGGG 
ACTGGATGGG 
ACTGGATGGG 
ACTGGATGGG 
ACTGGATGGG 
ACTGGATGGG 
ACTGGATGGG 
ACTGGATGGG 
ACTGGATGGG 



CTGACGTAGA 
CTGACGTAGA 
CTGACGTAGA 
CTGACGTAGA 
CTGACGTAGA 
CTGACGTAGA 
CTGACGTAGA 
CTGACGTAGA 
CTGACGTAGA 
CTGACGTAGA 
CTGACGTAGA 



TCTTTCAGAA 
TCTTTCAGAA 
TCTTTCAGAA 
TCTTTCAGAA 
TCTTTCAGAA 
TCTTTCAGAA 
TCTTTCAGAA 
TCTTTCAGAA 
TCTTTCAGAA 
TCTTTCAGAA 
TCTTTCAGAA 



100 

AAAGGTACAC 
AAAGGTACAC 
AAAGGTACAC 
AAAGGTACAC 
AAAGGTACAC 
AAAGGTACAC 
AAAGGTACAC 
AAAGGTACAC 
AAAGGTACAC 
AAAGGTACAC 
AAAGGTACAC 



msa63264.2{ll0_090; 
msa63264 . 2 f 110_1169NT 
msa63264 . 2 { 110_18RS21 
msa63264.2{ll0 2603 
msa63264 . 2 { 110_CJB110 
msa63264 . 2 { 110_COH1 
msa63264.2{110 H36B 
msa63264 . 2{110_JM9130013 
msa63264.2(ll0_M732 
msa63264 . 2 (110_M781 
msa63264.2{ll0_A909 
Consensus 



101 

AACAAGCTAT 
AACAAGCTAT 
AACAAGCTAT 
AACAAGCTAT 
AACAAGCTAT 
AACAAGCTAT 
AACAAGCTAT 
AACAAGCTAT 
AACAAGCTAT 
AACAAGCTAT 
AACAAGCTAT 



TGATGCTGGG 
TGATGCTGGG 
TGATGCTGGG 
TGATGCTGGG 
TGATGCTGGG 
TGATGCTGGG 
TGATGCTGGG 
TGATGCTGGG 
TGATGCTGGG 
TGATGCTGGG 
TGATGCTGGG 



AAATTAATTC 
AAATTAATTC 
AAATTAATTC 
AAATTAATTC 
AAATTAATTC 
AAATTAATTC 
AAATTAATTC 
AAATTAATTC 
AAATTAATTC 
AAATTAATTC 
AAATTAATTC 



AAGCAGCAGG 
AAGCAGCAGG 
AAGCAGCAGG 
AAGCAGCAGG 
AAGCAGCAGG 
AAGCAGCAGG 
AAGCAGCAGG 
AAGCAGCAGG 
AAGCAGCAGG 
AAGCAGCAGG 
AAGCAGCAGG 



150 

TATTGAGTTC 
TATTGAGTTC 
TATTGAGTTC 
TATTGAGTTC 
TATTGAGTTC 
TATTGAGTTC 
TATTGAGTTC 
TATTGAGTTC 
TATTGAGTTC 
TATTGAGTTC 
TATTGAGTTC 



msa63264.2{H0J>90 
msa63264 . 2 { 110_1 169NT 
rasa63264 . 2 { 110 JLBRS21 
msa63264 . 2 (110_2603 
rasa63264 . 2 { 110_CJB110 
msa63264. 2(110 com 
maa63264 . 2 { 110_H36B 
msa63264 . 2 { 110_JM9130013 
msa63264.2(llO_M732 
msa63264. 2(110 M781 
msa63264.2{ll0_A909 
Consensus 



151 

GACCTTGCTT 
GACCTTGCTT 
GACCTTGCTT 
GACCTTGCTT 
GACCTTGCTT 
GACCTTGCTT 
GACCTTGCTT 
GACCTTGCTT 
GACCTTGCTT 
GACCTTGCTT 
GACCTTGCTT 



TTACATCAGT 
TTACATCAGT 
TTACATCAGT 
TTACATCAGT 
TTACATCAGT 
TTACATCAGT 
TTACATCAGT 
TTACATCAGT 
TTACATCAGT 
TTACATCAGT 
TTACATCAGT 



TCTTAAACGT 
TCTTAAACGT 
TCTTAAACGT 
TCTTAAACGT 
TCTTAAACGT 
TCTTAAACGT 
TCTTAAACGT 
TCTTAAACGT 
TCTTAAACGT 
TCTTAAACGT 
TCTTAAACGT 



GCCATCAAAA 
GCCATCAAAA 
GCCATCAAAA 
GCCATCAAAA 
GCCATCAAAA 
GCCATCAAAA 
GCCATCAAAA 
GCCATCAAAA 
GCCATCAAAA 
GCCATCAAAA 
GCCATCAAAA 



200 

CAACTAACCT 
CAACTAACCT 
CAACTAACCT 
CAACTAACCT 
CAACTAACCT 
CAACTAACCT 
CAACTAACCT 
CAACTAACCT 
CAACTAACCT 
CAACTAACCT 
CAACTAACCT 



msa63264.2{ll0_090 
msa63264 . 2 f 110 JL169NT 
msa63264 . 2 { 110_18RS21 
msa63264.2{ll0 2603 
msa63264 . 2 ( 110_CJB110 
rasa63264.2fllO_.COHl 
msa63264.2{110 K36B 
msa63264 . 2 ( 110_JM9130013 
msa63264.2(ll0_M732 
msa63264. 2(110 M7B1 



201 

TGCCCTTGAA 
TGCCCTTGAA 
TGCCCTTGAA 
TGCCCTTGAA 
TGCCCTTGAA 
TGCCCTTGAA 
TGCCCTTGAA 
TGCCCTTGAA 
TGCCCTTGAA 
TGCCCTTGAA 



GCAGCTGATC 
GCAGCTGATC 
GCAGCTGATC 
GCAGCTGATC 
GCAGCTGATC 
GCAGCTGATC 
GCAGCTGATC 
GCAGCTGATC 
GCAGCTGATC 
GCAGCTGATC 



AACTTTGGGT 
AACTTTGGGT 
AACTTTGGGT 
AACTTTGGGT 
AACTTTGGGT 
AACTTTGGGT 
AACTTTGGGT 
AACTTTGGGT 
AACTTTGGGT 
AACTTTGGGT 



ACCAGTTGAA 
ACCAGTTGAA 
ACCAGTTGAA 
ACCAGTTGAA 
ACCAGTTGAA 
ACCAGTTGAA 
ACCAGTTGAA 
ACCAGTTGAA 
ACCAGTTGAA 
ACCAGTTGAA 



250 

AAATCATGGC 
AAATCATGGC 
AAATCATGGC 
AAATCATGGC 
AAATCATGGC 
AAATCATGGC 
AAATCATGGC 
AAATCATGGC 
AAATCATGGC 
AAATCATGGC 



752 



WO 2004/018646 
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Table 42: Comparative Sequences relating to SAG 0764 



rasa63264.2{llO_A909) TGCCCTTGAA GCAGCTGATC AACTTTGGGT ACCAGTTGAA AAATCATGGC 
Consensus ********** ********** ********** ********** ********** 



msa63264 . 2 { 110_09O ) 
maa63264 .2{llO_1169NT) 
msa63264 . 2 ( 110_18RS21 
msa63264 . 2 {110_2603 
msa63264 . 2 { 110_CJB110 ' 
msa63264 . 2 { 110_COH1 
msa6 3 264 . 2 { 1 10_H3 6B ] 
maa63264.2{H0 JM9130013 
msa63264.2(llOJ4732 
msa63264.2(H0_M781 
mBa63264.2(110_A909j 
Consensus 



251 

GCTTgAACGA 
GCTTgAACGA 
GCTTgAACGA 
GCTTgAACGA 
GCTTgAACGA 
GCTTgAACGA 
GCTTgAACGA 
GCTTgAACGA 
GCTTgAACGA 
GCTTgAACGA 
GCTTaAACGA 



ACGTCATTAC 
ACGTCATTAC 
ACGTCATTAC 
ACGTCATTAC 
ACGTCATTAC 
ACGTCATTAC 
ACGTCATTAC 
ACGTCATTAC 
ACGTCATTAC 
ACGTCATTAC 
ACGTCATTAC 



GGTGGATTGA 
GGTGGATTGA 
GGTGGATTGA 
GGTGGATTGA 
GGTGGATTGA 
GGTGGATTGA 
GGTGGATTGA 
GGTGGATTGA 
GGTGGATTGA 
GGTGGATTGA 
GGTGGATTGA 



CAGGAAAAAA 
CAGGAAAAAA 
CAGGAAAAAA 
CAGGAAAAAA 
CAGGAAAAAA 
CAGGAAAAAA 
CAGGAAAAAA 
CAGGAAAAAA 
CAGGAAAAAA 
CAGGAAAAAA 
CAGGAAAAAA 



300 

TAAAGCAGAA 
TAAAGCAGAA 
TAAAGCAGAA 
TAAAGCAGAA 
TAAAGCAGAA 
TAAAGCAGAA 
TAAAGCAGAA 
TAAAGCAGAA 
TAAAGCAGAA 
TAAAGCAGAA 
TAAAGCAGAA 



msa63264 . 2 { 110J390 
msa63264 . 2 { 110_1169NT 
msa63264 . 2 { 110_18RS21 
rasa63264 . 2 {110_2603 
msa63264 .2{llO_CJB110 
ms a6 3264.2(1 10_COH1 
tnsa63264 . 2 { 1 10_H3 6B 
msa63264.2{llO_JM9130013 
msa63264 . 2 { 110_M732 
msa63264 . 2 { 110_M781 
msa63264 .2{110_A909 
Consensus 



301 

GCAGCTGAAC 
GCAGCTGAAC 
GCAGCTGAAC 
GCAGCTGAAC 
GCAGCTGAAC 
GCAGCTGAAC 
GCAGCTGAAC 
GCAGCTGAAC 
GCAGCTGAAC 
GCAGCTGAAC 
GCAGCTGAAC 



AATTTGGTGA 
AATTTGGTGA 
AATTTGGTGA 
AATTTGGTGA 
AATTTGGTGA 
AATTTGGTGA 
AATTTGGTGA 
AATTTGGTGA 
AATTTGGTGA 
AATTTGGTGA 
AATTTGGTGA 



TGAGCAAGTT 
TGAGCAAGTT 
TGAGCAAGTT 
TGAGCAAGTT 
TGAGCAAGTT 
TGAGCAAGTT 
TGAGCAAGTT 
TGAGCAAGTT 
TGAGCAAGTT 
TGAGCAAGTT 
TGAGCAAGTT 



CATATTTGGC 
CATATTTGGC 
CATATTTGGC 
CATATTTGGC 
CATATTTGGC 
CATATTTGGC 
CATATTTGGC 
CATATTTGGC 
CATATTTGGC 
CATATTTGGC 
CATATTTGGC 



350 

GTCGTTCATA 
GTCGTTCATA 
GTCGTTCATA 
GTCGTTCATA 
GTCGTTCATA 
GTCGTTCATA 
GTCGTTCATA 
GTCGTTCATA 
GTCGTTCATA 
GTCGTTCATA 
GTCGTTCATA 



msa63264. 2(110 090 
msa63264 . 2 (110_1169NT' 
msa63 2 64 . 2 ( 1 1 0_18RS2 1 
msa63264 . 2 { 110_2603 
msa63264 . 2 { 110_CJB110 
msa63264.2(H0 COH1 
msa63264 . 2 { 110_H36B 
msa63264 . 2 { 110_JM9130013 
msa63264. 2(110 14732 
msa63264 . 2 { 110"M781 
msa63264 . 2 ( 110~A909 
Consensus 



351 

TGATGTATTG 
TGATGTATTG 
TGATGTATTG 
TGATGTATTG 
TGATGTATTG 
TGATGTATTG 
TGATGTATTG 
TGATGTATTG 
TGATGTATTG 
TGATGTATTG 
TGATGTATTG 



CCTCCAGATA 
CCTCCAGATA 
CCTCCAGATA 
CCTCCAGATA 
CCTCCAGATA 
CCTCCAGATA 
CCTCCAGATA 
CCTCCAGATA 
CCTCCAGATA 
CCTCCAGATA 
CCTCCAGATA 



TGGCTAAAGA 
TGGCTAAAGA 
TGGCTAAAGA 
TGGCTAAAGA 
TGGCTAAAGA 
TGGCTAAAGA 
TGGCTAAAGA 
TGGCTAAAGA 
TGGCTAAAGA 
TGGCTAAAGA 
TGGCTAAAGA 



TGATGAACAT 
TGATGAACAT 
TGATGAACAT 
TGATGAACAT 
TGATGAACAT 
TGATGAACAT 
TGATGAACAT 
TGATGAACAT 
TGATGAACAT 
TGATGAACAT 
TGATGAACAT 



400 

TCAGCACATA 
TCAGCACATA 
TCAGCACATA 
TCAGCACATA 
TCAGCACATA 
TCAGCACATA 
TCAGCACATA 
TCAGCACATA 
TCAGCACATA 
TCAGCACATA 
TCAGCACATA 



msa63264 . 2 ( 110_090 
msa63264 . 2 ( 110_1169NT 
msa63264 . 2 { 110_18RS21 
msa63264 . 2 { 110_2603 
msa63264 . 2 { 110_CJB110 
msa63264. 2(110 COH1 
msa63 264 . 2 { 110_H36B 
msa63264 . 2 ( 110_JM9130013 
msa63264 . 2 ( 110_M732 
tnsa63264 . 2 { 110_M781 
msa63264 .2 (110_A909 
Consensus 



401 

CTGATCGTCG 
CTGATCGTCG 
CTGATCGTCG 
CTGATCGTCG 
CTGATCGTCG 
CTGATCGTCG 
CTGATCGTCG 
CTGATCGTCG 
CTGATCGTCG 
CTGATCGTCG 
CTGATCGTCG 



CTATGCTTCA 
CTATGCTTCA 
CTATGCTTCA 
CTATGCTTCA 
CTATGCTTCA 
CTATGCTTCA 
CTATGCTTCA 
CTATGCTTCA 
CTATGCTTCA 
CTATGCTTCA 
CTATGCTTCA 



CTAGATGATT 
CTAGATGATT 
CTAGATGATT 
CTAGATGATT 
CTAGATGATT 
CTAGATGATT 
CTAGATGATT 
CTAGATGATT 
CTAGATGATT 
CTAGATGATT 
CTAGATGATT 



CTGTTATTCC 
CTGTTATTCC 
CTGTTATTCC 
CTGTTATTCC 
CTGTTATTCC 
CTGTTATTCC 
CTGTTATTCC 
CTGTTATTCC 
CTGTTATTCC 
CTGTTATTCC 
CTGTTATTCC 



450 

AGATGCAGAA 
AGATGCAGAA 
AGATGCAGAA 
AGATGCAGAA 
AGATGCAGAA 
AGATGCAGAA 
AGATGCAGAA 
AGATGCAGAA 
AGATGCAGAA 
AGATGCAGAA 
AGATGCAGAA 



msa63264.2{ll0_J>90 , 
msa63264 . 2 ( 110_1169NT 
msa63264 . 2 { 110_18RS21 ' 
msa63264 . 2 ( 110_2603 
ntsa63264.2{H0 CJB110 
rasa63 264 . 2 ( 110_COH1 
tnsa63264 . 2 (110_H36B 
msa63264 . 2 { 110_JM9130013 
msa63264 . 2 ( 110_M732 
msa63264.2(ll0_M781 
msa63264.2{110_A909 
Consensus 



451 

AACCTAAAAG 
AACCTAAAAG 
AACCTAAAAG 
AACCTAAAAG 
AACCTAAAAG 
AACCTAAAAG 
AACCTAAAAG 
AACCTAAAAG 
AACCTAAAAG 
AACCTAAAAG 
AACCTAAAAG 



TTACTTTAGA 
TTACTTTAGA 
TTACTTTAGA 
TTACTTTAGA 
TTACTTTAGA 
TTACTTTAGA 
TTACTTTAGA 
TTACTTTAGA 
TTACTTTAGA 
TTACTTTAGA 
TTACTTTAGA 



GCGTGCTCTT 
GCGTGCTCTT 
GCGTGCTCTT 
GCGTGCTCTT 
GCGTGCTCTT 
GCGTGCTCTT 
GCGTGCTCTT 
GCGTGCTCTT 
GCGTGCTCTT 
GCGTGCTCTT 
GCGTGCTCTT 



CCTTTCTGGG 
CCTTTCTGGG 
CCTTTCTGGG 
CICTTTCTGGG 
CCTTTCTGGG 
CCTTTCTGGG 
CCTTTCTGGG 
CCTTTCTGGG 
CCTTTCTGGG 
CCTTTCTGGG 



500 

AAGATAAAAT 
AAGATAAAAT 
AAGATAAAAT 
AAGATAAAAT 
AAGATAAAAT 
AAGATAAAAT 
AAGATAAAAT 
AAGATAAAAT 
AAGATAAAAT 
AAGATAAAAT 
AAGATAAAAT 



msa63264.2{H0_090 
msa63264 . 2 { 110_1169NT' 
msa63264 . 2 { 110_18RS21 
cnaa63264.2{H0 2603 
mea63264 . 2 { 110JUB110 
msa63264.2(H0 COH1 
msa63264 . 2 { 110~H36B 
maa63264 . 2 ( 110_JM9130013 
msa63264.2(ll0_M732 



501 

TGCTCCTGCT 
TGCTCCTGCT 
TGCTCCTGCT 
TGCTCCTGCT 
TGCTCCTGCT 
TGCTCCTGCT 
TGCTCCTGCT 
TGCTCCTGCT 
TGCTCCTGCT 



CTTAAAGATG 
CTTAAAGATG 
CTTAAAGATG 
CTTAAAGATG 
CTTAAAGATG 
CTTAAAGATG 
CTTAAAGATG 
CTTAAAGATG 
CTTAAAGATG 



GTAAAAATGT 
GTAAAAATGT 
GTAAAAATGT 
GTAAAAATGT 
GTAAAAATGT 
GTAAAAATGT 
GTAAAAATGT 
GTAAAAATGT 
GTAAAAATGT 



GTTTGTTGGT 
GTTTGTTGGT 
GTTTGTTGGT 
GTTTG TTGGT 
GTTTGTTGGT 
GTTTGTTGGT 
GTTTGTTGGT 
GTTTGTTGGT 
GTTTGTTGGT 



550 

GCACACGGTA 
GCACACGGTA 
GCACACGGTA 
GCACACGGTA 
GCACACGGTA 
GCACACGGTA 
GCACACGGTA 
GCACACGGTA 
GCACACGGTA 



753 



WO 2004/018646 



PCT/US2003/026827 



Table 42: Comparative Sequences relating to SAG 0764 

msa63264.2( 110_M78l} TGCTCCTGCT CTTAAAGATG GTAAAAATGT GTTTGTTGGT GCACACGGTA 
msa63264.2{ll0_A909) TGCTCCTGCT CTTAAAGATG GTAAAAATGT GTTTGTTGGT GCACACGGTA 
Consensus ********** ********** ********** ********** ********** 



msa63264 .2{ll0_090l 
msa63264.2{ll0_1169NT] 
msa63264 . 2 { 110__18RS21 
msa53264 . 2 (ll0_2603 
msa63264 . 2 { 110_CJB11 0 ' 
rasa63264 . 2 f 110_COH1 
msa63 264. 2{110_H36Bi 
msa63264. 2{llO_JM9130013 I 
msa63264 . 2 ( 110_M732 \ 
msa63264.2(110_M781} 
Tnsa63264.2(110_A909} 
Consensus 



S51 

ACTCAATCCG 
ACTCAATCCG 
ACTCAATCCG 
ACTCAATCCG 
ACTCAATCCG 
ACTCAATCCG 
ACTCAATCCG 
ACTCAATCCG 
ACTCAATCCG 
ACTCAATCCG 
ACTCAATCCG 



TGCTCTTGTA 
TGCTCTTGTA 
TGCTCTTGTA 
TGCTCTTGTA 
TGCTCTTGTA 
TGCTCTTGTA 
TGCTCTTGTA 
TGCTCTTGTA 
TGCTCTTGTA 
TGCTCTTGTA 
TGCTCTTGTA 



AAACATATCA 
AAACATATCA 
AAACATATCA 
AAACATATCA 
AAACATATCA 
AAACATATCA 
AAACATATCA 
AAACATATCA 
AAACATATCA 
AAACATATCA 
AAACATATCA 



AACAATTGTC 
AAGAATTGTC 
AACAATTGTC 
AACAATTGTC 
AACAATTGTC 
AACAATTGTC 
AACAATTGTC 
AACAATTGTC 
AACAATTGTC 
AACAATTGTC 
AACAATTGTC 



600 

AGATGATGAA 
AGATGATGAA 
AGATGATGAA 
AGATGATGAA 
AGATGATGAA 
AGATGATGAA 
AGATGATGAA 
AGATGATGAA 
AGATGATGAA 
AGATGATGAA 
AGATGATGAA 



msa63264 . 2 { 110_090 
msa63264 . 2 { 110_1169NT 
msa63264 . 2 { 1 10_18RS21 
msa63264.2{ll0_2603 
msa63264 . 2 { 1 10_CJB1 10 
rasa63264. 2(110 C0H1 
msa63264 . 2 { 110__H36B 
msa63264 . 2{ 110_jJM9130013 
raaa63264 . 2 { 110_M732 
msa63264 . 2 { 1 10_M7 8 1 
msa63264 . 2 (llO_A909 
Consensus 



601 

ATCATGGACG 
ATCATGGACG 
ATCATGGACG 
ATCATGGACG 
ATCATGGACG 
ATCATGGACG 
ATCATGGACG 
ATCATGGACG 
ATCATGGACG 
ATCATGGACG 
ATCATGGACG 



TTGAAATTCC 
TTGAAATTCC 
TTGAAATTCC 
TTGAAATTCC 
TTGAAATTCC 
TTGAAATTCC 
TTGAAATTCC 
TTGAAATTCC 
TTGAAATTCC 
TTGAAATTCC 
TTGAAATTCC 



TAACTTCCCA 
TAACTTCCCA 
TAACTTCCCA 
TAACTTCCCA 
TAACTTCCCA 
TAACTTCCCA 
TAACTTCCCA 
TAACTTCCCA 
TAACTTCCCA 
TAACTTCCCA 
TAACTTCCCA 



CCACTTGTTT 
CCACTTGTTT 
CCACTTGTTT 
CCACTTGTTT 
CCACTTGTTT 
CCACTTGTTT 
CCACTTGTTT 
CCACTTGTTT 
CCACTTGTTT 
CCACTTGTTT 
CCACTTGTTT 



650 

TCGAATTTGA 
TCGAATTTGA 
TCGAATTTGA 
TCGAATTTGA 
TCGAATTTGA 
TCGAATTTGA 
TCGAATTTGA 
TCGAATTTGA 
TCGAATTTGA 
TCGAATTTGA 
TCGAATTTGA 



msa63264 . 2 { 110_090 
rasa63264.2(llO_1169NT 
msa63264.2{110_18RS21 
msa63264 . 2 { 110_2603 
msa63264 . 2 { HOjCJBllO 
insa63264 . 2 { 110_COH1 
msa63264 . 2 (110_H36B 
msa63264.2{H0_JM9130013 
msa63264 . 2 ( 110_M732 
msa63264 . 2 (110_M781 
msa63264 . 2 {110_A909' 
Consensus 



651 

TGAAAAATTA AACCTTGTTT 
TGAAAAATTA AACCTTGTTT 
TGAAAAATTA AACCTTGTTT 
TGAAAAATTA AAC CTTGTTT 
TGAAAAATTA AACCTTGTTT 
TGAAAAATTA AACCTT GTTT 
TGAAAAATTA AACCTTGTTT 
TGAAAAATTA AACCTTGTTT 
TGAAAAATTA AACCTTGTTT 
TGAAAAATTA AACCTTGTTT 
TGAAAAATTA AACCTTGTTT 
********** ********** 



690 

CAGAATATTA CTTAGGTAAA 
CAGAATATTA CTTAGGTAAA 
CAGAATATTA CTTAGGTAAA 
CAGAATATTA CTTAGGTAAA 
CAGAATATTA CTTAGGTAAA 
CAGAATATTA CTTAGGTAAA 
CAGAATATTA CTTAGGTAAA 
CAGAATATTA CTTAGGTAAA 
CAGAATATTA CTTAGGTAAA 
CAGAATATTA CTTAGGTAAA 
CAGAATATTA CTTAGGTAAA 
********** ********** 



SEQ ID HO. 4212 t 2603 V/R STRAIN 

VKLVFARHGESEWN KANLFTGWAD VDLS E KGTQO^ I DAGKLI QAAG I EFDLAFTSVLKRA 
IKTTNIALRAADQLWVPVEKSWRLNERHYGGLTGK^ 

PDMAKDDKHSAHTDRRYASLDDSVI PDAENLKVTLERALPFWEDKIAPALKDGKNVFVGA 
HGNS I RALVKHI KQLSDDE I MDVE I PNFPPLVFEFDEKLNLVSEYYLGK 

SEQ ZD NO. 4213: 090 STRAIN 

VKLVFARHGESBWNKANLFTG WADVDLS E KGTQQA I DAGKL I QAAG I EFDLAFTSVL KRA 
IKTTNIALEAADQLWVPVEKSWRI2JBRH 

PDMAKDDEHSAHTDRRYASLDDSVI PDAENLKVTTJ2RALPFWEDKI APALKDGKNVFVGA 
HGNS I RALVKHI KQLSDDE I MDVE I PNFPPLWEFDEKLNLVSEYYLGK 

SEQ ZD NO. 4214 t A909 STRAIN 

VKLVFARHGE SEWNKANLFTG WAD VDLS E KGTQQA I DAGKL I QAAG I EFDLAFTSVLKRA 
IKTTNLALEAADQLWVPVEKSWRLNERHYGGLTGKNK^^ 

PDMAKDDEHSAHTDRRYASLDDSVI PDAENLKVTLERALPFWEDKI APALKDGKNVFVGA 
HGNS I RALVKHI KQLSDDE I MDVE I PNFPPLVFEFDEKLNLVSEYYLGK 

SEQ ID NO. 4215: H36B STRAIN 

VKLVFARHGESEWNKANLFTGtiADVDLSEKGTQ 
IKTTNLAIiEAADQLWVPVEKSWRLNERHYGGLTGKNKAEAAE^ 

PDMAKDDEHSAHTDRRYASLDDSVI PDAENLKVTLERALPFWEDKI APALKDGKNVFVGA 
HGNS I RALVKHI KQLSDDE I MDVE I PNFPPLVFEFDEKLNLVSEYYLGK 

SEQ ID NO. 4216: 18RS21 STRAIN 

VKLVFARHGESEWNKANLFTGWADVDLS EKGTQQA I DAGKL I QAAGI EFDLAFTSVLKRA 
I KTTNLALEAADQLWVPVEKSWRLNERHYGGLTGKNKAEAAEQFGDBQVH I WRRS YDVLP 
PDMAKDDEHSAHTDRRYASLDDSVI PDAENLKVTLERALPFWEDKIAPALKDGKNVFVGA 
HGNS I RALVKHI KQLSDDE I MDVE I PNFPPLVFEFDEKLNLVSEYYLGK 

SEQ ID NO. 4217 1 M732 STRAIN 

VKLVFARHGESEWNKANLFTGWADVDLSE KGTQQA I DAG KL I QAAG I EFDLAFTSVLKRA 
I KTTNLALBAADQL WVF VE KS WRLNKRHY G GLTG KNKAEAAEQ FGD EQVH I WRRS YD VL P 
PDMAKDDEHSAHTDRRYASLDDSVI PDAENLKVTLERALPFWBDKIAPALKDGKNVFVGA 
HGNS I RALVKHI KQLSDDE IMDVE I PNFPPLVFEFDEKLNLVSEYYLGK 

SEQ ID NO. 4218: COK1 STRAIN 



754 
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Table 42: Comparative Sequences relating to SAG 0764 



VKLVPARHGBSEWNKANLFTGWADVDLSEKGTQQAIDAGKLIQAAGI EFDLAFTSVLKRA 
I KTTNLALEAADQLWVPVEKS WRLNERJ1YGGLTGKNKAEAAE 

PDMAKDDEHSAHTDRRYASLDDSVI PDAENLKVTLERALPFWEDKIAPALKDGKNVFVGA 
HGNS I RALVKHI KQLSDDE I MDVE I PNFPPLVFEFDE KLNL VS E YYLG K 

SKQ XD NO. 4219s CJB110 STRAIN 

VKLVFARHOTSEWNKANLFTGWADVI^ 

IKrTNtALBAADQLWVPVEKSWRLNEKHYGGLTGKNKAEAAEQFGDEQVH 
PDMAKDDEHSAHTDRRYASLDDSVI PliABNLXVTLBRALPFWEDKIAPALKDC^^ 
HGNS I RALVKHI KQLSDDE I MDVE I PNFPPLVFEFDE KLNLVSEYYLGK 

SEQ ID NO. 4220 1 1169NT STRAIN 

VFARHGBSEWNKANLFTGWADVDLSEKGTQC^IDA KT 
TNIJVLEAADQLWVPVEKSWRLNERHYGGLTGKNKAEAAEQFGDEQV^ 
AKDDEHSAHTDRRYASLDDSVI PDAENLKVTLERALPFWEDKIAPALKDGKNVFVGAHGN 
SI RALVKHI KQLSDDE I MDVE I PNFPPLVFEFDEKLNLVSEYYLQK 

SEQ ID NO. 4221s M781 STRAIN 

VKLVFARHGE SEWNKANL FTG WAD VDLSEKGTQQAIDAGKL I QAAGI EFDLAFTSVLKRA 
IKTTNLALEAADQLWVPVEKSWRLNERHYGGLTGKNKAEAABQF^^ 
PDMAKDDBHSAHTDRRYASLDDSVI PDAENLKVTLERALPFWEDKIAPALKDGKNVFVGA 
HGNS I RALVKHI KQLSDDE I MDVE I PNFPPLVFEFDEKLNLVSEYYLGK 

SSQ ID NO. 4222s JM9130013 STRAIN 

VKLWARHGESEWNKANLFTGWADVDLSEKGTQQAIDAGKLI QAAGI EFDLAFTSVLKRA 
IKTTNLALEAADQLWVPVEKSWRLNERHYGGLTGKNKAEAAEQFGDEO^ 
PDMAKDDBHSAHTDRRYASLDDSVI PDAENLKVTLERALPFWEDKI APALKDGKNVFVGA 
HGNS I RALVKHI KQLSDDE I MDVE I PNFP PLVFEFDBKLNLVSEYYLGK 

PRETTY of t /biotmp/msa70722.2{*} March 10, 2003 09i33 .. 



maa70722 . 2 { 110_090 
msa70722 . 2{ 110_18RS21 
msa70722. 2(110 2603 
msa7 072 2 .2(11 0_A909 
msa7 0722 . 2 { 110_CJB1 10 
msa70722 . 2 { 110_COHl 
msa70722 . 2 {110_H36B 
msa70722 . 2 {11D_JM9130013 
msa70722.2(ll0 M732 
rasa70722 . 2 { 1 10~M78 1 
msa70722.2{ll0_1169NT 
Consensus 



vklVFARHGE 
vklVFARHGE 
vklVFARHGE 
vklVFARHGE 
vklVFARHGE 
VklVFARHGE 
vklVFARHGE 
vklVFARHGE 
vklVFARHGE 
vklVFARHGE 
VF ARHGE 



SEWNKANLFT 
SEWNKANLFT 
SEWNKANLFT 
SEWNKANLFT 
SEWNKANLFT 
SEWNKANLFT 
SEWNKANLFT 
SEWNKANLFT 
SEWNKANLFT 
SEWNKANLFT 
SEWNKANLFT 



GWADVDLSEK 
GWADVDLSEK 
GWADVDLSEK 
GWADVDLSEK 
GWADVDLSEK 
GWADVDLSEK 
GWADVDLSEK 
GWADVDLSEK 
GWADVDLSEK 
GWADVDLSEK 
GWADVDLSEK 



GTQQAIDAGK 
GTQQAIDAGK 
GTQQAIDAGK 
GTQQAIDAGK 
GTQQAIDAGK 
GTQQAIDAGK 
GTQQAIDAGK 
GTQQAIDAGK 
GTQQAIDAGK 
GTQQAIDAGK 
GTQQAIDAGK 



50 

LIQAAGIEFD 
LIQAAGIEFD 
LIQAAGIEFD 
LIQAAGIEFD 
LIQAAGIEFD 
LIQAAGIEFD 
LIQAAGIEFD 
LIQAAGIEFD 
LIQAAGIEFD 
LIQAAGIEFD 
LIQAAGIEFD 



msa70722.2{HO_090 
msa70722 . 2{ 110_18RS21 
msa70722 . 2 f 110_2603 
msa70722.2{110 A909 
msa70722 .2 { 110_CJB110 
msa70722 . 2 {110_OOH1 
msa70722 . 2 (110_H36B 
msa70722 . 2 { 110_JM9130013 
tnsa70 722 . 2 { 1 10_M732 
msa70722.2{H0 M781 
msa70722 . 2{ 110_lT69NT 
Consensus 



51 

LAFTSVLKRA 
LAFTSVLKRA 
LAFTSVLKRA 
LAFTSVLKRA 
LAFTSVLKRA 
LAFTSVLKRA 
LAFTSVLKRA 
LAFTSVLKRA 
LAFTSVLKRA 
LAFTSVLKRA 
LAFTSVLKRA 



IKTTNLALEA 
IKTTNLALEA 
IKTTNLALEA 
IKTTNLALEA 
IKTTNLALEA 
IKTTNLALEA 
IKTTNLALEA 
IKTTNLALEA 
IKTTNLALEA 
IKTTNLALEA 
IKTTNLALEA 



ADQLWVPVEK 
ADQLWVPVEK 
ADQLWVPVEK 
ADQLWVPVEK 
ADQLWVPVEK 
ADQLWVPVEK 
ADQLWVPVEK 
ADQLWVPVEK 
ADQLWVPVEK 
ADQLWVPVEK 
ADQLWVPVEK 



SWRLNERHYG 
SWRLNERHYG 
SWRLNERHYG 
SWRLNERHYG 
SWRLNERHYG 
SWRLNERHYG 
SWRLNERHYG 
SWRLNERHYG 
SWRLNERHYG 
SWRLNERHYG 
SWRLNERHYG 



100 

GLTGKNKAEA 
GLTGKNKAEA 
GLTGKNKAEA 
GLTGKNKAEA 
GLTGKNKAEA 
GLTGKNKAEA 
GLTGKNKAEA 
GLTGKNKAEA 
GLTGKNKAEA 
GLTGKNKAEA 
GLTGKNKAEA 



msa70722 . 2 { 110_090 J 
msa70722 . 2 { 110__1BRS2 1 
rosa70722.2{ll0_2603 
msa7 0722 . 2 { 11 0_A9 0 9 ' 
rasa70722 .2{110_CJB110 
msa70722.2{HO COHl' 
nisa70722.2{110_H36B' 
msa70722 .2{llO_JM9130013 
msa70722.2(H0 M732 
msa70722 . 2 {110 J4781 
msa70722 . 2 { 110_1169NT 
Consensus 



101 

AEQFGDEQVK 
AEQFGDEQVH 
AEQFGDEQVH 
AEQFGDEQVH 
AEQFGDEQVH 
AEQFGDEQVH 
AEQFGDEQVH 
AEQFGDEQVH 
AEQFGDEQVH 
AEQFGDEQVH 
AEQFGDEQVH 



IWRRSYDVLP 
IWRRSYDVLP 
IWRRSYDVLP 
IWRRSYDVLP 
IWRRSYDVLP 
IWRRSYDVLP 
IWRRSYDVLP 
IWRRSYDVLP 
IWRRSYDVLP 
IWRRSYDVLP 
IWRRSYDVLP 



PDMAKDDEHS 
PDMAKDDEHS 
PDMAKDDEHS 
PDMAKDDEHS 
PDMAKDDEHS 



PDMAKDDEHS 
PDMAKDDEHS 
PDMAKDDEHS 
PDMAKDDEHS 
PDMAKDDEHS 



AHTDRRYASL 
AHTDRRYASL 
AHTDRRYASL 
AHTDRRYASL 
AHTDRRYASL 
AHTDRRYASL 
AHTDRRYASL 
AHTDRRYASL 
AHTDRRYASL 
AHTDRRYASL 
AHTDRRYASL 



150 

DDSVIPDAEN 
DDSVIPDAEN 
DDSVIPDAEN 
DDSVIPDAEN 
DDSVIPDAEN 
DDSVIPDAEN 
DDSVIPDAEN 
DDSVIPDAEN 
DDSVIPDAEN 
DDSVIPDAEN 
DDSVIPDAEN 



msa70722 . 2 { 110_090 
msa70722 . 2 { 110_1BRS21 
msa70722. 2/110 2603 
msa70722 . 2 { 110_A909 
msa70722 . 2 { 110_CJB110 
nisa70722 . 2 f 110_COH1 
tnsa70722. 2(110 H36B 
msa70722.2{H0_JM9130013 
msa70722.2{ll0 M732 



151 

LKVTLERALP 
LKVTLERALP 
LKVTLERALP 
LKVTLERALP 
LKVTLERALP 
LKVTLERALP 
LKVTLERALP 
LKVTLERALP 
LKVTLERALP 



FWEDKIAPAL 
FWEDKIAPAL 
FWEDKIAPAL 
FWEDKIAPAL 
FWEDKIAPAL 
FWEDKIAPAL 
FWEDKIAPAL 
FWEDKIAPAL 
FWEDKIAPAL 



KDGKNVFVGA 
KDGKNVFVGA 
KDGKNVFVGA 
KDGKNVFVGA 
KDGKNVFVGA 
KDGKNVFVGA 
KDGKNVFVGA 
KDGKNVFVGA 
KDGKNVFVGA 



HGNSIRALVK 
HGNSIRALVK 
HGNSIRALVK 
HGNSIRALVK 
HGNSIRALVK 
HGNSIRALVK 
HGNSIRALVK 
HGNSIRALVK 
HGNSIRALVK 



200 

HIKQLSDDBI 
HI KQLSDDE I 
HIKQLSDDBI 
HIKQLSDDBI 
HIKQLSDDBI 
HIKQLSDDBI 
HIKQLSDDBI 
HIKQLSDDBI 
HIKQLSDDBI 
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Table 42: Comparative Sequences relating to SAG 0764 



msa70722.2{ll0 M78l) 
msa70722 . 2{ 110_1169NT} 
Consensus 



msa70722 . 2 { 110_090; 
msa70722 . 2 { 110_I8RS21 
msa70722 . 2 { 110_2603 
msa70722 . 2 { 110_A909 
msa70722 . 2 { 110_CJB110 
msa70722 . 2 1 110_COH1 
msa7 072 2 . 2 { 1 10_H3 6B 
msa70722.2{H0_OM9130013 
msa70722 . 2 { 110_M732 
maa70722 . 2 { 110_M781 
rasa70722 . 2 { 110JL169NT 
Consensus 



LKVTLERALP FWEDKIAPAL KDGKNVFVGA HGNSIRALVK HIKQLSDDEI 
LKVTLERALP FWEDKIAPAL KDGKNVFVGA HGNSIRALVK HIKQLSDDEI 



201 

MDVEIPNFPP 
MDVEIPNFPP 
MDVEIPNFPP 
MDVEIPNFPP 
MDVEIPNFPP 
MDVEIPNFPP 
MDVEIPNFPP 
MDVEIPNFPP 
MDVErPNFPP 
MDVEIPNFPP 
MDVEIPNFPP 



LVFEFDBKLN 
LVFEFDEKLN 
LVFEFDEKLN 
LVFEFDEKLN 
LVFEFDEKLN 
LVFEFDEKLN 
LVFEFDEKLN 
LVFEFDEKLN 
LVFEFDBKLN 
LVFEFDEKLN 
LVFEFDEKLN 



229 

LVSEYYLGK 
LVSEYYLGK 
LVSEYYLGK 
LVSEYYLGK 
LVSEYYLGK 
LVSEYYLGK 
LVSEYYLGK 
LVSEYYLGK 
LVSEYYLGK 
LVSEYYLGK 
LVSEYYLGK 



756 



WO 2004/018646 



Table 43: Comparative Sequences relating to SAG0079 



SEQ ID NO. 4301: 2603 V/R STRAIN 

ATGAATCTTTTAATTATGGGTTTGCCTGGTGCTGGTAAAGCT 

GTTGAAGAATTTGGTGTTGCTCACATCTC^ 

AATCAAACXX5AAATGGOAOGTTTAGCTAAAAGCT 

GATGAAGTAACAAACGGGATTGTAAAAGAGCGCTTAGC^^ 

GGTTTTTTACTTGATGGATATCCACGTACrATTGAACAAG 

CTTGAAGAACTAGGACTACGCITAGATGG^ 

CTTATAGAGCGTTTGAGTGkTCOTATTATCAATCGTAAAACTG^ 

GTGTTCAACCCACCAGTAGATTATAAAGAAGAAGATTACTATCAACGTGAAG^ 

CCTGAAACTGTCAAAaSTCGCrTGGACX3TTAATAT^ 

CACTATCGTAAGCTTGGTC1TC1TACAGATA 

TTTG CAGATGTTGAAAAAGCGTTGCT AGAACTCAAA 

SEQ ID NO. 4302 1 090 STRAIN (reverse complement) 
AATCTTTTAATTATGGGTTTGCCK3GTC 

AGCAGCTAAGATCGTTGAAGAATTTGGTGTTGCT * 
CGCCGCAATGGCTAATCAAACOGAAATGGGACXnTTAGCTAAAAG^ 

TATCGCAGAAAAAGGTTTTTTACITGATGG^ 
CTTAGATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGGT^ 
GGATCCATCATGTCTTATAGAGCX^rTTGAGTG 
AACTTTCJCACAAAGTGTrCAACCCACCAGTAGACT 

TGAAGATGATAAGCCTGAAACTGTCAAAOGTOGCTTGGACGTTAATAT^ 

ACCTATTCTTGAACACTATCGTAAGCTTGGTCriXir 

AATAACAGAAGTITTTGCAGATGTTGAAAAAGCGTTG 

SBQ ID NO. 4303i 1169NT STRAIN (REVERSE COMPLEMENT) 

TGGTAAAGX3GACTCAAGCAGCTAAGATTGTT 
AGGGGATATGTTCCGCGCCGCAATGGCTAATCA^ 
TTATATTGATAAAGGTGAATTGGTTCCT^TCAA^ 
CITAGCTGAGGATGATATCGCAGAAAAAGGTTTTT^ 

TGAACAAG CACACGCCTTAGATG CTACGCTTGAAGAACTAGGACTACG CTTAGATGGTGT 

TATTAATATTAAAGTGGATCCATCATGTCTTATAGAGCGTT^ 

TCGTAAAACTGGTGAAACTTTCCACAAAGTGTTQ^ 

AGATTACTATCAACGTGAAGATGATAAGCCTGAAACT 

TATTGCTCAAGGAGAACCTATTCTTGAACACTATAGTA 

TGAAGGTAATCAAGAAATAA 

SEQ ID NO. 4304: 18RS21 STRAIN (REVERSE COMPLEMENT) 

AATCTTTTAACCACGGGTTCGCCTGGTGCTGCTAA^ 

TTGAAGAATTTGGTGTTGCTCACATCTC^ 

ATCAAACXXSAAATGGGACGTTTAGCTAAAAGTTATATTGA 

ATGAAGTAACAAACX3GGATTGTAAAAGAGCGCTTAG CTGAGGATGATATCGCAGAAAAAG 

GTTTTTTACTTGATGGATATCCACGTACTATTGA 

TTGAAGAACTAGGACTACGCTTAGATGGTGTTATTAAT^ 

TTATAGAGCGTTTGAGTGGTCXSTATTATCAAT^ 

TGTTCAACCCACXIAGTAGATTATA7\AGAAGAAGATTACTA 

CTGAAACTGTCAAACGTCGCrrTGG 

ACTATCGTAAGCTTGGTCTTGTTACAGATATTGAAG^ 

TTGCAGATGTTGAAAAAGCGTTG 

SBQ ID NO. 4305: A909 STRAIN (REVERSE COMPLEMENT) 

CTAAGATCXn'TGAAGAATTTGGTGTTGCTCAC^ 

CAATGGCTAATCAAACOGAAATGGGAOGTTTAGCTAAAAG^ 

TGGTTCCTGATGAAGTAACAAACGGGATTGTAAAAGAGCGCr^ 

CAGAAAAAGGTriUTlACTTGATGGATATCCACGTACTA 

ATGCTACGCTTGAAGAACTAGGACTACGCTTAGATGG'iXJ 

CATCATGTCrTATAGAGCGTTTGAGTGGTCGTATTA 

TCCACAAAGTGTTCAACCCACCAGTAGATTATAAAG^ 

ATGATAAGCCTGAAACTGTCAAACGTCGCTTGG^ 

TTCTTGAACACTATCGAAAGCTTGGTCTTGT^ 

SBQ ID NO. 4306: CJB110 STRAIN (REVERSE COMPLEMENT) 

GATCGTTGAAGAArTTGGTGTTGCTCACATCTC^ CGCCGCAAT 
GGCTAATCAAACCGAAATGGGACGTTTAGCTAAAAGTTATATTG^ 
TCCTGATGAAX3TAACAAACGGGATTGTAAAAGAGCG CTTAGCTGAGGATGATATCGCAGA 
AAAAGGTTTTTTACTTGATGGATATCCACGTACT 
TACGCTTGAAGAACTAGGACTACGCTTAGATGGTGTTATrAATA 
■ ATGTCTTATAGAGCGTTTGAGTGGTCGTATTA 
CAAAGTGTTCAACCC^CCAGTAGATTATAAAG 
TAAGCCTGAAACrGTGftAACGTCGCrT^ 
TGAACACTATAG 

SEQ ID NO. 4307: GOBI STRAIN (REVERSE COMPLEMENT) 

ATCTTTTAATTATGGGTTTGCCTGGTGCT 

AAGAATTTGGTGTTGCTCACATCTCAACAGGGGAT^ 

AAACCCAAATGGGACGTTTAGCTAAAAGTTATATTGAT^ 

AAGTAACAAACGGGATTGTAAAAGAGCGCITAGCTGAG 

TTTTACTTGATGGATATCCACGTACTATTGAGCM 

AAGAACTAGGACTACGCTTAGATGGTGTTATTAATATT 

TAGAGCGTTTGAGTGGCCGTATTATCAATCGTAAAACTGG^ 
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Table 43: Comparative Sequences relating to SAG0079 



TCAACCCACCAGTAGATTATAAAGAAGA^ 

AAACTCTCAAACXSTCGCTTGGACGTTAATATTGCTCAAGGAGAACCT 
ATCGTAAGCTTGGTCTTGTTACAGATATO3AAGCT 
CAGATGTTGAAAAAG CGTTQ 



SEQ ID NO. 4308s H36B STRAIN (REVERSE COMPLEMENT) 

CAGGGGATATGTTCCGCX3 CCG CAATGGCTAATCAAACCGAAATGGGACXnTT^ 
GTTATATTGATAAAGGTGAATTGGTTCCT^ 

GCTTAG CTGAGGATGATATCG CAGAAAAAGGTTTTTTACTTGATGGATATCC^ 
TTGAACIAAGCACAOGCCTTAGATGCTACX3CTTGAAGAA 

TTATTAAT ATTAAAGTGGATCCATCATGTCTTATAGAG CXjTTTGAGTGGTCGTATTATCA 

ATCGTAAAAGTGGTGAAACTTTCCACAAAGTGTTC^ 

AAGATTACTATCAACGK1AAGATGATAAGCCTGAAACT 

ATATTGCTCRAGGAGAATCTATTCTT GAACACTA ^ 

TTGAAGGTAATCAAGAAATAACAGAAGTTTTTC 



SEQ ID NO. 4309s JH9130013 STRAIN (REVERSE COMPLEMENT) 

ACTCAAGCAGCTAAGATCGTTGAAGAATTTGCT 

TTCCGCX5CCX3CAATGGCTAATCAAACCX3A 

AAAGGTGAATTGGTTCKTTGATGAAGTAACAAACGGGATTCT 

GATGATATCXSCAGAAAAAGGTTTITTACTTQATGGATATCCACCT 

CACGCCTTAGAlXJC'rACGCTlXjAAGA 

AAAGTGGATCCATCATGTCTTATAGAGOJITTGAGTGGT 

GGTGAAACTTT CCACAAAGTGTT CAACCCAC CAGTAGATTAT AAAGAAGAAGATT AC7TAT 
CAACGTGAAGATGATAAGCCTGAAACTGTrAAACCT C^ 

CA 

SEQ ID NO. 4310s M732 STRAIN (REVERSE COMPLEMENT) 

CTTTT AATTATGGGTTTG CCTGGTG CTGGTAAAGGT ACTCAAG CAGCTAAGATTG'ITGAA 
GAATTTGGTGTTGCTCACATC 

ACCCAAATGGGACXSTTTAGCTAAAAGTTATATTGATAA^ 

CTAACAAACGGGATTGTAAAAGAGCGCTTAGCTGAG 

TTACTTGATGGATATCCACXjTACIATTGAGCAAG 

GAACTAGGACTACGCTTAGATGGTGTTAT^ 

GAG CGTTTGAGTGGCCGTATTATCAATCCTAAAACTGGTGAAA 

aacccaccagtagattataaagaagaagattactat 

ACTGTCAAACGTCGCTTGGACX?rTAATATTG 

CXSTAAGCTTGGTCTTGTTACAGATATTGAAGGTAATCAAG^ CA 
GATGTTGAAAAAGCGTTG 



SEQ ID NO. 43 lit M781 STRAIN (REVERSE COMPLEMENT) 

AATCirTTAATTACXSGGTTTGCCTGGT 
GCAGCTAAGATTGTTGAAGAATTTGGTGTTGCT 

GCCGCAATGGCTAATCAAACCCAAATGGGACGTTTAGCTAAAAGTTATATTGA 

GAATTGGTTCCTGATGAAGTAACAAACGGGATTCT 

ATCGCAGAAAAAGGTTTTTTACTTGATGGATAT^ 

TTAGATGCTACX3CTTGAAGAACTAGGACTACG<OT 

GATCCAACATGCCITTATAGAGCGTTTGAG^ 

ACTTICCACAAAGTGTTCAACCCACCA^ 

GAAGATGATAAGCCTGAAACTGTCAAACGTCGCTTGG^ 



MSA Alignment Results: Pretty output 

PRETTY of : /biotnp/rasa2S038 ,2{* } April 17, 2002 08:53 
PRETTY of: /biotmp/msa252229 .2{*} January 31, 2003 03:05 



rasa252229 . 2 ( 114_COHl 
maa2S2229 . 2 { 114_M732 
mea252229 . 2 j 114_M781 
maa25222 9 . 2 { 114_A909 
msa25222 9 . 2 ( 1 14_JM9130013 
msa252229 . 2 { 114_CJB110 
msa252229 . 2 { 114_090 
msa252229 . 2 { 114_2603 
msa252229 . 2 { 114JK36B 
msa252229 . 2 (114_18RS21 
msa252229 . 2 { 114_1169NT 
Consensus 



atcttt 

cttt 

Aatcttt 

Aatcttt 

Aatcttt 

Aatcttt 

Aatcttt 

atgAatcttt 



taattatggg 
taattatggg 
taattacggg 
taattatggg 
taattatggg 
taaccacggg 
taattatggg 
taattatggg 



tttgcctggt 
tttgcctggt 
tttgcctggt 
tttgcctggt 
tttgcctggt 
tttgcttggt 
tttgcctggt 
tttgcctggt 



gctggtaaag 
gctggtaaag 
gctggtaaag 
gctggtaaag 
gctggtaaag 
gctggtaaag 
gctggtaaag 
gctggtaaag 



50 

gtactcaagc 
gtactcaagc 
gtactcaagc 
gtactcaagc 
gtactcaagc 
gtactcaagc 
gtactcaagc 
gtactcaagc 



Aatcttt taaccacggg ttcgcctggt gctggtaaag gtactcaagc 

. — tggtaaag ggactcaagc 



mea252229 . 2 { 114_COHl| 
msa252229 . 2 { 114_M732 
msa25222 9 . 2 J 114_M781 
msa252229 . 2 ( 114_A909 
msa252229.2{H4_JM9130013 
msa252229 . 2 { 114_CJB110 
msa252229.2{H4_090 
msa252 22 9 . 2 { 114_2 603 
msa252229 . 2{114_H36B 
msa252229.2fll4_18RS21 
msa252229.2{ll4_1169NT 



51 

agctaagatt 
agctaagatt 
agctaagatt 
agctaagatc 
agctaagatc 
agctaagatc 
agctaagatc 
agctaagatc 



gttgaagaat 
gttgaagaat 
gttgaagaat 
gttgaagaat 
gttgaagaat 
gttgaagaat 
gttgaagaat 
gttgaagaat 



ttggtgttgc 
ttggtgttgc 
ttggtgttgc 
ttggtgttgc 
ttggtgttgc 
ttggtgttgc 
ttggtgttgc 
ttggtgttgc 



tcacatctca 
tcacatctca 
tcacatctca 
tcacatctca 
tcacatctca 
tcacatctca 
tcacatctca 
tcacatctca 



agctaagatc gttgaagaat 
agctaagatt gttgaagaat 



ttggtgttgc 
ttggtgttgc 



tcacatctca 
gcacatctca 



100 

aCAGGGGATA 
aCAGGGGATA 
aCAGGGGATA 
aCAGGGGATA 
aCAGGGGATA 
aCAGGGGATA 
aCAGGGGATA 
aCAGGGGATA 
-CAGGGGATA 
aCAGGGGATA 
aCAGGGGATA 
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consensus 



msa25222 9 . 2 f 114_C0H1 , 
msa252229. 2(114 M732 
rasa252229 . 2 (114~M781 
msa252229. 2(114 A909 
msa252229 . 2 { 114_JM9130013 ( 
msa252229 . 2 { 114_CJB110 
msa252229.2{ll4_090 
msa252229.2{ll4_2603 
msa252229.2{114_H36B 
nisa252229 . 2 { 114JL8RS21 
msa252229 . 2 { 114_1169NT 
Consensus 



101 

TGTTCCGCGC 
TGTTCCGCGC 
TGTTCCGCGC 
TGTTCCGCGC 
TGTTCCGCGC 
TGTTCCGCGC 
TGTTCCGCGC 
TGTTCCGCGC 
TGTTCCGCGC 
TGTTCCGCGC 
TGTTCCGCGC 



CGCAATGGCT 
CGCAATGGCT 
CGCAATGGCT 
CGCAATGGCT 
CGCAATGGCT 
CGCAATGGCT 
CGCAATGGCT 
CGCAATGGCT 
CGCAATGGCT 
CGCAATGGCT 
CGCAATGGCT 



AATCAAACCc 
AATCAAACCc 
AATCAAACCC 
AATCAAACCg 
AATCAAACCg 
AATCAAACCg 
AATCAAACCg 
AATCAAACCg 
AATCAAACCg 
AATCAAACCg 
AATCAAACCg 



AAATGGGACG 
AAATGGGACG 
AAATGGGACG 
AAATGGGACG 
AAATGGGACG 
AAATGGGACG 
AAATGGGACG 
AAATGGGACG 
AAATGGGACG 
AAATGGGACG 
AAATGGGACG 



. 150 
TTTAGCTAAA 
TTTAGCTAAA 
TTTAGCTAAA 
TTTAGCTAAA 
TTTAGCTAAA 
TTTAGCTAAA 
TTTAGCTAAA 
TTTAGCTAAA 
TTTAGCTAAA 
TTTAGCTAAA 
TTTAGCTAAA 



msa252229.2{H4 COH1, 
msa252229.2(114 M732 
msa252229. 2(114 M781 
msa252229.2{114~A909] 
maa252229 . 2 {114_JM9130013 , 
msa252229 . 2{ll4_CJB110 
msa2 52229 , 2 { 114_090 
msa252229.2(H4 2603 
msa252229.2{114_H36B 
rasa252229 . 2 ( 114_18RS2 1 
rasa252229 . 2 { 114_1169NT 
Consensus 



151 

AGTTATATTG 
AGTTATATTG 
AGTTATATTG 
AGTTATATTG 
AGTTATATTG 
AGTTATATTG 
AGTTATATTG 
AGTTATATTG 
AGTTATATTG 
AGTTATATTG 
AGTTATATTG 



ATAAAGGTGA 
ATAAAGGTGA 
ATAAAGGTGA 
ATAAAGGTGA 
ATAAAGGTGA 
ATAAAGGTGA 
ATAAAGGTGA 
ATAAAGGTGA 
ATAAAGGTGA 
ATAAAGGTGA 
ATAAAGGTGA 



ATTGGTTCCT 



ATTGGTTCCT 
ATTGGTTCCT 
ATTGGTTCCT 
ATTGGTTCCT 
ATTGGTTCCT 
ATTGGTTCCT 
ATTGGTTCCT 
ATTGGTTCCT 
ATTGGTTCCT 



GATgAAGTAA 
GATgAAGTAA 
GATgAAGTAA 
GATgAAGTAA 
GATgAAGTAA 
GATgAAGTAA 
GATgAAGTAA 
GATgAAGTAA 
GATgAAGTAA 
GATgAAGTAA 
GATcAAGTAA 



200 

CAAACGGGAT 
CAAACGGGAT 
CAAACGGGAT 
CAAACGGGAT 
CAAACGGGAT 
CAAACGGGAT 
CAAACGGGAT 
CAAACGGGAT 
CAAACGGGAT 
CAAACGGGAT 
CAAACGGGAT 



tnsa252229.2< 114_COHl 
msa252229 . 2 114_M732 \ 
msa252229 .2 114JM781 
msa2S2229.2{114_A909 
msa252229 . 2 { 114_JM9130013 
msa252229 . 2 { 114_CJB110 
nisa252229 . 2 { 114_090 
msa252229 . 2 f 114_2603 
msa252229 . 2{114_H36B 
msa252229 . 2 ( 114_18RS21 
rasa252229.2{114_1169NT 
Consensus 



msa252229 . 2 ( 114_COHl 
rasa252229.2(114_M732 
msa252229.2(114_M781 
msa252229.2(114_A909 
msa252229 . 2 {114_CJM9130013 
msa252229 . 2 {114_CJB110 
msa252229 . 2 { 114_090 
rasa25 2 22 9 . 2 { 114_2 6 03 
tnsa252229 . 2 {114_H36B 
msa252229 . 2 ( 114_18RS21 
msa252229.2{H4_1169NT 
Consensus 



201 

TGTAAAAGAG 
TGTAAAAGAG 
TGTAAAAGAG 
TGTAAAAGAG 
TGTAAAAGAG 
TGTAAAAGAG 
TGTAAAAGAG 
TGTAAAAGAG 
TGTAAAAGAG 
TGTAAAAGAG 
TGTAAAAGAG 



CGCTTAGCTG 
CGCTTAGCTG 
CGCTTAGCTG 
CGCTTAGCTG 
CGCTTAGCTG 
CGCTTAGCTG 
CGCTTAGCTG 
CGCTTAGCTG 
CGCTTAGCTG 
CGCTTAGCTG 
CGCTTAGCTG 



AGGATGATAT 
AGGATGATAT 
AGGATGATAT 
AGGATGATAT 
AGGATGATAT 
AGGATGATAT 
AGGATGATAT 
AGGATGATAT 
AGGATGATAT 
AGGATGATAT 
AGGATGATAT 



CGCAGAAAAA 
CGCAGAAAAA 
CGCAGAAAAA 
CGCAGAAAAA 
CGCAGAAAAA 
CGCAGAAAAA 
CGCAGAAAAA 
CGCAGAAAAA 
CGCAGAAAAA 
CGCAGAAAAA 
CGCAGAAAAA 



250 

GGTTTTTTAC 
GGTTTTTTAC 
G GTTTTTT AC 
GGTTTTTTAC 
GGTTTTTTAC 
GGTTTTTTAC 
GGTTTTTTAC 
GGTTTTTTAC 
GGTTTTTTAC 
GGTTTTTTAC 
GGTTTTTTAC 



251 

TTGATGGaTA 
TTGATGGaTA 
TTGATGGaTA 
TTGATGGaTA 
TTGATGGaTA 
TTGATGGaTA 
TTGATGGaTA 
TTGATGGaTA 
TTGATGGaTA 
TTGATGGaTA 
TTGATGGgTA 



TCCACGTACT 
TCCACGTACT 
TCCACGTACT 
TCCACGTACT 
TCCACGTACT 
TCCACGTACT 
TCCACGTACT 
TCCACGTACT 
TCCA CGTA CT 
TCCACGTACT 
TCCACGTACT 



ATTGAgCAAG 
ATTGAgCAAG 
ATTGAgCAAG 
ATTGAaCAAG 
ATTGAaCAAG 
ATTGAaCAAG 
ATTGAaCAAG 
ATTGAaCAAG 
ATTGAaCAAG 
ATTGAaCAAG 
ATTGAaCAAG 



CACACGCCTT 
CACACGCCTT 
CACACGCCTT 
CACACGCCTT 
CACACGCCTT 
CACACGC CTT 
CACACGCCTT 
CACACGCCTT 
CACACGC CTT 
CACACGC CTT 
CACACGCCTT 



300 

AGATGCTACG 
AGATGCTACG 
AGATGCTACG 
AGATGCTACG 
AGATGCTACG 
AGATGCTACG 
AGATGCTACG 
AGATGCTACG 
AGATGCTACG 
AGATGCTACG 
AGATGCTACG 



rasa252229.2(ll4_COHl 
msa252229.2(114_M732 
msa252 22 9 . 2 ( 114_M78 1 t 
rasa252 229 . 2 { 114_A909 
msa252229 . 2 { 114_JM9130013 . 
msa25222 9 . 2 { 114_CJB110 
msa252229.2{H4 090 
msa252229. 2 (114^2603 
msa252229 . 2 { 114_H36B ( 
rasa25222 9 . 2 ( 114 - 18RS21 
insa252229 . 2 { 114_1169NT] 
Consensus 



301 

CTTGAAGAAC 
CTTGAAGAAC 
CTTGAAGAAC 
CTTGAAGAAC 
CTTGAAGAAC 
CTTGAAGAAC 
CTTGAAGAAC 
CTTGAAGAAC 
CTTGAAGAAC 
CTTGAAGAAC 
CTTGAAGAAC 



TAGGACTACG 
TAGGACTACG 
TAGGACTACG 
TAGGACTACG 
TAGGACTACG 
TAGGACTACG 
TAGGACTACG 
TAGGACTACG 
TAGGACTACG 
TAGGACTACG 
TAGGACTACG 



CTTAGATGGT 
CTTAGATGGT 
CTTAGATGGT 
CTTAGATGGT 
CTTAGATGGT 
CTTAGATGGT 
CTTAGATGGT 
CTTAGATGGT 
CTTAGATGGT 
CTTAGATGGT 
CTTAGATGGT 



GTTATTAATA 
GTTATTAATA 
GTTATTAATA 
GTTATTAATA 
GTTATTAATA 
GTTATTAATA 
GTTATTAATA 
GTTATTAATA 
GTTATTAATA 
GTTATTAATA 
GTTATTAATA 



350 

TTAAAGTGGA 
TTAAAGTGGA 
TTAAAGTGGA 
TTAAAGTGGA 
TTAAAGTGGA 
TTAAAGTGGA 
TTAAAGTGGA 
TTAAAGTGGA 
TTAAAGTGGA 
TTAAAGTGGA 
TTAAAGTGGA 



ras a2 52229. 2 { 114_COHl 
msa252229 . 2 { 114_M732 
msa252229 . 2 (114^81 
rasa252229.2{114_A909 
msa252229 . 2 { 114_JM91 30013 

msa252229.2{H4_CJB110 
msa252229.2{H4_090 
msa252229. 2(114 2603 
msa252229 . 2 { 1143i36B 

msa252229 . 2 { 114_18RS21 



351 

TCCAaCATGc 
TCCAaCATGc 
TCCAaCATGc 
TCCAtCATGt 
TCCAtCATGt 
TCCAtCATGt 
TCCAtCATGt 
TCCAtCATGt 
TCCAtCATGt 
TCCAtCATGt 



CTTATAGAGC 
CTTATAGAGC 
CTTATAGAGC 
CTTATAGAGC 
CTTATAGAGC 
CTTA TAGAGC 
CTTATAGAGC 
CTTATAGAGC 
CTTATAGAGC 
CTTATAGAGC 



GTTTGAGTGg 
GTTTGAGTGg 
GTTTGAGTGg 
GTTTGAGTGg 
GTTTGAGTGg 
GTTTG AGTGg 
GTTTGAGTGg 
GTTTGAGTGk 
GTTTGAGTGg 
GTTTGAGTGg 



CCGTATTATC 
CCGTATTATC 
CCGTATTATC 
tCGTATTATC 
tCGTATTATC 
tCGTATTATC 
tCGTATTATC 
tCGTATTATC 
tCGTATTATC 
tCGTATTATC 



400 

AATCGTAAAA 
AATCGTAAAA 
AATCGTAAAA 
AATCGTAAAA 
AATCGTAAAA 
AATCGTAAAA 
AATCGTAAAA 
AATCGTAAAA 
AATCGTAAAA 
AATCGTAAAA 
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tnsa252229 . 2 { 1 14_1169NT} 
Consensus 



TCCAtCATGt CTTATAGAGC GTTTGAGTGg tCGTATTATC AATCGTAAAA 



msa252229.2fll4_COHl 
msa252229 . 2 {ll4_M732 
msa252229.2(114_M781 
msa2 S 2 2 2 9 . 2 { 1 14_A9 0 9 
msa252229 • 2 { 114_JM9130013 
msa252229 . 2 { 1 14J3JB1 10 
msa252229 . 2 { 114_090 
msa252229 .2 Ill4_2603 
msa252229.2{H4_H3 6B 
rasa252229.2(ll4_18RS21 
msa252229.2{114_1169NT 
Consensus 



401 

CTGGTGAAAC 
CTGGTGAAAC 
CTGGTGAAAC 
CTGGTGAAAC 
CTGGTGAAAC 
CTGGTGAAAC 
CTGGTGAAAC 
CTGGTGAAAC 
CTGGTGAAAC 
CTGGTGAAAC 
CTGGTGAAAC 



TTTCCACAAA 
TTTCCACAAA 
TTTCCACAAA 
TTTCCACAAA 
TTTCCACAAA 
TTTCCACAAA 
TTTCCACAAA 
TTTCCACAAA 
TTTCCACAAA 
TTTCCACAAA 
TTTCCACAAA 



GTGTTCAACC 
GTGTTCAACC 
GTGTTCAACC 
GTGTTCAACC 
GTGTTCAACC 
GTGTTCAACC 
GTGTTCAACC 
GTGTTCAACC 
GTGTTCAACC 
GTGTTCAACC 
GTGTTCAACC 



CACCAGTAGA 
CACCAGTAGA 
CACCAGTAGA 
CACCAGTAGA 
CACCAGTAGA 
CACCAGTAGA 
CACCAGTAGA 
CACCAGTAGA 
CACCAGTAGA 
CACCAGTAGA 
CACCAGTAGA 



450 

TTATAAAGAA 
TTATAAAGAA 
TTATAAAGAA 
TTATAAAGAA 
TTATAAAGAA 
TTATAAAGAA 
TTATAAAGAA 
TTATAAAGAA 
TTATAAAGAA 
TTATAAAGAA 
TTATAAAGAA 



msa252229.2 114_COHl 
msa252229.2 114 M732 
msa252229.2 'll4~M761 
msa252229.2(114 A909 
msa252229.2{H4_JM9130013 
msa252229 . 2 { 114_CJB110 
msa252229 . 2 { 114_090 
maa252229.2(H4_2603 
msa252229.2{ll4_H36B 
msa252229 . 2 { 114_18RS21 
msa252229.2{114_1169NT 
Consensus 



451 

GAAGATTACT 
GAAGATTACT 
GAAGATTACT 
GAAGATTACT 
GAAGATTACT 
GAAGATTACT 
GAAGATTACT 
GAAGATTACT 
GAAGATTACT 
GAAGATTACT 
GAAGATTACT 



ATCAACGTGA 
ATCAACGTGA 
ATCAACGTGA 
ATCAACGTGA 
ATCAACGTGA 
ATCAACGTGA 
ATCAACGTGA 
ATCAACGTGA 
ATCAACGTGA 
ATCAACGTGA 
ATCAACGTGA 



AGATGATAAG 
AGATGATAAG 
AGATGATAAG 
AGATGATAAG 
AGATGATAAG 
AGATGATAAG 
AGATGATAAG 
AGATGATAAG 
AGATGATAAG 
AGATGATAAG 
AGATGATAAG 



CCTGAAACTG 
CCTGAAACTG 
CCTGAAACTG 
CCTGAAACTG 
CCTGAAACTG 
CCTGAAACTG 
CCTGAAACTG 
CCTGAAACTG 
CCTGAAACTG 
CCTGAAACTG 
CCTGAAACTG 



500 

TcAAACGTCG 
TcAAACGTCG 
TcAAACGTCG 
TCAAACGTCG 
TtAAACGTCG 
TcAAACGTCG 
TcAAACGTCG 
TcAAACGTCG 
TcAAACGTCG 
TcAAACGTCG 
TcAAACGTCG 



maa252229.2(114_COHl 
msa252229 . 2 (114J4732 
msa252229.2{114_M781 
msa25222 9.2{114_A909 
msa252229 . 2 {ll4_JM9130013 
msa25222 9 . 2 ( 114_CJB110 
msa252229 . 2 { 114_090 
rasa252229 .2fll4_2603 
insa2 5 2 22 9 . 2 { 1 14_H3 6B 
msa252229.2fll4_18RS21 
msa252229 . 2 {114_1169NT 
Consensus 



501 

CTTGGACGTT 
CTTGGACGTT 
CTTGGACGTT 
CTTGGACGTT 
CTTGGACGTT 
CTTGGACGTT 
CTTGGACGTT 
CTTGGACGTT 
CTTGGACGTT 
CTTGGACGTT 
CTTGGACGTT 



aATATTGCTC 
aATATTGCTC 
aATATTGCTC 
aATATTGCTC 
aATATTGCTC 
aATATTGCTC 
aATATTGCTC 
aATATTGCTC 
aATATTGCTC 
aATATTGCTC 
cATATTGCTC 



AAggagaacc 
AAggagaacc 

AA — ■ 

AAggagaatc 
AAggagaacc 
AAggagaacc 
AAggagaacc 
AAggagaacc 
AAggagaatc 
AAggagaacc 
AAggagaacc 



550 

tattcttgaa cactatcgta 
tattcttgaa cactatcgta 



tattcttgaa 
tattcttgaa 
tattcttgaa 
tattcttgaa 
tattcttgaa 
tattcttgaa 
tattcttgaa 
tattcttgaa 



cactatcgaa 
cactataaaa 
cactatag— 
cactatcgta 
cactatcgta 
cactatcgta 
cactatcgta 
cactatagta 



msa25 2 22 9 . 2 { 114_COHl 
msa252229.2IH4 M732 
rasa252229 . 2 ( 114~~M781 
msa252229 . 2 {114~A909 
msa252229 . 2 { 114_JM913O0 13 
msa25222 9 . 2 { 114_CJB1 10 
msa252229 . 2 { 114_090 
msa252229 . 2 { 114J2603 
msa252229.2{114 H36B 
msa252229 . 2 {ll4_18RS21 
msa252229.2{ll4_1169NT' 
Consensus 



551 600 

agcttggtct tgttacagat attgaaggta atcaagaaat aacagaagtt 

agcttggtct tgttacagat attgaaggta atcaagaaat aacagaagtt 

agcttggtct tgttacagat attgaaggta a — ~ 

agcttggtct tgttacagat attgaaggta a tea — 



agcttggtct tgttacagat attgaaggta atcaagaaat aacagaagtt 
agcttggtct tgttacagat attgaaggta atcaagaaat aacagaagtt 
agcttggtct tgttacagat attgaaggta atcaagaaat aacagaagtt 
agcttggtct tgttacagat attgaaggta atcaagaaat aacagaagtt 
agettggect tgttacagat attgaaggta atcaagaaat aa 



msa252229.2{H4 COH1 
oisa252 2 2 9 . 2 ( 1 14~*M7 3 2 ' 
msa252229.2(114_M781 
msa252229 . 2 { 114_A909 
Ittsa252229 . 2 { 114_JM9130013 ' 
msa252229.2{ll4_CJB110' 
msa252229.2{H4 090 
msa252229 . 2 fll4_2603 
msa25222 9 . 2 { 114_H36B 
msa252229.2(ll4 18RS21 
msa252229 . 2 { 114~1169NT^ 
Consensus 



601 

tttgcagatg ttgaaaaagc gttg- 
tttgcagatg ttgaaaaagc gttg- 



636 



tttgcagatg ttgaaaaagc gttg — 

tttgcagatg ttgaaaaagc gttgctagaa ctcaaa 

tttgcagatg ttgaaaaagc gttg 

tttgcagatg ttgaaaaagc gttg *- 



SEQ ZD NO. 4312: 2603 V/R STRAIN 

MNLLIMGLPGAGKGTQAAKI VEEFGVAHI STGDMFRAAMANQTEMGR1AKSY IDKGELVP 
DEVTNGI VKERLAEDD I ABKGFLLDGYPRTI EQAHALDATLEELGLRIjDGVINI KVDPSC 
LIBRLSXRI I NRKTGBTPBKVFNPPVDYKEBDYYQREDDKPBTVKRRlrDVN IAQGEP I LB 
HYRKLGLiVTD I EGNQE I TBVFADVE KALLELK 

SEQ ZD NO. 4313 s 090 STRAIN 

NLLIMGLPGAGKGTQAAKI VEBFGVAHI STGBMFRAAMANCTEMGRLAKS Y I DKGELVPD 

BVrNGIVKERLAETJDIABKGFLLrXOTRTIEQAHAliD^ 

IBRLSGRI INRKTGETFHKVFNPPVDYKBEDYYQREDDKPBT\n<RR 
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YRKLGLVTDIEGNQEITEVFADVEKALLELK 
SBQ ID NO. 4314: 1169NT STRAIN 

GKGTQAAKI VEEFGVAHI STGDMFRAAMANQTEMGRLAKSY I DKGELVPDQVTNG I VKER 
LAEDD I AE KG FLiDGYPRTI EQAHALDATLEELGLRLDGVI NI KVDPS CL I ERLSGRI I N 
RKTGETFHKVFNPPVDYKBBDYYQREDD10?ETvTCRR^ 
BGNQEI 

SBQ ZD NO. 4315: 18RS21 STRAIN 

NLLTTGSPGAGKGTQAAKI VEEFGVAHI STGDM FRAAMANQTEMGRLAKS Y I DKGELVPD 
EVTNG I VKERliAEDD I AE KGFLLlDG YPRT X EQAHALDATLEELGLRLDGV I N I KVDPSCL 
I ERLSGRI INRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNI AQGEP ILEH 
YRKLGLVTDI EGNQE I TE VF ADVEKALLE 

SBQ ZD NO. 4316s A909 STRAIN 

NLLIMGLPGAGKGTQAAKI VEEFGVAHI STGDMFRAAMANQTEMGRLAKSY I DKGELVPD 
EVTNG I VKERLAEDDIAEKGFLLDGYPRTI EQAHALDATLEELGLRLDGV I N I KVDPSCL 
I ERLSGRI I NRKTGET FHKVFNP PVD YKEED YYQREDDKPETVKRRLDVNI AQGE S I LEH 
YRKLGLVTDIEG 

SBQ ZD NO. 4317s A909 STRAIN 

NLLIMGLPGAGKGTQAAKI VEEFGVAHI STGDMFRAAMANQTEMGRLAKSY I DKGELVPD 
EVTNGI VKERLAEDDIAEKGFLLDGYPRTI EOAHALDATLEELGLRLDGVINI KVDPSCL 
I ERLSGRI INRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAG^ESILKH 
YRKLGLVTDIEG 

SBQ ZD NO. 4318 x CJB110 STRAIN 

NLLTTGLLGAGKGTQAAKI VEEFGVAHI STGDMFRAAMANQTEMGRLAKSY I DKGELVPD 
EVTNG I VKERLAEDDIAEKGFLLDGYPRTI ECJUIALDATLEELGLRLDGVI NI KVDPSCL 
I ERLSGRI I NRKTGET FHKVFNP PVDYKEEDYYQRBDDKPETVKRRIjDVNIAQ^ 
Y 

SBQ ZD NO. 4319i COH1 STRAIN 

LL I MGLPGAGKGTQAAKI VEEFGVAH I S1X3DMFRAAMANQTQMGRLAKSY I DKGELVPDE 
VTNG I VKERLAEDDIAEKGFLLDGYPRTI EQAHALDATLEELGIjRLDGVINIKVDPTCLI 
ERLSGRI INRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDVNIAQGEPILEHY 
RKLGLVTD I EGNQE I TEVFAD VEKALL 

SBQ ZD NO. 4320: H36B STRAIN 

GDMFRAAMANQTEMGRLAKS YI DKGELVPDEVTNG I VKHRLAEDDI AEKGFLLDGYPRT I 
EQAHALDATLEELGIJILDGVINI KVDPS CXi I ERLSGRI INRKTGETFHKVFNP P VD YKEE 
DYYQREDDKPETVKRRLDVNI AQGES I LEHYRKLGLVTD I EGNQE I TEVFADVEKAL 

SBQ ZD NO. 4321s JM9130013 STRAIN 

NLLIMGLPGAGKGTQAAKI VEEFGVAHI STGDMFRAAMANQTEMGRLAKSYI DKGELVPD 
EVTNGI VKERLAEDDIAEKGFLLDGYPRTI EQAHALDATLiEELGLRLDGVINI KVDPSCL 
I ERLSGRI INRKTGETFHKVFNPPVDYKEEDYYQREDDKPETVKRRLDWIAQGEPILEH 
YKKLGLVTD I EGN 

SBQ ZD NO. 4322s M732 STRAIN 

LL I MGLPGAGKGTQAAKI VEEFGVAHI STGDMFRAAMANQTQMGRLAKS Y I DKGELVPDE 
VTNGI VKERLAEDDI AEKGFLLDGYPRT I ECAHALDATLEEIX3LRLDGVINI KVDPTCL I 
ERLSGRI INRKlX3ETFHiCVFNPPVDYKEEDYYQREDDKPETVKRRIJ3VNIAG^EP ILEHY 
RKLGLVTD I EGNQE I TEVFAD VBKALLELK 

SBQ ZD NO. 4323s H781 STRAIN 

NLLITGLPGAGKGTQAAKI VBEFGVAHI STGDM FRAAMANQTQMGRLAKSYIDKGBLVPD 
EVTNG I VKERLAEDDIAEKGFLLDGYPRTI EQAHALDATLEELGLRLDGVI NI KVDPTCL 
I ERLSGRI INRKTGETFHKVFNP PVD YKEED YYQREDDKPETVKRRLDVNIAQ 



MSA Alignment Results s Pretty output 

PRETTY of : /biotrap/msa32357.2{*} April 17, 2002 09:17 



msa252352.2{ll4_18RS21 
msa2 52 3 52 . 2 { 1 14_M7 8 1 
msa252352.2{H4 CJB110 
msa252352.2{X14_090 
msa252352 . 2 {114_JM9130013 
rasa252352.2{ll4_A909 
tnsa252352.2{ll4_1169NT 
msa252352 . 2 ( 114_2603 
msa252352 . 2 J 114_COHl 
cnsa2S2352 . 2 ( 114_M732 
msa2 52352 . 2 { 114_H36B 
Consensus 



1 50 
-nllttgspg agkgtqaaki veefgvahis tGDMFRAAMA NQTeMGRLAK 
-allitglpg agkgtqaaki veefgvahis tGDMFRAAMA NOTqMGRLAK 
-nllttgllg agkgtqaaki veefgvahis tGDMFRAAMA NQTeMGRLAK 
-nllimglpg agkgtqaaki veefgvahis tGDMFRAAMA NQTeMGRLAK 
-nlliraglpg agkgtqaaki veefgvahis tGDMFRAAMA NQTeMGRLAK 
-nllimglpg agkgtqaaki veefgvahis tGDMFRAAMA NQTeMGRLAK 

gkgtqaaki veefgvahis tGDMFRAAMA NQTeMGRLAK 

mnllimglpg agkgtqaaki veefgvahis tGDMFRAAMA NQTeMGRLAK 
— lliraglpg agkgtqaaki veefgvahis tGDMFRAAMA NOTqMGRLAK 
--llimglpg agkgtqaaki veefgvahis tGDMFRAAMA NOTqMGRLAK 

tGDMFRAAMA NQTeMGRLAK 

* - .****««•** ***.****** 



rasa252352.2{ll4_18RS21 
rasa252352.2{ll4_M781 
msa252352.2{ll4_CJB110 



51 100 
SYIDKGELVP DeVTNGIVKB RLAEDDIAEK GFLLDGYPRT IEQAHALDAT 
SYIDKGELVP DeVTNGIVKE RLAEDDIAEK GFLLDGYPRT IEQAHALDAT 
SYIDKGELVP DeVTNGIVKE RLAEDDIAEK GFLLDGYPRT IEQAHALDAT 
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msa2S2352 
msa252352.2{ll4 
msa252352 
msa252352.2{ 
msa252352 . 
msa252352. 
msa252352. 
msa252352 . 



.2{114_090| 
JM9130013 
2{114 A9.09 
114 1169NT 



114_2603 
114_COHl 
114_M732 
114_H36B 
Consensus 



SYIDKGELVP 
SYIDKGELVP 
SYIDKGELVP 
SYIDKGELVP 
SYIDKGELVP 
SYIDKGELVP 
SYIDKGELVP 
SYIDKGELVP 



msa252352.2{ 
msa252352 

msa252352.2{ 
msa252352 
msa252352.2{H4 
msa2S2352. 

msa252352.2{ 
msa252352 
msa252352 . 
msa252352. 
msa252352 



114_18RS2l' 
2{114_M781 
114_CJB110 
.2{ll4_090 
_JM9130013 
2{114_A909 
114_1169NT 
2{ll4_2603 
2(114 COH1 
2{114JM732 
2{114_H36B 
Consensus 



msa252352.2{ll4_18RS21 
mea252352 ,2{114_M781 
msa252352 . 2 { 114_C*JB110 
maa2523 52 . 2 { 114_090 
msa252352 . 2 { 114_JM9130013 
msa252352 .2{114_A909 
msa252352 .2{ll4_1169NT 
msa252352 .2 (114_2603 
msa252352 . 2 { 114_COHl 
msa252352.2{ll4_M732 
msa252352 .2{114_H36B 
Consensus 



DeVTNGIVKE 
DeVTNG I VKE 
DeVTNGIVKE 
DcfVTNGIVKE 
DeVTNGIVKE 
DeVTNGIVKE 
DeVTNGIVKE 
DeVTNGIVKE 



RLAEDDIAEK 
RLAEDDIAEK 
RLAEDDIAEK 
RLAEDDIAEK 
RLAEDDIAEK 
RLAEDDIAEK 
RLAEDDIAEK 
RLAEDDIAEK 



GFLLDGYPRT 
GPLLDGYPRT 
GFLLDGYPRT 
GFLLDGYPRT 
GFLLDGYPRT 
GFLLDGYPRT 
GFLLDGYPRT 
GFLLDGYPRT 



IEQAHALDAT 
IEQAHALDAT 
IEQAHALDAT 
IEQAHALDAT 
IEQAHALDAT 
IEQAHALDAT 
IEQAHALDAT 
IEQAHALDAT 



101 

LEELGLRLDG 
LEELGLRLDG 
LEELGLRLDG 
LEELGLRLDG 
LEELGLRLDG 
LEELGLRLDG 
LEELGLRLDG 
LEELGLRLDG 
LEELGLRLDG 
LEELGLRLDG 
LEELGLRLDG 



VINIKVDPSC 
VINIKVDPtC 
VINIKVDPSC 
VINIKVDPsC 
VINIKVDPSC 
VINIKVDPBC 
VINIKVDPSC 
VINIKVDPSC 
VINIKVDPtC 
VINIKVDPtC 
VINIKVDPSC 



LIERLSgRII 
LIERLSgRII 
LIERLSgRII 
LIBRLSgRII 
LIERLSgRII 
LIBRDSgRII 
LIERLSgRII 
LIERLSxRII 
LIERLSgRII 
LIERLSgRII 
LIBRLSgRII 



NRKTGETFHK 
NRKTGETFHK 
NRKTGETFHK 
NRKTGETFHK 
NRKTGETFHK 
NRKTGETFHK 
NRKTGETFHK 
NRKTGETFHK 
NRKTGETFHK 
NRKTGETFHK 
NRKTGETFHK 



ISO 

VFNPPVDYKE 
VFNPPVDYKE 
VFNPPVDYKE 
VFNPPVDYKE 
VFNPPVDYKE 
VFNPPVDYKE 
VFNPPVDYKE 
VFNPPVDYKE 
VFNPPVDYKE 
VFNPPVDYKE 
VFNPPVDYKE 



151 

EDYYQRBDDK 
EDYYQREDDK 
EDYYQREDDK 
EDYYQREDDK 
EDYYQREDDK 
EDYYQREDDK 
. EDYYQREDDK 
EDYYQREDDK 
EDYYQRBDDK 
EDYYQREDDK 
EDYYQREDDK 



PETVKRRLDV 
PETVKRRLDV 
PETVKRRLDV 
PETVKRRLDV 
PBTVKRRLDV 
PETVKRRLDV 
PETVKRRLDV 
PETVKRRLDV 
PETVKRRLDV 
PBTVKRRLDV 
PBTVKRRLDV 



nIAQgepile 

nIAQ 

nIAQgepile 
nIAQgepile 
nIAQgepile 
nIAQgesile 
nIAQgepile 
nIAQgepile 
nIAQgepile 
nIAQgepile 
nIAQgesile 



hyrklglvtd 



200 

iegnqeitev 



hy 

hyrklglvtd 
hykklglvtd 
hyrklglvtd 
hysklglvtd 
hyrklglvtd 
hyrklglvtd 
hyrklglvtd 
hyrklglvtd 



iegnqeitev 

iegn 

ieg 

iegnqei 

iegnqeitev 
iegnqeitev 
iegnqeitev 
iegnqeitev 



msa252352.2{ll4_18RS21 
msa252352.2{H4_M781 
msa252352.2{H4_CJB110 | 
msa252352 . 2 { 114_090 
msa252352 . 2 { 1 14_JM9 1 3 0 013 
msa252352 . 2 {114_A909 
msa252352 . 2 { 114_1169NT 
msa252352.2(ll4_2603 
msa2 523 52 . 2 { 1 14_COHl 
msa252352 .2(114 J4732 
rasa252352.2(114~H36B 
Consensus 



201 212 
fadvekalle — 



fadvekalle LK 



fadvekalle LK 
£advekall~ — 
fadvekalle LK 
f advekal — — 
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SEQ ZD NO. 4401 
STRAIN 2603 

GTGGATAAACATCACTCAAAAAAGGCnTVTTTTAAAGTTAACA 

CTT AT AACAACT AGT ATTTT ATTAATG CATAG CAATCAAGTGAATGCAGAGGAG CAAGAA 

TTAAAAAACCAAGAGCAATCACCTGTAATTGCTAATGTTGCT 

GTAACTACTAATACTGTTGAAAAAACATCTGTAACAGCTGCT^ 

AAAGAAATGGGTGATACATCTGTAAAAAATGACAAAACAGAAGATGAATO 

ITATCTAAAAACCTTGATACGTCTAATTTGGGGGCTGATC^ 

aaaccagagacaacc^caataaagaaagcaatg™ 

gcacagaaagttcc ct cag catatg aagaggtgaag c cag aaag caagt cat cg cttg ct 
gttctitgatacatctaaaataacaaaattacaagccataaccc^ 

GTAGTAGCTATTATTGATACTGGCTTTGATAT^ 

CCAAAAGATGATAAGCACAGCTTTAAAACTAAGACAGAATTTGAGGAATTAAAA^ 
CATAATATCACTTATGGGAAATGGGTTAACGATAAGATTC 
AACAATACAGAAACGGTGGCTGATATTGGAGCAGCTATGAAAGATGGT^ 
GCAAAGAATATTTCGCATGGTACACACX3TTGCTGGTATT^ 

CCAG CAATCAATGGTC1TGT1T1 AGAAGGTGCAG CG CCAAATGCTCAAGTCTTATTAATG 

CGTATTCCAGATAAAATTGATTCGGACAAATTTGGTGAAGC^ 

GACGCTGTTAATCTAGGAGCAAAAACXSATTAATATGA^ 

TTAATTGCrCTCAATGATAAAGTTAAATTAGCACTTAAATTAGCTTC^^ 

G CAGTTGTTG TGG CTGC CG GAAATGAAGG C G CATTTGGT ATGGATT AT AG CAAACCATTA 

TCAACTAATCCTGACTACGGTACGGTTAATAGTCCAGCrATTT^ 

GTTG CTAGCTATGAATCACTTAAAACTATCAGTGAGGTCGTTG^ 

AAGTTAGTTAAGTTGCXXSATTGTGACTTC^ 

GTGGTTTATGCCAATTATGGTGCAAAAAAAGACITTGAAGGTAAG 

ATTGCATTAATTGAG CGTGGTGGTGGACTTGAl'l'l'iATGACTAAAATCACTCATG CTACA 
AATG CAGGTGTTGTTGGTATCGTTATTTrTAACXIATCAAGAAAAA 
ATTCCTTACCGTGAATtACCTGTGGGGATTATTAGTAAAGTAGATGGCGAGCCT 
AATACTTCAAGTCAGTTAACATTTAACCAGAGTTT^ 

AATCGTATGCTGGAACAATCAAGTTGGGGCGTGACAGCTGAAGGAGCAAT^ 
GTAACAGCTTCTGGCTTTGAAATTTATTCTTC7VACCTAT 
TCTGGTACAAGTATGGCTTCACCACATGTTGC^GGATTAATGA 
TTGGCTGAGAAATATAAAGGGATGAATTTAOATTCT 

AACATCCTCATGAG CTCAG CAACAGCATTATATAGTGAAGAGGATAAGGCGTTTTATTCA 

CCACGTCAGCAAGGTGCAGGTGTAGTTGATGCTX3AAAAAGCT 

ATTACTGGAAACGATGGCAAAGCTAAAATTAATCTCAAACIGAAT^ 

ATC^CAGTTACAATTCATAAACTTGTAGAAGGTGTCAAAGA^ 

GTAGCAACAGAACMGTAAATAAAGGTAAATTTGCCC^ 

ACTAATTGG CAG AAAGT AATTCTTCGTGAT AAAGAAACACAAGTT CGATTTACTATTGAT 
GCTAGTCAATTTAaTCAGAAATTAAAAGAACAGATGGCAAA^ 
TTTGTACX7XTTTAAAGAAGCC3VAGGATAGTAATC^ 
GGATTTAATGGTGATTTTGCGAACTTACAAGCACTTC 

TCTAAAGGTAGTTTCTACTATAAACCAAATGATACAACTCATAAAGACCAATTGGAGTAC 
AATGA&TCAGCTCCTTTTGAAAGCAACAAC^ 
TGGGGCTATGTTGATTATGTCAAAAATGGTGGGGAGTTAGAA 
AAAAGAATTATTTTAGGAACITTTGAGAATAAGGTT^ 

GAAAGAGATGCAGCGAATAATCCATATTITGCCATTTCTCCAAATAAAGATGG^ 

GACGAAATCACTCXXZCAGGCAACTTTXTITAAGA 

CTAGATCAAAATGGAAATGTTATTTGGCAAAGTAAGGTTTTAC 

T TCGftT AATAATCXZAAAGCAAAGTGATGGTCATTATCGT^ 

GGTTTAGATAAGGATGGCAAAGTTGTAGCAGATGGTTTTTA 

ACACCAGTAGCAGAAGGAGCAAATAGTCA6GAGTCAGA 

AAGTCACCAAATCTTCCTTCACGAGCTCAGTTTGATGAAACTAA 

GCCATGCXrrAAGGAAAGTAGTTATGTTCCrrACATATCGTTTACAATTAGl"^ 

GTTGTAAAAGATGAAGAATATGGGGATGAGACTTCTTACCATTATC 

GAAGGTAAAGTGACACTTCCTAAAACGGTTAAGATAGGAGAGAGTGAG 

CCTAAGGCCTTGACACTTGTTGTGGAAGATAAAGCTGGTAA 

TCTGATCTCTTGAATAAGGCAGTAGTATCAGA 

AGTTTCAAATATTTTGATAACTTGAAAAAAGAACCT^ 

GTAGTAAACAAGAATCTAGAAGAAATAATATTAGTTAAGCCG CAAACTACAGTTACTACT 

CAATC&TTGTCTAAAGAAATAACTAAATCAGGAAATGAGA 

AATAATAGTAGCAGAGTAGCTAAGATCATATCACCTAAACATAAC^ 

CftTACCTTAC CTAGTACATCA^TAGA GCAACG 

TTGTTATCTAGTTTACTTCTTTATTTGAAACCCA 

SEQ ZD NO. 4402 
STRAIN 090 

GAGGAGCAAGAATTAAAAAACCAAGAGCAATCACCTGTAATTC 

AATGTTGCTCAACAGCCATCGCCATCGGTAACTACTAATATTGTTGA^ 

AACATCTGTAACAGCTGCTTCTGCTAGTAATACAGTGAAAGAA^ 

ATACATCTGTAAAAAATGACAAAACAGAAGATGAATTATTAGAAGAGTTA 

TCTAAAAACGTTGATACGTCTAATTTGGGGGCTGATCTTGAAGA^ 

TCCCTCTAAACCAGAGACAACCAACAATAAAGAAAGCAATGTAGTAACAA 

ATGCTTCAACTGCAATAGCACAGAAAGTTGCCTCAGCGTATG^ 

AAGCCAGAAAGC^GTCATCGCTTG CrGTTTTTGATACATCTAAAATAAC 

AAAATTGCAAGCCATAACX:CAAAGAGGAAAGGGAAATGTAGTAGCTATTA 

TTGATACTGGCTITGATATTAACCATGATAlU'lTItXnTTAGATAGCCCA 

AAAGATGATAAGCACAGCTTTAAAACTAAAGCAGAATT^ 

AGCAAAACATAATAT^CACTTATGGGAAATGGGTTAAa 

TTGCACATAACTACGCCAACAATACAGAAACGGTGGCTGATATTGCA^ 

ACACGTTGCTGGTATTTTTGTAGGTAATAGTA^ 
GTCTTCTTTTAGAAGGTGCAGCG CCAAATGCTCAAGTCT^ 
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ATTCCAGATAAAATTGATTCGGAC^ 

AATCACAGACGCTG t TAATCTAGG AG CAAAAaOGATTAATATGAGCCTTG 
GAAAAACAG CAGATTCTTTAAt tGCaCTCAATGATAAAGTTAAATTAGCA 
CTTAAATTAGCTTCTGAGAAGGGCX5TTG CAGTTGTTGTGGCTGCCGGAAA 
TGAAGGTGCATTTGGTATGGATTATAG CAAACCATTATCAACTAATcCTG 
ACTAGXJTACGGTTAATAGTCCAGCTATTTCTGAA^^CT t TGAGTGTT 
GCTAGCTATGAATCACTTAAAACTATCAGTGAGGTC^ 
TG aaGGTAAGTTAGTTAAGTTG CCGATTGTGACTTCTAAACCTTT tGACA 
AAGGTAAGGCCTACGATGTGGTTTATG CCAATTATGGTGCAaAAAAAGAC 
TTTGAAGGT AAgG&CTTTAAAGGTAAG ATTG CATTAAT t GAGCGTGG t GG 
TGGACTTGATTTTATGACTAAaa t CACTcATGCTACAAATG CAgGTGTTG 
tTGGTaTCGTtATTt t tAACgAtCAAGAaaAACG tGGAAATTTrcTAATT 
CCTT ACCGTG AATTACCTGTGG GG GTTATTAGTAAAGTAGATGG CGAGCG 
TATAAAAAATACTTCAAGTCAGTTAACATTTAACCAGA^ i I'iugAAGTAG 
TTGATAGCCAAGGTGGCAATCGTATGCTGGAAC^ 
ACMCTGAAGGAGCAATCAAGCCTGATGTAACAGCTrCTGGCrrTG^ 
TTATTCITCAACCTATAATAATCAATACCAAACAATGTCTGGTACAAGTA 
TGGCTTCACCAGATGTTGCAGGATTAATGACAATGCTTCAAAGTC 
GCTGAGAAAT AT AAAGGGATGAATTTAgATTCTAAAAAATTG CTAGAATT 
GTCTAaAAACATCCTCATGAGCTC^GCaaCAGCATTATATAGTgAAGAgG 
ATAAGGCGT t T t ATTCa CCACGTCAGCAAGG t GCAGG t GTAGTTGATGCT 
GAAAAAGCTATCCAAGCT<^TATTATGTTACTGGAAACGATGGCAAAGC 
TAAAATTAATCTCAAACGAGTGGGAGATAAATTTGATATCACAGTTACAA 
TTCAT AAACTTGTAG AAGGTGT CAAAG AATTGTAT TATCAAG CTAATGTA 

GCT AGAT ACT AATTGG CAG AaAGT AATTCTT c GTG ATAAAGAAACACAAG 

ITcGATTTACTATTGATGCTAGTCAATTTAGT 

ATGGCAAATGGTTATTTCITAgAAGGTTTTGTACXSTTT^ 

GGATAG tAATCAGGAGTTAaTGAGTATTCCTT tTGTAGGAT t tAATGGTG 

ATTTTGCGAACTTACAAGCACTTGAAACACCGAT^ 

AAAGGTAGTTTCTACTATAAACCAAATGATACAACTCATAAAGACCAATT 

GGAGTACAATGAATCAGCTCCirTTGAAAGCAACAACTATACTGCCT^ 

TAACACAATCAGCGTCTTGGG<3C7ATGTTGATTATGT^ 

GAGTTAG AATTAG CACCGGA gAGTc CAAAAAGAATTATTTTAgG AACTTT 

TGAGAATAAGGTTGAGGATAAAACAATTCATCTTTTGGAAAGAGATC 

C^AATAATCCATATTTT^CCATTTCTCC 

GAAATCACTCCCCAGGCAACTTTCTTAAG 

TCAAGTTCTAGATCAAAATGGAAATGTTATTTGGCAAAGTAA© 

CATCTTATCGTAAAAATTTCCATAATA 

TATCGTATGGATQCCTTTCAGTGGAGTGGTTTAGATAAG^ 

TGTAGCAGATGGTTTTTATACITATCGCCTACGTTACACACCAGTAG CAG 

AAGGAGCAAATAGTCAGGAGTCAGACTTTAAAGTTCAAGTAAGTACTAAG 

TCACCAAATCTTCCTTTACTAGCrCAGTTTGA 

AAG CTT AGC CATG C CT AAG G AAAGT AGTT ATGTT C CT ACAT AT CG TTT AC 

AATTAGTTTTATCTCATGTTGTAAAAGATGAAGAATATGG 

TCTTACCATTATTTCXATATAGATCAAGAAGGTA^ 

AACGGTT AAGATAGG AGAGAGTGAGGTTG CAGTAGACCCTAAGG CCTTGA 

CACTrGTTGTGGAAGATAAAGCTGGTAATTTTGCAA^ 

GACCTCTTGAATAAGGCAGTAGTATCAGAGAAAGAAAACGCTATAGTAAT 

TTCTAACAGTTTCAAAT ATTTTGATAA CTTGAAAAAAGAATCTATGTTT A 

TTTCTAAAGAAGGAAAAGTAGTAAACAAGAATCTAGAAGAAATAACATTA 

GTTAAGCCG CAAACT ACAGTTACT ACT CAATCATTGT CT AAAG AAAT AA C 

TAAATCAGGAAATGAGAAAGTCCTCACTTCTACAAAC 

GAGTAGCTAAGATCATATCACCTAAACTVTAACGGGGATTCrrGT^ 

ACC 

SEQ ZD HO. 4403 
STRAIN A909 

GAGGAGCAAGAATTAAAAAACCAAGAG CAAT 

CACCTGTAATTGCTAATGTTGCTCAACAG CCATCGCCATCGGTAACTACT 

AATACTGTTGAAAAAACATCTGTAACATCTGCTTCTGCrrAGTA 

GATVAGAAATGGGTGATACATCrTCTAAAAAATGACAAAACAGA 

TATTAGAAGAGTTATCTAAAAACCTTGATACGTCTAATTTGGGGGCT 

CHTGAAGAAGAATATCCCTCTAAACGAhGAGACAACCAACAATAAAGAAAG 

CAATGTAGTAACAAATGCTTCAACTGCAATAG CACAGAAAGTTCCCTCAG 

ACATCTAAAATAAGAAAATTGCAAG CCATAACCCAAAGAG GAAAGGGAAA 

TGTAGTAGCTATTATTGATACTCGCITTGATATTAAC^ 

GTTTAGATAGtxXAAAAGATgaTAAGCACAGCITTAaAACT 

TTTGAOGAATTAAAAGCAAAACATAATATCACTTAT^^ 

CGATAAGATTGtTTTTGCACATAACTACGCCAaCAATACAGA 

CTGATATTGCAGCAGCTATGAAAGATGGTTATGGGTCAGAAGCAA 

ATTTCGCATGGTACACACGTTG CTCGTATTTTTGTAGOTAATAGT AAACG 

TCCAGCAATCAATGGTCTTCTTTTAGAAGGTGCAGC^ 

TCTTATTAATCCGTATTCCAGATAAAATTGATTCGGACA 

GCATATGCTAAAGCAATCACAGACGCTGTTAATCTAGGAGCAA^ 

TAATATGAGCCTTGGAAAAACAGCAGATTCTTTAATT G 

AAGTT AAATT AG CACTTAAATT AG CTT CTGAGAAG GG CGTTG CAGTTGTT 

GTGGCTGCCGGAAATQAAGGTGCATTTGGTATGGATTATAGC^ 

ATCAACTAATCCTGACTACGGTACGGTTAATAGTCCAGCTAT^ 

ATACTTTGAGTGTTG CT AGCTATGAATCACTTAAAACTATCAGTGAGGTC 

GTTGAAACAACTATTCAAOOTAAGTTAGTTAAG^ 

TAAACCTTt TGACAAAGGTAAGGCCTACtlATGTGGTTTATGCCAATTATG 
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GTGCAAAAAAAAGACTTTGAAGGTAAGGACTTTAAAGGTA 
AATTGAG CGTGGTGGTGGACTTGATTTTATGACT AAAATCACTCATO 
CAAATGCaGGTGTTGTTGGTATOCOTATTTTTAACGAT^ 
GGAAATTTTCTAATTCCTTACCGTGAATTACCTGTG G 
ACTAGATGGCGAGCGTATAAAAAATACTTCAAGrCAfflTAACATTTAACC 
AGAGTTTTGAAGTAGTTGATAGCCAAGGTGGCAATCCT 
TCAM3TTGGGGCGTGACAGCTGAAGGAGCAATCAAGCCTGATCT 
TTCrGGCTTTGAAATTTATTCTTCAACCTATAATAATCAATACCAAACAA 
TGTCTGGTACAAGTATGGCTTCACCACATG tTGCAGGATTAATGACAATG 
CTTCAAAGTCATTTGGCTGAGaAATATAAAGGGATGAATT^ 
AAAATTGCTAGaATTGTCTAAAAACATcCTCATGAGCT^ 
v TATATAGTGAAGAGGATAAGGCGTTTTATTt^^ 

GGTGTAGTTGATGCTGAAAAAGCTATCCAAGCTCAATATTA 

AAACGATGGCAAAGCTAAAATTAATCTCAAACGAGTGGG^ 

ATAXCACAGTTAQJVTTCATAAACITGTAGA^ 

TATCAAGCTAATGTAGCAACAGAACAAGTAAATAAAGGTAAATTTGCCCT 

TaAACCaCAAGCCTTGCTAGATACTAATTGGCAGAAAGTAATTC 

ATAAAGAAACACAAGTTCGATTTACTA tTGATTCTAGTCA ATTTA GTCAG 

AAAITAAAAGAACAGATGG CAAATGGTTATTTCTTAGAAGurrr iGTACG 

TTTTAAAGAAGCCAAGGATAGTAATCAGGAGTTAATGAGTATTCC1TTTG 

TAGGATTTAATGGTGATTTTGCGftACTTACAAGCACT 

TATAAGACGCTTTCTAAAGGTAGTTTCTACTATAAACCAAATGATACAAC 

TCATAAAGACCAATTGGAGTACAATGAATCAGCTCCTITTGAA^ 

ACTATACTGCCTTGTTAACACAATCAGCGTC^^ 

GTCAAAAATGGTGGGGAGTTAGAATTAGCACCGGAGAGTCCAAAAAGAAT 

TATTTTAGGAACTTTTGAGAATAAGGTTGAGGATAAAACAA 

TGGAAAGAGATGCAG CGAATAATCCATATTTTGCCATTTCrc 

GATGGAAATAGGGATGAAATCACTCCCCAGGCAAL"rrrCrrAA 

TAAGGATATTTCTGCTCAAGTTCTAGATCAAAATGGAAATGTT 

AAAGTAAGGTTITACCATCTTATCGTAAAAATTTCCATAATAATCCAAAG 

CAAAGTGATGGTCATTATCGTATGGATGCCCTTCAGTGGAG 

TAAGGATGG CAAAGTTGTAG CAGATGfflTTTTATACTTATCGTTTACGTT 

ACACACX^GTAGCAGAAGGAGCAAATAGTC^GGAGTCAGAui-iiAAAGTT 

CAAGTAAGTACTAAGTCACCAAATCTTCCTTCAOSAGCTCAG 

AACTAATOGAACATTAAGCTTAGCCATGCCTAAG 

CTACATATCX3TCTACAATTAGTTTTATCTCATGTTOT 

TATGGAGATGAGACTTCTTACCATTATTTCCATATAGATCGAGAAGGTAA 

AGTGACACTTCXTAAAACAGTTAAGATAGGAGAGAGTGAGGTTGCAGTAG 

ACCCTAAGACCTTGACACTTGTTGTGGAAGATAA 

ACGGTAAAATTGTCTGACCTCTTGAATAAGGCAGTACT 

AAACX5CTATAGTAATTTCTAACAATTTCAAATATTTTGATAACT 

AAGAACCTATGTTTATTTCTAAAGAAGGAAAAGTAGTAAACAAGAATCT 

GAAGAAATAGCATTAGTTAAGCCGCAAACTACS^TT^ 

GTCTAAAGAAATAACTCAATCAGGAAATGAGAAAGTCCTC^ 

ACAATAATAGTAGCAGAGTAGCTAAGATCATATCACCTAAACATAACGGG 

GATTCTGTTAACCATACC 

SBQ ZD NO. 4404 
STRAIN H36B 

GAGGAGCAAGAATTAAAAAACCAAGAGCAATCACCTGTAATTGC 

TAATGTTGCTCAACAGCCATCG CCATCX^TAACTACTAATACTGTTGAAA 

AAACATCrGTAACATCTGCTTCTGCTAGTAATACAGCGAAAGAAA^ 

GATACATCn?TAAAAAATGACAAAAGAGAAGATGAATTATTAGAAGAGTT 

ATCTAAAAACCTTGATACGTCTAATTTGGGGGCrGATCTTGAA 

ATCKXnCTAAACCAGAGACAACCAACAATAAAGAAAG CAATGTAGTAACA 

AATG CTTCAACTGCAATAGCACAGAAaGTTCCCTCAGCATATGAAGAGGT 

GAAGCCAGAAAGCAAGTCATCACrrTGCTGTTCTTG^ 

CAAAATTGCAAGCCATAACCCAAAGAGGAAAGGGAAATCT 

ATTGATACTGGCTTTGATATTAACCATGATATTTTTCGTT^ 

AAAAGATGATAAG CACAGCTTTAAAACTAAGGCAGAATTTGAGGAAT TAA 

AAGCAAAACATAATATCACTTATGGGAAATGGGTT^ 

TTTGCACATAACTACGCCAaCAATACAGAAACGGTGGCT 

AGCTATGAAAGATGGTTATGGGTCAGAAGCAAAGAATATTTCGC^ 

CACACGTTGCTGGTATTTTTGTAGGTAATAGfrAAACGTC 

GGTCTTCTTTTAGAAGGTG CAG CGCCAAATGCTCAAGTCTTATTAATGCG 

TATTCCAGATAAAATTGATTCGGACAAATTTGGTGAAGCATATG CTAAAG 

CAATCACAGACGCTGTTAATCTAGGAGCAAAAACGATTAATATGA^ 

GGAAAAACAGCAGATTCTTTAATTGCTCTCAATGATA 

ACTTAAATTAGCTTCTGAGAAGGGCGTTGCAGT^ 

ATGAAGGTGCATTTGGTATGGATTATAG CAAACCATT ATCAACTAATCCT 
GACTAC^GTACGGTTAATAGTCCAGCTATTTCTGAAGATACTTTGAGTGT 
TGCTAGCTATGAATCACTTAAAACTATCAGTGAGGTCXyiTG^ 
TTGAAGGTAAGTTAGTTAAGTTGCOGATTGT 

AAAGGTAAGGCCTACXyVTGTGGTTTATGCCAATTATGGTG CAAAAAAAGA 
CTTTGAAGGTAAGGACTTTAAAGGTAAGATTGCATTAATT^ 

GTGGACnX^TTTTATGACTAAAATCACTCATGC^ 

GTTGGTATCGTTATTTTTAACGATCAAGAAAAACGTGGA 

TCCTTACOGTGAATTACCTGTGGGGGTTATTACTAAAOT 

GTATAAAAAATACTTCAAGTCAGTTAACATTTAACCAGAGTTTTGAAOT 

GTTGATAGCCAAGGTGGCAATCGTATGCTGGAACAATCAAGTT 

GACAGCTGAAGGAGCAATCAAG CCTGATGTAACAG CTTCTGG CTTTGAAA 

TTTATTCTTCAACCTATAATAATCAATACCAA 

ATGGCTTCACCACATQTTG CAGGATTAATGACAATGCTTCAAAGTCATTT 
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GGCTGAGAAATATAAAGGQATaAATTTAGATTCTAAAAAATTGCT 

TGTCTAAAAACATCCTC^TGAGCTCAGCAACAG 

GATAAGGCGTTTTATTCACCACGTCAGCAAGGTG^ 

TGAAAAAGCTATCOVAGCTCAATATTATGTTACrGGAAACGA 

CTAAAATTAATCTCAAACGAGTGGGAGATAAATTT^ 

ATTCATAAA,CrTGTAGAAGGTGTCAAAGAATTCTATTA 

AGCAACAGAACAAGTAAATAAAGGTAAATTTGCC^TTAAACCaCAAGCCT 

TGCTAGATACTAATTGGCAGAAAGTAATTCTrCGTGA 

GTTCGATTTACrrATTGATrCTAGTCAATTTAGTCAGAAATTAA 

GATGGCAAATGGTTArrrClUAGAAGGTTTTG tACGTTTTAAAGAAGCCA 

AGGATAGTAATCAGGAGlTAATGAGTATI^CnTTTGTAGGATTTAATGGT 

GATTTTG CGAACT t ACAAGCACTTGAAACACO^TTTATAAGACGCTTTC 

TAAAGGTAGTTIXTrACTATAAACCAAATC^TACAACTCATAAAGA 

TGGAGTACAATGAATCAGCTCCTTTTGAAA 

TTAACACAATCAGCGTCTTGGGGCTATGTTGATTATGTCAAAA^ 

GGAGTTAgAATTAgCACCGGAGAGTCCAAAAA GAATTAT TTT 

TTGAGAATAAGGTTGAGGATAAAACAATTC^TCTTTTGGAAA 

GCGAATAATCCATATTTTGCCATTTCTCCAAATAAAGATGGAAATAGGGA 

TOAAATOVCTCCCC^GGCAACTTTCTTAAGAAATGTTAA^ 

CTCAAGTTCTAGATCAARATGGAAATGTTATTTGGCAAAGTAA 

CXZATCTTATCGTAAAAATTTCCATAATAATCCA 

TTATCGTATGGATGCCCITCRGTGGAGTGGTITC AGAT AAGGATGG 

TTGTAGCAGATGGTTTTTATACTTATCGTTTAOGTTACA^ 

GAAGGAGCAAATAGTCAGGAGTClAGACTTrAAAGTTCAAGTAAGT 

GTCACCAAATCTTCCTTCACGAGCTCAGTTTGATGAA^ 

TAAGCTTAGCCATGCCTAAGGAAAGTAGTTATGTTCCTACATATCGTCTA 

CAATTAGTTTTATCTCATGTTGTAAAAGATGAAGA^ 

TTCTTACCATTATTTCXIATATAGATCA 

AAAGAGTTAAGATAGGAGAGAGTGAGGTTGC^ 

ACACTTGTTGTGGAAGATAAAGCTGGTAATTTCX3CAACGOT 

TGACCTCTTGAAT AAGG CAGTAGTATCAGAGAAAGAAAACGCTATAGTAA 

TTTCTAACAATTTCAAATATT7TTGATAACTTGAA 

ATTTCTAAAGAAGGAAAAGTAGTAAACAAGAATCTAGAAGAAATAGCATT 

AG^AAGCCGCAAACTACAGTTACTACTCAATC^TTGTCT 

CTCAATCAGGAAATGAGAAAGTCCTCACTTCT^ 

AGAGTAGCTAAGATCATATCACCTAAACATAACGGGGA 

TACC 

SEQ ID NO. 4405 
STRAIN 18RS21 

GAGGAGCAAGAATrAAAAAACCAAGAGCAATCACC 

TGTAATTGCTAATGTTCCTCAACAGCCATCXKrATCGGTAACrACTAATA 
CTGTTGAAAAAACATCTGTAACa\GCTX3CTTCrGCT 

GAAATGGGTGATACATCTGTAAAAAATGACAAAACAGAAGATGAATTATT 

AGAAGAGTTATCTAAAAACCTTGAT ACX3TCTAATTTGGGGG CTGATCTTG 

AAGAAGAATATCCCTCTAAACX^AGAGAC^CCAACMTAAAGAAAGCAAT 

GTAGTAACAAATGCTTCAACTGCAATAGCACAGAAA^ 

TGAAGAGGTGAAGCCAGAAAGCAAGTCATCGCTTGCTGTT^ 

CTAAAATAACAAAATTACAAGCCATAACCCAAAGAGGAAA 

GTAGCTATTATTGATACTGGCTTTGATATTAACCATC 

AGATAGCCCAAAAGATGATAAG CACAGCTTTAAAACTAAGACAGAATITG 

AGGAATTAAAAGCAAAACATAATATCACTTATGGGAAATGGGTTAACGAT 

AAGATTGTTTTTGCACATAACTACG CX^^CAATACAGAAACGGTGGCTGA 

TATTGCAGCAGCTATGAAAGATGGTTATGGTTCAGAAG CAAAGAATATTT 

CGCATGGTACACACGTTGCTGGTATTTTTGTAGGTAATAGTAAAOT 

GCAATCAATGGTCTTCTTTTAGAAGGTG 

ATTAATGCGTATTCXAGATAAAATTGATTCGGAC^ 

ATGCTAAAGCAATCACAGACGCTGTTAATCTAGGAGCAAAAACGA 

ATGAGTATTCGAAAAACAGCTGATTCTTTAATTGCT 

TAAATTAGCACTTAAATTAGCTTCTGAGAAGGGCGTrcCA^ 

CTGCCGGAAATGAAGGCGCATTTGGTATGGATTATAGCAAACCAT^ 

ACTAATCC^X1ACTACGGTACX^3TTAATAGTCCAGCTA 

TTTGAGTGTTGCTAGCTATGAATCACTTAAAACT 

AAACAACTATTGAAGGTAAGTTAGTTAAGTTGCXXIATTGTG^ 

CCTTTTGACAAAGGTAAGGCCTACGATGTGGTTTATGra 

AAAAAAAGACTTTGAAGGTAAGGACTTTAAAGGTAAGATTGCA^ 

AGCGTGGTGGTGGACTIX5ATTTTATGACTAAAATCACTCATC 

GCAGGTGTKnTGGTATCXnTATTTTTAACGATCAAGA 

TTTlCTAATTCCTTACXXJrGAATTACCTGTGGGGATTAT^ 

ATGGCGAGCGTATAAAAAATACTTCAAGTCAGTTAACATT tAACCAgAGT 

TTTOAAGtAGTTGATAGCCAAGGTGGtAATCGTa^ 

TTGGGGCGTGACAGCTGAAGGAGCAATC^VAGCCTGATOT 

GCTTTGAAATTTATTCTTCAACCTAT^ 

ggtacaagtatggcttcaccacatgttgcaggattaatgacaato 

aagtcatttggctgagaaatataaagggatgaatttagattctaaa 

tgctagaattgtctaaaaacatcctcatgagctca^ 

agtgaagaggataaggcgttttattcacx^cgtcagcaagg^ 

aqttgatgctgaaaaagctatccaagctcaatattatattac^ 

atggcaaagctaaaattaatctcaaacgaatgggagataaatttgata^ 

acagttacaattcat aaacttgtagaaggtgtcaaagaattgtattatca 

agctaatgtagcaacagaacaagtaaataaaggtaaatttoccctta 

cac^gccttgctagatactaattggcagaaagtaattctt 

qaaacacaagttcgatttactattgatgctagtcaatt^ 
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AAAAGAACAGATGG CAAATGGTTATTTCTT AgAAGGTTITGTACGTTTTA 

AAGAAGCCAAGGATAGTAATCAGGAGTTAATGAGTATTCClTritiTAGGA 

TTTAATGGTGATTTTGCGAACTTACAAGCACTTG^ 

GACGATTTCTAAAGGTAGTTTCTACTATAAACCAAATGA 

AAGACCAATTGGAGTACAATGAATCAG C^C"l"l"r 1XSAAAGCAACAACT 

ACTXSCCTTGTTAACACAATCAGCXSTCTTGGGGCTAT^ 

AAATGGTGGGGAGTTAGAATTAGCaCCGGAGAGTCOWVAAGAATTATTT 

TAGGAACTITTGAGAATAAGGTTGAGGATAAAACAATTCATC^ 

AGAGATGC^GCGAATAATCCATATTTTGa^TTTCTCCAAATAAAGATGG 

AAATAGGGACGAAATCACTCCCCAGGCAACtTTCTTAAGAAATGTTAAGG 

ATATTTCTGCTCAAGTTCTAGATCAAAATGGAAAT^ 

AAGGTTTTACCATCITATCGTAAAAATTrCCATAATAATC 

TGATGGTCATTATCGTATGGATGCTCTTCAGTGOAGTGGTTTAG^ 

ATGGCAAAGTTGTAGCAGATGGTTTTTATACTTATOGC^ 

CCAGTAGCAGAAGGAGCAAATAGTCAGGAGTCAGACIUU'AAAGTACAAGT 

AAGTACTAAGTCACCAAATCTTCXrrTCACGAGCT 

ATCGAACATTAAG CTTAGCCATG CCTAAGGAAAGTAGTTATGTTCCT ACA 
TATCGTTTACAATTAGTTTTATCTCATGTTGTAAA 

GGATGAGACrrClTACCATTATTTCCATATAGATCAAGAAGGTAAAGTGA 

CACTTCCTAAAACGGTTAAGATAGGJM5AQAGTGAGGTT GC^ 

AAGGCCTTGACACTTGTTGTGGAAGATAAAGCTGGTAATTT^ 

AAAATTGTCTGATCTCTTGAATAAGGOVGTAGTATCA GAGA AAGAAAACG 

CTATAGTAATTTCTAACAGTTTCAAATATTTTGATAACTTGAAAAAAG 

CCTATGTTTATTTCTAAAAAAGAAAAAGTAGTAAACAAGAATCTAGAAGA 

AATAATATTAGTTAAGCXXSCAAACTAGAGTTACTACrCAATC^ 

AAGAAATAACTAAATCAGGAAATGAGAAAGTCCTCAC7ITCTACAAA 

AATAGTAGCAGAGTAGCTAAGATCATATCACCTAAACATAA^ 

TGTTAACCATACC 

SBQ ID KO. 4406 
STRAIN K732 

GAGGAGCAAGAATTAAAAAACCAAGAGCAATCACCT 

GTAATTGCTAATGTTGCTCAACAGCCATCGCCATCGGTA^ 

TGTTGAAAAAACATCTGTAACAGCTGCITCTGCTAGTA^ 

AAATGGG1X1ATACATCTGTAAAAAATGACAAAACAGAAGATC 

GAAGAGTTATCTAAAAACCTTGATACGTCTAATTTGGGGGCT 

AGAAGAATATCCCTCTAAACCAGAGAGAACCAACAATAAAGAAAGCAATG 

TAGTAACAAATGCTTC^UVCTGCAATAGCACAGAAAGTTCCCTCAG 

GAAGAGGltSAAGTCAGAAAGCAAGTCATCGCTTGCTGT^ 

TAAAATAACAAAATTACAAGCCACAACCXIAAAGAGGAAAGGGAAATGTAG 

TAGCTATTATTGATACTGGCTTTGATATTAA 

GATAGCCCAAAAGATGATAAGCACAGCTTTAAAACTAAGGCAGAATTTGA 
GGAATTAAAAGC7VAAACATAATATCACTTATGGGAAATGGGTTAACGATA 
AGATrGTrTTTG CACATAACTACGCCAACAATACAGAAACXXnXXSCTGAT 
ATTG CAGCAGCTATGAAAGATGGTTATGGGTGAGAAGCAAAGAATAT^ 
GCATGGTACACACGTTG CTXK7TATTTTTGTAGGTAATAGTAAACGTCCAG 
CAATCAATAGTCTTCTTTTAGAAGGTG CAGCGCCAAATGCTCAAGTCTTA 
TTAATGCGTATTCCAGATAAAATTGATTCGGACAAAT^ 
TGCTAAAGCAATCATAGACGCTGTTAA^ 
TGAGCCTGGGAAAAACXSGCTGATTCrrrTAATTGCTCT^ 
AAATTAGCACTTAAATTAGCTTCTGAGAAGGGCXnTGCA^ 
TGCCGGAAATGAAGGTGCATTTGGTATGGATTATA^ 
CTAATCCTGACTACX3GTACX5GTTAATAGTCCAG CTATTTCTGAAGATACT 
TTGAGTGTlX3CTAGCrATGAATCACTTAA^ 

AACAACTATTGAAGGTAAGTTAGTTAAGTTGCCGATTGTGACTTCT 

CrrtTGACAAAGGTAAGGCCTACGATGTGGTTTATGCO^ 

AAAAAGATTTTGAAGGTAAGGACTTTAAAGGTAAGATTGCAT^ 

CGTGGTGGTGGACTTGATTTTATGACrAAAATCACTCATGCT 

AGGTGTTGTTGGTATOGTTATTTTTAACGATCAAGAA 

TTCTAATTCCTTACCGTGAATTACCTGTGGGGGTTATTAGTAAAGTA 

GGOGAGCCTATAAAAAATACTTCAAOTCAGTTAACA 

TGAAGTAGTTGATAGCCAAGGTGGCAATCGTATGCTGG^ 

GGGGCGTGACAGCTGAAGGAGCAATCAAGCCreATGTAACA^ 

TTTGAAATl^ATTCTTCAACCTATAATAATCAATACT^ 

TACAAGTATGG CTTCAC<^CATGTTGCAGGATTAATGACAATGCTTCAAA 

GTCATTTGGCTGAGAAATATAAAGGGATGAATTTAGATTCTAA 

CTAGAATTGTCTAAAAACATCCTCATGAGCTCAGCAACAGC^TTAT^ 

TGAAGAGGATAAGGCGTTTTATTCACCACGTCAGCAAGGTGCAGGTG^ 

TTGATGCTGAAAAAGCTATCCAAGCTCAATATTATGTTACTGGAAACGAT 

GGCAAAGTTAAAATTAATCTCAAACX3AGAGGGAGATAAATTTGATATCAC 

AGTTACAATTCATaAACTTGTAGAAGGTGTCAAAGAATTGTATrATCAAQ 

CTAATGTAG CAACAGAaCAAGTAAATAAAGGTAAATTTGCXXTTTaAACCA 

CAAG CCTTGCTAGATACTAATTGG CAGAAAGTAATTCTTCGTGATAAAGA 

AACACAAGTTCXSATTTACTATTGATGCTAGTCAATTTAGTCAGAAATTA^ 

AAGAACAGATGGCAAATGGTTATTTCTTAGAAGGTrrTGT 

GAAGCCAAGGATAGTAATCAGGAGTTAATGAGTATTCCTTTTGTAGG^ 

TAATGGTGATTTTGCGAACTTACAAGCACTTGAAACaCCGATTTATA 

CGCTTTCTAAAGGTAGTTTCTACTATAAACCAAATGATACAACT 

GACCAATTGGAGTACAATGAATCAGCTCCTTTTGAAAGCAA 

TGCCTTGTTAACACAATCAGCGTCTTGGGGCTATGTTGAT^ 

ATGGTGGGGAGTTAGAATTAGCACCGGAGAGTCCAAAAAGAATTATTTTA 

GGAACTTTTGAGAATAAGGTTGAGGATAAAACAATTCATCTT^ 

AGATGCAGCGAATAATCCATATTTTGCCATTTCTCCAAATAA 
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ATAGGGACXSAAATCACTCCCGAGGCAAC^ 

ATTTCTG CTCAAGTTCTAGATGAAAATGGAAATGTTATTTGG CAAAGTAA 
GGTTTTACCATCTTATCGTAAAAATTTCCATAATAATCCAAAGCAAAGTG 
ATGGTCAITATCGTATCXxATGCTCT 

GGCAAAGTTGTAGCAGATGGTTTTTATACTTATOGCTTAG^ 

AGTAGCAGAAGGAGCaAATAGTCAGGAGTCAGACTTTAAAGTTCAAGTAA 

GTACTAAGTCACCAAATCTTCCTTCACGAG CTCAGTTTGATGAAACTAAT 

CGAACATTAAGCTTAGCCATGCCTAAGGAAAGTAGTTATGTTCCT 

TCGTTTACAATTAGTTTTATCTCATGTTGTAAAAGATGA 

ATGAGACTTCTTACCATTATTTCCATATAGATCAAGAAGGTAAAGTGACA 

CTTCCTAAAACGGTTAAGATAGGAGAGAGTGAGGT TGCGG TAGACCCTAA 

GGCCTTGACACTTGTTGTGGAAGATAAAGCTGGTAATTTTGCA^ 

AATTGTCTGACCTCTTGAATAAGGCAGTAGTATCAGAGAAAG aAAACGCT 

ATAGTAA'i-riXJiAACAGTTTC^U^TA'riu-i<^TAACTTGAAGAAAGAACC 

TATGTTTATTTCTAAAGAAGGAAAAGTAGTAAACAAGAATCTAGAAGAAA 

TAACATTAGTTAAGCCTCAAACTACAGTrACTACTCAATCATTGTCTAAA 

GAAATAACTAAATCAGGAAATGAGAAAGTCCTCACTTCTACAAACAATAA 

TAGTAGCAGAGTAGCTAAGATCATATCACCTAAACATAACGGGGATrCl'G 

TTAACCATACC 



SEQ ID HO. 4407 
STRAIN COH1 

AATTGCTAATGTTGCTXZAACAGCX^ATCGCCATCGGTaACT^ 

TTGAAAAAACATCTGTAACAGCTGCTTCTGCTAGTAATACAGTGAAAGAA 

ATGGGtgATACATCTGTAAAAAATGACAAAACAGAAGATGAATTATTAGA 

AGAGTTATCTAAAAACCTTGATACGTCTAATTTGGGGGCTGAT^ 

AAGAATATCCCTCTAAACCAGAGaCAftCCAACAATAAAGAAAGC^ 

GTAACAAATGCTTCAACIXXIAATAGCACAGAAAGTTCCCT 



AAATAACAAAATTACAAGCCACAACCCAAAGAGGAAAGGGAAATGTAGTA 
GCTATTATTGATACTGG CTTTGAT ATTAACCATGATATTTTTCXTTTTAGA 
TAGCCCAAAAGATGATAAG CACAGCTTTAAAACTAAGGCAGAATTTGAGG 
AAtTAAAAGCAAAACATAATATCACTTATGGGAAATGGGTTAACGATAAG 
ATTGTTTTTGCACATAACTACG CCAaCAATACAGAAACGGTGG CTGATAT 
TGCAGCAGCTATGAAAGATGGTTATGGGTCAGAAGCAAAGAATATTTTGC 
ATGCTACACACGTTGCTGCTATTTTTGTAGCTAATAGT CA 
ATCAATAGTCTTCTTTTAGAAGGTGCAGCGCCAAATC 
AATGCGTATTCCAGATAAAATTGATTCGGACAAATTTGGAGAAG 
CTAAAGCAAT<^TAGAC<3CTGTTAATCTAGGAGCAAAAACGATTAATATG 

ATT AG CACTTAAATTAGCTTCTGAG AAGGG CGTTG CAGTTGTTGTGG CTG 
CCGGAAATGAAGGTGCATTTGGTATGGATTATAGCAAACCATTATCAACT 
AATCCTGACTACXK3TACGGTTAATAGTCCAGCTATTTCTGAAGATACTTT 
GAGTGTTGCTAGCTATGAATCACTTAAAACrATCAGTGAGGTCG 
CAACTATTGAAGGTAAGTTAGTTAAGTTG CCGATTGTGACTTCT 
TtTGACAAAGGTAAGGCCTACGATGTGGTTTATGCCAATTATGGTGCAAA 
AAAGATTTTGAAGGTAAGGACTTTAAAGGTAAGATTGCATTAATT^ 
TGGTGGTGGAC1TGATTTTATGACTAAAATCACTCATGCTACAAATGCAG 
GTGTTGTTGGTATCGTTATTTTTAACGATCAAGAAAAACGTGGAAA^ 
CTAATT(Xri^ACCGTGAATTACCTGTGGG<3GTTATTAGTA 
CGAGCGTATAAAAAATACTTCAAGTCAGTTAACATC 
AAGTAGTTGATAGCCAAGGTGGCAATCGTATGCTGGAACAATCAAGTTGG 
GGCGTGACAG CTGAAGGAGCAATCAAGCCTGATGTAACAGCTTCTGG CTT 
TGAaATTTATTCTTCAACCTATAATAATCAATACTA 
CAAGTATGGCTTCACCACATGTTGCZAGGATTAATGAnAATGCT^ 
CATTTGGCTGAGAAATATAAAGGGATGAATTTAGATrCTAaAAAATTGCT 
AGaATTGTCTAaaAACATCCTCATGAGCTCAGCAACAGCATTATATAGTG 
AAGAGGATAAGG CGTTTTATTCACCACGT CAGCAAGGTGCAG GTGTAGTT 
GATG CTGAAAAAGCT ATCCAAG CTCAATATTATGTTACTGGAAA CGATGG 
CAAAGTTAAAATTAATCTCAAACGAGAGGGAGATAAATTTGATATCACAG 
TTACAATTCATaAACTTGTAGAAGGTGTCAAAGAATTGT 
AATGTAGCAaCAGAACAAGTAAATAAAGGTAAATTTGCCCTTAAACCACA 
AG CCTTG CT AGATACT AATTGG CAGAAAGTAATTCTTcGTGATAAAGAAA 
CACAAGTTCGATTT ACTATTGATG CTAGT CAATTTAGTCAGAAATTAAAA 
GAACAGATGGCAAATGGTTATTTCTTAGAAGGTTTTGTACGTTTTA 
AGCCAAGGATAGTAATCAGGAGTTAATGAGTATTCC'rri'lXjl'AGGATTTA 
ATGGTGATTTTG CGAACTTACAAGCACTrGAAACACCX3ATTTATAAGACG 
CTTTCTAAAGGTAGTTTCTACTATAAACCAAATGATACAACTC^ 
CCAATTGGAGTACAATGAATCAGCTCCTTTTGAAAGCAACAACTATAC^ 
CCTTGTTAACACMTCAGCGTCTrGGGGCTATGTTGA 
GGTGOSQAGTTAGAATTAGCACXGGAGAGTCCAAAAAGAAT^ 
aACTTTTGAGAATAAGGTTGAGGATAAAACAATT CATCTTTTGGAAAGAG 
ATGCAGCGAATAATCCATATTTTGCCATTTCTCCAAAT^ 
AGGGACX3AAATCACTCCCCAGG<^ClTrCrrAAGAAATGTrAAGGATAT 
TTCTGCTCAAGtTCTAGATCAAAATGGAAATGTTATTTGGCAAAGTAA^ 
. TTTTACCATCTTATCGTAAAAATTTCCATAATaATCCA^ 
GGTCATTATCGTATGGATGCTCTTCAGTGGAGTGGTTTAgATAAGGATGG 
CAAAGTTGTAgCAGATGG tTTTTATACTT ATCGCTTACGTTACA 
TAGCAGAAGGAGCAAATAGTCAGOAGTCAGACTTTaAAGTTCAAGTAAGT 
AcTAAGTCACCAAATCTTCCTTCACGAG CTCAG1TTGATG 
AACATTAAGCTTAGCCATGCCTAAGGAAAGTAGTTATGTTCCTACATATC 
GTITACAATTAGTTTTATCTCATGTTGTAAAAGATGAAGA^ 



768 



WO 2004/018646 



PCT/US2003/026827 



Table 44: Comparative Sequences relating to SAG0416 (strain info highlighted in BOLD) 



GAGACTTCTTACCATTATTTCCATATAGATCAflGAAGGTAAAGTGACACT 

TCCTAAAACGGTTAAGATAGGAGAGAGTGAGGTTG CGGTAGACCCTAAGG 

CCTTGACACTTGTTGTGGAAGATAAAGCTGGTA^ 

TTGTCTGACCTCrTGAATAAGGCAGTAGTATCAQAGAAAG 

AGTAATTTCTAACZAGTTTCAAATATTTTGATAACTIGAAG 

TGTTTATTTCrAAAGAAGGAAAAGTAGTAAACAAGAATCTA 

ACATTAGTTAAG CCTCAAACTACAGTTACrACrcAATCATTGTCTAAA^ 

AATAACTAAATCAGGAAATGAGAAAGTCCTCACrTCTACAAACAATAATA 

GTAGC^AGTAGCTAAGATCATATCACCTAAACATAACGGGGATTCTGTT 

AACCATACC 

SEQ ID NO. 4408 
STRAIN M781 

GAGGAGCAAGAATTAAAAAACCAAGAGCAATCACCTGT 

AATTGCTAATGTTGCTCAACAGCXATCGCCATOGGTAACTACTAATATTC 

TTGAAAAAA.CATCTGTAACAGCTG CTTCTG CTAGTAATACAGTGAAAGAA 

ATGGGTGATACATCTGTAAAAAATGACAAAACAGAAGATGAATTATTAGA 

AGAGTTATCTAAAAACCTTGATACGTCTAATTTGGGGGC^^ 

AAGAATATCCCTCTAAACCAGAGACAACCAACAATAAAGAAAGCAATGTA 

GTAACAAATGCTTCAACTG CAATAG CACAGAAAGTTCCCTCAGCATATGA 

AGAGGTGAAGTCAGAAAGCAAGTCATCG<nTGCTGTTCTTG^ 

AAATAACAAAATTACAAGCCACAACCXAAAGAGGAAAGGGAAATGTAGTA 

GCTATTATTGATACTGGCTTTGATATTAACCATG^ 

TAGCCCAAAAGATGATAAGCACAGCTITAAAACTAAGGCAGAATTTGAGG 

AAT TAAAAG CAAAACATAATATCACTTATGGGAAATGGGTTAACGATAAQ 

ATTGii-ii-iGCACATAACTACGCCAaCAATACAGAAACGGTGGCTGATAT 

TGCAGCAGCTATGAAAGATGGTTATGGGTCAGAAGCAAAGAATATTTTGC 

ATGGTACACACXSTTGCTGGTATTTTTGTAGGTAAT^ 

ATCAATAGTCTTCTTTTAGAAGGTG C^GCG CCAAATGCTCAAGTCTT ATT 

AATGCGTATTCCAGATAAAATTGATTCGGACAAATTTGGAGAAGCATATG 

CTAAAGCAATCATAGACGCTGTTAATCTAGGAGCAAAAACGATTAATATG 

AGCCIGGGAAAAAaXSCTGATTCTTTAA 

ATTAG CACTTAAATTAGCTTCTGAGAAGGGCXSTTGCTUyrTGTTG 
CCGGAAATGAAGGTGCATTTGGTATGGATTATAGCAAaCCATTATCAaCT 
AATCCTCACTACGGTACGGTTAATAGTCCAGCTATTTCTGAAGATACTTT 
GAGTGTTGCTAG CTATGAATCACT t^AAAACTATCAGTGAGGTCGTTGAAA 
CAACTATTGAAGGTAAGTTAGTTAAGTTGO^TTGTGACtTCTAaACCT 
TITGACTU^AGGTAAGGCCTACGATG'lXiG' I'l'lATG CCAATTATGGTGCAAA 
AAAGATTTTGAAGGTAAGGACTTTAAAGGTAAGATTG CATTAATTGAGCG 
TGGTGGTGGACTTGATTTTATGACTAAAATCACTCATGCTACAAATC 
GTGTTGTTGGTATCXSTTATTTTTAACGAT^ 
cTAATTCCTTACCGTGAATTACCTGTGgGGGTTATTA 
CXSAGCX^ATAAAAAATACTTCAAGTCAGTTAACATT^ 
AAGTAGTTGAT7U3CCAAGGTGGCAATCGTATGCTGGA 
GGCGTGACAGCTGAAGGAG CAATCAAG CCTGATGTAACAGCTTCTGG CTT 
' TGAAATTTATTCTTCAACCTATAATAATCAATACTAAACAATGTCTGGT 
CAAGTATGGCTTCACCACATGTTGCAGGATTAATGACA 
CATTTGG CTGAGAAATATAAAGGGATGAATTTAGATTCTAAAAAATTGOT 
AGAATTGTCTAAAAACATCCTCATGAGCTCAGCAACAGC3\TTATATAGTG 
AAGAGGATAAGGOGTTTTATTCACXIACGTCAGCA 
GATGCTGAAAAAGCTATCXIAAGCTCAATATTATGTTACT^^ 
CAAAGTTAAAATTAATCTCAAACGAGAGGGAGATAAATTTGATATCAC^ 
TTACAATTCATaaAC^TGTAgAAGGTGTCAAAGAATTGTATTATCAAGCT 
AATGTAGCaaCAGAACAAGTAAATAaAGGTAAATTTGCCCTTaAaCCaCA 
AGC^ITGCTAGATACTAATTGGCAGAaAGTaATTCTtcGTGATAAAGAAA 
CACAAGTTcGATTTACTAtTGAT GCTA GTCA ATTTA g 
GAACAGATGGCAAATGGTTATTTCTTAGAAGG^ 
AGCCAAGGATAGTAATCAGGAGTTAATGAGTATTCCTTTTGTAGG 
ATGGTGATTTTGCXlRACTtACAAGCACTTGAAACACCGAT^ 
CTTTCTAAAGGTAGTTTCTACTATAAaCCAAATGATACAACTCATAAAGA 
CCAATTGGAGTACAATGAATCAGCTCCTTTTGAAAGCAACAACTAT^ 
CCTTGTTAACACAATCAGCGTCTTGGGGCTATG 
GG TGQGQA GTTAGAATTAGCACCGGAGAGTCCAAAAAGAAT^ 
AACTTTTGAGAATAAGGTTGAGGATAAAACAATTCAT^ 
ATGCAGCGAATAATCCATATTTTGCCATTTCTCCAAATAAA 
AGGGACG aaATCACTCCCCAGG CaAC t TTCTTAAGAAATGTTAAGGATAT 
TTCTGCTCAAG t TCTAGATCAAAATGGAA&TGTTATTTGGCAAAGTAAGG 
TTTTACGATCTTATCGTAAAAATTTCCATAATaATCCAAAGCAAAGTGAT 
GGTCATTATCGTATGGATGCTCTTCAGTGGAG^ 
CAAAGTTGTAGCAGATGGTTTTTATACTTATCGC^ 

TAGCAGAAGGAGCAAATAGTCAGGAGTCAGACTTTAAAGTTCAAGTAAGT 
ACTAACTCACCAAATCTTCCTTCACGAGCTCA 

AACATTAAGCTTAGCCATGCCTAAGGAAAGTAGTTATGTTCCTACAtATC 

GTTTACAATTAGTTTTATCTCATGTTGTAAAAGAT^^ 

GAGACT'l'CTTACCATTATTTCXMATAGATCAAGAAGGTAAAGTGACACT 

TCCTAAAACGGTTAAGATAGGAGAGAGTGAGGTTGCGGTAGACCCTAAGG 

CCTTGACACTTGTTGTGGAAGATAAAGCTGGTAATTT^ 

TTGTCTGACCTCTTGAATAAGGCAGTAGTATCAGAGAAAGAAAAC^ 

AGTAATTTCTAACAGTTTCAAATATTTTGATAAC^ 

TGTTTATTTCTAAAGAAGGAAAAGTAGTAAACAAGAATCrAGAAGAA^ 

ACATTAGTTAAGCCTCAAACTACAGTTACTACTCAATCATTGTCT 

AATAACTAAATCAGGAAATGAGAAAGTCCTCACTTCTACAAACAATAATA 

GTAGCAGAGTAGCTAAGATC^TATCACCTAAACATAACGGGGATTCTGTT 
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AACCATACC 

SEQ ID NO. 4409 
STRAIN CJB110 

GAGGAGCAAGAATTAAAAAACCAAGAGCAATCACCTGTAA 

TTGCTAATGTTGCrCAACAG CCATCXX:CATCX^TAACT7VCrAATATTGTT 

GAAAAAACATCTGTAnCAGCTGCTTCTGCTAGTAATACAGCG^ 

GGGTGATACATCTGTAAAAAATGACAAAACAGAAGA^ 

AGTTATCTAAAAACCTTGATACGTCTAATvmSGGGGCTC 

GAATATCCCTCTAAACCAGAGACAACXIAACAATAAAGAAAGCAAT^ 

AACAAATGCTTCAACTGCAATAGCACAGAAAGTTCC^ 

AGGTGaAGCCAGAAAGCAAGTCATCGCTTGCTGTTTTTGATA 

ATAACAAAATTGCAAGCCATARCCCAAAGAGGAAAGGGAAATGTAGTAGC 

TATTATTGATACrGGCTTTGATATTAACCATGATATTTT^ 

GCCCAAAAGATGATAAGCACAGCTTTAAAACTAAAGCAGAATT 

tTAAAAGCAAAACATAATATCACriTATGGGAAATGGGTTAACGATAAGAT 

TGTTTTTGCACATAACTACGCCAACAATACAGAAAC 

CAGCAGCTATGAAAGATGGTTATGGGTCAGAAGCAAAGAATATTT 

GGTACACACGTTGCTGGTATTTTTGTAGGTAATAGTAAACX3T 

CAATGOTCITCrTTTAGAAGGTGCAGCGCC^ 

TG CGTATTC CAGATAAAATTGATTCGGACAAA'l "1TGG AG AAG CAT ATG CT 
AAAG CAATCACAGACG CTGTTAAT CTAGG AGCAAAAA CG ATT AAT ATGAG 
CGTTGGAAAAAC^^CAGATTCTITAATTG CACTCAATGATAAAGTTAAAT 
TAgCACTTAAATTAGCTrTcTGAGAAGGGCGTTGC^^ 
GGAAATGAAGGTGCATTTGGTATGGATTATAgCAAAC 
TcCTGACTACGGtACGGTTAATAGTCCAGCTAT^ 

GTGTTG CTAG CTATGAATCACTTAAAACTATCAGTX^GGTCXrrTG aAACA 

ACTATTGAAGGTAAGTTAGTTAAGTTGCCGATTGTGA 

TGACAAAGGTAAGG CCTACGATGTGGTTTATG CCAATTATGGTG CAAAAA 

AAGACTTTCAAGGTAAGGACTTTAAAGGTAAGATTC 

GGTGGTGGACTTGATTTTATGACTAAAATCZ^ 

i^i^ iXSGT ATCGTTA 

TAATTCCTT ACGXn'GAATTACCTCTGgGGGTTATT AGTAAAGTAGATGG C 
GAGCGTAT AAAAAAT ACTT CAAGT CAGTT AACATTTAAC CAg AGTTTTG A 
AGTAgTTGATAGCCAAgGTGGCAATCGTATGCTGGA^ 
GOn^CAGCTGAAGGAGCAATCAAGCCIX^TGTA^ 
GAAATTTATTCTTCAACCTATAATAATCAAT^ 

AAGTATGGCTTCACCACATG t TGCAGGATTAATCACAATGCTTCAAAATC 

ATTTGG<rrGAGAAATATAAAGGGATGAATTTAGATTC^^ 

GAATTGTCTAAAAACAT<XTCATGAGCTCAGCA 

AGAGGATAAGGCGT/TTTATTCACCACGTCAGCAAGG t GCAGGTGTAGTTG 
ATGCTGAAAAAGCTATCCAAGCrCAATATTATGTTACTG^ 
AAAG CTAAAATTAATCTCAAACXIAGTGGGAGATAAAT/TTXIAT^ 
TACAATTCATAAACTTGTAGAAGGTGTCAAAG^ 

ATCTAGCAACAGAACAAGTAAATAAAGGTAAATTTCCCCTTaAACCACAA 

GCCTTGCTAGATACTAATTGGCAGAAAGTAATTCTTcGTGATAAAGAA^ 

ACAAGTTCXIATTTACTAtTGATGCTAGTCAATTTAgTXA 

AACAGATCGCAAATGCTTATTTCTTAgAA^ 

GCCAAGGATAGTAATCAGGAGOTAATGAGTATTCCT^ 

TGGTGATTrTGCGAACT tACAAGCACTTGAAA<^Ct^TTTATAAGACG C 

TTTCTAAAGGTAGTtTCTACTATAAACCAAATGA^ 

CAATTGQAGTACAATGAATCAGCrCc tTTTGAAAGCAACAACTATACTGC 

CTTGTTAACACAATCAGCGTCrTGGGG CTATGTTG 

GTCGGGAGTTAGAATTAGCACCGGAGAGTCCAAAAAGA^ 

ACITTTQAQAATAAGOT TGAGGAT AAAACA^ 

TGCAGCGAATAATCCATATTTIGCCATTT^ 

GGGATGaaATCACTCCCCAGGCAACtTTCTTA^ 

TCTCCTCAAGTTCTAGATCAAAATGGAAATGT^ 

TTTACCATCTTATCGTAAAAATTTCCATAATAATCCAAAG 

GTCATTATCXSTATGGATGCCTTTCaGTG 

AAiUn^GTAGCAGATGQTTTTTATftCTlATOGCCTAOGTTACACACCA^ 

AG CAGAAgGAGCAAATAGTCAGGAGTC^gACTTTAAAGTTCAAGTAAGTA 

CT AAGTCACCAAATCTTCCTTTACTAG CTCAGTTTGATGAAACTAATCGA 

ACAT TAAGCT TAGCC ATCCCTAAGGAAAGT^ 

TTTACAATTAGTTTTATCTCATGTTGTAAA 

AGACTTCTTACCATTAT/TTCCATATAGATCAAGAAGGTAA 

CCTAAAACGGTTAAGATAGGAGAGAGTGAGGTTGCAGTAGA 

CITGACACTTGTTGTGGAAGATAAAGCTGGTAATTTT^ 

TGTCTGACCTCTTOAaTAAgGCA GTAGT ATCA^ 

OTAA TTTCTAACAGTTTCAAATATTTT^ 

GTITATTTCrAAAGAAGGAAAAGTAGTAAACAAGAATCTAGAAGAAATAA 

CATTAGTTAAGCCGCAaACTACAGTTACTACrCAATCATTGTCTAAAGAA 

ATAACTAAATCAGGAAATGAGAAAGT^Xn^CTTCTACAAACAATAATAG 

TAGCAGAGTAGCTAAGATCATATCACCTAAACATAACGGGGATTCT 

ACCATACC 

SEQ ZD NO. 4410 
STRAIN 116 9NT 

GAGGAGCAAGAATTAAAAAACCAAGAGCAATC 
ACCTGTAATTGCTAATGTTGCTCAACAGCCATOGCCW 
ATATTGTTGAAAAAACATCTQTAACAGC ^ C lTt Ol j CTAGTAATACAG^ 
AAAG AAATGG GTGATACAT CIX7TAAAAAATG ACAAAACAG AAGATGAATT 
ATTAGAAGAGTTATCTAAAAACCTTGATAanCTAATATGGG 
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TTGAAQAAGAATATCCCTCTAAACCAGAGACAACCAACAATAAGGAAAGC 

AATGTAGTJUVCAAATGCTTCAACTC 

ATATGAAGAGGTGAAGCCAAAAAG CAAGTCATCGCTT^ 

CATCTAAAATAACAAAATTGCAAGCCATAACCCAAAGAGGAAAGGGAAAT 

OTAGTAGCTATTATTGATACTGGCTTTGATATTAACCATGAT 

TTTAGATAG TCCAAAAG ATGATAAGCACAGCTTTAAAAAT AAGG CAGAAT 

TCGAGGAATTAAAAGCAftAACATAATATCACTTATGGGA^ 

GATAAGATTGTTTTTGCACATAACTACGCCAAC^TACAG 

TGATA3TCCAGCAGCTATGAAAgATGGTTATGGTT 

TTTCX3CATGGTACACACGTTGCTGGTATTtTTCTAGGTAATA^ 

CTTATTAATGCGTATTCCAGATAAAATtG^ 

CATATGCTAAAGCAATCACAGACGCTGTTAATCTAGGAGCTaAAACGATT 

AATATGAGTATTGGAAAAACAGCTGATTCTTTAA 

AGTTAAATTAgCACTTAAATTAGCTTCTGAG 

TGGCTGcCGGAAATGAAGGCGCATTtGGTATGGATTATAGCAAACCGlTA 
TCAACTTAATcCTGACTACGG tACX3G tTAATAGTCCAGCTATTTCTGAAGA 
TACTTTGAGTGTTGCTAGCrATGAATCACITAAAACT 
TTGAAACAACTATTGAAGGTAAGTTAGTTAAGTtGCCGATTC tGACTTCT 
AAACCTT 1 1 GACAAAGGTAAGGCCTACGATGTGGTTTATG CCAATTATGG 
TG CAAAAAAAGACTTTGAAG{H\AAGGACTTTAAAG GTAAGATTG CATTAA 
TTGAG^XTTGCTGOTtSGACTTGATTTTATGACTA 
AATGCAGGTGTTGTTGGTATOGTTATTTTTAACGATCAAGAAAA^ 
AAATTTTCTAATTCCTrACaSTGAATTAC 

TAGATGG CGAGCGTATAAAAaATACTTCAAGTCAGTTAACATTTAACC^ 

AGATTTGAAGTAGTTGATAGCCAAgGTGGCAATC<3TATGCTG^ 

aACTtGG<K3CGTGACAGCTGAAGGAGCAATCAA^ 

CTGGCrrrCX3aAATTTATTCrrTCa 

TCTGGTACAAGTATGGCrTCACCACATGTTGaVGGA 

TCAAAGTCATTTGGCTGAGaAATATAAAGXSGATCAATTTAg^ 

AATTG CTAGAATTGTCTAAAAACATCCTCATGAGCTCAG CAACAG CATTA 

TATAGTGAAGAGGATAAGG CGlTTTATTCAtXACGTCAGCAAGG t GCAGG 

TGTAGTTGATGCTGAAAAAG CTATCCAAG CTCAATATTATGTTACTGGAA 

ACGATGGCAAAGCTAAAATTAATCTCAAACX^GTGGGAGATAAATT^ 

ATCACAGTTACAATTCATAAACTTGTAGAAGG 

TCAAGCTAATGTAG C^^CAGAACAAGTAAATAAAGKnAAATTTGCCCTTA 
AACCAOtfiGCCrTGCTAGATACTAAT^ 

AAAGAAACACAAGTTCGATTTACTATTGATGCHTVGTCAATT^ 

ATTAAAAGAACAGATGGCAAATGGTTATTTCTTAgAAGGTTTTC 

TTAAAGAAGCTAAGGATAGTAATCAGGAGTrAATGAGTATTC C-ri"IT GTA 

G^^TTTA^GGTX3ATTTTG CG^CTTACAAGCACrrTGAAA(^CCGU\TTTA 

TAAGACGCTTTCTAAAGGTAGTTrCriACTATAAA(XAAATGAl^ 

ATAAAGACCAATTGGAGTATAATGAATCAGCTCCTTTTGA 

TATACTGCCirGTTAACACAATCAGCGTCTTGGGGCTATG 

CaAAAATGGTGGGGAGTTAGAATTAGCACCGGAGAGTcCAAAAAGAATTA 

i-riuAGGAALri-l-iUtjAGAATAAGGTTGAGGATAAAACAATTCATCrri'l'G 

GAAAGAGATGCAGCGAATAATCCATATTTTGCCATTTCTCCAAATAAAG^ 

TGGAAATAGGGATGAAATCACTCCCCAGGCAACTTTCT^ 

AGGATATTTCTGCTCAAGTTCTAGATCAAAATGGAAATGT^ 

AGTAAGGITTTACCATCTTATCGTAAAAATTTCCATAATAATCC^ 

GAGTGATGGTCATTATCGTATGGATGCCCTTCAGTGGAG^ 

AGGATGGCAAAGTKSTAGGAGATGGTTTTTATACTTATCGCT^ 

ACAC CAGTAG CAGAAGGAG CAAAT AGTCAGGAGT CAG ACTTT AAAGTTCA 

AGTAAGTACTAAGTCTVCCAAATCTTCXTrTCACGAG 

CTAATCGAACATTAAGCTTAGCCATGCCrAAGGGAAGTAGTTATGTTCCT 
ATATATCGTCTACAATTAGTITTATCTCATGTTGTAAAAGATGAAGAATA 
TGGAGATGAGACTTCTTACTATTATTTCCATATAGATCAAGAAGCT 
CGACACTTCCTAAAACGGTTAAGATAGGAGAGAGTGAGGTTGCAGT^ 
CCTAAG<XXnTGACACTTGTTGTGGAAGATAAAG CTGGTAATTTCGCAaC 
GGTAAAATTGTCTGACCTCTT GAATA AGGCAGTAGT^ 
. ACtXTTATAGTAAlUTCrAACAGTTTCAAATAlUUUt^TAACTTGAAAA^ 
GAACCTATGTTTATTTCTAAAAAAGAAAAAGTAGTAAACAAGAATCTAGA 
AGAaATAATATTAGTTAAGCOGCAcACTACAGTTACTACTCAaTCATTGT 
CTAAAGAAATAACTAAATCAGGAAATGAGAAAGTCCTC^CTTCTACAAAC 
AATAATAGTAGTAGAGTAG CTAAAATCATATCACCTAAACATAATGGGGA 
TTCTGTTAACCATACC 

SEQ ID NO. 4411 
STRAIN JM9130013 

GAGGAGCAAGAATTAAAAAACCAAGAG CAATCACCTGTAA 
TTGCTAATGTTGCTCAACAG CCATCGCCATCGGTAACTACTAATACTGTT 
GAAAAAACATCTGT AACAG CTGCTTCTGCTAGTAATACAG CGAAAGAAAT 
GQGTGATACATCTGTAAAAAATGACAAAACAQAAGATGAATTATTAGA^ 
AGTTATCTAAAAACCTTGATACGTCTAATTTG 

GAATATCCCTCT AAA CCAG AGACAACCAACAATAAAGAAAG CAATGTAGT 

AACAAATGCITCAACTGCAATAGCACAGAAAGTTCCCTCAGCATATGAAG 

AGGTGAAGCCAGAAAGCAAGTCATCX3CTrGCTG'l"i' LTltjATACATCTAAA 

ATAACAAAATTACAAGCCATAACCCAAAGAGGAAAG 

TATTATTGATACTGG<nTTGATATTAACCATGATATC 

GCCCAAAAGATGAT AAGCACAG CTTTAAAACTAAGACAGAATTTGAGGAA 

TTAAAAGCAAAACATAATATCACTTATGGGAAATGGGTTAACGATAAGAT 

TGTTTTTGCACATAACTACGCCAACAATACAGAAAOGGT^ 

CAGCAGCTATGAAAGATGGTTATGGTrCAGAAGCAAAGAATATTTCGCAT 
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ATTTTTGTAGGTAATAGTAAACGTCCAGCAAT 
TAGAAGGTGCAGCGCCAAATGCTCAAGTCTTATTAA 
TGCGTATTCCAGATAAAATTGATTCGGACAAATTT^ CAT ATGCT 
AAAGCAATCACAGACGCTGTTAATCTAGGAGCAAAAACG^ 
TATrcGAAAAACAGCTGATTCTTTAATTGCTCT 

TAGCACTTAAATTAGCTTCTGAGAAGGGCGTTGCAG . 

GGAAATGAAGG CGCATTTG GTATGGATTAT AG CAAACCATTATCAACTAA 

TCCTGACTACGGTACXaGTTAATAGTCCAGCTATTrCT^ 

GTGTTG CTAGCTATGAATCACTTAAAACTATCAGTGAGGTCGTTGAAACA 

ACTATTGAAGGTAAGTTAGTTAftGTTGCCGATTC^ 

TGACAAAgGTAAgGCCTACGATGTGGTTTATGCCAATTATGff 

AAGACITTGAAGGTAAGGACTTTAAAGGTAAGATTGC^ 

GGTGGTGGACTTGATTTTATGACTAAAATCACTCATGCTACAAATG 

TGTT13TTGGTATCGTTATTTTTAACGATCAAGAA 

TAATTCCTTACCGTGAATTACCTGTGGGGATTATTAGTAAAGTAG^ 

GAGCGTATAAAAAATACTTCAAGTC^TTAACATTTAACCAGAGTT^ 

AGTAGTTGATAGCCAAGGTGGTAATCXn'ATGCTGGAACAATCAAGT^ 

GCGTGACAG CTGAAGGAGCAATCAAGCCTGATGTAACAG CTTCTGG CTTT 

GAAATTTATTCTTCAACCTATAATAATCAATACCAAACA^ 

AAGTATGGCTTCACCACATGTTGCAGGATTAATGACAATGCT^ 

ATTTGGCTGAGAAATATAAAGGGaTGAATTTAGATTClAA 

GAATTGTCTAAAAACATCCTCATGAGCTCAGCAACAG CATTATATAGTGA 

AGAGGATAAGGCGTTTTATTCACCACGTCAGCAAGGTGC^^ 

ATGCTGAAAAAGCTATCCAAGCTCaATATTATATTACTGGAAACX^TG^ 

AAAGCTAAAATTAATCTCAAACGAATGGGAGATAAATTTGATATCACAG 

TACAATTCATaAACTTGTAGAAGGTGTCAAAGAA t TGTATTATC^ 

ATGTAGCAACAGAACAAGTAAATAAAGGTAAATTTGCCCTTaAACCACAA 

GCCTTGCTAGATACTAATTGGCAGAAAGTAATTCTTCmX^TAAAGA 

ACAAGTTCX^TTTACTATTGATGCTAGTCAATTTAGT 

AACAGATGGCAAATGGTTATTTCTTAGAAGGTTTTGTAC^ 

GCCAAGGATAGTAATCAGGAGTTAATGAGTATTCCTTTTGTAGGA 

TGGTGATTTTGCGAACTTACAAGCACITGAAACACC^ 

TTTCTAAAGGTAGTTTCTACTATAAACXyWVTGATA(^^ 

CAATTGGAGTACAATGAATCAGCrcCITnTrGAAAG CAACAACTAT ACTG C 

CTTGTTAACACAATCAGCGTCITGGGGCTATGTTGAT^ 

GTGGGGAGTTAGAATTAGCACCGGAGAGTCCAAAAAGAATTATTTTAGGA 

ACTITTGAGAATAAGGTTGAGGATAAAACAATTCATCTTTTG 

TGCAGCXIAATAATCCATATTTTGCCATTTCTCCAAATAAAG^ 

GGGACGAAATCACTCCXX^GGCAACTTTCTTAAGAAATGTTAAGGATATT 

TCTGCTCAAGTTCTAGATCAAAATGGAAATGTTATTT 

TTTACCATCTTATCGTAAAAATTTCCATAATAATCCAAAGCAAAGT^ 

GTCATT ATCGTATGGATG CTCTTCAGTGGAGTGGTT^ 

AAAGTTGTAGCAGATGGTTTTTATACTTATOGCrTACGTT^ 

AGCAGAAGGAGCAAATAGTCAGGAGTCAGACTTTAAAGTACAAGTAAGTA 

CTAAGTCACCAAATCTTCCTTCACQAGCTCAGTTTGATGAAACT 

ACATTAAGCTTAGCCATGCCTAAGGAAAGTAGTTATGTTCCTACATATCG 

TTTACAATTAGTTTTATCTCATGTTGTAAAAGATGAAGAATATGGG^ 

AGACTTCTTACCATTATTT CK3ATATAGATCAAGAAGGTAAAGTGACACTT 

CCTAAAAC<K3TTAAGATAGGAGAGAGTGAGGTTGCGGTAGACCCTAAGGC 

CTTGACACTTGTTGTGGAAGATAAAGCTGGTAATTT^ 

TGTCTGATCTCTTGAATAAGGCAGT AGTATCAGAGAAAGAAA^ CTAT A 

GTAATTTCTaACAGTTTCAAATATTTTGATA^ 

GTTTATTTCTAAAAAAGAAAAAGTAGTAAACAAGAATCTAGAAGAAATAA 
TATTAGTTAAGCCX3 CAAACTACAGTTACTACTCAATCATTGTCT 
ATAACTAAATCAGGAAATGAGAAAGTCCTCACTTCTACAAACAATAATAG 
TAGCAGAGTAGCTAAGATCATATCACCTAAACATAACGGGGATTCTGTTA 
ACCATACC 

PRETTY of: /biotmp/msal83564 . 2 {* } May 13, 2003 03i28 



msal83564.2j 
msal83564.2| 
msal83564 . 2\ 
msal83564.2j 



147_C0H1 
147 M732 
147_M781 
147 2603 



msal83564.2{l47 JM9130013 
msal83564 .2{l47_18RS21 
maal83564 . 2 { 147_090 
msal 83564 . 2 { 147_CJB110 
msal83564 . 2{ 147_A909 
rosal83564.2{147 H36B 
msal83564 . 2 { 147 JL169NT 
Consensus 



50 



gtggataaac atcactcaaa aaaggctatt ttaaagttaa cacttataac 



msal83564 .2{l47_COHl 
msal83564 . 2 { 147J4732 
cnsal83S64 . 2 { 147J4781 
msal83564 . 2 { 147^2603 
msal 83 564. 2 { 14 7_JM9 13 001 3 
msal83564.2{!47 18RS21 
msal83564.2{l47_090 
msal83564.2{l47 CJB110 



51 100 

GAGGAGCAAG 

GAGGAGCAAG 

GAGGAGCAAG 

aactagtatt ttattaatgc atagcaatca agtgaatgca GAGGAGCAAG 

GAGGAGCAAG 

GAGGAGCAAG 

GAGGAGCAAG 

GAGGAGCAAG 
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maal83564.2(l47_A909) GAGGAGCAAG 

msal83564 .2{147_H36B} J. GAGGAGCAAG 

msal83564.2{l47_1169NT) GAGGAGCAAG 

Consensus ********** ********** ********** ********** ********** 



msal83564.2{l47 COHl} 
msal83564 . 2 { 147~M732 } 
msal83S64.2(147"~M781 % 
xnsal83564 . 2 { 147*2603 ' 
msalB3564.2{l47 JM9130013* 
msal83564.2{T47 18RS21 
msal83564.2{l47_09o! 
ms al 8 3 564 . 2 { 14 7_CJB11 0 
msal83564.2{l47 A909 
msal83564.2{147*H36B 
msal83564 . 2 { 147_1169NT] 
Consensus 



101 

AATTAAAAAA 
AATTAAAAAA 
AATTAAAAAA 
AATTAAAAAA 
AATTAAAAAA 
AATTAAAAAA 
AATTAAAAAA 
AATTAAAAAA 
AATTAAAAAA 
AATTAAAAAA 
AATTAAAAAA 



CCAAGAGCAA 
CCAAGAGCAA 
CCAAGAGCAA 
CCAAGAGCAA 
CCAAGAGCAA 
CCAAGAGCAA 
CCAAGAGCAA 
CCAAGAGCAA 
CCAAGAGCAA 
CCAAGAGCAA 
CCAAGAGCAA 



TCACCTGTAA 
TCACCTGTAA 
TCAC CTGTA A 
TCACCTGTAA 
TCACCTGTAA 
TCACCTGTAA 
TCACCTGTAA 
TCACCTGTAA 
TCACCTGTAA 
TCACCTGTAA 
TCACCTGTAA 



TTGCTAATGT 
TTGCTAATGT 
TTGCTAATGT 
TTGCTAATGT 
TTGCTAATGT 
TTGCTAATGT 
TTGCTAATGT 
TTGCTAATGT 
TTGCTAATGT 
TTGCTAATGT 
TTGCTAATGT 



150 

TGCTCAACAG 
TGCTCAACAG 
TGCTCAACAG 
TGCTCAACAG 
TGCTCAACAG 
TGCTCAACAG 
TGCTCAACAG 
TGCTCAACAG 
TGCTCAACAG 
TGCTCAACAG 
TGCTCAACAG 



msal83564.2(l47 COHl 
msal83564 . 2 ? 147*M732 
msal83S64.2(147~M781 
msal83564.2{147*2603 
TOsal83564 .2{ 147_jJM9130013 
msal83564 .2{l47_18RS21 
msal83564 . 2 { 147_090 
msal83 564 . 2 { 14 7_CJB110 
msal83S64.2{l47 A909 
msal83564 . 2 (147*H36B 
msal 8 3 5 64 . 2 { 14 7_116 9NT 
Consensus 



151 

CCATCGCCAT 
CCATCGCCAT 
CCATCGCCAT 
CCATCGCCAT 
CCATCGCCAT 
CCATCGCCAT 
CCATCGCCAT 
CCATCGCCAT 
CCATCGCCAT 
CCATCGCCAT 
CCATCGCCAT 



CGGTAACTAC 
CGGTAACTAC 
CGGTAACTAC 
CGGTAACTAC 
CGGTAACTAC 
CGGTAACTAC 
CGGTAACTAC 
CGGTAACTAC 
CGGTAACTAC 
CGGTAACTAC 
CGGTAACTAC 



TAATAtTGTT 
TAATAtTGTT 
TAATAtTGTT 
TAATAcTGTT 
TAATAcTGTT 
TAATACTGTT 
TAATAtTGTT 
TAATAtTGTT 
TAATAcTGTT 
TAATACTGTT 
TAATAtTGTT 



GAAAAAACAT 
GAAAAAACAT 
GAAAAAACAT 
GAAAAAACAT 
GAAAAAACAT 
GAAAAAACAT 
GAAAAAACAT 
GAAAAAACAT 
GAAAAAACAT 
GAAAAAACAT 
GAAAAAACAT 



200 

CTGTAaCAgC 
CTGTAaCAgC 
CTGTAaCAgC 
CTGTAaCAgC 
CTGTAaCAgC 
CTGTAaCAgC 
CTGTAaCAgC 
CTGTAnCAgC 
CTGTAaCAtC 
CTGTAaCAtC 
CTGTAaCAgC 



msal 83 5 64 . 2 { 147_COHl 
msal83S64 . 2 I 147_M732 
msal83564. 2(147 M781 
msal83564 . 2 { 147*2603 
msal83564 . 2 { 14 7_JM9 130013 
msal83564 .2 { 147_18RS21 
msal83564 . 2 { 147_090 
msal83 564 . 2 { 147_CJB110 
msal83564.2fl47_A909 
msal83564 .2{147_H36B 
msal83564 .2{l47_1169NT> 
Consensus 



201 

TGCTTCTGCT 
TGCTTCTGCT 
TGCTTCTGCT 
TGCTTCTGCT 
TGCTTCTGCT 
TGCTTCTGCT 
TGCTTCTGCT 
TGCTTCTGCT 
TGCTTCTGCT 
TGCTTCTGCT 
TGCTTCTGCT 



AGTAATACAG 
AGTAATACAG 
AGTAATACAG 
AGTAATACAG 
AGTAATACAG 
.AGTAATACAG 
AGTAATACAG 
AGTAATACAG 
AGTAATACAG 
AGTAATACAG 
AGTAATACAG 



tGAAAGAAAT 
tGAAAGAAAT 
tGAAAGAAAT 
CGAAAGAAAT 
CGAAAGAAAT 
CGAAAGAAAT 
tGAAAGAAAT 
CGAAAGAAAT 
CGAAAGAAAT 
CGAAAGAAAT 
CGAAAGAAAT 



GGGTGATACA 
GGGTGATACA 
GGGTGATACA 
GGGTGATACA 
GGGTGATACA 
GGGTGATACA 
GGGTGATACA 
GGGTGATACA 
GGGTGATACA 
GGGTGATACA 
GGGTGATACA 



250 

TCTGTAAAAA 
TCTGTAAAAA 
TCTGTAAAAA 
TCTGTAAAAA 
TCTGTAAAAA 
TCTGTAAAAA 
TCTGTAAAAA 
TCTGTAAAAA 
TCTGTAAAAA 
TCTGTAAAAA 
TCTGTAAAAA 



msal 8 3 5 64 . 2 ( 14 7_C0H1 
msal83564 . 2 1 147_M732 
msal 83 564. 2 (147 M781 
msal83564 . 2 { 147*2603 
TOSalS 3 5 64 . 2 { 147_JM9 130 0 1 3 
rasal83564 . 2 ( 147_18RS21 
msal83564.2(l47 090 
msal83564 .2(147 CJB110 
msal83 564 , 2 { 14 7_A9 0 9 
msal 8 3 564 , 2 { 14 7_H3 6B 
msal83564 .2{l47_1169NT 
Consensus 



251 

ATGACAAAAC 
ATGACAAAAC 
ATGACAAAAC 
ATGACAAAAC 
ATGACAAAAC 
ATGACAAAAC 
ATGACAAAAC 
ATGACAAAAC 
ATGACAAAAC 
ATGACAAAAC 
ATGACAAAAC 



AGAAGATGAA 
AGAAGATGAA 
AGAAGATGAA 
AGAAGATGAA 
AGAAGATGAA 
AGAAGATGAA 
AGAAGATGAA 
AGAAGATGAA 
AGAAGATGAA 
AGAAGATGAA 
AGAAGATGAA 



TTATTAGAAG 
TTATTAGAAG 
TTATTAGAAG 
TTATTAGAAG 
TTATTAGAAG 
TTATTAGAAG 
TTATTAGAAG 
TTATTAGAAG 
TTATTAGAAG 
TTATTAGAAG 
TTATTAGAAG 



AGTTATCTAA 
AGTTATCTAA 
AGTTATCTAA 
AGTTATCTAA 
AGTTATCTAA 
AGTTATCTAA 
A GTTA TCTAA 
AGTTATCTAA 
AGTTATCTAA 
AGTTATCTAA 
AGTTATCTAA 



300 

AAACCTTGAT 
AAAC CTTG AT 
AAACCTTGAT 
AAACCTTGAT 
AAACCTTGAT 
AAACCTTGAT 
AAAC CTTG AT 
AAACCTTGAT 
AAACCTTGAT 
AAACCTTGAT 
AAACCTTGAT 



msal83564 
msal83564 
msal83564 
msal63564 
insal83564.2{l47 

msal83564.2{' 
msal83564 

msal 83 564. 2 { 
msal83564 
msal83564. 

msal83564.2{ 



2{147_OOH1 
2(147_M732 
2(147_M781 
2{147_2603 
JM9 130013 
147 1BRS21 
2 {147 090 
147_CJB110 
2(147 A909 
2{147*H36B 
147_1169NT. 
Consensus 



301 

ACGTCTAATt 
ACGTCTAATt 
ACGTCTAATt 
ACGTCTAATt 
ACGTCTAATt 
ACGTCTAATt 
ACGTCTAATt 
ACGTCTAATw 
ACGTCTAATt 
ACGTCTAATt 
ACGTCTAATa 



TGGGGGCTGA 
TGGGGGCTGA 
TGGGGGCTGA 
TGGGGGCTGA 
TGGGGGCTGA 
TGGGGGCTGA 
TGGGGGCTGA 
TGGGGGCTGA 
TGGGGGCTGA 
TGGGGGCTGA 
TGGGGGCTGA 



TCTTGAAGAA 
TCTTGAAGAA 
TCTTGAAGAA 
TCTTGAAGAA 
TCTTGAAGAA 
TCTTGAAGAA 
T CTTGA AGAA 
TCTTGAAGAA 
TCTTGAAGAA 
TCTTGAAGAA 
TCTTGAAGAA 



GAATATCCCT 
GAATATCCCT 
GAATATCCCT 
GAATATCCCT 
GAATATCCCT 
GAATATCCCT 
GAATATCCCT 
GAATATCCCT 
GAATATCCCT 
GAATATCCCT 
GAATATCCCT 



350 

CTAAACCAGA 
CTAAACCAGA 
CTAAACCAGA 
CTAAACCAGA 
CTAAACCAGA 
CTAAACCAGA 
CTAAACCAGA 
CTAAACCAGA 
CTAAACCAGA 
CTAAACCAGA 
CTAAACCAGA 



msal83.564 . 2 { 147_C0H1 
insal83564.2 147 M732 
msal83564 . 2 147~M781 
msal83564 . 2 { 147~2603 
msal 83564. 2 {14 7 JM9130013 
msal83564.2{l47 18RS21 
msal83564.2{l47 090 



351 

GACAACCAAC 
GACAACCAAC 
GACAACCAAC 
GACAACCAAC 
GACAACCAAC 
GACAACCAAC 
GACAACCAAC 



AATAAaGAAA 
AATAAaGAAA 
AATAAaGAAA 
AATAAaGAAA 
AATAAaGAAA 
AATAAaGAAA 
AATAAaGAAA 



GCAATGTAGT 
GCAATGTAGT 
GCAATGTAGT 
GCAATGTAGT 
GCAATGTAGT 
GCAATGTAGT 
GCAATGTAGT 



AACAAATGCT 
AACAAATGCT 
AACAAATGCT 
AACAAATGCT 
AACAAATGCT 
AACAAATGCT 
AACAAATGCT 



400 

TCAACTGCAA 
TCAACTGCAA 
TCAACTGCAA 
TCAACTGCAA 
TCAACTGCAA 
TCAACTGCAA 
TCAACTGCAA 



773 



WO 2004/018646 PCT7US2003/026827 
Table 44: Comparative Sequences relating to SAG0416 (strain info highlighted in BOLD) 



msal83564.2(l47 CJB110 
msalB3564.2(l47 A909 
msal83564.2(147,_H36B 

rasal83564 .2{l47_1169NT 
Consensus 



mBal83564 . 2 f 147_COHl 
msal83564.2i 147 M732 
msal83564 . 2 s 147~M7B1 
msal83564.2{147_2603 i 
maal83564.2{l47 JM9130013 
msal8'3S64 . 2 {T47_18RS21 
msal83564.2{l47_O90 
msalB3564 . 2 { 147_CJB110 
rasal83S64 . 2 { 147_A909 
msal83564 . 2\ 147_H36B 
msal83564 . 2 { 147_1169NT 
Consensus 



msal83 564 . 2 ( 147_C0H1 
msal83564 . 2 { 14 7 J4732 ' \ 
msal83564 . 2 { 147_M781 f 
msal83S64.2(147_2603 f 
rasal83S64 . 2 (147_JM9130013 
msal83564 .2(147 18RS21 
tnsal83 564 . 2 {14 7_090 
msal83564 . 2 { 147_CJB110 
msal83564.2(l47_A909 
msal83564.2{l47_H36B 
msal83 564 . 2 { 147_1169NT 
Consensus 



tnsalB3564 . 2 ( 147_COHl 
msal83564.2 147_M732 > 
msal83564.2 147_M781 
msalB3564 . 2 (147_2603 \ 
maal835S4.2{l47 JM9130013 
msal83564 .2{l47_18RS2l' 
msal83564.2{l47_090 | 
msal83564.2(l47_CJB110 
msal 8 3 564.2(147 A909* 
msal83564 . 2 ( 147 J*36b'i 
msal83S64.2{l47_1169NT ) 
Consensus 



msalS 3564 . 2 f 147_COHl 
msal83564 . 2 { 147 J4732 
msal83S64.2{147_M781 'i 
msal83564. 2(147 2603 
msal83564 . 2 { 14 7_JM9 130013 
msal83564.2(l47_18RS21 
msal83564.2{l47_090 
msal 83 564 .2{147_CJB110 
msal83564.2(l47_A909 ) 
msal83564.2(147_H36B f 
msal83S64 . 2 { 147_1169NT \ 
Consensus 



ms al8 3564 .2(14 7_C0H1[ 
msal83564 .2 147_M732 
msalB3564.2 147J4781 
msal83564.2 147_2603 
msal 8 3 564. 2 { 14 7_JM9 13 0013 
msal83564 . 2 ( 147_18RS21 ' 
msal83564.2{l47 090' 
msal83564 . 2 { 147_CJB110 
msalS 3 5 64 . 2 f 14 7_A9 0 9 
msal63564.2{l47_H36B 
msal83 564 . 2 ( 147_1169NT; 

Consensus 



msal83S64 . 2 { 147_COHl 
msal83564.2 147 M732 
msal83564.2 147~M781 
msal83564 . 2( 147_2603 
msal83564.2{l47 JM9130013 
' msal83564.2{!47 18RS21 



GACAACCAAC AATAAaGAAA GCAATGTAGT AACAAATGCT TCAACTGCAA 
GACAACCAAC AATAAaGAAA GCAATGTAGT AACAAATGCT TCAACTGCAA 
GACAACCAAC AATAAaGAAA GCAATGTAGT AACAAATGCT TCAACTGCAA 
GACAACCAAC AATAAgGAAA GCAATGTAGT AACAAATGCT TCAACTGCAA 



401 450 
TAGCACAGAA AGTTCCCTCA GCaTATGAAG AGGTGAAGtC AgAAAGCAAG 
TAGCACAGAA AGTTCCCTCA GCaTATGAAG AGGTGAAGtC AgAAAGCAAG 
TAGCACAGAA AGTTCCCTCA GCaTATGAAG AGGTGAAGtC AgAAAGCAAG 
TAGCACAGAA AGTTCCCTCA GCaTATGAAG AGGTGAAGcC AgAAAGCAAG 
TAGCACAGAA AGTTCCCTCA GCaTATGAAG AGGTGAAGcC AgAAAGCAAG 
TAGCACAGAA AGTTCCCTCA GCaTATGAAG AGGTGAAGcC AgAAAGCAAG 
TAGCACAGAA AGTTCCCTCA GCgTATGAAG AGGTGAAGcC AgAAAGCAAG 
TAGCACAGAA AGTTCCCTCA GCgTATGAAG AGGTGAAGcC AgAAAGCAAG 
TAGCACAGAA AGTTCCCTCA GCaTATGAAG AGGTGAAGcC AgAAAGCAAG 
TAGCACAGAA AGTTCCCTCA GCaTATGAAG AGGTGAAGcC AgAAAGCAAG 
TAGCACAGAA AGTTCCCTCA GCaTATGAAG AGGTGAAGcC AaAAAGCAAG 



451 500 
TCATCgCTTG CTGTTcTTGA TACATCTAAA ATAACAAAAT TaCAAGCCAc 
TCATCgCTTG CTGTTcTTGA TACATCTAAA ATAACAAAAT TaCAAGCCAc 
TCATCgCTTG CTGTTcTTGA TACATCTAAA ATAACAAAAT TaCAAGCCAc 
TCATCgCTTG CTGTTcTTGA TACATCTAAA ATAACAAAAT TaCAAGCCAt 
TCATCgCTTG CTGTTcTTGA TACATCTAAA ATAACAAAAT TaCAAGCCAt 
TCATCgCTTG CTGTTcTTGA TACATCTAAA ATAACAAAAT TaCAAGCCAt 
TCATCgCTTG CTGTTtTTGA TACATCTAAA ATAACAAAAT TgCAAGCCAt 
TCATCgCTTG CTGTTtTTGA TACATCTAAA ATAACAAAAT TgCAAGCCAt 
TCATCaCTTG CTGTTcTTGA TACATCTAAA ATAACAAAAT TgCAAGCCAt 
TCATCaCTTG CTGTTcTTGA TACATCTAAA ATAACAAAAT TgCAAGCCAt 
TCATCgCTTG CTGTTcTTGA TACATCTAAA ATAACAAAAT TgCAAGCCAt 
*****_**** *****.**** ********** ********** *_*******_ 



501 550 
AACCCAAAGA GGAAAGGGAA ATGTAGTAGC TATTATTGAT ACTGGCTTTG 
AACCCAAAGA GGAAAGGGAA ATGTAGTAGC TATTATTGAT ACTGGCTTTG 
AACCCAAAGA GGAAAGGGAA ATGTAGTAGC TATTATTGAT ACTGG CTTT G 
AACCCAAAGA GGAAAGGGAA ATGTAGTAGC TATTATTGAT ACTGGCTTTG 
AACCCAAAGA GGAAAGGGAA ATGTAGTAGC TATTATTGAT ACTGGCTTTG 
AACCCAAAGA GGAAAGGGAA ATGTAGTAGC TATTATTGAT ACTGGCTTTG 
AACCCAAAGA GGAAAGGGAA ATGTAGTAGC TATTATTGAT ACTGG CTTT G 
AACCCAAAGA GGAAAGGGAA ATGTAGTAGC TATTATTGAT ACTGGCTTTG 
AACCCAAAGA GGAAAGGGAA ATGTAGTAGC TATTATTGAT ACTGGCTTTG 
AACCCAAAGA GGAAAGGGAA ATGTAGTAGC TATTATTGAT ACTGGCTTTG 
AACCCAAAGA GGAAAGGGAA ATGTAGTAGC TATTATTGAT ACTGGCTTTG 



551 600 
ATATTAACCA TGATATTTTT CGTTTAGATA GCCCAAAAGA TGATAAGCAC 
ATATTAACCA TGATATTTTT CGTTTAGATA GCCCAAAAGA TGATAAGCAC 
ATATTAACCA TGATATTTTT CGTTTAGATA GCCCAAAAGA TGATAAGCAC 
ATATTAACCA TGATA TTTTT CGTTTAGATA GCCCAAAAGA TGATAAGCAC 
ATATTAACCA TGATATTTTT CGTTTAGATA GCCCAAAAGA TGATAAGCAC 
ATATTAACCA TGAT ATTTT T CGTTTA GATA GCCCAAAAGA TGATAAGCAC 
ATATTAACCA TGATATTTTT CGTTTAGATA GCCCAAAAGA TGATAAGCAC 
ATATTAACCA TGATATTTTT CGTTTAGATA GCCCAAAAGA TGATAAGCAC 
ATATTAACCA TGATATTTTT CGTTTAGATA GCCCAAAAGA TGATAAGCAC 
ATATTAACCA TGATATTTTT CGTTTAGATA GCCCAAAAGA TGATAAGCAC 
ATATTAACCA TGATATTTTT CGTTTAGATA GCCCAAAAGA TGATAAGCAC 



601 650 
AGCTTTAAAA cTAAggCAGA ATTtGAGGAA TTAAAAGCAA AACATAATAT 
AGCTTTAAAA CTAAggCAGA ATTtGAGGAA TTAAAAGCAA AACATAATAT 
AGCTTTAAAA CTAAggCAGA ATTtGAGGAA TTAAAAGCAA AACATAATAT 
AGCTTTAAAA cTAAgaCAGA ATTtGAGGAA TTAAAAGCAA AACATAATAT 
AGCTTTAAAA CTAAgaCAGA ATTtGAGGAA TTAAAAGCAA AACATAATAT 
AGCTTTAAAA CTAAgaCAGA ATTtGAGGAA TTAAAAGCAA AACATAATAT 
AGCTTTAAAA cTAAagCAGA ATTcGAGGAA TTAAAAGCAA AACATAATAT 
AGCTTTAAAA CTAAagCAGA ATTcGAGGAA TTAAAAGCAA AACATAATAT 
AGCTTTAAAA CTAAggCAGA ATTtGAGGAA TTAAAAGCAA AACATAATAT 
AGCTTTAAAA CTAAggCAGA ATTtGAGGAA TTAAAAGCAA AACATAATAT 
AGCTTTAAAA aTAAggCAGA ATTcGAGGAA TTAAAAGCAA AACATAATAT 



651 700 
CACTTATGGG AAATGGGTTA ACGATAAGAT TGTTTTTGCA CATAACTACG 
CACTTATGGG AAATGGGTTA ACGATAAGAT TGTTTTTGCA CATAACTACG 
CACTTATGGG AAATGGGTTA ACGATAAGAT TGTTTTTGCA CATAACTACG 
CACTTATGGG AAATGGGTTA ACGATAAGAT TGTTTTTGCA CATAACTACG 
CACTTATGGG AAATGGGTTA ACGATAAGAT T GTTTTTG CA CATAACTACG 
CACTTATGGG AAATGGGTTA ACGATAAGAT TGTTTTTGCA CATAACTACG 



774 
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Table 44: Comparative Sequences relating to SAG0416 (strain info highlighted in BOLD) 



msal83564.2{l47 090) 
msal83564 . 2 { 147_CJB110 J 
msal83564.2{l47 A909) 
msal83S64 ,2{1472h36BJ 
msalB3S64.2(l47_1169NT} 
Consensus 



msal83564.2(l47 CX>H1; 
msal 8 3 564 . 2 Jl47_M732 
msal83564 .2(147_M781 
msal83S64 . 2 { 147~2603 ( 
msal83564 .2(147 JM9130013 
msal83 564 . 2 (l47_18RS21 
msal83 564, 2 { 147_090 
msal83564.2(l47_C0B110 - 
msal83564.2(l47 A909 - 
msal 8 3 5 64 . 2 { 14 7_H3 6B 
msal83564.2(l47_1169NT \ 
Consensus 



msal83564.2ll47 COH1 
msal83564 . 2 ( 147~M732 
insaX83564 . 2 ( 147~M781 \ 
msal83564.2{147 2603 I 
msal83S64.2{l47 JM9130013 
rasalB3564.2{T47_18RS21 \- 
msal83564. 2 { 147_090 \ 
msal83564 . 2 { 147_CJB110 
msal83564.2(l47 A909 i 
msal83564.2{147 H36B/ 
rasal83 564 . 2 { 147JL169NT 
Consensus 



msal83564 . 2 ( 147_COHl 
msal83564.2(147 M732 
tnsal83564. 2(147 M781 
msal 83 564. 2 (147~2603 f 
msal83564 .2(147 JM9130013 
msalB3564.2(l47 18RS21 
msal83564.2{147 090 
msaia 3 564 . 2 ( 14 7_CJB110 
msal 83 564. 2 (147 A909 
msal 83564 . 2 { 147^H3 6B i 
msal83564.2(l47_1169NT \ 
Consensus 



msal83564.2(l47 COH1 
msal83564.2/l47 M732 
msal83564.2<147 M781 
msal83564 . 2 ( 147^2 603 \ 
msal83564.2{!47 JM9130013 \ 
msal83 564 . 2 (147_18RS2 1 
msal83564 . 2 ( 147_090 
msal83564.2(l47 CJB110 
msal83564.2(l47 A909 
msal83564.2(147^H36B \ 
msal83S64.2(l47_1169NT 
Consensus 



msal 8 3564 .2(14 7 jCOHl 
msal83564.2{l47_M732 
maal83564.2(147_M781 
msal83564 . 2 ( 14 7_2603 
msal83564. 2(147 JM9130013 
msal83564. 2(147 18RS21 

msal 6 3564.2(14 7 090 ■ 
msal83564.2(l47_CJB110 
msal83564.2(l47__A909 
msal83 564 . 2 { 147_H36B \ 
rasal83564.2(l47 - 1169NT f 
Consensus 



msal83564.2(l47 COH1 
msal83564.2(147 M732 
msal83S64.2(147 M781 
msal83564 . 2 ( 147_2603 
rasal83564. 2(147 JM9130013 



CACTTATGGG AAATGGGTTA ACGATAAGAT TGTTTTTGCA CATAACTACG 
CACTTATGGG AAATGGGTTA ACGATAAGAT TGTTTTTGCA CATAACTACG 
CACTTATGGG AAATGGGTTA ACGATAAGAT TGTTTTTGCA CATAACTACG 
CACTTATGGG AAATGGGTTA ACGATAAGAT TGTTTTTGCA CATAACTACG 
CACTTATGGG AAATGGGTTA ACGATAAGAT TGTTTTTGCA CATAACTACG 



701 750 
CCAACAATAC AGAAACGGTG GCTGATATTG CAGCAGCTAT GAAAGATGGT 
CCAACAATAC AGAAACGGTG GCTGATATTG CAGCAGCTAT GAAAGATGGT 
CCAACAATAC AGAAACGGTG GCTGATATTG CAGCAGCTAT GAAAGATGGT 
CCAACAATAC AGAAACGGTG GCTGATATTG CAGCAGCTAT GAAAGATGGT 
CCAACAATAC AGAAACGGTG GCTGATATTG CAGCAGCTAT GAAAGATGGT 
CCAACAATAC AGAAACGGTG GCTGATATTG CAGCAGCTAT GAAAGATGGT 
CCAACAATAC AGAAACGGTG GCTGATATTG CAGCAGCTAT GAAAGATGGT 
CCAACAATAC AGAAACGGTG GCTGATATTG CAGCAGCTAT GAAAGATGGT 
CCAACAATAC AGAAACGGTG GCTGATATTG CAGCAGCTAT GAAAGATGGT 
CCAACAATAC AGAAACGGTG GCTGATATTG CAGCAGCTAT GAAAGATGGT 
CCAACAATAC AGAAACGGTG GCTGATATTG CAGCAGCTAT GAAAGATGGT 

) 

751 800 
TATGGgTCAG AAGCAAAGAA TATTTtGCAT GGTACACACG TTGCTGGTAT 
TATGGgTCAG AAGCAAAGAA TATTTtGCAT GGTACACACG TTGCTGGTAT 
TATGGgTCAG AAGCAAAGAA TATTTtGCAT GGTACACACG TTGCTGGTAT 
TATGGtTCAG AAGCAAAGAA TATTTcGCAT GGTACACACG TTGCTGGTAT 
TATGGtTCAG AAGCAAAGAA TATTTcGCAT GGTACACACG TTGCTGGTAT 
TATGGtTCAG AAGCAAAGAA TATTTcGCAT GGTACACACG TTGCTGGTAT 
TATGGgTCAG AAGCAAAGAA TATTTcGCAT GGTACACACG TTGCTGGTAT 
TATGGgTCAG AAGCAAAGAA TATTTcGCAT GGTACACACG TTGCTGGTAT 
TATGGgTCAG AAGCAAAGAA TATTTcGCAT GGTACACACG TTGCTGGTAT, 
TATGGgTCAG AAGCAAAGAA TATTTcGCAT GGTACACACG TTGCTGGTAT 
TATGGtTCAG AAGCAAAGAA TATTTcGCAT GGTACACACG TTGCTGGTAT 



801 850 
TTTTGTAGGT AATAGTAAAC GTCCAGCAAT CAATaGTCTT CTTTTAGAAG 
TTTTGTAGGT AATAGTAAAC GTCCAGCAAT CAATaGTCTT CTTTTAGAAG 
TTTTGTAGGT AATAGTAAAC GTCCAGCAAT CAATaGTCTT CTTTTAGAAG 
TTTTGTAGGT AATAGTAAAC GTCCAGCAAT CAATgGTCTT CTTTTAGAAG 
TTTTGTAGGT AATAGTAAAC GTCCAGCAAT CAATgGTCTT CTTTTAGAAG 
TTTTGTAGGT AATAGTAAAC GTCCAGCAAT CAATgGTCTT CTTTTAGAAG 
TTTTGTAGGT AATAGTAAAC GTCCAGCAAT CAATgGTCTT CTTTTAGAAG 
TTTTGTAGGT AATAGTAAAC GTCCAGCAAT CAATgGTCTT CTTTTAGAAG 
TTTTGTAGGT AATAGTAAAC GTCCAGCAAT CAATgGTCTT CTTTTAGAAG 
TTTTGTAGGT AATAGTAAAC GTCCAGCAAT CAATgGTCTT CTTTTAGAAG 
TTTTGTAGGT AATAGTAAAC GTCCAGCAAT CAATgGTCTT CTTTTAGAAG 



851 900 
GTGCAGCGCC AAATGCTCAA GTCTTATTAA TGCGTATTCC AGATAAAATT 
GTGCAGCGCC AAATGCTCAA GTCTTATTAA TGCGTATTCC AGATAAAATT 
GTGCAGCGCC AAATGCTCAA GTCTTATTAA TGCGTATTCC AGATAAAATT 
GTGCAGCGCC AAATGCTCAA GTCTTATTAA TGCGTATTCC AGATAAAATT 
GTGCAGCGCC AAATGCTCAA GTCTTATTAA TGCGTATTCC AGATAAAATT 
GTGCAGCGCC AAATGCTCAA GTCTTATTAA TGCGTATTCC AGATAAAATT 
GTGCAGCGCC AAATGCTCAA GTCTTATTAA TGCGTATTCC AGATAAAATT 
GTGCAGCGCC AAATGCTCAA GTCTTATTAA TGCGTATTCC AGATAAAATT 
GTGCAGCGCC AAATGCTCAA GTCTTATTAA TGCGTATTCC AGATAAAATT 
GTGCAGCGCC AAATGCTCAA GTCTTATTAA TGCGTATTCC AGATAAAATT 
GTGCAGCGCC AAATGCTCAA GTCTTATTAA TGCGTATTCC AGATAAAATT 



901 950 
GATTCGGACA AATTTGGaGA AGCATATGCT AAAGCAATCA tAGACGCTGT 
GATTCGGACA AATTTGGaGA AGCATATGCT AAAGCAATCA tAGACGCTGT 
GATTCGGACA AATTTGGaGA AGCATATGCT AAAGCAATCA tAGACGCTGT 
GATTCGGACA AATTTGGtGA AGCATATGCT AAAGCAATCA cAGACGCTGT 
GATTCGGACA AATTTGGtGA AGCATATGCT AAAGCAATCA cAGACGCTGT 
GATTCGGACA AATTTGGtGA AGCATATGCT AAAGCAATCA cAGACGCTGT 
GATTCGGACA AATTTGGaGA AGCATATGCT AAAGCAATCA cAGACGCTGT 
GATTCGGACA AATTTGGaGA AGCATATGCT AAAGCAATCA cAGACGCTGT 
GATTCGGACA AATTTGGtGA AGCATATGCT AAAGCAATCA cAGACGCTGT 
GATTCGGACA AATTTGGtGA AGCATATGCT AAAGCAATCA cAGACGCTGT 
GATTCGGACA AATTTGGaGA AGCATATGCT AAAGCAATCA cAGACGCTGT 



951 1000 

TAATCTAGGA GCaAAAACGA TTAATATGAG ccTgGGAAAA ACgGCtGATT 

TAATCTAGGA GCaAAAACGA TTAATATGAG CcTgGGAAAA ACgGCtGATT 

TAATCTAGGA GCaAAAACGA TTAATATGAG ccTgGGAAAA ACgGCtGATT 

TAATCTAGGA GCaAAAACGA TTAATATGAG taTtGGAAAA ACaGCtGATT 

TAATCTAGGA GCaAAAACGA TTAATATGAG taTtGGAAAA ACaGCtGATT 
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Table 44: Comparative Sequences relating to SAG0416 (strain info highlighted in BOLD) 



msal83564.2{l47 18RS21/ 
msal83564 .2{l47_090 
msal83564 . 2 { 147_CJB110 
maal83564. 2(147 A909 
msal83564 . 2{ 147 J*36B 
msal83564 . 2 { 147_1169NT 
Consensus 



msal83564 . 2 ( 147_C0H1 
msal83564. 2(147 M732, 
msal83564.2{147_M781 
msal83564 . 2 { 147_2603 
msal83564 . 2 { 147_JM9130013 
msal83564 . 2 {147_18RS21 
msal83564.2{l47_090 
msal83564 . 2 { 147_CJB110 
msal83 564 . 2 ( 147_A909 
msalS 3 564 . 2 { 147_H3€B 
msal83564.2{l47_1169NT 
Consensus 



TAATCTAGGA 
TAATCTAGGA 
TAATCTAGGA 
TAATCTAGGA 
TAATCTAGGA 
TAATCTAGGA 



GCaAAAACGA 
GCaAAAACGA 
GCaAAAACGA 
GCaAAAACGA 
GCaAAAACGA 
GCtAAAACGA 



TTAATATGAG 
TTAATATGAG 
TTAATATGAG 
TTAATATGAG 
TTAATATGAG 
TTAATATGAG 



taTtGGAAAA 
ccTtGGAAAA 
CCTtGGAAAA 
CcTtGGAAAA 
CCTtGGAAAA 
taTtGGAAAA 



ACaGCtGATT 
ACaGCaGATT 
ACaGCaGATT 
ACaGCaGATT 
ACaGCaGATT 
ACaGCtGATT 



1001 

CTTTAATTGC 
CTTTAATTGC 
CTTTAATTGC 
CTTTAATTGC 
CTTTAATTGC 
CTTTAATTGC 
CTTTAATTGC 
CTTTAATTGC 
CTTTAATTGC 
CTTTAATTGC 
CTTTAATTGC 



tCTCAATGAT 
tCTCAATGAT 
tCTCAATGAT 
tCTCAATGAT 
tCTCAATGAT 
tCTCAATGAT 
aCTCAATGAT 
aCTCAATGAT 
tCTCAATGAT 
tCTCAATGAT 
tCTCAATGAT 



AAAGTTAAAT 
AAAGTTAAAT 
AAAGTTAAAT 
AAAGTTAAAT 
AAAGTTAAAT 
AAAGTTAAAT 
AAAGTTAAAT 
AAAGTTAAAT 
AAAGTTAAAT 
AAAGTTAAAT 
AAAGTTAAAT 



TAGCACTTAA 
TAGCACTTAA 
TAGCACTTAA 
TAGCACTTAA 
TAGCACTTAA 
TAGCACTTAA 
TAGCACTTAA 
TAGCACTTAA 
TAGCACTTAA 
TAGCACTTAA 
TAGCACTTAA 



1050 
ATTAGCTTCT 
ATTAGCTTCT 
ATTAGCTTCT 
ATTAGCTTCT 
ATTAGCTTCT 
ATTAGCTTCT 
ATTAGCTTCT 
ATTAGCTTCT 
ATTAGCTTCT 
ATTAGCTTCT 
ATTAGCTTCT 



1051 

msal83564.2(l47_COHl) GAGAAGGGCG 

msal83564.2(147_M732' GAGAAGGGCG 

msal83564.2(147 M781 GAGAAGGGCG 

msal83S64.2{147_2603 GAGAAGGGCG 

msal83564.2{l47_JM9130013 GAGAAGGGCG 

msal83564.2{l47_18RS21 GAGAAGGGCG 

msal83564.2{l47 090 GAGAAGGGCG 

msal83564 . 2 { 147_CJB110 GAGAAGGGCG 

msal83564.2(l47_A909 GAGAAGGGCG 

msal83564 ,2{147_H36B ■ GAGAAGGGCG 

msal83564 . 2 { 147_1169NT} GAGAAGGGCG 

Consensus ********** 



TTGCAGTTGT 
TTGCAGTTGT 
TTGCAGTTGT 
TTGCAGTTGT 
TTGCAGTTGT 
TTGCAGTTGT 
TTGCAGTTGT 
TTGCAGTTGT 
TTGCAGTTGT 
TTGCAGTTGT 
TTGCAGTTGT 



TGTGGCTGCC 
TGTGGCTGCC 
TGTGGCTGCC 
TGTGGCTGCC 
TGTGGCTGCC 
TGTGGCTGCC 
TGTGGCTGCC 
TGTGGCTGCC 
TGTGGCTGCC 
TGTGGCTGCC 
TGTGGCTGCC 



GGAAATGAAG 
GGAAATGAAG 
GGAAATGAAG 
GGAAATGAAG 
GGAAATGAAG 
GGAAATGAAG 
GGAAATGAAG 
GGAAATGAAG 
GGAAATGAAG 
GGAAATGAAG 
GGAAATGAAG 



110 0 
GtGCATTTGG 
GtGCATTTGG 
GtGCATTTGG 
GcGGATTTGG 
GcGCATTTGG 
GcGCATTTGG 
GtGCATTTGG 
GtGCATTTGG 
GtGCATTTGG 
GtGCATTTGG 
GcGCATTTGG 



msal83564 . 2 ( 147_C0H1^ 
msal83564.2(147_M732 
msal63564.2(147_M78l] 
msal83564 . 2{ 147_2603 
msal83564.2{l47 JM9130013, 
msal83564 . 2 (147_18RS21 
msal83564.2{l47 090 
msal83564 . 2 { 147_CJB110 
msal83564 . 2( 147_A909 
msal83564 .2{147_H36B 
msal83S64.2{l47_1169NT 
Consensus 



msal83564 . 2 ( 147_COHl \ 
msa!83564 . 2 { 147_M732 
msal83564 . 2 ( X47_M78 1 
msal83564 . 2 { 147_2603 
msal83564 .2(147 JM9130013 
msal83564 . 2 {147_1BRS21 
msal83564 . 2 { 147_090 
msal83 564 . 2 { 147_CJB110 
msal83564 . 2 f 147_A909 
msal83564 . 2 { 147_H36B 
msal83564 .2{147_1169NT 
Consensus 



msal83564 . 2 147_C0H1 
msal83564 . 2 { 147 _M732 
msa!83564.2 147_M781 
msal83564.2{147 2603 
msal83564 . 2 { 147_JM9 130013 
msal83564 . 2 { 147_18RS2 1 
msal83564.2{l47_090 
msal83564 .2{147_CJB110 
msal83564 . 2 ( 147_A909 
msal83564 .2(147_H36B 
tnsal83564.2{l47_1169NT 
Consensus 



1101 

TATGGATTAT 
TATGGATTAT 
TATGGATTAT 
TATGGATTAT 
TATGGATTAT 
TATGGATTAT 
TATGGATTAT 
TATGGATTAT 
TATGGATTAT 
TATGGATTAT 
TATGGATTAT 



AGCAAACCaT 
AGCAAACCaT 
AGCAAACCaT 
AGCAAACCaT 
AGCAAACCaT 
AGCAAACCaT 
AGCAAACCaT 
AGCAAACCaT 
AGCAAACCaT 
AGCAAACCaT 
AGCAAACCgT 



TATCAACTAA 
TATCAACTAA 
TATCAACTAA 
TATCAACTAA 
TATCAACTAA 
TATCAACTAA 
TATCAACTAA 
TATCAACTAA 
TATCAACTAA 
TATCAACTAA 
TATCAACTAA 



TCCTGACTAC 
TCCTGACTAC 
TCCTGACTAC 
TCCTGACTAC 
TCCTGACTAC 
TCCTGACTAC 
TCCTGACTAC 
TCCTGACTAC 
TCCTGACTAC 
TCCTGACTAC 
TCCTGACTAC 



1150 
GGTACGGTTA 
GGTACGGTTA 
GGTACGGTTA 
GGTACGGTTA 
GGTACGGTTA 
GGTACGGTTA 
GGTACGGTTA 
GGTACGGTTA 
GGTACGGTTA 
GGTACGGTTA 
GGTACGGTTA 



1151 

ATAGTCCAGC 
ATAGTCCAGC 
ATAGTCCAGC 
ATAGTCCAGC 
ATAGTCCAGC 
ATAGTCCAGC 
ATAGTCCAGC 
ATAGTCCAGC 
ATAGTCCAGC 
ATAGTCCAGC 
ATAGTCCAGC 



TATTTCTGAA 
TATTTCTGAA 
TATTTCTGAA 
TATTTCTGAA 
TATTTCTGAA 
TATTTCTGAA 
TATTTCTGAA 
TATTTCTGAA 
TATTTCTGAA 
TATTTCTGAA 
TATTTCTGAA 



GATACTTTGA 
GATACTTTGA 
GATACTTTGA 
GATACTTTGA 
GATACTTTGA 
GATACTTTGA 
GATACTTTGA 
GATACTTTGA 
GATACTTTGA 
GATACTTTGA 
GATACTTTGA 



GTGTTG CTAG 
GTGTTGCTAG 
GTGTTGCTAG 
GTGTTGCTAG 
GTGTTGCTAG 
GTGTTGCTAG 
GTGTTGCTAG 
GTGTTGCTAG 
GTGTTGCTAG 
GTGTTGCTAG 
GTGTTGCTAG 



1200 
CTATGAATCA 
CTATGAATCA 
CTATGAATCA 
CTATGAATCA 
CTATGAATCA 
CTATGAATCA 
CTATGAATCA 
CTATGAATCA 
CTATGAATCA 
CTATGAATCA 
CTATGAATCA 



1201 

CTTAAAACTA 
CTTAAAACTA 
CTTAAAACTA 
CTTAAAACTA 
CTTAAAACTA 
CTTAAAACTA 
CTTAAAACTA 
CTTAAAACTA 
CTTAAAACTA 
CTTAAAACTA 
CTTAAAACTA 



TCAGTGAGGT 
TCAGTGAGGT 
TCAGTGAGGT 
TCAGTGAGGT 
TCAGTGAGGT 
TCAGTGAGGT 
TCAGTGAGGT 
TCAGTGAGGT 
TCAGTGAGGT 
TCAGTGAGGT 
TCAGTGAGGT 



CGTTGAAACA 
CGTTGAAACA 
CGTTGAAACA 
CGTTGAAACA 
CGTTGAAACA 
CGTTGAAACA 
CGTTGAAACA 
CGTTGAAACA 
CGTTGAAACA 
CGTTGAAACA 
CGTTGAAACA 



ACTATTGAAG 
ACTATTGAAG 
ACTATTGAAG 
ACTATTGAAG 
ACTATTGAAG 
ACTATTGAAG 
ACTATTGAAG 
ACTATTGAAG 
ACTATTGAAG 
ACTATTGAAG 
ACTATTGAAG 



1250 
GTAAGTTAGT 
GTAAGTTAGT 
GTAAGTTAGT 
GTAAGTTAGT 
GTAAGTTAGT 
GTAAGTTAGT 
GTAAGTTAGT 
GTAAGTTAGT 
GTAAGTTAGT 
GTAAGTTAGT 
GTAAGTTAGT 



msal83564 . 2{147_C0H1 
tnsalB3564.2(147_M732 
msal83564 . 2 ( 147_M781 
m9al83564 . 2{147_2603 



1251 1300 
TAAGTTGCCG ATTGTGACTT CTAAACCTTT TGACAAAGGT AAGGCCTACG 
TAAGTTGCCG ATTGTGACTT CTAAAC CTTT TGACAAAGGT AAGGCCTACG 
TAAGTTGCCG ATTGTGACTT CTAAACCTTT TGACAAAGGT AAGGCCTACG 
TAAGTTGCCG ATTGTGACTT CTAAACCTTT TGACAAAGGT AAGGCCTACG 



776 



WO 2004/018646 



PCT/US2003/026827 



Table 44: Comparative Sequences relating to SAG0416 (strain info highlighted in BOLD) 



msalB3564 .2(147 JM9130013 
msal83564.2(T47 18RS21 
msal83564.2(l47 090 
msal83564.2{l47 CJB110 
msal83S64 . 2( 147_A909 
msal83564 . 2 { 147_H36B 
msa!83564 . 2 { 147_1169NT 
Consensus 



TAAGTTGCCG 
TAAGTTGCCG 
TAAGTTGCCG 
TAAGTTGCCG 
TAAGTTGCCG 
TAAGTTGCCG 
TAAGTTGCCG 



ATTGTGACTT 
ATTGTGACTT 
ATTGTGACTT 
ATTGTGACTT 
ATTGTGACTT 
ATTGTGACTT 
ATTGTGACTT 



CTAAAC CTTT 
CTAAACCTTT 
CTAAAC CTTT 
CTAAACCTTT 
CTAAACCTTT 
CTAAACCTTT 
CTAAACCTTT 



TGACAAAGGT 
TGACAAAGGT 
TGACAAAGGT 
TGACAAAGGT 
TGACAAAGGT 
TGACAAAGGT 
TGACAAAGGT 



AAGGCCTACG 
AAGGCCTACG 
AAGGCCTACG 
AAGGCCTACG 
AAGGCCTACG 
AAGGCCTACG 
AAGGCCTACG 



msal 8 3 5 64 . 2 { 14 7_COHl 
msal83564.2{l47_M732 
msalS 3564 . 2 { 147 _M78 1 
msal83S64 . 2 { 147J2603 
tnsal83S64.2{l47_JM9130013 
msal83564 . 2 { 147_18RS21 
msal83SS4.2{l47 090 
msal83564.2(l47 CJB110 
msal83564 . 2 { 147_A909 
msal83S64 . 2 ( 147JJ36B 
msal 83 5 64 . 2 { 147_1169NT 
Consensus 



1301 

ATGTGGTTTA 
ATGTGGTTTA 
ATGTGGTTTA 
ATGTGGTTTA 
ATGTGGTTTA 
ATGTGGTTTA 
ATGTGGTTTA 
ATGTGGTTTA 
ATGTGGTTTA 
ATGTGGTTTA 
ATGTGGTTTA 



TGCCAATTAT 
TGCCAATTAT 
TGCCAATTAT 
TGCCAATTAT 
TGCCAATTAT 
TGCCAATTAT 
TGCCAATTAT 
TGCCAATTAT 
TGCCAATTAT 
TGCCAATTAT 
TGCCAATTAT 



GGTGC. .AAA 
GGTGC .AAA 
GGTGC. .AAA 
GGTGC. aAAA 
GGTGC. aAAA 
GGTGC. aAAA 
GGTGC. 8AAA 
GGTGC. aAAA 
GGTGCaaAAA 
GGTGC. aAAA 
GGTGC. aAAA 



AAAGAtTTTG 
AAAGAtTTTG 
AAAGAtTTTG 
AAAGAcTTTG 
AAAGAcTTTG 
AAAGAcTTTG 
AAAGAcTTTG 
AAAGAcTTTG 
AAAGAcTTTG 
AAAGA cTTT G 
AAAGAcTTTG 



13S0 
AAGGTAAGGA 
AAGGTAAGGA 
AAGGTAAGGA 
AAGGTAAGGA 
AAGGTAAGGA 
AAGGTAAGGA 
AAGGTAAGGA 
AAGGTAAGGA 
AAGGTAAGGA 
AAGGTAAGGA 
AAGGTAAGGA 



msal 83 564 . 2 f 147_COHl 
tnsal83S64 . 2 < 147_M732 
msal83564 . 2 { 147_M781 
msal83S64 . 2{ 147_2603 
msal83 564 . 2 { 147_JM9130 013 
msal83564.2(l47 1BRS21 
msal83564.2{l47 090 
* msal 83 564. 2 {14 7 CJB110 
msal83564 . 2 ( 147_A909 
msal 83564.2(14 7_H3 6B 
msal83564 . 2 { 147_1169NT 
Consensus 



1351 

CTTTAAAGGT 
CTTTAAAGGT 
CTTTAAAGGT 
CTTTAAAGGT 
CTTTAAAGGT 
CTTTAAAGGT 
CTTTAAAGGT 
CTTTAAAGGT 
CTTTAAAGGT 
CTTTAAAGGT 
CTTTAAAGGT 



AAGATTGCAT 
AAGATTGCAT 
AAGATTGCAT 
AAGATTGCAT 
AAGATTGCAT 
AAGATTGCAT 
AAGATTGCAT 
AAGATTGCAT 
AAGATTGCAT 
AAGATTGCAT 
AAGATTGCAT 



TAATTGAGCG 
TAATTGAGCG 
TAATTGAGCG 
TAATTGAGCG 
TAATTGAGCG 
TAATTGAGCG 
TAATTGAGCG 
TAATTGAGCG 
TAATTGAGCG 
TAATTGAGCG 
TAATTGAGCG 



TGGTGGTGGA 
TGGTGGTGGA 
TGGTGGTGGA 
TGGTGGTGGA 
TGGTGGTGGA 
TGGTGGTGGA 
TGGTGGTGGA 
TGGTGGTGGA 
TGGTGGTGGA 
TGGTGGTGGA 
TGGTGGTGGA 



140 0 
CTTGATTTTA 
CTTGATTTTA 
CTTGATTTTA 
CTTGATTTTA. 
CTTGATTTTA 
CTTGATTTTA 
CTTGATTTTA 
CTTGATTTTA 
CTTGATTTTA 
CTTGATTTTA 
CTTGATTTTA 



msalB 3564 . 2 ( 147_C0H1 
msal83564 . 2 f 147_M732 
msal 83 564 . 2 f 147_M781 ' 
msal83S64 . 2 { 147_2603 ' 
msal83564 .2 { 147_JM9130013 ' 
msal83564.2{l47 18RS21 
msal83564.2{l47 090' 
msal83564 . 2 { 147_CJB110 
msal83564 . 2 { 147_A909 
msal 8 3 564 . 2 { 14 7_H3 6B 
msal83564.2{l47_1169NT 
Consensus 



1401 

TGACTAAAAT 
TGACTAAAAT 
TGACTAAAAT 
TGACTAAAAT 
TGACTAAAAT 
TGACTAAAAT 
TGACTAAAAT 
TGACTAAAAT 
TGACTAAAAT 
TGACTAAAAT 
TGACTAAAAT 



CACTCATGCT 
CACTCATGCT 
CACTCATGCT 
CACTCATGCT 
CACTCATGCT 
CACTCATGCT 
CACTCATGCT 
CACTCATGCT 
CACTCATGCT 
CACTCATGCT 
CACTCATGCT 



ACAAATGCAG 
ACAAATGCAG 
ACAAATGCAG 
ACAAATGCAG 
ACAAATGCAG 
ACAAATGCAG 
ACAAATGCAG 
ACAAATGCAG 
ACAAATGCAG 
ACAAATGCAG 
ACAAATGCAG 



G TGTTGTTG G 
GTGTTGTTGG 
GTGTTGTTGG 
GTGTTGTTGG 




GTGTTGTTGG 



1450 
TATCGTTATT 
TATCGTTATT 
TATCGTTATT 
TATCGTTATT 
TATCGTTATT 
TATCGTTATT 
TATCGTTATT 
TATCGTTATT 
TATCGTTATT 
TATCGTTATT 
TATCGTTATT 



msal 83 564 . 2 { 147_COHl 
rasa!83564.2 147_M732 
rasal83564.2 147_M781 
msal83564.2{l47_2603 
msal83564. 2(147 JM9130013 
msal 83 5 64 . 2 {l47_18RS2 1 
msal83564.2{l47_090 
msal83564.2{l47_COB110 
msal83564 . 2 ( 147_A909 
msal83564 . 2 { 147_H36B 
msal83564 . 2 ( 147_1169NT 
Consensus 



1451 

TTTAACGATC 
TTTAACGATC 
TTTAACGATC 
TTTAACGATC 
TTTA ACGATC 
TTTAACGATC 
TTT AACGATC 
TTTAACGATC 
TTTAACGATC 
TTTA ACGATC 
TTTAACGATC 



AAGAAAAACG 
AAGAAAAACG 
AAGAAAAACG 
AAGAAAAACG 
AAGAAAAACG 
AAGAAAAACG 
AAGAAAAACG 
AAGAAAAACG 
AAGAAAAACG 
AAGAAAAACG 
AAGAAAAACG 



TGGAAATTTT 
TGGAAATTTT 
TGGAA ATTTT 
TGGAAATTTT 
TGGAAATTTT 
TGGAAATTTT 
TGGAAATTTT 
TGGAAATTTT 
TGGAAATTTT 
TGGAAATTTT 
TGGAAATTTT 



CTAATTCCTT 
CTAATTCCTT 
CTAATTCCTT 
CTAATTCCTT 
CTAATTCCTT 
CTAATTCCTT 
CTAATTCCTT 
CTAATTCCTT 
CTAATTCCTT 
CTAATTCCTT 
CTAATTCCTT 



1500 
ACCGTGAATT 
ACCGTGAATT 
ACCGTGAATT 
ACCGTGAATT 
ACCGTGAATT 
ACCGTGAATT 
ACCGTGAATT 
ACCGTGAATT 
ACCGTGAATT 
ACCGTGAATT 
ACCGTGAATT 



msal 8 3 564 . 2 ( 147_COHl 1 
msal83564 . 2 j 147_M732 
rasal83564.2(147J178l' 
msal83564 . 2( 147_2603 
msal 8 35 64. 2 (147 JM9130013 
msal83564.2{l47 18RS21 
msal 63564 .2(147 090 
msal83564.2{l47 CJB110 
msal 83564.2{147_A90 9 
msal83564.2(l47_H36B 
msal83564 . 2 {l47_1169NT 
Consensus 



1501 

ACCTGTGGGG 
ACCTGTGGGG 
ACCTGTGGGG 
ACCTGTGGGG 
ACCTGTGGGG 
ACCTGTGGGG 
ACCTGTGGGG 
ACCTGTGGGG 
ACCTGTGGGG 
ACCTGTGGGG 
ACCTGTGGGG 



gTTATTAGTA 
gTTATTAGTA 
gTTATTAGTA 
aTTATTAGTA 
aTTATTAGTA 
aTTATTAGTA 
gTTATTAGTA 
gTTATTAGTA 
gTTATTAGTA 
gTTATTAGTA 
gTTATTAGTA 



AAGTAGATGG 
AAGTAGATGG 
AAGTAGATGG 
AAGTAGATGG 
AAGTAGATGG 
AAGTAGATGG 
AAGTAGATGG 
AAGTAGATGG 
AAGTAGATGG 
AAGTAGATGG 
AAGTAGATGG 



CGAGCGTATA 
CGAGCGTATA 
CGAGCGTATA 
CGAGCGTATA 
CGAGCGTATA 
CGAGCGTATA 
CGAGCGTATA 
CGAGCGTATA 
CGAGCGTATA 
CGAGCGTATA 
CGAGCGTATA 



1550 
AAAAATACTT 
AAAAATACTT 
AAAAATACTT 
AAAAATACTT 
AAAAATACTT 
AAAAATACTT 
AAAAATACTT 
AAAAATACTT 
AAAAATACTT 
AAAAATACTT 
AAAAATACTT 



msal83564 . 2 { 147_COHl > 
tnsal83564. 2(147 M732) 
msal83564 . 2 ( 14 7^78 1 ) 



1551 1600 
CAAGTCAGTT AACATTTAAC CAGAGtTTTG AAGTAGTTGA TAGCCAAGGT 
CAAGTCAGTT AACATTTAAC CAGAGtTTTG AAGTAGTTGA TAGCCAAGGT 
CAAGTCAGTT AACATTTAAC CAGAGtTTTG AAGTAGTTGA TAGCCAAGGT 



777 



WO 2004/018646 



PCT7US2003/026827 



Table 44: Comparative Sequences relating to SAG0416 (strain info highlighted in BOLD) 



msal83564 
msal83564.2{l47 
msal83564.2{ 
msalB3564 
msal83564.2{ 
msal83564 
msal83564 
msal83564.2{ 



2{l47__2603 
JM9130013 
147_1BRS21 
.2{147_090 
147_CJB110 
2{l47_A909 
2{l47_H36B 
147_1169NT 
Consensus 



CAAGTCAGTT 
CAAGTCAGTT 
CAAGTCAGTT 
CAAGTCAGTT 
CAAGTCAGTT 
CAAGTCAGTT 
CAAGTCAGTT 
CAAGTCAGTT 



AACATTTAAC 
AACATTTAAC 
AACATTTAAC 
AACATTTAAC 
AACATTTAAC 
AACATTTAAC 
AACATTTAAC 
AACATTTAAC 



CAGAGtTTTG 
CAGAGtTTTG 
CAGAGtTTTG 
CAGAGtTTTG 
CAGAGtTTTG 
CAGAGtTTTG 
CAGAGt TTTG 
CAGAGaTTTG 



AAGTAGTTGA 
AAGTAGTTGA 
AAGTAGTTGA 
AAGTAGTTGA 
AAGTAGTTGA 
AAGTAGTTGA 
AAGTAGTTGA 
AAGTAGTTGA 



TAGCCAAGGT 
TAGCCAAGGT 
TAGCCAAGGT 
TAGCCAAGGT 
TAGCCAAGGT 
TAGCCAAGGT 
TAGCCAAGGT 
TAGCCAAGGT 



roaal83564 * 2 { 147_C0H1 
msal83S64 . 2 { 147_M732 
msal83564 . 2 f 147_M781 
msal83564 .2(147_2603 
msa!83S64 .2{l47_JM9130013 
msalB3564 . 2 { 147_18RS2 1 
msal83564.2{l47_090 
msal83564 .2 { 147_CJB110 
msal83564 .2{l47_A909 
msalB3564.2(147_H36B 
msal83564 . 2 { 147_1169NT 
Consensus 



1601 

GGcAATCGTA 
GGcAATCGTA 
GGcAATCGTA 
GGtAATCGTA 
GGtAATCGTA 
GGtAATCGTA 
GGcAATCGTA 
GGcAATCGTA 
GGcAATCGTA 
GGcAATCGTA 
GGcAATCGTA 



TGCTGGAACA 
TGCTGGAACA 
TGCTGGAACA 
TGCTGGAACA 
TGCTGGAACA 
TGCTGGAACA 
TGCTGGAACA 
TGCTGGAACA 
TGCTGGAACA 
TGCTGGAACA 
TGCTGGAACA 



ATCAAGTTGG 
ATCAAGTTGG 
ATCAAGTTGG 
ATCAAGTTGG 
ATCAAGTTGG 
ATCAAGTTGG 
ATCAAGTTGG 
ATCAAGTTGG 
ATCAAGTTGG 
ATCAAGTTGG 
ATCAAGTTGG 



GGCGTGACAG 
GGCGTGACAG 
GGCGTGACAG 
GGCGTGACAG 
GGCGTGACAG 
GGCGTGACAG 
GGCGTGACAG 
GGCGTGACAG 
GGCGTGACAG 
GGCGTGACAG 
GGCGTGACAG 



1650 
CTGAAGGAGC 
CTGAAGGAGC 
CTGAAGGAGC 
CTGAAGGAGC 
CTGAAGGAGC 
CTGAAGGAGC 
CTGAAGGAGC 
CTGAAGGAGC 
CTGAAGGAGC 
CTGAAGGAGC 
CTGAAGGAGC 



msal 83564 . 2 ( 147_C0H1 
msal83564 . 2 { 147_M732 
msal83564.2{l47_M781 
msal83564.2{147_2603 
msa!83564 . 2 { 147_JM9130013 
msa!83564 . 2 { 147_18RS21 
rasal83564.2(l47_090 
msal83564.2(l47_CJB110 
msal83564 . 2 { 147_A909 
msal83564 . 2 { 147_H36B 
msal83564.2{l47_1169NT 
Consensus 



1651 

AATCAAGCCT 
AATCAAGCCT 
AATCAAGCCT 
AATCAAGCCT 
AATCAAGCCT 
AATCAAGCCT 
AATCAAGCCT 
AATCAAGCCT 
AATCAAGCCT 
AATCAAGCCT 
AATCAAGCCT 



GATGTAACAG 
GATGTAACAG 
GATGTAACAG 
GATGTAACAG 
GATGTAACAG 
GATGTAACAG 
GATGTAACAG 
GATGTAACAG 
GATGTAACAG 
GATGTAACAG 
GATGTAACAG 



CTTCTGGCTT 
CTTCTGGCTT 
CTTCTGGCTT 
CTTCTGGCTT 
CTTCTGGCTT 
CTTCTGGCTT 
CTTCTGGCTT 
CTTCTGGCTT 
CTTCTGGCTT 
CTTCTGGCTT 
CTTCTGGCTT 



tGAAATTTAT 
tGAAATTTAT 
tGAAATTTAT 
tGAAATTTAT 
tGAAATTTAT 
tGAAATTTAT 
tGAAATTTAT 
tGAAATTTAT 
tGAAATTTAT 
tGAAATTTAT 
cGAAATTTAT 



1700 
TCTTCAACCT 
TCTTCAACCT 
TCTTCAACCT 
TCTTCAACCT 
TCTTCAACCT 
TCTTCAACCT 
TCTTCAACCT 
TCTTCAACCT 
TCTTCAACCT 
TCTTCAACCT 
TCTTCAACCT 



msal 8 35 64 . 2 f 147_C0H1 ' 
msal83564 . 2( 147_M732 ( 
maal83564 .2{l47_M781 
msal83564.2{147_2603 
msal83564.2{l47 JM9130013 
msal83564 . 2 { 147_1BRS21 
rasal83564 . 2 { 147_090 
msal83564 . 2 { 147_CJB110 
msal83564 . 2 f 147_A909 
msal83564 .2(147 H36B 
msal83564 .2{l47_1169NT 
Consensus 



1701 

ATAATAATCA 
ATAATAATCA 
ATAATAATCA 
ATAATAATCA 
ATAATAATCA 
ATAATAATCA 
ATAATAATCA 
ATAATAATCA 
ATAATAATCA 
ATAATAATCA 
ATAATAATCA 



ATACtAAACA 
ATACtAAACA 
ATACtAAACA 
ATACcAAACA 
ATACCAAACA 
ATACcAAACA 
ATACcAAACA 
ATACCAAACA 
ATACcAAACA 
ATACcAAACA 
ATACCAAACA 



ATGTCTGGTA 
ATGTCTGGTA 
ATGTCTGGTA 
ATGTCTGGTA 
ATGTCTGGTA 
ATGTCTGGTA 
ATGTCTGGTA 
ATGTCTGGTA 
ATGTCTGGTA 
ATGTCTGGTA 
ATGTCTGGTA 



CAAGTATGGC 
CAAGTATGGC 
CAAGTATGGC 
CAAGTATGGC 
CAAGTATGGC 
CAAGTATGGC 
CAAGTATGGC 
CAAGTATGGC 
CAAGTATGGC 
CAAGTATGGC 
CAAGTATGGC 



1750 
TTCACCACAT 
TTCACCACAT 
TTCACCACAT 
TTCACCACAT 
TTCACCACAT 
TTCACCACAT 
TTCACCACAT 
TTCACCACAT 
TTCACCACAT 
TTCACCACAT 
TTCACCACAT 



msal 8 35 64 . 2 { 147__COHl 1 
msal83564 . 2 { 147_M732 
rasal83564 . 2 { 147J4781 
msal83564.2{147__2603' 
msal83564 .2{l47_OM9130013 
msa!83564 .2(147 18RS21 
msal 83 564 .2{l47_090 
msal83564 . 2 { 147_CJB110 
msal 83564 .2(147_A909 
msal83564.2(147_H36B 
msal83564 . 2 { 147_1169NT 
Consensus 



1751 

GTTGCAGGAT 
GTTGCAGGAT 
GTTGCAGGAT 
GTTGCAGGAT 
GTTGCAGGAT 
GTTGCAGGAT 
GTTGCAGGAT 
GTTGCAGGAT 
GTTGCAGGAT 
GTTGCAGGAT 
GTTGCAGGAT 



TAATGACAAT 
TAATGACAAT 
TAATGACAAT 
TAATGACAAT 
TAATGACAAT 
TAATGACAAT 
TAATGACAAT 
TAATGACAAT 
TAATGACAAT 
TAATGACAAT 
TAATGACAAT 



GCTTCAAAgT 
GCTTCAAAgT 
GCTTCAAAgT 
GCTTCAAAgT 
GCTTCAAAgT 
GCTTCAAAgT 
GCTTCAAAgT 
GCTTCAAAaT 
GCTTCAAAgT 
GCTTCAAAgT 
GCTTCAAAgT 



CATTTGGCTG 
CATTTGGCTG 
CATTTGGCTG 
CATTTGGCTG 
CATTTGGCTG 
CATTTGGCTG 
CATTTGGCTG 
CATTTGGCTG 
CATTTGGCTG 
CATTTGGCTG 
CATTTGGCTG 



1600 
AGAAATATAA 
AGAAATATAA 
AGAAATATAA 
AGAAATATAA 
AGAAATATAA 
AGAAATATAA 
AGAAATATAA 
AGAAATATAA 
AGAAATATAA 
AGAAATATAA 
AGAAATATAA 



msal835 64 . 2 ( 147_C0H1 ! 
msal83564.2{l47_M732 
msal83564 . 2 ( 147_M781 
msal83564 . 2 { 147_2603 ' 
msalB3564.2{147_JM9130013 
msal83S64 . 2 { 147_18RS2 1 
msal83564 . 2 ( 147_090 
msal83564 . 2 ( 147_CJB110 
msal83564 . 2 { 147_A909 
msal83564 .2(147_H36B 
msal83564 .2(l47_1169NT \ 
Consensus 



1801 

AGGGATGAAT 
AGGGATGAAT 
AGGGATGAAT 
AGGGATGAAT 
AGGGATGAAT 
AGGGATGAAT 
AGGGATGAAT 
AGGGATGAAT 
AGGGATGAAT 
AGGGATGAAT 
AGGGATGAAT 



TTAGATTCTA 
TTAGATTCTA 
TTAGATTCTA 
TTAGATTCTA 
TTAGATTCTA 
TTAGATTCTA 
TTAGATTCTA 
TTAGATTCTA 
TTAGATTCTA 
TTAGATTCTA 
TTAGATTCTA 



AAAAATTGCT 
AAAAATTGCT 
AAAAATTGCT 
AAAAATTGCT 
AAAAATTGCT 
AAAAATTGCT 
AAAAATTGCT 
AAAAATTGCT 
AAAAATTGCT 
AAAAATTGCT 
AAAAATTGCT 



AGAATTGTCT 
AGAATTGTCT 
AGAATTGTCT 
AGAATTGTCT 
AGAATTGTCT 
AGAATTGTCT 
AGAATTGTCT 
AGAATTGTCT 
AGAATTGTCT 
AGAATTGTCT 
AGAATTGTCT 



1850 
AAAAACATCC 
AAAAACATCC 
AAAAACATCC 
AAAAACATCC 
AAAAACATCC 
AAAAACATCC 
AAAAACATCC 
AAAAACATCC 
AAAAACATCC 
AAAAACATCC 
AAAAACATCC 



msalB3564 
msal83564 



.2{l47_COHl) 
.2(147^ 



IM732) 



1851 1900 
TCATGAGCTC AGCAACAGCA TTATATAGTG AAGAGGATAA GGCG TTTT AT 
TCATGAGCTC AGCAACAGCA TTATATAGTG AAGAGGATAA GGCGTTTTAT 



778 



WO 2004/018646 



PCT/US2003/026827 



Table 44: Comparative Sequences relating to SAG0416 (strain info highlighted in BOLD) 



msal83564. 2(147 M781 
msal83S64.2{l47~2603 
msal83564.2{l47_JM9130013 
rasal83 564 . 2 { 14 7_18RS2 1 
msal83SS4 .2{147_090 
raaal83564 . 2 { 147_CJB110 
msal83564 .2{ 147_A909 
maal83S64 . 2 { 147_H36B 
msal83564 . 2 { 147_1169NT 
Consensus 



TCATGAGCTC 
TCATGAGCTC 
TCATGAGCTC 
TCATGAGCTC 
TCATGAGCTC 
TCATGAGCTC 
TCATGAGCTC 
TCATGAGCTC 
TCATGAGCTC 



AGCAACAGCA 
AGCAACAGCA 
AGCAACAGCA 
AGCAACAGCA 
AGCAACAGCA 
AGCAACAGCA 
AGCAACAGCA 
AGCAACAGCA 
AGCAACAGCA 



TTATATAGTG 
TTATATAGTG 
TTATATAGTG 
TTATATAGTG 
TTATATAGTG 
TTATATAGTG 
TTATATAGTG 
TTATATAGTG 
TTATATAGTG 



AAGAGGATAA 
AAGAGGATAA 
AAGAGGATAA 
AAGAGGATAA 
AAGAGGATAA 
AAGAGGATAA 
AAGAGGATAA 
AAGAGGATAA 
AAGAGGATAA 



GGCGTTTTAT 
GGCGTTTTAT 
GGCGTTTTAT 
GGCGTTTTAT 
GGCGTTTTAT 
GGCGTTTTAT 
GGCGTTTTAT 
GGCGTTTTAT 
GGCGTTTTAT 



msal83564 . 2 ( 147 J20H1 
msal83S64 . 2 { 147J-I732 
rasal83564.2{l47_M781 
msalB3564 . 2 { 147_2603 
msal83564 . 2 { 147_JM9130013 
msal83564 . 2 { 147_1BRS21 
msalB3564 . 2 { 147_090 
msal83564 . 2 { 147_CJB110 
rasal83564 .2fl47_A909 
msa!83564 . 2 { 147_H36B 
msal83564.2{l47_1169NT 
Consensus 



1901 

TCACCACGTC 
TCACCACGTC 
TCACCACGTC 
TCACCACGTC 
TCACCACGTC 
TCACCACGTC 
TCACCACGTC 
TCACCACGTC 
TCACCACGTC 
TCACCACGTC 
TCACCACGTC 



AGCAAGGTGC 
AGCAAGGTGC 
AGCAAGGTGC 
AGCAAGGTGC 
AGCAAGGTGC 
AGCAAGGTGC 
AGCAAGGTGC 
AGCAAGGTGC 
AGCAAGGTGC 
AGCAAGGTGC 
AGCAAGGTGC 



AGGTGTAGTT 
AGGTGTAGTT 
AGGTGTAGTT 
AGGTGTAGTT 
AGGTGTAGTT 
AGGTGTAGTT 
AGGTGTAGTT 
AGGTGTAGTT 
AGGTGTAGTT 
AGGTGTAGTT 
AGGTGTAGTT 



GATGCTGAAA 
GATGCTGAAA 
GATGCTGAAA 
GATGCTGAAA 
GATGCTGAAA 
GATGCTGAAA 
GATGCTGAAA 
GATGCTGAAA 
GATGCTGAAA 
GATGCTGAAA 
GATGCTGAAA 



1950 
AAGCTATCCA 
AAGCTATCCA 
AAGCTATCCA 
AAGCTATCCA 
AAGCTATCCA 
AAGCTATCCA 
AAGCTATCCA 
AAGCTATCCA 
AAGCTATCCA 
AAGCTATCCA 
AAGCTATCCA 



msal83564 . 2 { 147_COHl ' 
msal83564 . 2 { 147_M732 1 
msal83564.2fl47_M78l| 
msal83564 . 2 { 147_2603 ' 
msal83564.2{l47_JM9130013 
msal83564.2{l47_18RS21 
msal83564 . 2 { 147_090 
msal 8 3 564 . 2 { 14 7_CJB1 10 
msal83564 . 2 ( 147_A909 
msal83564 .2(14 7_H36B 
msal83564 . 2 { 14 7_1169NT 
Consensus 



1951 

AGCTCAATAT 
AGCTCAATAT 
AGCTCAATAT 
AGCTCAATAT 
AGCTCAATAT 
AGCTCAATAT 
AGCTCAATAT 
AGCTCAATAT 
AGCTCAATAT 
AGCTCAATAT 
AGCTCAATAT 



TATgTTACTG 
TATgTTACTG 
TATgTTACTG 
TATaTTACTG 
TATaTTACTG 
TATaTTACTG 
TATgTTACTG 
TATgTTACTG 
TATgTTACTG 
TATgTTACTG 
TATgTTACTG 



GAAACGATGG 
GAAACGATGG 
GAAACGATGG 
GAAACGATGG 
GAAACGATGG 
GAAACGATGG 
GAAACGATGG 
GAAACGATGG 
GAAACGATGG 
GAAACGATGG 
GAAACGATGG 



CAAAGtTAAA 
CAAAGtTAAA 
CAAAGtTAAA 
CAAAGcTAAA 
CAAAGcTAAA 
CAAAGcTAAA 
CAAAGcTAAA 
CAAAGCTAAA 
CAAAGcTAAA 
CAAAGcTAAA 
CAAAGcTAAA 



2000 
ATTAATCTCA 
ATTAATCTCA 
ATTAATCTCA 
ATTAATCTCA 
ATTAATCTCA 
ATTAATCTCA 
ATTAATCTCA 
ATTAATCTCA 
ATTAATCTCA 
ATTAATCTCA 
ATTAATCTCA 



msal 8 3564 . 2 f 147JCOH1 
msal83564 . 2 { 147_M732 
msal83564.2(l47_M781 
msalB3564 . 2{ 147_2603 ' 
msal83564.2{l47_JM9130013 
msalB3564.2{l47_18RS2l' 
msal83S64 . 2 { 147_090 ' 
msal83564 . 2 { 147_CJB110 ' 
msal83564 . 2[ 147_A909 
msal83564 . 2 { 147_H36B' 
rasal83564 .2 { 147_1169NT 
Consensus 



2001 

AACGAgaGGG 
AACGAgaGGG 
AACGAgaGGG 
AACGAatGGG 
AACGAatGGG 
AACGAatGGG 
AACGAgtGGG 
AACGAgtGGG 
AACGAgtGGG 
AACGAgtGGG 
AACGAgtGGG 



AGATAAATTT 
AGATAAATTT 
AGATAAATTT 
AGATAAATTT 
AGATAAATTT 
AGATAAATTT 
AGATAAATTT 
AGATAAATTT 
AGATAAATTT 
AGATAAATTT 
AGATAAATTT 



GATATCACAG 
GATATCACAG 
GATATCACAG 
GATATCACAG 
GATATCACAG 
GATATCACAG 
GATATCACAG 
GATATCACAG 
GATATCACAG 
GATATCACAG 
GATATCACAG 



TTACAATTCA 
TTACAATTCA 
TTACAATTCA 
TTACAATTCA 
TTACAATTCA 
TTACAATTCA 
TTACAATTCA 
TTACAATTCA 
TTACAATTCA 
TTACAATTCA 
TTACAATTCA 



2050 
TAAACTTGTA 
TAAACTTGTA 
TAAACTTGTA 
TAAACTTGTA 
TAAACTTGTA 
TAAACTTGTA 
TAAACTTGTA 
TAAACTTGTA 
TAAACTTGTA 
TAAACTTGTA 
TAAACTTGTA 



msal83564 . 2 ( 147_COHl 
msal83564 . 2 { 14 7_M73 2 ' 
msal 83 564 . 2 { 14 7_M781 
msal83564.2(147_2603 
msal83564.2(l47_JM9130013 
msal83564 . 2 { 147_18RS21 
msal83564 . 2 {l47_090 
msal83564 . 2 { 147__CJB110 
msal83564 . 2 { 147_A909 
rasal83564 . 2{ 147_H36B 
msal83564.2{l47_1169NT 
ConsensuB 



2051 

GAAGGTGTCA 
GAAGGTGTCA 
GAAGGTGTCA 
GAAGGTGTCA 
GAAGGTGTCA 
GAAGGTGTCA 
GAAGGTGTCA 
GAAGGTGTCA 
GAAGGTGTCA 
GAAGGTGTCA 
GAAGGTGTCA 



AAGAATTGTA 
AAGAATTGTA 
AAGAATTGTA 
AAGA ATTGTA 
AAGAATTGTA 
AAGAATTGTA 
AAGAATTGTA 
AAGAATTGTA 
AAGA ATTGTA 
AAGAATTGTA 
AAGAATTGTA 



TTATCAAGCT 
TTATCAAGCT 
TTATCAAGCT 
TTATCAAGCT 
TTATCAAGCT 
TTATCAAGCT 
TTATCAAGCT 
TTATCAAGCT 
TTATCAAGCT 
TTATCAAGCT 
TTATCAAGCT 



AATGTAGCAA 
AATGTAGCAA 
AATGTAGCAA 
AATGTAGCAA 
AATGTAGCAA 
AATGTAGCAA 
AATGTAGCAA 
AATGTAGCAA 
AATGTAGCAA 
AATGTAGCAA 
AATGTAGCAA 



2100 
CAGAACAAGT 
CAGAACAAGT 
CAGAACAAGT 
CAGAACAAGT 
CAGAACAAGT 
CAGAACAAGT 
CAGAACAAGT 
CAGAACAAGT 
CAGAACAAGT 
CAGAACAAGT 
CAGAACAAGT 



msal83564 . 2 ( 147_COHl| 
msal83564. 2(147_M732 ) 
msal83564.2{l47_M781 ) 
msal83564.2{l47_2603 
msal83564 .2{147_JM9130013 
Tnsal83564.2{l47_18RS21 
msal83 564 . 2 { 147_09 0 
msal83564 . 2 { 147_CJB110 
msal83564 . 2 f 147_A909 
msal83564 . 2 { 147_H36B 
msal83564 . 2 { 147_1169NT 
Consensus 



2101 

AAATAAAGGT 
AAATAAAGGT 
AAATAAAGGT 
AAATAAAGGT 
AAATAAAGGT 
AAATAAAGGT 
AAATAAAGGT 
AAATAAAGGT 
AAATAAAGGT 
AAATAAAGGT 
AAATAAAGGT 



AAATTTGCCC 
AAATTTGCCC 
AAATTTGCCC 
AAATTTGCCC 
AAATTTGCCC 
AAATTTGCCC 
AAATTTGCCC 
AAATTTGCCC 
AAATTTGCCC 
AAATTTGCCC 
AAATTTGCCC 



TTAAACCACA 
TTAAACCACA 
TTAAACCACA 
TTAAACCACA 
TTAAACCACA 
TTAAACCACA 
TTAAACCACA 
TTAAACCACA 
TTAAACCACA 
TTAAACCACA 
TTAAACCACA 



AGCCTTGCTA 
AGCCTTGCTA 
AGCCTTGCTA 
AGCOTTGCTA 
AGCCTTGCTA 
AGCCTTGCTA 
AGCCTTGCTA 
AGCCTTGCTA 
AGCCTTGCTA 
AGC CTTG CTA 
AGCCTTGCTA 



2150 
GATACTAATT 
GATACTAATT 
GATACTAATT 
GATACTAATT 
GATACTAATT 
GATACTAATT 
GATACTAATT 
GATACTAATT 
GATACTAATT 
GATACTAATT 
GATACTAATT 



msal83564 . 2{ 147_C0H1} 



2151 2200 
GGCAGAAAGT AATTCTTCGT GATAAAGAAA CACAAGTTCG ATTTACTATT 



779 



WO 2004/018646 



PCT/US2003/026827 



Table 44: Comparative Sequences relating to SAG0416 (strain info highlighted in BOLD) 



maal83564 . 2 ( 147_M732 ] 
msal83564 . 2 I 147_M781 
tnsal83S64 . 2 { 147_2603 
rasal83564 . 2 { 147_JM9130013 
msal83 564 . 2 { 147_18RS2 1 
maalB3S64 .2{l47__090 
msalB3 564 . 2 { 147_CJB110 
msalB3564.2(l47 A909 
msal83564 . 2{ 147_H36B 
msal83564.2{l47_1169NTi 
Consensus 



msal83564 . 2 ( 147_C0H1 \ 
msalS 3564.2(14 7_M73 2 
msalS 3 564 . 2 { 14 7_M78 1 
msal83564 . 2 { 147_2603 ( 
msal83564 . 2 { 147_JM9130013 
msal83564 .2{l47_18RS21 
msal83S64.2{l47 090 
rasal83564 . 2 { 147_CJB110 
msal83564 . 2 { 147JV909 
msal83564 . 2 { 147_H36B 
msal83564 .2 {147_1169NT 
Consensus 



GGCAGAAAGT 
GGCAGAAAGT 
GGCAGAAAGT 
GGCAGAAAGT 
GGCAGAAAGT 
GGCAGAAAGT 
GGCAGAAAGT 
GGCAGAAAGT 
GGCAGAAAGT 
GGCAGAAAGT 



AATTCTTCGT 
AATTCTTCGT 
AATTCTTCGT 
AATTCTTCGT 
AATTCTTCGT 
AATTCTTCGT 
AATTCTTCGT 
AATTCTTCGT 
AATTCTTCGT 
AATTCTTCGT 



GATAAAGAAA 
GATAAAGAAA 
GATAAAGAAA 
GATAAAGAAA 
GATAAAGAAA 
GATAAAGAAA 
GATAAAGAAA 
GATAAAGAAA 
GATAAAGAAA 
GATAAAGAAA 



CACAAGTTCG 
CACAAGTTCG 
CACAAGTTCG 
CACAAGTTCG 
CACAAGTTCG 
CACAAGTTCG 
CACAAGTTCG 
CACAAGTTCG 
CACAAGTTCG 
CACAAGTTCG 



ATTTACTATT 
ATTTACTATT 
ATTTACTATT 
ATTTACTATT 
ATTTACTATT 
ATTTACTATT 
ATTTACTATT 
ATTTACTATT 
ATTTACTATT 
ATTTACTATT 



2201 

GATgCTAGTC 
GATgCTAGTC 
GATgCTAGTC 
GATgCTAGTC 
GATgCTAGTC 
GATgCTAGTC 
GATgCTAGTC 
GATgCTAGTC 
GATtCTAGTC 
GATtCTAGTC 
GATgCTAGTC 



AATTTAGTCA 
AATTTAGTCA 
AATTTAGTCA 
AATTTAGTCA 
AATTTAGTCA 
AATTTAGTCA 
AATTTAGTCA 
AATTTAGTCA 
AATTTAGTCA 
A ATTT AGTCA 
AATTTAGTCA 



GAAATTAAAA 
GAAATTAAAA 
GAAATTAAAA 
GAAATTAAAA 
GAAATTAAAA 
GAAATTAAAA 
GAAATTAAAA 
GAAATTAAAA 
GAAATTAAAA 
GAAATTAAAA 
GAAATTAAAA 



GAACAGATGG 
GAACAGATGG 
GAACAGATGG 
GAACAGATGG 
GAACAGATGG 
GAACAGATGG 
GAACAGATGG 
GAACAGATGG 
GAACAGATGG 
GAACAGATGG 
GAACAGATGG 



2250 
CAAATGGTTA 
CAAATGGTTA 
CAAATGGTTA 
CAAATGGTTA 
CAAATGGTTA 
CAAATGGTTA 
CAAATGGTTA 
CAAATGGTTA 
CAAATGGTTA 
CAAATGGTTA 
CAAATGGTTA 



msal 8 3 S 64 . 2 f 147__C0H1 ) 
msal83564.2< 147_M732> 
msal83564.2< 147_M78l} 
msalB3S64.2{l47_2603> 
rasal83564 . 2{ 147_JM9130013 J 
msal83564 . 2 { 147_18RS21 J 
msal83564 . 2 {147_090 } 
rasal83564 . 2 { 147_CJB110 } 
msal83564 . 2 { 147_A909 ) 
tnsal83564 . 2 { 147_H36B J 
msal83564 . 2 { 147_1169NT} 
Consensus 



msal83 564.21 147 JCOH1 
tnsal83564 . 2 ( 147_M732 
msal83564 . 2 { 147J4781 
msal83564.2{l47_2603 
msalB3564 . 2 { 147_JM9130013 
msal 83 564 . 2 { 147_18RS21 
msal83564.2{l47_090 
msal83564 . 2 { 147_CJB110 
meal83564 . 2 { 147_A909 
msal83564 . 2 { 147_H36B 
msal83564 . 2 { 147_1169NT 
Consensus 



msal83564 . 2 I 147_COHl ] 
msal83564 . 2ll47_M732 ( 
msal8 3564 . 2 { 147_M781 
msal83564 . 2 { 147_2603 
msalS 3564 .2(14 7_JM9130 013 
msal83564 . 2 { 147_18RS21 
msal83564.2{l47_090 
maal83564 . 2 {147_CJB110 
insal83564 . 2 ( 147_A909 
msal83564 . 2 { 147_H36B 
msal83564.2{l47 - 1169NT 
Consensus 



msal83564.2< 147_COHl 
msal83564.2 |l47_M732' 
maalB3564.2 147J4781 
msal83564 . 2 { 147_2603 
msal83564.2{l47 JM9130013 
msal63564.2{l47 18RS21 
msal83 564 . 2 {l47_090 
msal 8 3 5 64 . 2 { 147_CJB 11 0 
msal83564.2(l47_A909 
msal83564 . 2 { 147_H36B 
msal83564 . 2 { 147_1163NT 
Consensus 



2251 

TTTCTTAGAA 
TTTCTTAGAA 
TTTCTTAGAA 
TTTCTTAGAA 
TTTCTTAGAA 
TTTCTTAGAA 
TTTCTTAGAA 
TTTCTTAGAA 
TTTCTTAGAA 
TTTCTTAGAA 
TTTCTTAGAA 



GGTTTTGTAC 
GGTTTTGTAC 
GGTTTTGTAC 
GGTTTTGTAC 
GGTTTTGTAC 
GGTTTTGTAC 
GGTTTTGTAC 
GGTTTTGTAC 
GGTTTTGTAC 
GGTTTTGTAC 
GGTTTTGTAC 



GTTTTAAAGA 
GTTTTAAAGA 
GTTTTAAAGA 
GTTTTAAAGA 
GTTTTAAAGA 
GTTTTAAAGA 
GTTTTAAAGA 
GTTTTAAAGA 
GTTTTAAAGA 
GTTTTAAAGA 
GTTTTAAAGA 



AGCcAAGGAT 
AGCcAAGGAT 
AGCcAAGGAT 
AGCcAAGGAT 
AGCcAAGGAT 
AGCCAAGGAT 
AGCcAAGGAT 
AGCcAAGGAT 
AGCcAAGGAT 
AGCcAAGGAT 
AGCtAAGGAT 



2300 
AGTAATCAGG 
AGTAATCAGG 
AGTAATCAGG 
AGTAATCAGG 
AGTAATCAGG 
AGTAATCAGG 
AGTAATCAGG 
AGTAATCAGG 
AGTAATCAGG 
AGTAATCAGG 
AGTAATCAGG 



2301 

AGTTAATGAG 
AGTTAATGAG 
AGTTAATGAG 
AGTTAATGAG 
AGTTAATGAG 
AGTTAATGAG 
AGTTAATGAG 
AGTTAATGAG 
AGTTAATGAG 
AGTTAATGAG 
AGTTAATGAG 



TATTCCTTTT 
TATTCCTTTT 
TATTCCTTTT 
TATTCCTTTT 
TATTCCTTTT 
TATTCCTTTT 
TATTCCTTTT 
TATTCCTTTT 
TATTCCTTTT 
TATTCCTTTT 
TATTCCTTTT 



GTAGGATTTA 
GTAGGATTTA 
GTAGGATTTA 
GTAGGATTTA 
GTAGGATTTA 
GTAGGATTTA 
GTAGGATTTA 
GTAGGATTTA 
GTAGGATTTA 
GTAGGATTTA 
GTAGGATTTA 



ATGGTGATTT 
ATGGTGATTT 
ATGGTGATTT 
ATGGTGATTT 
ATGGTGATTT 
ATGGTGATTT 
ATGGTGATTT 
ATGGTGATTT 
ATGGTGATTT 
ATGGTGATTT 
ATGGTGATTT 



2350 
TGCGAaCTTA 
TGCGAaCTTA 
TGCGAaCTTA 
TGCGAaCTTA 
TGCGAaCTTA 
TGCGAaCTTA 
TGCGAaCTTA 
TGCGAaCTTA 
TGCGAaCTTA 
TGCGAaCTTA 
TGCGAgCTTA 



2351 

CAAGCACTTG 
CAAGCACTTG 
CAAGCACTTG 
CAAGCACTTG 
CAAGCACTTG 
CAAGCACTTG 
CAAGCACTTG 
CAAGCACTTG 
CAAGCACTTG 
CAAGCACTTG 
CAAGCACTTG 



AAACACCGAT 
AAACACCGAT 
AAACACCGAT 
AAACACCGAT 
AAACACCGAT 
AAACACCGAT 
AAACACCGAT 
AAACACCGAT 
AAACACCGAT 
AAACACCGAT 
AAACACCGAT 



TTATAAGACG 
TTATAAGACG 
TTATAAGACG 
TTATAAGACG 
TTATAAGACG 
TTATAAGACG 
TTATAAGACG 
TTATAAGACG 
TTATAAGACG 
TTATAAGACG 
TTATAAGACG 



CTTTCTAAAG 
CTTTCTAAAG 
CTTTCTAAAG 
CTTTCTAAAG 
CTTTCTAAAG 
aTTTCTAAAG 
CTTTCTAAAG 
CTTTCTAAAG 
CTTTCTAAAG 
CTTTCTAAAG 
CTTTCTAAAG 



2400 
GTAGTTTCTA 
GTAGTTTCTA 
GTAGTTTCTA 
GTAGTTTCTA 
GTAGTTTCTA 
GTAGTTTCTA 
GTAGTTTCTA 
GTAGTTTCTA 
GTAGTTTCTA 
GTAGTTTCTA 
GTAGTTTCTA 



2401 

CTATAAACCA 
CTATAAACCA 
CTATAAACCA 
CTATAAACCA 
CTATAAACCA 
CTATAAACCA 
CTATAAACCA 
CTATAAACCA 
CTATAAACCA 
CTATAAACCA 
CTATAAACCA 



AATGATACAA 
AATGATACAA 
AATGATACAA 
AATGATACAA 
AATGATACAA 
AATGATACAA 
AATGATACAA 
AATGATACAA 
AATGATACAA 
AATGATACAA 
AATGATACAA 



CTCATAAAGA 
CTCATAAAGA 
CTCATAAAGA 
CTCATAAAGA 
CTCATAAAGA 
CTCATAAAGA 
CTCATAAAGA 
CTCATAAAGA 
CTCATAAAGA 
CTCATAAAGA 
CTCATAAAGA 



CCAATTGGAG 
CCAATTGGAG 
CCAATTGGAG 
CCAATTGGAG 
CCAATTGGAG 
CCAATTGGAG 
CCAATTGGAG 
CCAATTGGAG 
CCAATTGGAG 
CCAATTGGAG 
CCAATTGGAG 



2450 
TAcAATGAAT 
TAcAATGAAT 
TACAATGAAT 
TAcAATGAAT 
TAcAATGAAT 
TAcAATGAAT 
TACAATGAAT 
TACAATGAAT 
TACAATGAAT 
TACAATGAAT 
TACAATGAAT 



2451 



2500 



780 



WO 2004/018646 



PCT/US2003/026827 



Table 44: Comparative Sequences relating to SAG0416 (strain info highlighted in BOLD) 



msal83564 . 2 f 147_C0H1 
msal83564 . 2 f 147_M732 
msal83564.2(l47 M781 
msal83564 . 2 { 147~2603 
msal83564 . 2 { 147_JM9130013 
msal83564.2{l47 18RS21 
msal83564 . 2 {l47_J)90 
msal83564.2{l47 CJB110 
msal83564 . 2 ( 147JV909 
rasal83564.2(147_H36B 
msal83564.2{l47_1169NT 
Consensus 



CAGCTCCTTT 
CAGCTCCTTT 
CAGCTC CTTT 
CAGCTCCTTT 
CAGCTCCTTT 
CAGCTCCTTT 
CAGCTCCTTT 
CAGCTCCTTT 
CAGCTCCTTT 
CAGCTCCTTT 
CAGCTCCTTT 



TGAAAGCAAC 
TGAAAGCAAC 
TGAAAGCAAC 
TGAAAGCAAC 
TGAAAGCAAC 
TGAAAGCAAC 
TGAAAGCAAC 
TGAAAGCAAC 
TGAAAGCAAC 
TGAAAGCAAC 
TGAAAGCAAC 



AACTATACTG 
AACTATACTG 
AACTATACTG 
AACTATACTG 
AACTATACTG 
AACTATACTG 
AACTATACTG 
AACTATACTG 
AACTATACTG 
AACTATACTG 
AACTATACTG 



CCTTGTTAAC 
CCTTGTTAAC 
CCTTGTTAAC 
CCTTGTTAAC 
CCTTGTTAAC 
CCTTGTTAAC 
CCTTGTTAAC 
CCTTGTTAAC 
CCTTGTTAAC 
CCTTGTTAAC 
CCTTGTTAAC 



ACAATCAGCG 
ACAATCAGCG 
ACAATCAGCG 
ACAATCAGCG 
ACAATCAGCG 
ACAATCAGCG 
ACAATCAGCG 
ACAATCAGCG 
ACAATCAGCG 
ACAATCAGCG 
ACAATCAGCG 



rasal83564.2(l47 COH1 
msal83564 . 2 { 147~M732 
msal83564 . 2 < 147_M781 
msa!83564 . 2 { 147_2603 
msal83564.2{l47_JM9130013 
msal83564 . 2 { 147_18RS21 
msal83564 . 2 { 147_090 
msaX83564 . 2 { 147_CJB110 
msal83564 . 2 { 147_A909 
msal 8 3564 .2(14 7_H36B 
msal83564.2{l47_1169NT 
Consensus 



2501 

TCTTGGGGCT 
TCTTGGGGCT 
TCTTGGGGCT 
TCTTGGGGCT 
TCTTGGGGCT 
TCTTGGGGCT 
TCTTGGGGCT 
TCTTGGGGCT 
TCTTGGGGCT 



ATGTTGATTA 
ATGTTGATTA 
ATGTTGATTA 
ATGTTGATTA 
ATGTTGATTA 
ATGTTGATTA 
ATGTTGATTA 
ATGTTGATTA 
ATGTTGATTA 
ATGTTGATTA 
ATGTTGATTA 



TGTCAAAAAT 
TGTCAAAAAT 
TGTCAAAAAT 
TGTCAAAAAT 
TGTCAAAAAT 
TGTCAAAAAT 
TGTCAAAAAT 
TGTCAAAAAT 
TGTCAAAAAT 
TGTCAAAAAT 
TGTCAAAAAT 



GGTGGGGAGT 
GGTGGGGAGT 
GGTGGGGAGT 
GGTGGGGAGT 
GGTGGGGAGT 
GGTGGGGAGT 
GGTGGGGAGT 
GGTGGGGAGT 
GGTGGGGAGT 
GGTGGGGAGT 
GGTGGGGAGT 



2550 
TAGAATTAGC 
TAGAATTAGC 
TAGAATTAGC 
TAGAATTAGC 
TAGAATTAGC 
TAGAATTAGC 
TAGAATTAGC 
TAGAATTAGC 
TAGAATTAGC 
TAGAATTAGC 
TAGAATTAGC 



msal83564 . 2 ( 147_C0H1 
msal83564 . 2 { 147_M732 
msal83564 . 2 ( 147 J4781 
msal83564 . 2 { 147_2603 
maal83564 . 2 { 147_JM9130013 
msal83564 . 2 { 147_18RS21 
msaX83564 . 2 { 147_090 
rasal 8 3 5 64 . 2 { 14 7_CJB11 0 
msal83564.2{l47_A909 
msal 83564 . 2 { 147_H36B 
msal83564 . 2 { 147_1169NT 
Consensus 



2551 

ACCGGAGAGT 
ACCGGAGAGT 
ACCGGAGAGT 
ACCGGAGAGT 
ACCGGAGAGT 
ACCGGAGAGT 
ACCGGAGAGT 
ACCGGAGAGT 
ACCGGAGAGT 
ACCGGAGAGT 
ACCGGAGAGT 



CCAAAAAGAA 
CCAAAAAGAA 
CCAAAAAGAA 
CCAAAAAGAA 
CCAAAAAGAA 
CCAAAAAGAA 
CCAAAAAGAA 
CCAAAAAGAA 
CCAAAAAGAA 
CCAAAAAGAA 
CCAAAAAGAA 



TTATTTTAGG 
TTATTTTAGG 
TTATTTTAGG 
TTATTTTAGG 
TTATTTTAGG 
TTATTTTAGG 
TTATTTTAGG 
TTATTTTAGG 
TTATTTTAGG 
TTATTTTAGG 
TTATTTTAGG 



AACTTTTGAG 
AACTTTTGAG 
AACTTTTGAG 
AACTTTTGAG 
AACTTTTGAG 
AACTTTTGAG 
AACTTTTGAG 
AACTTTTGAG 
AACTTTTGAG 
AACTTTTGAG 
AACTTTTGAG 



2600 
AATAAGGTTG 
AATAAGGTTG 
AATAAGGTTG 
AATAAGGTTG 
AATAAGGTTG 
AATAAGGTTG 
AATAAGGTTG 
AATAAGGTTG 
AATAAGGTTG 
AATAAGGTTG 
AATAAGGTTG 



nisal83564 . 2 ( 147_C0H1 
msalB3564 . 2 ( 147_M732 
msal83564 . 2 i 147_M781 
tnsal83564 . 2 { 147_2603 
msal83564.2{l47_JM9130013 
msal83564.2{l47_18RS21 
msal83564 .2{147_090 
msal83S64 . 2 { 147_CJB110 
msal83564 . 2 { 147_A909 
msal83564. 2(147 H36B 
msal 83 5 64 . 2 { 147_1169NT! 

Consensus 



2601 

AGGATAAAAC 
AGGATAAAAC 
AGGATAAAAC 
AGGATAAAAC 
AGGATAAAAC 
AGGATAAAAC 
AGGATAAAAC 
AGGATAAAAC 
AGGATAAAAC 
AGGATAAAAC 
AGGATAAAAC 



AATTCATCTT 
AATTCATCTT 
AATTCATCTT 
AATTCATCTT 
AATTCATCTT 
AATTCATCTT 
AATTCATCTT 
AATTCATCTT 
AATTCATCTT 
AATTCATCTT 
AATTCATCTT 



TTGGAAAGAG 
TTGGAAAGAG 
TTGGAAAGAG 
TTGGAAAGAG 
TTGGAAAGAG 
TTGGAAAGAG 
TTGGAAAGAG 
TTGGAAAGAG 
TTGGAAAGAG 
TTGGAAAGAG 
TTGGAAAGAG 



ATGCAGCGAA 
ATGCAGCGAA 
ATGCAGCGAA 
ATGCAGCGAA 
ATGCAGCGAA 
ATGCAGCGAA 
ATGCAGCGAA 
ATGCAGCGAA 
ATGCAGCGAA 
ATGCAGCGAA 
ATGCAGCGAA 



2650 
TAATCCATAT 
TAATCCATAT 
TAATCCATAT 
TAATCCATAT 
TAATCCATAT 
TAATCCATAT 
TAATCCATAT 
TAATCCATAT 
TAATCCATAT 
TAATCCATAT 
TAATCCATAT 



msal83564 . 2 f 147_COHl 
rasal83564 .21 147_M732 
msal83564.2 'l47_M781 
rasal83564 . 2 { 147__2603 
msal83564.2{l47_JM9130013 
msal83564.2{l47_18RS21 
msal83564 . 2 {l47_090 
msal83564 . 2 { 147_CJB110 
Risal83564.2(l47 A909 
msal83564 . 2 { 147_H36B 
rasal83564.2{l47_1169NT: 
Consensus 



2651 

TTTGCCATTT 
TTTGCCATTT 
TTTGCCATTT 
TTTGCCATTT 
TTTGCCATTT 
TTTGCCATTT 
TTTGCCATTT 
TTTGCCATTT 
TTTGCCATTT 
TTTGCCATTT 
TTTGCCATTT 



CTCCAAATAA 
CTCCAAATAA 
CTCCAAATAA 
CTCCAAATAA 
CTCCAAATAA 
CTCCAAATAA 
CTCCAAATAA 
CTCCAAATAA 
CTCCAAATAA 
CTCCAAATAA 
CTCCAAATAA 



AGATGGAAAT 
AGATGGAAAT 
AGATGGAAAT 
AGATGGAAAT 
AGATGGAAAT 
AGATGGAAAT 
AGATGGAAAT 
AGATGGAAAT 
AGATGGAAAT 
AGATGGAAAT 
AGATGGAAAT 



AGGGAcGAAA 
AGGGAcGAAA 
AGGGAcGAAA 
AGGGAcGAAA 
AGGGAcGAAA 
AGGGAcGAAA 
AGGGAtGAAA 
AGGGAtGAAA 
AGGGAtGAAA 
AGGGAtGAAA 
AGGGAtGAAA 



2700 
TCACTCCCCA 
TCACTCCCCA 
TCACTCCCCA 
TCACTCCCCA 
TCACTCCCCA 
TCACTCCCCA 
TCACTCCCCA 
TCACTCCCCA 
TCACTCCCCA 
TCACTCCCCA 
TCACTCCCCA 



maalS 3564 .2(147 COHlj 
msal 8 3 564 . 2 { 1473*732 
msal83564 . 2 { 147_M781 ' 
msal83564.2{l47 2603 
msal83564 . 2 { 147_JM9130013 
msal83564.2{l47 18RS21 
msal83564 . 2 {T47_090 
msal83564 . 2 { 147_CJB110 
msal83564 . 2 { 147_A909 
msal83564 . 2 { 147_H36B 
msal83564.2{l47_1169Hr 
Consensus 



2701 

GGCAACTTTC 
GGCAACTTTC 
GGCAACTTTC 
GGCAACTTTC 
GGCAACTTTC 
GGCAACTTTC 
GGCAACTTTC 
GGCAACTTTC 
GGCAACTTTC 
GGCA ACTTT C 
GGCAACTTTC 



TTAAGAAATG 
TTAAGAAATG 
TTAAGAAATG 
TTAAGAAATG 
TTAAGAAATG 
TTAAGAAATG 
TTAAGAAATG 
TTAAGAAATG 
TTAAGAAATG 
TTAAGAAATG 
TTAAGAAATG 



TTAAGGATAT 
TTAAGGATAT 
TTAAGGATAT 
TTAAGGATAT 
TTAAGGATAT 
TTAAGGATAT 
TTAAGGATAT 
TTAAGGATAT 
TTAAGGATAT 
TTAAGGATAT 
TTAAGGATAT 



TTCTGCTCAA 
TTCTGCTCAA 
TTCTGCTCAA 
TTCTGCTCAA 
TTCTGCTCAA 
TTCTGCTCAA 
TTCTGCTCAA 
TTCTGCTCAA 
TTCTGCTCAA 
TTCTGCTCAA 
TTCTGCTCAA 



2750 
GTTCTAGATC 
GTTCTAGATC 
GTT CTAGATC 
GTTCTAGATC 
GTTCTAGATC 
GTTC TAGATC 
GTT CTAGATC 
GTTCTAGATC 
GTTCTAGATC 
GTTCTAGATC 
GTTCTAGATC 
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Table 44: Comparative Sequences relating to SAG0416 (strain info highlighted in BOLD) 



msal 8 3 564 . 2 ( 147_COHl 
msal83S64 . 2 ( 147_M732 
msal83564 .2( 147J4781 
insal83S64 . 2 { 147^2603 
msal83S64 . 2 { 147_JM9130013 
msalB3564.2{l47 18RS21 
tnsalB3564 . 2 {l47_090 
msal83564.2{l47 CJB110 
msal83564 . 2 ( 147JV909 
msal83564.2{147_H36B 
rasal83564 . 2 { 147_1169NT 
Consensus 



msal83564 . 2 { 147_C0H1 
msal 8 3564.2(147 M732 
msal 83564 . 2 { 147~M781 
insal83564 . 2 j 147_2603 ' 
maal83564.2{l47 JM9130013 
msal83564.2(l47 18RS21 
msal83S64 . 2 { 14 7_090 
msal 83 564 . 2 { 147_CJB110 
msal83564.2{l47 A909 
msal83564 . 2 { 147~H36B 
msal83564 . 2 { 147_1169NT 
Consensus 



msal83564 .2( 147_COHl 
msal83S64 . 2 ( 147_M732 \ 
msal83564.2fl47_M781 \ 
msal83564.2(l47 2603 
msaia 3564 . 2 { 147_JM9 13 00 13 
msal83564.2{l47 18RS21 
msal 83 564 . 2 { 147_J>90 
msal83564.2{l47 CJB110 
msal83564 . 2 {147_A909 
msal83564 . 2 { 147^3 6B 
msal83564.2{l47_1169NT i 
Consensus 



msal 83564 . 2 { 14 7_COHl 
m3al83564-2{147_M732 
msal83S64 . 2 { 147_M781 
msal83564 . 2 (147_2603 
msal83564 .2{147_JM9 130013 > 
msal 83 564. 2 {147 18RS21 
msal83564.2{l47_090 
msal83564.2{l47 CJB110 \ 
mBal83564 . 2 (147_A909 
msal 8 3 564 . 2 { 147__H36B ' f 
msal 8 3 564. 2 { 147^116 9NT) 
Consensus 



msal83564 . 2 ( 147J30H1 
msal83564.2(l47_M732 
rasal83564 . 2 { 147_M781 
msal83564 . 2 { 147_2603 
msal83564.2{l47 JM9130013 
msal 83 5 64. 2 {147 18RS21 
msal83564.2{l47_090 
msal83564 ,2{147_CJB110 
msal83564. 2(147 A909 
msal 8 3 564 . 2 { 147_H36B 
msal83564.2{l47_1169NT \ 
Consensus 



msaX83564.2{l47 COH1 
msal83S64.2 147~M732 
msal83564 .2 147_M781 
msal83564 . 2 { 147""2603 
msal 8 3 5 64 . 2 { 14 7_JM9 13 0 0 13 
msalB3564.2{l47 18RS21 
msal83564.2{l47 090 
msal83564.2{l47 CJB110 
msal 8 3564 .2(147_A909 
msal83564.2{147_H36B » 
rasal83564 .2{l47_1169NT 
Consensus 



2751 2800 
AAAATGGAAA TGTTATTTGG CAAAGTAAGG TTTTACCATC TTATCGTAAA 
AAAATGGAAA TGTTATTTGG CAAAGTAAGG TTTTACCATC TTATCGTAAA 
AAAATGGAAA TGTTATTTGG CAAAGTAAGG TTTTACCATC TTATCGTAAA 
AAAATGGAAA TGTTATTTGG CAAAGTAAGG TTTT ACCATC TTATCGTAAA 
AAAATGGAAA TGTTATTTGG CAAAGTAAGG TTTTACCATC TTATCGTAAA 
AAAATGGAAA TGTTATTTGG CAAAGTAAGG TTTTACCATC TTATCGTAAA 
AAAATGGAAA TGTTATTTGG CAAAGTAAGG TTTTACCATC TTATCGTAAA 
AAAATGGAAA TGTTATTTGG CAAAGTAAGG TTTTACCATC TTATCGTAAA 
AAAATGGAAA TGTTATTTGG CAAAGTAAGG TTTTACCATC TTATCGTAAA 
AAAATGGAAA TGTTATTTGG CAAAGTAAGG TTTTACCATC TTATCGTAAA 
AAAATGGAAA TGTTATTTGG CAAAGTAAGG TTTTACCATC TTATCGTAAA 



2801 2850 
AATTTCCATA ATAATCCAAA GCAaAGTGAT GGTCATTATC GTATGGATGC 
AATTTCCATA ATAATCCAAA GCAaAGTGAT GGTCATTATC GTATGGATGC 
AATTTCCATA ATAATCCAAA GCAaAGTGAT GGTCATTATC GTATGGATGC 
AATTTCCATA ATAATCCAAA GCAaAGTGAT GGTCATTATC GTATGGATGC 
AATTTCCATA ATAATCCAAA GCAaAGTGAT GGTCATTATC GTATGGATGC 
AATTTCCATA ATAATCCAAA GCAaAGTGAT GGTCATTATC GTATGGATGC 
AATTTCCATA ATAATCCAAA GCAaAGTGAT GGTCATTATC GTATGGATGC 
AATTTCCATA ATAATCCAAA GCAaAGTGAT GGTCATTATC GTATGGATGC 
AATTTCCATA ATAATCCAAA GCAaAGTGAT GGTCATTATC GTATGGATGC 
AATTTCCATA ATAATCCAAA GCAaAGTGAT GGTCATTATC GTATGGATGC 
AATTTCCATA ATAATCCAAA GCAgAGTGAT GGTCATTATC GTATGGATGC 



2851 2900 
tcTTCAGTGG AGTGGTTTAG ATAAGGATGG CAAAGTTGTA GCAGATGGTT 
tcTTCAGTGG AGTGGTTTAG ATAAGGATGG CAAAGTTGTA GCAGATGGTT 
tCTTCAGTGG AGTGGTTTAG ATAAGGATGG CAAAGTTGTA GCAGATGGTT 
tcTTCAGTGG AGTGGTTTAG ATAAGGATGG CAAAGTTGTA GCAGATGGTT 
tcTTCAGTGG AGTGGTTTAG ATAAGGATGG CAAAGTTGTA GCAGATGGTT 
tcTTCAGTGG AGTGGTTTAG ATAAGGATGG CAAAGTTGTA GCAGATGGTT 
CtTTCAGTGG AGTGGTTTAG ATAAGGATGG CAAAGTTGTA GCAGATGGTT 
ctTTCAGTGG AGTGGTTTAG ATAAGGATGG CAAAGTTGTA GCAGATGGTT 
CCTTCAGTGG AGTGGTTTAG ATAAGGATGG CAAAGTTGTA GCAGATGGTT 
CCTTCAGTGG AGTGGTTTAG ATAAGGATGG CAAAGTTGTA GCAGATGGTT 
CCTTCAGTGG AGTGGTTTAG ATAAGGATGG CAAAGTTGTA GCAGATGGTT 



2901 2950 
TTTATACTTA TCGctTACGT TACACACCAG TAGCAGAAGG AGCAAATAGT 
TTTATACTTA TCGctTACGT TACACACCAG TAGCAGAAGG AGCAAATAGT 
TTTATACTTA TCGctTACGT TACACACCAG TAGCAGAAGG AGCAAATAGT 
TTTATACTTA TCGctTACGT TACACACCAG TAGCAGAAGG AGCAAATAGT 
TTTATACTTA TCGctTACGT TACACACCAG TAGCAGAAGG AGCAAATAGT 
TTTATACTTA TCGctTACGT TACACACCAG TAGCAGAAGG AGCAAATAGT 
TTTATACTTA TCGccTACGT TACACACCAG TAGCAGAAGG AGCAAATAGT 
TTTATACTTA TCGccTACGT TACACACCAG TAGCAGAAGG AGCAAATAGT 
TTTATACTTA TCGttTACGT TACACACCAG TAGCAGAAGG AGCAAATAGT 
TTTATACTTA TCGttTACGT TACACACCAG TAGCAGAAGG AGCAAATAGT 
TTTATACTTA TCGctTACGT TACACACCAG TAGCAGAAGG AGCAAATAGT 



2951 3000 
CAGGAGTCAG A CTTTA AAGT tCAAGTAAGT ACTAAGTCAC CAAATCTTCC 
CAGGAGTCAG ACTTTAAAGT tCAAGTAAGT ACTAAGTCAC CAAATCTTCC 
CAGGAGTCAG ACTTTAAAGT tCAAGTAAGT ACTAAGTCAC CAAATCTTCC 
CAGGAGTCAG ACTTTAAAGT aCAAGTAAGT ACTAAGTCAC CAAATCTTCC 
CAGGAGTCAG ACTTTAAAGT aCAAGTAAGT ACTAAGTCAC CAAATCTTCC 
CAGGAGTCAG ACTTTAAAGT aCAAGTAAGT ACTAAGTCAC CAAATCTTCC 
CAGGAGTCAG ACTTTAAAGT tCAAGTAAGT ACTAAGTCAC CAAATCTTCC 
CAGGAGTCAG ACTTTAAAGT tCAAGTAAGT ACTAAGTCAC CAAATCTTCC 
CAGGAGTCAG ACTTTAAAGT tCAAGTAAGT ACTAAGTCAC CAAATCTTCC 
CAGGAGTCAG ACTTTAAAGT tCAAGTAAGT ACTAAGTCAC CAAATCTTCC 
CAGGAGTCAG ACTTTAAAGT tCAAGTAAGT ACTAAGTCAC CAAATCTTCC 



3001 3050 
TTcACgAGCT CAGTTTGATG AAACTAATCG AACATTAAGC TTAGCCATGC 
TTcACgAGCT CAGTTTGATG AAACTAATCG AACATTAAGC TTAGCCATGC 
TTcACgAGCT CAGTTTGATG AAACTAATCG AACATTAAGC TTAGCCATGC 
TTcACgAGCT CAGTTTGATG AAACTAATCG AACATTAAGC TTAGCCATGC 
TTcACgAGCT CAGTTTGATG AAACTAATCG AACATTAAGC TTAGCCATGC 
TTcACgAGCT CAGTTTGATG AAACTAATCG AACATTAAGC TTAGCCATGC 
TTtACtAGCT CAGTTTGATG AAACTAATCG AACATTAAGC TTAGCCATGC 
TTtACtAGCT CAGTTTGATG AAACTAATCG AACATTAAGC TTAGCCATGC 
TTcACgAGCT CAGTTTGATG AAACTAATCG- AACATTAAGC TTAGCCATGC 
TTcACgAGCT CAGTTTGATG AAACTAATCG AACATTAAGC TTAGCCATGC 
TTcACgAGCT CAGTTTGATG AAACTAATCG AACATTAAGC TTAGCCATGC 
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WO 2004/018646 PCT/US2003/026827 
Table 44: Comparative Sequences relating to SAG0416 (strain info highlighted in BOLD) 



msalS 3564 . 2 { 147_C0H1 • 
msal83564 . 2 ( 147_M732 
tnsal83S64 . 2 ( 147_M7B1 
msal 03 564 . 2 { 147_2603 
msal83564.2{l47 JM9130013 
msal83564.2{l47_18RS21 ) 

msal83S64.2{l47 090 
msal83564 . 2 { 147_CJB110 
msal83564.2(l47 A909 
msal83564.2{l47~H36B 
msal83 564 . 2 { 147_1169NT 
Consensus 



msal83564 . 2 f 147 JCX>H1 > 
msal83S64.2(l47_M732 > 
msal83564.2(147 M781 
msal 8 3564. 2 { 14 7~2 603 
msalB3564.2{l47 JM9130013 
msal83564.2{l47 18RS21 • 
msalS 3 S6 4 . 2 {147_0 9 0. 
msal83 S64 . 2 { 147_CJB110 
msal83S64.2(l47 A909 
ma al 8 3 564 . 2 { 14 7_H3 6B 
msal83564 . 2 { 147_1169NT > 
Consensus 



msal83564 . 2 ( 147_COHl 
msal 8 35 64 .2(147_M732 
msal83S64.2(147_M781 
msal83564 . 2 { 147_2603 
rasal83564 .2{l47_JM9 130013 '! 
msal83 564 . 2 { 147_18RS21 
msal83564 . 2 { 147_090 
msal 8 3 5 64 . 2 { 14 7_CJB110 
tnsal83564 . 2 { 147_A909 
msal83S64.2(147_H36B > 
msal83564.2{l47_1169NT » 
Consensus 



msal 83 564 . 2 f 147__COHl 
msal83S64 . 2 ( 147_M732 
msal83564 . 2(147_M781 
msal83564 . 2 { 147_2603 
msal83564.2{!47 JM9130013 
msal83564.2{l47_16RS21 
msal83S64 .2{147_090 
msal 83 564 . 2 { 147_CJB110 
msal83564 . 2 ( 147_A909 
msal 8 3 564 . 2 { 147_H36B \ 
msal83564 . 2 { 147_1169NT \ 
Consensus 



msal 8 3564 . 2 { 147_C0H1 
msal83564 .2 147_M732 
msal83564 . 2 147_M781 
msal83564 . 2 { 147_2603 
msal83564.2{l47 JM9130013 
msal83564 . 2 {147_18RS21 
msal83564 . 2 { 147_090 
msal83564.2{l47 CJB110 
1033183564.2(147^909 
msal83564. 2(147 H36B 
rasal83564 .2{147_1169NT \ 
Consensus 



msal83564.2(l47_COHl 
msal83564.2 147J4732 
msalB3564.2 147_M781 
msal83564 . 2 { 147_2603 
msal83S64 .2{147_JM9130013 

msal83564.2{l47 18RS21 
msal83564.2{l47_090 

msal83564.2{l47_CJB110 
msalB3564 . 2 { 147_A909 
msal83564.2{l47 H36B 

msal83564.2{!47 1169NT } 



3051 3100 
CTAAGGaAAG TAGTTATGTT CCTAcATATC GTtTACAATT AGTTTTATCT 
CTAAGGaAAO TAGTTATGTT CCTAcATATC GTtTACAATT AGTTTTATCT 
CTAAGGaAAG TAGTTATGTT CCTAcATATC GTtTACAATT A GTTTTA TCT 
CTAAGGaAAG TAGTTATGTT CCTAcATATC GTtTACAATT AGTTTTATCT 
CTAAGGaAAG TAGTTATGTT CCTAcATATC GTtTACAATT A GTTTTA TCT 
CTAAGGaAAG TAGTTATGTT CCTAcATATC GTtTACAATT AGTTTTATCT 
CTAAGGaAAG TAGTTATGTT CCTACATATC GTtTACAATT A GTTTTA TCT 
CTAAGGaAAG TAGTTATGTT CCTAcATATC GTtTACAATT AGTTTTATCT 
CTAAGGaAAG TAGTTATGTT CCTAcATATC GTcTACAATT AGTTTTATCT 
CTAAGGaAAG TAGTTATGTT CCTAcATATC GTcTACAATT AGTTTTATCT 
CTAAGGgAAG TAGTTATGTT CCTAtATATC GTcTACAATT AGTTTTATCT 
******_*** ********** ****_***** **_******* ********** 



3101 3150 
CATGTTGTAA AAGATGAAGA ATATGGgGAT GAGACTTCTT ACcATTATTT 
CATGTTGTAA AAGATGAAGA ATATGGgGAT GAGACTTCTT ACcATTATTT 
CATGTT G T A A AAGATGAAGA ATATGGgGAT GAGACTTCTT ACcATTATTT 
CATGTTGTAA AAGATGAAGA ATATGGgGAT GAGACTTCTT ACcATTATTT 
CATGTTGTAA AAGATGAAGA ATATGGgGAT GAGACTTCTT ACcATTA TTT 
CATGTTGTAA AAGATGAAGA ATATGGgGAT GAGACTTCTT ACcATTATTT 
CATGTTGTAA AAGATGAAGA ATATGGgGAT GAGACTTCTT ACcATTATTT 
CATGTTGTAA AAGATGAAGA ATATGGgGAT GAGACTTCTT ACcATT ATTT 
CATGTTGTAA AAGATGAAGA ATATGGaGAT GAGACTTCTT ACcATTATTT 
CATGTTGTAA AAGATGAAGA ATATGGaGAT GAGACTTCTT ACcATTATTT 
CATGTTGTAA AAGATGAAGA ATATGGaGAT GAGACTTCTT ACtATTATTT 



3151 3200 
CCATATAGAT CaAGAAGGTA AAGtGACACT TCCTAAAACg GTTAAGATAG 
CCATATAGAT CaAGAAGGTA AAGtGACACT TCCTAAAACg GTTAAGATAG 
CCATATAGAT CaAGAAGGTA AAGtGACACT TCCTAAAACg GTTAAGATAG 
CCATATAGAT CaAGAAGGTA AAGtGACACT TCCTAAAACg GTTAAGATAG 
CCATATAGAT CaAGAAGGTA AAGtGACACT TCCTAAAACg GTTAAGATAG 
CCATATAGAT CaAGAAGGTA AAGtGACACT TCCTAAAACg GTTAAGATAG 
CCATATAGAT CaAGAAGGTA AAGtGACACT TCCTAAAACg GTTAAGATAG 
CCATATAGAT CaAGAAGGTA AAGtGACACT TCCTAAAACg GTTAAGATAG 
CCATATAGAT CgAGAAGGTA AAGtGACACT TCCTAAAACa GTTAAGATAG 
CCATATAGAT CaAGAAGGTA AAGtGACACT TCCTAAAACa GTTAAGATAG 
CCATATAGAT CaAGAAGGTA AAGcGACACT TCCTAAAACg GTTAAGATAG 



3201 3250 
GAGAGAGTGA GGTTGCgGTA GACCCTAAGg CCTTGACACT TGTTGTGGAA 
GAGAGAGTGA GGTTGCgGTA GACCCTAAGg CCTTGACACT TGTTGTGGAA 
GAGAGAGTGA GGTTGCgGTA GACCCTAAGg CCTTGACACT TGTTGTGGAA 
GAGAGAGTGA GGTTGCgGTA GACCCTAAGg CCTTGACACT TGTTGTGGAA 
GAGAGAGTGA GGTTGCgGTA GACCCTAAGg CCTTGACACT TGTTGTGGAA 
GAGAGAGTGA GGTTGCgGTA GACCCTAAGg CCTTGACACT TGTTGTGGAA 
GAGAGAGTGA GGTTGCaGTA GACCCTAAGg CCTTGACACT TGTTGTGGAA 
GAGAGAGTGA GGTTGCaGTA GACCCTAAGg CCTTGACACT TGTTGTGGAA 
GAGAGAGTGA GGTTGCaGTA GACCCTAAGa CCTTGACACT TGTTGTGGAA 
GAGAGAGTGA GGTTGCaGTA GACCCTAAGa CCTTGACACT TGTTGTGGAA 
GAGAGAGTGA GGTTGCaGTA GACCCTAAGg CCTTGACACT TGTTGTGGAA 



3251 3300 
GATAAAGCTG GTAATTTtGC AACGGTAAAA TTGTCTGAcC TCTTGAATAA 
GATAAAGCTG GTAATTTtGC AACGGTAAAA TTGTCTGAcC TCTTGAATAA 
GATAAAGCTG GTAATTTtGC AACGGTAAAA TTGTCTGAcC TCTTGAATAA 
GATAAAGCTG GTAATTTcGC AACGGTAAAA TTGTCTGAtC TCTTGAATAA 
GATAAAGCTG GTAATTTcGC AACGGTAAAA TTGTCTGAtC T CTTG AATAA 
GATAAAGCTG GTAATTTcGC AACGGTAAAA TTGTCTGAtC TCTTGAATAA 
GATAAAGCTG GTAATTTtGC AACGGTAAAA TTGTCTGAcC TCTTGAATAA 
GATAAAGCTG GTAATTTtGC AACGGTAAAA TTGTCTGAcC TCTTGAATAA 
GATAAAGCTG GTAATTTcGC AACGGTAAAA TTGTCTGAcC TCTTGAATAA 
GATAAAGCTG GTAATTTcGC AACGGTAAAA TTGTCTGAcC TCTTGAATAA 
GATAAAGCTG GTAATTTcGC AACGGTAAAA TTGTCTGAcC TCTTGAATAA 



3301 3350 
GGCAGTAGTA TCAGAGAAAG AAAACGCTAT AGTAATTTCT AACAgTTTCA 
GGCAGTAGTA TCAGAGAAAG AAAACGCTAT AGTAATTTCT AACAgTTTCA 
GGCAGTAGTA TCAGAGAAAG AAAACGCTAT AGTAATTTCT AACAgTTTCA 
GGCAGTAGTA TCAGAGAAAG AAAACGCTAT AGTAATTTCT AACAgTTTCA 
GGCAGTAGTA TCAGAGAAAG AAAACGCTAT AGTAATTTCT AACAgTTTCA 
GGCAGTAGTA TCAGAGAAAG AAAACGCTAT AGTAATTTCT AACAgTTTCA 
GGCAGTAGTA TCAGAGAAAG AAAACGCTAT AGTAATTTCT AACAgTTTCA 
GGCAGTAGTA TCAGAGAAAG AAAACGCTAT AGTAATTTCT AACAgTTTCA 
GGCAGTAGTA TCAGAGAAAG AAAACGCTAT AGTAATTTCT AACAaTTTCA 
GGCAGTAGTA TCAGAGAAAG AAAACGCTAT AGTAATTTCT AACAaTTTCA 
GGCAGTAGTA TCAGAGAAAG AAAACGCTAT AGTAATTTCT AACAgTTTCA 
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Consensus 



msal83564.2(l47 COH1 
msal83564 . 2 { 147JA732 
msal83564.2(147 M781 
rasal83564 . 2 { 147~2603 
msalB3564.2(l47_OM9130013 
msal8 3 564.2(147 18RS21 
rosal83564.2{l47 090; 
msal83564.2(l47 CJB110 
msal83564 . 2 ( 147_A909 
msal 8 3 564. 2 {147^363' 
msal83 564.2 (l47_1169NT 
Consensus 



3351 

AATATTTTGA 
AATATTTTGA 
AATATTTTGA 
AATATTTTGA 
AATATTTTGA 
AATATTTTGA 
AATATTTTGA 
AATATTTTGA 
AATATTTTGA 
AATATTTTGA 
AATATTTTGA 



TAACTTGAAg 
TAACTTGAAg 
TAACTTGAAg 
TAACTTGAAa 
TAACTTGAAa 
TAACTTGAAa 
TAACTTGAAa 
TAACTTGAAa 
TAACTTGAAa 
TAACTTGAAa 
TAACTTGAAa 



AAAGAAcCTA 
AAAGAAcCTA 
AAAGAAcCTA 
AAAGAAcCTA 
AAAGAACCTA 
AAAGAACCTA 
AAAGAAtCTA 
AAAGAAtCTA 
AAAGAAcCTA 
AAAGAAcCTA 
AAAGAAcCTA 



TGTTTATTTC 
TGTTTATTTC 
TGTTTATTTC 
TGTTTATTTC 
TGTTTATTTC 
TGTTTATTTC 
TGTTTATTTC 
TGTTTATTTC 
TGTTTATTTC 
TGTTTATTTC 
TGTTTATTTC 



3400 
TAAAgAAGgA 
TAAAgAAGgA 
TAAAgAAGgA 
TAAAaAAGaA 
TAAAaAAGaA 
TAAAaAAGaA 
TAAAgAAGgA 
TAAAgAAGgA 
TAAAgAAGgA 
TAAAgAAGgA 
TAAAaAAGaA 



rasal 83 5 64 . 2 { 14 7_COHl ' 
msal83564.2 147J4732 1 
rasal83564 .2 14 7_M781 
msal83564. 2(147 2603 
rasal83564 .2 (l47_JM9130013 
msal83564 .2{l47_18RS21 
msal83564.2(l47 090 
msal83S64.2(l47 CJB110 
msal 8 3 564 . 2 ( 14 7_A90 9 
rasal 8 3 564 . 2 { 147_H36B f 
msal83564 . 2 { 147_1169NT 
Consensus 



3401 

AAAGTAGTAA 
AAAGTAGTAA 
AAAGTAGTAA 
AAAGTAGTAA 
AAAGTAGTAA 
AAAGTAGTAA 
AAAGTAGTAA 
AAAGTAGTAA 
AAAGTAGTAA 
AAAGTAGTAA 
AAAGTAGTAA 



ACAAGAATCT 
ACAAGAATCT 
ACAAGAATCT 
ACAAGAATCT 
ACAAGAATCT 
ACAAGAATCT 
ACAAGAATCT 
ACAAGAATCT 
ACAAGAATCT 
ACAAGAATCT 
ACAAGAATCT 



AGAAGAAATA 
AGAAGAAATA 
AGAAGAAATA 
AGAAGAAATA 
AGAAGAAATA 
AGAAGAAATA 
AGAAGAAATA 
AGAAGAAATA 
AGAAGAAATA 
AGAAGAAATA 
AGAAGAAATA 



a cATTAGTT A 
acATTAGTTA 
a cATTAGTT A 
atATTA GTTA 
atATTAGTTA 
atATTAGTTA 
acATTAGTTA 
acATTAGTTA 
gcATTAGTTA 
g cATTAGTT A 
atATTAGTTA 



3450 
AGCCtCAaAC 
AGCCtCAaAC 
AGCCtCAaAC 
AGCCgCAaAC 
AGCCgCAaAC 
AGCCgCAaAC 
AGCCgCAaAC 
AGCCgCAaAC 
AGCCgCAaAC 
AGCCgCAaAC 
AGCCgCAcAC 



msal 83 564 .2(147 COH1 
msal 8 3 S64 . 2 ( 14 7~M73 2 
tnsal83564.2(l47_M78l' 
rasal83564.2(147_2603 
msal 8 3 564 . 2 ( 147_JM9130013 
msal83564.2(l47 18RS21 
msal83564 .2{l47_090l 
msal83564.2(l47 CJB110) 
msal 83564 . 2 { 14 7_A9 0 9 J 
msal83564 . 2 { 147_H3 6B J 
msal83564.2{l47_1169NT) 
Consensus 



3451 

TACAGTTACT 
TACAGTTACT 
TACAGTTACT 
TACAGTTACT 
TAC AGTTA CT 
TACAGTTACT 
TACAGTTACT 
TACAGTTACT 
TACAGTTACT 
TACAGTTACT 
TACAGTTACT 



ACTCAATCAT 
ACTCAATCAT 
ACTCAATCAT 
ACTCAATCAT 
ACTCAATCAT 
ACTCAATCAT 
ACTCAATCAT 
ACTCAATCAT 
ACTCAATCAT 
ACTCAATCAT 
ACTCAATCAT 



TGTCTAAAGA 
TGTCTAAAGA 
TGTCTAAAGA 
TGTCTAAAGA 
TGTCTAAAGA 
TGTCTAAAGA 
TGTCTAAAGA 
TGTCTAAAGA 
TGTCTAAAGA 
TGTCTAAAGA 
TGTCTAAAGA 



AATAACTaAA 
AATAACTaAA 
AATAACTaAA 
AATAACTaAA 
AATAACTaAA 
AATAACTaAA 
AATAACTaAA 
AATAACTaAA 
AATAACTcAA 
AATAACTcAA 
AATAACTaAA 



3500 
TCAGGAAATG 
TCAGGAAATG 
TCAGGAAATG 
TCAGGAAATG 
TCAGGAAATG 
TCAGGAAATG 
TCAGGAAATG 
TCAGGAAATG 
TCAGGAAATG 
TCAGGAAATG 
TCAGGAAATG 



msal83S64.2{l47 COH1 
msal83564.2(l47*~M732 
msal83564 . 2 { 147J478 1 
tnsal83564 . 2 ( 147_2603 
msal83564.2(l47_JM9130013 
msal83564 . 2 { 147_18RS21 
msal83564 .2{147_090 
msal 83 564 . 2 { 147_CJB110 
msal83564.2(l47 A909 
msal 8 3 564 . 2 { 14 7_H36B 
msal83564 . 2 ( 147_1169NT 
Consensus 



3501 

AGAAAGTCCT 
AGAAAGTCCT 
AGAAAGTCCT 
AGAAAGTCCT 
AGAAAGTCCT 
AGAAAGTCCT 
AGAAAGTCCT 
AGAAAGTCCT 
AGAAAGTCCT 
AGAAAGTCCT 
AGAAAGTCCT 



CACTTCTACA 
CACTTCTACA 
CACTTCTACA 
CACTTCTACA 
CACTTCTACA 
CACTTCTACA 
CACTTCTACA 
CACTTCTACA 
CACTTCTACA 
CACTTCTACA 
CACTTCTACA 



AACAATAATA 
AACAATAATA 
AACAATAATA 
AACAATAATA 
AACAATAATA 
AACAATAATA 
AACAATAATA 
AACAATAATA 
AACAATAATA 
AACAATAATA 
AACAATAATA 



GTAGcAGAGT 
GTAGcAGAGT 
GTAGcAGAGT 
GTAGcAGAGT 
GTAGcAGAGT 
GTAGcAGAGT 
GTAGcAGAGT 
GTAGcAGAGT 
GTAGcAGAGT 
GTAGcAGAGT 
GTAGtAGAGT 



3550 
AGCTAAgATC 
AGCTAAgATC 
AGCTAAgATC 
AGCTAAgATC 
AGCTAAgATC 
AGCTAAgATC 
AGCTAAgATC 
AGCTAAgATC 
AGCTAAgATC 
AGCTAAgATC 
AGCTAAaATC 



msal83564 . 2[ 147_C0H1 
msal83564 . 2 f 147 J4732 
msal83564 . 2 j 147_M781 
msal83564 . 2 { 147_2603 
rasal83S64 . 2 { 147 JM9130013 
msal 8 3 564 . 2(l47_18RS21 
0isal83564.2(l47 090 
msalB3564.2{l47 CJB110 
msal 8 3 564 . 2 { 147_A909 
msal83564. 2(147^68 
msal83564.2{l47_1169NT 
Consensus 



3551 

ATATCACCTA 
ATATCACCTA 
ATATCACCTA 
ATATCACCTA 
ATATCACCTA 
ATATCACCTA 
ATATCACCTA 
ATATCACCTA 
ATATCACCTA 
ATATCACCTA 
ATATCACCTA 



AACATAAcGG 
AACATAAcGG 
AACATAACGG 
AACATAAcGG 
AACATAAcGG 
AACATAAcGG 
AACATAAcGG 
AACATAAcGG 
AACATAAcGG 
AACATAACGG 
AACATAAtGG 



GGATTCTGTT 
GGATTCTGTT 
GGATTCTGTT 
GGATTCTGTT 
GGATTCTGTT 
GGATTCTGTT 
GGATTCTGTT 
GGATTCTGTT 
GGATTCTGTT 
GGATTCTGTT 
GGATTCTGTT 



3600 

AACCATACC 

AACCATACC 

AACCATACC 

AACCATACCt tacctagtac 

AACCATACC' 

AACCATACC 

AACCATACC 

AACCATACC 

AACCATACC 

AACCATACC 

AACCATACC 



rasal83564 .2{l47_C0Hl} 
msal83564.2{l47 M732J 
msal83564 . 2 { 147_M781 } 
tnsal 83 564 . 2 { 14 7_2 603 ) 
msal8 3564. 2 ( 147 _JM9 130013) 

msal83564.2{l47_18RS21> 
msalB3564.2(l47_090] 

msalB3564. 2(147 CJBlloj 
msal83564.2(l47_A909) 
msal83564. 2(147 H36B} 



3601 



3650 



atcagataga gcaacgaatg gtctatttgt tggtactttg gcattgttat 
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msal83564 .2 { 147_1169NT} 
Consensus 



msal83564 . 2 ( 147_COHl 
msa!83564.2 147J4732 
msal83564.2 147_M781 
msal83564.2{l47 2603 
msal83564 . 2 { 147_JM9130013 
msa!83564 . 2 { 147_18RS21 
msal83564 .2{l47_090 
msal83564 . 2 { 147_CJB110 
msal83564 . 2 { 147_A909 
msal83S64 . 2 { 147_H36B 
msal83 564 . 2 { 147_1169NT 
Consensus 

SEQ ZD NO. 4412 
STRAIN 2603 

VDKHHSKKAI LKLTL ITTS I LLMHSNQVNAEEQELKNQEQS PVI ANVAQQ PS PS VTTNTV 
EKTSVTAASASNTAKEMGDTSVKOTKTEDELLEELSKNLDTSNL^ KPETTN 
NKESNVVTKASTAI AQKVPSAYEE\HCP ES KSS 1AVLDT S KI TKLQAI TQRGKGNWAI ID 
TGFDINHDI FRIJ^SPKDDKHSFKTKTEFEBLKAKHNITYGKWVNDKJW^ 
ADIAAAMKDGYGSEAKNISHGTHVAGI FVGNSKRPAINGLLLEGAAPNAQVLLMRI PDKI 
DSDKFGBAYAKAITDAVNLGAKTINMS IGKTADSLIALNDKVKIAIiKLASEKGVAVVVAA 
GNEGAFGMD YS KPLSTNPDYGTVN SPA I SEDTLSVASYESLKTI SEWETTI EGKLVKLP 
I VTS KP FDKGKAYD VVYANYGAKKD FEGKD FKGKI AL I ERGGGLD FMTKI THATNAG WG 
I VI FNDQEKRGNFL I PYRELPVG 1 1 SKVDGBRIKNTSSQLTPNQSPEWDSQGGNRMLEQ 
SSWGVTAEGAI KPDVTASGFEI YSSTYI^QYQTMSGTSMASPHVAGLMTMLQSHLAEKYK 
G>OJIjDSKKLLELSKNILMSSATALYSEEDKAFYS 
K7AKINLKRMGDKFDITVTIHKLVEGVKELYYQANVA^ 

I LPJ3KETQVRFT IDASQPSQKLKEQMANG Y FTiEG FVRFKEAKDSNQELMS I P FVGFNGDP 

VKNGGELEI^PESPKRII1^TFE^KVEDKTIHLLERDAANNPYPAISPNKIX3NRDEITP<3 
ATFLRNVKD I SAQVLDQHGNTVI WQSKVLPS YRKNFHNNPKQSDGHYRMDALQHSGLDKDG 
KWADGFYTTRLRYTP VAEGANSQE SDFKVQVSTKS PNLPSRAQFDETNRTLSLAMPKES 
SYVPTYRLQLVLSHVVKDEEYGDETSYHYFHIDQEGKVTLPKTVI^ 

WEDKAGNFATVKLSDLLNKAWS EKENA I VI SNS FKYFDNLKKE PMFI S KKEKWNKNL 
EEI ILVKPCTTVTTQSLSKEITKSGNEKVLTSTNNNSSRVAKI I SPKHNGDSVNHTLPST 
SDRATNGLFVGTLALLS SLLLYLKP KKTKNNS K 

SEQ ZD NO. 4413 
STRAIN A909 

EEQELKNQEQSPVIANVAOX2PSPSVTTNTVEKTSVTSASASOT 
LLEELSKNLOTSNIXSADI^EEYPSKPETTNNK^SNVVTNASTAIAQKVPSA 
SSLAVLDTSKITKLQAI TQRGKGNWAI I DTGFDINHDI FRLDSPKDDKHSFKTKAEFEE 
LKAKHNI TYGKWVNDKI VFAHNYANNTETVAD I AAAMKDGYGSEAKNI SHGTHVAG I FVG 
NSKRPAI NGLLLEGAAPNAQ VLLMR I PDKI DSDKFGEAYAKA ITDAVNLGAKT INMSLGK 
TADSL IALNDKVKIALKLASEKGVAVWAAGNEGAFGMDYSK^ PAI SE 

DTLSVASYESLKTI SEWETTI EGKLVKLP I VTSKP FDKGKAYD WYANYGAKKRL .R.G 
L.R. DCIN . AWWWT . FYD . NHSCYKCRCCWYRYF . RSRKTWKPSNSLP . ITCGGY . . SRW 
RAYKKYFKSVNI . PEF . SS . . PRWQS YAGT I KLGRDS . RSNQA . CNSFWL . NLFFNL . . S 
I PNNVWYKYGFTTCCRI NDNAS KS FG . EI . RDEFRF . KIARIV. KHPHELSNSI I . . RG . 
GVLFTTSARCRCS . C . KSYPSS ILCYWKRWQS . N . SQTSGR . I . YHSYNS . TCRRCQRIV 
LSS . CSNRTSK. R . I CP . TTSLARY . LAESNSS . . RNTSS IYY .F.SI . SE I KRTDGKWL 
FLRRFCTF . RSQG . . SGVNEYSFCRI . W. FCELTST . NTDL . DAF . R . FLL.TK. YNS . R 
PIGVQ . ISSP . KQQLYCLVNTI SVLGLC . LCQKWWGVRI STGESKKNYFRNF .E.G. G.N 
NSSFGKRCSE . S I FCHFSK . RWK . G . NHS PGNFLKKC . GYFCSSSRSKWKCYLAK . GFTI 
LS . KFP . . SKAK . WSLSYGCPS VEWFR . GWQSCSRWFLYLS FTLHTSSRRSK . SGVRL . S 
SSKY . VTKSSFTSSV . . N . SNI KLSKA . GK . LCSYI SSTI SPISCCKR . RIWR . DFLPLP 
PYRSRR . SDTS . NS - DRRE . GCSRP . DLDTCCGR . SW . FRNGKIV . PLE . GSSIRERKRY 
SNF . QFQIF . . LEKRTYVYF . RRKSSKQESRRNS IS .AANYSYYSI IV . RNNSIRK . ESP 
HFYKQ. . .QSS.DHIT.T.RGFC.PY 

SEQ ZD NO. 4414 
STRAIN H36B 

EEQELKNQEQSPVIANVAQQPS PSVTTNTVEKTSVTSASASNTAKEMGDTSVKNDKTEDB 
LLEBLSKNLDTSNLGADLEEEY PS KPETTNNKESNWTNASTAI AQKVPS AYEEVKPES K 
SSLAVLDTSKITKLQAI TQRGKGNWAI I DTGFDINHDI FRLDSPKDDKHSFKTKAEFEE 
LKAKMJI TYGKWVNDKI VFAHNYANNTETVAD I AAAMKDGYGSEAKNI SHGTHVAG I FVG 
NSKRPAI NGLLLEGAAPNAQVLLMRI PDKI DSDKFGEAYAKA ITDAVNLGAKT I NMSLGK 
TADSLIALNDKVKLALKLASEKGVAVVVAAGNE^ 

DTLSVASYESLKTI SEWETTI EGKLVKLP I VTS KPFDKGKAYDVWANYGAKKDFEGKD 
FKGKI ALIERGGGLDFMTKITHATNAGVVGIVIFNDQBKRGNFLIPYRELPVGVIS 
ERI KNTS SQLTFNQS FBWDSQGGNRMLEQSS WGVTAEGA I KPDVTASGFEI YSSTYNNQ 
YOTMSGTSMASPHVAGLWn4LQSHLAEKYKGMN^ 

AFY S PRQCjGAGVVDAEKAI QAQYYVTGNDG KAKI NLKRVGDKFD I TVT I HKL VEGVKEL Y 
YQANVATEQVNKGKFALKPCALLDTNWQKVI LRDKETQVRFTIDSSQFSQKLKEQMANGY 
FLEG FVRFKEAKD SNQELMS I P FVG FNGD F ANLQALETP I YKTLS KG S FYYKPNDTTHKD 
QLEYNESAPFESNNYTALLTQSASWGYVDYVKNGGELELAPES PKRI I LGTFENKVEDKT 
I HLLERDAANNPYFAI S PNKDGNRDE I TPQATFLRNVKD I SAQ VLDQNGNV I WQ S KVLPS 
YRKNFHNNPKQSDGHYRM>ALQWSGLDKDGKWADGFYT^ 
QVSTKSPNLPSRAQFDETNRTLSLAMPKESSYVPTYRI^LVI^m 



3651 3700 



ctagtttact tctttatttg aaacccaaaa agactaaaaa taatagtaaa 
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HIDQEGKVTLPKTVKIGESEVAVDPKTLTLVVEDKAG^ 

VI SNNFKYFDNLKKE PMF I SK12GKWNKNLEE I ALVKPQTTVTTQSLSKE I TQSGNEKVL 
TSTNNNSSRVAKI ISPKHNGDSVNHT 

. / 

SBQ XD NO. 4415 
STRAIN 18RS21 

EEQELKNQEQSPVIANVAQQPSPSVTTNTVEKTSVTAASA^ 
LLEELSKNLDTSNLGADLEEEYPSKPETTNbJKF^NVVTNAS^ 

SSLAVLDTSKITKLQAITQRGKGNWAI IDTGFDINHDI FRLDS PKDDKHS FKTKTEFEE 
LKAKHN I TYGKWVNDKI VPAHNYANNTETVAD IAAAMKDGYG SEAKNI SHGTHVAG I PVG 
NSKRPAI NGLLLEGAAPNAQVLLMR I PDKI DSDKFGEAYAKA I TD AVNLGAKT I NMS I G K 
TADSLIALNDKVKLJUiKLASEKGVAVWAAGNEGAFGMDYSKPLSTNPDYGTW PAISE 
DTLSVASYESLKTI SEWETTI EGKLVKLP I VTS KPFDKGKAYD WYANYGAKKDFEGKD 
FKGKI AL I ERGGGLD FWTKI THATNAGWG I VI FNDQEKRGNFLI PYRELPVG 1 1 SKVDG 
ERI KNTS S QLTFNQS FEWDSQGGNRMLEQSS WGVTAEGA I KPDVTASGFE I YSSTYNNQ 
YQTMSGTSMASPHVAGLMTMI^SHLAEKYKGMNLDS KXLLELS KN ILMSSATALYSEEDK 
AFYSPRQQGAGWDAEKAI QAQYY I TGNDGKAKI NLKRMGDKFD I TVTI HKLVEGVKELY 
YQANVATEQVNKGKFALKPO^LDTNWQKVI LRDKETQVR 

FLEG FVRFKEAKDSNQELMS I PFVGFNGDFANIiQALETP I YKTI SKGSFYYKPNDTTHKD 
QLEYNESAPFESNNYTALLTQSASWGYVDYVKNGGELELAPESPKRI I LGTFENKVEDKT 
I HLLERDAANNP YFA I S PNKDGNRDE I TPQAT FLRNVKD I SAQVLDQNGNVI WQSKVLP S 
YRKNFHNNPKQSDGHYR^AI^WSGLDKDGKVVADGFYTYR^^ 
QVSTKSPNLPSRAQFDETNRTLSLAMPKESSYVPTYRLQLVLSHVVK^ 
HIDQEGKVTLPKTVKIGESEVAVDPKALTLVVEDKAGNFATVKLSDIA^KAWSEKENAI 
VISNSFKYFDNLKKEPMFI SKKEKWNKNLBEI I LVKPQTTVTTQSLSKE I TKSGNBKVL 
TSTNNNSSRVAKI I SPKHNGDSVNHT 

SBQ ID NO. 4416 
STRAIN M732 

EEQELKNQEQSPVI ANVAQQPS PSVTTN I VEKTS VTAASASNT\fi<EMGDTSVKNDKTEDE 
LLEELSKNLDTSNLGADLEEEY PSKPETTNNKESNVVTNASTAI AQKVPSAYEEVKSES K 
SSLAVLDTSKITKLQATTQRGKGNWAI IDTGFDINHDI FRLDSPKDDKHSFKTKAE FEE 
LKAKHNI TYGKWVNDKI VFAHNYANNTETVAD IAAAMKDGYG S EAKN I LHGTHVAG I FVG 
NS KRPAI NSLLLEGAAPNAQVLLMRI PDKI DSDKFGEAYAKAI I DAVNLGAKTINMSLGK 
TADSLIALNDKVKIALKIiASEKGVAWVAA^ SB 
DTLSVASYESLKTI SEWETTI EGKLVKLP I VTSKPFDKGKAYDVWANYGAKKILKVRT 
LKVRLH . LSVWDLIL . LKSLMLQMQVLLVSLFLTI KKNVEI F . FLTVNYLWGLLVK. MA 
SV . KILQVS . HLTRVLK . LI AKVAI VCWNNQVGA . QLKEQSSLM . QLLALKFILQPI I IN 
TKQCLVQVWLHHMLQD . . QCFKVIWLRNIKG . I . ILKNC . NCLKTSS . AQQQHY I VKRI R 
RFIHHVSKVQV. LMLKKLSKLNIMLLETMAKLKLISNEREINLISQLQFINL . KVSKNCI 
I KLM . QQNK . I KVNLPLNHKPC . ILIGRK . FFVI KKHKFDLLLMLVNLVRN . KNRKQMVI 
S . KVLYVLKKPRIVIRS . . VFLL . DLMVI LRTYKHLKHRP I RRFLKWST I NQM IQLIKT 
NWSTMNQLLLKATTILPC . HNQRLGAMLIMSKMVGS - N . HRRVQKELF . ELLRIRLRIKQ 
FI FWKBMQRI I HI LPFLQI KME IGTKSLPRQLS . EMLRIFLLKF . I KMEMLFGKVRFYHL 
I VKISI I IQSKVMVI IVWMLFSGW . IRMAKL- QMVFILIAYVTHQ . QKEQIVRSQTLKF 
K . VLSHQI FLHELSLMKLI EH . A . PCLRKWMFLH I VYN . FYLML - KMKNMGMRLLTI I S 
I . I KKVK .HFLKRLR . ERVRLR.TLRP . HLLWKI KLVI LQR . NCLTS . IRQ. YQRKKTL - 
. FLTVSNI LIT . RKNLCLFLKKEK . . TRI . KK.H . LSLKLQLLLNHCLKK . LNQEMRKSS 
LLOTI IVAE . LRSYHLNITGILLTI 

SBQ ID NO. 4417 
STRAIN COHl 

EEQELKNQEQSPVI ANVAO^PSPSVTTNIVEKTSVTAASASNTVKEMGDTS\^KNDKTEDE 
LLEELSKNLDTSNLGADLEEEYPSKPETTNNKE SNWTNASTA I AQKVPSAYEEVKS ES K 
SSLAVLDTSKITKLQATTQRGKGNVVAI IDTGFDINHDI FRLDSPKDDKHSFKTKAE FEE 
LKAKKNI TYGKWVNDKI VFAHNYANNTETVAD IAAAMKDGYGSEAKN I LHGTHVAG I FVG 
NSKRPAI NSLLLEGAAPNAQVLLMRI PDKI DSDKFGEAYAKA 1 1 DAVNLGAKTINMSLGK 
TADSLIALNDKVKLALKLASEKGVAVVVAAGNEGA SB 
DTLSVASYESLKTI SEWETTI EGKLVKLP I VTS KPFDKGKAYD VVYANYGAKKILKVRT 
LKVRLH . LSVWDLI L . LKSLMLQMQVLLVSLFLTIKKNVEI F . FLTVNYLWGLLVK . MA 
SV . KILQVS . HLTRVLK . LI AKVAI VCWNNQVGA . QLKEQSSLM . QLLALKFILQPI I IN 
TKQCLVQVWLHHMLQD . -QCFKVIWLRNIKG, I . ILKNC .NCLKTSS .AQQQHY I VKRI R 
RFIHHVSKVQV . LMLKKLSKLNIMLLETMAKLKLISNEREINLI SQLQFINL . KVSKNCI 
I KLM. QQNK . I KVNLPLNHKPC . ILIGRK. FFVI KKHKFDLLLMLVNLVRN . KNRWQMVI 
S . KVLYVLKKPRIVIRS . . VFLL . DLMVI LRTYKHLKHRP I RRFLKWST I NC^I IQLIKT 
NWSTMNQLLLKATTILPC . HNQRLGAMLIMSKMVGS . N . HRRVQKELF . ELLRIRLRIKQ 
FI FWKEMQRI I H I LPFLQI KMEIGTKSLPRQLS . EMLRIFLLKF . I KMEMLFGKVRFYHL 
IVKISI I IQSKVMVI IVWMLFSGW . IRMAKL . QMVFILIAYVTHQ . QKEQIVRSQTLKF 
K. VLSHQI FLHELSLMKLI EH . A . PCLRKWMFLH I VYN . FYLML . KMKNMGMRLLTI IS 
I . I KKVK . HFLKRLR . ERVRLR .TLRP . HLLWKI KLVI LQR . NCLTS .IRQ. YQRKKTL . 
. FLTVSNILIT . RKNLCLFLKKEK . . TRI .KK.H . LSLKLQLLLNHCLKK . LNQEMRKSS 
LLOTI IVAE . LRSYHLNITGILLTI 

SBQ XD NO. 4418 
STRAIN K781 

EEQELKNQEQSPVIANVAC^PSPSVTTNIVEKTSVTAASASNTVKEMG 

LLEELSKNLDTSNLGADLEEEYPSKPETTNNKESNWTNASTAIAQKVPSA 

S S LAVLDTS KI TKLQATTQRGKGNVVA 1 1 DTGFD INHDI FRLDSPKDDKHSFKTKAE FEE 

LKAKHNITYGKWVNDKI WAHNYANNTETVADIAAA^IKDGYGSEAKNI LHGTHVAG I FVG 

NSKRPAI NSLLLEGAAPNAQVLLMRI PDKI DSDKFGEAYAKAI I DAVNLGAKTINMSLGK 

TADSLIAL1TOKVKLALKLASEKGVAVWAAG 

DTLSVASYESLKTI SEWETTI EG KLVKL P I VTS KPFDKG KAYDWY ANYGAKKI LKVRT 
LKVRLH . LSVWDLIL . LKSLMLCWQVLLVSLFLT I KKNVE I F . FLTVNYLWGLLVK. MA 
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SV . KILQVS . HLTRVLK . LI AKVAI VCWNNQVGA . QLKEQSSLM . QLLALKFILQPI I IN 
TKQCLVQVWLHHMLQD . . QCFKVTWLRNIKG. I . ILKNC .NCLKTSS . AQQQHYIVKRIR 
RF IHHVS KVQV . LMLKKLS KLN I MLLETMAKLKLI SNERE I NL I SQLQF I NL . KVS KNC I 
IKLM . QQNK . I KVNLPLNHKPC . ILIGRK. FPVI KKHKFDLLLMLVNLVRN . KNRWQMVI 
S . KVLYVLKKPRIVIRB . . VFLL . DIMVILRTYKHLKHRFIRRFLKWSTINQMIQLIKT 
NWSTMNQLLLKATT I L PC . HNQRLGAML I MS KMVGS . N . HRRVQKEL F . ELLRIRLRIKQ 
FIFWKEMQRIIHILPFLQIKMEIGTKSLPRQLS . EMLRIFLLKF . I KMEMLFGKVRFYHL 
IVKISI I IQSKVMVI IVWMLFSGW . IRMAKL . QMVF I L I AYVTHQ . QKEQIVRSOTLKF 
K . VLSHQ I FLHBLSLMKL I EH . A . PCLRKWMFLH I VYN . FYLML . KMKNMGMRLLT 1 1 S 
I . I KKVK . HFLKRLR . ERVRLR . TLRP . HLLWKI KLVILQR . NCLTS .IRQ. YQRKKTL . 
. FLTVSNIL I T . RKNLCLFLKKEK ...TRI.KK.H. LSLKLQLLLNHCLKK . LNQEMRKSS 
LLQTI IVAE . LRSYHLNITGILLTI 

SBQ ZD NO. 44X9 
STRATH JM9130013 

EEQELKNQEQSPVIANVAQQPSPSVTTNTVBKTSVTAASASNTAKEMGOT 
LI^LSKNI*DTSNIiGADLBEEYPSKPBTTNNKES 

SS LAVLDTS KI TKLQAI TQRGKGNWAI IDTGFDINHDIFRLDSPKDDKHSPKTKTEFEE 
LKAKHN I TYG KWVNDKI WAHNYANNTETVAD I AAAMKDGYG S EAKN I S HGTHVAG I FVG 
NSKRPAINGLLLEGAAPNAQVLLMRI PDKIDSDKFGEAYAKAITDAVNLGAKTINMS IGK 
TADSLIAI^K?/Kl^KIJ\SBKGVAVWAAGNEGArcMDYSKPLSTNPDYGTVNS PAI SE 
DTLSVASYESLKTI SEWETTI EGKLVKLP I VTSKPFDKGKAYDWYANYGAKKDFEGKD 
FKGKIALIERGGGLDFMTKITHATNAGWGIVI FNDQEKRGNFLI PYRELPVGI I SKVDG 
ERI KNTS SQLTFNQS FEWDSQGGNRMLEQSS WG VTAEGAI KPDVTASG FE I YSSTYNNQ 
YQTMSGTSMASPHVAGLMTMLQSHLAEKYKGMNLDSKKLLELSKNII^^ 
AFYSPRQQGAGWDAEKAI QAQYY ITGNDGKAKI NLKRMGDKFD ITVTI HKLVEGVKELY 
YQANVATEQVNKGKFALKPQALIiDTNWQKV I LRD KETQVRFT I DASQFSQ KLKEQMANGY 
FI^GFVRFKEAKDSNQELMSI PFVGFNGDFANLQALETPI YKTLSKGSFYYKPNITCTHKD 
QLEYNESAP FESNNYTALLTQS AS WGYVDYVKNGG ELE LAPE S PKRI ILGTFENKVEDKT 
IHLLERDAANNPYFAI S PNKDGNRDEITPG^TFLRllVKDI SAQVLDQNGNVI WQSKVLPS 
YRKNFHNNPKQSIX3HYR>mALQWSGLJ3KDGKVYADGFYTYRLRYTP^ 
QVSTKSPNLPSRAQFDBTNRTI^LAMPKEESYVPTYRIC^^ 
HIIX2EGKVTLPKTVKIGESEVAVDPKALTLVVBDKAGNFATVKL 

VI SNS FKYFDNIiKKEPMFI SKKEKWNKNLEE 1 1 LVKPQTTVTTQSLSKE ITKSGNEKVL 
TSTNNNSSRVAKI ISPKHNGDSVNHT 

SEQ ID NO. 4420 
STRAIN 090 

EEQELKNQEQSPVIANVAQQPSPSVTTNIVEKTSVTAASA^ 

LLEELS KNLDTSNLGADLEEEY PS KPBTTNNKESNWTNASTAI AQKVPS AYEEVKPES K 
SSLAVFDTSKITKLQAITQRGKGNVVAIIDTGFDINHDIFR^jD 

LKAKHNI TYG KWVNDKI VFAHNYANNTETVAD I AAAMKDGYG SEAKN I SHGTHVAG I FVG 
NS KRPAI NGLLLEGAAPNAQVLLMRI PDKI DSD KFGEAYAKA I TDAVNLGAKT I NMSLGK 
TADSLIAI2JDKVKLALKIASEKGVAVWAAGNEGA PAI SE 

DTLSVASYESLKTI SBVVETT I EGKLVKLP I VTSKPFDKGKAYDWYANYGAKKDFEGKD 
FKGKI AL I ERGGGLDFMTK I THATNAGVVG I VI FNDQEKRGNFLI PYRELPVGVI SKVDG 
ERI KNTSSQLTFNQS FEVVDSQGGNRMLEQSSWGVTAEGAI KPDVTASGFE I YSSTYNNQ 
YO^mSGTSMASPHVAGIMTMIiQSHLAEKYKGMNLDSKKLL^^ 

AFYS PRQQGAGWDAEKAI Q AQYYVTGNDGKAKI NLKRVGD KFD I TVT I HKLVEGVKELY 

YQANVATEQVNKGKFALKPQALLDTNWQKVI LRD KETQVRFT I DASQFSQKLKEQMANGY 

FLEGFVRFKEAKDSNQELMS I PFVGFNGDFANLQALETP I YKTLS KGSFYYKPNDTTHKD 

QLEYNESAP FESNNYTALLTQSASWGYVDYVKNGGELELAPE S PKRI ILGTFENKVEDKT 

I HLLERDAANNP YFAI S PNKDGNRDE I TPQATFLRNVKD I SAQVLDQNGNVI WQS KVLPS 

YRKNFHNNPKQSDGHYRMDAFQWSGLDKDGKVVADGFYT^ 

QVSTKSPNLPIjLAQFDETNRTLSLAMPKESSYVPTYRIG^ 

HIDQEGKVTLPKTVKIGESEVAVDPKALTLVVEDKAGNFATVKLSDLL^ 

VI SNSFKYFDNLKKBSMFI SKEGKVVNKNLEB ITLVKPQ'ri'VTl'QSLSKE ITKSGNEKVL 

TSTNNNSSRVAKI I S PKHNGDS VNHT 

SEQ ZD NO. 4421 
STRAIN CJBX10 

EEQELKNQEQS PVI ANVAQQPS PS VTTN I VEKTSVTAASASNTAKEMGDTS VKNDKTBDE 
LliEELSKNLDTSNLGADIiEEEYPSKPETTNNKESNVVTN^ 

SSLAVFDTSKITKLQAI TQRGKGNWAI IDTGFDINHDIFRLDSPKDDKHSFKTKAEFEE 
LKAKHNITYGKWVNDKI VFAHNYANNTETVAD I AAAMKDGYG SEAKN I SHGTHVAG I FVG 
NSKRPAINGLLLEGAAPNAQVLLMRI PDKI DSDKFGEAYAKAI TDAVNLGAKTINMSLGK 
TADSLIAI^NDKVTCLALKLASEKGVAVVVAAGNEGA 

DTLSVASYESLKT I SEWETTI EGKLVKLP I VTSKPFDKGKAYDWYANYGAKKDFEGKD 
FKGKXAL I ERGGGLD FMTKI THATNAGVVG I VI FNDQEKRGNFLI PYRELPVGVI SKVDG 
ERI KNTS SQLTFNQS FEWDSQGGNRMLEQSS WGVTAEGA I KPDVTASG FE I YSSTYNNQ 
YQTMSOTSMASPHVAGLMTMLQNHLAEKYKGMNL^ 

AFYSPRQQGAGWDAEKAI QAQYYVTGNDGKAKI NLKRVGDKFDI TVT I HKLVEGVKELY 

YQANVATEQVNKGKFALKPQALLDTNWQKVI LRDKETQVRFT I DASQFSQKLKEQMANGY 

FLEGFVRFKEAKDSNQEIMSIPFVGFNGDFANLQ^LETPIYKrLSKGS 

QLEYNESAP FESNNYTALLTQSAS WGYVDYVKNGGELELAPBS P KR I- 1 LGTFENKVED KT 

IHLLERDAANNPYFAI S PNKDGNRDE I TPQATFLRNVKD I SAQVLDQNGNVI WQSKVLPS 

YRKNFHNNPKQSDGHYRMDAFQWSGLDKDGKVVADGFYTYRLRYTPVA^ 

O^STKSPNLPLLAQFDETNRTLSLAMPKESSYVPTYRLQL^ 

H I DQEGKVTL PKTVKI GES E VAVD P KALTLWFJ)KAGNFATVKLSDLLN KAWS BKENA I 

VISNSFKYFDNLKKESMFISKEGKWNKNLEBITLVKPGTTV^ 

TSTNNNSSRVAKI I SPKHNGDSVNHT 

SBQ ZD NO. 4422 
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Table 44: Comparative Sequences relating to SAG0416 (strain info highlighted in BOLD) 



STRAIN 1169NT 

EBQELKNQEQSPVIANVAQQPSPSVTTNrVEKTSVTAASASm'AKEMGm'SVKmDKTEDE 
LLEELSKNLDTSNMGADI^EEYPSKPBTTNNKESN\A^ 

SSLAVLDTSKITKLQAI TQRGKGNWAI IDTGFDINHDIFRJtiDSPKDDKHSFKNKABFEE 
LKAKHN I TYG KWVNDKI VFAHNYANNTETVAD I AAAMKDG YG SEAKN I S HGTHVAG I FVG 
NS KRP AI NGLLLEGAAPNAQ VLLMR IPDKI DSDKFGEAY AKA I TDAVNLGAKT INMSIGK 
TADSLIALNDKVKIJUiKLASEKGVAVVVAAGN^ 

DTLSVAS YES LKT I S E WETT I EG KLVKLi P I VTSKPPDKGKAYD WYANYGAKKD FEGKD 
FKGKIALIERGGGLDFMTKITHATNAGWGIVI FNDQEKRGNFLI PYRELPVGVI SKVDG 
ERIKOTSSQLTFNQREEVVDSQGGNRMLEQSSWGVTAEGAI KPDVTASG FE I YSSTYNNQ 
YQTMSGTSMASPHVAGLMTMLQSHLAEKYKGMNIJDSKK^ 

APYSPRQQGAGWDAEKAI QAQYYVTGNDGKAKJNLKR.VGDKFD I TVTI HKLVEGVKELY 
YQANVATEQVNKGKFALKPQAIJJDTNWQKV I LRDKETQVRFT I DASQ PSQKLKEQMANG Y 
FLEGFVRFKEAKDSNQELMS I PFVGFNGDFAS LQALETP I YKTLS KGS FYYKPNDTTHKD 
QLEYNESAPFESNNYTALLTQSASWGYVDYVKNGGELEliAPESPKRI ILGTFENKVEDKT 
I HLLERDAANNPYFAI S PNKDGNRDE ITPQATFLRNVKD I SAQVLDQNGNVI WQS KVLPS 
YRKNFHNNPKQSDGHYRMDALQWSGLDKIXSKVVA^ 

QVSTKSPNLPSRAQFDETNRTLSLAMPKGSSYVP I YRbQLVLSHWKDBEYGDBTSYYYF 
HIDQEGKATLPKTVKIGESEVAVDPKALTLVVEDKAGNFAT\n^ 

VI SNSFKYFDNLKKEPMFI SKKEKVVNKNLEEI I LVKPHTTVTTQSLSKB ITKSGNEKVL 
TSTNNNSSRVAKI I SPKHNGDSVNHT 
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msa2 09368 . 2 { 147 jCOHl ' 
msa2 093 68 . 2 { 147~M732 
rasa209368.2{l47_M781 
msa209368.2{l47_18RS21 
msa2 09368.2(147 2603 
msa2093 68 . 2{ 147_JM9130013 
msa209368 . 2 { 147_090 
msa209368 . 2 { 147_CJB110 
msa2 09368 .2{147_1169NT 
msa209368.2(l47_H36B 
rasa20936B.2(l47_A909 



1 50 

EEQELKNQEQ SPVIANVAQQ 

EEQELKNQEQ SPVIANVAQQ 

EEQELKNQEQ SPVIANVAQQ 

EEQELKNQEQ SPVIANVAQQ 

vdkhhskkai lkltlittsi llmhsnqvna EEQELKNQEQ SPVIANVAQQ 

EEQELKNQEQ SPVIANVAQQ 

EEQELKNQEQ SPVIANVAQQ 

EEQELKNQEQ SPVIANVAQQ 

EEQELKNQEQ SPVIANVAQQ 

EEQELKNQEQ SPVIANVAQQ 

EEQELKNQEQ SPVIANVAQQ 



msa209368.2(l47 COHl| 
rasa209368.2(l47_M732 
rasa2 09368 .2(147_M781 
msa209368 . 2 { 147_18RS21 
msa209368.2{l47 2603 
msa209368 .2{l47_JM9130013 
msa209368 . 2 {147_090 
msa209368.2(l47 CJB110 
msa209368 . 2 { 147 1169NT 
msa2 093 68 .2(147 H36B 
msa209368 . 2 { 147~A909 
Consensus 



51 

PSPSVTTNiV 
PSPSVTTNiV 
PSPSVTTNiV 
PSPSVTTNtV 
PSPSVTTNtV 
PSPSVTTNtV 
PSPSVTTNiV 
PSPSVTTNiV 
PSPSVTTNiV 
PSPSVTTNtV 
PSPSVTTNtV 



EKTSVTaASA 
EKTSVTaASA 
EKTSVTaASA 
EKTSVTaASA 
EKTSVTaASA 
EKTSVTaASA 
EKTSVTaASA 
EKTSVTaASA 
EKTSVTaASA 
EKTSVTaASA 
EKTSVTsASA 



SNTvKEMGDT 
SNTvKEMGDT 
SNTvKEMGDT 
SNTaKEMGDT 
SNTaKEMGDT 
SNTaKEMGDT 
SNTvKEMGDT 
SNTaKEMGDT 
SNTaKEMGDT 
SNTaKEMGDT 
SNTaKEMGDT 



SVKNDKTEDE 
SVKNDKTEDB 
SVKNDKTEDE 
SVKNDKTEDE 
SVKNDKTEDE 
SVKNDKTEDE 
SVKNDKTEDE 
SVKNDKTEDE 
SVKNDKTEDE 
SVKNDKTEDE 



100 

LLEEL SKNLD 
LLEELSKNLD 
LLEELSKNLD 
LLEELSKNLD 
LLEELSKNLD 
LLEELSKNLD 
LLEELSKNLD 
LLEELSKNLD 
LLEELSKNLD 
LLEELSKNLD 
LLEELSKNLD 



msa209368 .2{l47_C0Hi; 
tnaa209368. 2(147 M732 
msa209368.2{147 - M781 
rasa2 09 3 68 . 2 { 147JL8RS2 1 
msa209368.2{l47 2603 
msa209368.2{l47 JM9130013 
msa2 0936872 (147_090 
msa20936B .2{l47_CJB110 
msa2 09368 .2(147 1169NT 
maa209368.2(l47 H36B 
msa2 09368 . 2 { 147JV909 
f Consensus 



101 

TSN1GADLEE 
TSN1GADLEE 
TSN1GADLEE 
TSN1GADLEE 
TSN1GADLEE 
TSN1GADLBE 
TSN1GADLEE 
TSN 1 GADLE E 
TSNmGADLEE 
TSN1GADLEE 
TSN1GADLEE 



EYPSKPETTN 
EYPSKPETTN 
EYPSKPETTN 
EYPSKPETTN 
EYPSKPETTN 
EYPSKPETTN 
EYPSKPETTN 
EYPSKPETTN 
EYPSKPETTN 
EYPSKPETTN 
EYPSKPETTN 



NKESNWTNA 
NKESNWTNA 
NKESNWTNA 
NKESNWTNA 
NKESNWTNA 
NKESNWTNA 
NKESNWTNA 
NKESNWTNA 
NKESNWTNA 
NKESNWTNA 
NKESNWTNA 



STAIAQKVPS 
STAIAQKVPS 
STAIAQKVPS 
STAIAQKVPS 
STAIAQKVPS 
STAIAQKVPS 
STAIAQKVPS 
STAIAQKVPS 
STAIAQKVPS 
STAIAQKVPS 
STAIAQKVPS 



150 

AYEEVKseSK 
AYEEVKs eSK 
AYEEVKseSK 
AYEEVKp eSK 
AYEEVKpeSK 
AYEEVKpeSK 
AYEEVKpeSK 
AYEEVKpeSK 
AYEEVKp kSK 
AYEEVKpeSK 
AYEEVKpeSK 



msa2 093 68 . 2 { 147_C0H1 
rasa209368.2ll47 M732 
tnsa209368 . 2 { 147 M781 
msa2 09 368.2(147 18RS21 
msa209368 . 2{ 147_2603 
msa209368 .2(147 JM9130013 
msa20936872{l47 090 
rosa2 09368 . 2 ( 147_CJB110 
rasa209368.2(l47_1169NT 
msa209368.2{!47 H36B 
ms a209368 . 2 { 147JV909 
Consensus 



151 

SSLAV1DTSK 
SSLAV1DTSK 
SSLAV1DTSK 
SSLAV1DTSK 
SSLAV1DTSK 
SSLAV1DTSK 
SSLAVf DTSK 
SSLAVfDTSK 
SSLAV1DTSK 
SSLAV1DTSK 
SSLAV1DTSK 



ITKLQAtTQR 
ITKLQAtTQR 
ITKLQAtTQR 
ITKLQAiTQR 
ITKLQAiTQR 
ITKLQAiTQR 
ITKLQAiTQR 
ITKLQAiTQR 
ITKLQAiTQR 
ITKLQAiTQR 
ITKLQAiTQR 



GKGNWAIID 
GKGNWAIID 
GKGNWAIID 
GKGNWAIID 
GKGNWAIID 
GKGNWAIID 
GKGNWAIID 
GKGNWAIID 
GKGNWAIID 
GKGNWAIID 
GKGNWAIID 



TGFDINHDIF 
TGFDINHDIF 
TGFDINHDIF 
TGFDINHDIF 
TGFDINHDIF 
TGFDINHDIF 
TGFDINHDIF 
TGFDINHDIF 
TGFDINHDIF 
TGFDINHDIF 
TGFDINHDIF 



200 

RLDSPKDDKH 
RLDSPKDDKH 
RLDSPKDDKH 
RLDSPKDDKH 
RLDSPKDDKH 
RLDSPKDDKH 
RLDSPKDDKH 
RLDSPKDDKH 
RLDSPKDDKH 
RLDSPKDDKH 
RLDSPKDDKH 



msa209368.2{l47_COHl) 
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SFKtKaEFEE LKAKHN I TYG KWVNDKI VFA HNYANNTBTV ADIAAAMKDG 
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Table 44: Comparative Sequences relating to SAG0416 (strain info highlighted in BOLD) 



msa209368 . 2 { 147_M732 ' 
msa20936B.2{l47_M781 
rasa209368 . 2 { 147_18RS21 
msa209368 . 2 {147_2603 
rasa209368.2{l47 JM9130013 
msa209368T2{l47_090 
msa209368.2(l47_CJB110 
msa209368 . 2 {147_1169NT 
msa209368.2(l47_H36B 
rasa209368.2{l47_A909 
Consensus 



SFKtKaEPEE 
SPKtKaEFEE 
SPKtKtEFEE 
SFKtKtEPBE 
SPKtKtEFEE 
SPKtKaEFEE 
SFKtKaEPEE 
SFKnKaEFEB 
SFKtKaEPEE 
SFKtKaEPEE 



LKAKHNITYG 
LKAKHNITYG 
LKAKHNITYG 
LKAKHNITYG 
LKAKHNITYG 
LKAKHNITYG 
LKAKHNITYG 
LKAKHNITYG 
LKAKHNITYG 
LKAKHNITYG 



KWVNDKIVFA 
KWVNDKIVFA 
KWVNDKIVFA 
KWVNDKIVFA 
KWVNDKIVFA 
KWVNDKIVFA 
KWVNDKIVFA 
KWVNDKIVFA 
KWVNDKIVFA 
KWVNDKIVFA 



HNYANNTETV 
HNYANNTBTV 
HNYANNTETV 
HNYANNTETV 
HNYANNTETV 
HNYANNTETV 
HNYANNTETV 
HNYANNTETV 
HNYANNTETV 
HNYANNTETV 



ADIAAAMKDG 
ADIAAAMKDG 
ADIAAAMKDG 
ADIAAAMKDG 
ADIAAAMKDG 
ADIAAAMKDG 
ADIAAAMKDG 
ADIAAAMKDG 
ADIAAAMKDG 
ADIAAAMKDG 



msa2 0 93 68 . 2 { 147 JXM1 
msa2 09368 . 2 { 147 J*732 
msa209368.2{147 M781 
msa2 0 93 6 8 . 2 { 147_18RS2 1 t 
msa209368 .2{l47_2603 
rasa209368 .2{l47_JM9130013 
msa209368.2{l47 090 
msa2093 68 . 2 { 147_CJB110 
msa20936B.2{147_1169NT 
msa209368 .2(147 H36B 
msa209368.2{l47~A909 
Consensus 



251 

YGSEAKNI1H 
YGSBAKNIlH 
YGSBAKNI1H 
YGSEAKNIsH 
YGSBAKNIsH 
YGSEAKNIsH 
YGSBAKNIsH 
YGSEAKNIsH 
YGSBAKNIsH 
YGSEAKNIsH 
YGSEAKNIsH 



GTHVAGIFVG 
GTHVAGIFVG 
GTHVAGIFVG 
GTHVAGIFVG 
GTHVAGIFVG 
GTHVAGIFVG 
GTHVAGIFVG 
GTHVAGIFVG 
GTHVAGIFVG 
GTHVAGIFVG 
GTHVAGIFVG 



NSKRPAINsL 
NSKRFAINsL 
NSKRPAINsL 
NSKRPAINgL 
NSKRPAINgL 
NSKRPAINgL 
NSKRPAINgL 
NSKRPAINgL 
NSKRPAINgL 
NSKRPAINgL 
NSKRPAINgL 



LLEGAAPNAQ 
LLEGAAPNAQ 
LLEGAAPNAQ 
LLEGAAPNAQ 
LLEGAAPNAQ 
LLEGAAPNAQ 
LLEGAAPNAQ 
LLEGAAPNAQ 
LLEGAAPNAQ 
LLEGAAPNAQ 
LLEGAAPNAQ 



300 

VLLMRIPDKI 
VLLMRIPDKI 
VLLMRIPDKI 
VLLMRIPDKI 
VLLMRIPDKI 
VLLMRIPDKI 
VLLMRIPDKI 
VLLMRIPDKI 
VLLMRIPDKI 
VLLMRIPDKI 
VLLMRIPDKI 



msa209368.2[l47 COHl' 
0183209368.2(147^732, 
msa209368.2{l47 M781 
msa2 09 3 68 . 2 { 147_18RS2 1 
msa2 093 68 . 2 { 147_2603 
msa209368 .2{147_JM9130013 
msa2 09368 . 2 { 147 J)90 
msa209368 . 2 ( 147_CJB110 
msa209368 . 2 { 147_1169NT 
msa209368 . 2 { 147_H36B 
msa209368 . 2 { 147_A909 
Consensus 



301 

DSDKFGEAYA 
DSDKFGEAYA 
DSDKFGEAYA 
DSDKFGEAYA 
DSDKFGEAYA 



DSDKFGEAYA 
DSDKFGEAYA 
DSDKFGEAYA 
DSDKFGEAYA 
DSDKFGEAYA 



KAIlDAVNLG 
KAIiDAVNLG 
KAIlDAVNLG 
KAItDAVNLG 
KAItDAVNLG 
KAItDAVNLG 
KAItDAVNLG 
KAItDAVNLG 
KAItDAVNLG 
KAItDAVNLG 
KAItDAVNLG 



AKTINMS1GK 
AKTINMS1GK 
AKTINMS1GK 
AKTINMS1GK 
AKTINMSiGK 
AKTINMSlGK 
AKTINMSIGK 
AKTINMSIGK 
AKTINMSiGK 
AKTINMSIGK 
AKTINMSIGK 



TADSLIALND 
TADSLIALND 
TADSLIALND 
TADSLIALND 
TADSLIALND 
TADSLIALND 
TADSLIALND 
TADSLIALND 
TADSLIALND 
TADSLIALND 
TADSLIALND 



350 

KVKLALKLAS 
KVKLALKLAS 
KVKLALKLAS 
KVKLALKLAS 
KVKLALKLAS 
KVKLALKLAS 
KVKLALKLAS 
KVKLALKLAS 
KVKLALKLAS 
KVKLALKLAS 
KVKLALKLAS 



msa2 0 93 68 . 2 ( 147_C0H1 
msa2 0 9368 . 2 { 147_M73 2 
msa209368. 2(147 M781 
msa209368 . 2 { 147_18RS21 
msa209368.2{l47_2603 
msa20936B . 2 { 147_JM9130013 
rasa209368 . 2 { 147_090 
msa209368.2(l47_CJB110 
msa209368 . 2 { 147_1169NT 
msa209368 .2{147_H36B 
msa209368 ,2{147_A909 
Consensus 



351 

EKGVAVWAA 
EKGVAVWAA 
EKGVAVWAA 
EKGVAVWAA 
EKGVAVWAA 
EKGVAVWAA 
EKGVAVWAA 
EKGVAVWAA 
EKGVAVWAA 
EKGVAVWAA 
EKGVAVWAA 



GNEGAFGMDY 
GNEGAFGMDY 
GNEGAFGMDY 
GNEGAFGMDY 
GNEGAFGMDY 
GNEGAFGMDY 
GNEGAFGMDY 
GNEGAFGMDY 
GNEGAFGMDY 



GNEGAFGMDY 



SKPLSTNPDY 
SKPLSTNPDY 
SKPLSTNPDY 
SKPLSTNPDY 
SKPLSTNPDY 
SKPLSTNPDY 
SKPLSTNPDY 
SKPLSTNPDY 
SKPLSTNPDY 
SKPLSTNPDY 
SKPLSTNPDY 



GTVNSPAISB 
GTVNSPAISE 
GTVNSPAISB 
GTVNSPAISE 
GTVNSPAISB 
GTVNSPAISB 
GTVNSPAISB 
GTVNSPAISE 
GTVNSPAISE 
GTVNSPAISE 
GTVNSPAISE 



400 

DTLSVASYES 
DTLSVASYES 
DTLSVASYES 
DTLSVASYES 
DTLSVASYES 
DTLSVASYES 
DTLSVASYES 
DTLSVASYES 
DTLSVASYES 
DTLSVASYES 
DTLSVASYES 



rasa209368. 2(147 COHl| 
msa209368 . 2 { 147J4732 
rasa2 09368 . 2 { 147_M781 ( 
msa20936B . 2 { 147_18RS2 1 
msa209368 .2{147_2603 
msa209368 .2{147_JM9130013 
msa209368 . 2 {l47_090 
msa2 09368 .2(147 CJB110 
msa209368.2{147"ll69NT 
msa209368 . 2( 147_H36B 
msa209368 . 2 { 147JV909 
Consensus 



401 

LKTISEWET 
LKTISEWET 
LKTISEWET 
LKTISEWET 
LKTISEWET 
LKTISEWET 
LKTISEWET 
LKTISEWET 
LKTISEWET 
LKTISEWET 
LKTISEWET 



TIEGKLVKLP 
TIEGKLVKLP 
TIEGKLVKLP 
TIEGKLVKLP 
TIEGKLVKLP 
TIEGKLVKLP 
TIEGKLVKLP 
TIEGKLVKLP 
TIEGKLVKLP 
TIEGKLVKLP 
TIEGKLVKLP 



IVTSKPPDKG 
IVTSKPFDKG 
IVTSKPFDKG 
IVTSKPFDKG 
IVTSKPFDKG 
IVTSKPFDKG 
IVTSKPFDKG 
IVTSKPFDKG 
IVTSKPFDKG 
IVTSKPFDKG 
IVTSKPFDKG 



KAYDWYANY 
KAYDWYANY 
KAYDWYANY 
KAYDWYANY 
KAYDWYANY 
KAYDWYANY 
KAYDWYANY 
KAYDWYANY 
KAYDWYANY 
KAYDWYANY 
KAYDWYANY 



450 

GAKKilkvrt 
GAKKilkvrt 
GAKKilkvrt 
GAKKdfegkd 
GAKKdfegkd 
GAKKdfegkd 
GAKKdfegkd 
GAKKdfegkd 
GAKKdfegkd 
GAKKdfegkd 
GAKKrl.r.g 



msa209368. 2(147 COHl 
msa209368. 2(147 M732 
msa209368.2{147 M781 
msa2 09368 .2{l47_18RS21 
msa209368 .2(147 2603 
msa209368 . 2 { 147_JM9130013 
msa209368?2{l47J)90 
msa209368 . 2 ( 147_CJB110 
msa209368.2{147 1169NT' 
insa209368 . 2 ( 147_H36B 
rasa20936B . 2 ( 147_A909 
Consensus 



451 

lkvrlh.lsv 
lkvrlh.lsv 
lkvrlh.lsv 
fkgkialier 
fkgkialier 
fkgkialier 
fkgkialier 
fkgkialier 
fkgkialier 
fkgkialier 
l.r.dcin.a 



wdlil.lks 
wdlil.lks 
wdlil.lks 
gggldfratki 
gggldfmtki 
gggldfmtki 
gggldfmtki 
gggldfmtki 
gggldfmtki 
gggldfmtki 
wwwt . fyd.n 



lmlqmqvllv 
lmlqmqvllv 
lmlqmqvllv 
thatnagwg 
thatnagwg 
thatnagwg 
thatnagwg 
thatnagwg 
thatnagwg 
thatnagwg 
hscykcrccw 



slfltikknv 
slfltikknv 
slfltikknv 
ivifndqekr 
ivifndqekr 
ivifndqekr 
ivifndqekr 
ivifndqekr 
ivifndqekr 
ivifndqekr 
yryf .rsrkt 



500 

eiF.fltvny 
eiF.f ltvny 
eiF.fltvny 
gnFlipyrel 
gnFlipyrel 
gnFlipyrel 
gnFlipyrel 
gnFlipyrel 
gnFlipyrel 
gnFlipyrel 
wkFsnslp . i 



501 



550 
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table 44: Comparative Sequences relating to SAG0416 (strain info highlighted in BOLD) 



xnsa2 0 93 68 . 2 f 14 7_COHl 
msa209368.2(l47_M732 
msa209368.2{l47_M781 
msa209368 .2 (l47_18RS21 
msa209368 . 2 { 147_2603 
msa20 93 68 . 2 { 14 7_JM9 13 0 0 1 3 
msa209368 . 2 {147_090 
msa209368.2(l47_CJB110 
msa209368 .2{l47_1169NT 
msa209368 . 2 f 147_H36B 
msa2 093 68 . 2 { 14 7_A90 9 
Consensus 



lwGllvk.ma 
lwGllvk.ma 
lwGllvk.ma 
pvGiiskvdg 
pvGiiskvdg 
pvGiiskvdg 
pvGviskvdg 
pvGviskvdg 
pvGviskvdg 
pvGviskvdg 
tcGgy. .srw 



sv.KilqvB . 
sv.Kilqvs . 
sv.Kilqve . 
eriKntssql 
eriKntBsql 
eriKntssql 
eriKntssql 
eriKntssql 
eriKntssql 
eriKntssql 
rayKkyfksv 



hltrvlk.li 
hltrvlk.li 
hltrvlk.li 
tfnqsfewd 
tfnqsfewd 
tfnqsfewd 
tfnqsfewd 
tfnqsfewd 
tfnqrf ewd 
tfnqsfewd 
ni.pef.ss. 



akvaivcwnn 
akvaivcwnti 
akvaivcwnn 
sqggnrtnleq 
sqggnrraleq 
sqggnrraleq 
sqggnrraleq 
sqggnrtnleq 
sqggnrtnleq 
sqggnnnleq 
.prwqsyagt 



qvga . qlkeq 
qvga.qlkeq 
qvga . qlkeq 
sawgvtaega 
sswgvtaega 
sawgvtaega 
sswgvtaega 
sawgvtaega 
sswgvtaega 
sswgvtaega 
iklgrds.rs 



msa2 093 68 . 2 f 14 7_COHl 
msa209368.2(147_M732' 
msa209368.2(147_M781 
msa209368 .2 { 147_18RS21 
msa209368.2{l47_26O3 
msa209368 .2{147_JM9130013 
msa209368 . 2 { 147_090 
msa209368.2(l47 CJB110 
rasa209368 . 2 { 147_1169NT 
rasa209368 . 2 { 147_H36B 
msa209368.2{l47_A909 
Consensus 



551 

sslm.qllal 
sslra.qllal 
sslm.qllal 
ikpdvtasgf 
ikpdvtasgf 
ikpdvtasgf 
ikpdvtasgf 
ikpdvtasgf 
ikpdvtasgf 
ikpdvtasgf 
nqa.cnsfwl 



kfilqpiiin 
kfilqpiiin 
kfilqpiiin 
eiysstynnq 
eiysstynnq 
eiysstynnq 
eiysstynnq 
eiysstynnq 
eiysstynnq 
eiysstynnq 
.nlffnl. .s 



tkqclvqvwl 
tkqclvqvwl 
tkqclvqvwl 
yqtmsgt Btna 
yqtmsgtsma 
yqtmsgt sma 
yqtmsgtsma 
yqtmsgtsma 
yqtmsgtsma 
yqtmsgtsma 
ipnnvwykyg 



hhmlqd. .qc 
hhmlqd. .qc 
hhmlqd. .qc 
sphvaglmtm 
sphvaglmtm 
sphvaglmtm 
sphvaglmtm 
sphvaglmtm 
sphvaglmtm 
sphvaglmtm 
f ttccrindn 



600 . 
fkviwlrnik 
fkviwlmik 
fkviwlrnik 
lqshlaekyk 
lqshlaekyk 
lqshlaekyk 
lqshlaekyk 
lqnhlaekyk 
lqshlaekyk 
lqshlaekyk 
asksf g . ei . 



ms a2 0 93 68 . 2 ( 14 7_COHl ' 
msa209368 . 2 { 147_M732 ( 
msa209368 . 2 { 147_M781 ( 
msa20936B . 2 { 147_18RS21 
msa209368 . 2 { 147_2603 
msa209368.2{l47_JM9130013 
msa209368 .2{l47_090 
msa2 09368.21 147_CJB110 
msa209368.2(147 1169NT 
msa209368 . 2 ( 147_H36B 
msa2 0 93 68 . 2 { 14 7_A9 0 9 
Consensus 



601 

g.i.ilknc. 
g ..i . ilknc . 
g.i.ilknc. 
gmnldskkll 
gmnldskkll 
gmnldskkll 
gmnldskkll 
gmnldskkll 
gmnldskkll 
gmnldskkll 
rdefrf .kia 



nclktss . aq 
nclktss.aq 
nclktss . aq 
elsknilmss 
elsknilmss 
elsknilmss 
elsknilmss 
elsknilmss 
elsknilmss 
elsknilmss 
riv.khphel 



qqhyivkrir 
qqhyivkrir 
qqhyivkrir 
atalyseedk 
atalyseedk 
atalyseedk 
atalyseedk 
atalyseedk 
atalyseedk 
atalyseedk 
snsii. .rg. 



rfihhvskvq 
rf ihhvskvq 
rfihhvskvq 
afysprqqga 
afysprqqga 
afysprqqga 
afysprqqga 
afysprqqga 
afysprqqga 
afysprqqga 
gvlfttsarc 



650 

v.lmlkKlsk 
v.lmlkKlsk 
v.lmlkKlsk 
gwdaeKaiq 
gwdaeKaiq 
gwdaeKaiq 
gwdaeKaiq 
gwdaeKaiq 
gwdaeKaiq 
gwdaeKaiq 
res . c . Ksyp 



msa20936B .2fl47_COHl 
msa209368.2fl47_M732| 
msa209368 . 2 { 147_M78l| 
msa209368.2{l47_18RS21 
msa209368.2{l47 2603 
msa209368.2{l47_JM9130013 
msa209368 . 2 { 147_090 
msa209368.2(l47 CJB110 
msa209368 . 2 { 147~1169NT 
msa209368 . 2 ( 147_H36B 
msa209368 .2{l47_A909 
Consensus 



651 

lnimlletma 
lnimlletma 
lnimlletma 
aqyyitgndg 
aqyyitgndg 
aqyyitgndg 
aqyyvtgndg 
aqyyvtgndg 
aqyyvtgndg 
aqyyvtgndg 
ssilcywkrw 



klklisnere 
klklisnere 
klklisnere 
kakinlkrmg 
kakinlkrmg 
kakinlkrmg 
kakinlkrvg 
kakinlkrvg 
kakinlkrvg 
kakinlkrvg 
qs.n.sqtsg 



inlisqlqfi 
inlisqlqfi 
inlisqlqfi 
dkfditvtih 
dkfditvtih 
dkfditvtih 
dkfditvtih 
dkfditvtih 
dkfditvtih 
dkfditvtih 
r.i.yhsyns 



nl.kvsknci 
nl . kvsknei 
nl . kvsknei 
klvegvkely 
klvegvkely 
klvegvkely 
klvegvkely 
klvegvkely 
klvegvkely 
klvegvkely 
. tcrrcqriv 



700 

iklm.qqnk. 
iklm.qqnk. 
iklm.qqnk. 
yqanvateqv 
yqanvateqv 
yqanvateqv 
yqanvateqv 
yqanvateqv 
yqanvateqv 
yqanvateqv 
lsB.csnrts 



msa209368 . 2 f 147_COHl ' 
msa20936B . 2 I 147_M732 
msa209368 .2(147_M7B1 
msa209368.2{l47__18RS21 
msa209368 .2{l47_2603 
msa209368 . 2 { 147_JM9130013 
msa209368.2{l47_090 
msa2Q9368 .2 { 147_CJB110 
msa209368.2{l47 1169NT 
ras a2 0 93 68 . 2 ( 14 7_H3 6B 
msa209368 .2{147_A909 
Consensus 



701 

ikvnlplnhk 
ikvnlplnhk 
ikvnlplnhk 
nkgkfalkpq 
nkgkfalkpq 
nkgkfalkpq 
nkgkfalkpq 
nkgkfalkpq 
nkgkfalkpq 
nkgkfalkpq 
k.r.icp.tt 



pc.iligrk. 
pc.iligrk. 
pc.iligrk. 
alldtnwqkv 
alldtnwqkv 
alldtnwqkv 
alldtnwqkv 
alldtnwqkv 
alldtnwqkv 
alldtnwqkv 
alary. laes 



ffvikkhkfd 
ffvikkhkfd 
ffvikkhkfd 
ilrdketqvr 
ilrdketqvr 
ilrdketqvr 
ilrdketqvr 
ilrdketqvr 
ilrdketqvr 
ilrdketqvr 
nss. .rntBB 



lllralvnlvr 
lllmlvnlvr 
lllmlvnlvr 
f tidasqf aq 
ftidasqfsq 
f tidasqf sq 
ftidasqfsq 
ftidasqfsq 
ftidasqfsq 
f tidssqf sq 
iyy.f .si.s 



750 

n.Knrwqmvi 
n.Knrwqmvi 
n.Knrwqmvi 
klKeqmangy 
klKeqmangy 
klKeqmangy 
klKeqmangy 
klKeqmangy 
klKeqmangy 
klKeqmangy 
eiKrtdgkwl 



msa2 093 68 . 2 ( 147_COHl \ 
msa209368.2{l47 M732 t 
msa209368 .2(147 M781 
msa209368.2{147_18RS21 
msa209368 . 2 { 147__2 603 
msa209368 .2{l47_JM9130013 
msa209368.2{l47_090 
msa209368.2f 147_CJB110 
msa2 0 93 6 8 . 2 [ 14 7 1 16 9NT 
msa209368 . 2 ( 147_H36B 
msa209368.2(147_A909 
Consensus 



751 

s . kvlyvlkk 
s . kvlyvlkk 
s . kvlyvlkk 
flegfvrfke 
flegfvrfke 
flegfvrfke 
flegfvrfke 
flegfvrfke 
flegfvrfke 
flegfvrfke 
flrrfctf .r 



privirs. .v 
privirs. .v 
privirs. .v 
akdsnqelms 
akdsnqelms 
akdsnqelms 
akdsnqelms 
akdsnqelms 
akdsnqelms 
akdsnqelms 
sqg . . sgvne 



fll.dlmvil 
fll.dlmvil 
fll.dlmvil 
ipfvgfngdf 
ipfvgfngdf 
ipfvgfngdf 
ipfvgfngdf 
ipfvgfngdf 
ipfvgfngdf 
ipfvgfngdf 
ysfcri.w.f 



rtykhlkhrf 
rtykhlkhrf 
rtykhlkhrf 
anlqaletpi 
anlqaletpi 
anlqaletpi 
anlqaletpi 
anlqaletpi 
aslqaletpi 
anlqaletpi 
celtst.ntd 



800 

irrflkwst 
irrf lkwst 
irrflkwst 
yktlskgsfy 
yktlskgsfy 
yktlskgafy 
yktlskgsfy 
yktlskgsfy 
yktlskgsfy 
yktlskgsfy 
l.daf .r.fl 
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Table 44: Comparative Sequences relating to SAG0416 (strain info highlighted in BOLD) 



msa209368 

msa209368 . 

msa209368 . 
msa209368.2{ 

msa209368 . 
msa209368.2{l47 
rasa209368 
msa209368.2 
msa209368.2 

msa209368 . 

rasa209368 



2(147 COH1 
2{l47~M732 
2(147 M781 
147 18RS21 
2{l47_2603 
JM9130013 
2{147_090 
147_CJB110 
147 1169NT 
2{l47_H36B 
2{147_A909 
Consensus 



801 

inqmiqlikt 
inqmiqlikt 
Inqmiqlikt 
ykpndtthkd 
ykpndtthkd 
ykpndtthkd 
ykpndtthkd 
ykpndtthkd 
ykpndtthkd 
ykpndtthkd 
l.tk.yns.r 



nwstmnqlll 
nwstmnqlll 
nwstmnqlll 
qleynesapf 
qleynesapf 
qleynesapf 
qleynesapf 
qleynesapf 
qleynesapf 
qleynesapf 
pigvq.issf 



kattilpc.h 
kattilpc.h 
kattilpc.h 
esnnytallt 
esnnytallt 
esnnytallt 
esnnytallt 
esnnytallt 
esnnytallt 
esnnytallt 
.kqqlyclvn 



nqrlgamlim 
nqrlgamlim 
nqrlgamlim 
qsaswgyvdy 
qsaswgyvdy 
qsaswgyvdy 
qsaswgyvdy 
qsaswgyvdy 
qsaswgyvdy 
qsaswgyvdy 
tisvlglc . 1 



850 

skmvgs.n.h 
skmvgs.n.h 
skmvgs.n.h 
vknggelela 
vknggelela 
vknggelela 
vknggelela 
vknggelela 
vknggelela 
vknggelela 
cqkwwgvris 



msa2 09368 . 2 { 147_C0H1 
ma a2 09368. 2(14 7_M73 2 
ms a2 09368 .2{147_M781 
msa209368 . 2 { 147 18RS21 
msa2 09368 . 2 {l47_2603 
msa209368 .2{147_JM9130013 
msa20936B . 2 { 147_090 
msa209368.2{l47 CJB110 
msa209368.2{147~1169NT 
msa209368 . 2 { 147__H36B 
msa2 09368 . 2 { 147_A909 
Consensus 



851 

rrvqKelf . e 
rrvqKelf .e 
rrvqKelf .e 
pespKriilg 
pespKriilg 
pespKriilg 
pespKriilg 
pespKriilg 
pespKriilg 
pespKriilg 
tgesKknyf r 



llrirlrikq 
llrirlrikq 
llrirlrikq 
tfenkvedkt 
tfenkvedkt 
tfenkvedkt 
tfenkvedkt 
tfenkvedkt 
tfenkvedkt 
tfenkvedkt 
nf .e.g.g.n 



fifwkemqri 
fifwkemqri 
fifwkemqri 
ihllerdaan 
ihllerdaan 
ihllerdaan 
ihllerdaan 
ihllerdaan 
ihllerdaan 
ihllerdaan 
nssfgkrcse 



ihilpflqik 
ihilpflqik 
ihilpflqik 
npyfaispnk 
npyfaispnk 
npyfaispnk 
npyfaispnk 
npyfaispnk 
npyfaispnk 
npyfaispnk 
.sifchfsk. 



900 

meigtkslpr 
meigtkslpr 
meigtkslpr 
dgnrdeitpq 
dgnrdeitpq 
dgnrdeitpq 
dgnrdeitpq 
dgnrdeitpq 
dgnrdeitpq 
dgnrdeitpq 
rwk - g . nhsp 



msa209368 . 

msa209368 

msa209368 
msa20936B.2{ 

msa2 09368 
msa209368.2{l47. 
msa209368 
msa209368.2{ 
msa209368.2{ 

msa209368. 

msa209368 



2{l47_COHl] 
2fl47_M732 
2{147_M781 
147_18RS21 
2{l47_2603 
JM9130013 
72{147_090 
147_CJB110 
147_1169NTJ 
2{l47_H36B> 
2{147_A909) 
Consensus 



901 

qls.emlrif 
qls.emlrif 
qls.emlrif 
atflmvkdi 
atflmvkdi 
atflrnvkdi 
atflrnvkdi 
atflmvkdi 
atflrnvkdi 
atflrnvkdi 
gnf lkkc.gy 



llkf . ikmem 
llkf .ikmem 
llkf . ikmem 
saqvldqngn 
saqvldqngn 
saqvldqngn 
saqvldqngn 
saqvldqngn 
saqvldqngn 
saqvldqngn 
fcsssrskwk 



lfgkvrfyhl 
lfgkvrfyhl 
lfgkvrfyhl 
viwqskvlps 
viwqskvlps 
viwqskvlps 
viwqskvlps 
viwqskvlps 
viwqskvlps 
viwqskvlps 
cylak.gfti 



ivklsiiiqs 
ivkisiiiqs 
ivkisiiiqs 
yrknfhnnpk 
yrknfhnnpk 
yrknfhnnpk 
yrknfhnnpk 
yrknfhnnpk 
yrknfhnnpk 
yrknfhnnpk 
ls.kfp..sk 



950 

kvmviivwml 
kvmviivwml 
kvmviivwml 
qsdghyrmda 
qsdghyrmda 
qsdghyrmda 
qsdghyrmda 
qsdghyrmda 
qsdghyrmda 
qsdghyrmda 
ak . wslsygc 



msa209368 . 

msa209368. 

msa209368. 
msa209368.2{ 

msa209368 
msa209368 .2(147 
msa209368 
msa209368.2{ 
msa209368.2{ 

msa209368. 

msa209368 



2(147_C0H1 
2{l47_M732 
2{147_M781 
147 18RS21 
2{147_2603 
JM9130013 
2{147_090 
147_CJB110. 
147_1169NT 
2(147_H36B 
2{147_A909 
Consensus 



951 

f sgw.irraa 
fsgw.irma 
f sgw.irraa 
lqwsgldkdg 
lqwsgldkdg 
lqwsgldkdg 
fqwsgldkdg 
fqwsgldkdg 
lqwsgldkdg 
lqwsgldkdg 
psvewfr.gw 



kl.qravPili 
kl.qmvPili 
kl.qmvPili 
kwadgPyty 
kwadgFyty 
kwadgPyty 
kwadgPyty 
kwadgFyty 
kwadgFyty 
kwadgFyty 
qscsrwPlyl 



ayvthq.qke 
ayvthq.qke 
ayvthq . qke 
rlrytpvaeg 
rlrytpvaeg 
rlrytpvaeg 
rlrytpvaeg 
rlrytpvaeg 
rlrytpvaeg 
rlrytpvaeg 
sf tlhtssrr 



qivrsqtlkf 
qivrsqtlkf 
qivrsqtlkf 
ansqesdf kv 
ansqesdf kv 
ansqesdf kv 
ansqesdf kv 
ansqesdf kv 
ansqesdf kv 
ansqesdf kv 
ak.egvrl > s 



1000 
k.vlshqifl 
k.vlshqifl 
k.vlshqifl 
qystkspnlp 
qvstkspnlp 
qystkspnlp 
qvstkspnlp 
qvstkspnlp 
qvstkspnlp 
qystkspnlp 
ssky.vtkss 



msa2 09368 . 2 { 147_COHl 
msa209368.2(l47_M732' 
msa20936e.2{l47_M78l' 
msa209368.2{l47 18RS21 
msa2 09368 . 2 { 147_2603 
msa209368.2{l47_JM9130013 
msa209368 .2 { 147_090 
msa209368 . 2 { 147_CJB110 
msa209368.2(147_1169NT 
msa209368.2(l47_H36B 
msa209368 -2{147_A909 
Consensus 



1001 

helslmklie 
helslmklie 
helslmklie 
sraqfdetnr 
sraqfdetnr 
sraqfdetnr 
llaqfdetnr 
llaqfdetnr 
sraqfdetnr 
sraqfdetnr 
f tssv. .n.a 



h.a.pclrkv 
h.a.pclrkv 
h.a.pclrkv 
tlslampkes 
tlslarapkeB 
tlslampkes 
tlslampkes 
tlslampkes 
tlslampkgs 
tlslampkes 
niklsha.gk 



vmf lhivyn. 
vmf lhivyn. 
vmf lhivyn . 
syvptyrlql 
syvptyrlql 
syvptyrlql 
syvptyrlql 
syvptyrlql 
syvpiyrlql 
syvptyrlql 
.lcsyissti 



f ylml . Kmkn 
f ylml . Kmkn 
f ylml . Kmkn 
vlshwKdee 
vlshwKdee 
vlshwKdee 
vlshwKdee 
vlshwKdee 
vlshwKdee 
vlshwKdee 
sf isccKr .r 



1050 
mgmrlltiis 
mgmrlltiis 
mgmrlltiis 
ygdetsyhyf 
ygdetsyhyf 
ygdetsyhyf 
ygdetsyhyf 
ygdetsyhyf 
ygdetsyyyf 
ygdetsyhyf 
iwr.dflplf 



msa209368.2(l47 COH1 
raaa209368.2(147~M732 
msa209368 . 2 { 147_M781 
msa209368 . 2 { 147_18RS21 
msa209368 . 2 { 147_2603 
msa209368 . 2 { 147_JM9130013 
msa209368.2{l47_090 
msa209368 . 2 { 147_CJB110 
msa209368 . 2 { 147JL169NT 
msa209368.2fl47JK36B 
msa209368 .2{147_A909 
Consensus 



1051 

i.ikkvk.hf 
i.ikkvk.hf 
i.ikkvk.hf 
hidqegkvtl 
hidqegkvtl 
hidqegkvtl 
hidqegkvtl 
hidqegkvtl 
hidqegkatl 
hidqegkvtl 
pyrsrr.sdt 



lkrlr .ervr 
lkrlr.ervr 
lkrlr. ervr 
pktvkigese 
pktvkigese 
pktvkigese 
pktvkigese 
pktvkigese 
pktvkigese 
pktvkigese 
s.ns.drre. 



lr.tlrp.hl 
lr.tlrp.hl 
lr.tlrp.hl 
vavdpkaltl 
vavdpkaltl 
vavdpkaltl 
vavdpkaltl 
vavdpkaltl 
vavdpkaltl 
vavdpktltl 
gcsrp.dldt 



lwkiklvilq 
lwkiklvilq 
lwkiklvilq 
wedkagnfa 
wedkagnfa 
wedkagnfa 
wedkagnfa 
wedkagnfa 
wedkagnfa 
wedkagnfa 
ccgr.sw.fr 



1100 
r.nclts . ir 
r.nclts.ir 
r.nclts.ir 
tvklsdllnk 
tvklsdllnk 
tvklsdllnk 
tvklsdllnk 
tvklsdllnk 
tvklsdllnk 
tvklsdllnk 
ngkiv . pie . 



791 
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Table 44: Comparative Sequences relating to SAG0416 (strain info highlighted in BOLD) 



msa209368 . 2 f 147_C0H1 
msa209368 . 2 { 147_M732 
msa209368.2{l47 M781 
rasa2093 68 . 2 { 147_18RS2 1 
msa2 0 93 68 . 2 { 14 7_2 60 3 
maa209368.2{l47_JM9130013 
rasa209368 . 2 {l47_090 
msa209368 . 2 { 147_CJB110 
msa2093 68 . 2 { 147_1169NT 
msa20 93 68 . 2 [ 14 7_H36B 
msa209368 . 2 { 147_A909 
Consensus 



1101 

q.yqrkktl . 
q.yqrkktl . 
q.yqrkktl. 
awsekenai 
awsekenai 
awsekenai 
awsekenai 
awsekenai 
awsekenai 
awsekenai 
gssirerkry 



.fltvsnlli 
.fltvsnili 
.fltvsnili 
visnsfkyfd 
visnsfkyfd 
visnsfkyfd 
visnsfkyfd 
visnsfkyfd 
visnsfkyfd 
visnnfkyfd 
snf .qfqif . 



t.rKnlclfl 
t . rKnlclf 1 
t.rKnlclfl 
nlkKepmfis 
nlkKepmfis 
nlkKepmfis 
nlkKesmfis 
nlkKesmfis 
nlkKepmfis 
nlkKepmfis 
. leKrtyvyf 



kkeK. .tri. 
kkeK..tri. 
kkeK. .tri. 
kkeKwnknl 
kkeKwnknl 
kkeKwnknl 
kegKwnknl 
kegKwnknl 
kkeKwnknl 
kegKwnknl 
. rrKsskqes 



1150 
kk.h.lslkl 
kk.h.lslkl 
kk.h.lslkl 
eeiilvkpqt 
eeiilvkpqt 
eeiilvkpqt 
eeitlvkpqt 
eeitlvkpqt 
eeiilvkpht 
eeialvkpqt 
rrnsis .aan 



msa2 09368.2(147 COH1 
msa209368 . 2 ( 147~M732 
msa209368 . 2 { 147~M781 
msa2093 68 . 2 { 147_18RS21 
msa209368 . 2 { 147_2603 
msa209368 . 2 { 147_JM9130013 
msa209368.2{l47_090 
ma a2 093 68 . 2 ( 147_CJB110 
msa209368 .2{147_1169NT 
msa209368.2{l47_H36B 
msa209368 . 2 { 147_A909 
Consensus 



1151 

qlllnhclkk 
qlllnhclkk 
qlllnhclkk 
tvttqslske 
tvttqslske 
tvttqslske 
tvttqslske 
tvttqslske 
tvttqslske 
tvttqslske 
ysyysiiv.r 



. Inqemrkss 
. Inqemrkss 
. Inqemrkss 
itksgnekvl 
itksgnekvl 
itksgnekvl 
itksgnekvl 
itksgnekvl 
itksgnekvl 
itqsgnekvl 
nnsirk.esp 



llqtiivae. 
llqtiivae. 
llqtiivae. 
tstnnnssrv 
tstnrmsarv 
tstnnnssrv 
tetnnnssrv 
tstnnnssrv 
tstnnnssrv 
tstnnnssrv 
hfykq. . .qs 



lrsyhlnitg 
lrsyhlnitg 
lrsyhlnitg 
akiispkhng 
akiispkhng 
akiiBpkhng 
akiispkhng 
akiispkhng 
akiispkhng 
akiispkhng 
s.dhit.t.r 



1200 

illti 

illti 

illti 

dsvnhT- 

dsvnhTlpst 
dsvnhT-- — 
dsvnhT— — 

dsvnhT 

dsvnhT 

dsvnhT 

gfc.py 



msa20 9368 . 2 ( 147_COKl ] 
msa209368 . 2 ( 147_M732 ' 
msa2 09368.2(14 7_M7 8 1 
msa209368 . 2 { 147_18RS21 
, msa209368.2{l47_2603 
msa209368 .2{l47_JM9130013 
msa209368 . 2 { 147_090 
msa209368 . 2 { 147J3JB110 
msa209368 . 2 ( 147_1169NT 
msa209368 . 2 { 147_H36B 
msa209368 .2{147_A909 
Consensus 



1201 



sdratnglfv gtlallssll lylkpkktkn nsk 
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Table 45: Comparative Sequences relating to SAG1404 (strain info highlighted in BOLD) 



SEQ ZD NO. 4501 
STRAIN 2603 

ATGAAAAAGATTAGAAAAAGTTTAGGACrTCTACT 

TTAGCGTTTTTTTCGGTAGCCAGTGTAAATGCTGA 

CAGATAGGACTTCAGCCAAATACTACAGAGGAGGGGA 

ACTGACAACTTAAAAGTTGATTTATTGAGCCAA^ 

TATAAGAGTATCTTG^CTTCTCCTACTGATACrAATGCT 

AATGGTTCGTACTTTGGTCGTOCTTATAAAGCT^ 

TTTTATATTCUkATTACCAGATGAT^ 

AAAGTTGAAACAGG CCX3ATTAAAACTTATTAAATATACAAAAGAAGGAAAGATAAAGAAA 

AGGCTATCCGGAOTAATATTTGTATT^^ 

AATGGACGATTTACGACCGATCAAGATGGGATTAC^ 

GAAATTGAGGTTGAAGGTTTATTACCTGGTAAGTATATT^ 

ACTGGTTACCXn?ATATCTATGAAGGATGCTGTAGTTGCT 

GAAGTAGAGGTAGAAAAOGAAAAAGAAACTCCTCCACCAACAAA^ 

CCGCTTTTTCCACAATCATTTCTTCCTAAAAC^GG 

ATTCTTGGTTGT ATT ATTTTGGGAATTTTGTTT^ C 
AAATCTGAAAGAAACGATACAGTA 

SEQ ID NO. 4502 
STRAIN 090 

GATACCCCTAATCAACTAACAATCACAC 

AGATAGGACTTCAGCCAAATACTACAGAGGAGGGGATT^ 

TGGACTGTGACTGACAACTTAAAAGTTGATTTAT^ 

TAGCGAATTCAACCAGAAGTATAAGAGTATCTTGACTT^ 

CTAATGGtCAGACAAAGATAGCACTCCCAAATGGTT^ 

GCTTATAAAGCTGATCAAAGCGTTTCAACAAT^ 

ATTACCAGATGATAAGTTATGAAATCAATTAC^ 

AAGTTGAAACAGGCCGATTAAAACTTATTAAATATACAAAAGAAGGAAAG 
ATAAAGAAAAGGCTATCAGGAGTAATATTTGTATTATAaSATAACCAGAA 
TCAGCCAGTTCGCTTTAAAAATGGACGATTTACGAC 
TT!ACTTCATTAGTAACrGATGATAAGGG 

TTACCTGGTAAGTATATTTTTCX5AGAAGCAAAAGCA tTACCG 
TATATCrATGAAGGATGCTGTAGTTGCTGTAGTTGCTAAT 
AAGTaG^GGTaGAAAACGAAAAAGAAACTCCTCCACCAACAAATCCTA 
CCAT CACAACCG 

SEQ ID NO. 4503 
STRAIN H36B 

GATACCCCTAATCAACTAACAATCACACAGA 

TAGGACTTCAGCCAAATACTAC3VGA 

ACTGTGACTGACAACTTAAAAGTTGATTTAT^ 

CGAATTGAACCMAAGTATAAGAGTATCTTGACTTCTCCTA 

ATGGtCAGACAAAGATAGCACTCCO^AATGGT^ ^ 

TATAAAGCTGATa^AAGCGTTTCAACAATAGTACCT^ 

ACCAGATGATAAGTTATCAAATCAATTACAGATAAATCCTAAGCGAAAAG 

TTGAAACAGG CCGATTAAAACTTATTAAATATACAAAAGAAGGAAAGATA 

AAGAAAAGGCTVTCCGGAGTAATATTTGTATTA^ 

GCCAGTTCGCITTAAAAATGGACGATTTACGACCGAT^ 

CTTCATTAGTAACTGATGATAAGGGAGAAATTGAGG^ 

CCTGGTAAGTATATTTTTCGAGAAGCAAAAGCAC^ 

ATCTATGAAGGATGCTGTAGTTGCTGTAGTTGCT 

TAGAGGTAGLAAAACXL*W\AAGAAACTC CT CCACCAACAAATC CTAAACCA 
TCACAACCGC 

SEQ ID NO. 4504 
STRAIN 18RS21 

GATACCCCTAATCAACTAACAATCACACAG 

ATAGGACTTCAGCCAAATACTACAGAGGAGGGGATTTCTTA^ 

GACTCrTGACTXJACAACTTAAAAG 

GCGAATTGAACCAGAAGTATAAGAGTATCTTGACTTC^ 

AATGG t CAGACAAAGATAG CACTCC CAAATGGTTCGTACTTTGGTOGTGC 

TTATAAAGCTGATOUUVGCGTTTCAACA^ 

TACCAGATGATAAGTTATCAAATCAATTACAGA 

GTTGAAACAGGCOGATTAAAACTTATTAAATATACAAAAG 

AAAGAAAAGGCTATCCGGAGTAATATTTGTATTATA 

AGCCaGTTCQCTTTAAAAATGGACGATTTACGA 

ACITCATTAGTAACTGATGATAAGGGAGAAATTGAGGTTG 

ACCTGGTAAGTATATT1TTCGAGAAGCAAAAG C^CTAACTGGTTACCGTA 

TATCTATGAAGGATGCIKTTAGTTGCTGT^ 

GTAGAGGTAGAAAACGAAAAAGAAACTCCTCXZACCAACAA^ 

ATCACAACC 

SEQ ID NO. 4505 
STRAIN CJB110 

GATACCXTCTAATCAACTAACAATCACACA 

GATAGGACTTCAGCCAAATACTA CAGA G GAG GGG^ 

GGaCTGTGACTGACAACTTAAAAGTTGATTTA 

AGCGAATTgAACCAGAAGTATAAGAGTATCTTG^ 

TAATGGTCAGAGAAAGATAGCACTCCCAAATGGTTcGTA 

CTTATAAAGCTGATCAAAGCGTTTCAACAATAGTACCT^^ 

TTACCAGATGAT AAGTrATCAAATCAATTACAGa tAAATCCTAAGOGAAA 

AGTTGAAACAGGCOGATTaaAACTTATTAAATATACAAAAGAAGGA 
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Table 45: Comparative Sequences relating to SAG1404 (strain info highlighted in BOLD) 



TAAAGAAAAGGCTaTCAGGAGTAATATTTGTATTATACGATAACCAGAAT 
CAGCCAGTTCGCTTTAAAAATGGACGATTTAC 

TACTTCATTAGTAACTGATGATAAGGGAGAAATTGAGGTTGAAGG'rrrAT 

TACTCTGGTAAGTATATTTTTCGAGAAGCAA 

ATATCTATGAAGGATGCTGTAGTTGCTGTAGTTGCTAAT 

AGTAGAGGTAGAAAACGAAAAAGAAACTCCTCCACCAACAAATCCT 

CATCACAACC 



SBQ ID NO. 4506 
STRAIN 116 9NT 

GATACCCCTAATCAACTAACAATCACACAG 

ATAGGACTTCAGCCAAATACTACAGAGGAGGGGATTTCrrTATOj LTTATG 

GACTGTGACTGACAACTTAAAAGTTGATTTAT^ 

GOaAATTGAACCAGAAGTATAAGAGTATCTT^ 

AATGG t CAga CAAAGATAGCACTCCCAAATGGTTCGT ACTTT GGTCGTGC 

TTATAAAGCTGATCAAAGCGTTTCAACAATAGTACC^ 

TACCAGATGATAAGTTATCAAATCAATTACAGATAAATCCTAAGaSAAAA 

GTTGAAACAGGCCGATTAAAACTTATTAAATATACAAAAGAAGGAAAGAT 

AAAGAAAAGGCTATCAGGAGTAATATTTGTATTATACGATAACCAGAATC 

AGCCAGTTCGCTTTAAAAATGGACGATTTAC^ 

ACTTGATTAGTAACtgaTGATAAGGGAGAAATTGAGGTT^ 

ACCTX3GTAAGTATATTTTTCGAGAAGCAA AAG CACrA 

TATCTATGAAGGATGCTGTAGTTGCTGTAGTrcCTAATAAAACACAGG 

GTAGAGGTAGAAAAOmAAAAGAAACTCCTC<^CCAACAAATCCTAAACC 

ATCACAACC 

PRETTY of: /biotmp/msal84750 .2 { *} May 13, 2003 06:23 



maal84750 . 2 { 150_090 
msalB4750.2{l50_1169NT 
msalB47 50 . 2 { 150 JCJB110 
msal84750.2{150 18RS21 
rasal84750 . 2 { 150_2603 
tnsal84750 . 2 { 150_H36B 
Consensus 



50 



atgaaaaaga ttagaaaaag tttaggactt ctactatgtt gctttttagg 



msal847 50 . 2 { 150_090 
msal84750 . 2 { 150_1169NT 
msal84750 . 2 ( 150_CJB110 
msal84750 . 2 { 150JL8RS21 
tnsal84750.2{l50_2603 
msal84750 . 2{150_H36B 
Consensus 



51 100 

GATACCC 

GATACCC 

1 GATACCC 

— GATACCC 

attggtacaa ttagcgtttt tttcggtagc cagtgtaaat gctGATACCC 
GATACCC 



msal84750 .2{150_090 
rasal84750 . 2 { 150JL169NT 
maal84750.2(l50 CJB110 
msal84750 * 2 { 150""l8RS21 
msal84750.2(l50 2603 
msal84750 . 2 { 150~H3 6B 
Consensus 



101 

CTAATCAACT 
CTAATCAACT 
CTAATCAACT 
CTAATCAACT 
CTAATCAACT 
CTAATCAACT 



AACAATCACA 
AACAATCACA 
AACAATCACA 
AACAATCACA 
AACAATCACA 
AACAATCACA 



CAGATAGGAC 
CAGATAGGAC 
CAGATAGGAC 
CAGATAGGAC 
CAGATAGGAC 
CAGATAGGAC 



TTCAGCCAAA 
TTCAGCCAAA 
TTCAGCCAAA 
TTCAGCCAAA 
TTCAGCCAAA 
TTCAGCCAAA 



150 

TACTACAGAG 
TACTACAGAG 
TACTACAGAG 
TACTACAGAG 
TACTACAGAG 
TACTACAGAG 



msal84750 ,2{lS0_090; 
rasal84750.2{l50 1169NT 
msal84750.2(l50~CJB110 
msal84750.2{l50~~18RS21 
msal84750 . 2(l50_2603 
msal84750.2{150_H36B 
Consensus 



151 

GAGGGGATTT 
GAGGGGATTT 
GAGGGGATTT 
GAGGGGATTT 
GAGGGGATTT 
GAGGGGATTT 



CTTATCGTTT 
CTTATCGTTT 
CTTATCGTTT 
CTTATC GTTT 
CTTATCGTTT 
CTTATCGTTT 



ATGGACTGTG 
ATGGACTGTG 
ATGGACTGTG 
ATGGACTGTG 
ATGGACTGTG 
ATGGACTGTG 



ACTGACAACT 
ACTGACAACT 
ACTGACAACT 
ACTGACAACT 
ACTGACAACT 
ACTGACAACT 



200 

TAAAAGTTGA 
TAAAAGTTGA 
TAAAAGTTGA 
TAAAA GTTG A 
TAAAAGTTGA 
TAAAAGTTGA 



msalB4750 .2 {l50_090] 
rasal84750 . 2 { 150_1169NT ( 
msal84750. 2(150 CJB110 
msal84750 . 2 { 150~18RS21 \ 
rosal84750 . 2 { 1S0_3603 
msal84750 . 2{150_H36B 
Consensus 



201 

TTTATTGAGC 
TTTATTGAGC 
TTTATTGAGC 
TTTATTGAGC 
TTTATTGAGC 
TTTATTGAGC 



CAAATGACAG 
CAAATGACAG 
CAAATGACAG 
CAAATGACAG 
CAAATGACAG 
CAAATGACAG 



ATAGCGAATT 
ATAGCGAATT 
ATAGCGAATT 
ATAGCGAATT 
ATAGCGAATT 
ATAGCGAATT 



GAACCAGAAG 
GAACCAGAAG 
GAACCAGAAG 
GAACCAGAAG 
GAACCAGAAG 
GAACCAGAAG 



250 

TATAAGAGTA 
TATAAGAGTA 
TATAAGAGTA 
TATAAGAGTA 
TATAAGAGTA 
TATAAGAGTA 



msal847 50 .2(150 090 1 
msal84750.2{l50 11?9NT| 
rasal8475G . 2 1 150~CJB110 
msal84750.2{150 18RS21 
msal84750 . 2 { 150_2603 
msal84750 . 2 {lS0_H36B 
Consensus 



251 

TCTTGA CTT C 
TCTTGACTTC 
TCTTGA CTT C 
TCTTGACTTC 
TCTTGA CTT C 
TCTTGACTTC 



TCCTACTGAT 
TCCTACTGAT 
TCCTACTGAT 
TCCTACTGAT 
TCCTACTGAT 
TCCTACTGAT 



ACTAATGGTC 
ACTAATGGTC 
ACTAATGGTC 
ACTAATGGTC 
ACTAATGGTC 
ACTAATGGTC 



AGACAAAGAT 
AGACAAAGAT 
AGACAAAGAT 
AGACAAAGAT 
AGACAAAGAT 
AGACAAAGAT 



300 

AGCACTCCCA 
AGCACTCCCA 
AGCACTCCCA 
AGCACTCCCA 
AGCACTCCCA 
AGCACTCCCA 



301 



350 
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Table 45: Comparative Sequences relating to SAG1404 (strain info highlighted in BOLD) 



msal84750 . 2 { 150_090 
msal84750.2(l50_1169NT' 
msal84750 .2( 150__CJB110 
msal84750 . 2 { 150_18RS21 ' 
msal84750. 2(150^2603 
maal84750 . 2 { 150JH36B 
Consensus 



AATG GTT CGT 
AATGGTTCGT 
AATGGTTCGT 
AATGGTTCGT 
AATGGTTCGT 
AATGGTTCGT 
********** 



ACTTTGGTCG 
ACTTTGGTCG 
ACTTTGGTCG 
A CTTT GGTCG 
ACTTTGGTCG 
ACTTTGGTCG 
********** 



TGCTTATAAA 
TGCTTATAAA 
TGCTTATAAA 
TGCTTATAAA 
TGCTTATAAA 
TGCTTATAAA 



GCTGATCAAA 
GCTGATCAAA 
GCTGATCAAA 
GCTGATCAAA 
GCTGATCAAA 
GCTGATCAAA 



GCGTTTCAAC 
GCGTTTCAAC 
GCGTTTCAAC 
GCGTTTCAAC 
GCGTTTCAAC 
GCGTTTCAAC - 



********** ********** ********** 



msal84750.2{l50 090 
msal84750.2fl50__1169NT 
msal84750 . 2 { 150_CJB110 
msal84750 . 2 (l50_18RS21 
msal847S0 . 2 f 150_2603 
rasal84750.2{l50_H36B 
Consensus 



351 

AATAGTACCT 
AATAGTACCT 
AATAGTACCT 
AATAGTACCT 
AATAGTACCT 
AATAGTACCT 



TTTTATATTG 
TTTTATATTG 
TTTTATATTG 
TTTTATATTG 
TTTTATATTG 
TTTTATATTG 



AATTACCAGA 
AATTACCAGA 
AATTACCAGA 
AATTACCAGA 
AATTACCAGA 
AATTACCAGA 



TGATAAGTTA 
TGATAAGTTA 
TGATAAGTTA 
TGATAAGTTA 
TGATAAGTTA 
TGATAAGTTA 



400 

TCAAATCAAT 
TCAAATCAAT 
TCAAATCAAT 
TCAAATCAAT 
TCAAATCAAT 
TCAAATCAAT 



msal84750.2{l50_090 
msal84750.2(l50_1169NT 
msa!847 50 . 2 ( 150_CJB110 
msa!84750 . 2{ 150_18RS21 
msal84750 . 2 { 150_2603 
msal84750 . 2 {150_H36B 
Consensus 



401 

TACAGATAAA 
TACAGATAAA 
TACAGATAAA 
TACAGATAAA 
TACAGATAAA 
TACAGATAAA 



TCCTAAGCGA 
TCCTAAGCGA 
TCCTAAGCGA 
TCCTAAGCGA 
TCCTAAGCGA 
TCCTAAGCGA 



AAAGTTGAAA 
AAAGTTGAAA 
AAAGTTGAAA 
AAAGTTGAAA 
AAAGTTGAAA 
AAAGTTGAAA 



CAGGCCGATT 
CAGGCCGATT 
CAGGCCGATT 
CAGGCCGATT 
CAGGCCGATT 
CAGGCCGATT 



450 

AAAA CTTA TT 
AAAACTTATT 
AAAACTTATT 
AAAACTTATT 
AAAACTTATT 
AAAACTTATT 



msal84750.2{l50 090 
msal84750 . 2 { 150_1169NT 
msalB4750 . 2 { 150_CJB110 ( 
msal84750 . 2 { 150_18RS21 
msal84750 . 2 { 150_2*603 
msal84750 . 2 { 150_K36B' 
Consensus 



451 

AAATATACAA 
AAATATACAA 
AAATATACAA 
AAATATACAA 
AAATATACAA 
AAATATACAA 



AAGAAGGAAA 
AAGAAGGAAA 
AAGAAGGAAA 
AAGAAGGAAA 
AAGAAGGAAA 
AAGAAGGAAA 



GATAAAGAAA 
GATAAAGAAA 
GATAAAGAAA 
GATAAAGAAA 
GATAAAGAAA 
GATAAAGAAA 



AGGCTaTCaG 
AGGCTaTCaG 
AGGCTaTCaG 
AGGCTaTCcG 
AGGCTaTCcG 
AGGCTwTCcG 



500 

GAGTAATATT 
GAGTAATATT 
GAGTAATATT 
GAGTAATATT 
GAGTAATATT 
GAGTAATATT 



msal84750.2{l50 090 
" 'lSO^^NT 1 
150_OJB110 
150_18RS2l| 
2fl50_2603 
2{150_H36B 
Consensus 



msalB4750.2 
msal84750.2 
oisal84750.2 
rasal84750 
rasal84750 



501 

TGTATTATAC 
TGTATTATAC 
TGTATTATAC 
TGTATTATAC 
TGTATTATAC 
TGTATTATAC 



GATAACCAGA 
GATAACCAGA 
GATAACCAGA 
GATAACCAGA 
GATAACCAGA 
GATAACCAGA 



ATCAGCCAGT 
ATCAGCCAGT 
ATCAGCCAGT 
ATCAGCCAGT 
ATCAGCCAGT 
ATCAGCCAGT 



TCGCTTTAAA 
TCGCTTTAAA 
TCGCTTTAAA 
TCG CTTTA AA 
TCGCTTTAAA 
TCGCTTTAAA 



550 

AATGGACGAT 
AATGGACGAT 
AATGGACGAT 
AATGGACGAT 
AATGGACGAT 
AATGGACGAT 



msal847S0.2{l50_090' 
msal84750 . 2 ( 1S0_1169NT 
msal84750 . 2 { 150_CJB110 
tnsal84750 . 2 { 150_18RS21 
rasal84750 . 2 { 150_2 603 
rosal847 50 . 2 { 150_H36B 
Consensus 



551 

TTACGACCGA 
TTACGACCGA 
TTACGACCGA 
TTACGACCGA 
TTACGACCGA 
TTACGACCGA 



TCAAGATGGG 
TCAAGATGGG 
TCAAGATGGG 
TCAAGATGGG 
TCAAGATGGG 
TCAAGATGGG 



ATTACTTCAT 
ATTACTTCAT 
ATTACTTCAT 
ATTACTTCAT 
ATTACTTCAT 
ATTACTTCAT 



TAGTAACTGA 
TAGTAACTGA 
TAGTAACTGA 
TAGTAACTGA 
TAGTAACTGA 
TAGTAACTGA 



600 

TGATAAGGGA 
TGATAAGGGA 
TGATAAGGGA 
TGATAAGGGA 
TGATAAGGGA 
TGATAAGGGA 



msal84750.2{l50 090 
msal84750 .2(150_1169NT 
msal84750 .2(15 0_CJB 110 
msa!84750 . 2 { 150_18RS21 
msal84750 . 2 ( 150_2603 
cnsal847S0 . 2 { 150_H36B 
Consensus 



601 

GAAATTGAGG 
GAAATTGAGG 
GAAATTGAGG 
GAAATTGAGG 
GAAATTGAGG 
GAAATTGAGG 



TTGAAGGTTT 
TTGAAGGTTT 
TTGAAGGTTT 
TTGAAGGTTT 
TTGAAGGTTT 
TTGAAGGTTT 



ATTACCTGGT 
ATTACCTGGT 
ATTACCTGGT 
ATTACCTGGT 
ATTACCTGGT 
ATTACCTGGT 



AAGTATATTT 
AAGTATATTT 
AAGTATATTT 
AAGTATATTT 
AAGTATATTT 
AAGTATATTT 



650 

TTCGAGAAGC 
TTCGAGAAGC 
TTCGAGAAGC 
TTCGAGAAGC 
TTCGAGAAGC 
TTCGAGAAGC 



msal84750 . 2 { 150_09 0 
msal84750 . 2 ( 150_1169NT 
msal84750 .21 150JCJB110 
msal84750 . 2 { 150__18RS2 1 
msal84750 . 2 ( 150_2603 
msal84750 . 2 { 150_H36B 
Consensus 



651 

AAAAGCACTA 
AAAAGCACTA 
AAAAGCACTA 
AAAAGCACTA 
AAAAGCACTA 
AAAAGCACTA 



ACTGGTTACC 
ACTGGTTACC 
ACTG GTTA CC 
ACTGGTTACC 
ACTGGTTACC 
ACTGGTTACC 



GTATATCTAT 
GTATATCTAT 
GTATATCTAT 
GTATATCTAT 
GTATATCTAT 
GTATATCTAT 



GAAGGATGCT 
GAAGGATGCT 
GAAGGATGCT 
GAAGGATGCT 
GAAGGATGCT 
GAAGGATGCT 



700 

GTAGTTGCTG 
GTAGTTGCTG 
GTAGTTGCTG 
GTAGTTGCTG 
GTAGTTGCTG 
GTAGTTGCTG 



maal84750 . 2 { 150_090 
rasal84750 . 2 { 150_1169NT 
msal84750 . 2 ( 150_CJB110 
tnsal84750 . 2 { 150^18RS21 
msal84750 . 2 ( 150_2603 
msal84750 .2{l50_H36B 
Consensus 



701 

TAGTTGCTAA 
T AGTTG CTAA 
TAGTTGCTAA 
TA GTTG CTAA 
TA GTTG CTAA 
TAGTTGCTAA 



TAAAACACAG 
TAAAACACAG 
TAAAACACAG 
TAAAACACAG 
TAAAACACAG 
TAAAACACAG 



GAAGTAGAGG 
GAAGTAGAGG 
GAAGTAGAGG 
GAAGTAGAGG 
GAAGTAGAGG 
GAAGTAGAGG 



TAGAAAACGA 
TAGAAAACGA 
TAGAAAACGA 
TAGAAAACGA 
TAGAAAACGA 
TAGAAAACGA 



750 

AAAAGAAACT 
AAAAGAAACT 
AAAAGAAACT 
AAAAGAAACT 
AAAAGAAACT 
AAAAGAAACT 



msal84750 
tnsal84750 



2{150 090} 
2{150_1169NT} 



751 

CCTCCACCAA CAAATCCTAA ACCATCACAA CCg- 
CCTCCACCAA CAAATCCTAA ACCATCACAA CC — 



800 
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Table 45: Comparative Sequences relating to SAG1404 (strain info highlighted in BOLD) 



msal84750.2{l50 CJB110) 
msal84750 . 2 {150~18RS21 } 
msal847S0 . 2 [ 150_2603 J 
msal84750.2(150_H36B} 
Consensus 



msal84750.2{l50 090 
msal84750 . 2 { 150_1 169NT 
msal84750.2fl50 CJB110 
msal84750.2{150~18RS21 
msal84750 . 2 { 150_2603 
msal84750 . 2 { 150_H36B 
Consensus 



msal84750 . 2 { 150_090 
msal84750 . 2 { 150_1169NT 
msal84750 . 2 ( 150_CJB110 
msal84750.2{150_18RS21 
msal84750 . 2 f 150__2603 
msal847 50 . 2 { 150_H3 6B 
Cons en sua 



msal84750 . 2 { 150_090 
msal84750 .2 { 150_1169NT 
msal84750 . 2 { 150_CJB110 
msal84750.2(150_18RS21 
msal847 5 0 . 2 ( 150_2603 
msal84750.2{l50_H36B 
Consensus 



CCTCCACCAA CAAATCCTAA ACCATCACAA CC 

CCTCCACCAA CAAATCCTAA ACCATCACAA CC 

CCTCCACCAA CAAATCCTAA ACCATCACAA CCgCtttttC cacaatcatt 
CCTCCACCAA CAAATCCTAA ACCATCACAA CCgC 



801 



850 



tcttcctaaa acaggaatga ttattggtgg aggactgaca attcttggtt 



851 



900 



gtattatttt gggaattttg tttatctttt taagaaaaac taaaaatagc 



901 



924 



aaatctgaaa gaaacgatac agta 



SBQ ZD NO. 4507 
STRAIN 2603 

MKKI RKSLGT J iT iCCFLGLVQLAFFSVASVNADTPNQLTI TQI GLQPNTTEEG I S YRLWTV 
TDNLKVDLLSQMTDSELNQKYKS I LTSPTDTNGGTKI ALPNGSYFGRAYTO\DQSVSTIVP 
PYI BLPDDKLSNQLQ I NPKRKVETGELKL I KYTKEGKI KKRLSGVI FVLYDNQNQPVRFK 
NGRFTTDQDG ITSLVTDDKGE I EVEGLLPGKYI FREAKALTGYRI SMKDAWAWANKTQ 
EVEVENEKETPPPTNPKPSQPLFPQSFLPKTGMI IGGGLTILGCI ILGILFIFLRKTKNS 



S2Q ZD NO. 4508 
STRAIN 090 

DTPNQIiT I TQI GLQPNTTEEG I S YRLWTVTDNLKVDLLSQMTDSELNQKYKS I LTS PTDT 
NGQTKIALFNGS YFGRAYKADQ SVST I VPFY I ELPDD KL SNQLQ I NPKRKVETGRLKL I K 
YTKEGKIKKRLSGVI FVLYDNQNQPVRFXNGRFTTDQDG ITSLVTDDKGE I EVEGLLPGK 



SBQ ZD NO. 4509 
STRAIN H36B 

DTPNQLTITQI GLQPNTTEEG I S YRLWTVTDNLKVDLLS QWTDSELNQKYKS I LTSPTDT 
NGQTKI ALPNGS YFGRAYKADQSVST I VPFYI ELPDD KL SNQLQ I NPK3UCVETGRLKLI K 
YTKEGKIKKRLSGVI FVLYDNQNQPVRFKNGRFTTDQDG I TSLVTDDKGE I EVEGLLPGK 
YI FREAKALTGYRI SMKDAVVAWANKTQEVEVENEKBTPPPTNPKPSQP 

SBQ ZD NO. 4510 
STRAIN 18RS21 

DTPNQLTITQIGLQPNTTEEGI SYRLWTVTDNLKVDLLS QWTDSELNQKYKS I LTSPTDT 
NGCTKXALPNGSYFGRAYKADQSVSTIVPFYIELPDDKLS^ 

YTKEGKIKKRLSGVI FVL YDNQNQ PVRFKNGRFTTDQDG ITSLVTDDKGEI EVEGLLPGK 
YI FREAKALTGYRI SMKDA WAVVANKTQEVEVENEKET P P PTNPKPSQ 

SBQ ZD NO. 4511 
STRAIN 116 9 NT 

DTPNQLTITQIGLQPNTTEEGI SYRLWTVTDNLKVDLLSQMTDSELNQKYKS I LTSPTDT 
NGQTKIALPNGSYFGRAYKADQSVSTI VPFYI BLPDDKLSNQLQ INPKRKVETGRLKLI K 
YTKEGKI KKRLSGVI FVL YDNQNQ PVRFKNGRFTTDQDG ITS LVTDDKGE I EVEGLLPGK 
YI FREAKALTGYRI SMKDAVVAVVANKTQEVEVENEKETPPPTNPKPSQ 



PRETTY oft /blotmp/msal84868.2{*} May 13, 2003 06:25 



msal84 8 68 . 2 { 150_0 90 
msal84868.2{l50_2603 
msal848 68 . 2 { 150_H36B 
msal84868 . 2 { 150_1169NT 
msal84868 . 2 { 150_18RS21 
Consensus 



msal84868 . 2 { 150_090 } 



1 50 

-DTPNQLTIT QIGLQPNTTE 

mkkirkslgl llccf lglvq laf fsvasvn aDTPNQLTlT QIGLQPNTTE 

«. — ~ DTPNQLTIT QIGLQPNTTE 

DTPNQLTIT QIGLQP NTTE 

_ — -DTPNQLTIT QIGLQPNTTE 



51 100 
EGISYRLWTV TDNLKVDLLS QMTDSELNQK YKSILTSPTD TNGQTKIALP 
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Table 45: Comparative Sequences relating to SAG1404 (strain info highlighted in BOLD) 



maal84B68.2f 150 2603 
msal84868 . 2 { 1S0~H3SB 
maa!84868 .2f 150 116 9NT 
msal84868 . 2 { 150~18RS21 . 

Consensus 



msal84868 . 2 { 150_090 
msal8486B . 2 {l50_2603 
msal84868 . 2 { 150_H36B 
msal84868 . 2{l50_1169NT 
msal84868.2{l50_18RS21 
Consensus 



EGISYRLWTV TDNLKVDLLS QMTDSELNQK YKSILTSPTD TNGQTKIALP 
EGISYRLWTV TDNLKVDLLS QMTDSELNQK YKSILTSPTD TNGQTKIALP 
EGISYRLWTV TDNLKVDLLS QMTDSELNQK YKSILTSPTD TNGQTKIALP 
EGISYRLWTV TDNLKVDLLS QMTDSELNQK YKSILTSPTD TNGQTKIALP 



101 150 
NGSYPGRAYK ADQSVSTIVP FYIELPDDKL SNQLQINPKR KVETGRLKLI 
NGSYFGRAYK ADQSVSTIVP FYIELPDDKL SNQLQINPKR KVETGRLKLI 
NGSYFGRAYK ADQSVSTIVP FYIELPDDKL SNQLQINPKR KVETGRLKLI 
NGSYFGRAYK ADQSVSTIVP FYIELPDDKL SNQLQINPKR KVETGRLKLI 
NGSYFGRAYK ADQSVSTIVP FYIELPDDKL SNQLQINPKR KVETGRLKLI 



msal84S68.2{l50_090 
msal84868 . 2 { 150_2603 
msalB4868 . 2 { 150_H36B 
msal84868 .2{150_1169NT 
msal84868 . 2 { 150_18RS21 
Consensus 



msal84868 .2{l50_090 
msal84868.2{l50_2603 
msal84868 .2{150_H36B 
msal848 68 . 2 { 150_JL169NT 
msal848 68 . 2 { 150_18RS21 
Consensus 



msal84868 . 2 { 150JD90 
tnsal84868 .2{150_2603 
msal84868.2(150JH36B 
msal84868 , 2 { 150_1169NT 
msal848 68 . 2 { 150_18RS21 
Consensus 



msal848 68 . 2 { 1S0_090 
msal84868 . 2 { 150_2603 
msal84868 . 2 { 150_H3 6B 
msalB4868 .2f 150_1169NT 
msal84868 . 2{150_18RS21 
Consensus 



151 

KYTKEGKIKK 
KYTKEGKIKK 
KYTKEGKIKK 
KYTKEGKIKK 
KYTKEGKIKK 



RLSGVIFVLY DNQNQPVRFK NGRFTTDQDG 
RLSGVIFVLY DNQNQPVRFK NGRFTTDQDG 
RLSGVIFVLY DNQNQPVRFK NGRFTTDQDG 
RLSGVIFVLY DNQNQPVRFK NGRFTTDQDG 
RLSGVIFVLY DNQNQPVRFK NGRFTTDQDG 



200 

ITSLVTDDKG 
ITSLVTDDKG 
ITSLVTDDKG 
ITSLVTDDKG 
ITSLVTDDKG 



201 , 250 

EIEVEGLLPG KYIFREAKAL TGYRISMKDA WAWANKTQ EVEVENEKET 
BIEVEGLLPG KYIFREAKAL TGYRISMKDA WAWANKTQ EVEVENEKET 
EIEVEGLLPG KYIFREAKAL TGYRISMKDA WAWANKTQ EVEVENEKET 
EIEVEGLLPG KYIFREAKAL TGYRISMKDA WAWANKTQ EVEVENEKET 
EIEVEGLLPG KYIFREAKAL TGYRISMKDA WAWANKTQ EVEVENEKET 

251 300 

PPPTNPKPSQ p 

PPPTNPKPSQ plfpqsflpk tgmiiggglt ilgciilgil fiflrktkns 

PPPTNPKPSQ p 

PPPTNPKPSQ 

PPPTNPKPSQ 

301 

kserndtv 
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Table 46: Comparative Sequences relating to SAG1615 (strain info highlighted in BOLD) 



SBQ ID NO. 4601 
STRAIN A909 

TGACAAATATTATTTTACCCAACGTGGTTTAGAGC^ 
CTC^CCGAATAATATCAGTGAGGATTTAGAGATTATTGCAGGAAATC 
TAACAATGAAGAGTTGGCTTATGTTATTGAA^ 
ATTTCTCGGAGATTTTATGCGTCAGTTCACTAGTCTAGGTCT 
' AACCTCIAACGACAGGTTTATTAGCTCATGTTTTAAAAAATAT^ 
AATTGGAGATGGTACAGGACGTGGTTCTG CT 
TGAATACGAACGTCATTTTATGCCGTACCATCC^GA^ 

TTTTGACCATCCTGATTATTTTACAGG CXTTAGAGGACGTATTCAATGCCTTTAATGACTA 

TGCTAAGQUVGTTCAAAAAGGTTTATTCATTTATO 

CACTTCIX^GGCACCAATATATXATTATGKSTTTTGA^ 

AGACATCACTCXiAACTGTTAATGGTTCTGACT^ 

TGGTCAGTTTOVTGTACCAGCATACGGTAAACAT 

TGCTAACCTTTACATAATGGGAATTGATATGGCAT^ 

TTCAGGGGTAAAGCGTCGTTTTACTGAGAAGATTA^ 

CTTTGCTCACCATCCTACTGAGATTATTG<^^ 

GTCAAAAGAAATTGTAGCTATTTTCCAACCGC^ 

AGACGAATTTG CCCATGCCTTGAGTCAAGCGGAT AG CGTTTATCTCGCTCAAATATATGG 

TTCTGCTAGAGAAGTAGATAATGGTGAGGTGAAGGTAGAAGATTTAGCTGOT 

CAAACACTO^GATTTAGTGACAGTCGAAAATGTCTCGCC 

TGTCTATGTCTITATGGGTGCTGGAGACATTCAAT^ 

ATTAGCTAACCTAACTAAAAATACACAA 



SBQ ZD NO. 4602 
STRAIN 116 9NT 

AAAAGCAGGCICTAGTGACGTTGACAAATATTATTTT 

AGGTGTAACTATATTACCTTTCTGACXX3AATAATATC^ 

AGGAAATGCTTTTCX3TCCAGATAACAATGAAGAGTTC 

TCATTTTAAACGATATCATGAATTTCT 

TGTAGCTGGGGCACATGGAAAAACCTCAACGACAG^ 

TATTACAGACACTTCTTTCCTAATTGGAGATG 

TTACTTTGTGTTTGAAGCTGATGAATACGA^ 

CTCAATTATTACCAATATIX3ATTrTGACCATCC^ 

ATTC7VATGCCTTTAATGACTATGCTAAGCAAGTTGAA 

AGATCCAA AACTT CATGAAATCACTTCT^ 

TTCAAATGATTTTATAGCAAAAGAavrCACTCG 

TTTCTATAACCAAGAAGAAATTGGTCAGTTTCA^ 

CTTAAATGCAACrcCTGTTATrGCTAACCTT^ 

AGCTGAGCATTTGAAGACATTTTCAGG 

CGATACTGTCATTATTGATGACrriXXrrCACCW 

TGCTCCTCGAOVAAAATACCCGTCAAAAGAAA^ 

CACTCGTACGATAGCTCTTTTAGACGAATTTGCCCATGCCTTGAGT^ 

TTATCrCGCTCAAATATATGGTTCTGCTAGAGAAGTAGA 

AGATTTAGCTGCTAAGATTGTCAAACACTCAGATTTAGTG^ 

TTTACTCAATCATGATAATGCTGTCTATGTCTT^ 

TGAGCGCTCTTTTGAAGAATTATTAGCTAACCTAACT^ 



SBQ ZD NO. 4603 
STRAIN 090 

AAAGCAGGCTCTAGTGACGTTGACAAATATTAT^ 

GGTGTAACTATATTACXTriTCTCACCGAATA 

GGAAATGCTTTTCGTCCAGATAACAATGAAGAGTT 

CATTTTAAACGATATCATGAATTTCTCGGAG^ 

GTAGCTGGGGCACATGGAAAAACCTCAACGACAGG^ 

TACTTTGTJGTTTGAAGCTGATGAATACGA^ 

TCAATTA TTACCA ATATTGATTTTGA 

TTCAATGCTTTTAATGACTATGCTAAGCAAGTTCA 

GATTCAAAACITCATGAAATCACTTCTAAGGCAC^ 

TCAAATGATTTTATAGCAAAAGACATCACTCGAAC^ 

TTCTATAACCAAGAAGAAATTGGTCAG TTTC^ 

TTAAATGCAACTGCTGTTATTGCTAACCTTT^ CATTAGTA 

GCTGAGCATTTGAAGAGAITTTCAGGGGTAAA 

GATACTGTCATTATTGATGACTTTGCT 

GCTGCTOGACAAAAATACCCGTCAAAAGAAATTGTAGCT 

ACTCGTACGATAGCTCITTTAGACGATTTTG^ 

TATCTTGCTCAAATATATGGTTCTGCTAGA 

GATTTAGCTGCTAAGATTGTCAAACA^ CCT 

TTACTCAATCATGATAATGCTGTCTATGTCT^ 

GAGCGCTCTTTTGAAGAATTATTAGCTAACCTA 



SBQ ZD NO. 4604 
STRAIN H36B 

AAAAGCAGGCTCTAGTgACGTTgACAAATATtATTTTACT^ 

ATAACTATATTACCTTTCTCACCGAATAATATCAGT^ 

AATGCTTTTCtTTCCAGATAAC^ 

TTTAAACGATATCATGAATTTCTC^ 

GCTGGGGCACATGGAAAAACCTCAACGACAGGTrTATTA^ 

ACAGACACTTCTTTCCTAATTGGAGATGGTACW 

TTTQTGTTTGAAGCTOATQAATACGAACQTCA^ 

ATTATTACCAATATTGATTTTGACCATCCTGAT^ 

AATGCTITTTAATGACTATGCTAAGCAAGTTCAAAAAG 



798 



WO 2004/018646 
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Table 46: Comparative Sequences relating to SAG1615 (strain info highlighted in BOLD) 



CCAAAACTTCATGAAATCACITCTG^ 

AATGATTTTATAGCAAAAGATATCACT CGAACTGTTAATGGTTCTGACTTT AAGGTTTTC 

TATAACCAAGAAGAAATTGGTCAGTTTCACGTACCIAGCAT^ 

AATGCAACTGCTGTTATTGCTAACCTTTACATAATGGGAATTG^ 

GAGCATTTGAAGACATTTTCAGGGGTAAAAC 

ACTGTCATTATTGATGACTTTGCTCACCATCCT^ 

GCTCGACAAAAATACCCGTCAAAAGAAATTGTAGCT 

CGTACGATAGCTCTTTTAGACGAATTTX3CCCATG 

CTCG CTCAAATATATGGTTCTG CT AGAGAAGTAGATAATGGTGAGGTGAAGGTAGAAGAT 
TTAGCTGCTAAGATTGTCAAACACTCAGATTTAGTGAC^^ 
CTCAATCATGATAATGCTGTCTATGTCTrTATGGGTGCTG 
CGCTCmTGAAGAATTATrAGCTAACCTAACTAAAAATAC^CAA 

SEQ ID HO. 4605 
STRAIN 18RS2X 

AAAGCMGCTCTAGTGAOGTTGACAAATATTATTC 

GGTGTAACTATATTACCTTTCTCACCGAATAATATCAGTGAGGATT^ 

GGAAATGCTTTTCGTCCAGATAACAATGAAGAGTTGG CTTATGTTATTGAAAAGGGCTAT 

CATTTTAAACGATATCATGAATTTCTCGGAGATTTTATC 

GTAGCTGGGGCACATQGAAAAACCTCAACGACAGGTTTATTA^ 

ATTACAGACAClTCri'i'CCTAATTGGAGATGGTACAGGA 

TACITTGTGTTTGAAGCTGATGAATACGAACGTCATTT^ 

TCAATTATTACCAATATTGATTTTGACCATCCTC 

TTCAATGCCTTTAATGACTATGCTAAGCAAGTTCA^ 

GATCCAAAACTTCATGAAATCACTTCTGAGGCACCAATATATT 

TC^AATGATTTTATAGCAAAAGACATCACTCGAACTGTTAA 

TTCTATAACCAAGAAGAAATTGGTCAGTTTCATGTACCA 

TTAAATG CAACTGCTGTTATTG CTAACCTTTACATAATGGGAATTGATATGGCATTAGTA 

GCIX3AGCATTTGAAGACGTTTTCAGGGGTAAAGCX5 

GATACTGTCATTATTGATGACITTGCTCACCATCCT 

GCTGCTCGACAAAAATACCCGTCAARAGAAATTGTAGCT CATACGTTC 

ACTCXSTAOGATAGCTCTTTTAGACGAATTTGCCCATGC^ 

TATCTCG CTCAAATATATGGTTCTGCTAGAGAAGTAGATAATGGTGAGGTG^ 

GATTTAGCTGCTAAGATTGTCAAACACTC AG^ 

TTACTCAATCATGATAATGCTGTCTAIGTCTT^ 

GAGCGCTCTTTTGAAGAATTATTAGCTAACCTAACTAA 

SEQ ID NO. 4606 
STRAIN M732 

AAAAG€AGGCTCTAGTGA05TtGACAAATAtTATTTTACCCAACXn^ 

GTGTAACTATATTACCTTTCTCACCGAATAAT^ 

GAAATGCTTTTCGTCCAGATAACAATGA 

ATTTTAAACGATATCATGAATTTCTCGGAGATTTT 

TAGCTGGGGCACATGGAAAAACXMAACGACAGGTTTATTAG 

TTACAGACACTTCTTTCCTAATTGGAGATGCT 

ACTTTGTG1TTGAAGCTGATGAATACGAACGTCATTTTATC 

CAATTATTACCAATATTGATTTTGACCATCCTG^ 

TCAATGCCITTAATGACTATGCTAAGCAAGTT^ 

ATCCAAAACTTCATGAAATCACTTCTGA 

CAAATGATTTTATAGCAAAAGAGATCACT 

TCTATAACCAAGAAGAAATTGGTCAGTTTCATGTACX^GCA 

TAAATGCAACTGCTGTTATTGCTAACCTTTACATA 

CTX3AGCATTTGAAGACATTTTCAG 

ATACTGTCATTATTGATGACTTTGCTCACCAT 

CTOCTCGACaAAAATACCCGTCAAAAGAAATTG 

CTCGTACGATAGCTCTTTTAGACX3AATTTG CCCATGCCTTGAGTCAAGCGGATAGCGTTT 
ATCTCGCTCAAAT^ATATGGTTCTGCTAGAGAACT 
ATTTAGCTGCTAAgATTGTCAAACACTCAGAT^ 
TACTCAATCATGATAATGCTGTCTATGTCTTTATGGGTC 
AGCGCTCITTTGAAGAATTATTAG CTAACCTAACT AAAAATACACAA 

SEQ ID NO. 4607 
STRAIN M781 

AAAGCAGGCTCTAGTGACGTtGACAAATATTATTT^ 

GTGTAACTATATTACCTTTCTCACCGAATAAT^ 

GAAATG CTTTTCGTCCAGATAACAATGAAGAGTTGGCl^ 

ATTTTAAACGATATCATGAATTTCTCXSGAGATTTT^ 

GTAGCTGGGGCACATGGAAAAACCTCAACGACAGGTTTATTAGCT 

TAT TACAGACACTT CTTTCCrAATT^ 

CTCAATTATTACCAATATTGAITITGACCATCCTG^ 

ATTCAATGCCTTTAATGACTATGCTAAGCAAGTTCAAAAAGGTTT 

AGATCCAAAACTTCATGAAATCACTTCTGAGGCACCAATATATTAT^ 

TTCAAATGATTTTATAGCAAAAGACATCACTOGAACr 

TTTCTATAACCAAGAAGAAATTGGTCAGTTTCATCT 

CTTAAATGCAACTCCTGTTATTGCTAACCTTTAC^ 

AG CTGAG CATTTGAAGACAT 1" I" iCAGGGGTAAAG CGT CG TTTTA CTGAGAAGATTATTGA 

CGATACTGTCATTATTGATGACTTTGCTCAC 

TGCTGCTCGACAAAAATACCCGTCAAAAGAAATTGTAGCT 

CACTCGTAOGATAGCTCTTTTAGACGAATTTGCCCA^ 

TTATCTCGCTCAAATATATGGTTCTGCTAGAGAAGTAG^ 

AQATTTAGCTGCTAAGATTGTCAAACACTC AG^ 

TTTACTCAATCATGATAATGCTGTCTATGTCIT^ 



799 



WO 2004/018646 
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Table 46: Comparative Sequences relating to SAG1615 (strain info highlighted in BOLD) 



TGAGCGCTCTTTTGAAGAATTATTA^ 

SEQ ZD HO. 4608 
STRAIN CJB110 

AAAAAGCAGG CTCTAGTGACGT tX3ACAAAT At TATTTTACCCAACGTGGT7TAGAGCAAGCA 

GGTGTAACTATATTACCTTTCTCACCGAATAATATCA 

GGAAATGCTTTTCGTCCAGATAACAATGAAGAGTTGGCTT^^ 

CATTTTAAACGATATCATGAATTTCTCGGAGATTTTATG CGTCAGTTCACTAGTCTAGGT 

GTAGCTGGGGCACATGGAAAAACCTCAACGACAGGTTTATTAGCT^ 

ATTACAGACACrTCTTTCCrAATTGGAGATGGT^ 

TA LUTlVlXjlTr GAAGCTG ATGAA TACGA 

TCAATTATTACCAATATTGATTTTGACCATC 

.TTCAATG CTTTTAATGACTATG CTAAGCAAGTTCAAAAAGGTTTATTCATTTATGGAGAA 

GATTCAAAACTTCATGAAATCACTTCTAAGGCACCAA^ 

TCAAATGATTTTATAGCAAAAGACATCACTCGAACrc 

TI^ATAACCAAGAAGAAATTGGTCAGTrTCATGTACCAG CATACGGTAAACATAATATC 
' TTAAATGCRACTGCTGTTATTGCTAACCrTTAC 
GCTGAGCATTTGAAGACATTTTCAGGGGTAAAACGTCG' 
GATACTGTCATTATTGATGACTTTGCTC^ 

GCTGCTCGACAAAAATACCCGTCAAAAGAAATTGTAGCTATTTTCCAAC 

ACTCGTACX^TAGCTCTTTTAGACGATTTrcCCCATG 

TATCTTGCTCAAATATATGGTTCTGCTAGAGAAGTA 

GATTTAGCTGCTAAGATTGTCAAACACTCAGATTTAGT^ 

TTACTCAATCATGATAATGCTGTCTATGTCTTTATGGGT 

GAGCGCTCTTTTGAAGAATTATTAGCTAACCTAACTAA 

SEQ ZD NO. 4609 

STRAIN JM9130013 (reverse complement) 

GTTCAAAAAAGCAGGCTCTAGTGACGTTGACAAATATTAl 

GCAAGCAGGTATAACTATATTACCTTTCTCACCGAATAATATCAGT^ 

TATTGCAGGAAATGCTTTTCGTCCAGATAACAATGAAGA 

GGGCTATCATTTTAAACGATATCATGAATTTC^ CGTCAGTTCACTAG 

TCTAGGTGTAGCTGGGGCACATGGAAAAACCTCAACGACAG^ 

AAAAAATATTACAGACACTTCTTTCCTAA 

TGOTAATTACTTTGTGTTTGAAGCTGATGAATACGAACOT 

AGAATACTCAATTATTACCAATATTGATTT^ 

GGACXjTATTCAATGCTTTT AATGACTATG CTAAG CAAGTT CAAAAAGGTTTATr CATTT A 

TGGAGAAGATCCAAAACTTCATCAAATCACTTC^^ 

TGAAGATTCAAATGATTTTATAGCMAAGATATCACTCG^ 

TAAGGTITTCTATAACCAAGAAGAAATTGGTCAGTT^ 

TAATATCTTAAATGCAACTGCTGTTATTGCTAA^ 

ATTAGTAGCTGAGCATTTGAAGACATTTTCAGGGGTAA 

TATTGACGATACTGTCATTATTGATGACTTTO 

ATTAGATGCTG CTCGA£y\AAAATACCCGTCAAAAGAAATTCTAG 

TACGTTCACTCGTACGATAGCTCTTTTAGACGAATTT^ CCTTGAGTCAAGCGGA 

TAGCGTTTATCTCXCTCAAATATATGGTTCIX3CT 

GGTAGAAGATTTAGCIGCTAAGATTOTCAAACACTC^ 

CTOGCCITTACTCAATCATGATAATGC^ 

ATTGTATGAGCGCTCTTTTGAAGAATTATTAG^TA 

SEQ ZD NO. 4610 

STRAIN COH1 reverae complement 

CAGGCTCIAGTGACGTGACAAATAT tATTTT ACCCAACGTGGTTAGAGCAAGCAGGTGT AA 

CTATATTACCTTTCTCACOGAATAATATCAGTG 

CTTTTCGTCCAGATAACAATGAAGAGTTGGCTTATGT^ 

AAa^TATCATGAATTTCTCGGAGATTTTATGCGTCAG 

GGGCACATGGAAAAACCTCAACGACAGGTTTATTAGCT^ 

ACACTTCTTTCCTAATTGGAGATGGTACA^ 

TGTTTGAAGCTGATGAATACGAACGTCATTTTATGC^^ 

TTACCAATATTGATTTTGACXZATCCTGATTATTT^ 

CCTTTAATGACTATGCTAAGCAAGTTCAAAAAGG^ 

AACTTCATGAAATCACTTCTGAGGCAGCAATATATTAT^ 

ATTTTATAGCAAAAGACATCACTCGAACTGTTAATGGTTC 

ACCAAGAAGAAATTGGTCAGTTTCATGTACCAGCATA 

CAACTCCTGTTATTGCTAACCTTTACATAA 

ATTTCAAGACATTTTCAGGGGTAAAGCGTCGTTT^ 

TCATTATTGATGACTTTGCTCAC^ 

GACAAAAATACCCGTCAAAAGAAATTGTAGCTATTTTCCAACC^ 

CGATAGCTCTTTTAGACQAATTTG CCCATGCCTTG^ 

CTCAAATATATGGTTCTGCTAGAGAAGTAGATAATGGT^ 

CTGCrAAGATTGTCAAACACTCAGATTTAff 

ATCATGATAATGCTGTCTATGTCTTTA 

CTTTTGAAGAATTATTAGCTAACXITAACTAAAAATACACAA 

SEQ ZD NO. 4611 
STRAIN 2603 

atgtcaaaaacttatcattttattggtattaaaggatccggaatgagtgccctagcactg 
atgc 1 1 cat caaatgggacataacgtccaaggaagtgacgttgacaaat att att t tacc 
caacgtggtttagagcaagcaggtgtaactatattacctttctcaccgaataatatcagt 
gaggatttagagattattgcaggaaatgcttttcgtccagataacaatgaagagttggct 
tatgttattgaaaagggctatcaatttaaacgatatcatgaatttctcggagattttatg 
cgtcagttcactagtctaggtgtagctggggcacatggaaaaacctcaacgacaggttta 
ttagctcatgttttaaaaaatattacagacacttctttcctaattggagatggtacagga 
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Table 46: Comparative Sequences relating to SAG1615 (strain info highlighted in BOLD) 



cgtggttctgctaatgctaattactttgtgtttgaagctgatgaatacgaacgtcatttt 
atgccgtaccatccagaatactcaattattaccaatattgattttgaccatcctgattat 
tttacaggcttagaggacgtattcaatgcctttaatgactatgctaagcaagttcaaaaa 
ggtttattcatttatggagaagatccaaaacttcatgaaatcacttctgaggcaccaata 
tattattatggttttgaagattcaaatgattttatagcaaaagacatcactcgaactgtt 
aatggttctgactttaaggttttctataaccaagaagaaattggtcagtttcatgtacca 
gcatacggtaaacataatatcttaaatgcaactgctgttattgctaacctttacataatg 
ggaattgatatggcattagtagctgagcatttgaagacgttttcaggggtaaagcgtcgt 
tttactgagaagattattgacgatactgtcattattgatgactttgctcaccatcctact 
gagattattgcgacattagatgctgctcgacaaaaatacccgtcaaaagaaattgtagct 
attttccaaccgcatacgttcactcgtacgatagctcttttagacgaatttgcccatgcc 
ttgagtcaagcggatagcgtttatctcgctcaaatatatggttctgctagagaagtagat 
aatggtgaggtgaaggtagaagatttagctgctaagattgtcaaacactcagatttagtg 
acagtcgaaaatgtctcgcctttactcaatcatgataatgctgtctatgtctttatgggt 
gctggagacattcaattgtatgagcgctcttttgaagaattattagctaacctaactaaa 
aatacacaa 

SEQ XD HO. 4612 

STRAIN COH1 reverse complement 

CAGGCTCTAGTGACXn?tGACAAATAtTATTTT^ 

CTATATTACCTTTCTCACCGAATAATATCAGTGAGGAT^ 

iiiriCGTCCAGATAAC^TGAAGAGTTGGC^ 

AACGATATCATGAATTTCTCGGAGATTITATGCGTCAGTTCACT 

GGGCACATGQAAAAACCTCAACX5ACAGGTTTATTAGC^ 

ACACTTCTTTCCTAATTGGAGATGGTACAGGAC^ 

TGTTTGAAGCTGATGAATACX3AA 

TTACCAATATTQATTTTGACCATCCTGATTAT^ 

CCTTTAATGACTATGCTAAGCAAGTTCAAAAAGG^ 

AACTTCATGAAATCACTTCTGAGG CACCAATATATTATTATGGTTTTGAAGATTCAAATQ 

ATTTTATAGCAAAAGACATCACTCGAACK3TTAATC 

ACCAAGAAGAAATTGGTCAGTTTCATGTACCAGC^ 

CAACTGCTGTTATTGCTAACCTITACATAA 

ATTTGAAGACAj.> ~jriX?AG G 

TCATTATTGATGACTTTGCTCACCATC^ 

GACAAAAATACCCGTCAAAAGAAATTGTAGCTATTT^^ 

(XATAGCTCTTTTAGACXSAATTTGCCXATC^ 

CTCAAATATATGGTTCTGCTAGAGAAGTAGA^ 

CTGCTAAGATTGTCAAACACTCAGATTTAGTGACAGTCXSAAA^ 

ATCATGATAATGCTGTCTATGTCrr 1 ATGGGTG CTGGAGACATTCAATTGTATGAG CGCT 
CTTTTGAAGAATTATTAGCTAACCTAACTAAAAATACACAA 

PR ETTY of: /biotmp/msa56524 . 2 { * } November 26, 2002 08:06 .. 
PRETTY of i /biotmp/msa253045.2{*} January 31, 2003 03:51 .. 



msa253045 . 2 {157_090 
msa253045 . 2 { 157_CJB110 
msa253045 . 2 { 157_H36B 
msa253045 . 2 { 157 JJM9130013 
msa253045 . 2 {l57_1169NT 
maa253045 . 2 f 157_A909 
msa253045.2<157 COH1 
msa253045 . 2 { 157~M732 
msa253045 . 2 { 157_M781 
msa253045.2{!57 18RS21 
msa253 045 . 2 { 157_2603 
Consensus 



SO 



atgtcaaaaa cttatcattt tattggtatt aaaggatccg gaatgagtgc 



msa253045 
msa253045.2{ 

msa253045. 
msa253045-2{l57 
msa253045.2{' 

msa253045. 

msa253045. 

msa253045. 

msa253045. 
msa253045.2( 

msa253045 



.2{l57_090 
157 CJB110 
2{l57_H36B 
JM9130013 
157 1169NT 



51 



157_A909 
157 COH1 
157J4732 
157_M781 
157JL8RS21 
2{l57_2603 
Consensus 



100 

-aaagcaggc tctagtgacg 

A Aaaagcaggc tctagtgacg 

. Aaaagcaggc tctagtgacg 

— GttcaA Aaaagcaggc tctagtgacg 
Aaaagcaggc tctagtgacg 



— , caggc tctagtgacg 

. Aaaagcaggc tctagtgacg 

,„ , -aaagcaggc tctagtgacg 

, , . -aaagcaggc tctagtgacg 

cctagcactg atgcttcatc aaatGggacA taacgtccaa ggaagtgacg 



msa253045.2{l57 090 
msa253045 .2 { 157_CJB110 
msa253045.2{l57_H36B 
tnsa253045.2{l57_JM9130013 
tnsa253045 .2 { 157_1169NT 
msa253045 . 2 { 157_A909 
msa253045 . 2 ( 157_C0H1 
msa253045 . 2 j 157_M732 
msa253045.2{157 M7B1 
msa253045.2{l57_18RS21 



101 

tTGACAAATA 
tTGACAAATA 
tTGACAAATA 
tTGACAAATA 
tTGACAAATA 
-TGACAAATA 
tTGACAAATA 
tTGACAAATA 
tTGACAAATA 
tTGACAAATA 



TTATTTTACC 
TTATTTTACC 
TTATTTTACt 
TTATTTTACt 
TTATTTTACC 
TTATTTTACC 
TTATTTTACC 
TTATTTTACC 
TTATTTTACC 
TTATTTTACC 



CAACGTGGTT 
CAACGTGGTT 
CAACGTGGTT 
CAACGTGGTT 
CAACGTGGTT 
CAACGTGGTT 
CAA CGTG GTT 
CAACGTGGTT 
CAACGTGGTT 
CAACGTGGTT 



TAGAGCAAGC 
TAGAGCAAGC 
TAGAGCAAGC 
TAGAGCAAGC 
TAGAGCAAGC 
TAGAGCAAGC 
TAGAGCAAGC 
TAGAGCAAGC 
TAGAGCAAGC 
TAGAGCAAGC 



150 

AGGTgTAACT 
AGGTgTAACT 
AGGTaTAACT 
AGGTaTAACT 
AGGTgTAACT 
AGGTgTAACT 
AGGTgTAACT 
AGGTgTAACT 
AGGTgTAACT 
AGGTgTAACT 



801 



WO 2004/018646 



PCT/US2003/026827 



Table 46: Comparative Sequences relating to SAG1615 (strain info highlighted in BOLD) 



msa253045 . 2 { 157_2603 } 
Consensus 



tTGACAAATA TTATTTTACc CAACGTGGTT TAGAGCAAGC AGGTgTAACT 



msa253045 . 2 { 157_090 
msa253045.2{l57 CJB110 
msa2 53045 . 2 { 157_H36B 
tnsa253045 . 2 { 157_JM9130013 
msa253 045 . 2 { 157_1169NT 
rasa253045 . 2 { 157_A909 
msa253045.2{157_COHl 
msa2 53045 . 2 j 157J4732 
msa2 53045 ♦ 2 { 157J47 8 1 
msa253045 . 2 { 157_18RS21 
msa253045 . 2 { 157_2603 
Consensus 



151 

ATATTACCTT 
ATATTACCTT 
ATATTACCTT 
ATATTACCTT 
ATATTACCTT 
ATATTACCTT 
ATATTACCTT 
ATATTACCTT 
ATATTACCTT 
ATATTACCTT 
ATATTACCTT 



TCTCACCGAA 
TCTGACCGAA 
TCTCACCGAA 
TCTCACCGAA 
TCTCACCGAA 
TCTCACCGAA 
TCTCACCGAA 
TCTCACCGAA 
TCTCACCGAA 
TCTCACCGAA 
TCTCACCGAA 



TAATATCAGT 
TAATATCAGT 
TAATATCAGT 
TAATATCAGT 
TAATATCAGT 
TAATATCAGT 
TAATATCAGT 
TAATATCAGT 
TAATATCAGT 
TAATATCAGT 
TAATATCAGT 



GAGGATTTAG 
GAGGATTTAG 
GAGGATTTAG 
GAGGATTTAG 
GAGGATTTAG 
GAGGATTTAG 
GAGGATTTAG 
GAGGATTTAG 
GAGGATTTAG 
GAGGATTTAG 
GAGGATTTAG 



200 

AGATTATTGC 
AGATTATTGC 
AGATTATTGC 
AGATTATTGC 
AGATTATTGC 
AGATTATTGC 
AGATTATTGC 
AGATTATTGC 
AGATTATTGC 
AGATTATTGC 
AGATTATTGC 



msa253045 
msa253045.2{ 
msa253045 . 
msa253045.2{l57 
msa253045.2{ 
msa253045 
msa253045 
msa253045 
msa253045 
msa253045.2{ 
msa253045 



.2{157_090 
157_CJB110 
2 {157 H36B 
JM9 130013 
157 1169NT 
2(157 A909 
2(l57~COHl 
2(1S7_M732 
2{157_M781 
157 18RS21 
2{l57_2603 
Consensus 



201 

AGGAAATGCT 
AGGAAATGCT 
AGGAAATGCT 
AGGAAATGCT 
AGGAAATGCT 
AGGAAATGCT 
AGGAAATGCT 
AGGAAATGCT 
AGGAAATGCT 
AGGAAATGCT 
AGGAAATGCT 



TTTCGTCCAG 
TTTCGTCCAG 
TTTCGTCCAG 
TTTCGTCCAG 
TTTCGTCCAG 
TTTCGTCCAG 
TTTCGTCCAG 
TTTCGTCCAG 
TTTCGTCCAG 
TTTCGTCCAG 
TTTCGTCCAG 



ATAACAATGA 
ATAACAATGA 
ATAACAATGA 
ATAACAATGA 
ATAACAATGA 
ATAACAATGA 
ATAACAATGA 
ATAACAATGA 
ATAACAATGA 
ATAACAATGA 
ATAACAATGA 



AGAGTTGGCT 
AGAGTTGGCT 
AGAGTTGGCT 
AGAGTTGGCT 
AGAGTTGGCT 
AGAGTTGGCT 
AGAGTTGGCT 
AGAGTTGGCT 
AGAGTTGGCT 
AGAGTTGGCT 
AGAGTTGGCT 



250 

TATGTTATTG 
TATGTTATTG 
TATGTTATTG 
TATGTTATTG 
TATGTTATTG 
TATGTTATTG 
TATGTTATTG 
TATGTTATTG 
TATGTTATTG 
TATGTTATTG 
TATGTTATTG 



msa253045 . 2 { 157_090 ' 
rasa253 045 . 2 { 157_CJB110 ' 
msa253045 . 2 { 157JH36B 
msa253045.2{l5.7_JM9130013 
msa253045 .2 { 157_1169NT 
msa253045 . 2 f 157_A909 
msa253 045 . 2 j 157_C0H1 
msa253 04 5 . 2 { 157_M732 
msa253045.2{l57_M781 
msa253045 .2 { 157_18RS21 
msa253045 . 2 { 157J2603 
Consensus 



251 

AAAAGGGCTA 
AAAAGGGCTA 
AAAAGGGCTA 
AAAAGGGCTA 
AAAAGGGCTA 
AAAAGGGCTA 
AAAAGGGCTA 
AAAAGGGCTA 
AAAAGGGCTA 
AAAAGGGCTA 
AAAAGGGCTA 



TCAtTTTAAA 
TCAtTTTAAA 
TCAtTTTAAA 
TCAtTTTAAA 
TCAtTTTAAA 
TCAtTTTAAA 
TCAt TTTA AA 
TCAtTTTAAA 
TCAtTTTAAA 
TCAtTTTAAA 
TCAaTTTAAA 



CGATATCATG 
CGATATCATG 
CGATATCATG 
CGATATCATG 
CGATATCATG 
CGATATCATG 
CGATATCATG 
CGATATCATG 
CGATATCATG 
CGATATCATG 
CGATATCATG 



AATTTCTCGG 
AATTTCTCGG 
AATTTCTCGG 
AATTTCTCGG 
AATTTCTCGG 
AATTTCTCGG 
AATTTCTCGG 
AATTTCTCGG 
AATTTCTCGG 
AATTTCTCGG 
AATTTCTCGG 



300 

AGATTTTATG 
AGATTTTATG 
AGATTTTATG 
AGATTTTATG 
AGATTTTATG 
AGATTTTATG 
AGATTTTATG 
AGATTTTATG 
AGATTTTATG 
AGATTTTATG 
AGATTTTATG 



msa253045 
tnsa253045.2{ 

msa253045 
msa253045.2{l57 
maa253045.2{ 

msa253045. 

msa253045 . 

msa253045. 

msa253045. 
msa253045.2{ 

msa253045 



.2{l57_090 
157_CJB110 
2{157_H36B 
JM9130013 
157_1169NT 
2{157_A909 
2{157_COHl 
2<157_M732 
2{157_M781 
1S7_1BRS21 
2{157_2603 
Consensus 



301 

CGTCAGTTCA 
CGTCAGTTCA 
CGTCAGTTCA 
CGTCAGTTCA 
CGTCAGTTCA 
CGTCAGTTCA 
CGTCAGTTCA 
CGTCAGTTCA 
CGTCAGTTCA 
CGTCAGTTCA 
CGTCAGTTCA 



CTAGTCTAGG 
CTAGTCTAGG 
CTAGTCTAGG 
CTAGTCTAGG 
CTAGTCTAGG 
CTAGTCTAGG 
CTAGTCTAGG 
CTAGTCTAGG 
CTAGTCTAGG 
CTAGTCTAGG 
CTAGTCTAGG 



TGTAGCTGGG 
TGTAGCTGGG 
TGTAGCTGGG 
TGTAGCTGGG 
TGTAGCTGGG 
TGTAGCTGGG 
TGTAGCTGGG 
TGTAGCTGGG 
TGTAGCTGGG 
TGTAGCTGGG 
TGTAGCTGGG 



GCACATGGAA 
GCACATGGAA 
GCACATGGAA 
GCACATGGAA 
GCACATGGAA 
GCACATGGAA 
GCACATGGAA 
GCACATGGAA 
GCACATGGAA 
GCACATGGAA 
GCACATGGAA 



350 

AAACCTCAAC 
AAACCTCAAC 
AAACCTCAAC 
AAACCTCAAC 



AAACCTCAAC 
AAACCTCAAC 
AAACCTCAAC 
AAACCTCAAC 
AAACCTCAAC 
AAACCTCAAC 



rasa253045 . 2 { 157__090 
msa253045 . 2 { 157_CJB110 ' 
msa253045 . 2 { 157_H36B 
msa253045.2{l57 JM9130013 
msa253045 . 2 {157_1169NT' 
msa253045 . 2 { 157_A909 
msa2 53045 . 2 157_C0H1 
msa253045.2 157_M732 
msa253045.2{157_M781 
msa253045 . 2 { 157_18RS21 
msa253045. 2 {157_2603 
Consensus 



351 

GACAGGTTTA 
GACAGGTTTA 
GACAGGTTTA 
GACAGGTTTA 
GACAGGTTTA 
GACAGGTTTA 
GACAGGTTTA 
GACAGGTTTA 
GACAGGTTTA 
GACAGGTTTA 
GACAGGTTTA 



TTAGCTCATG 
TTAGCTCATG 
TTAGCTCATG 
TTAGCTCATG 
TTAGCTCATG 
TTAGCTCATG 
TTAGCTCATG 
TTAGCTCATG 
TTAGCTCATG 
TTAGCTCATG 
TTAGCTCATG 



TTTTA AAAAA 
TTTTAAAAAA 
TTTTA AAAAA 
TTTTAAAAAA 
TTTT AAAAAA 
TTTTA AAAAA 
TTTTAAAAAA 
TTTTA AAAAA 
TTTTAAAAAA 
TTTTA AAAAA 
TTTTAAAAAA 



TATTACAGAC 
TATTACAGAC 
TATTACAGAC 
TATTACAGAC 
TATTACAGAC 
TATTACAGAC 
TATTACAGAC 
TATTACAGAC 
TATTACAGAC 
TATTACAGAC 
TATTACAGAC 



400 

AC TTCTTT CC 
ACTT CTTT CC 
ACTTCTTTCC 

ACTTCTTTCC 
ACTTCTTTCC 
ACTTCTTTCC 
ACTTCTTTCC 
ACTTCTTTCC 
ACTTCTTTCC 
ACTTCTTTCC 



msa253045 
msa253045.2{ 
msa253045 
msa253045.2{l57 
tnaa253045.2{ 
msa253045. 
msa253045. 
msa253045. 
msa253045. 



,2{157_090 
157_CJB110 
2{157_H36B 
JM9130013 
157 1169NT 



157 A909 
157_C0H1 
157 M732 
157**M781 



401 

TAATTGGAGA 
TAATTGGAGA 
TAATTGGAGA 
TAATTGGAGA 
TAATTGGAGA 
TAATTGGAGA 
TAATTGGAGA 
TAATTGGAGA 
TAATTGGAGA 



TGGTACAGGA 
TGGTACAGGA 
TGGTACAGGA 
TGGTACAGGA 
TGGTACAGGA 
TGGTACAGGA 
TGGTACAGGA 
TGGTACAGGA 
TGGTACAGGA 



CGTGGTTCTG 
CGTGGTTCTG 
CGTGGTTCTG 
CGTGGTTCTG 
CGTGG TTCTG 
CGTGGTTCTG 
CGTGGTTCTG 
CGTGGTTCTG 
CGTGGTTCTG 



CTAATGCTAA 
CTAATGCTAA 
CTAATGCTAA 
CTAATGCTAA 
CTAATGCTAA 
CTAATGCTAA 
CTAATGCTAA 
CTAATGCTAA 
CTAATGCTAA 



450 

TTACTTTGTG 
TTACTTTGTG 
TTA CTTTG TG 
TTACTTTGTG 
TTACTTTGTG 
TTA CTTTG TG 
TTACTTTGTG 
TTACTTTGTG 
TTACTTTGTG 



802 



WO 2004/018646 



PCT/US2003/026827 



Table 46: Comparative Sequences relating to SAG1615 (strain info highlighted in BOLD) 



msa25304S.2{l57 18RS21} TAATTGGAGA TGGTACAGGA CGTGGTTCTG CTAATGCTAA TTACTTTGTQ 
msa253045.2{l57_2603) TAATTGGAGA TGGTACAGGA .CGTGGTTCTG CTAATGCTAA TTACTTTGTG 
Consensus ********** ********** ********** ********** ********** 



msa25304S.2{l57 090 
msa253045.2{l57_CJB110 , 
msa2 5 3 045 . 2 { 15 7_H3 6B 
insa253045.2{l57_JM9130013 
msa25304S . 2 { 157_1169NT 
msa2 53045 . 2[ 157_A909 
msa253045.2f 157 COH1 
msa2 53045 . 2 i 157~M732 
rasa253045 .2{l57_tf781 
msa253045 . 2 { 157_18RS21 
tnsa253045 . 2{ 157_2603 
Consensus 



451 

TTTGAAGCTG 
TTTGAAGCTG 
TTTGAAGCTG 
TTTGAAGCTG 
TTTGAAGCTG 
TTTGAAGCTG 
TTTGAAGCTG 
TTTGAAGCTG 
TTTGAAGCTG 
TTTGAAGCTG 
TTTGAAGCTG 



ATGAATACGA 
ATGAATACGA 
ATGAATACGA 
ATGAATACGA 
ATGAATACGA 
ATGAATACGA 
ATGAATACGA 
ATGAATACGA 
ATGAATACGA 
ATGAATACGA 
ATGAATACGA 



ACGTCATTTT 
ACGTCATTTT 
ACGTCATTTT 
ACGTCATTTT 
ACGTCATTTT 
ACGTCATTTT 
ACGTCATTTT 
ACGTCATTTT 
ACGTCATTTT 
ACGTCATTTT 
ACGTCATTTT 



ATGCCGTACC 
ATGCCGTACC 
ATGCCGTACC 
ATGCCGTACC 
ATGCCGTACC 
ATGCCGTACC 
ATGCCGTACC 
ATGCCGTACC 
ATGCCGTACC 
ATGCCGTACC 
ATGCCGTACC 



500 

ATCCAGAATA 
ATCCAGAATA 
ATCCAGAATA 
ATCCAGAATA 
ATCCAGAATA 
ATCCAGAATA 
ATCCAGAATA 
ATCCAGAATA 
ATCCAGAATA 
ATCCAGAATA 
ATCCAGAATA 



rosa253045 
tnsa253045.2{ 
msa253045. 
msa253045.2{l57 
msa253045.2{ 
msa253045 
R10a253O45 
msa253045 
msa253045 
msa253045.2-( 
msa253045 



.2{157_090 
1S7_CJB110 
2 {157 H36B 
_JM9 130013 
157_1169NT 
2(157_A909 
2fl57_C0Hl 
2{l57_M732 
2{157_M781 
157_18RS21 
2{157_2603 
Consensus 



501 

CTCAATTATT 
CTCAATTATT 
CTCAATTATT 
CTCAATTATT 
CTCAATTATT 
CTCAATTATT 
CTCAATTATT 
CTCAATTATT 
CTCAATTATT 
CTCAATTATT 
CTCAATTATT 



ACCAATATTG 
ACCAATATTG 
ACCAATATTG 
ACCAATATTG 
ACCAATATTG 
ACCAATATTG 
ACCAATATTG 
ACCAATATTG 
ACCAATATTG 
ACCAATATTG 
ACCAATATTG 



ATTTT GAOCA 
ATTTTGACCA 
ATTTTGACCA 
ATTTTGACCA 
ATTTTGACCA 
ATTTTGACCA 
ATTTTGACCA 
ATTTTGACCA 
ATTTTGACCA 
ATTTT GACCA 
ATTTTGACCA 



TCCTGATTAT 
TCCTGATTAT 
TCCTGATTAT 
TCCTGATTAT 
TCCTGATTAT 
TCCTGATTAT 
TCCTGATTAT 
TCCTGATTAT 
TCCTGATTAT 
TCCTGATTAT 
TCCTGATTAT 



550 

TTTACAGGCc 
TTTACAGGCc 
TTTACAGGCc 
TTTACAGGCc 
TTTACAGGCc 
TTTACAGGCc 
TTTACAGGCc 
TTTACAGGCc 
TTTACAGGCc 
TTTA CAGGCt 
TTTACAGGCt 



insa253045 
msa253045.2{ 
msa253045 
msa253045.2{l57 
msa253045.2{ 
msa253045 
msa25304S 
msa2 53045 
msa253045 
mBa253045.2{ 
msa253045 



2{157_090 
157_CJB110. 
2{157_H36B] 
JM9130013 
157_1169NTj 
2(l57_A909 
2<157_C0Hl' 
2il57_M732 
2{l57_M78i; 
157_18RS21] 
2{l57_2603 
Consensus 



551 

TAGAGGACGT 
TAGAGGACGT 
TAGAGGACGT 
TAGAGGACGT 
TAGAGGACGT 
TAGAGGACGT 
TAGAGGACGT 
TAGAGGACGT 
TAGAGGACGT 
TAGAGGACGT 
TAGAGGACGT 



ATTCAATGCt 
ATTCAATGCt 
ATTCAATGCt 
ATTCAATGCt 
ATTCAATGCc 
ATTCAATGCc 
ATTCAATGCc 
ATTCAATGCc 
ATTCAATGCC 
ATTCAATGCc 
ATTCAATGCc 



TTTAATGACT 
TTTAATGACT 
TTTAATGACT 
TTTAATGACT 
TTTAATGACT 
TTTAATGACT 
TTTAATGACT 
TTTAATGACT 
TTTAATGACT 
TTTAATGACT 
TTTAATGACT 



ATGCTAAGCA 
ATGCTAAGCA 
ATGCTAAGCA 
ATGCTAAGCA 
ATGCTAAGCA 
ATGCTAAGCA 
ATGCTAAGCA 
ATGCTAAGCA 
ATGCTAAGCA 
ATGCTAAGCA 
ATGCTAAGCA 



600 

AGTTCAAAAA 
AGTTCAAAAA 
AGTTCAAAAA 
AGTTCAAAAA 
AGTTCAAAAA 
AGTTCAAAAA 
AGTTCAAAAA 
AGTTCAAAAA 
AGTTCAAAAA 
AGTTCAAAAA 
AGTTCAAAAA 



msa253 045 . 2 { 157_090 1 
tnsa253045.2{l57 CJBIIO' 
msa253045 . 2{lS7_H36B 
msa253045.2{l57 JM9130013 
msa253 045 . 2 {1S7_1169NT 
msa253045 . 2 f 157_A909 
msa25304S . 2 f 1S7_C0H1 
rasa253045 . 2 {l57_M732 
msa253045.2(157 M781 
msa2 53 045 . 2 { 157_18RS2 1 
rasa253045 . 2 { 157_2603 
Consensus 



601 

GGTTTATTCA 
GGTTTATTCA 
GGTTTATTCA 
GGTTTATTCA 
GGTTTATTCA 
GGTTTATTCA 
GGTTTATTCA 
GGTTTATTCA 
GGTTTATTCA 
GGTTTATTCA 
GGTTTATTCA 



TTTATGGAGA 
TTTATGGAGA 
TTTATGGAGA 
TTTATGGAGA 
TTTATGGAGA 
TTTATGGAGA 
TTTATGGAGA 
TTTATGGAGA 
TTTATGGAGA 
TTTATGGAGA 
TTTATGGAGA 



AGATtCAAAA 
AGATtCAAAA 
AGATcCAAAA 
AGATCCAAAA 
AGATcCAAAA 
AGATcCAAAA 
AGATcCAAAA 
AGATCCAAAA 
AGATcCAAAA 
AGATcCAAAA 
AGATcCAAAA 



CTTCATGAAA 
CTTCATGAAA 
CTTCATGAAA 
CTTCATGAAA 
CTTCATGAAA 
CTTCATGAAA 
CTTCATGAAA 
CTTCATGAAA 
CTTCATGAAA 
CTTCATGAAA 
CTTCATGAAA 



650 

TCACTTCTaA 
TCACTTCTaA 
TCACTTCTgA 
TCACTTCTgA 
TCACTTCTgA 
TCACTTCTgA 
TCACTTCTgA 
TCACTTCTgA 
TCACTTCTgA 
TCACTTCTgA 
TCACTTCTgA 



»~* 



msa253045 
msa2S3045.2{ 

msa2S3045. 
insa253045.2{l57 
msa253045.2{ 

mea253045. 

msa2 53045. 

msa253045. 

msa253045. 
msa253045.2{ 

msa253045. 



,2{157_090 
157_CJB110 
2{l57_H36B 
JW9130013 
157 1169NT 



157_A909 
157_C0H1 
157J4732 
157_M781 
157_18RS21 
2{157__2603 
Consensus 



651 

GGCACCAATA 
GGCACCAATA 
GGCACCAATA 
GGCACCAATA 
GGCACCAATA 
GGCACCAATA 
GGCACCAATA 
GGCACCAATA 
GGCACCAATA 
GGCACCAATA 
GGCACCAATA 



TATTATTATG 
TATTATTATG 
TATTATTATG 
TATTATTATG 
TATTATTATG 
TATTATTATG 
TATTATTATG 
TATTATTATG 
TATTATTATG 
TATTATTATG 
TATTATTATG 



GTTTTGAAGA 
GTTTTGAAGA 
GTTTTGAAGA 
GTTTTGAAGA 
GTTTTGAAGA 
GTTTTGAAGA 
GTTTTGAAGA 
GTTTTGAAGA 
GTTTTGAAGA 
GTTTTGAAGA 
GTTTTGAAGA 



TTCAAATGAT 
TTCAAATGAT 
TTCAAATGAT 
TTCAAATGAT 
TTCAAATGAT 
TTCAAATGAT 
TTCAAATGAT 
TTCAAATGAT 
TTCAAATGAT 
TTCAAATGAT 
TTCAAATGAT 



700 

TTTATAGCAA 
TTTATAGCAA 
TTTATAGCAA 
TTTATAGCAA 
TTTATAGCAA 
TTTATAGCAA 
TTTATAGCAA 
TTTA TAGCAA 
TTTATAGCAA 
TTTATAGCAA 
TTTATAGCAA 



msa253045.2{l57 090; 
insa253 045 . 2 { 157_COB110 
msa253045 . 2 { 157_H36B 
tnsa2S3045.2{l57 JM9 130013 
msa253045.2{l57 1169NT 
msa253045.2{l57 A909 
mBa25304S.2(157_COHl 
mfla253045 . 2 { 157_M732 



701 

AAGAcATCAC 
AAGAcATCAC 
AAGAtATCAC 
AAGAtATCAC 
AAGACATCAC 
AAGACATCAC 
AAGACATCAC 
AAGAcATCAC 



TCQAA CTGTT 
TCGAACTGTT 
TCGAACTGTT 
TCGAACTGTT 
TCGAACTGTT 
TCGAACTGTT 
TCGAACTGTT 
TCGAACTGTT 



AATGGTTCTG 
AATGGTTCTG 
AATGGTTCTG 
AATGGTTCTG 
AATGGTTCTG 
AATGGTTCTG 
AATGGTTCTG 
AATGGTTCTG 



ACTTTAAGGT 
ACTTTAAGGT 
ACTTTAAGGT 
ACTTTAAGGT 
ACTTTAAGGT 
ACTTTAAGGT 
ACTTTAAGGT 
ACTTTAAGGT 



750 

TTTCTATAAC 
TTTCTATAAC 
TTTCTATAAC 
TTTCTATAAC 
TTTCTATAAC 
TTTCTATAAC 
TTTCTATAAC 
TTTCTATAAC 



803 



WO 2004/018646 



PCT/US2003/026827 



Table 46: Comparative Sequences relating to SAG1615 (strain info highlighted in BOLD) 



msa253045.2{l57 M78l) 
msa253 045 . 2 { 157_18RS2 1 } 
cnsa253045 . 2 { 157_260 3 ) 
Consensus 



AAGAcATCAC TCGAACTGTT AATGQTTCTO ACTTTAAGGT TTTCTATAAC 
AAGAcATCAC TCGAACTGTT AATGGTTCTG ACTTTAAGGT TTTCTATAAC 
AAGACATCAC TCGAACTGTT AATGGTTCTG ACTTTAAGGT TTTCTATAAC 



msa25304 5 
msa253045.2{ 
msa253045 
msa253045.2{l57 
msa253045.2{ 
rosa253045 
msa253045 
msa253045 
msa253045 
msa253045.2{ 
msa25304S. 



2{lS7_090 
157_CJB110 
2{157_H36B 
_JM9130013' 
157_1169NT 
2{l57_A909 
2<157_C0H1 
2<157JM732 
2{1S7_M781 
157__18RS21 
2{l57_2603 
Consensus 



751 

CAAGAAGAAA 
CAAGAAGAAA 
CAAGAAGAAA 
CAAGAAGAAA 
CAAGAAGAAA 
CAAGAAGAAA 
CAAGAAGAAA 
CAAGAAGAAA 
CAAGAAGAAA 
CAAGAAGAAA 
CAAGAAGAAA 



TTGGTCAGTT 
TTGGTCAGTT 
TTGGTCAGTT 
TTGGTCAGTT 
TTGGTCAGTT 
TTGGTCAGTT 
TTGGTCAGTT 
TTGGTCAGTT 
TTGGTCAGTT 
TTGGTCAGTT 
TTGGTCAGTT 



TCAtGTACCA 
TCAtGTACCA 
TCAcGTACCA 
TCAcGTACCA 
TCAtGTACCA 
TCAtGTACCA 
TCAtGTACCA 
TCAtGTACCA 
TCAtGTACCA 
TCAtGTACCA 
TCAtGTACCA 



GCATACGGTA 
GCATACGGTA 
GCATACGGTA 
GCATACGGTA 
GCATACGGTA 
GCATACGGTA 
GCATACGGTA 
GCATACGGTA 
GCATACGGTA 
GCATACGGTA 
GCATACGGTA 



800 

AACATAATAT 
AACATAATAT 
AACATAATAT 
AACATAATAT 
AACATAATAT 
AACATAATAT 
AACATAATAT 
AACATAATAT 
AACATAATAT 
AACATAATAT 
AACATAATAT 



msa253045 . 2 { 157_090 
msa253 045 . 2 { 157_CJB110 
msa253045.2{l57_H36B 
nisa253045 . 2 { 157_JM913 0013 
msa253045.2{lS7_1169NT 
msa2 53045. 2{l57 A909 
msa253045.2{157~COHl 
msa253045.2 157~M732 
msa253045 . 2 (15734781 
msa253 045 . 2 { 157_18RS21 
msa253045.2{l57_2603 
Consensus 



801 

CTTAAATGCA 
CTTAAATGCA 
CTTAAATGCA 
CTTAAATGCA 
CTTAAATGCA 
CTTAAATGCA 
CTTAAATGCA 
CTTAAATGCA 
CTTAAATGCA 
CTTAAATGCA 
CTTAAATGCA 



ACTGCTGTTA 
ACTGCTGTTA 
ACTGCTGTTA 
ACTGCTGTTA 
ACTGCTGTTA 
ACTGCTGTTA 
ACTGCTGTTA 
ACTGCTGTTA 
ACTGCTGTTA 
ACTGCTGTTA 
ACTGCTGTTA 



TTGCTAACCT 
TTGCTAACCT 
TTGCTAACCT 
TTGCTAACCT 
TTGCTAACCT 
TTGCTAACCT 
TTGCTAACCT 
TTGCTAACCT 
TTGCTAACCT 
TTGCTAACCT 
TTGCTAACCT 



TTACATAATG 
TTACATAATG 
TTACATAATG 
TTACATAATG 
TTACATAATG 
TTACATAATG 
TTACATAATG 
TTACATAATG 
TTACATAATG 
TTACATAATG 
TTACATAATG 



850 

GGAATTGATA 
GGAATTGATA 
GGAATTGATA 
GGAATTGATA 
GGAATTGATA 
GGAATTGATA 
GGAATTGATA 
GGAATTGATA 
GGAATTGATA 
GGAATTGATA 
GGAATTGATA 



rasa253045.2{l57_090 
msa2 53 045 . 2 { 1S7_CJB11 0 
msa253045 . 2 { 157_H36B' 
msa253045.2{l57_JM9130013 
msa2S3045 . 2 { 157_1169NT 
msa253045 . 2{ 157_A909 
msa253045.2 157_C0H1 
msa253045 . 2 157_M732 
msa253045 . 2 { 157_M78 1 
msa253045 . 2 { 157_18RS21 
msa253045 . 2 { 157_2603 
Consensus 



851 

TGGCATTAGT 
TGGCATTAGT 
TGGCATTAGT 
TGGCATTAGT 
TGGCATTAGT 
TGGCATTAGT 
TGGCATTAGT 
TGGCATTAGT 
TGGCATTAGT 
TGGCATTAGT 
TGGCATTAGT 



AGCTGAGCAT 
AGCTGAGCAT 
AGCTGAGCAT 
AGCTGAGCAT 
AGCTGAGCAT 
AGCTGAGCAT 
AGCTGAGCAT 
AGCTGAGCAT 
AGCTGAGCAT 
AGCTGAGCAT 
AGCTGAGCAT 



TTGAAGACaT 
TTGAAGACaT 
TTGAAGACaT 
TTGAAGACaT 
TTGAAGACaT 
TTGAAGACaT 
TTGAAGACaT 
TTGAAGACaT 
TTGAAGACaT 
TTGAAGACgT 
TTGAAGACgT 



TTTCAGGGGT 
TTTCAGGGGT 
TTTCAGGGGT 
TTTCAGGGGT 
TTTCAGGGGT 
TTTCAGGGGT 
TTTCAGGGGT 
TTTCAGGGGT 
TTTCAGGGGT 
TTTCAGGGGT 
TTTCAGGGGT 



900 

AAAaCGTCGT 
AAAaCGTCGT 
AAAaCGTCGT 
AAAaCGTCGT 
AAAgCGTCGT 
AAAgCGTCGT 
AAAgCGTCGT 
AAAgCGTCGT 
AAAgCGTCGT 
AAAgCGTCGT 
AAAgCGTCGT 



msa253045 . 2 {157_090 
msa253045.2{l57 CJB110 
m8a253045.2{l57_H36B , 
msa253045 . 2 { 157_JM9130013 
msa253045 .2 { 157_1169NT 
msa253045.2fl57_A909 
msa253045 . 2 157_COHl' 
msa253045 . 2 157_M732 
msa253045.2{l57 M7B1 
msa253045.2{lS7_18RS21 
msa253045 . 2 { 157^2603 
Consensus 



901 

TTTACTGAGA 
TTTACTGAGA 
TTTACTGAGA 
TTTACTGAGA 
TTTACTGAGA 
TTTACTGAGA 
TTTACTGAGA 
TTTACTGAGA 
TTTACTGAGA 
TTTACTGAGA 
TTTACTGAGA 



AgATTATTGA 
AgATTATTGA 
AaATTATTGA 
AaATTATTGA 
AgATTATTGA 
AgATTATTGA 
AgATTATTGA 
AgATTATTGA 
AgATTATTGA 
AgATTATTGA 
AgATTATTGA 



CGATACTGTC 
CGATACTGTC 
CGATACTGTC 
CGATACTGTC 
CGATACTGTC 
CGATACTGTC 
CGATACTGTC 
CGATACTGTC 
CGATACTGTC 
CGATACTGTC 
CGATACTGTC 



ATTATTGATG 
ATTATTGATG 
ATTATTGATG 
ATTATTGATG 
ATTATTGATG 
ATTATTGATG 
ATTATTGATG 
ATTATTGATG 
ATTATTGATG 
ATTATTGATG 
ATTATTGATG 



950 

ACTTTGCTCA 
ACTTTGCTCA 
ACTTTGCTCA 
ACTTTGCTCA 
ACTTTGCTCA 
ACTTTGCTCA 
ACTTTGCTCA 
ACTTTGCTCA 
ACTTTGCTCA 
ACTTTGCTCA 
ACTTTGCTCA 



msa2 53 04 5 . 2 { 1 57_09 0 
msa253045 . 2 { 157_CJB110 
msa253045 . 2 { 157 JH36B 
msa253045 . 2 { 157_JM9130013 
rasa253045.2{l57_1169NT 
msa253045.2(l57_A909 
maa253045 .2 157_C0H1 
msa253045 .2 157_M732 
msa253045.2{157_M781 
msa253045 . 2 { 157_1BRS21 
msa253045 . 2 { 157_2603 
Consensus 



951 

CCATCCTACT 
CCATCCTACT 
CCATCCTACT 
CCATCCTACT 
CCATCCTACT 
CCATCCTACT 
CCATCCTACT 
CCATCCTACT 
CXATCCTACT 
CCATCCTACT 
CCATCCTACT 



GAGATTATTG 
GAGATTATTG 
GAGATTATTG 
GAGATTATTG 
GAGATTATTG 
GAGATTATTG 
GAGATTATTG 
GAGATTATTG 
GAGATTATTG 
GAGATTATTG 
GAGATTATTG 



CGACATTAGA 
CGACATTAGA 
CGACATTAGA 
CGACATTAGA 
CGACATTAGA 
CGACATTAGA 
CGACATTAGA 
CGACATTAGA 
CGACATTAGA 
CGACATTAGA 
CGACATTAGA 



TGCTGCTCGA 
TGCTGCTCGA 
TGCTGCTCGA 
TGCTGCTCGA 
TGCTGCTCGA 
TGCTGCTCGA 
TGCTGCTCGA 
TGCTGCTCGA 
TGCTGCTCGA 
TGCTGCTCGA 
TGCTGCTCGA 



1000 
CAAAAATACC 
CAAAAATACC 
CAAAAATACC 
CAAAAATACC 
CAAAAATACC 
CAAAAATACC 
CAAAAATACC 
CAAAAATACC 
CAAAAATACC 
CAAAAATACC 
CAAAAATACC 



msa253045.2{l57_090 
msa253045 .2{ 157_CJB110 
msa2 53045 . 2 {157_H3€B 
msa253045 . 2{ 157_JM913 0013 
rosa253045.2{l57 1169NT 
msa2S3045.2(l57 A909 
raaa2 S3045 . 2 { 157"C0H1 



1001 

CGTCAAAAGA 
CGTCAAAAGA 
CGTCAAAAGA 
CGTCAAAAGA 
CGTCAAAAGA 
CGTCAAAAGA 
CGTCAAAAGA 



AATTGTAGCT 
AATTGTAGCT 
AATTGTAGCT 
AATTGTAGCT 
AATTGTAGCT 
AATTGTAGCT 
AATTGTAGCT 



ATTTTCCAAC 
ATTTTCCAAC 
ATTTTCCAAC 
ATTTT CCAAC 
ATTTTCCAAC 
ATTTTCCAAC 
ATTTTCCAAC 



CGCATACGTT 
CGCATACGTT 
CGCATAC GTT 
CGCATACGTT 
CGCATACGTT 
CGCATACGTT 
CGCATACGTT 



1050 
CACTCGTACG 
CACTCGTACG 
CACTCGTACG 
CACTCGTACG 
CACTCGTACG 
CACTCGTACG 
CACTCGTACG 



804 



WO 2004/018646 



PCT/US2003/026827 



Table 46: Comparative Sequences relating to SAG1615 (strain info highlighted in BOLD) 



tnsa253045.2{l57 M732) 
msa253045 . 2 { 157 JM7 81 } 
rasa2S3045 . 2 {l57_18RS21 1 
rasa253045.2{l57_2603} 
Consensus 



CGTCAAAAGA AATTGTAGCT ATTTTCCAAC CGCATACGTT CACTCGTACG 
CGTCAAAAGA AATTGTAGCT ATTTTCCAAC CGCATACGTT CACTCGTACG 
CGTCAAAAGA AATTGTAGCT ATTTT CCAAC CGCATACGTT CACTCGTACG 
CGTCAAAAGA AATTGTAGCT ATTTTCCAAC CGCATACGTT CACTCGTACG 



rasa253045 . 2 { 157_090' 
msa253045 . 2 { 157_C JB110 ' 
msa2 53045 . 2 { 157_H36B 
msa253045.2{l57_JM9130013 i 
msa2 53 045 . 2 { 157_1 16 9NT 
ma a2 53 045 . 2{l57_A909 
• msa253045.2 157 COH1 
tnsa253045 .2 15731732 
msa2 53 045 . 2 { 157_M7 8 1 
maa253045 . 2 { 1S7_18RS2 1 
rasa2 53045 . 2 { 157_2603 
Consensus 



1051 

ATAGCTCTTT 
ATAGCTCTTT 
ATAGCTCTTT 
ATAGCTCTTT 
ATAGCTCTTT 
ATAGCTCTTT 
ATAGCTCTTT 
ATAGCTCTTT 
ATAGCTCTTT 
ATAGCTCTTT 
ATAGCTCTTT 



TAGACGAtTT 
TAGACGAtTT 
TAGACGAaTT 
TAGACGAaTT 
TAGACGAaTT 
TAGACGAaTT 
TAGACGAaTT 
TAGACGAaTT 
TAGACGAaTT 
TAGACGAaTT 
TAGACGAaTT 



TGCCCATGCt 
TGCCCATGCt 
TGCCCATGCC 
TGCCCATGCc 
TGCCCATGCc 
TGCCCATGCc 
TGCCCATGCc 
TGCCCATGCc 
TGCCCATGCC 
TGCCCATGCc 
TGCCCATGCc 



TTGAGTCAAG 
TTGAGTCAAG 
TTGAGTCAAG 
TTGAGTCAAG 
TTGAGTCAAG 
TTGAGTCAAG 
TTGAGTCAAG 
TTGAGTCAAG 
TTGA GTCAAG 
TTGAGTCAAG 
TTGAGTCAAG 



1100 
CGGATAGCGT 
CGGATAGCGT 
CGGATAGCGT 
CGGATAGCGT 
CGGATAGCGT 
CGGATAGCGT 
CGGATAGCGT 
CGGATAGCGT 
CGGATAGCGT 
CGGATAGCGT 
CGGATAGCGT 



m8a253045 . 2 { 157_090 
msa253045 .2{157_CJB110 
msa253045.2{l57 H36B 
msa253045 . 2 { 157_JM9 130013 
msa253045.2{l57_1169NT 
TOBa253045 . 2 ( 157_A909 
maa2 53045 . 2 { 157_COHl 
msa253045.2(157~M732 
msa25304S.2{l57 M781 
rasa2 53045 . 2 { 157_18RS2 1 
msa25304S . 2{ 157_2603 
Consensus 



1101 

TTATCTtGCT 
TTATCTtGCT 
TTATCTcGCT 
TTATCTcGCT 
TTATCTcGCT 
TTATCTcGCT 
TTATCTcGCT 
TTATCTcGCT 
TTATCTcGCT 
TTATCTcGCT 
TTATCTcGCT 



CAAATATATG 
CAAATATATG 
CAAATATATG 
CAAATATATG 
CAAATATATG 
CAAATATATG 
CAAATATATG 
CAAATATATG 
CAAATATATG 
CAAATATATG 
CAAATATATG 



GTTCTGCTAG 
GTTCTGCTAG 
GTTCTGCTAG 
GTTCTGCTAG 
GTTCTGCTAG 
GTTCTGCTAG 
GTTCTGCTAG 
GTTCTGCTAG 
GTTCTGCTAG 
GTTCTGCTAG 
GTTCTGCTAG 



AGAAGTAGAT 
AGAAGTAGAT 
AGAAGTAGAT 
AGAAGTAGAT 
AGAAGTAGAT 
AGAAGTAGAT 
AGAAGTAGAT 
AGAAGTAGAT 
AGAAGTAGAT 
AGAAGTAGAT 
AGAAGTAGAT 



1150 
AATGGTGAGG 
AATGGTGAGG 
AATGGTGAGG 
AATGGTGAGG 
AATGGTGAGG 
AATGGTGAGG 
AATGGTGAGG 
AATGGTGAGG 
AATGGTGAGG 
AATGGTGAGG 
AATGGTGAGG 



msa253045.2{l57_090 
rasa253045 . 2 { 157_CJB110 
msa253045.2{l57 H36B 
msa253045 . 2 { 157_jJM9130013 
msa253045 . 2 { 1S7_1169NT 
msa253045 . 2 ( 157_A909 * 
rasa253 045 . 2 { 157_C0H1 
msa253045.2{l57 M732 
msa253045 . 2 { 157~M781 
msa253045 .2 (157_18RS21 
msa253045 . 2{l57_2603 
Consensus 



1151 

TGAAGGTAGA 
TGAAGGTAGA 
TGAAGGTAGA 
TGAAGGTAGA 
TGAAGGTAGA 
TGAAGGTAGA 
TGAAGGTAGA 
TGAAGGTAGA 
TGAAGGTAGA 
TGAAGGTAGA 
TGAAGGTAGA 



AGATTTAGCT 
AGATTTAGCT 
AGATTTAGCT 
AGATTTAGCT 
AGATTTAGCT 
AGATTTAGCT 
AGATTTAGCT 
AGATTTAGCT 
AGATTTAGCT 
AGATTTAGCT 
AGATTTAGCT 



GCTAAGATTG 
GCTAAGATTG 
GCTAAGATTG 
GCTAAGATTG 
GCTAAGATTG 
GCTAAGATTG 
GCTAAGATTG 
GCTAAGATTG 
GCTAAGATTG 
GCTAAGATTG 
GCTAAGATTG 



TCAAACACTC 
TCAAACACTC 
TCAAACACTC 
TCAAACACTC 
TCAAACACTC 
TCAAACACTC 
TCAAACACTC 
TCAAACACTC 
TCAAACACTC 
TCAAACACTC 
TCAAACACTC 



1200 
AGATTTAGTG 
AGATTTAGTG 
AGATTTAGTG 
AGATTTAGTG 
AGATTTAGTG 
AGATTTAGTG 
AGATTTAGTG 
AGATTTAGTG 
AGATTTAGTG 
AGATTTAGTG 
AGATTTAGTG 



msa253045.2{l57_090 
rasa253045 . 2 { 157_CJB110 
msa253045. 2(157 K36B 
msa253045 . 2 { 157_JM9130013 
msa253045 . 2 { 1S7_1169NT 
maa253045 . 2 { 157_A909 
rasa253045 .2 157_COHl 
msa253045 . 2 157_M732 
rasa253045.2{157 M781 
tasa2 53 045 . 2 { 157_18RS2 1 
msa253045 . 2{157_2603 
Consensus 



1201 

ACAGTCGAAA 
ACAGTCGAAA 
ACAGTCGAAA 
ACAGTCGAAA 
ACAGTCGAAA 
ACAGTCGAAA 
ACAGTCGAAA 
ACAGTCGAAA 
ACAGTCGAAA 
ACAGTCGAAA 
ACAGTCGAAA 



ATGTCTCGCC 
ATGTCTCGCC 
ATGTCTCGCC 
ATGTCTCGCC 
ATGTCTCGCC 
ATGTCTCGCC 
ATGTCTCGCC 
ATGTCTCGCC 
ATGTCTCGCC 
ATGTCTCGCC 
ATGTCTCGCC 



TTTACTCAAT 
TTTACTCAAT 
TTTACTCAAT 
TTTACTCAAT 
TTTACTCAAT 
TTTACTCAAT 
TTTACTCAAT 
TTTACTCAAT 
TTTACTCAAT 
TTTACTCAAT 
TTTACTCAAT 



CATGATAATG 
CATGATAATG 
CATGATAATG 
CATGATAATG 
CATGATAATG 
CATGATAATG 
CATGATAATG 
CATGATAATG 
CATGATAATG 
CATGATAATG 
CATGATAATG 



1250 

CTGTCTATGT 
CTGTCTATGT 
CTGTCTATGT 
CTGTCTATGT 
CTGTCTATGT 
CTGTCTATGT 
CTGTCTATGT 
CTGTCTATGT 
CTGTCTATGT 
CTGTCTATGT 
CTGTCTATGT 



tnsa253045 . 2 {157_090 
msa253045 . 2 { 157_CJB1X0 
. ra8a253045.2{l57_H36B 
msa253 04 5 . 2 { 157_JM91 3 0 0 13 
msa253045 . 2 { 157_1 169NT 
msa2 53045 . 2 { 157jA909 
msa253045.2 157 COH1 
rasa253 045.2 157^M732 
rasa253045.2{157 M761 
msa253045 . 2 { 157_18RS2 1 
msa253045.2{l57_2603 
Consensus 



1251 

CTTTATGGGT 
CTTTATGGGT 
CTTTATGGGT 
CTTTATGGGT 
CTTTATGGGT 
CTTTATGGGT 
CTTTATGGGT 
CTTTATGGGT 
CTTTATGGGT 
CTTTATGGGT 
CTTTATGGGT 



GCTGGAGACA 
GCTGGAGACA 
GCTGGAGACA 
GCTGGAGACA 
GCTGGAGACA 
GCTGGAGACA 
GCTGGAGACA 
GCTGGAGACA 
GCTGGAGACA 
GCTGGAGACA 
GCTGGAGACA 



TTCAATTGTA 
TTCAATTGTA 
TTCAATTGTA 
TTCAATTGTA 
TTCAATTGTA 
TTCAATTGTA 
TTCAATTGTA 
TTCAATTGTA 
TTCAATTGTA 
TTCAATTGTA 
TTCAATTGTA 



TGAGCGCTCT 
TGAGCGCTCT 
TGAGCGCTCT 
TGAGCGCTCT 
TGAGCGCTCT 
TGAGCGCTCT 
TGAGCGCTCT 
TGAGCGCTCT 
TGAGCGCTCT 
TGAGCGCTCT 
TGAGCGCTCT 



1300 
TTTGAAGAAT 
TTTGAAGAAT 
TTTGAAGAAT 
TTTGAAGAAT 
TTTGAAGAAT 
TTTGAAGAAT 
TTTGAAGAAT 
TTTGAAGAAT 
TTTGAAGAAT 
TTTGAAGAAT 
TTTGAAGAAT 



msa253 045 . 2 { 157_090 
msa253045.2(l57 CJB110 
msa25304S.2{l57 H36B 
msa253045.2{l57 JM9130013 
msa253045 . 2 { 157_1169NT 
msa253045.2{l57_A909 



1301 

TATTAGCTAA 
TATTAGCTAA 
TATTAGCTAA 
TATTAGCTAA 
TATTAGCTAA 
TATTAGCTAA 



CCTAACTAAA 
CCTAACTAAA 
CCTAACTAAA 
CCTAACTAAA 
CCTAACTAAA 
CCTAACTAAA 



1329 
AATACACAA 
AATACACAA 
AATACACAA 
AATACACAA 
AATACACAA 
AATACACAA 



805 



WO 2004/018646 



PCT7US2003/026827 



Table 46: Comparative Sequences relating to SAG1615 (strain info highlighted in BOLD) 



msa253045 . 2 I 157_COHl 
msa253045 . 2 f 157_M732 
msa253045 . 2 { 157_M781 
msa253 045 » 2 { 157_18RS21 
msa253045 . 2 { 157_2603 
Consensus 



TATTAGCTAA 
TATTAGCTAA 
TATTAGCTAA 
TATTAGCTAA 
TATTAGCTAA 



CCTAACTAAA AATACACAA 
CCTAACTAAA AATACACAA 
CCTAACTAAA AATACACAA 
CCTAACTAAA AATACACAA 
CCTAACTAAA AATACACAA 



SEQ ID NO. 4613 
STRAIN A9 09 frame: 2 

DKYYFTQRGLEQAGVT I LPFSPNN I SEDLE 1 I AGNAFRPDNNEELAYVI EKG YHFKRYHE 
FLGD FMRQFT SLGVAGAHGKTSTTGLLAHVLKNI TDT S FLI GDGTGRG SANANY FVF BAD 
BYBRHFMPYHPEYS I ITNIDFDHPDYFTGLEDVFNAFNDYAKQVQKGLFI YGEDPKLHE I 
TSEAP I YYYGFEDSNDFI AKDITRTWGSDFKWYNQEE IGQFHVPAYGKHN I LNATAVI 
ANLYIMGIDMALVAEHLKTFSGVKRRFTEKI IDDTVI I DDFAHHPTE I IATLDAARQKYP 
SKEIVAI FQPHTFTRTIALIjDEFAHALSOJUDSVYLAQIYGSAREVDNGEVKVEDLAAKIV 
KHSDLVTVENVSPLLNHDNAVYVFMGAGD I QLYERSFEELLANLTKNTQ 

SEQ ZD NO. 4614 
STRAIN U69NT frame: 2 

KAGSSDVDKYYFTQRGLEQAGVTI LPFSPNNI SEDLE 1 1 AGNAFRPDNNEEIiAYV I EKG Y 
HFKRYHBFU5DFMRQFTSIX3VAGAHGKTSTTC^ 

YFVFEADEYERHFMPYHPEYS I ITNIDFDHPDYFTGLEDVFNAFNDYAKQVQKGLFIYGE 
DPKLHEI TSEAP I YYYGFEDSNDF IAKDITRTVNGSDFKVFYNQEEI GQFHVPAYGKHNI 
LNATAV1ANLYIMGI DMALVAEHIJCTFSGVKRRFTEKT IDDTVI I DDFAHHPTE I IATLD 
AARQKYPSKEIVAI FQPHTFTRTIAXiLDEFAHALSQADSVYIJVQI^ 
DLAAKIVKHSDLVTVENVSPIANHDNAVYVFMGAGDIQLYERSFEE 

SEQ ID NO. 4615 
STRAIN 090 FRAME: 1 

KAGSSDVDKYYFTQRGIiEQAGVTI LPFSPNNI SEDLE I IAGNAFRPDNNEBLAYVIEKGY 
HBKRYHBFIXaDFMRQFTSLGVAGAHGKTSTTGLLAHVL^ I TDTS FL I GDGTGRG SANAN 
YFVFEADEYERHFMPYHPEYS I ITNIDFDHPDYFTGLEDVFNAFNDYAKQVQKGLFIYGE 
DS KLHEITSKAP I YYYGFEDSNDFI AKDI TRTVNGSDFKVFYNQEBI GQFHVPAYGKHNI 
LNATAVIANL Y I MG I DMALVAEHLKTF SGVKRRFTEKI I DDTVI I DDFAHHPTE I IATLD 
AARQKYPSKEIVAI TOPHTFTRTIAIiLDDFAHAIiSGiU5SVYIjAQIYGSARBVDNGEViWB 
DLAAKI VKHSDLVTVENVSPLLNHDNAVYVFMGAGD I QLYERSFEELLANLTKNTQ 

SEQ ID NO. 4616 
STRAIN H36B frames 2 

KAGS SDVDKYYFTQRGLEQAGI TI LPFSPNNI SEDLE 1 1 AGNAPRPDNNEELAYVI EKGY 
HFKRYHEFIjGDFMRQFTSLGVAGAHGKTSTTGLLAHVL^ 

YFVFEADEYERHFMPYHPEYS I ITN I DFDHPDYFTGLED VFNAFNDYAKQVQKGLF I YGB 
DPKLHBITSEAPI YYYGFEDSNDF IAKDITRTVNGSDFKVFYNQEEI GQFHVPAYGKHNI 
LNATAVIANLYIMG I DMALVAEHLKTFSGVKRRFTEKI I DDTVI I DDFAHHPTE I IATLD 
AARQKYPSKE I VAI FQPHTFTRTI ALIJDEFAHALSOOTSVYIAQ I YGSAREVDNGEVKVE 
DLAAKI VKHSDLVTVENVSPLLNHDNAVYVFMGAGDI QLYERSFEELLANLTKNTQ 

SEQ ID NO. 4617 
STRAIN 18RS21 frame: 1 

KAGSSDVDKYYFTQRGLEQAGVTI LPFSPNNI SEDLE I IAGNAFRPDNNEBLAYVIEKGY 
HFKRYHBFLGDFNIRQFTSLGVAGAHGKTSTTGIjLAHVIiK^ 

YFVFEADEYERHFMPYHPEYS I ITNI DFDHPDYFTGLEDVFNAFNDYAKQVQKGLFI YGB 
DPKIjHEITSEAPIYYYGFBDSNDFIAKDITRTVNGSDFK^ 

LNATAVIANLYIMGI DMALVAEHLKTFSGVKRRFTEKI IDDTVI I DDFAHHPTE I IATLD 
AARQKYPSKEIVAI FQPHTFTRTIALLDEFAHALSQADSVYLAQIYGSAREVDNGEVKVE 
DLAAKI VKHSDLVTVENVSPIjLNHDNAVYVFMGAGDIQL 

SEQ ID NO. 4618 ' 
STRAIN M732 frames 2 

KAGSSDVDKYYFTQRGLEQAGVTI LPFSPNNI SEDLE 1 1 AGNAFRPDNNBELAYVI EKGY 
HFKRYHEFLGDFMRQFTSIiGVAGAHGKTSTTGLIiAHVLKNIT^ 

YFVFEADEYERHFMPYHPBYS I ITNIDFDHPDYFTGLEDVFNAFNDYAKQVQKGLFI YGE 
DPKLHB I TSEAPI YYYGFEDSNDF I AKD ITRTVNGSDFKVFYNQEE I GQFHVPAYGKHNI 
LNATAVI ANLY I MG I DMALVAEHLKTFSGVKRRFTEKI I DDTVI I DDFAHHPTE I IATLD 
AARQKYPSKEIVAI FQPHTFTRTIALLDBFAHALSQADSVYLAQI YGSAREVDNGEVKVE 
DLAAKI VKHSDLVTVENVS P LLNHDNAVYVFMGAGD I QLYFJtS FEELLANLTKNTQ 

SEQ ID NO. 4619 

STRAIN JK9130013 frames 2 

FKKAGSSDVDKYYFTQRGLEQAGIT I LPFSPNNI SEDLE 1 1 AGNAPRPDNNEELAYVI BK 
GYHFKRYHEFLGDFMRQFTSIiGVAGAHGKTSTTGLIJUrVLK^ 

ANYFVFEADEYBRHFMPYHPBYSI I TNI DFDHPD YFTGLEDVFNAFNDYAKQVQKGLF I Y 
GEDPKLHE ITSBAP I YYYGFEDSNDFI AKD ITRTVNGSDFKVFYNQBEI GQFHVPAYGKH 
NI LNATAVIANLYIMG I DMALVAEHLKTFSGVKRRFTEKI IDDTVI I DDFAHHPTE I IAT 
LD AARQKYPS KE I VA I F^PHTFTRTIALLDEFAHALSQADSVYLAQI YGSAREVDNGBVK 
VEDLAAKI VKHSDLVTVENVS PLIiNHDNAVYVFM FEBLLANLTKNTQ 

SEQ ID NO. 4620 
STRAIN M781 frames 1 

KAGSSDVDKYYFTQRGLEQAGVTI LPFSPNNI SEDLE 1 1 AGNAFRPDNNEELAYV I E KG Y 
HFKRYHBFIiGDFMRQFTSLGVAGAHGKTSTTGLJjAHVLKN I TDTS FL I GDGTGRG SANAN 
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YFVFEADEYERHFMP YHPEYS I ITNIDFDHPDYFTGLEDVFNAFNDYAKQVQKGLF I YOB 
DP KLHEI TSEAP I YYYGFEDSNDFI AKD I TRTVNG SDFKVPYNQEE I GQFHVPAYGKHNI 
LN AT A VI ANL Y I MG I DMALVAEHLKT FSG VKRRFTE KI IDDTVI I DDFAHHPTE I IATLD 
AARQKYPSKEIVAI FQPHTFTRTI ALLDEFAHALSQADSVYIiAQI YGSAREVDNGEVKVE 
D1AAKI VKHSDL VTVENVS PLLNHDNAVYVFMGAGD I QLYERS FEELLANLTKNTQ 

SEQ ID KD. 4621 
STRAIN CJB110 frame: 3 

KAG S SD VDKYY FTQRGLEQAGVT I LPFSPNNI SEDLE I IAGNAFRPDNNEELAYVIEKGY 
HFKRYHE FLGDFMRQFTS LG VAGAHGKTSTTGLLAHVLKN I TDT S FL I GDGTGRG SANAN 
YFVFEADBYERHFMPYHPE YS I ITNIDFDHPDYFTGLEDVFNAFNDYAKQVQKGLF I YGE 
DSKLHE I TSKAP I YYYGFEDSNDF I AKD ITRTVNGSDFKVFYNQEE I GQFHVPAYGKHN I 
LNATAVIANLYIMG I DMALVAEHLKTFSGVKRRFTEKI IDDTVI I DDFAHHPTE I IATLD 
AARQKYPSKE I VA I FQPHTFTRTI ALLDDFAHALSQADSVYLAQ I YGSAREVDNGEVKVE 
DLAAKI VKHSDLVTVENVS PLLNHDNAVYVFMGAGD I QLYERS FEELLANLTKNTQ 



SEQ ZD NO. 4622 
STRAIN 2603 frame: 1 

MSKTYHF IG I KGSGMSALALMLHQMGHNVGGSDVDKYYFTQRGLEQAGVTI LPFSPNNI S 
EDLEI IAGNAFRPDNNEBIAWIEKGYQFKRYHBFLGDFMRQFTSLGvTlG^ 
LAHVLKtllTDTSFLIGDGTGRGSANANYFVFEADEYERHFMPYHPEYSI ITNIDFDHPDY 
FTGLEDVFNAFNDYAKQVQKGLFIYGEDPKIjHEITSEAPIYYYGFEDSNDFIAKDITRTV 
NGSDFKVFYNQEEI GQFHVPAYGKHNILNATAVI ANLYIMG IDMALVAEHLKTF 
FTEKI IDDTVI I DDFAHHPTE 1 1 ATLDAARQKYPS KB I VAI FQPHTFTRT IALLDE FAHA 
LSQADSVYLAQI YGSAREVDNGEVKVEDLAAKI VKHSDLVTVENVS PLLNHDNAVYVFMG 
AGDI QLYERS FEELLANLTKNTQ 

SEQ ZD NO. 4623 
STRAIN COH1 frame: 3 

GSSDVDKYY FTQRGLEQAGVT I LPFSPNNI SEDLE 1 1 AGNAFRPDNNEELAYVI EKGYHF 
KRYHEFLGDFMRQFTSLGVAGAHGKTSTTGLLAHVLKNITDTS 

VFEADEYERHFMPYHPEYS 1 1 TNI DFDHPD YFTGLEDVFNAFNDYAKQVQKGLF I YGEDP 
KLHBITSBAPIYYYGFEDSNDFIAKDITRTVNGSDFKVFYNQEEIGQFHVPAYGKH^ 
ATAVIANLYIMGIDMALVAEHIjKTFSGVKRRFTEKI IDDTVI IDDFAHHPTE I IATLDAA 
RQKYPSKEIVAI FQPHTFTRT I ALLDEFAHALSQADS VYliAQI YGSAREVDNGEVKVEDL 
AAKI VKHSDLVTVENVS PLLNHDNAVYVFMGAGD I QLYERS FEELLANLTKNTQ 

PRETTY of: /biotmp/msa56635 . 2 { * } November 26 , 2002 08:08 . 



m8a253220 .2{1S7_090; 
msa253220 . 2 { 157_CJB110 
msa253220.2{157_1169NT 
rasa253220 . 2 { 157_18RS21 
msa253220 . 2 { 157_M732 
msa2 53220 . 2 < 157_M781 
msa2 S3220 . 2 ( 157_C0H1 
msa253220.2{l57_H36B 
msa253220.2{l57_JM9130013 
maa253220.2{l57_2603 
tnsa2 53220 . 2 { 157_A909 
Consensus 



1 SO 

— — kag ssdvDKYYFT QRGLEQAGvT 

kag ssdvDKYYFT QRGLEQAGvT 

kag ssdvDKYYFT QRGLEQAGvT 

kag ssdvDKYYFT QRGLEQAGvT 

kag ssdvDKYYFT QRGLEQAGvT 

kag ssdvDKYYFT QRGLEQAGvT 

g ssdvDKYYFT QRGLEQAGvT 

kag ssdvDKYYFT QRGLEQAGiT 

fkkag ssdvDKYYFT QRGLEQAGiT 

msktyhf igi kgsgmsalal mlhqmghnvq gsdvDKYYFT QRGLEQAGvT 
DKYYFT QRGLEQAGvT 



msa253220 . 2 { 157_090 ] 
msa2 53220 . 2 ( 157_CJB110 : 
msa253220 .2(157JL169NT 
msa253220.2{157_JL8RS21 | 
tnsa253220 . 2 ( 157_M732 
msa253220 .2 157_M781 
msa2 53220.2^ 157_C0H1 
msa253220 . 2{ 157_H36B 
msa253220 . 2 { 157_JM9130013 
msa253220. 2(157 2603 
msa253220 . 2 { 157_A909 
Consensus 



51 

ILPFSPNNIS 
ILPFSPNNIS 
ILPFSPNNIS 
ILPFSPNNIS 
ILPFSPNNIS 
ILPFSPNNIS 
ILPFSPNNIS 
ILPFSPNNIS 
ILPFSPNNIS 
ILPFSPNNIS 
ILPFSPNNIS 



EDLEI I AGNA 
EDLEI IAGNA 
EDLEI I AGNA 
EDLEI IAGNA 
EDLEI IAGNA 
EDLEI IAGNA 
EDLEI IAGNA 
EDLEI IAGNA 
EDLEI IAGNA 
EDLEI IAGNA 
EDLEI IAGNA 



FRPDNNEELA 
FRPDNNEELA 
FRPDNNEELA 



FRPDNNEELA 
FRPDNNEELA 
FRPDNNEELA 
FRPDNNEELA 
FRPDNNEELA 



YVIEKGYhFK 
YVIEKGYhFK 
YVIEKGYhFK 
YVIEKGYhFK 
YVIEKGYhFK 
YVIEKGYhFK 
YVIEKGYhFK 
YVIEKGYhFK 
YVIEKGYhFK 
YVI EKGYqFK 
YVIEKGYhFK 



100 

RYHEFLGDFM 
RYHBFLGDFM 
RYHEFLGDFM 
RYHEFLGDFM 
RYHEFLGDFM 
RYHEFLGDFM 
RYHEFLGDFM 
RYHEFLGDFM 
RYHEFLGDFM 
RYHEFLGDFM 
RYHEFLGDFM 



msa253220 . 2 {157 J)90; 
msa253220 . 2 { 157_CJB110 
msa253220 .2{l57_1169NT 
tnsa2 53 2 20 . 2 ( 1 57_1 SRS2 1 
msa253220.2f 157 M732 
msa2 53220.2 157~M78 1 
msa253220.2 'l57 COH1 
ms a2 5 32 2 0 . 2 { 1 57J13 6B 
msa253220 . 2 { 157_JM9130013 
msa253220.2(l57 2603 
tnsa253220 . 2 { 157~A909 
Consensus 



msa253220.2{!57_090} 



101 

RQFTSLGVAG 
RQFTSLGVAG 
RQFTSLGVAG 
RQFTSLGVAG 
RQFTSLGVAG 
RQFTSLGVAG 
RQFTSLGVAG 
RQFTSLGVAG 
RQFTSLGVAG 
RQFTSLGVAG 
RQFTSLGVAG 



AHGKTSTTGL 
AHGKTSTTGL 
AHGKTSTTGL 
AHGKTSTTGL 
AHGKTSTTGL 
AHGKTSTTGL 
AHGKTSTTGL 
AHGKTSTTGL 
AHGKTSTTGL 
AHGKTSTTGL 
AHGKTSTTGL 



LAHVLKNITD 
LAHVLKNITD 
LAHVLKNITD 
LAHVLKNITD 
LAHVLKNITD 
LAHVLKNITD 
LAHVLKNITD 
LAHVLKNITD 
LAHVLKNITD 
LAHVLKNITD 
LAHVLKNITD 



TSFLIGDGTG 
TSFLIGDGTG 
TSFLIGDGTG 
TSFLIGDGTG 
TSFLIGDGTG 
TSFLIGDGTG 
TSFLIGDGTG 
TSFLIGDGTG 
TSFLIGDGTG 
TSFLIGDGTG 
TSFLIGDGTG 



150 

RGSANANYFV 
RGSANANYFV 
RGSANANYFV 
RGSANANYFV 
RGSANANYFV 
RGSANANYFV 
RGSANANYFV 
RGSANANYFV 
RGSANANYFV 
RGSANANYFV 
RGSANANYFV 



151 200 
FEADEYERHF MPYHPEYSII TNI DFDHPD Y FTGLEDVFNA FNDYAKQVQK 
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maa253220 .2(157 CJB110 < 
tnsa2J53220 . 2 ( 1S7"~1169NT > 
msa253220 . 2 { 157~18RS2 1 ) 
msa253220 . 2( 157_M732 
msa253220-2f 157 M781 
msa2 53220 . 2 ( 157~COHl 
msa2 53220 . 2 { 157~H36B 
tnsa253220 . 2 { 157_JM9130013 > 
msa253220.2f 157 2603 
msa253220 . 2 { 157~A909 
Consensus 



msa253220.2{157_090 '> 
msa253220.2(l57 CJB110 > 
m8a253220.2(l57~1169NT f 
msa2 53220 . 2 { 157~18RS21 
msa253220 . 2( 157_M732 
msa253220.2(157_M781 
rasa253220 . 2 { 157_COHl' 
msa253220 . 2 { 157_H36B ' > 
msa253220.2{l57 JM9130013 
msa25322 0 . 2 ( 157 J2 603 
msa253220 . 2 { 157_A909 
Consensus 



msa253220 . 2 {157_090 
msa253220.2(l57_CJB110 
msa253220 . 2 f 157_1169NT 
rasa253220.2(157_18RS21 
msa253220.2(l57_M732 > 
msa253220.2(157_M781 ) 
rasa253220.2(l57_COHl \ 
msa2 53220 . 2 { 157_H36B 
msa253220 . 2 {l57_JM9130013 
rasa253220 . 2 { 157_2603 
msa253220 . 2 { 157_A909 
Consensus 



msa253220 . 2 { 157_090 
msa253220 . 2 ( 157_CJB110 
msa253220. 2(157 1169NT 
msa253220.2{l57~18RS21 
msa253220 . 2 { 157_M732 
msa2 53220 .2(157 M78l'> 
msa253220 . 2 { 157~C0H1 
msa2 53220 . 2 { 157JK3 6B 
insa253220.2{l57_JM9130013 \ 
tnsa2 5322 0 . 2 { 157_2 603 
msa253220 . 2 { 157_A909 r 
Consensus 



msa253220.2{157 090 
tasa253220 . 2 ( 157_CJB110 
msa253220. 2(157 1169NT 
msa253220. 2(157 1BRS21 
msa253220 .2(157 M732 f 
msa253220.2(157~M781 
msa253220.2(157 COH1 
msa253220.2{l57_H36B f 
msa253220 . 2 { 157_JM9130013 
msa253220.2(l57_2603 
msa2 53220. 2{1S7_A909 
Consensus 



tnsa253220 .2{X57_090 
rasa253220.2(l57_CJB110 
msa253220.2(l57 1169NT 
msa253220.2{l57~18RS21 
msa253220.2(l57 M732 
msa2 53 2 20 . 2 ( 1 57~M7 8 1 
msa2 53220 . 2 f 157jCOHl 
msa253220.2{157_H36B 
msa253220 . 2 { 157_JM9130013 
msa253220.2(l57 2603 • 
maa253220.2{l57~A909 
Consensus 



FEADEYBRHF MPYHPEYSII TNIDFDHPDY FTGLEDVFNA FNDYAKQVQK 
FEADEYBRHF MPYHPBYSII TNIDFDHPDY FTGLEDVFNA FNDYAKQVQK 
FKADEYERHF MPYHPBYSII TNIDFDHPDY FTGLEDVFNA FNDYAKQVQK 
FEADEYBRHF MPYHPEYSII TNIDFDHPDY FTGLEDVFNA FNDYAKQVQK 
FEADEYBRHF MPYHPEYSII TNIDFDHPDY FTGLEDVFNA FNDYAKQVQK 
FEADEYBRHF MPYHPEYSII TNIDFDHPDY FTGLEDVFNA FNDYAKQVQK 
FEADEYBRHF MPYHPEYSII TNIDFDHPDY FTGLEDVFNA FNDYAKQVQK 
FEADEYBRHF MPYHPEYSII TNIDFDHPDY FTGLEDVFNA FNDYAKQVQK 
FEADEYBRHF MPYHPEYSII TNIDFDHPDY FTGLEDVFNA FNDYAKQVQK 
FEADBYERHF MPYHPEYSII TNIDFDHPDY FTGLEDVFNA FNDYAKQVQK 



201 250 
GLFIYGEDsK LHEITSkAPI YYYGFEDSND FIAKDITRTV NGSDFKVFYN 
GLFIYGEDsK LHEITSkAPI YYYGFEDSND FIAKDITRTV NGSDFKVFYN 
GLFIYGEDpK LHEITSeAPI YYYGFEDSND FIAKDITRTV NGSDFKVFYN 
GLFIYGEDpK LHEITSeAPI YYYGFEDSND FIAKDITRTV NGSDFKVFYN 
GLFIYGEDpK LHEITSeAPI YYYGFEDSND FIAKDITRTV NGSDFKVFYN 
GLFIYGEDpK LHEITSeAPI YYYGFEDSND FIAKDITRTV NGSDFKVFYN 
GLFIYGEDpK LHEITSeAPI YYYGFEDSND FIAKDITRTV NGSDFKVFYN 
GLFIYGEDpK LHEITSeAPI YYYGFEDSND FIAKDITRTV NGSDFKVFYN 
GLFIYGEDpK LHEITSeAPI YYYGFEDSND FIAKDITRTV NGSDFKVFYN 
GLFIYGEDpK LHEITSeAPI YYYGFEDSND FIAKDITRTV NGSDFKVFYN 
GLFIYGEDpK LHEITSeAPI YYYGFEDSND FIAKDITRTV NGSDFKVFYN 



251 300 
QBBIGQFHVP AYGKHNILNA TAVIANLYIM GIDMALVAEH LKTFSGVKRR 
QEEIGQFHVP AYGKHNILNA TAVIANLYIM GIDMALVAEH LKTFSGVKRR 
QBBIGQFHVP AYGKHNILNA TAVIANLYIM GIDMALVAEH LKTFSGVKRR 
QEEIGQFHVP AYGKHNILNA TAVIANLYIM GIDMALVAEH LKTFSGVKRR 
QEEIGQFHVP AYGKHNILNA TAVIANLYIM GIDMALVAEH LKTFSGVKRR 
QEEIGQFHVP AYGKHNILNA TAVIANLYIM GIDMALVAEH LKTFSGVKRR. 
QEEIGQFHVP AYGKHNILNA TAVIANLYIM GIDMALVAEH LKTFSGVKRR 
QEEIGQFHVP AYGKHNILNA TAVIANLYIM GIDMALVAEH LKTFSGVKRR 
QBBIGQFHVP AYGKHNILNA TAVIANLYIM GIDMALVAEH LKTFSGVKRR 
QEEIGQFHVP AYGKHNILNA TAVIANLYIM GIDMALVAEH LKTFSGVKRR 
QEEIGQFHVP AYGKHNILNA TAVIANLYIM GIDMALVAEH LKTFSGVKRR 
********** ********** ********** ********** ********** 



301 

FTEKIIDDTV 
FTEKIIDDTV 
FTEKIIDDTV 
FTEKIIDDTV 
FTEKIIDDTV 
FTEKIIDDTV 
FTEKIIDDTV 
FTEKIIDDTV 
FTEKIIDDTV 
FTEKIIDDTV 
FTEKIIDDTV 



IIDDFAHHPT 
IIDDFAHHPT 
I IDDFAHHPT 
IIDDFAHHPT 
IIDDFAHHPT 
IIDDFAHHPT 
IIDDFAHHPT 
IIDDFAHHPT 
IIDDFAHHPT 
IIDDFAHHPT 
IIDDFAHHPT 



EIIATLDAAR 
EIIATLDAAR 
EIIATLDAAR 
EIIATLDAAR 
EIIATLDAAR 
EIIATLDAAR 
EIIATLDAAR 
EIIATLDAAR 
EIIATLDAAR 
EIIATLDAAR 
EIIATLDAAR 



QKYPSKEIVA 
QKYPSKEIVA 
QKYPSKEIVA 
QKYPSKEIVA 
QKYPSKEIVA 
QKYPSKEIVA 
QKYPSKEIVA 
QKYPSKEIVA 
QKYPSKEIVA 
QKYPSKEIVA 
QKYPSKEIVA 



350 

IFQPHTFTRT 
IFQPHTFTRT 
IFQPHTFTRT 
IFQPHTFTRT 
IFQPHTFTRT 
IFQPHTFTRT 
IFQPHTFTRT 
IFQPHTFTRT 
IFQPHTFTRT 
IFQPHTFTRT 
IFQPHTFTRT 



351 400 
IALLDdFAHA LSQADSVYLA QIYGSAREVD NGEVKVEDLA AKIVKHSDLV 
IALLDdFAHA LSQADSVYLA QIYGSAREVD NGEVKVEDLA AKIVKHSDLV 
IALLDeFAHA LSQADSVYLA QIYGSAREVD NGEVKVEDLA AKIVKHSDLV 
IALLDeFAHA LSQADSVYLA QIYGSAREVD NGEVKVEDLA AKIVKHSDLV 
IALLDeFAHA LSQADSVYLA QIYGSAREVD NGEVKVEDLA AKIVKHSDLV 
IALLDeFAHA LSQADSVYLA QIYGSAREVD NGEVKVEDLA AKIVKHSDLV 
IALLDeFAHA LSQADSVYLA QIYGSAREVD NGEVKVEDLA AKIVKHSDLV 
IALLDeFAHA LSQADSVYLA QIYGSAREVD NGEVKVEDLA AKIVKHSDLV 
IALLDeFAHA LSQADSVYLA QIYGSAREVD NGEVKVEDLA AKIVKHSDLV 
IALLDeFAHA LSQADSVYLA QIYGSAREVD NGEVKVEDLA AKIVKHSDLV 
IALLDeFAHA LSQADSVYLA QIYGSAREVD NGEVKVEDLA AKIVKHSDLV 



401 

TVENVSPLLN HDNAVYVFMG 
TVBNVSPLLN HDNAVYVFMG 
TVENVSPLLN HDNAVYVFMG 
TVENVSPLLN HDNAVYVFMG 
TVENVSPLLN HDNAVYVFMG 
TVENVSPLLN HDNAVYVFMG 
TVENVSPLLN HDNAVYVFMG 
TVENVSPLLN HDNAVYVFMG 
TVENVSPLLN HDNAVYVFMG 
TVENVSPLLN HDNAVYVFMG 
TVENVSPLLN HDNAVYVFMG 



443 

AGDIQLYERS FEELLANLTK NTQ 
AGDIQLYERS FEELLANLTK NTQ 
AGDIQLYERS FEELLANLTK NTQ 
AGDIQLYERS FEELLANLTK NTQ 
AGDIQLYERS FEELLANLTK NTQ 
AGDIQLYERS FEELLANLTK NTQ 
AGDIQLYERS FEELLANLTK NTQ 
AGDIQLYERS FEELLANLTK NTQ 
AGDIQLYERS FEELLANLTK NTQ 
AGDIQLYERS FEELLANLTK NTQ 
AGDIQLYERS FEELLANLTK NTQ 
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SEQ ID NO. 4701 
STRAIN A909 

TATTTTTTAACAACAAAAAAAGGAAAAGAGCTAAGGAAAAATC 
ATTCTATGGAGAATATAAAGAAAATCCAGA^ 
AAGATAAAGCAAGTGAATATTCAAATTTAGCTGTTGATACT 
TATAAAGGTAAATTTGAATCAGGTGAATTGACAACAGAGGATA 
AGCX^TTAAGGAAAAAAGCGGAGAAGTAGTTGACrTTGCT 
TCAATCAAG CTAAATCAAAATTCTCAGACX^GGATACTG CTAAAAAAGAA 
GATAAGG CT CCTGAAA.CAAAAGTAGAAGATATTGTCATTGATTATAAAGA 
AAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4702 
STRAIN H36B 

TAl'X M ri'lTAACAACAAAAAAAGGAAAAGAGCTAAGGAAAAATGCAGAAAA 
ATTCTATGGAGAATATAAAGAAAATCXAGAAGAATATCATCAAATAG CTA 
AAGATAAAGCAAGTGAATATTCAAATTTAGCTGTTG^ 
TATAAAGGTAAATTTOAATCAGGTGAATTGACAACA 
AGCCGTTAAGGAAAAAAG CX3GAGAAGTAGTTGACTTTG CTAATGATTTTG 
TCAATCAAGCTAAATCAAAATTCTCAGACXSA^ 
GATAAGGCTCCTGAAACAAAAGTAGAAGATATTOT 
AAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4703 
STRAIN 18RS21 

TATTTTTTAACAACAAAAAAAGGAAAAGAG CTAAGGAAAAATGCAGAAAA 

ATTCTATGGAGAATATAAAGAAAATCCAGAAGAATATCATCAAATAGCTA 

AAGATAAAGCAAGTOAATATTCAAATTTAGCT^ 

TATAAAGGTAAATTTGAATCAGGTGAATTGACAACAGAGGA^ 

AGCCGTTAAGGAAAAAAGCGGAGAAGTAGTTGACTTTGC^ 

TCAATCAAGCIAAATCAAAATTCTCAGACGAGGATACTGCT 

GATAAGGCTCCTGAAACAAAAGTAGAAGATAT^ 

AAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4704 
STRAIN M732 

TATTTTTTAACAACAAAAAAAGGAAAAGAG CTAAGGAAAAATG CAGAAAA 
ATTCTATGGAGAATATAAAGAAAATCCAGAAGAATATCATCAAATAGCTA 
AAGATAAAG CAAGTGAATATTCAAATTTAGul^U u it^TAu:ri"i"i"A7VAGAT 
TATAAAGGTAAATTTGAATCAGGTGAATTGACAACAGAGGATA 
AGCCGTTAAGGAAAAAAGCGGAGAAGTAGTTGACTTTGCT 
TCAATCAAG CTAAATCAAAATTCTCAGACX3AGGATA 
C^TAAGGCTCCTGAAACAAAAGTAGAAGATATTGTCATTGATTATAAAGA 
AAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4705 
STRAIN COH1 

TATTTTTTAACAAO^AAAAAAGGAAAAGAG CTAAGGAAAAATGCAGAAAA 

ATTCTATGQAGAATATAAAQAAAATCCAGAAGA 

AAGATAAAGCAAGTGAATATTCAAATTTAGCT 

TATAAAGGTAAATTTGAATCAGGTGAATTGACAACAG^ 

AGCCGTTAAGGAAAAAAGCGGAGAAGTAGTTGACTTTGCT 

TCAATCAAGCTAAATCAAAATTCTCAGACXIAGGAT^ 

GATAAGGCTCCTGAAACAAAAGTAGAAGATATTGTCATTGA 

AAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4706 
STRAIN K781 

TATTTTTTAACAACAAAAAAAGGAAAAGAGC 

TAAGGAAAAATGCAGAAAAATTCTATGGAGAATATAAAGAAAATCCAGAA 

GAATATCA TCaAAT AGCTAAAGATAAAGCAAGTGAA 

TGTTGATACTTTTAAAGATTATAAAGGTAAATTTGAATC 

CAACAGAGGATATCGTCTCAGCCGTTAAGGAAAAA 

GACTTTGCTAATGATTTTGTCAATCAAGCTA 

GGATACTGCTAAAAAAGAAGATAAGGCnrCCTGAAACAAAAGTAG 

TTGTCATTGATTATAAAGAAAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4707 
STRAIN 2603 

tattttttaacaacaaaaaaaggaaaagagctaaggaaaaatgcagaaaa 
attctatggagaatataaagaaaatccagaagaatatcatcaaatagcta 
aagataaagcaagtgaatattcaaatttagctgttgatacttttaaagat 
tataaaggtaaatttgaatcaggtgaattgacaacagaggatatcgtctc 
agccgttaaggaaaaaagcggagaagtagttgactttgctaatgattttg 
tcaatcaagctaaatcaaaattctcagacgaggatactgctaaaaaagaa 
gataaggctcctgaaacaaaagtagaagatattgtcattgattataaaga 
aaacacagaagataaagaaaaa 

SEQ ID NO. 4708 
STRAIN 090 

TATTTTTTaACaACAAAAAAAGGAAAAGAGOTAAGGAAAAATGCAGAAAA 

ATTCTATGGAGAATATAAAGAAAATCCAGAAG 

AAGATAAAGCAAGTGAATATTCAAATTrAGCTG 



809 
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TATAAAGGTAAATTTQAATCAGC3TGAATTGACAACAGAGQATATCGTCTC 
AGCCGTTAAGGAAAAAAGCGGAGAAGTAGTITGACTTTGCT^ 
TCAATCAAGCTAAATCAAAATTCTCAGACGAGGATACTG CTAAAAAAGAa 
GATAAGGCTCCTGAAACAAAaGTAGAAGATATTGTCATTGATTA^ 
AAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4709 
STRAIN CJB110 

TATTTTrTAACAACAAAAAAAGGAAAAGAGCTAAGGAAAA 
ATGCAGAAAAATTCTATGGAGAATATAAAGAAAATCCAGAAGAATATCAT 
CAAATAGCTAAAGAT AAAGC^UVGTGAATATTCAAATTTAG CTGTTGATAC 
TTTTAAAGATTATAAAGGTAAATTTGAATCAGGTgAATTGACAAC^ 
ATATCGTCTCAGCCGtTAAGGAAAAAAGCGGAGAAGTAGTTGACTTTGCT 
AATG ATTTTGTCAATCAAGCTAAATCAAAATrCTCAGACGAGGA C 
TAAAAAAGAAGATAAGGCTC CTGAAACAAAAGTAGAAGATATTGTCATTG 
ATTATAAAGAAAACACAGAAGATAAAGAAAAA 

SEQ ZD NO- 4710 
STRAIN 1169NT 

TATTTTTTAACAACAAAAAAAGGAAAAGAGCTAAGGAAA 

AATG CAGAAAAATTCTTATGGAGAAT AT AAAGAAAATCCAGAAGAA'T ATCA 

TCAAATAGCTAAAGATAAAG CAAGTGAATATTCAAATTTAGCTGTTGATA 

CTTTTAAAGATTATAAAGGTAAATTTGAATCAGGTG^ 

GATATCGTCTCAGCCGTTAAGGAAAAAAGCGGAGAAGTAGTl^ 

TAATGATTTTGTCAATCAAGCrAAATCAAAATTC 

CTAAAAAAGAAAATAAGGCTCCTGAAACAAAAGTAGAAGATATTGTCATT 
GATTATAAAGAAAACACAGAAGATAAAGAAAAA 

SEQ ID NO. 4711 
STRAIN JK9130013 

TATTTTTTAaCAAtlAAATVAAAGGAAAAGAGCTAAGGAAAA 

ATGCAGAAAAATTCTATGGAGAATATAAAGAAAATCCAG^ 

CAAATAGCTAAAGATAAAGCAAGTGAATATO^AATTTAG CTGTTGATAC 

TTTTAAAGATTATAAAGGTAAATTTOAATCAGG 

ATATCGTCTCAGCCGTTAAGGAAAAAAGCGGAGAAGTAGTTGAC^ 

AATGATTTTGTCAATCAAGCrrAAATCIAAAAT^ 

TAAAAAAGAAGATAAGGCTCXrrGAAAOW^AGTAGAAGATATTC 

ATTATAAAGAAAACACAGAAGATAAAGAAAAA 

PRETTY of: /biotmp/msa68511.2{*} January 22, 2003 05:47 

1 50 
TATTTTTTAA CAACAAAAAA AGGAAAAGAG CTAAGGAAAA ATGCAGAAAA 
TATTTTTTAA CAACAAAAAA AGGAAAAGAG CTAAGGAAAA ATGCAGAAAA 
TA TTTTTTA A CAACAAAAAA AGGAAAAGAG CTAAGGAAAA ATGCAGAAAA 
TATTTTTTAA CAACAAAAAA AGGAAAAGAG CTAAGGAAAA ATGCAGAAAA 
TATTTTTTAA CAACAAAAAA AGGAAAAGAG CTAAGGAAAA ATGCAGAAAA 
TATTTTTTAA CAACAAAAAA AGGAAAAGAG CTAAGGAAAA ATGCAGAAAA 
TATTTTTTAA CAACAAAAAA AGGAAAAGAG CTAAGGAAAA ATGCAGAAAA 
T ATTTTTT AA CAACAAAAAA AGGAAAAGAG CTAAGGAAAA ATGCAGAAAA 
TA TTTTTT AA CAACAAAAAA AGGAAAAGAG CTAAGGAAAA ATGCAGAAAA 
TATTTTTTAA CAACAAAAAA AGGAAAAGAG CTAAGGAAAA ATGCAGAAAA 
TATTTTTTAA CAACAAAAAA AGGAAAAGAG CTAAGGAAAA ATGCAGAAAA 



51 100 
ATTCTATGGA GAATATAAAG AAAATCCAGA AGAATATCAT CAAATAGCTA 
ATTCTATGGA GAATATAAAG AAAATCCAGA AGAATATCAT CAAATAGCTA 
ATTCTATGGA GAATATAAAG AAAATCCAGA AGAATATCAT CAAATAGCTA 
ATTCTATGGA GAATATAAAG AAAATCCAGA AGAATATCAT CAAATAGCTA 
ATTCTATGGA GAATATAAAG AAAATCCAGA AGAATATCAT CAAATAGCTA 
ATTCTATGGA GAATATAAAG AAAATCCAGA AGAATATCAT CAAATAGCTA 
ATTCTATGGA GAATATAAAG AAAATCCAGA AGAATATCAT CAAATAGCTA 
ATTCTATGGA GAATATAAAG AAAATCCAGA AGAATATCAT CAAATAGCTA 
ATTCTATGGA GAATATAAAG AAAATCCAGA AGAATATCAT CAAATAGCTA 
ATTCTATGGA GAATATAAAG AAAATCCAGA AGAATATCAT CAAATAGCTA 
ATTCTATGGA GAATATAAAG AAAATCCAGA AGAATATCAT CAAATAGCTA 



101 ISO 
AAGATAAAGC AAGTGAATAT TCAAATTTAG CTGTTGATAC TTTTAAAGAT 
AAGATAAAGC AAGTGAATAT TCAAATTTAG CTGTTGATAC TTTTAAAGAT 
AAGATAAAGC AAGTGAATAT TCAAATTTAG CTGTTGATAC TTTTAAAGAT 
AAGATAAAGC AAGTGAATAT TCAAATTTAG CTGTTGATAC TTTTAAAGAT 
AAGATAAAGC AAGTGAATAT TCAAATTTAG CTGTTGATAC TTTTAAAGAT 
AAGATAAAGC AAGTGAATAT TCAAATTTAG CTGTTGATAC TTTTAAAGAT 
AAGATAAAGC AAGTGAATAT TCAAATTTAG CTGTTGATAC TTTTAAAGAT 
AAGATAAAGC AAGTGAATAT TCAAATTTAG CTGTTGATAC TTTTAAAGAT 
AAGATAAAGC AAGTGAATAT TCAAATTTAG CTGTTGATAC TTTTAAAGAT 
AAGATAAAGC AAGTGAATAT TCAAATTTAG CTGTTGATAC TTTTAAAGAT 
AAGATAAAGC AAGTGAATAT TCAAATTTAG CTGTTGATAC TTTTAAAGAT 
Consensus ********** ********** ********** ********** ********** 



msa68511.2{l64_090 
msa68511.2{l64_18RS21 
msa68511 . 2 { 164__2603 
msa68511 . 2{ 164_A909 
rasa68 5 11 . 2 { 164_CJB110 
msa68511 . 2 ( 164_COHl 
msa68511 . 2 { 164_H3 6B 
msaSBSll . 2 { 164_JM9130013 > 
msa68511 . 2 {164_M732 
msa68511.2(164_M781 
msa68511 . 2 {164_116SNT \ 
Consensus 



rosa68511.2{l64_090' 
msa68511 . 2 { 164_18RS2 1 \ 
msa68511 . 2 ( 164_2603 
msa68511 . 2 { 164_A909 
msa68511 . 2 { 164_GJB110 
msa68511 . 2 (l64_COHl 
msa68511.2{164_H36B 
msa68511.2{l64_JM9130013 
msa68511 . 2 { 164_M732 I 
msa68Sll . 2 {164_M781> 
msa68511 . 2 { 164__1169NT f 
Consensus 



msa68511 . 2 { 164J) 90 
msa68511.2{l64_18RS21 
msa68511 . 2 ( 164_2603 
msa68511 . 2 j 164_A909 
msaSBSll . 2 { 164_CJB110 
msa6B511 . 2 { 164_COHl 
msa6 8 5 1 1 . 2 { 1 64_H3 GB t 
msa68511 . 2 { 164_JM9130013 
maa68511. 2(164 M732 
cnsa68 511 . 2 { 164~M78 1 
msafiBSll . 2 { 164_1169NT 
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151 

msa6B511.2{l64J>90> TATAAAGGTA 

ntsa68511.2{l64_18RS21 > TATAAAGGTA 

m8a68511.2f 164_2603J TATAAAGGTA 

msa68511.2{164 A909 TATAAAGGTA 

msa68511.2{l64 CJB110 TATAAAGGTA 

msa68511.2(l?4 COH1 TATAAAGGTA 

msa68511.2{164~H36B TATAAAGGTA 

mBa68511.2{l64_JM9130013) TATAAAGGTA 

rasa6 8511.2(164 M732 TATAAAGGTA 

msa6 8 511 . 2 { 1 64~M78 1 } TATAAAGGTA 

msa68511 . 2 { 164_1169NT) TATAAAGGTA 

Consensus ********** 



AATTTGAATC 
AATTTGAATC 
AATTTGAATC 
AATTTGAATC 
AATTTGAATC 
AATTTGAATC 
AATTTGAATC 
AATTTGAATC 
AATTTGAATC 
AATTTGAATC 
AATTTGAATC 



AGGTGAATTG 
AGGTGAATTG 
AGGTGAATTG 
AGGTGAATTG 
AGGTGAATTG 
AGGTGAATTG 
AGGTGAATTG 
AGGTGAATTG 
AGGTGAATTG 
AGGTGAATTG 
AGGTGAATTG 



ACAACAGAGG 
ACAACAGAGG 
ACAACAGAGG 
ACAACAGAGG 
ACAACAGAGG 
ACAACAGAGG 
ACAACAGAGG 
ACAACAGAGG 
ACAACAGAGG 
ACAACAGAGG 
ACAACAGAGG 



200 

ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 



201 

msa68511.2{l64_09O) AGCCGTTAAG 

msa68511.2{l64_18RS21 AGCCGTTAAG 

msa68511.2(l64_2603> AGCCGTTAAG 

mfla68511.2{164_A909 AGCCGTTAAG 

maa68511 . 2 { 164_CJB110) AGCCGTTAAG 

msa68511.2(164_COHl AGCCGTTAAG 

msaS 8 511 . 2 { 164_H3 6B AGCCGTTAAG 

msa68511.2{l64_JM9130013 AGCCGTTAAG 

mfla68511-2fl64_M732 AGCCGTTAAG 

msa68511.2{164J47Bl AGCCGTTAAG 

, msa68511.2{l64_1169NT} AGCCGTTAAG 

Consensus ********** 



GAAAAAAGCG 
GAAAAAAGCG 
GAAAAAAGCG 
GAAAAAAGCG 
GAAAAAAGCG 
GAAAAAAGCG 
GAAAAAAGCG 
GAAAAAAGCG 
GAAAAAAGCG 
GAAAAAAGCG 
GAAAAAAGCG 



GAGAAGTAGT 
GAGAAGTAGT 
GAGAAGTAGT 
GAGAAGTAGT 
GAGAAGTAGT 
GAGAAGTAGT 
GAGAAGTAGT 
GAGAAGTAGT 
GAGAAGTAGT 
GAGAAGTAGT 
GAGAAGTAGT 



TGACTTTGCT 
TGACTTTGCT 
TGACTTTGCT 
TGACTTTGCT 
TGACTTTGCT 
TGACTTTGCT 
TGACTTTGCT 
TGACTTTGCT 
TGACTTTGCT 
TGACTTTGCT 
TGACTTTGCT 



25 0 

AATGATTTTG 
AATGATTTTG 
AATGATTTTG 
AATGATTTTG 
AATG ATTTT G 
AATGATTTTG 
AATG ATTTTG 
AATGATTTTG 
AATGATTTTG 
AATGATTTTG 
AATGATTTTG 



msaSeSll . 2 { 164 J>90 ; 
msa68511 . 2 {l64_18RS21 
msa68511 . 2 (164_2603 
maa6 8 5 1 1 . 2 { 1 64_A909 
msa68511.2{l64_CJB110 
msa6 8511.2(1 64_00H1 
msa6 8 511 . 2 { 1 64_H3 6B 
msa68511 . 2 { 164_JM9130013 
msa68511 . 2 { 164_M732 
msa68511 . 2 {164_M781 
msa68 5 1 1 . 2 { 1 64_1 16 9NT 
Consensus 



- msa68511.2{l64_090' 
tnsa68511 . 2 { 164JL8RS21 ( 
msa68511.2{l64_2603 ( 
msa68 511 . 2 { 164_A909 
mBa68Sll . 2 { 164_CJB110 
msa68511.2{l64 COH1 

msa685ii.2{i64~H36B 

msa68511 . 2 {164_JM9130013 
msa6B511 . 2 f 164J4732 
msa6B511.2{164_M781 

msa68511.2{l64_1169NT 
Consensus 



251 

TCAATCAAGC 
TCAATCAAGC 
TCAATCAAGC 
TCAATCAAGC 
TCAATCAAGC 
TCAATCAAGC 
TCAATCAAGC 
TCAATCAAGC 
TCAATCAAGC 
TCAATCAAGC 
TCAATCAAGC 



TAAATCAAAA 
TAAATCAAAA 
TAAATCAAAA 
TAAATCAAAA 
TAAATCAAAA 
TAAATCAAAA 
TAAATCAAAA 
TAAATCAAAA 
TAAATCAAAA 
TAAATCAAAA 
TAAATCAAAA 



TTCTCAGAcG 
TTCTCAGAcG 
TTCTCAGAcG 
TTCTCAGAcG 
TTCTCAGACG 
TTCTCAGAcG 
TTCTCAGAcG 
TTCTCAGAcG 
TTCTCAGAcG 
TTCTCAGAcG 
TTCTCAGAtG 



AGGATACTGC 
AGGATACTGC 
AGGATACTGC 
AGGATACTGC 
AGGATACTGC 
AGGATACTGC 
AGGATACTGC 
AGGATACTGC 
AGGATACTGC 
AGGATACTGC 
AGGATACTGC 



300 

TAAAAAAGAA 
TAAAAAAGAA 
TAAAAAAGAA 
TAAAAAAGAA 
TAAAAAAGAA 
TAAAAAAGAA 
TAAAAAAGAA 
TAAAAAAGAA 
TAAAAAAGAA 
TAAAAAAGAA 
TAAAAAAGAA 



301 

gATAAGGCTC 
gATAAGGCTC 
gATAAGGCTC 
gATAAGGCTC 
gATAAGGCTC 
gATAAGGCTC 
gATAAGGCTC 
gATAAGGCTC 
gATAAGGCTC 
gATAAGGCTC 
aATAAGGCTC 



CTGAAACAAA 
CTGAAACAAA 
CTGAAACAAA 
CTGAAACAAA 
CTGAAACAAA 
CTGAAACAAA 
CTGAAACAAA 
CTGAAACAAA 
CTGAAACAAA 
CTGAAACAAA 
CTGAAACAAA 



AGTAGAAGAT 
AGTAGAAGAT 
AGTAGAAGAT 
AGTAGAAGAT 
AGTAGAAGAT 
AGTAGAAGAT 
AGTAGAAGAT 
AGTAGAAGAT 
AGTAGAAGAT 
AGTAGAAGAT 
AGTAGAAGAT 



ATTGTCATTG 
ATTGTCATTG 
ATTGTCATTG 
ATTGTCATTG 
ATTGTCATTG 
ATTGTCATTG 
ATTGTCATTG 
ATTGTCATTG 
ATTGTCATTG 
ATTGTCATTG 
ATTGTCATTG 



350 

ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 



msa68511.2{l64 090 
msa68511 . 2 { 164_18RS21 
msa68511.2{l64_2603 
msa68511 . 2 {l64_A909 
msa68511 . 2 { 164_CJB110 
msa6 8511.2(1 64_COHl 
msa68511.2{l64 H36B 
msa68511. 2 {l64_JM9130013 
msa68 511 . 2 { 164_M7 32 
msa6851 1 . 2 { 164_M781 
rasa68511.2{l64_1169NT 
Consensus 



351 

AAACACAGAA 
AAACACAGAA 
AAACACAGAA 
AAACACAGAA 
AAACACAGAA 
AAACACAGAA 
AAACACAGAA 
AAACACAGAA 
AAACACAGAA 
AAACACAGAA 
AAACACAGAA 



372 

GATAAAGAAA AA 
GATAAAGAAA AA 
GATAAAGAAA AA 
GATAAAGAAA AA 
GATAAAGAAA AA 
GATAAAGAAA AA 
GATAAAGAAA AA 
GATAAAGAAA AA 
GATAAAGAAA AA 
GATAAAGAAA AA 
GATAAAGAAA AA 



SBQ ID NO. 4712 
STRAIN 2603 

YFLTTKKGHELRKNAEKFYGEYKBNPEBYH^ 

TTED I VSAVKEKSGBWDFANDFVNQAKS KPSDKDTAKKBDKAPETKVBD I VI D YKENTE 
DKEK 

SBQ TD NO. 4713 
STRAIN A909 frames 1 

YFLTTIGCGKEIiRKNAEKFYGBYKENPBEYHQIAKDKA5EYSNliAVOT 

TTBD I VSAVKBKSGBWD FAND PVNQAKS KPSD SDTAKKEDKAPETKVED I VI D YKENTE 



SBQ ID NO* 4714 



811 
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STRAIN H36B frames 1 
YFLTTKHGKELKKHAEKFYGEYKEHPEEYHQ 

TTED I VSAVKEKSGEVVDFANDFWGAKSKFSDEDTAKKEDKAPETKVED IV I DYKENTB 
DKEK 

SEQ ZD NO. 4715 

STRAIN 18RS21 frame: 1 

YFLT TKKGKBIiKKNABKFYGEYKENPEEYHQIA 

TTEDIVSAVKEKSGEVVDFANDFVNQAKSKPSDEDTAKKEDKA^ 

DKEK 

SEQ ID HO. 4716 
STRAIN M732 frames 1 

YFLTTKKGKELRKNAEKFYGEYKENPEEYHQIAra 

TTEDIVSAVKEKSGEVVDPANDFVNQAKSKFSDEiyrAKKEDKAPETKVEDIVIDYKE 
DKEK 

SEQ ID NO. 4717 
STRAIN _COHl frame: 1 

YFLTTKKGKELRKNAEKFYGBYKENPEEYHQIAKDK^ 

Ti'EDIVSAVKEKSGEVVDFANDFVNQAKSKFSDEDTAKKEDKAPETKVED 

DKEK 

SEQ ID NO. 4718 
STRAIN _M781 frames 1 

YFLTTKKGKBLPJCNABKFYGEYKENPEEYHQIAKDKASEYSN^ 

TTED I VSAVKEKSGEWD FAND FVNOAKS KFSDEDTAKKEDKAPETKVED I V I D YKENTE 
DKEK 

SEQ ID NO. 4719 ; 

STRAIN J390 frames 1 

YPljTTKKGKELRKNAEiCPYGEyKENPEFjYHQIAKDKASEYSNLA^ 

TTEDIVSAVKEKSGEVVDFANDFVNQAKSKFSDEDTAKKFJDKAPET^ 

DKEK 

SEQ ID NO. 4720 

STRAIN _CJB110 frames 1 

YFLTTKKGKELRIQIAEKFYGBYKBNPEEYHQIAKDKASOT 

TTBDI VSAVKEKSGEVVDFANDFWGAKSKFSDEDTAKKEDKAPETKVED I VIDYKENTE 
DKEK 

SEQ ID NO. 4721 

STRAIN 116 9NT frames 1 

YFLXTKKGKEI&KNAEKFYGEYKENPE 

TTED IVSAVKEKSGBWDFAND FVNGAKSKFSDEDTAKKENKAPBTKVED I VIDYKENTE 
DKEK 

SEQ ZD NO. 4722 

STRAIN _JM9130013 frames 1 

YFLTTKKGKBLRKNAEKFYGEYKBNPEEYHQI 

TTED I VSAVKEKSGEVVDFAND FVNQAKS KFSDEDTAKKEDKAPETKVED I VID YK^ 
DKEK 



PRETTY of s /biotmp/msa68746.2{*} January 22, 2003 05:54 



mBa68746.2{l64_090 
msa68746 . 2 ( 164_1169NT' 
maa68746 . 2 { 164~1BRS21 
msa68746.2(l64 2603 
maa68746.2{l64~A909 
msa68746.2{l64 CJB110 
msa68746.2{l64 COH1 
msa68746 . 2 { 164~H36B 
tnsa68746 . 2 {l64_JM9130013 
msa68746.2{l64 M732 
maa68746.2{1643M781 
Consensus 



YFLTTKKGKE 
YFLiTTKKGKE 
YFLTTKKGKE 
YFLTTKKGKE 
YFLTTKKGKE 
YFLTTKKGKE 
YFLTTKKGKE 
YFLTTKKGKE 
YFLTTKKGKE 
YFL TTKK GKE 
YFLTTKKGKE 



LRKNAEKFYG 
LRKNABKFYG 
LRKNAEKFYG 
LRKNAEKFYG 
LRKNAEKFYG 
LRKNAEKFYG 
LRKNABKFYG 
LRKNAEKFYG 
LRKNABKFYG 
LRKNAEKFYG 
LRKNAEKFYG 



EYKENPEBYH 
EYKENPEEYH 
EYKENPEBYH 
EYKENPEBYH 
EYKENPEBYH 
EYKENPEEYH 
EYKENPEBYH 
EYKENPEEYH 
EYKENPEEYH 
EYKENPEBYH 
EYKENPEEYH 



QIAKDKASEY 
QIAKDKASEY 
QIAKDKASEY 
QIAKDKASEY 
QIAKDKASEY 
QIAKDKASEY 
QIAKDKASEY 
QIAKDKASEY 
QIAKDKASEY 
QIAKDKASEY 
QIAKDKASEY 



50 

SNLAVDTFKD 
SNLAVDTFKD 
SNLAVDTFKD 
SNLAVDTFKD 
SNLAVDTFKD 
SNLAVDTFKD 
SNLAVDTFKD 
SNLAVDTFKD 
SNLAVDTFKD 
SNLAVDTFKD 
SNLAVDTFKD 



msa68746.2{l64 090 
msa68746.2(l64 1169NT 
msa68746.2{l64 18RS21 
msa68746.2(l?4 2603 
msa68746 . 2 { 164~A909 
msa68746.2{l64 CJB110 
rtl8a68746.2{l64 COH1 
msa68746.2{164~H36B 
msa68746 . 2 { 164_JM913 0013 
msa68746.2(l64 M732 
tnaa6 87 46 . 2 { 164~M7 8 1 



51 



YKGKFESGEL 
YKGKFESGEL 
YKGKFESGEL 
YKGKFESGEL 
YKGKFESGEL 
YKGKFESGEL 
YKGKFESGEL 
YKGKFESGEL 
YKGKFESGEL 
YKGKFESGEL 



TTBDIVSAVK 
TTBDIVSAVK 
TTBD IVSAVK 
TTBDIVSAVK 
TTBD IVSAVK 
TTBDIVSAVK 
TTED IVSAVK 
TTEDIVSAVK 
TTEDIVSAVK 
TTEDIVSAVK 
TTEDIVSAVK 



EKSGEWDFA 
EKSGEWDFA 
EKSGEWDFA 
EKSGEWDFA 
EKSGEWDFA 
EKSGEWDFA 
EKSGEWDFA 
EKSGEWDFA 
EKSGEWDFA 
EKSGEWDFA 
EKSGEWDFA 



NDFVNQAKSK 
NDFVNQAKSK 
NDFVNQAKSK 
NDFVNQAKSK 
NDFVNQAKSK 
NDFVNQAKSK 
NDFVNQAKSK 
NDFVNQAKSK 
NDFVNQAKSK 
NDFVNQAKSK 
NDFVNQAKSK 



100 

FSDEDTAKKB 
FSDEDTAKKE 
FSDEDTAKKB 
FSDEDTAKKE 
FSDEDTAKKB 
FSDEDTAKKE 
FSDEDTAKKB 
FSDEDTAKKE 
FSDEDTAKKE 
FSDEDTAKKB 



812 
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Consensus 



msa68746 . 2 { 164_090 \ 
msa68746.2{l64 1169NT, 
msa6B746 ♦ 2 { 164~18RS21 
msa68746 . 2 { 164_2603 
msa68746.2{l64_A909 
msa68746.2{l64 CJB110 
tnsa68746 .2(l€4_C0Hl 
msa68746.2{164_H36B 
maa68746.2{l64 JM9130013 
msa68746.2{l64_M732 
msa68746.2{164_M781 
Consensus 



101 

dKAPBTKVED 
nKAPETKVED 
dKAPBTKVED 
dKAPBTKVED 
dKAPBTKVED 
dKAPBTKVED 
dKAPBTKVED 
dKAPBTKVED 
dKAPBTKVED 
dKAPBTKVED 
dKAPBTKVED 



IVIDYKENTE 
IVIDYKENTE 
IVIDYKENTE 
IVIDYKENTE 
IVIDYKENTE 
IVIDYKENTE 
IVIDYKENTE 
IVIDYKENTE 
IVIDYKENTE 
IVIDYKENTE 
IVIDYKENTE 



124 
DKEK 
DKEK 
DKEK 
DKEK 
DKEK 
DKEK • 



_********* ********** 



DKEK 
DKEK 
DKEK 
**** 
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SEQ ZD NO: 4801 
STRAIN 2603 

aatagtactgagacaagtgcttcagtagttcctactacaaatactatcgt 
tcaaactaatgacagtaatcctaccgcaaaatttgtatcagaatcaggac 
aatctgtaataggtcaagtaaaaccagataattctgcggcgcttacaaca 
gttgacacgcctcatcatatttcagctccagatgctttaaaaacaactca 
atcaagtcctgtcgttgagagtacttctactaagttaactgaagagactt 
acaa acaaaaagat ggt caagat 1 1 agccaaca t gg t gagaagt gg t caa 
gttactagtgaggaactcgttaatatggcatacgatattattgctaaaga 
aaacccatctttaaatgcagtcattactactagacgccaagaagctattg 
aagaggctagaaaacttaaagataccaatcagccgtttttaggtgttccc 
ttgttagtcaaggggttagggcacagtattaaaggtggtgaaaccaataa 
tggcttgatctatgcagatggaaaaattagcacatttgacagtagctatg 
tcaaaaaatataaagatttaggatttattattttaggacaaacgaacttt 
ccagagtatgggtggcgtaatataacagattctaaattatacggtctaac 
gcataatccttgggatcttgctcataatgctggtggctcttctggtggaa 
gtgcagcagccattgctagcggaatgacgccaattgctagcggtagtgat 
gctggtggttctatccgtattccatcttcttggacgggcttggtaggttt 
aaaaccaacaagaggat tggtgagt aa tgaaaagccagat tcgta tagt a 
cagcagttcattttccattaactaagtcatctagagacgcagaaacatta 
ttaacttatctaaagaaaagcgatcaaacgctagtatcagttaatgattt 
aaaatctttaccaattgcttatactttgaaatcaccaatgggaacagaag 
ttagtcaagatgctaaaaacgctattatggacaacgtcacattcttaaga 
aaacaaggattcaaagtaacagagatagacttaccaattgatggtagagc 
attaatgcgtgattattcaaccttggctattggcatgggaggagcttttt 
caacaattgaaaaagacttaaaaaaacatggttttactaaagaagacgtt 
gatcctattacttgggcagttcatgttatttatcaaaattcagataaggc 
tgaacttaagaaatctattatggaagcccaaaaacatatggatgattatc 
gt aaggcaatggagaagctt cacaagcaa t tt cc tat tt tct tatcgcca 
acgaccgcaagtttagcccctctaaatacagatccatatgtaacagagga 
agataaaagagcgatttataatatggaaaacttgagccaagaagaaagaa 
t tgc t ctct; 1 1 aat cgccagtgggagcc t a tgt tgcgtagaacacc 1 1 1 1 
acacaaattgctaatatgacaggactcccagctatcagtatcccgactta 
cttatctgagtctggtttacccatagggacgatgttaatggcaggtgcaa 
actatgatatggtattaattaaatttgcaactttctttgaaaaacatcat 
ggttttaatgttaaatggcaaagaataatagataaagaagtgaaaccatc 
tactggcctaatacagcctactaactccctctttaaagctcattcatcat 
tagtaaatttagaagaaaattcacaagttactcaagtatctatctctaaa 
aaatggatgaaatcgtctgttaaaaataaaccatccgtaatggcatatca 
aaaagca 

SEQ ZD NOz 4802 
STRAIN 090 

AATAGTACTGAGACAAGTGCTTCAGTAGTTCCTACTACAA 

ATACTATCGTTCAAACTAATGACAGTAATCCTACrc 

GAATCAGGACAATCTGTAATAGGTCAAGTAAAACCAGATAA 

GCTTACAAGAGTTGACACX3CCTCATCATATrT(^ 

AAACAACTCAATCAAGTOCTGTCXy^^ 

GAAGAGACTTACAAACAAAAAGATGGTAAAGATTTAGCCAA^ 
AAGTGGTCAAGTTACTAGTGAGGAACTCGTTAATATGGCA 
TTGCTAAAGAAAACCCATCTTTAAATG CAGTCATTACTACTAGACGCCAA 

AAACCAATAATGGCTTGATCTATGCAGATGGA 
AGTAGCTATGTC^AAAAATATAAAQATTTAGGATTTATTA 
AACX3AACTITCCAGAGTATGGGTGG(XiTAATATA 
ACGGTCTAACXXATAATCCTTGGGATCTTGCTtA^ 
TCTGGTGGAAGTGCAGCAGCCATTGCTAGC^ 
CXSGTAGTGATGCTGGTGGTTCTATCCGTATTCCA^ 
TGGTAGGTTTAAAACCAACAAGAGGATTGGTGAGTAAT^ 
TCGTATAGTACAGCAGTTCATTTTCCATTAACTAAGTCATCT 
AGAAACATTATTAACTTATCTAAAGAAAAG CGATCAAACGCTAGTATCAG 
TTAATGATTTAAAATCTT tACCAATTG CTTATACTTTGAAATCACCAATG 
GGAACAGAAGTTAGTCAAGATGCTAAAAACGCTATTATGGAC^ 
ATTCTTAAGAAAACAAGGATTCAAAGTAACAGAGATAG^ 
ATXKSTAGAGCATTAATGCGTGATTATTCAACCTTGGCTAT^ 
GGAGCTTTTTCAACAATTGAAAAAGACITTAAAAA 
• AGAAGACGTTGATCCTATTACTTGGGCAGTT^ 

CAGATAAGGCreAACTTAAGAAATCTATTATGGAAGCCCAAAAACATA 

GATGATTATCGTAAGGCAATGGAGAAGCTTCACAAGCAATTTCCT 

CTTATCX3CX^VACGACCGCAAGTTTAG<XXX^rCTAAAT^ 

TAACAGAGGAAGATAAAAGAGCX^TTTATAATATGG 

GAAGAAAGAATTGCTCTCTTTAATCGCXyVGTGG 

AACACCTTTTACACAAATTG CTTAATATGACAGGACTCCCAGCTATCAGTA 

TCCXJGACTTACTTATCTGAGTCroGTTTACC^T^ 

GOVGGTGCAAACTATGATATGGTATTAATTAAATT^ 

AAAACAT<IATGGTTTTAATGTT AAATGG CAAAGAATAAT AGAT AAAGAAG 

TGAAACCATCTACTGGCCTAATACAGCCTACTAACT^ 

CATTCATCATTAGTAAATl^AGAAGAAAATTCACAAGTTA 

TATCTCTAAAAAATGOATGAAATCGTCItmaAAA 

TGGCATATCAAAAAGCA 

SEQ ZD NO i 4803 
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STRAIN A909 

TACTACAAATACTATCXOTCAAACTAATGACAGTAATCCTACCGCAAAAT 

TTGTATCAGAATCAGGACAATCTGTAATAGGTCAAGTAAAACCAaATAAT 

TCTGCGGCX3 CTT ACAACAGTTGACACGCCT CATCATATTTCAGCTCCAGA 

TGCTTTAAAAACAACTCAATCAAGTCCTGT^ 

AGTTAACTGAAGAGACOTACAAACAAAAAGATGGTCAAGATTTAG 

ATGGTGAGAAGTGGTCAAGTTACTAGTGAGGAACTCG1TAATATGG 

CGATATTATTGCTAAAGAAAA02CATCTTTAAATGCAGTCATTACT 

GACGCCAAGAAGCTATTGAAGAGGCTAGAAAACTTAAAGA 

CCGTTTTTAGGTGTTCCCTTGTTAGTCAAGGGGTTA . 

AGGTGGTGAAACCAATAATGGCTTGATCTATGCAGATGGAAAAATTAGCA 

CATTTGACAGTAGCTATGTCAAAAAATATAAAGATTTAGGATTTATTA^ 

TTAGGAC^AACGAACTTTCO^GAGTATGGGTGGCCT 

TAAATTATACGGTCTAACX3CATAATCCTTGGG ATCTTGCT CTG 

GTGGCTCTTCTGGTGGAAGTGCAG CAG CCATTGCTAGCGG AATGACG CCA 

ATTGCTAGCXK?TAGTGATGCTGGTGGTTCT 

GACGG^CrrTGGTAGGTTTAAAACCAACRAGAGGATTG 

AGCXAGATTCXn'ATAGTACAGCAGTTCATTTTC 

AGAGACGCAGAAAGATTATTAACTTATCTAAAGAAAAG 

AGTATCAGTTAATGATTTAAAATCTTTACCAA 

CACCAATGGGAACAGAAGTTAGTCAAGATGC7rAAAAACX3 

AACXjTCACaTTCTTAAGAAAACAAC4GATTCAAAGTAACA 

ACCAATTGATGGTAGAGCATTAATG CGTGATTATTCAACCTTGGCTATTG 

GCATGGGAGGAGCITTTTCMCAATTGA 

TTTACTAAAGAAGACXJrTGATCCTATTACTTGGG CAGTTCATGTTATTTA 
T CAAAATTCAGATAAGG CTGAACIT AAGAAAT CTATT ATGGAAG CCCAAA 
AAC^TATGGATt^TTATCGTAAGGCAATGGAGAA 
CXTTATTITCITATCGCC^CGACCGCIAA^ 

TCC^TATGTaACAGAGGAAGATAAAAGAGCXaATTTATAATATGGAAAACT 
TGAGCCAAGAAGAAAGAATTGCrCTCTTTAATOGCCAGTGCGAGCCTATO 
TTGCGTAGAACACCTrrTACA^ 
TATCAGriATCCCGACTTACTTATCTG^ 

TGTT AATGGCAGGTG CAAACTATGATATGGTATTAATTAAATTTG CAACT 

TTCTTTGAAAAACATCATGGTTTTAArarT^ 

TAAAGAAGTGAAACCATCTACTGGCCTAATACMCOTACTAAC^ 

TTAAAGCTCATTCATCATTAGTAAATTTAGAA 

CAAGTATCTATCTCTAAAAAATGGATGAAATCGTCTG 

ATCCGTAATGGCATATCAAAAAGCA 

SEQ ZD NO i 4804 
STRAIN COH1 

AATAGTACTGAGACAAGTGCTTCAGTAGCTrc 

ACTATCXTITCAAACTAATGACAGTAATCCTACCX^ 

ATCAGGACAATCTCTAATAGGTCAAGTAAAACCAGCT 

TTACAACAGTTGACACGCCTCATATTTCAGCT 

ACTCAATCAAGTCCTGTCGTTGAG^GTCXiriTCT 

GACATACAAAQVAAAAGATGXTTCAAGATTTAGCCAACAT^ 

GTCAAGTTACTAGTGAGGAACrCGTOVATATGGCATACGATATTA 

AAAGAAAACCCATCTTTAAATGCAGTCATTACTACT^ 

CATTGAAGAGGCTAGAAAACITAAAGATACTAATC 

TTCCcTTGTTAGTCAAGGGGTTAGGGCACAGTA 

AATAATGGCTTGATCTATGCAGATGGAAAAATT^ 

CTATGTCAAAAAATATAAAGATTTAGGATTTATTATTT^ 

ATTTTCCAGAGTATGK3GTGGCGTAA3M 

COUVCtX^TAATCCTTGGAATCTTGCT 

TGGAAGTGCAGCAGCTATTGCTAGCGGAATGACGCC^ 

GGTTTAAAACCAAC^AGAGGATTGGTGAGTAATGAAA 
TAGTACAGCAGTTCATTTTCCATTAACTAAGTCATCTA 
CATTGTTAACTTACCTAAAGAAAAGCGATCAAAC^ 
GATTTAAAATCTTTACCAATTGCITATACTT^ 

AGAAGTTAGTCAAGATG CT7^AAAATGCTATTATGGACAACX5TCACATTCT 

TAAGAAAAC^GGATTCAAAGTGACAGAGATAGATT t AC CAATTGATGGT 

AGAGCATTAATGCOT3ATTATTCAAOTTOGCTO 

TTTTTCAACAATTGAAAAAGACTTAAAAAAAC^ 

ACXnTGATCCCATTACTTGGGCIAGTTCATff 

AAGGCTGAACTTAAGAAATCTATTGTGGAAGCCCAAA 

TTATCGTAAGGCAATGGAGAAGCTTCACAAGCAATT^ 

CGCCAAOGACCG CAAgTTT AG CCCCTCTAAAT ACAGATC CAT ATGTAACA 

GAGAAAGAT AAAAGAG CX^TTTAT AATATGGAAAACTTG AG CCAAGAAGA 

AAGaATTGCTCTCTTTAATCGCCACPTGGXaAGCCT 

CTTTTACACCAATTGCTAATAtGACAGGACTC 

ACTTAC^TATCTGAGTCTGGTTTAC^ 

TGCAAACTATGATATGGTATTAATTAAATTTGCAAC 

ATCATGGTTTTAATGTTAAATGGCAAAGAATAATAGAT^ 

ATCATTAGTAAATITAGAAGAAAATTCACAAGTTACTCAAGTAT^ 

CTAAAAAATGGATGAAATOTrOOTTAAAAATAAAC^ 

TATCAAAAAGCA 

SEQ ID NO: 4805 
STRAIN M732 

TCAGTAGCTCCTACTACTVAATACTATCGfTTCAAACTA 
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TACCGCAAAATTTGCATCAGAATCAGGAC 

AACCAGCTAATTCTGCGGCGCTTACAACAGTTGACA^ 

GCTCCAGATGCTTTAAA^CAACTCAATCAAGTCCTGT^ 

TTCTACTAAGTTAACTGAAGAGACATACARACAAAAAGATG 

TAGCCAACATGGTGAGAAGTGGTCAAGTTACTAGTGAGGA^ 

ATGGCATACGATATTATCX3CTAAAGAAAACCXATC7rTTAAATGCAGTCAT 

TACTACTAGACGCCAAGAAGCCATTGAAGAGG CTAGAAAACTTAAAGATA 

CTAATCAGCCGTTTTTAGGTGTrcCCriGTTAG 

AGTATTAAAGGTGGTGAAACCAATAATGG CTTGATCTATGCAGATGGAAA 

AATTAGCACATTTGACAGTAGCTATGTCAAAAAATATA 

TTATTATTTTAGGACAAACGAATTTTCCAGAGTATGG 

ACAGACTCTAAATTATACGGraiAACX3CATAATC 

TAACGCTGGTGGCTCTTCT^ 

TGACXSCCAATTGCTAGCGGCAGTGATGCIXX^ 

TCTTCTTGGACGGGCITAGTAGGTTTAAAACCAAC^ 

TAATGAAAAG CCAGATTCGTATAGTACAGCAGTTCATTTTCCATTAACTA 

AGTCATCTAGAGACGCAGAAACATTGTTAACITACCTA 

CA^CGCTAGTATCAGTTAATGATTTAAAATCTTTACCAATTG 

TTTGAAATCACCAATGGGAACAGAAGTTAGTCAAG 

TTATGGACAACGTCACAlTCri'AAGAAAACAAGGATTCAAAGTGACA 

ATAGATTTACCAATTGATGGTAGAGCATTAATGCGTGATC 

GGCTATTGG CATGGGAGGAGCTTTTTCAAC7UVTTGAAAAAGACTTAAAAA 

-AACATGGTTTTACTAAAGAAGACGTTGAT^ 

GTTATTTATCAAAATTCAGATAAGGCTGAACr^ 

AG CCCAAAAACAiATGGATGATTATCGTAAGGCAATGGAGAAG CTTCACA 
AG CAATTTCCTATTTTCTTATCGCCAACGACCGC^ 

AATACAGATCCATATGTTACAGAGAAAGATAAAAGAGCGATTTATAATAT 

GGAAAACTTGAGCCAAGAAGAAAGAATTGCTCTCTTTAATOT 

AGCCTATGTTGCGTAGAACACCTTTTACACCAATTGCTAATATGA 

CTCCCAGKTTATCAGTATCCCGACTTACTTATCTGAGTC^^ 

AGGGACGATGTT AATGG CAGGTGCAAACT ATGATATGGT ATTAATTAAAT 

TTGCAACTTTCTITGAAAAACATCATGGTTTTAATGT^ 

ATAATAGATAAAGAAGTGAAACXATCTGCTGACCTAATACAGCCTACT 

CTCCCTCTTTAAAGCTCATTCATCATTAGT^ 

AAGTTACTCAAGTATCTATCTCnAAAAAATGGAT^ 

AATAAACCATCCGTAATGG CATATCAAAAAGCA 

SEQ ID NO: 4806 
STRAIN 1BRS21 

AATAGTACTGAGACAAGTG CTTCAGTAGTTCCTACTACAAATACTATCX3T 

TCAAACTAATGACAGTAATCCTACCGCAAAATTTGTAT 

AATCTGTAATAGGTCAAGTAAAACCAGATAATTCTGCG^ 

GTTGACACG CCTCATCATATTTCAG CTCCAGATGCITTAAAAACAACTCA 

ATCAAGTCCTGTOGTTGAGAGTACrrCrACTAAGTTAACT 

acaaacaaaaagatggtcaagatttago^^catggtgagaagtggtcaa 
' gttactagtgaggaactcgttaatatggcatacgatattattgctaaaga 
aaacccatcl"itaaatgcagtcattacractagacgccaagaagctattc 
aagacxxttagaaaacttaaagatacca 

ttgttagtcaaggggttagggcacagtattaaaggtggtgaaaccaa™ 
tggcttgatctatgcagatggaaaaattagcacatttga^ 

TCAAAAAATATAAAGATTTAGGATTTATTATTT^ 

CCAGAGTATGGGTGG CGTAATATAACAGATTCTAAATTATACGGTCTAAC 
GCATAATCCTTGGGATCTTGCTCATAATGCTGG^ 
GTGCAGCAGCCATTGCTAGCX3GAATGACX3CCAATTC 
GCIXjCTKSGTTCTATCCGTATTCCATCTTCT^ 

AAAACCAACAAGAGGATTGGTGAGTAATGAAAAGCCAGATTCGTATAGTA 
CAGCAGTTCATTTTCCATTAACTAAGTCATCTAGAGACGC 
TTAACITATCTAAAGAAAAGCGATCAAACGCTAGTAT^ 
AAAATCTTTACCAATTGCTTATACTTTGAAATCA 

TT AGTCAAQATG CTAAAAACX5CTATTATGGACAACGTCACATTCTTAAGA 

AAACAAGGATTCAAAGTAACAGAGATAGACTTACCAATTGATGGTA^ 

ATIAATGOGTGATTATTCAACCTTGGCTATTGG 

CAACAATTGAAAAAGACTTAA7VAAAACATGGTTTTACT 

GATCCTATTACTTGGGCAGTTCATGTTATTTATCAAAATTCAG^ 

TGAACTTAAGAAATCTATTATGGAAGCCCAAAAACMATGGATGATTATC 

GTAAGGCAATGGAGAAGCTTCACAAGCAATTTCX'IA^ 

ACGACCGCAAGTTTAGCCCCTCTAAATACAGATCCATATGTAACAG^ 

AGatAAA AGAGC GATTTATAATATGGAAAACTTGAGCCAAGAAGAA 

TTGCTCTCrTTAATCGCXaGTGGGAGCCrA 

ACACAAATTGCTAATATGACAGGACTCCCAGCW 

CTTATCTGAGTCTX3GTTTACCCATAGG 

A CTAXGA TATGGTATTAATTAAATTTGCAA C^ ^ 

GGTTTTAATGTTAAATGGCAAAGAATAATAGAT^ 

TAGTAAATTTAGAAGAAAATTCACAAGTTACTCAAGTATC^ 

AAATGGATGAAATCGTCTGTTAAAAATAAACCATCCGT^ 

AAAAGCA 

SEQ ID NO i 4807 
STRAIN M781 

TGCTTCAGTAGCTCCTACTACAAATACrATOGTT^ 

ATCCTACCGCAWVATTTGCATCAGAATCIAGGACAA^ 

GTAAAACCAGCTAATTCTGCGGCGCTTACAACAGTTG 
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TTCAG CTCCAGATGCTTTAAAAACAACTCAATCAAGTCCTGT 
GTCCTTCTACTAAGTTAACTGAAGAGACATACAAACAAAAAGATGGT 
GATTTAGCCAACATGGTGAGAAGTGGTCAAGTTACTAGTGAGGJ^ 
CAATATGGCATACGATATTATCGCTAAAGAAAACCX»TCTTTAAATGCAG 
TCATT ACTACT AGACGCCAAGAAG CCATTGAAGAGGCTAGAAAACTTAAA 
GATACTAATCAGCCGi-rri"iAGGTGTTCCCTTGTTAGTCAA^ 
GCACAGTAT tAAAG GTGGTGAAACCAATAATGGCTTGATCTATGCAGATG 
GA AAAAT TAG CACAT TTGACAGTAGCTATGTCAAA 

GGATTTATTATTTTAGGACAAACGaATTTTCCAGAGTATGGGTGGCGTAA 

TATAACAGACTCTAAATTATACGGTCCAACGCATAATCC^ 

CTCATAACGCTGGTGGCTCTTCTGGTGGAAGTGCAGCAGCT 

GGAATGACGCCAATTGCTAGCGGCAGTGATGCTGGTGGTTCTA 

TCCATCTTCTTGGACGGGCTTAGTAGGTTTAAAAC 

TGAGTAATGAAAAGCCAGATTCGTATAGTAGAGCAGTTCATTTTC 

ACTAAGTCATCTAGAGACGCAGAAACATTGTTAACITACCTAAAGAAAA 

CGATCAAACG CTAGT ATCAGTTAATGATTTAAAaTCTTTACCAATTG CTT 

ATACTTTGAAATCACCAATGGGAACAGAAgTTAGTCAAGATC 

GCTATTATGGACAACGTCACATTCTTAAGAGAACAAGGATTG^ 

AGAGATAGATTTACCAATTGATGGTAGAG CATTAATGCGTGATTATTCAA 

CCTTGGCTATTGGCATGGGAGGAGCTTTITCA 

AAAAAACATGGTTTTACTAAAGAAGACGTTGATCCCATTA 

TGGAAGCCCAAAAACATATGGATGATTATCGTAAGGCAATG^ 

CACAAGC^TTTCCTATTTTCTTATCGCCAACGACCGCAA^ 

TCTAAATACAGATCCATATGTAACAGaGaAAGATAAAAGAGCGATTrATA 

ATATGGAAAACTTGAGCCAAGAAGAAAQAATTGCTCTCTT^ 

TGGGAGCCTATGTTGCX3TAGAACACU"l-ri-lACACCAATTGCTAATAtGAC 

AGGACTCCCAGCTATCAGTATCCCGACITACTTATCTGAG 

CCATAGGGACGATGTTAATGGCAGGTGCAAACTATGATATG 

AAATTTG CAAi_i-i r u-i-i-i<WVAAACATC^TGGTTTTAATGTTAAATGG<^ 

AAGAATAATAGATAAAGAAGTGAAACCATCTG CTGACCTAATACAGCCTA 

CTAACTCCCTCTTTAAAGCTCATTCATCATTAGTAAAT^ 

TCACAAGTTACTCAAGTATCTATCT CrTAAAAAATGGATGAAATCGTCTGT 

TAAAAATAAACCATCCGTAATGGCATATCAAAAAGCA 

SEQ ZD NO: 4810 
STRAIN CJB110 

TAGTTC^TTACTACAAATACTATOGTTCAAACrAATGACAGTAATCCTAC^ 

GCAAAATTTGTATCAGAATCAGGACAATCTGTAATAGGTCAAGTAAAACC 

AGATAATTCTGCGGCGCTTAC^ACAGTTGACACGCCT 

CTCCAGATG CITTAAAAACAACTCAATCAAGTC CTGTCG 

TCnACTAAGTTAACTGAAGAGACTTACAAACAAAAAGATGGTA 

AGCCAACATGGTGAGAAGTGGTCAAGTTACTAGTGAGGAACTC 

TGGCATACGATATTATTGCTAAAGAAAACCCATCTTTAAAT^ 

ACTACTAGACG CCAAGAAG CTATTGAAGAGGCTAGAAAACTTAAAGATAC 

CAATCAGCCGTTTTTAGGTGTTCCCTTGTTAGTCAAGGGGT^ 

GTATTAAAGGTGGTGAAACCAATAATGGCITGATCTATGC 

ATTAGCACATTTGACAGTAGCTATGTCAAAAAATATAA^ 

TATTATTTTAGGACAAACGAACriTTCCAGAGTATGGGTG 

CAGATTCTAAATTATACGGTCTAACGCATAATCCTTGGGA 

AATGCTGGTGGCTCTTCTGGTGGAAGTGCAG 

CTTCTTGGACGGG CTTGGTAGGTTTAAAACCAACAAGAGGATTGGTGAGT 

CATGAAAAG C CAGATTCGTATAGTACAGCAGTTCAT^TTC CATTAACTAA 

GTCATCTAGAGACGCAGAAACATTATTAACTTATCTAAAGAAAAGOGAT 

AAACGCTAGTATCAGTTAATGAT1TAAAATCTITACXZAATTGCTTAT 

TTGAAATCACCAATGGGAACAGAAGTTAGTCAAGATGCTAAAAACG 

TATGGACAACGT CACATTCTT AAGAAAACAAGGATTCAAAGT AACAGAGA 

TAGACTTACCAATTGATGGTAGAG CATTAATGCGTGATTATTCAACCTTG 

GCTATIX3GCATGGGAgGA<3CTTTrTCAACaATTGAA 

AcATGGTTTTACTAAAGAAGACXjrTGATC<7rATTACTTGGGC 

TTATTTATCAAAATTCAGATAAGGCTGAACTTAAGA^TCTATTATGGAA 

GCC!CAAAAACATATGGATGATTATCGTAAGGCAATGGAGAAGCTTCACAA 

GCAATTTCCTATTTTCTTATCGCCAACX5ACCGC 

ATACAGATCGATATGTAACAGAGGAAGATAAAAGAGCGATTTATAATATG 

GAAAACTIt3AGCCAAGAAGAAAGAATTGCTCTCTTTAAT^ 

GCCTATGTTGCGTAGAACACCTrTTTACACAAATTGCTAATAtGACAG 

TCCCAGCTATCAGTATCCCGACTTACTTATCTGAGTC 

gGGACgATGTTAATGGCAGGTGCAAACTATGATATGGTATTAAT^ 

TGCAACTTTCTTTGAAAAACATCATGGTITTAATGT^ 

TAATAGATAAAGAAGTGAAACCATCTACTOGCCTAATACAGCCTACTAAC 

TCCCTCTITAAAGCTCATTCATCATTAGTAAATT^ 

AGTTACTCAAGTATCTATCTCrAAAAAATGGATGAAAT^ 

ATAAACCATCCGTAATGGCATATCAAAAAGCA 

SEQ ZD NO: 4811 
STRAIN 11 6 9 NT 

AATAGTACTGAGACAAGTGCTTCAGTAGCTCCTACrACAAATACTATCGT 
TCAAACTAATGACAGTAATCCTACCGCAAAATTTGCAT^ 
AATCTGTAATATGTCAAGTAAAACCAGATAATTCTGCGGCG 
GTTGACACGCCTCATATTTC AGC TCCAGAT GATT TAAAAACAA 

AACAAAAAGATGGTCAAGATTTAGCCAACATGGTGAGAAGTGGTCAAGTT 
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ACTAGTGAGGAACTC^ 

CCCTTCTTTAAATGCAGTCATTACTACTAGACGCC^ 

AGGCTAGAAAACTTAAAGATACTAATCAGCCATTTTTAGGTGTrCCCTTG 

TTAGTCAAGGGGTTAGGGCACAGTATTAAAGGTGGTGAAACCAATAATOT 

CTTGATCTATGCAGATGGAAAAAT t aGCACATTTGACAGTAGCTATGTCA 

AAAAATATAAAGATTTAGGATTTATTATTTTAGGACAAACGAACTTTCCA 

GAGTATGGGTGGCXn^AATATAACAGATTCTAAATTATACGGTCCA^ 

TAACCCT CGGAATCTTG CTCATAATGCTGGTGGCTCTTCTGGTGGAAGTG 

CAGCAGCCATTG CT AGCGGr ATGACGCCAATTGCT AG CGGTAGTGATGCT 

GGTGGTTCTATCCG tATTCCATCTTCTTGGACGGG CTTGGTAGGTTTAAA 

ACCAAC AAGAGG ATTGGTGAGTAATGAAAAGCCAGATTOGT^ 

CAGTTCATTTTCCATTAACTAAGTCATCTA 

ACTTATCTAAAGAAAAGCGATCAAATOCTAGTATCAGTTAATGATTTAAA 

ATCTTTACCAATTCCTTATACTTTGAAATCACCAATGG^ 

GTCAAGATGCTAAAAACGCTATTATGGACAACCTGACATTCrTAAGA 

CAAGGATTCAAAGTAACAGAGATAGACITACCAA1TC 

AATGCGTGATTATTCAACCTTGGCTATTGGCATGGGAGG 

CAATTGAAAAAGACTTAAAAAAACATGGTTTTACTAAAGA 

CCTATTACTTGGGCAGTTCATGTTATTTATCAAAATT^ 

ACTTAAGAAATCrATTATGGAAGCCCAAAAACATATGGATGATrATCGTA 

AGGCAATGGAGAAGCn^CACAAGCAATTTCCT 

ACCGCAAGlTTAGCCCCTCTAAATACAGAt CCATATGTAACAGAGGAAGA 
TAAAAGAGCGATTTATAATATGGA?W\CTTGAGCCAAGAAGAAAGAATTC 
CTCTCTTTAATCGCCAGTGGGAGCCTATG^ 

CAAATTGCTAATATGACAGGACTCCCAG CTATCAGTATCCCGACTTACTT 

ATCTGAGTCTGGTTTACCCATAGGGACGATGTTAATGGCAGGTC 

ATGATATGGTATTAATTAAATTTGCAACTTTCTTTGAAAA 

TTTAATGTTAAATGGCAAAGAATAATAGATAAAGAAGTGAAACCATCTAC 

TGGCCTAATACAGCCTACTAACTCCCTCTTTAAAGCTCATTCATCATTAG 

TAAATTTAGAAGAAAATTCACAAGTTACTGAAGTATCTATCTCrAAAA^ 

TGGATGAAATCGTCTGTTAAAAATAAACCATCCGTAATXM 

AGCA 

SEQ ID NO: 4812 

strain jm9130013 

ttcagtagctcc^ctaa^aatactatcgttcaaactaatgacagtaatc 

ctaccgcaaaattitcatcagaatc^ggacaatctgtaataggtcaagt'a 

aaacc3uxn , aattctgtggcgcttacaacagttgacacgcct 

agctccagatgctttaaaaacaactcaatcaagtcc^ 

cttctactaagttaacigaagagacatac^aa 

ttagcc^catggtgagaagtggtauvgttactagtgaggaactcgtc^ 

tatggcatacgatattattgctaaagaaaacccatctttaaatgcagtca 

tiactactagacgccaagaagctatt^ 

accaatcagccgtttttaggtgttcccttgttagtcaaggggt^ 

cagtattaaaggtggtgaaaccaataatggcttgatgtatgcag^ 

aaattagcacatttgacagtagctatgtcaaaaaatataaagatttagga 

tttattattttaggacaaacgaactttccagagtat^ 

aacagattctaaattatacxk?rccaacgcataacccttggaa 

ATGACX3CCAATTGCTAGCGGTAGTGATGCTGGTGGTTCT 

ATClTClTtgGACX3GGCTTGGT!AGGTTTAAAA 

GTAATGAAAAGCCAGATTCGTATAGTACAGCAGTTCATTTTCC^ 

AAGTC^TCTAGAGACGCAGAAACATTATTAACTTATCTAAAGAAAAGCSSA 

TCAAACGCTAGTATCAGTTAATGATTTAAAATCTTTACCAA 

CTTTGAAATCACCAATGGGAAC^GAAGTTAGTCAAGATGCT 

ATTATGGACAACGTCATATTCTTAAGAAAACAAGGATTCAAAGTG^ 

GATAGACTTACCAATTGATGGTAGAGCATrAATGCGTGATTAT^ 

TGGCTATTGGTATGGGAGGAGCTTTTTCAACAATTGAA 

AAACATGGTTTTACTAAAGAAGACGTTG^ 

TGTTATTTATCAAAATTCAGATAAGGCTGAACTTAAGAAATCTA^ 

AAGCCCAAAAACATATGGATGATTATCGTAAGGCAATGGAGAAGCrrCAC 

AAGCAATTTCCTATTTTCTTATCGCCAACGACCGCA 

AAATACAGATCCATATGTAACAGAGGAAGATAAAAGAGCGATTTATAATA 

TGGAAAACTTpAGCCAAGAAGAAAGAATTGCTCTCTTTAAT 

GAGCCTATG1TGCGTAGAACACCTTTTACACAAATTGCTAATATGACAGG 

ACTCGCAGCTATCAGTATCCCGACITACTTATCTGAGTCTGGTTT 

TAGGGAC GATGTTAA TGGCAGGTGCAAACTATGATATGGTATTAATTAA^ 

TTIGCAACTI^-rrimAAAATATCATGGTTTTAATGTTAAATGG CAAAG 

AATAATAGATAAAGAAGTGAAACCATCTACJTGGCCTAATACAGCCTA 

ACTCCCTCTTTAAAGCTCATTCATCATTAGTAAATTTAGAAG 

CAAGT^CTCAAGTATCIATCTCTAAAAAATGGATGAAATCG^ 

AAATAAACCATCCGTAATGGCATAT 

SEQ ID KOs 48X3 
STRAIN H36B 

CTTCAGTAGTTCCTACTACAAATACTATOGTTCAAACT^ 

CCTACCGCAAAATTTTCATCAGAATCAGGACAATC^ 

AAAACXAGCTAA TTCrG TGGCGCTTACAAO«3ra 

C AGC TCCAGATGCriTAAAAACAACTCAATCAAGTCC^ 

CCTTCTACTAAGTTAACTGAAGAGACATACAAACAAAAAGATGGTCAAGA 

TTTAGCXIAACATGGTGAGAAGTGGTCAAGTTACT^ 

ATATXKK^CTaCGATAtTATTGCTAAAGAAAACCCATCTTTA 

ATTACTACTAGACGCCAAGAAGCTATTGAAGAGGCTTIGAAAACTTAAAGA 
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Table 48: Comparative Sequences relating to SAG1474 



TACCAATCAGCCGTTTTTAGC?rcOT 

ACAGTATTAAAGGTGGTGAAACCAATAATGGCTTGATCTATGCAGGTGGA 

AAAATTAGCACATTTGACAGTAGCTATGTaWVAAATATAAAGATTTAGG 

ATTTATTATTTTAGGACAAACGAACTTTCCAGAGTATGGATGG 

TAACAGATTCTAAATTATACX3GTCCAACGCATAACCCTTGGAA 

(^TAATGCTGGTGGCTCTTCTGGTGGAAGTGCAGCAGTO 

GATGACGCCAATTG CTAGCGGTAGTGATGCTGGTGGTTCi'ATCCGTATTC 

CATCTTCTTGGACGGGCTTGGTAGGTTTAAAACX^ 

AGTAATGAAAAG CX^GATTCGTATAGTACAGCAGTTCATTITCCATTAAC 

TAAGTCATCTAGAGACGCAGAAACATTATTAAC^ATCTAAAGAAAAGCG 

ATCAAACGCTAGTATCAGTTAATGATTTAAAATC'I^riACCAA 

ACFITGAAATCACCAATGGGAACAG AAGTTAGTGAAG ATC CTAAAAATGC 

TATTATGGACAACGTCATATTCTTAAGAAAACAAGGATTC^W^GTGACAG 

AGATAGACTTACCAATTGATGGTAGAGCATTAATGCG^ 

TTGGCTATTGGTATGGGAGGAG CTTTTTCAACAATTGAAAAAGACTTAAA 

AAAACATGGTTTTACTAAAGAAGACGTTGATCCCATTACITCGGCAGTTC 

ATGTTATTTATCAAAATTCAGATAAGG CTGAACT^AAGAAATCTATTATG 

GAAG CCCAAAAACATATGGATGATTATCGTAAGGCAATGGAGAAGCTTCA 

CAAGCAATTTCCTATTTTCTTATCGCCAACGACC^ 

TAAATACAGATCCATATGTAACAGAGGAAGATAAAAGAGCGATTTATAAT 

ATGGAAAACTTGAGCCAAGAAGAAAGAATTGCTCTC^ 

GGAGCCTATGTTGCGTAGLAACACCTTTTACACAAATTGCT 

GACTCCCAGCTATCAGTATCCCGACTTACTTAT^ 

ATAGGGAC GATGT TAATGGCAGGTGCAAACTATGATATG 

ATTTGCAACTTTCTTTGAAAAATATCATG 

GAATAATAGATAAAGAAGTGAAACCATCTACIXX3CC7rAATAGAGCCTACT 
AACTCCCTCTTTAAAGCTCATTCATCATTAGTAAATTTAG 
ACAAGTTACTCAAGTATCTATCTCTAAAAAATGGATGAAATCOT 
AAAATAAA 

PRETTY of» /biotnip/rasa71927.2{*} January 22, 2003 07:23 



msa7192 7 . 2 { 173_18RS21 ' 
msa71927.2(l73_2603 
msa71927 . 2 { 173_A909 ' 
msa71927.2{l73_090 
msa7 1927 . 2 { 173 JCJB110 ' 
maa7 1927 . 2 { 173_C0H1 ' 
msa71927 . 2 ( 173_M781 ' 
msa71927 . 2 <173_M732 ' 
msa71927.2{173 H36B 
rosa71927 . 2 { 173_JM9130013 
rosa71927 . 2 { 173_1169NT 
Consensus 



1 50 
aatagtactg agacaagtgc ttcagtagtt ccTACTACAA ATACTATCGT 
aatagtactg agacaagtgc ttcagtagtt ccTACTACAA ATACTATCGT 

— TACTACAA ATACTATCGT 

aatagtactg agacaagtgc ttcagtagtt ccTACTACAA ATACTATCGT 

tagtt ccTACTACAA ATACTATCGT 

aatagtactg agacaagtgc ttcagtagct ccTACTACAA ATACTATCGT 

tgc ttcagtagct ccTACTACAA ATACTATCGT 

T tcagtagct ccTACTACAA ATACTATCGT 

. — c ttcagtagtt ccTACTACAA ATACTATCGT 

ttcagtagct ccTACTACAA ATACTATCGT 

aatagtactg agacaagtgc ttcagtagct ccTACTACAA ATACTATCGT 



rosa71927 . 2 { 173_18RS21 
msa7 1927 . 2 f 173_2603 
msa71927 .2{173_A909 
msa7 192 7 . 2 { 17 3_0 90 
insa71927 . 2 { 173_CJB1 10 
msa71927.2'{!73 COH1 
msa71927 . 2 (173~M781 
msa71927 .2 { 173~M732 
msa71927 . 2 { 173_H3 6B 
msa71927.2{!73 OM9130013 
tnsa71927.2{T73_1169NT \ 
Consensus 



51 

TCAAACTAAT 
TCAAACTAAT 
TCAAACTAAT 
TCAAACTAAT 
TCAAACTAAT 
TCAAACTAAT 
TCAAACTAAT 
TCAAACTAAT 
TCAAACTAAT 
TCAAACTAAT 
TCAAACTAAT 



GACAGTAATC 
GACAGTAATC 
GACAGTAATC 
GACAGTAATC 
GACAGTAATC 
GACAGTAATC 
GACAGTAATC 
GACAGTAATC 
GACAGTAATC 
GACAGTAATC 
GACAGTAATC 



CTACCGCAAA 
CTACCGCAAA 
CTACCGCAAA 
CTACCGCAAA 
CTACCGCAAA 
CTACCGCAAA 
CTACCGCAAA 
CTACCGCAAA 
CTACCGCAAA 
CTACCGCAAA 
CTACCGCAAA 



ATTTgtATCA 
ATTTgtATCA 
ATTTgtATCA 
ATTTgtATCA 
ATTTgtATCA 
ATTTgcATCA 
ATTTg cATCA 
ATTTgcATCA 
ATTTtcATCA 
ATTT tcATCA 
ATTTgcATCA 



100 

GAATCAGGAC 
GAATCAGGAC 
GAATCAGGAC 
GAATCAGGAC 
GAATCAGGAC 
GAATCAGGAC 
GAATCAGGAC 
GAATCAGGAC 
GAATCAGGAC 
GAATCAGGAC 
GAATCAGGAC 



msa71927.2{l73_18RS21 
msa71927 . 2 fl73_2603 
msa71927 . 2 (173_A909 
msa7 1927 . 2 { 173_090 
msa71927 . 2 {173_CJB110 
maa71927.2fl73 C0H1 
msa71927 . 2 { 173~M781 
maa71927 . 2 { 173~M732 
msa71927.2{173 H36B 
msa71927 . 2 {173_JM9130013 
msa71927.2{l73_1169Nr 
Consensus 



101 

AATCTGTAAT 
AATCTGTAAT 
AATCTGTAAT 
AATCTGTAAT 
AATCTGTAAT 
AATCTGTAAT 
AATCTGTAAT 
AATCTGTAAT 
AATCTGTAAT 
AATCTGTAAT 
AATCTGTAAT 



AgGTCAAGTA 
AgGTCAAGTA 
AgGTCAAGTA 
AgGTCAAGTA 
AgGTCAAGTA 
AgGTCAAGTA 
AgGTCAAGTA 
AgGTCAAGTA 
AgGTCAAGTA 
AgGTCAAGTA 
AtGTCAAGTA 



AAACCAGaTA 
AAACCAGaTA 
AAACCAGaTA 
AAACCAGaTA 
AAACCAGaTA 
AAACCAGcTA 
AAACCAGcTA 
AAACCAGcTA 
AAACCAGcTA 
AAACCAGCTA 
AAACCAGaTA 



ATTCTGcGGC 
ATTCTGcGGC 
ATTCTGcGGC 
ATTCTGcGGC 
ATTCTGcGGC 
ATTCTGcGGC 
ATTCTGcGGC 
ATTCTGcGGC 
ATTCTGtGGC 
ATTCTGtGGC 
ATTCTGcGGC 



150 

GCTTACAACA 
GCTTACAACA 
GCTTACAACA 
GCTTACAACA 
GCTTACAACA 
GCTTACAACA 
GCTTACAACA 
GCTTACAACA 
GCTTACAACA 
GCTTACAACA 
GCTTACAACA 



msa71927 . 2 { 173_18RS21 
msa71927 . 2 { 173_2603 
msa7 1927 . 2 { 173_A909 
msa71927.2{l73_090 

msa71927 . 2 { 173_CJB110 
maa71927.2fl73_COHl 
msa71927.2(173 M781 
maa7 1 92 7 . 2 { 173 - M7 32 



151 

GTTGACACGC 
GTTGACACGC 
GTTGACACGC 
GTTGACACGC 
GTTGACACGC 
GTTGACACGC 
GTTGACACGC 
GTTGACACGC 



CtcaTCATAT 
CtcaTCATAT 
CtcaTCATAT 
CtcaTCATAT 
CtcaTCATAT 
C. . .TCATAT 
C . . . TCATAT 
C. . .TCATAT 



TTCAGCTCCA 
TTCAGCTCCA 
TTCAGCTCCA 
TTCAGCTCCA 
TTCA GCTCCA 
TTCAGCTCCA 
TTCAGCTCCA 
TTCAGCTCCA 



GATGcTTTAA 
GATGcTTTAA 
GATGcTTTAA 
GATGcTTTAA 
GATGcTTTAA 
GATGcTTTAA 
GATGcTTTAA 
GATGcTTTAA 



200 

AAACAACTCA 
AAACAACTCA 
AAACAACTCA 
AAACAACTCA 
AAACAACTCA 
AAACAACTCA 
AAACAACTCA 
AAACAACTCA 



819 
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Table 48: Comparative Sequences relating to SAG1474 



maa7 1 92 7 . 2 { 17 3_H3 6B } 
msa71927 . 2 { 173_JM9130013 J 
msa71927 . 2 { 173_1169NT } 
Consensus 



GTTGACACGC C. . .TCATAT TTCAGCTCCA GATGcTTTAA AAACAACTCA 
GTTGACACGC C. . .TCATAT TTCAGCTCCA GATGcTTTAA AAACAACTCA 
GTTGACACGC C. . .TCATAT TTCAGCTCCA GATGaTTTAA AAACAACTCA 



msa71927.2{l73_18RS21 
msa71927 . 2 ( 173_2603 ' 
maa71927 . 2 { 173_A909 ' 
msa71927 . 2 { 173_090 ' 
msa71927 . 2 { 173_CJB110 ' 
msa7 1927 . 2 f 173_C0H1 ' 
msa71927.2(173 M78l' 
rasa71927.2f 173""M732' 
msa7 192 7 . 2 { 1733*3 6B 
rasa71927.2{l73 JM9130013' 
msa71927 . 2 (173_1169NT 
Consenaus 



201 

ATCAAGTCCT 
ATCAAGTCCT 
ATCAAGTCCT 
ATCAAGTCCT 
ATCAAGTCCT 
ATCAAGTCCT 
ATCAAGTCCT 
ATCAAGTCCT 
ATCAAGTCCT 
ATCAAGTCCT 
ATCAAGTCCT 



GTCGTTGAGA 
GTCGTTGAGA 
GTCGTTGAGA 
GTCGTTGAGA 
GTCGTTGAGA 
GTCGTTGAGA 
GTCGTTGAGA 
GTCGTTGAGA 
GTCGTTGAGA 
GTCGTTGAGA 
GTCGTTGAGA 



GTaCTTCTAC 
GTaCTTCTAC 
GTaCTTCTAC 
GTaCTTCTAC 
GTaCTTCTAC 
GTcCTTCTAC 
GTcCTTCTAC 
GTcCTTCTAC 
GTcCTTCTAC 
GTcCTTCTAC 
GTaCTTCTAC 



TAAGTTAACT 
TAAGTTAACT 
TAAGTTAACT 
TAAGTTAACT 
TAAGTTAACT 
TAAGTTAACT 
TAAGTTAACT 
TAAGTTAACT 
TAAGTTAACT 
TAAGTTAACT 
TAAGTTAACT 



250 

GAAGAGACtT 
GAAGAGACtT 
GAAGAGACtT 
GAAGAGACtT 
GAAGAGACtT 
GAAGAGACaT 
GAAGAGACaT 
GAAGAGACaT 
GAAGAGACaT 
GAAGAGACaT 
GAAGAGACaT 



maa71927.2{l73_18RS21 
maa71927 . 2 { 173_2603 
msa71927.2{l73_A909 
msa71927 .2{l73_090 
msa71927.2{l73_CJB110 
msa7 1927.2(173 COHl' 
msa71927 . 2 (173~M781 
msa71927. 2(173 M732 
msa71927 . 2 { 173~H36B 
msa7 1927 . 2 { 173_JM9130013 
msa71927 . 2 { 173_1169NT 
Consensus 



251 

ACAAACAAAA 
ACAAACAAAA 

ACAAACAAAA 
ACAAACAAAA 
ACAAACAAAA 
ACAAACAAAA 
ACAAACAAAA 
ACAAACAAAA 
ACAAACAAAA 
ACAAACAAAA 



AGATGGTcAA 
AGATGGTcAA 
AGATGGTcAA 
AGATGGTaAA 
AGATGGTaAA 
AGATGGTcAA 
AGATGGTCAA 
AGATGGTcAA 
AGATGGTcAA 
AGATGGTcAA 
AGATGGTCAA 



GAtTTAGCCA 
GAtTTAGCCA 
GAtTTAGCCA 
GAtTTAGCCA 
GAtTTAGCCA 
GAtTTAGCCA 
GAtTTAGCCA 
GAtTTAGCCA 
GAtTTAGCCA 
GAgTTAGCCA 
GAtTTAGCCA 



ACATGGTGAG 
ACATGGTGAG 
ACATGGTGAG 
ACATGGTGAG 
ACATGGTGAG 
ACATGGTGAG 
ACATGGTGAG 
ACATGGTGAG 
ACATGGTGAG 
ACATGGTGAG 
ACATGGTGAG 



300 

AAGTGGTCAA 
AAGTGGTCAA 
AAGTGGTCAA 
AAGTGGTCAA 
AAGTGGTCAA 
AAGTGGTCAA 
AAGTGGTCAA 
AAGTGGTCAA 
AAGTGGTCAA 
AAGTGGTCAA 
AAGTGGTCAA 



msa71927 . 2 { 173_JL8RS21 
msa71927 . 2 ( 173_2603 
msa71927 . 2 { 173_A909 
msa71927.2{l73_090 
msa71927 . 2 { 173 JCJB110 
msa7 192 7 . 2 ( 173_COHl 
rasa71927.2(173_M781 
msa71927 . 2 (173_M732 
msa7 1927 . 2 { 173_H3 6B 
msa71927.2{l73_JM9130013 
msa71927 . 2 { 173J1169NT 
Consensus 



301 

GTTACTAGTG 
GTTACTAGTG 
GTTACTAGTG 
GTTACTAGTG 
GTTACTAGTG 
GTTACTAGTG 
GTTACTAGTG 
GTTACTAGTG 
GTTACTAGTG 
GTTACTAGTG 
GTTACTAGTG 



AGGAACTCGT 
AGGAACTCGT 
AGGAACTCGT 
AGGAACTCGT 
AGGAACTCGT 
AGGAACTCGT 
AGGAACTCGT 
AGGAACTCGT 
AGGAACTCGT 
AGGAACTCGT 
AGGAACTCGT 



tAATATGGCA 
tAATATGGCA 
tAATATGGCA 
tAATATGGCA 
tAATATGGCA 
CAATATGGCA 
cAATATGGCA 
CAATATGGCA 
CAATATGGCA 
cAATATGGCA 
cAATATGGCA 



TACGATATTA 
TACGATATTA 
TACGATATTA 
TACGATATTA 
TACGATATTA 
TACGATATTA 
TACGATATTA 
TACGATATTA 
TACGATATTA 
TACGATATTA 
TACGATATTA 



350 

TtGCTAAAGA 
TtGCTAAAGA 
TtGCTAAAGA 
TtGCTAAAGA 
TtGCTAAAGA 
TcGCTAAAGA 
TcGCTAAAGA 
TcGCTAAAGA 
TtGCTAAAGA 
TtGCTAAAGA 
TtGCTAAAGA 



msa71927 . 2 { 173_18RS21 
maa71927.2fl73_2603 
msa71927 . 2 { 173_A909 
msa71927.2{l73_090 
msa71927 . 2 { 173_CJB110 
rasa7 1 927 . 2 { 17 3_COHl 
msa71927. 2(173 M781 
msa71927 . 2 { 173^M732 
msa7 1 927 . 2 { 173_H3 6B 
msa71927.2{l73_JM9130013 
msa71927 . 2 { 173_1169NT 
Consensus 



351 

AAACCCaTCT 
AAACCCaTCT 
AAACCCaTCT 
AAACCCaTCT 
AAACCCaTCT 
AAACCCaTCT 
AAACCCaTCT 
AAACCCaTCT 
AAACCCaTCT 
AAACCCaTCT 
AAACCCtTCT 



TTAAATGCAG 
TTAAATGCAG 
TTAAATGCAG 
TTAAATGCAG 
TTAAATGCAG 
TTAAATGCAG 
TTAAATGCAG 
TTAAATGCAG 
TTAAATGCAG 
TTAAATGCAG 
TTAAATGCAG 



TCATTACTAC 
TCATTACTAC 
TCATTACTAC 
TCATTACTAC 
TCATTACTAC 
TCATTACTAC 
TCATTACTAC 
TCATTACTAC 
TCATTACTAC 
TCATTACTAC 
TCATTACTAC 



TAGACGCCAA 
TAGACGCCAA 
TAGACGCCAA 
TAGACGCCAA 
TAGACGCCAA 
TAGACGCCAA 
TAGACGCCAA 
TAGACGCCAA 
TAGACGCCAA 
TAGACGCCAA 
TAGACGCCAA 



400 

GAAGCtATTG 
GAAGCtATTG 
GAAGCtATTG 
GAAGCtATTG 
GAAGCtATTG 
GAAGCcATTG 
GAAGCcATTG 
GAAGCcATTG 
GAAGCtATTG 
GAAGCtATTG 
GAAGCCATTG 



msa71927 . 2 { 173_18RS21 
rasa71927 . 2 { 173_2603 
msa71927.2{173_A909 
msa71927.2{l73 090 
rasa71927 . 2 { 173_CJB110 
msa71927.2{l73 COHl 
msa7 192 7 . 2 ( 173~M7 8 1 
maa7 1927 . 2 (173 JM732 
msa7 1 927 . 2 { 173_H3 6B 
msa71927.-2{l73_0M9130013 
msa71927 . 2 { 173_1169NT 
Consensus 



401 

AAGAGGCTAG 
AAGAGGCTAG 
AAGAGGCTAG 
AAGAGGCTAG 
AAGAGGCTAG 
AAGAGGCTAG 
AAGAGGCTAG 
AAGAGGCTAG 
AAGAGGCTAG 
AAGAGGCTAG 
AAGAGGCTAG 



AAAACTTAAA 
AAAACTTAAA 
AAAACTTAAA 
AAAACTTAAA 
AAAACTTAAA 
AAAACTTAAA 
AAAACTTAAA 
AAAACTTAAA 
AAAACTTAAA 
AAAACTTAAA 
AAAACTTAAA 



GATACcAATC 
GATACcAATC 
GATACcAATC 
GATACcAATC 
GATACCAATC 
GATACtAATC 
GATACtAATC 
GATACtAATC 
GATACcAATC 
GATACCAATC 
GATACtAATC 



AGCCgTTTTT 
AGCCgTTTTT 
AGCCgTTTTT 
AGCCgTTTTT 
AGCCgTTTTT 
AGCCgTTTTT 
AGCCgTTTTT 
AGCCgTTTTT 
AGCCgTTTTT 
AGCCgTTTTT 
AGCCaTTTTT 



450 

AGGTGTTCCC 
AGGTGTTCCC 
AGGTGTTCCC 
AGGTGTTCCC 
AGGTGTTCCC 
AGGTGTTCCC 
AGGTGTTCCC 
AGGTGTTCCC 
AGGTGTTCCC 
AGGTGTTCCC 
AGGTGTTCCC 



msa71927 . 2 { 173_18RS21 
maa71927.2fl73_2603 
maa7 1927 . 2 { 173_A9 09 
msa71927.*2{l73J>90 

msa71927 . 2 { 173_CJB110 
maa7 1927 . 2 { 173 JOOHI 
msa71927 . 2 { 173_M781 



451 

TTGTTAGTCA 
TTGTTAGTCA 
TTGTTAGTCA 
TTGTTAGTCA 
TTGTTAGTCA 
TTGTTAGTCA 
TTGTTAGTCA 



AGGGGTTAGG 
AGGGGTTAGG 
AGGGGTTAGG 
AGGGGTTAGG 
AGGGGTTAGG 
AGGGGTTAGG 
AGGGGTTAGG 



GCACAGTATT 
GCACAGTATT 
GCACAGTATT 
GCACAGTATT 
GCACAGTATT 
GCACAGTATT 
GCACAGTATT 



AAAGGTGGTG 
AAAGGTGGTG 
AAAGGTGGTG 
AAAGGTGGTG 
AAAGGTGGTG 
AAAGGTGGTG 
AAAGGTGGTG 



500 

AAACCAATAA 
AAACCAATAA 
AAACCAATAA 
AAACCAATAA 
AAACCAATAA 
AAACCAATAA 
AAACCAATAA 



820 
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Table 48: Comparative Sequences relating to SAG1474 



msa71927 . 2 f 173_M732 J 
msa71927.2{173 H36B) 
mea71927 . 2 { 173_JM9130013 } 
msa71927 . 2 {l73_1169NT} 
Consensus 



TTGTTAGTCA AGGGGTTAGG GCACAGTATT AAAGGTGGTG AAACCAATAA 
TTGTTAGTCA AGGGGTTAGG GCACAGTATT AAAGGTGGTG AAACCAATAA 
TTGTTAGTCA AGGGGTTAGG GCACAGTATT AAAGGTGGTG AAACCAATAA 
TTGTTAGTCA AGGGGTTAGG GCACAGTATT AAAGGTGGTG AAACCAATAA 



msa71927 . 2 {l73_18RS21 
msa7 1927.21 17 3 2603 
msa71927 . 2 {173*"A909 
msa7 1927 . 2 { 173_090 
msa71927 . 2 { 173_CJB110 
msa7 1927 . 2 ( 173_COHl 
msa71927.2|l73_M781 
rosa71927 . 2 f 173_M7*32 
msa71927 . 2 { 173_H36B 
msa71927 . 2 { 173_JM9130013 
msa71927 . 2 { 173_1169NT 
Consensus 



501 

TGGCTTGATC 
TGGCTTGATC 
TGGCTTGATC 
TGGCTTGATC 
TGGCTTGATC 
TGGCTTGATC 
TGGCTTGATC 
TGGCTTGATC 
TGGCTTGATC 
TGGCTTGATC 
TGGCTTGATC 



TATGCAGaTG 
TATGCAGaTG 
TATGCAGaTG 
TATGCAGaTG 
TATGCAGaTG 
TATGCAGaTG 
TATGCAGaTG 
TATGCAGaTG 
TATGCAGgTG 
TATGCAGgTG 
TATGCAGaTG 



GAAAAATTAG 
GAAAAATTAG 
GAAAAATTAG 
GAAAAATTAG 
GAAAAATTAG 
GAAAAATTAG 
GAAAAATTAG 
GAAAAATTAG 
GAAAAATTAG 
GAAAAATTAG 
GAAAAATTAG 



CACATTTGAC 
CACATTTGAC 
CACATTTGAC 
CACATTTGAC 
CACATTTGAC 
CACATTTGAC 
CACATTTGAC 
CACATTTGAC 
CACATTTGAC 
CACATTTGAC 
CACATTTGAC 



550 

AGTAGCTATG 
AGTAGCTATG 
AGTAGCTATG 
AGTAGCTATG 
AGTAGCTATG 
AGTAGCTATG 
AGTAGCTATG 
AGTAGCTATG 
AGTAGCTATG 
AGTAGCTATG 
AGTAGCTATG 



msa71927.2{l73_18RS21 
tnsa71927 . 2 { 173_2603 
rafla71927.2{173_A909 
msa71927 . 2{ 173_090 
msa71927 .2{173_CJB110 
msa7 192 7 . 2 f 17 3_COHl 
msa71927.2 173 M781 
msa7 1927 . 2 1 173~M7 32 
rasa7 1 92 7 . 2 { 173_H3 6B ' 
msa71927 . 2 {173_JM9130013 ' 
msa71927 . 2 {l73_1169NT' 
Consensus 



551 

TCAAAAAATA 
TCAAAAAATA 
• TCAAAAAATA 
TCAAAAAATA 
TCAAAAAATA 
TCAAAAAATA 
TCAAAAAATA 
TCAAAAAATA 
TCAAAAAATA 
TCAAAAAATA 
TCAAAAAATA 



TAAAGATTTA 
TAAAGATTTA 
TAAAGATTTA 
TAAAGATTTA 
TAAAGATTTA 
TAAAGATTTA 
TAAAGATTTA 
TAAAGATTTA 
TAAAGATTTA 
TAAAGATTTA 
TAAAGATTTA 



GGATTTATTA 
GGATTTATTA 
GGATTTATTA 
GGATTTATTA 
GGATTTATTA 
GGATTTATTA 
GGATTTATTA 
GGATTTATTA 
GGATTTATTA 
GGATTTATTA 
GGATTTATTA 



TTTTAGGACA 
TTTTA GGACA 
TTTTAGGACA 
TTTTAGGACA 
TTTTAGGACA 
TTTTAGGACA 
TTTTAGGACA 
TTTTA GGACA 
TTTTA GGACA 
TTTTAGGACA 
TTTTAGGACA 



600 

AACGAAcTTT 
AACGAAcTTT 
AACGAACTTT 
AACGAAcTTT 
AACGAAcTTT 
AACGAAtTTT 
AACGAAtTTT 
AACGAAtTTT 
AACGAAcTTT 
AACGAACTTT 
AACGAAcTTT 



msa71927 . 2 { 173JL8RS21 
msa71927 .2 { 173_2603 
msa71927 . 2 { 173_A909 
msa71927 . 2 { 173_090 
msa71927 . 2 { 173_CJB1 10 
msa71927 . 2 { 173_COHl 
msa7 1 92 7 . 2 f 173_M7 8 1 
msa71927 . 2 f 173_M732 
msa71927 .2{173_H36B 
rasa71927 . 2 { 173_JM9130013 
rosa71927 . 2 { 173_1169NT 
Consensus 



601 

CCAGAGTATG 
CCAGAGTATG 
CCAGAGTATG 
CCAGAGTATG 
CCAGAGTATG 
CCAGAGTATG 
CCAGAGTATG 
CCAGAGTATG 
CCAGAGTATG 
CCAGAGTATG 
CCAGAGTATG 



GgTGGCGtAA 
GgTGGCGtAA 
GgTGGCGtAA 
GgTGGCGtAA 
GgTGGCGtAA 
GgTGGCGtAA 
GgTGGCGtAA 
GgTGGCGtAA 
GaTGGCGcAA 
GaTGGCGcAA 
GgTGGCGtAA 



TATAACAGAt 
TATAACAGAt 
TATAACAGAt 
TATAACAGAt 
TATAACAGAt 
TATAACAGAc 
TATAACAGAc 
TATAACAGAc 
TATAACAGAt 
TATAACAGAt 
TATAACAGAt 



TCTAAATTAT 
TCTAAATTAT 
TCTAAATTAT 
TCTAAATTAT 
TCTAAATTAT 
TCTAAATTAT 
TCTAAATTAT 
TCTAAATTAT 
TCTAAATTAT 
TCTAAATTAT 
TCTAAATTAT 



650 

ACGGTCtAAC 
ACGGTCtAAC 
ACGGTCtAAC 
ACGGTCtAAC 
ACGGTCtAAC 
ACGGTCcAAC 
ACGGTCcAAC 
ACGGTCnAAC 
ACGGTCcAAC 
ACGGTCcAAC 
ACGGTCcAAC 



msa71927.2{l73_18RS21 
• msa71927.2fl73 2603 
msa7 1 92 7 . 2 { 173~A90 9 
n»sa71927.2{l73_090 
msa71927 . 2 {173_CJB110 
msa71927 . 2 { 173_COHl 
msa71927.2{l73 M781 
msa71927 . 2 il73~M732 
rasa71927 .2(173_B36B 
rosa71927 . 2 {173_JM9130013 
msa71927 . 2 { 173_1169NT 
Consensus 



651 

GCATAAtCCT 
GCATAAtCCT 
GCATAAtCCT 
GCATAAtCCT 
GCATAAtCCT 
GCATAAtCCT 
GCATAAtCCT 
GCATAAtCCT 
GCATAAcCCT 
GCATAAcCCT 
GCATAAcCCT 



tGGgATCTTG 
tGGgATCTTG 
tGGgATCTTG 
tGGgATCTTG 
tGGgATCTTG 
tGGaATCTTG 
tGGaATCTTG 
tGGgATCTTG 
tGGaATCTTG 
tGGaATCTTG 
cGGaATCTTG 



CTCATAAtGC 
CTCATAAtGC 
CTCATAAtGC 
CTCATAAtGC 
CTCATAAtGC 
CTCATAAcGC 
CTCATAAcGC 
CTCATAAcGC 
CTCATAAtGC 
CTCATAAtGC 
CTCATAAtGC 



TGGTGGCTCT 
TGGTGGCTCT 
TGGTGGCTCT 
TGGTGGCTCT 
TGGTGGCTCT 

TGGTGGCTCT 
TGGTGGCTCT 
TGGTGGCTCT 
TGGTGGCTCT 
TGGTGGCTCT 



700 

TCTGGTGGAA 
TCTGGTGGAA 
TCTGGTGGAA 
TCTGGTGGAA 
TCTGGTGGAA 
TCTGGTGGAA 
TCTGGTGGAA 
TCTGGTGGAA 
TCTGGTGGAA 
TCTGGTGGAA 
TCTGGTGGAA 



msa71927 . 2 { 173_18RS21 
msa71927 . 2 { 173_2603 
msa71927.2{l73 A909 
msa71927 . 2 { 173_090 
msa71927 . 2 { 173_CJB110 
msa71927 . 2 ( 173_COHl 
msa71927 ,2{l73_M781 
msa71927 . 2 { 173_M732 
msa7 1927 . 2 { 173__H36B 
msa71927 . 2 { 173_JM9130013 
msa71927 . 2 { 173_1169NT 
Consensus 



701 

GTGCAGCAGc 
GTGCAGCAGc 
GTGCAGCAGc 
GTGCAGCAGc 
GTGCAGCAGC 
GTGCAGCAGc 
GTGCAGCAGc 
GTGCAGCAGc 
GTGCAGCAGt 
GTGCAGCAGt 
GTGCAGCAGc 



CATTGCTAGC 
cATTGCTAGC 
CATTGCTAGC 
CATTGCTAGC 
CATTGCTAGC 
tATTGCTAGC 
tATTGCTAGC 
tATTGCTAGC 
tATTGCTAGC 
tATTGCTAGC 
CATTGCTAGC 



GGaATGACGC 
GGaATGACGC 
GGaATGACGC 
GGaATGACGC 
GGaATGACGC 
GGaATGACGC 
GGaATGACGC 
GGaATGACGC 
GGgATGACGC 
GGgATGACGC 
GGrATGACGC 



CAATTGCTAG 
CAATTGCTAG 
CAATTGCTAG 
CAATTGCTAG 
CAATTGCTAG 
CAATTGCTAG 
CAATTGCTAG 
CAATTGCTAG 
CAATTGCTAG 
CAATTGCTAG 
CAATTGCTAG 



750 

CGGtAGTGAT 
CGGtAGTGAT 
CGGtAGTGAT 
CGGtAGTGAT 
CGGtAGTGAT 
CGGcAGTGAT 
CGGcAGTGAT 
CGGcAGTGAT 
CGGtAGTGAT 
CGGtAGTGAT 
CGGtAGTGAT 



tnsa71927.2{l73 18RS21 
msa71927.2{l73 2603 
msa71927.2(173lA909 
rasa71927 . 2 { 173_090 

msa71927 . 2{173_CJB110 
tnsa71927.2{!73 COH1 



751 

GCTGGTGGTT 
GCTGGTGGTT 
GCTGGTGGTT 
GCTGGTGGTT 
GCTGGTGGTT 
GCTGGTGGTT 



CTATCCGTAT 
CTATCCGTAT 
CTATCCGTAT 
CTATCCGTAT 
CTATCCGTAT 
CTATCCGTAT 



TCCATCTTCT 
TCCATCTTCT 
TCCATCTTCT 
TCCATCTTCT 
TCCATCTTCT 
TCCATCTTCT 



TGGACGGGCT 
TGGACGGGCT 
TGGACGGGCT 
TGGACGGGCT 
TGGACGGGCT 
TGGACGGGCT 



800 

TgGTAGGTTT 
TgGTAGGTTT 
TgGTAGGTTT 
TgGTAGGTTT 
TgGTAGGTTT 
TaGTAGGTTT 



821 



WO 2004/018646 



PCT/US2003/026827 



Table 48: Comparative Sequences relating to SAG1474 



msa7 192 7. 2 (173_M781 
msa71927 . 2 { 173_M732 
msa71927.2{173 H36B 
msa71927 . 2 { 173_JM9130013 
msa71927 . 2 {173_1169NT \ 
Consensus 



GCTGGTGGTT CTATCCGTAT TCCATCTTCT TGGACGGGCT TaGTAGGTTT 
GCTGGTGGTT CTATCCGTAT TCCATCTTCT TGGACGGGCT TaGTAG GTTT 
GCTGGTGGTT CTATCCGTAT TCCAT CTT CT TGGACGGGCT TgGTAGGTJTT 
GCTGGTGGTT CTATCCGTAT TCCAT CTT CT TGGACGGGCT TgGTAGGTTT 
GCTGGTGGTT CTATCCGTAT TCCATCTTCT TGGACGGGCT TgGTAGGTTT 



msa71927.2{l73 18RS21 
msa71927.2{l73 2603 
msa71927.2(173~A909 
msa7 1927 . 2 { 17 3_090 
msa71927.2{l73 CJB110 
ma a7 1927 . 2 f 173_COHl 
msa71927 .2 173_M781 
msa7 192 7.2' 173_M732 
msa71927 . 2 (173_H36B 
msa71927.2{l73 JM9130013 
msa71927.2{l73_1169NT 
Consensus 



801 

AAAACCAACA 
AAAACCAACA 
AAAACCAACA 
AAAACCAACA 
AAAACCAACA 
AAAACCAACA 
AAAACCAACA 
AAAACCAACA 
AAAACCAACA 
AAAACCAACA 
AAAACCAACA 



AGAGGATTGG 
AGAGGATTGG 
AGAGGATTGG 
AGAGGATTGG 
AGAGGATTGG 
AGAGGATTGG 
AGAGGATTGG 
AGAGGATTGG 
AGAGGATTGG 
AGAGGATTGG 
AGAGGATTGG 



TGAGTaATGA 
TGAGTaATGA 
TGAGTaATGA 
TGAGTaATGA 
TGAGTCATGA 
TGAGTaATGA 
TGAGTaATGA 
TGAGTaATGA 
TGAGTaATGA 
TGAGTaATGA 
TGAGTaATGA 



AAAGCCAGAT 
AAAGCCAGAT 
AAAGCCAGAT 
AAAGCCAGAT 
AAAGCCAGAT 
AAAGCCAGAT 
AAAGCCAGAT 
AAAGCCAGAT 
AAAGCCAGAT 
AAAGCCAGAT 
AAAGCCAGAT 



850 

TCGTATAGTA 
TCGTATAGTA 
TCGTATAGTA 
TCGTATAGTA 
TCGTATAGTA 
TCGTATAGTA 
TCGTATAGTA 
TCGTATAGTA 
TCGTATAGTA 
TCGTATAGTA 
TCGTATAGTA 



msa71927 . 2 { 173_18RS21 
rasa71927.2{l73_2603 
msa71927 . 2 { 173_A909 
msa71927 . 2 (173_090 
jnsa71927 . 2 { 173_CJB110 
msa71927.2(l73 COHl' 
mBa71927.2{173~M781 
msa71927 .21 173_M732 
insa71927 . 2 { 173_H36B 
msa71927.2{l73_JM9130013 
msa71927 . 2 { 173_1169NT 
Consensus 



851 

CAGCAGTTCA 
CAGCAGTTCA 
CAGCAGTTCA 
CAGCAGTTCA 
CAGCAGTTCA 
CAGCAGTTCA 
CAGCAGTTCA 
CAGCAGTTCA 
CAGCAGTTCA 
CAGCAGTTCA 
CAGCAGTTCA 



TTTTCCATTA 
TTTTCCATTA 
TTTTCCATTA 
TTTTCCATTA 
TTTTCCATTA 
TTTTCCATTA 
TTTTCCATTA 
TTTTCCATTA 
TTTTCCATTA 
TTTTCCATTA 
TTTTCCATTA 



ACTAAGTCAT 
ACTAAGTCAT 
ACTAAGTCAT 
ACTAAGTCAT 
ACTAAGTCAT 
ACTAAGTCAT 
ACTAAGTCAT 
ACTAAGTCAT 
ACTAAGTCAT 
ACTAAGTCAT 
ACTAAGTCAT 



CTAGAGACGC 
CTAGAGACGC 
CTAGAGACGC 
CTAGAGACGC 
CTAGAGACGC 
CTAGAGACGC 
CTAGAGACGC 
CTAGAGACGC 
CTAGAGACGC 
CTAGAGACGC 
CTAGAGACGC 



900 

AGAAACATTa 
AGAAACATTa 
AGAAACATTa 
AGAAACATTa 
AGAAACATTa 
AGAAACATTg 
AGAAACATTg 
AGAAACATTg 
AGAAACATTa 
AGAAACATTa 
AGAAACATTa 



rasa71927.2{l73_lBRS21 
rasa71927.2{173_2603^ 
rosa71927 . 2 {l73_A909 
rasa71927 . 2 { 173_090 
insa71927 . 2{l73_CJB110 
msa7 1 9 2 7 . 2 { 173_C0H1 
tnsa71927. 2(173 M7B1 
msa7 1927 . 2 { 173~M732 
msa7 192 7 . 2 { 173JK36B 
msa71927.2{l73_JM9130013 
tnsa71927 . 2 { 173_1169NT 
Consensus 



901 

TTAACTTAtC 
TTAACTTAtC 
TTAACTTAtC 
TTAACTTAtC 
TTAACTTAtC 
TTAACTTAcC 
TTAACTTAcC 
TTAACTTAcC 
TTAACTTAtC 
TTAACTTAtC 
TTAACTTAtC 



TAAAGAAAAG 
TAAAGAAAAG 
TAAAGAAAAG 
TAAAGAAAAG 
TAAAGAAAAG 
TAAAGAAAAG 
TAAAGAAAAG 
TAAAGAAAAG 
TAAAGAAAAG 
TAAAGAAAAG 
TAAAGAAAAG 



CGATCAAACG 
CGATCAAACG 
CGATCAAACG 
CGATCAAACG 
CGATCAAACG 
CGATCAAACG 
CGATCAAACG 
CGATCAAACG 
CGATCAAACG 
CGATCAAACG 
CGATCAAACG 



CTAGTATCAG 
CTAGTATCAG 
CTAGTATCAG 
CTAGTATCAG 
CTAGTATCAG 
CTAGTATCAG 
CTAGTATCAG 
CTAGTATCAG 
CTAGTATCAG 
CTAGTATCAG 
CTAGTATCAG 



950 

TTAATGATTT 
TTAATGATTT 
TTAATGATTT 
TTAATGATTT 
TTAATGATTT 
TTAATGATTT 
TTAATGATTT 
TTAATGATTT 
TTAATGATTT 
TTAATGATTT 
TTAATGATTT 



msa71927 . 2 { 173_18RS21 ] 
msa71927.2{l73_2603 
msa71927.2{173_A909 
msa71927 . 2 { 173_090^ 
msa71927 . 2 { 173 JCJB110 
mfl a7 1 92 7 . 2 { 173_COHl 
msa71927.2i 173_M781 
msa71927.2 173 M732 
rasa71927.2{173~H36B 
msa71927 . 2 { 173_JM9130013 
msa71927 . 2 { 173_1169NT 
Consensus 



951 

AAAATCTTTA 
AAAATCTTTA 
AAAATCTTTA 
AAAATCTTTA 
AAAATCTTTA 
AAAATCTTTA 
AAAATCTTTA 
AAAATCTTTA 
AAAATCTTTA 
AAAATCTTTA 
AAAATCTTTA 



CCAATTGCTT 
CCAATTGCTT 
CCAATTGCTT 
CCAATTG CTT 
CCAATTGCTT 
CCAATTGCTT 
CCAATTGCTT 
CCAATTGCTT 
CCAATTGCTT 
CCAATTGCTT 
CCAATTGCTT 



ATACTTTGAA 
ATACTTTGAA 
ATACTTTGAA 
ATACTTTGAA 
ATACTTTGAA 
ATACTTTGAA 
ATACTTTGAA 
ATACTTTGAA 
ATACTTTGAA 
ATACTTTGAA 
ATACTTTGAA 



ATCACCAATG 
ATCACCAATG 
ATCACCAATG 
ATCACCAATG 
ATCACCAATG 
ATCACCAATG 
ATCACCAATG 
ATCACCAATG 
ATCACCAATG 
ATCACCAATG 
ATCACCAATG 



1000 
GGAACAGAAG 
GGAACAGAAG 
GGAACAGAAG 
GGAACAGAAG 
GGAACAGAAG 
GGAACAGAAG 
GGAACAGAAG 
GGAACAGAAG 
GGAACAGAAG 
GGAACAGAAG 
GGAACAGAAG 



msa71927.2{l73_18RS2i; 
msa7 1927 . 2 ( 173_2603 
msa71927 . 2 { 173_A909 
tnsa71927 . 2 { 173_090 
msa71927 . 2 { 173_CJB110 J 
msa7 1 92 7 . 2 { 1 7 3_COHl 
raaa71927 .2 173_K781 
msa71927 . 2 ' 173_M732 
tnsa71927 .2{173_H36B 
msa71927 . 2 { 173_JM9130013 
msa71927 . 2 { 173_1169NT' 
Consensus 



1001 

TTAGTCAAGA 
TTAGTCAAGA 
TTAGTCAAGA 
TTAGTCAAGA 
TTAGTCAAGA 
TTAGTCAAGA 
TTAGTCAAGA 
TTAGTCAAGA 
TTAGTCAAGA 
TTAGTCAAGA 
TTAGTCAAGA 



TGCTAAAAAc 
TGCTAAAAAc 
TGCTAAAAAc 
TGCTAAAAAC 
TGCTAAAAAC 
TGCTAAAAAt 
TGCTAAAAAt 
TGCTAAAAAt 
TGCTAAAAAt 
TGCTAAAAAt 
TGCTAAAAAc 



GCTATTATGG 
GCTATTATGG 
GCTATTATGG 
GCTATTATGG 
GCTATTATGG 
GCTATTATGG 
GCTATTATGG 
GCTATTATGG 
GCTATTATGG 
GCTATTATGG 
GCTATTATGG 



ACAACGTCAc 
ACAACGTCAc 
ACAACGTCAC 
ACAACGTCAc 
ACAACGTCAc 
ACAACGTCAC 
ACAACGTCAC 
ACAACGTCAC 
ACAACGTCAt 
ACAACGTCAt 
ACAACGTCAc 



1050 
ATTCTTAAGA 
ATTCTTAAGA 
ATTCTTAAGA 
ATTCTTA AGA 
ATTCTTAAGA 
ATTCTTAAGA 
ATTCTTAAGA 
ATTCTTAAGA 
ATTCTTAAGA 
ATTCTTAAGA 
ATTCTTAAGA 



msa71927 . 2 { 173_18RS21 
msa71927 . 2 ( 173_2603 
msa71927 . 2 (173_A909 
msa71927.2{l73 090 

msa71927.2{!73 CJB110 



1051 

aAACAAGGAT 
aAACAAGGAT 
aAACAAGGAT 
aAACAAGGAT 
aAACAAGGAT 



TCAAAGTaAC AGAGATAGAc TTACCAATTG 
TCAAAGTaAC AGAGATAGAc TTACCAATTG 
TCAAAGTaAC AGAGATAGAc TTACCAATTG 
TCAAAGTaAC AGAGATAGAc TTACCAATTG 
TCAAAGTaAC AGAGATAGAc TTACCAATTG 



1100 
ATGGTAGAGC 
ATGGTAGAGC 
ATGGTAGAGC 
ATGGTAGAGC 
ATGGTAGAGC 



822 



WO 2004/018646 



PCT/US2003/026827 



Table 48: Comparative Sequences relating to SAG1474 



rasa71927 . 2 (173_COHl 
msa71927.2 173_M70l' 
msa71927 . 2 {173_M732 ' 
msa7 1 92 7 . 2 { 1 73_H3 6B ' 
tnaa71927.2{L73 JM9130013' 
tnsa71927 . 2 {173_1169NT 
Consensus 



aAACAAGGAT 
gAACAAGGAT 
aAACAAGGAT 
aAACAAGGAT 
aAACAAGGAT 
aAACAAGGAT 



TCAAAGTgAC 
TCAAAGTgAC 
TCAAAGTgAC 
TCAAAGTgAC 
TCAAAGTgAC 
TCAAAGTaAC 



AGAGATAGAt 
AGAGATAGAt 
AGAGATAGAt 
AGAGATAGAc 
AGAGATAGAC 
AGAGATAGAc 



TTACCAATTG 
TTACCAATTG 
TTACCAATTG 
TTACCAATTG 
TTACCAATTG 
TTACCAATTG 



ATGGTAGAGC 
ATGGTAGAGC 
ATGGTAGAGC 
ATGGTAGAGC 
ATGGTAGAGC 
ATGGTAGAGC 



maa71927.2{l73 18RS21 
msa7l927.2{l73_2603 
msa7 1927 . 2 (l73_A909 
msa71927.2{l73 090 
msa7 1927 . 2 { 173 JCJB110 
msa7 1927. 2(17 3_COHl 
msa71927.2 173*~M781 
msa71927 . 2 173~M732 
msa7 1927 . 2 { 173_H3 6B 
msa71927 . 2 { 173_JM9130013 
msa71927 . 2 { 173_1169NT 
Consensus 



1101 

ATTAATGCGT 
ATTAATGCGT 
ATTAATGCGT 
ATTAATGCGT 
ATTAATGCGT 
ATTAATGCGT 
ATTAATGCGT 
ATTAATGCGT 
ATTAATGCGT 
ATTAATGCGT 
ATTAATGCGT 



GATTATTCAA 
GATTATTCAA 
GATTATTCAA 
GATTATTCAA 
GATTATTCAA 
GATTATTCAA 
GATTATTCAA 
GATTATTCAA 
GATTATTCAA 
GATTATTCAA 
GATTATTCAA 



CCTTGGCTAT 
CCTTGGCTAT 
CCTTGGCTAT 
CCTTGGCTAT 
CCTTGGCTAT 
CCTTGGCTAT 
CCTTGGCTAT 
CCTTGGCTAT 
CCTTGGCTAT 
CCTTGGCTAT 
CCTTGGCTAT 



TGGcATGGGA 
TGGcATGGGA 
TGGcATGGGA 
TGGCATGGGA 
TGGcATGGGA 
TGGcATGGGA 
TGGcATGGGA 
TGGcATGGGA 
TGGtATGGGA 
TGGtATGGGA 
TGGcATGGGA 



1150 
GGAGCTTTTT 
GGAGCTTTTT 
GGAGCTTTTT 
GGAGCTTTTT 
GGAGCTTTTT 
GGAGCTTTTT 
GGAGCTTTTT 
GGAGCTTTTT 
GGAGCTTTTT 
GGAGCTTTTT 
GGAGCTTTTT 



msa71927 . 2 { 173_18RS21 
msa7 1927.2(173 2603 
maa71 92 7 . 2 { 173~AS09 
msa71927.2{!73 090 
msa71927 . 2 { 173_CJB110 
msa71927.2(173 COH1 
msa7 1927 . 2 I 173*~M781 
msa71927 . 2 f 1733«732 
msa71927 . 2 {173_H36B 
msa71927.2{l73 JM9130013 
msa71927 . 2 { 173_1169NT 
Consensus 



1151 

CAACAATTGA 
CAACAATTGA 
CAACAATTGA 
CAACAATTGA 
CAACAATTGA 
CAACAATTGA 
CAACAATTGA 
CAACAATTGA 
CAACAATTGA 
CAACAATTGA 
CAACAATTGA 



AAAAGACTTA 
AAAAGACTTA 
AAAAGACTTA 
AAAAGACTTA 
AAAAGACTTA 
AAAAGACTTA 
AAAAGACTTA 
AAAAGACTTA 
AAAAGACTTA 
AAAAGACTTA 
AAAAGACTTA 



AAAAAACATG 
AAAAAACATG 
AAAAAACATG 
AAAAAACATG 
AAAAAACATG 
AAAAAACATG 
AAAAAACATG 
AAAAAACATG 
AAAAAACATG 
AAAAAACATG 
AAAAAACATG 



GTTTTACTAA 
GTTTTACTAA 
GTTTTACTAA 
GTTTTACTAA 
GTTTTACTAA 
GTTTTACTAA 
GTTTTACTAA 
GTTTTACTAA 
GTTTTACTAA 
GTTTTACTAA 
GTTTTACTAA 



1200 
AGAAGACGTT 
AGAAGACGTT 
AGAAGACGTT 
AGAAGACGTT 
AGAAGACGTT 
AGAAGACGTT 
AGAAGACGTT 
AGAAGACGTT 
AGAAGACGTT 
AGAAGACGTT 
AGAAGACGTT 



msa71927 . 2 { 173_18RS21 
rasa71927 . 2 {173_2603 ' 
msa71927 . 2 (173_A909 
msa71927.2(l73 090 
msa71927 . 2 { 173_CJB110 
msa71927.2fl73_C0Hl 
msa71927 .2 {l73_M781 
msa71927 . 2 \ 173_M732 
msa7 1 9 2 7 . 2 { 1 7 3_H3 6B 
msa71927 . 2 { 173_JM9130013 
msa71927.2{l73_1169NT 
Consensus 



1201 

GATCCtATTA 
GATCCtATTA 
GATCCtATTA 
GATCCtATTA 
GATCCtATTA 
GATCCcATTA 
GATCCcATTA 
GATCCcATTA 
GATCCcATTA 
GATCCCATTA 
GATCCtATTA 



CTTGGGcAGT 
CTTGGGcAGT 
CTTGGGcAGT 
CTTGGGcAGT 
CTTGGGcAGT 
CTTGGGCAGT 
CTTGGGcAGT 
CTTGGGcAGT 
CTTGGGcAGT 
CTTGGGgAGT 
CTTGGGcAGT 



TCATGTTATT 
TCATGTTATT 
TCATGTTATT 
TCATGTTATT 
TCATGTTATT 
TCATGTTATT 
TCATGTTATT 
TCATGTTATT 
TCATGTTATT 
TCATGTTATT 
TCATGTTATT 



TATCAAAATT 
TATCAAAATT 
TATCAAAATT 
TATCAAAATT 
TATCAAAATT 
TATCAAAATT 
-TATCAAAATT 
TATCAAAATT 
TATCAAAATT 
TATCAAAATT 
TATCAAAATT 



1250 
CAGATAAGGC 
CAGATAAGGC 
CAGATAAGGC 
CAGATAAGGC 
CAGATAAGGC 
CAGATAAGGC 
CAGATAAGGC 
CAGATAAGGC 
CAGATAAGGC 
CAGATAAGGC 
CAGATAAGGC 



msa71927 . 2 { 173_18RS21 
msa7 1927 . 2 { 173_2603 
. msa71927.2{l73 A909 
msa71927 . 2{l73_090 
msa71927 . 2 { 173_CJB110 
cnsa71927 . 2 ( 173_C0H1 
msa71927 . 2 173_M781 
rasa71927.2 173_M732 
msa71927 . 2 { 173_H3 SB 
msa71927 . 2 { 173_JM9130013 
msa71927 . 2 { 173_1169NT 
Consensus 



1251 

TGAACTTAAG 
TGAACTTAAG 
TGAACTTAAG 
TGAACTTAAG 
TGAACTTAAG 
TGAACTTAAG 
TGAACTTAAG 
TGAACTTAAG 
TGAACTTAAG 
TGAACTTAAG 
TGAACTTAAG 



AAATCTATTa 
AAATCTATTa 
AAATCTATTa 
AAATCTATTa 
AAATCTATTa 
AAATCTATTg 
AAATCTATTg 
AAATCTATTg 
AAATCTATTa 
AAATCTATTa 
AAATCTATTa 



TGGAAGCCCA 
TGGAAGCCCA 
TGGAAGCCCA 
TGGAAGCCCA 
TGGAAGCCCA 
TGGAAGCCCA 
TGGAAGCCCA 
TGGAAGCCCA 
TGGAAGCCCA 
TGGAAGCCCA 
TGGAAGCCCA 



AAAACATATG 
AAAACATATG 
AAAACATATG 
AAAACATATG 
AAAACATATG 
AAAACATATG 
AAAACATATG 
AAAACATATG 
AAAACATATG 
AAAACATATG 
AAAACATATG 



1300, 
GATGATTATC 
GATGATTATC 
GATGATTATC 
GATGATTATC. 
GATGATTATC 
GATGATTATC 
GATGATTATC 
GATGATTATC 
GATGATTATC 
GATGATTATC 
GATGATTATC 



msa7 1927 . 2 { 173_18RS21 ' 
ntfla71927 . 2 (173_2603 
msa71927 . 2 {173_A909 
msa71927.2{l73 090 
msa71927 . 2{ 173_CJB110 
msa71927.2{l73 C0H1 
raea71927 . 2 (173^781 
maa71927 . 2(173_H732 
msa71927.2{173 H36B 
msa71927.2{l73 JM9130013 
msa71927 . 2 { 1 73JU69NT 
Consensus 



1301 

.GTAAGGCAAT 
GTAAGGCAAT 
GTAAGGCAAT 
GTAAGGCAAT 
GTAAGGCAAT 
GTAAGGCAAT 
GTAAGGCAAT 
GTAAGGCAAT 
GTAAGGCAAT 
GTAAGGCAAT 
GTAAGGCAAT 



GGAGAAGCTT 
GGAGAAGCTT 
GGAGAAGCTT 
GGAGAAGCTT 
GGAGAAGCTT 
GGAGAAGCTT 
GGAGAAGCTT 
GGAGAAGCTT 
GGAGAAGCTT 
GGAGAAGCTT 
GGAGAAGCTT 



CACAAGCAAT 
CACAAGCAAT 
CACAAGCAAT 
CACAAGCAAT 
CACAAGCAAT 
CACAAGCAAT 
CACAAGCAAT 
CACAAGCAAT 
CACAAGCAAT 
CACAAGCAAT 
CACAAGCAAT 



TTCCTATTTT 
TTCCTATTTT 
TTCCTATTTT 
TTCCTATTTT 
TTCCTATTTT 
TTCCTATTTT 
TTCCTATTTT 
TTCCTATTTT 
TTCCTATTTT 
TTCCTATTTT 
TTCCTATTTT 



1350 
CTTATCGCCA 
CTTATCGCCA 
CTTATCGCCA 
CTTATCGCCA 
CTTATCGCCA 
CTTATCGCCA 
CTTATCGCCA 
CTTATCGCCA 
CTTATCGCCA 
CTTATCGCCA 
CTTATCGCCA 



msa71927 . 2 { 173 JL8RS21 
msa71927 . 2 { 173_2603 
msa7 1927 . 2 { 173_A909 
msa71927.2{l73_090 



1351 1400 
ACGACCGCAA GTTTAGCCCC TCTAAATACA GATCCATATG TaACAGAGgA 
ACGACOGCAA GTTTAGCCCC TCTAAATACA GATCCATATG TaACAGAGgA 
ACGACCGCAA GTTTAGCCCC TCTAAATACA GATCCATATG 'TaACAGAGgA 
ACGACCGCAA GTTTAGCCCC TCTAAATACA GATCCATATG TaACAGAGgA 



823 



WO 2004/018646 



PCT/US2003/026827 



Table 48: Comparative Sequences relating to SAG1474 



msa71927 . 2 { 173_CJB110 
msa71927 . 2 [ 173_COHl 
msa71927. 2(173 M781 
msa71927.2(173~M732 
msa71927 . 2 { 173~H36B 
msa71927.2(l73_JM9130013 
msa71927 . 2 { 173_1169NT 
Consensus 



ACGACCGCAA 
ACGACCGCAA 
ACGACCGCAA 
ACGACCGCAA 
ACGACCGCAA 
ACGACCGCAA 
ACGACCGCAA 



G TTTA GCCCC 
GTTTAGCCCC 
GTTTAGCCCC 
GTTTAGCCCC 
GTTT AGCCCC 
GTTTAGCCCC 
GTTTAGCCCC 



TCTAAATACA 
TCTAAATACA 
TCTAAATACA 
TCTAAATACA 
TCTAAATACA 
TCTAAATACA 
TCTAAATACA 



GATCCATATG 
GATCCATATG 
GATCCATATG 
GATCCATATG 
GATCCATATG 
GATCCATATG 
GATCCATATG 



TaACAGAGgA 
TaACAGAGaA 
TaACAGAGaA 
TtACAGAGaA 
TaACAGAGgA 
TaACAGAGgA 
TaACAGAGgA 



msa71927.2{l73 18RS21] 
msa71927.2(l73 2603 
msa71927 . 2 { 173~A909 
maa71927 .2(173 090 
tnsa71927 . 2 { 173_CJB110 
maa71927.2(l73_COHl] 
msa71927.2(173 M781 
msa7 1927 . 2 ( 173~M732 
insa7 192 7 . 2 { 1732H3 €B 
tnsa71927 . 2 { 173_JM9130013 
msa71927.2(l73_1169NT] 
Consensus 



1401 

AGATAAAAGA 
AGATAAAAGA 
AGATAAAAGA 
AGATAAAAGA 
AGATAAAAGA 
AGATAAAAGA 
AGATAAAAGA 
AGATAAAAGA 
AGATAAAAGA 
AGATAAAAGA 
AGATAAAAGA 



GCGATTTATA 
GCGATTTATA 
GCGATTTATA 
GCGATTTATA 
GCGATTTATA 
GCGATTTATA 
GCGATTTATA 
GCGATTTATA 
GCGATTTATA 
GCGATTTATA 
GCGATTTATA 



ATATGGAAAA 
ATATGGAAAA 
ATATGGAAAA 
ATATGGAAAA 
ATATGGAAAA 
ATATGGAAAA 
ATATGGAAAA 
ATATGGAAAA 
ATATGGAAAA 
ATATGGAAAA 
ATATGGAAAA 



CTTGAGCCAA 
CTTGAGCCAA 
CTTGAGCCAA 
CTTGAGCCAA 
CTTGAGCCAA 
CTTGAGCCAA 
CTTGAGCCAA 
CTTGAGCCAA 
CTTGAGCCAA 
CTTGAGCCAA 
CTTGAGCCAA 



1450 
GAAGAAAGAA 
GAAGAAAGAA 
GAAGAAAGAA 
GAAGAAAGAA 
GAAGAAAGAA 
GAAGAAAGAA 
GAAGAAAGAA 
GAAGAAAGAA 
GAAGAAAGAA 
GAAGAAAGAA 
GAAGAAAGAA 



msa71927.2{l73_18RS21 
msa71927.2(l73 2603 
msa71927 . 2 ( 173~A909 
msa71927 . 2 { 173_090 
msa71927.2{l73_CJB110 
maa71927.2(l73 COH1 
ntBa71927.2(l73~M781 
msa71927 . 2 1 173_M732 
msa71927 . 2 { 173_H36B 
msa71927.2{l73_JM9130013 
msa71927 . 2 { 173_1169NT 
Consensus 



1451 

TTGCTCTCTT 
TTGCTCTCTT 
TTGCTCTCTT 
TTGCTCTCTT 
TTGCTCTCTT 
TTGCTCTCTT 
TTGCTCTCTT 
TTGCTCTCTT 
TTGCTCTCTT 
TTGCTCTCTT 
TTGCTCTCTT 



TAATCGCCAG 
TAATCGCCAG 
TAATCGCCAG 
TAATCGCCAG 
TAATCGCCAG 
TAATCGCCAG 
TAATCGCCAG 
TAATCGCCAG 
TAATCGCCAG 
TAATCGCCAG 
TAATCGCCAG 



TGGGAGCCTA 
TGGGAGCCTA 
TGGGAGCCTA 
TGGGAGCCTA 
TGGGAGCCTA 
TGGGAGCCTA 
TGGGAGCCTA 
TGGGAGCCTA 
TGGGAGCCTA 
TGGGAGCCTA 
TGGGAGCCTA 



TGTTGCGTAG 
TGTTGCGTAG 
TGTTGCGTAG 
TGTTGCGTAG 
TGTTGCGTAG 
TGTTGCGTAG 
TGTTGCGTAG 
T GTT GCGTAG 
TGTTGCGTAG 
TGTTGCGTAG 
TGTTGCGTAG 



1500 
AACACCTTTT 
AACACCTTTT 
AACACCTTTT 
AACACCTTTT 
AACACCTTTT 
AACACCTTTT 
AACACCTTTT 
AACACCTTTT 
AACACCTTTT 
AACACCTTTT 
AACACCTTTT 



msa71927.2{ 
msa.71927 
msa71927. 
msa71927 

tnsa71927.2{ 
msa71927 
maa71927. 
msa71927. 
msa71927 
tnsa71927.2{l73 

msa7l927.2{ 



173_18RS2l] 
2(173 2603 
2{173"*A909] 
.2(173 090 
173JCJB110 
2/173 COH1 
2(173~M781 
2(173~M732 
2(173~H36B 
JM9130013 
i73_1169NT] 
Consensus 



1501 

ACACaAATTG 
ACACaAATTG 
ACACaAATTG 
ACACaAATTG 
ACACaAATTG 
ACACcAATTG 
ACACcAATTG 
ACACcAATTG 
ACACaAATTG 
ACACaAATTG 
ACACaAATTG 



CTAATATGAC 
CTAATATGAC 
CTAATATGAC 
CTAATATGAC 
CTAATATGAC 
CTAATATGAC 
CTAATATGAC 
CTAATATGAC 
CTAATATGAC 
CTAATATGAC 
CTAATATGAC 



AGGACTOCCA 
AGGACTCCCA 
AGGACTCCCA 
AGGACTCCCA 
AGGACTCCCA 
AGGACTCCCA 
AGGACTCCCA 
AGGACTCCCA 
AGGACTCCCA 
AGGACTOCCA 
AGGACTCCCA 



GCTATCAGTA 
GCTATCAGTA 
GCTATCAGTA 
GCTATCAGTA 
GCTATCAGTA 
GCTATCAGTA 
GCTATCAGTA 
GCTATCAGTA 
GCTATCAGTA 
GCTATCAGTA 
GCTATCAGTA 



1550 
TCCCGACTTA 
TCCCGACTTA 
TCCCGA CTTA 
TCCCGACTTA 
TCCCGACTTA 
TCCCGACTTA 
TCCCGACTTA 
TCCCGACTTA 
TCCCGACTTA 
TCCCGACTTA 
TCCCGACTTA 



msa71927 . 2 { 173_18RS21 
m9a71927.2(l73 2603 
msa71927.2(173~A909 
msa71927 . 2{ 173_090 
msa71927 . 2{173_CJB110 
msa71927.2(l73 COH1 
msa71927 .2 173~M781 
msa71927.2 173 M732 
ms a7 1 9 2 7 . 2 ( 1 7 3~H3 6B 
msa7192 7 . 2 ( 173_JM913 00 13 
msa71927.2(l73_1169NT 
Consensus 



1551 

CTTATCTGAG 
CTTATCTGAG 
CTTATCTGAG 
CTTATCTGAG 
CTTATCTGAG 
CTTATCTGAG 
CTTATCTGAG 
CTTATCTGAG 
CTTATCTGAG 
CTTATCTGAG 
CTTATCTGAG 



TCTGGTTTAC 
TCTGGTTTAC 
TCTGGTTTAC 
TCTGGTTTAC 
TCTGGTTTAC 
TCTGGTTTAC 
TCTGGTTTAC 
TCTGGTTTAC 
TCTGGTTTAC 
TCTGGTTTAC 
TCTGGTTTAC 



CCATAGGGAC 
CCATAGGGAC 
CCATAGGGAC 
CCATAGGGAC 
CCATAGGGAC 
CCATAGGGAC 
CCATAGGGAC 
CCATAGGGAC 
CCATAGGGAC 
CCATAGGGAC 
CCATAGGGAC 



GATGTTAATG 
GATGTTAATG 
GATGTTAATG 
GATGTTAATG 
GATGTTAATG 
GATGTTAATG 
GATGTTAATG 
GATGTTAATG 
GATGTTAATG 
GATGTTAATG 
GATGTTAATG 



1600 
GCAGGTGCAA 
GCAGGTGCAA 
GCAGGTGCAA 
GCAGGTGCAA 
GCAGGTGCAA 
GCAGGTGCAA 
GCAGGTGCAA 
GCAGGTGCAA 
GCAGGTGCAA 
GCAGGTGCAA 
GCAGGTGCAA 



msa71927.2{l73_18RS21 
msa71927. 2(173 2603* 
msa7 1 927 . 2 { 1 73~A9 0 9 
rasa71927 . 2 { 173_090 
msa71927 . 2{ 173_CJB110 
msa71927 .2{173_C0H1 
msa7 1927 . 2 173_M78 1 
rasa71927.2 173_M732 
maa71927 . 2 (173_H36B 
msa71927.2(l73 JM9130013 
msa71927 . 2 { 173_1169NT; 

Consensi 



1601 

ACTATGATAT 
ACTATGATAT 
ACTATGATAT 
ACTATGATAT 
ACTATGATAT 
ACTATGATAT 
ACTATGATAT 
ACTATGATAT 
ACTATGATAT 
ACTATGATAT 
ACTATGATAT 



GGTATTAATT 
GGTATTAATT 
GGTATTAATT 
GGTATTAATT 
GGTATTAATT 
GGTATTAATT 
GGTATTAATT 
GGTATTAATT 
GGTATTAATT 
GGTATTAATT 
GGTATTAATT 



AAATTTGCAA 
AAATTTGCAA 
AAATTTGCAA 
AAATTTGCAA 
AAATTTGCAA 
AAATTTGCAA 
AAATTTGCAA 
AAATTTGCAA 
AAATTTGCAA 
AAATTTGCAA 
AAATTTGCAA 



CTTTCTTTGA 
CTTTCTTT GA 
CTTTCTTTGA 
CTTTCTTTGA 
CTTTCTTTGA 
CTTTCTTTGA 
CTTTCTTTGA 
CTTTCTTTGA 
CTTTCTTTGA 
CTTTCTTTG A 



1650 
AAAAcATCAT 
AAAAcATCAT 
AAAACATCAT 
AAAAcATCAT 
AAAAcATCAT 
AAAAcATCAT 
AAAACATCAT 
AAAAcATCAT 
AAAAtATCAT 
AAAAtATCAT 
AAAAcATCAT 



msa71927.2(l73 18RS21) 
msa71927.2(l73 2603} 
msa71927.2(1733A909) 



l gs * 1700 
GGTTTTAATG TTAAATGGCA AAGAATAATA GATAAAGAAG TGAAACCATC 
GGTTTTAATG TTAAATGGCA AAGAATAATA GATAAAGAAG TGAAACCATC 
GGTTTTAATG TTAAATGGCA AAGAATAATA GATAAAGAAG TGAAACCATC 



824 



WO 2004/018646 



PCTAJS2003/026827 



Table 48: Comparative Sequences relating to SAG1474 



msa71927.2{l73_090 
msa71927 . 2 { 173_CJB110 
maa7 1927 . 2 f 173_COHl 
msa71927.2i 173_M781 
rasa71927.2(l73_M732 
maa7 1 92 7 . 2 { 173~H3 6B 
msa71927 . 2 { 173_JM9130013 
msa71927.2{l73_1169NT 
Consensus 



GGTTTTAATG 
GGTTTTAATG 
GGTTTTAATG 
GGTTTTAATG 
GGTTTTAATG 
GGTTTTAATG 
GGTTTTAATG 
GGTTTTAATG 
********** 



TTAAATGGCA 
TTAAATGGCA 
TTAAATGGCA 
TTAAATGGCA 
TTAAATGGCA 
TTAAATGGCA 
TTAAATGGCA 
TTAAATGGCA 
********** 



AAGAATAATA 
AAGAATAATA 
AAGAATAATA 
AAGAATAATA 
AAGAATAATA 
AAGAATAATA 
AAGAATAATA 
AAGAATAATA 
********** 



GATAAAGAAG 
GATAAAGAAG 
GATAAAGAAG 
GATAAAGAAG 
GATAAAGAAG 
GATAAAGAAG 
GATAAAGAAG 
GATAAAGAAG 
********** 



TGAAACCATC 
TGAAACCATC 
TGAAACCATC 
TGAAACCATC 
TGAAACCATC 
TGAAACCATC 
TGAAACCATC 
TGAAACCATC 
********** 



msa71927 . 2 { 173_18RS21 ) 
msa71927 . 2 { 173_2603 J 
msa71927 . 2 { 173_A909 } 
msa71927 . 2 { 173_0 90 } 
ra8a71927 , 2 { 173_CJB110 J 
msa7 1 92 7 . 2 { 17 3_COHl } 
msa71927.2 173_M78l) 
msa71927.2 173_M732J 
msa71927 . 2 {173_H36B J 
msa71927 . 2 {l73_JM9130013 } 
msa71927.2{l73_1169NT} 
Consensus 



1701 

TaCTGgCCTA 
TaCTGgCCTA 
TaCTGgCCTA 
TaCTGgCCTA 
TaCTGgCCTA 
TgCTGaCCTA 
TgCTGaCCTA 
TgCTGaCCTA 
TaCTGgCCTA 
TaCTGgCCTA 
TaCTGgCCTA 



ATACAGCCTA 
ATACAGCCTA 
ATACAGCCTA 
ATACAGCCTA 
ATACAGCCTA 
ATACAGCCTA 
ATACAGCCTA 
ATACAGCCTA 
ATACAGCCTA 
ATACAGCCTA 
ATACAGCCTA 



CTAACTCCCT 
CTAACTCCCT 
CTAACTCCCT 
CTAACTCCCT 
CTAACTCCCT 
CTAACTCCCT 
CTAACTCCCT 
CTAACTCCCT 
CTAACTCCCT 
CTAACTCCCT 
CTAACTCCCT 



CTTTAAAGCT 
CTTTAAAGCT 
CTTTAAAGCT 
CTTTAAAGCT 
CTTTAAAGCT 
CTTTAAAGCT 
CTTTAAAGCT 
CTTTAAAGCT 
CTTTAAAGCT 
CTTTAAAGCT 
CTTTAAAGCT 



1750 
CATTCATCAT 
CATTCATCAT 
CATTCATCAT 
CATTCATCAT 
CATTCATCAT 
CATTCATCAT 
CATTCATCAT 
CATTCATCAT 
CATTCATCAT 
CATTCATCAT 
CATTCATCAT 



tnsa71927 . 2 { 173_18RS21 
msa71927 . 2 { 173_2603 ; 
msa7 1927 . 2 { 173_A9 09 
msa7 1927 . 2 { 173_090 
msa71927.2{l73_CJB110 
maa71927 . 2 { 173_COHl 
msa71927.2 173_M781 
msa71927 - 2 { 173_M732 
msa71927 . 2 { 173_H36B 
msa7 1927 . 2 { 173_JM913 0 0 13 
msa71927 . 2 { 173_1169NT; 

Consensus 



1751 

TAGTAAATTT 
TAGTAAATTT 
TAGTAAATTT 
TAGTAAATTT 
TAGTAAATTT 
TAGTAAATTT 
TAGTAAATTT 
TAGTAAATTT 
TAGTAAATTT 
TAGTAAATTT 
TAGTAAATTT 



AGAAGAAAAT 
AGAAGAAAAT 
AGAAGAAAAT 
AGAAGAAAAT 
AGAAGAAAAT 
AGAAGAAAAT 
AGAAGAAAAT 
AGAAGAAAAT 
AGAAGAAAAT 
AGAAGAAAAT 
AGAAGAAAAT 



TCACAAGTTA 
TCACAAGTTA 
TCACAAGTTA 
TCACAAGTTA 
TCACAAGTTA 
TCACAAGTTA 
TCACAAGTTA 
TCACAAGTTA 
TCACAAGTTA 
TCACAAGTTA 
TCACAAGTTA 



CTCAAGTATC 
CTCAAGTATC 
CTCAAGTATC 
CTCAAGTATC 
CTCAAGTATC 
CTCAAGTATC 
CTCAAGTATC 
CTCAAGTATC 
CTCAAGTATC 
CTCAAGTATC 
CTCAAGTATC 



1800 
TATCTCTAAA 
TATCTCTAAA 
TATCTCTAAA 
TATCTCTAAA 
TATCTCTAAA 
TATCTCTAAA 
TATCTCTAAA 
TATCTCTAAA 
TATCTCTAAA 
TATCTCTAAA 
TATCTCTAAA 



ra8a71927 . 2{ 173_18RS2l} 
maa71927 . 2 { 173_2603 } 
tnsa71927 . 2 (173_A909) 
msa7 1927 .2 {173^0 90) 
msa71927 .2{173_CJB110> 
msa71927 . 2 { 173_C0H1 } 
msa71927 .2 f 173_M781> 
msa71927.2 173_M732> 
msa7 192 7 . 2 { 17 3_H3 6B J 
tnsa71927 . 2 { 173_JM913 0013 J 
rasa71927 . 2 { 173_1169NT} 
Consensus 



1801 

AAATGGATGA 
AAATGGATGA 
AAATGGATGA 
AAATGGATGA 
AAATGGATGA 
AAATGGATGA 
AAATGGATGA 
AAATGGATGA 
AAATGGATGA 
AAATGGATGA 
AAATGGATGA 



AATCGTCTGT 
AATOGTCTGT 
AATCGTCTGT 
AATCGTCTGT 
AATCGTCTGT 
AATCGTCTGT 
AATCGTCTGT 
AATCGTCTGT 
AATCGTCTGT 
AATCGTCTGT 
AATCGTCTGT 



TAAAAATAAA 
TAAAAATAAA 
TAAAAATAAA 
TAAAAATAAA 
TAAAAATAAA 
TAAAAATAAA 
TAAAAATAAA 
TAAAAATAAA 
TAAAAATAAA 
TAAAAATAAA 
TAAAAATAAA 



ccatccgtaa 
ccatccgtaa 
ccatccgtaa 
ccatccgtaa 
ccatccgtaa 
ccatccgtaa 
ccatccgtaa 
ccatccgtaa 

ccatccgtaa 
ccatccgtaa 



1850 
tggcatatca 
tggcatatca 
tggcatatca 
tggcatatca 
tggcatatca 
tggcatatca 
tggcatatca 
tggcatatca 

tggcatat — 
tggcatatca 



rasa71927 . 2 { 173_18RS21 ] 
msa71927 . 2 ( 173_2603 
rasa71927.2{173 A909 
rasa71927 ,2{173_090 
msa71927 . 2 { 173_CJB110 
msa7 1927 . 2 { 173_COHl 
msa71927 . 2 { 173_M781 
msa71927 . 2 (173_M732 
msa71927.2{173_H36B 
msa71927.2{l73 JM9130013 
msa71927 ,2{T73_1169NT 
Consensus 



1851 

aaaagca 

aaaagca 

aaaagca 

aaaagca 

aaaagca 

aaaagca 

aaaagca 

aaaagca 



aaaagca 



SBQ XD NO: 4814 

STRAIN 2603 frame : 1 

NSTBTSASVVPTTNTIVOTNDSNPTAKFVSESGQS VI GOVKPDNSAALTTVDTPHHI SAP 
DALKTTQSSPVVBSTSTKLTEETYKQKTCQDLANMVRSG^ IAKENPS 
UIAVlTTRRQBAIEEARXLKDrNQPPIX3VPIjLVnGIX3HS I KGGETNNGXjI YADGKI STFD 
SSYVKKYKDLGFI I LGQTNFPEYGWRN I TDSKLYGLTHNPWDLAHNAGGS SGGSAAAI AS 
GMTP I ASGSDAGGS I RI PSSWTGLVGLKPTRGLVSNBKPDSYSTAVHFPLTKSSRDABTL 
LTYLKKSTOQTLVSVNDIjK9I*P lAYTLKSPMGTEVSQDAKNAIMDNVT FLRKQGFKVTBI D 
I^IDGRAIJ^YSTIJtfGMGGAFSTIEXDLKKHGFTKra 

KS I MEAQKHMDD YRKAMBKLHKQFP I PLS PTTAS LAPLNTDP YVTEBDKRAI YNMENIrS Q 
EB11I ALFNRQWEPMLRRTPFTQIANMTGLPAI S I PTYLSESGLP I GTMLMAGANYDMVLI 
KFATFFEXHHGFNVKWQRI I DKEVKPSTGL I QPTNSL.FKAHS SLVNLESNSQVTQVS I S K 
KWMKSSVKNKPSVMAYQKA 



SBQ ZD KOt 4815 

STRAIN 090 frame: 1 

NSTBTSASVVPTTNTIVQTNDSNPTAKFVSBSGCiSV 



825 
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Table 48: Comparative Sequences relating to SAG1474 



DALKTI^SSPVVESTSTKLTEETYTOKDGKDIiANMVRSGQVTSBELVNMAYDI IAKENPS 
LNAV I TTRRQEA I EEARKLKDTNQPFLGVPLLVKGLGHSI KGGBTNNGLI YADGKI STFD 
SSYVKKYKDIXSFIIIiGQIOTPEYGWRNITDSKLYGLTHNPWDLA^ 
GMTP IASGSDAGGS I RI PSSWTGLVGLKPTRGLVSNEKPDSYSTAVHFPLTKSSRDABTL 
LTYLKKSDCTTjVSVNDLKS LP I AYTLKSPMGTBVSQDAKNAIMDNVTFLRKOX5F1CVTO I D 
LP IDGRAIWRDYSTLAIGMGGAFST IE KDLKKHG FTKBDVDPITWAVHVI YQNSDKAELK 
KS IMEAQKHMDDYRKAMEKLHKQFPI PLS PTTASLAPLNTDPYVTEEDKRAI YNMENLS Q 
EERIALFNRQWEPMLRRTPFTQIANMTGLPAI S I PTYIiS ESGLP I GTMLMAGANYDMVL I 
KFATPFEKHHGFNVKWQRI IDKBVKPSTGL I QPTNSLFKAHSSLVNLEENSQVTQVSI SK 
KWMKS S VKNKPS VMA YQKA 

SEQ ZD NO: 4816 
STRAIN A909 frame: 2 

TTNT I VQTNDSNPTAKFVS E SGQS V I G QVKPDNS AALTTVDT PHH I SAPDALKTTQSSPV 
VESTSTKLTEETYKQKDGQDLANMVRSGQVTSEELVNMAYD I IAKENPS LNAVITTRRQE 
AI EEARKLKDTNQP FLGVPLLVKGLGHS I KGGETNNGL I YADGKI STFDSSYVKKYKDLG 
FIILGO/TNPPEYGWRNITDSKLYGLTHNPWDIaAHNAGGSSGGSAAAIASGMTPIASGSISA 
GGSI RI PSSWTGLVGLKPTRGLVSNEKPDSYSTAVHFPLTKSSRDAETLLTYLK^ 
VSVNDLKSLPIAYTLKSPMGTEVSQDAKNAI MDNVTFLRKQGFKVTE IDLPIDGRALMRD 
YSTLAIGMGGAFSTIEKDLKKHGFTKEDVDPITWAVHVIYQNSDKAELKKSIMEAQ 
DYRKAMEKLHKQFPI FLSPTTASLAPLNTDPYWEEDKRAIYNMENLSQEERIALFNRQW 
EPMLRRTPFTQIANMTGLPAISIPTYLSESGLPIGTMLMAGANYDMVLIKFATFF^ 
FNVKWQRI I DKEVKPSTGLI QPTNSLFKAHSSLVNLEENSQVTQVS I SKKWMKSSVKNKP 
SVMAYQKA 

SEQ ZD NO i 4817 

STRAIN COH1 frame i 1 

NSTETSASVAPTTNT I VGTNDSNPT AKFAS ESGQ S VI GQVKP AN SAALTTVDTPH I SAPD 
ALKTTQSSPVVESPSTKLTEETYKQKDGQDIANMVRSGQ IAKENPS L 

NAVITTRRQEAI EEARKLKDTNQPFLGVPLLVKGLGHS I KGGETNNGL I YADGKI STFDS 
SYVKKYKDLGFI ILGOTNFPEYGWRNITDSKLYGPTHNPWNIJUiNAGGSSGGSAAAIASG 
MTPIASGSDAGGS I RI PS SWTGLVGIiKPTRGLVSNEKPDSYSTAVHFPLTKSSRDAETLL 
TYLKKSDQTLVSVNDIiKSLPIAYTLKSPMGTEVSQDAKNAIMDN^ 
PIDGRALMRDYSTLAIGMGGAFSTIEKDLKKHGFTKEDVDP ITWAVHVI YQNSDKAELKK 
S I VEAQKHMDD YRKAME KLHKQFP I FIiSPTTASLAPLNTDPYVTEKDKRAIYNMENLSQE 
ERIALFNRQWEPMLRRTPFTPIANMTGLPAISIPTYLSESGLPIGTMLMAGAN^ K 
FATFFEKHHGFNVKWQRI IDKEVKPSADLI QPTNSLFKAHSSLVNLEENSQVTQVS I SKK 
WMKS S VKNKPSVMAYQKA 

SEQ ZD NOt 4818 

STRAIN M732 frame: 1 

SVAPVTTNTI VGTNDSNPTAKFASESGQSVI GQVKPANSAALTTVDTPHI SAPDALKTTQS 
S PWES P STKLTEETYKQKDGQDLANMVRSGQVTS EELVNMAYD I IAKENPSLNAVTTTR 
RQEAI EBARKLKDTNQPFLGVPLLVKGLGHS I KGGETNNGLI YADGKI STFD SSYVKKYK 
DLGFI ILGQTNFPEYGWRNITDSKLYGXTHNPWDLAHNAGGSSGGSAAAIASG 
SDAGGS I RI PSSWTGLVGLKPTRGLVSNEKPDS YSTAVHFPLTKS SRDAETLLTYLKKSD 
QTLVSVNDLKSLPIAYTLKS P^GTEVSQ^AKNAIMDNVTFIjRKQGFKVTE IDLPI DGRAL 
MRDYSTLAIGMGGAFST I EKDLKKHGFTKEDVDP ITWAVHVI YQNSDKAELKK^ 
HMDDYRKAMEKLHKQFP I FLSPTTASLAPLNTDPYVTBKDKRAI YNMENLSQEERIALFN 
RQWEPMLRRTPFTPIANMTGLPAI S I PTYLSESGLP I GTMLMAGANYDMVL I KFATFFEK 
HHGFNVKWQRI I DKEVKPSADL I QPTNSLFKAHSSLVNLEENSQVTQVS I SKKWMKSSVK 
NKPSVMAYQKA 

SEQ ZD NO: 4819 

STRAIN 18RS21 frame: 1 

NSTETSASVVPTTNTI VQTNDSNPTAKFVSBSGQSVT GQVKPDNSAALTTVDTPHHI SAP 
DALKTTQSSPVVESTSTKLTEETYKQKDGQDLANMVRS^ IAKENPS 
LNAVI TTRRQEA I EEARKLKDTNQ PFLGVPLLVKGLGHS I KGGETNNGL I YADGKI STFD 
SSYVKKYKDLGF 1 1 LGGTNFPE YGWRN I TDS KLYGLTHNPWDLAHNAGG S SGGS AAAI AS 
GMTP IASGSDAGGS I RI PSSVmSLVGLKPTRGLVSNEKPDSYSTAVHFPLTKSSRDAETL 
LTYLKKSDQTLVSVNDLKS LP I AYTLKS PMGTEVSQD AKNAI MDNVTFLRKQGFKVTE ID 
LP IDGRALMRDY STLAI GMGGAFST I EKDLKKHG FTKED VD P ITWAVHV I YQNSDKAELK 
KSIMEAQKHMDDYRKAMEKLHKQFPI FLSPTTASLAPLNTDPYVTEEDKRAI YNMENLSQ 
EER I ALFNRQWE PMLRRTP FTQ IANMTGL P AI SI PTYLSESGLP I GTMLMAGANYDMVL I 
KFATFFEKHHGFNVKWQRI I DKEVKPSTGL I QPTNSLFKAHSSLVNLEENSQVTQVS I S K 
KWMKS SVKNKPSVMAYQKA 

SEQ ZD NO: 4820 
STRAIN M781 frame: 2 

ASVAPTTNT I VQTNDSNPTAiCFASESGQS VI GQVXPANSAALri'VlJrPH I SAPDALKTTQ 
SS PVVESPSTKLTEETYKQKTXSCDIJ^NMVRSGQVTSEELVNMAYDI IAKENPSLNAVTTT 
RRQEAI EBARKLKDTNQPFLGVPLLVKGLGHS I KGGETNNGL I YADGKI STFDSSYVKKY 
KDLGF 1 1 LGQTNFPEYGWRN ITDS KLYGPTHNP WNLAHNAGGSSGGSAAAIASGMTP IAS 
GSDAGGS I R I PS S WTGLVGLKPTRGLVSNEKPDS YSTAVHFP LTKS SRDAETLLTYLKKS 
DOJTLVSVNDLKSIiPIAYTLKSPMGTEVSQDAKNAI MDNVTFLR 

LMRDYSTLAIGMGGAFSTI EKDLKKHG FTKBDVDPITWAVHVI YQNSDKAELKKS IVEAQ 
KHMDD YRKAMEKLHKQFP I PliSPTTASLAPLNTDPYVTEKDKRAIYNMENLSQEERIALF 
NROJ^MLRRTPFTPIANMTGLPAI SI PTYI^BSGLPIGTMLMAGANYDMVLIKFATFFB 
KHHG FNVKWQR 1 1 DKEVKPSADL I QPTNSLFKAHSSLVNLEENSQVTQVS I SKKWMKSS V 
KNKP SVMAYQKA 

SEQ ZD NO: 4821 
STRAIN CJB110 frame: 3 
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VPTTHTIVQTflroSNPTAKFVSESGQSVIGQVK^ 

PVVHSTSTKLTEETYKQKIX3KDLANMVRSGQVTSEELVNMAYDI IAKENPSLNAVITTRR 
QEAI EEARKLKDTNQP FLG VPLLVKGLGHS I KGGETNNGL I YADGKI STFDS SYVKKYKD 
U5FIILGQTNFPEYGVTONITDSKLYGLTHNPWDLAHNAGGSSGGSAAAIASGMTPIASGS 
DAGGS I RI PS SWTGLVGLKPTRGLVSHEKPDS YSTAVHF PLTKS SRDAETLLTYLKKSDQ 
TL VSVNDLKSLP I AYTLKS PMGTEVSQDAKNAIMDNVTFLRKQGFKVTE I DLPI DGRALM 
RDYSTLAIGMGGAFST I EKDLKKHGFTKEDVDPI TWAVHVI YQNS DKAELKKS I MBAQKH 
MDDYRKAMEKLHKQFPI FLSPTTASIAPLNTDPYVTEEDKFJUYNMENLSQEERIALFNR 
QWEPMLRRTPFTQIANMTGLPAIS I PTYLSESGLPIGTMLMAGANYDMVLIKFATFFEKH 
HGFNVKWQRIIDKEVKPSTGLIQPTNSLFKAHSSLVNIjEENSQV^^ 
KPSVMAYQKA 

SEQ ID NO i 4822 

STRAIN 1169NT frame: 1 

NSTETSASVAPTTNT IVQTNDSNPTAKFASESGQSVI CQVKPDNSAALTTVDTPH I SAPD 
DLKTTQSSPVVESTSTKLTEETYKQKDGQDLANMVRSGQVTSEEL 

NAVITTRRQEAI EEARKLKDTNQPFLGVPLLVKGLGHS I KGGETNNGL I YADGKI STFDS 
S YVKKYKDLGFI I IiGQTNFPEYGWRNITDSKLYGPTHNPRNIAHNAGGS SGGSAAAIASG 
MT P I AS GSDAGGS I RI PSSWTGLVGLKFTRGLVSNEKPDS YSTAVHFPLTKSSRDAETIiIi 
TYLKKSDQTLVSVNDLKSLP I AYTLKS PMGTEVSQDAKNA I MDNVTFIiRKQGFKVTE IDL 
PIDGRALMRDYSTLAIGMGGAFST I EKDLKKHGFTKEDVDPI TWAVHVI YQNSDKAELKK 
SIMEAQKHMDDYRKAMEKLHKQFPI FI*SPTTASLAPIjNTDPYVTEEDKRAIYNMENLSQB 
ERIALFNRQWEPMLRRTPFTQIANMTGLPAI S I PTYLSESGLPIGTMLMAGANYDMVLI K 
FATFFEKHHGFNVKWQRI I DKEVKPSTGLI QPTNSLFKAHSSLVNLEENSQVTQVS I SKK 
WMKSSVKNKPSVMAYQKA 

SEQ ID HO: 4823 

STRAIN JM9 130013 frame: 2 

SYAPTTNT I VQTND SNPTAKFS S ES GQS VI GQVKPAN SVALTTVDTPHI SAPDALKTTQS 
SPVVESPSTKLTEETYKQKDGQEIANMVRSGQVTSEELVNMAYDI IAKENPSLNAVI TTR 
RQEAI EEARKI»KDTNQPFI*GVPLLVKGLGHSI KGGETNNGIjI YAGGKI STFDSSYVKKYK 
DLGFI I LGQTNF PEYGWRNI TDSKLYGPTHNPWNLAHNAGGSSGGSAAVI ASGMTP IASG 
SDAGGSIRI PSS WTGLVGLKPTRGLVSNRKPDSYSTAVHFPLTKS SRDAETLLTYIiKKSD 
QTLVSVNDLKSLPI AYTLKS PMGTEVSQDAKNAI MDNVI FLRKQGFKVTEIDLPI DGRAL 
MRDYSTLAIGMGGAFSTIEKDLKKHGFTKEDVDP I TWGVHVI YQNSDKAELKKS IMEAQK 
HMDDYRKAMEKLHKQFP I FLSPTTASLAPLNTDP YVTEEDKRAI YNMENLSQEERIALFN 
RQWEPMLRRTPF^TQI ANMTGLPAI S I PTYLSBSGLP IGTMLMAGANYTJMVLI KFATFFEK 
YHGFNVKWQR I IDKEVKPSTGL I QPTNSLFKAHSSLVNLEENSQVTQVS I SKKWMKSSVK 
NKPSVMAY 

SEQ XD NO: 4824 

STRAIN H36B frame: 3 

SWPTTNTI VQTNDSNPTAKFSSESGQSVIGQVKPANSVALTTVDTPHI SAPDALKTTQS 
SPVVBSPSTKLTEETYKQKDGQDLANMVRSGQVTSEELVNMAYDI IAKENPSLNAVITTR 
RQEAI EEARKLKDTNQP FLGVPLLVKGLGHS I KGGETNNGL I YAGGKI STFDSSYVKKYK 
DLGF I ILGQTNFPEYGVn^ITDSKLYGPTHNPWNLAHNAGGSSGGSAAVIASGMTPIASG 
SDAGGS I RI PS SWTGLVGLKPTRGLVSNEKPD SY STAVHFPLTKS SRDAETLLTYIiKKSD 
QTLVSVNDLKSLPIAYTLKS PMGTEVSQDAKNAI MDNVI FLRKQGFKVTE IDLPIDGRAL 
MRDYSTLAI GMGGAFST I EKDLKKHGFTKEDVDP ITWAVHVI YQNSDKAELKKS IMEAQK 
HMDDYRKAMEKLHKQFP I FI>SPTTASLAPLNTDPYVTEEDKRAI YNMENLSQEERIALFN 
RQWEPMLRRTPFTQI ANMTGLPAI SIPTYLSESGLP IGTMLMAGANYDMVLI KFATFFEK 
YHGFNVKWQR 1 1 DKBVKPSTGLIQPTNSLFKAHSSLVNLEENSQVTQVSI SKKWMKSSVK 
NK 
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msa72034.2{l73_090; 
msa72034 . 2{173_18RS21 
msa72034.2{l73_2603 
msa72034 . 2 { 173_A909 
msa72034 . 2 { 173_CJB110 
ma a7 2 034 . 2 { 173_COHl 
msa72034 .2 (173_M732 
msa72034.2{l73_M781 
msa72034 . 2 { 173_1169NT 
maa72034.2{l73_H36B 
msa72034 . 2 {173_JM9130013 
~ Consensus 



rasa72034.2{l73_090 
msa72034 . 2 { 173_1BRS21 
msa72034 . 2 { 173.2603 
msa7 2 03 4 . 2 { 173_A9 09 
msa72034 . 2 {173_CJB110 
msa72034 . 2 { 173_OOHl 
msa72034 . 2 { 173_M732 
msa72034 . 2 { 173_M781 
msa72034.2{l73 1169NT 
msa72034 . 2 { 173_H36B 
msa7 2 034 . 2 { 173_JM9 13 0013 



1 SO 
nstetsasw pTTNTIVQTN DSNPTAKFvS ESGQSVIgQV KPdNSaALTT 
nstetsasw pTTNTIVQTN DSNPTAKFvS ESGQSVIgQV KPdNSaALTT 
nstetsasw pTTNTIVQTN DSNPTAKFvS ESGQSVIgQV KPdNSaALTT 

TTNTIVQTN DSNPTAKFvS ESGQSVIgQV KPdNSaALTT 

v pTTNTIVQTN DSNPTAKFvS ESGQSVIgQV KPdNSaALTT 

nstetsasva pTTNTIVQTN DSNPTAKFaS ESGQSVIgQV KPaNSaALTT 

Bva pTTNTIVQTN DSNPTAKFaS ESGQSVIgQV KPaNSaALTT 

asva pTTNTIVQTN DSNPTAKFaS ESGQSVIgQV KPaNSaALTT 

nstetsasva pTTNTIVQTN DSNPTAKFaS BSGQSVIcQV KPdNSaALTT 

sw pTTNTIVQTN DSNPTAKFaS ESGQSVIgQV KPaNSvALTT 

ava pTTNTIVQTN DSNPTAKFaS ESGQSVIgQV KPaNSvALTT 

51 100 
VDTphHISAP DaLKTTQSSP WEStSTKLT EETYKQKDGk dLANMVRSGQ 
VDTphHISAP DaLKTTQSSP WEStSTKLT BBTYKQKDGq dLANMVRSGQ 
VDTphHISAP DaLKTTQSSP WEStSTKLT BBTYKQKDGq dLANMVRSGQ 
VDTphHISAP DaLKTTQSSP WEStSTKLT BBTYKQKDGq dLANMVRSGQ 
VDTphHISAP DaLKTTQSSP WEStSTKLT EETYKQKDGk dLANMVRSGQ 
VDT.pHISAP DaLKTTQSSP WESpSTKLT EETYKQKDGq dLANMVRSGQ 
VDT.pHISAP DaLKTTQSSP WESpSTKLT BBTYKQKDGq dLANMVRSGQ 
VDT.pHISAP DaLKTTQSSP WESpSTKLT BBTYKQKDGq dLANMVRSGQ 
VDT.pHISAP DdLKTTQSSP WEStSTKLT BBTYKQKDGq dLANMVRSGQ 
VDT.pHISAP DaLKTTQSSP WESpSTKLT EETYKQKDGq dLANMVRSGQ 
VDT.pHISAP DaLKTTQSSP WESpSTKLT EETYKQKDGq eLANMVRSGQ 
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Consensus 



101 

msa72034.2{l73_090) VTSEELVNMA 

rasa72034.2{l73 18RS21J VTSEELVNMA 

msa72034.2fl73_2603> VTSEELVNMA 

msa72034.2{l73_A909) VTSEELVNMA 

msa72034.2{l73_CJB110) VTSEELVNMA 

msa72034 . 2 { 173_COHl> VTSEELVNMA 

msa72034.2{l73 M732) VTSEELVNMA 

msa72034.2{173~M78l} VTSEELVNMA 

msa72034.2{l73_1169NT> VTSEELVNMA 

msa72034.2{l73_H36Bj VTSEELVNMA 

msa72034 . 2 { 173_JM913 00 13 } VTSEELVNMA 

~~ Consensus ********** 



YDIIAKENPS 
YDI IAKENPS 
YDIIAKENPS 
YDIIAKENPS 
YDIIAKENPS 
YDIIAKENPS 
YDIIAKENPS 
YDIIAKENPS 
YDIIAKENPS 
YDIIAKENPS 
YDIIAKENPS 



LNAVITTRRQ 
LNAVITTRRQ 
LNAVITTRRQ 
LNAVITTRRQ 
LNAVITTRRQ 
LNAVITTRRQ 
LNAVITTRRQ 
LNAVITTRRQ 
LNAVITTRRQ 
LNAVITTRRQ 
LNAVITTRRQ 



EAIEEARKLK 
EAIEEARKLK 
EAIEEARKLK 
EAIEEARKLK 
EAIEEARKLK 
EAIEEARKLK 
EAIEEARKLK 
EAIEEARKLK 
EAIEEARKLK 
EAIEEARKLK 
EAIEEARKLK 



150 

DTNQPPLGVP 
DTNQPPLGVP 
DTNQPPLGVP 
DTNQPPLGVP 
DTNQPPLGVP 
DTNQPPLGVP 
DTNQPPLGVP 
DTNQPPLGVP 
DTNQPPLGVP 
DTNQPPLGVP 
DTNQPPLGVP 



1S1 

moa72034.2{l73_090} LLVKGLGHSI 

msa7 2034.2(173 18RS21} LLVKGLGHSI 

msa7 2 03 4 . 2 ( 17 3_2 6 03 LLVKGLGHSI 

msa72034.2{l73 A909 \ LLVKGLGHSI 

msa72034.2{l73_CJB110 'f LLVKGLGHSI 

msa72034.2(l73 COH1 LLVKGLGHSI 

Oisa72034. 2 f 173~M732 J LLVKGLGHSI 

msa72034.2{l73_M781 LLVKGLGHSI 

msa72034.2{l73_1169NT} LLVKGLGHSI 

msa72034.2{l73_H36B} LLVKGLGHSI 

msa72034.2{l73_OM9130013} LLVKGLGHSI 

~" Consensus ********** 



KGGETNNGLI 
KGGETNNGLI 
KGGETNNGLI 
KGGETNNGLI 
KGGETNNGLI 
KGGETNNGLI 
KGGETNNGLI 
KGGETNNGLI 
KGGETNNGLI 



YAdGKISTFD 
YAdGKI STFD 
YAdGKISTFD 
YAdGKISTFD 
YAdGKISTFD 
YAdGKISTFD 
YAdGKISTFD 
YAdGKISTFD 
YAdGKISTFD 
YAgGKISTFD 
YAgGKISTFD 



SSYVKKYKDL 
SSYVKKYKDL 
SSYVKKYKDL 
SSYVKKYKDL 
SSYVKKYKDL 
SSYVKKYKDL 
SSYVKKYKDL 
SSYVKKYKDL 
SSYVKKYKDL 
SSYVKKYKDL 
SSYVKKYKDL 



200 

GFIILGQTNF 
GFIILGQTNF 
GFIILGQTNF 
GFIILGQTNF 
GFIILGQTNF 
GFIILGQTNF 
GFIILGQTNF 
GFIILGQTNF 
GFIILGQTNF 
GFI ILGQTNF 
GFIILGQTNF 



201 

msa72034 . 2 { 173_090 J PEYGWRNITD 

msa72034 . 2 { 173_18RS21 PEYGWRNITD 

rasa72034.2fl73_2603) PEYGWRNITD 

m3a72034.2{173_A909} PEYGWRNITD 

msa72034.2{l73 CJB110} PEYGWRNITD 

msa72 034 . 2 ( 173_COHl i PEYGWRNITD 

msa72034 . 2 { 173_M732 I PEYGWRNITD 

msa72034.2{l73_M781 ) PEYGWRNITD 

msa72034.2{l73_1169NT) PEYGWRNITD 

tnsa72034 . 2 {173_H36B> PEYGWRNITD 

msa72034.2{l73_JM9130013) PEYGWRNITD 

Consensus ********** 



SKLYG1THNP 
SKLYG1THNP 
SKLYG1THNP 
SKLYG1THNP 
SKLYG1THNP 
SKLYGpTHNP 
SKLYGxTHNP 
SKLYGpTHNP 
SKLYGpTHNP 
SKLYGpTHNP 
SKLYGpTHNP 



wdLAHNAGGS 
wdLAHNAGGS 
wdLAHNAGGS 
wdLAHNAGGS 
wdLAHNAGGS 
wnLAHNAGGS 
wdLAHNAGGS 
wnLAHNAGGS 
rnLAHNAGGS 
wnLAHNAGGS 
wnLAHNAGGS 



SGGSAAalAS 
SGGSAAalAS 
SGGSAAalAS 
SGGSAAalAS 
SGGSAAalAS 
SGGSAAalAS 
SGGSAAalAS 
SGGSAAalAS 
SGGSAAalAS 
SGGSAAvIAS 
SGGSAAvIAS 



250 

GMTPIASGSD 
GMTPIASGSD 
GMTPIASGSD 
GMTPIASGSD 
GMTPIASGSD 
GMTPIASGSD 
GMTPIASGSD 
GMTPIASGSD 
GMTPIASGSD 
GMTPIASGSD 
GMTPIASGSD 



msa72034 . 2 { 173_090 \ 
msa72034 . 2 { 173_18RS21 
msa72034 .2 ( 173_2603 
msa72034 . 2 (l73_A909 
msa72034 . 2 { 173_CJB110 
tnsa72034 . 2 ( 173_C0H1 
tnsa72 034 . 2 ( 173_M732 
tnsa72034 . 2 (173_M781 
msa72034 . 2 { 173_1169NT 
msa72034 . 2 { 173JK36B 
msa72034 . 2 { 173_JM913 0013 
Consensus 



msa72034.2{l73_090| 
msa72034.2{l73_18RS21 
msa72034 . 2 (173_2603 
msa72034 . 2 { 173_A909 
msa72034 . 2 { 173_CJB110 
msa72034 . 2 ( 173_C0H1 
rasa72034 . 2 f 173_M732 
rasa72034.2{173_M781 
msa72034 . 2 { 173_1169NT 
msa72034 . 2 { 173_H36B 
msa72034 . 2 {173_JM9130013 
Consensus 



251 

AGGSIRIPSS 
AGGSIRIPSS 
AGGSIRIPSS 
AGGSIRIPSS 
AGGSIRIPSS 
AGGSIRIPSS 
AGGSIRIPSS 
AGGSIRIPSS 
AGGSIRIPSS 
AGGSIRIPSS 
AGGSIRIPSS 



WTGLVGLKPT 
WTGLVGLKPT 
WTGLVGLKPT 
WTGLVGLKPT 
WTGLVGLKPT 
WTGLVGLKPT 
WTGLVGLKPT 
WTGLVGLKPT 
WTGLVGLKPT 
WTGLVGLKPT 
WTGLVGLKPT 



RGLVSnEKPD 
RGLVSnEKPD 
RGLVSnEKPD 
RGLVSnEKPD 
RGLVShEKPD 
RGLVSnEKPD 
RGLVSnEKPD 
RGLVSnEKPD 
RGLVSnEKPD 
RGLVSnEKPD 
RGLVSnEKPD 



SYSTAVHFPL 
SYSTAVHFPL 
SYSTAVHFPL 
SYSTAVHFPL 
SYSTAVHFPL 
SYSTAVHFPL 
SYSTAVHFPL 
SYSTAVHFPL 
SYSTAVHFPL 
SYSTAVHFPL 
SYSTAVHFPL 



300 

TKSSRDAETL 
TKSSRDAETL 
TKSSRDAETL 
TKSSRDAETL 
TKSSRDAETL 
TKSSRDAETL 
TKSSRDAETL 
TKSSRDAETL 
TKSSRDAETL 
TKSSRDAETL 
TKSSRDAETL 



301 

LTYLKKSDQT 
LTYLKKSDQT 
LTYLKKSDQT 
LTYLKKSDQT 
LTYLKKSDQT 
LTYLKKSDQT 
LTYLKKSDQT 
LTYLKKSDQT 
LTYLKKSDQT 
LTYLKKSDQT 
LTYLKKSDQT 



LVSVNDLKSL 
LVSVNDLKSL 
LVSVNDLKSL 
LVSVNDLKSL 
LVSVNDLKSL 
LVSVNDLKSL 
LVSVNDLKSL 
LVSVNDLKSL 
LVSVNDLKSL 
LVSVNDLKSL 
LVSVNDLKSL 



PIAYTLKSPM 
PIAYTLKSPM 
PIAYTLKSPM 
PIAYTLKSPM 
PIAYTLKSPM 
PIAYTLKSPM 
PIAYTLKSPM 
PIAYTLKSPM 
PIAYTLKSPM 
PIAYTLKSPM 
PIAYTLKSPM 



GTEVSQDAKN 
GTEVSQDAKN 
GTEVSQDAKN 
GTEVSQDAKN 
GTEVSQDAKN 
GTEVSQDAKN 
GTEVSQDAKN 
GTEVSQDAKN 
GTEVSQDAKN 
GTEVSQDAKN 
GTEVSQDAKN 



350 

AIMDNVtFLR 
AIMDNVtFLR 
AIMDNVtFLR 
AIMDNVtFLR 
AIMDNVtFLR 
AIMDNVtFLR 
AIMDNVtFLR 
AIMDNVtFLR 
AIMDNVtFLR 
AIMDNViFLR 
AIMDNViFLR 



rosa72034.2{l73 090] 
msa72034 . 2 { 173JL8RS21 ] 
msa72034 . 2 (173J2603 ( 
tnsa72034.2{173 A909 
msa72034 . 2 {173JCJB110 
tnsa72034 . 2 { 173_COHl 
msa72034 . 2 ( 173 J032 
msa72034 . 2 (173_M781 
msa72034.2{l73 1169NT 
msa72034 . 2 { 173J06B 



351 

kQGFKVTEID 
kQGFKVTEID 
kQGFKVTEID 
kQGFKVTEID 
kQGFKVTEID 
kQGFKVTEID 
kQGFKVTEID 
eQGFKVTEID 
kQGFKVTEID 
kQGFKVTEID 



LPIDGRALMR 
LPIDGRALMR 
LPIDGRALMR 
LPIDGRALMR 
LPIDGRALMR 
LPIDGRALMR 
LPIDGRALMR 
LPIDGRALMR 
LPIDGRALMR 
LPIDGRALMR 



DYSTLAIGMG 
DYSTLAIGMG 
DYSTLAIGMG 
DYSTLAIGMG 
DYSTLAIGMG 
DYSTLAIGMG 
DYSTLAIGMG 
DYSTLAIGMG 
DYSTLAIGMG 
DYSTLAIGMG 



GAFSTIEKDL 
GAFSTIEKDL 
GAFSTIEKDL 
GAFSTIEKDL 
GAFSTIEKDL 
GAFSTIEKDL 
GAFSTIEKDL 
GAFSTIEKDL 
GAFSTIEKDL 
GAFSTIEKDL 



400 

KKHGFTKEDV 
KKHGFTKEDV 
KKHGFTKEDV 
KKHGFTKEDV 
KKHGFTKEDV 
KKHGFTKEDV 
KKHGFTKEDV 
KKHGFTKEDV 
KKHG FTKED V 
KKHGFTKEDV 
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msa72034 . 2 { 173_JM9130013 ) 
Consensus 



kQGPKVTEID LPIDGRALMR DYSTLAIGMG GAPSTIEKDL KKHGFTKEDV 



msa72034 . 2 {173_090 1 
msa72034 . 2 { 173JL8RS21 ' 
msa72034.2{l73 2603' 
m8a72034.2{1733A909| 
msa72034 . 2 { 173_CJB110 ' 
msa72034.2(l73_COHl 
msa72034. 21173 M732' 
msa7 2 03 4 . 2 { 173~M7 8 1 
msa72034 . 2{ 173_1169NT 
msa72034 . 2{l73_H36B 
msa72034 . 2 { 173_JM9130013 
Consensus 



401 

DPITWaVHVI 
DPITWaVHVI 
DPITWaVHVI 
DPITWaVHVI 
DPITWaVHVI 
DPITWaVHVI 
DPITWaVHVI 
DPITWaVHVI 
DPITWaVHVI 
DPITWaVHVI 
DPITWgVHVI 



YQNSDKAELK 
YQNSDKAELK 
YQNSDKAELK 
YQNSDKAELK 
YQNSDKAELK 
YQNSDKAELK 
YQNSDKAELK 
YQNSDKAELK 
YQNSDKAELK 
YQNSDKAELK 
YQNSDKAELK 



KSImEAQKHM 
KSImEAQKHM 
KSImEAQKHM 
KSImEAQKHM 
KSImEAQKHM 
KSIvEAQKHM 
KSIvEAQKHM 
KSIvEAQKHM 
KSImEAQKHM 
KSImEAQKHM 
KSImEAQKHM 



DDYRKAMEKL 
DDYRKAMEKL 
DDYRKAMEKL 
DDYRKAMEKL 
DDYRKAMEKL 
DDYRKAMEKL 
DDYRKAMEKL 
DDYRKAMEKL 
DDYRKAMEKL 
DDYRKAMEKL 
DDYRKAMEKL 



4S0 

HKQPPIPLSP 
HKQFPIPLSP 
HKQFPIPLSP 
HKQFPIFLSP 
HKQFPIPLSP 
HKQFPIPLSP 
HKQFPIFLSP 
HKQFPIPLSP 
HKQFPIFLSP 
HKQFPIFLSP 
HKQFPIFLSP 



msa72034 
ms'a72034.2{ 

msa72034 

msa72034 
msa72034.2{ 

msa72034. 

msa72034. 

msa72034 . 
msa72034.2{ 

msa72034. 
msa72034.2{X73 



.2(173 090 
173_18RS21 
2(173 2603 
2{173~A909 
173_CJB110 
2{l73_COHl 
2fl73_M732 
2{173_M781 
173_1169NT 
2{l73_H36B 
JM9130013 
Consensus 



451 

TTASLAPLNT 
TTASLAPLNT 
TTASLAPLNT 
TTASLAPLNT 
TTASLAPLNT 
TTASLAPLNT 
TTASLAPLNT 
TTASLAPLNT 
TTASLAPLNT 
TTASLAPLNT 
TTASLAPLNT 
********** 



DPYVTEeDKR 
DPYVTEeDKR 
DPYVTEeDKR 
DPYVTEeDKR 
DPYVTEeDKR 
DPYVTEkDKR 
DPYVTEkDKR 
DPYVTEkDKR 
DPYVTEeDKR 
DPYVTEeDKR 
DPYVTEeDKR 
******_*** 



AIYNMENLSQ 
AIYNMENLSQ 
AIYNMENLSQ 
AIYNMENLSQ 
AIYNMENLSQ 
AIYNMENLSQ 
AIYNMENLSQ 
AIYNMENLSQ 
AIYNMENLSQ 
AIYNMENLSQ 
AIYNMENLSQ 
********** 



EBRIALFNRQ 
EERIALPNRQ 
EBRIALFNRQ 
EERIALPNRQ 
EBRIALFNRQ 
EERIALPNRQ 
EERIALPNRQ 
EERIALPNRQ 
EBRIALFNRQ 
EBRIALFNRQ 
EERIALPNRQ 
********** 



500 

WEPMLRRTPP 
WEPMLRRTPP 
WEPMLRRTPP 
WEPMLRRTPP 
WEPMLRRTPP 
WEPMLRRTPP 
WEPMLRRTPP 
WEPMLRRTPF 
WEPMLRRTPF 
WEPMLRRTPF 
WEPMLRRTPF 
*********** 



msa72034 . 2 { 173_090 
msa72034 . 2 { 173_18RS21 
rasa72034.2^173_2603 , 
msa72 034 . 2 { 173_A909 
msa72034 . 2 { 173_CJB110 
msa72034 .2(173_C0H1 
msa72 034 . 2 { 173J4732 
msa72 03 4 . 2 { 173_M7 8 1 
msa72034 . 2 { 173_1169NT 
msa72034 . 2 {173_H36B 
msa72034 . 2 { 173_JM9130013 
Consensus 



501 

TglANMTGLP 
TqlANMTGLP 
TqlANMTGLP 
TglANMTGLP 
TqlANMTGLP 
TpIANMTGLP 
TpIANMTGLP 
TpIANMTGLP 
TqlANMTGLP 
TqlANMTGLP 
TqlANMTGLP 



AISIPTYLSE 
AISIPTYLSE 
AISIPTYLSE 
AISIPTYLSE 
AISIPTYLSE 
AISIPTYLSE 
AISIPTYLSE 
AISIPTYLSE 
AISIPTYLSE 
AISIPTYLSE 
AISIPTYLSE 



SGLPIGTMLM 
SGLPIGTMLM 
SGLPIGTMLM 
SGLPIGTMLM 
SGLPIGTMLM 
SGLPIGTMLM 
SGLPIGTMLM 
SGLPIGTMLM 
SGLPIGTMLM 
SGLPIGTMLM 
SGLPIGTMLM 



AGANYDMVLI 
AGANYDMVLI 
AGANYDMVLI 
AGANYDMVLI 
AGANYDMVLI 
AGANYDMVLI 
AGANYDMVLI 
AGANYDMVLI 
AGANYDMVLI 
AGANYDMVLI 
AGANYDMVLI 



550 

KFATFFEKhH 
KFATFFEKhH 
KFATFFEKhH 
KFATFFEKhH 
KFATFFEKhH 
KFATFFEKhH 
KFATFFEKhH 
KFATFFEKhH 
KFATFFEKhH 
KFATPPEKyH 
KFATFFEKyH 



*_* 



msa72034 . 2 { 173_090 
msa72034 . 2 { 173_18RS21 
msa72 03 4 . 2 { 173_2 6 03 
msa72034 .2{173_A909 
msa72034 . 2 { 173_CJB110 
msa72034 . 2 { 173_C0H1 
msa72034.2(173_M732 
msa7 2 03 4 . 2 { 173_M7 8 1 
msa72034 . 2 { 173_1169NT 
msa72034 . 2 {173^H36B 
msa72034 .2 {173_JM9130013 
Consensus 



551 

GPNVKWQRII 
GFNVKWQRI I 
GPNVKWQRII 
GFNVKWQRI I 
GPNVKWQRII 
GPNVKWQRII 
GPNVKWQRII 
GPNVKWQRII 
GPNVKWQRII 
GPNVKWQRII 
GPNVKWQRII 



DKEVKPStgL 
DKEVKPStgL 
DKEVKPStgL 
DKEVKPStgL 
DKEVKPStgL 
DKEVKPSadL 
DKEVKPSadL 
DKEVKPSadL 
DKEVKPStgL 
DKEVKPStgL 
DKEVKPStgL 



IQPTNSLPKA 
IQPTNSLPKA 
IQPTNSLPKA 
IQPTNSLPKA 
IQPTNSLPKA 
IQPTNSLPKA 
IQPTNSLPKA 
IQPTNSLPKA 
IQPTNSLPKA 
IQPTNSLPKA 
IQPTNSLPKA 



HSSLVNLEEN 
HSSLVNLEEN 
HSSLVNLEEN 
HSSLVNLEEN 
HSSLVNLEEN 
HSSLVNLEEN 
HSSLVNLEEN 
HSSLVNLEEN 
HSSLVNLEEN 
HSSLVNLEEN 
HSSLVNLEEN 



600 

SQVTQVSISK 
SQVTQVSISK 
SQVTQVSISK 
SQVTQVSISK 
SQVTQVSISK 
SQVTQVSISK 
SQVTQVSISK 
SQVTQVSISK 
SQVTQVSISK 
SQVTQVSISK 
SQVTQVSISK 



msa72034.2{l73 090 
msa72034.2{l73_18RS21 
msa72034 . 2 { 173_2603 
msa72034 . 2 { 173_A909 
msa72034 . 2 { 173_CJB110 
msa72034 . 2 ( 173_COHl 
msa72034^2(173 M732 
msa7 2 03 4 . 2 { 173~M7 8 1 
rasa72034 . 2 { 173_1169NT 
msa72034 . 2{173_H36B 
msa72034 . 2 { 173_JM9130013 
Consensus 



601 

KWMKSSVKNK 
KWMKSSVKNK 
KWMKSSVKNK 
KWMKSSVKNK 
KWMKSSVKNK 
KWMKSSVKNK 
KWMKSSVKNK 
KWMKSSVKNK 
KWMKSSVKNK 
KWMKSSVKNK 
KWMKSSVKNK 



619 

psvraayqka 
psvraayqka 
psvmayqka 
psvmayqka 
psvmayqka 
psvmayqka 
psvmayqka 
psvmayqka 
psvmayqka 

psvmay 
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SEQ ZD NO: 4901 
STRAIN 2603 

aaacatccgatacttaatgatcaaaaatccttagcaattgttgaacagat 
agaatatgattttgataaattcgataattcagaagcttctttttatgcaa 
cattagctagawttcgcgttatggatagagaaatcaaaaaatttattaga 
gaaaatccaaatagtcaaatcctttcaattggttgtggacttgatacaag 
gtttgaaagagtcgataatggacaaattaggtggtataaccttgatttgc 
cagaggttatggaga taagaaaat ta 1 1 1 1 1 1 gaagagcatgaaagag 1 t 
actaatatagcaaaatcagccctagatgaaacttggacacgggaggtaaa 
tccccaaaatgccccttttctaatcgtgtcagaaggtgttttaatgtttc 
taaaagaagatgacgtagagacttttcttcatatcctgacaaattcattt 
agccaatttatggcacaatttgatttgtgtcataaggaaatgattaataa 
aggaaagcaacatgatacagtaaagtatatggatacagaatttcagtttg 
gtatcacagatggtcatgagattgtggatttagaccctaaattaaagcaa 
ataaatctgattaactttacagatgagatgagcaaatttgagttaggcac 
acttcgctctttacttccaacaattcgtaaatttaataattgtttaggtg 
tgtacgaatataaagcatc 

SEQ ID NO: 4902 
STRAIN 090 

TAATGATCMAAATCCTTAGCAATTGTO 

ATAAATTCGATAATTCAQAAGCTT L"rJ."l"lTATGCAACATTAGCTAGAATT 

CGCGTTATGGATAGAGAAATCAAAAAATTTATTAGAGAAAATCCAAATAG 

TCAAATCCTTTCAATTGGTTGTGGACrTGAT^ 

ATAATGGAC^UVATTAGGTGGTATAACCTTGATTTGCCAGA 

ATAAGAAAATTATTTTTTGAAGAG CATGAAAGAGTTACTAATAT AGCAAA 

ATCAGCCATAGATGAAACTTGGACACGGGAGCTAAATCCCCAA 

CTTTTCTAATCXSTGTCAGAAGGTGTTTT^ 

GTAGAGACTTTTCTTCATATCCTGACAAAT^ 

ACAATTTGATTTGTGTC^TAAGGAAATGATTAATAAAGGAAAG 

ATACAGTAAAGTATATGGATACAGAATTTCAGTTTGCT 

CATGAGATTGTGGATTTAGACCCTAAATTAAAGCAAATAAAT 

CTTTACAGATGAGATGAGCAAATTTGAGTTAGG CACACTTCGCTCTTTAC 

TTCCAACAATTCGTAAATTTAATAATTGTTTAGG 

GCATC 

SEQ ID NO: 4903 
STRAIN A909 

AAACATCCGATACTTAATGA 

TCAAAAATCCTTAGCAATTGTTGAACAGATAGAATATG^ 
TCGATAATTCAGAAGClTTCTTriTATG CAACATTAGCTAGAATTCGCGTT 
ATGGATAGAGAAATCAAAAAATTTATTAGAGAAAATCCAAATAGTCAAAT 
CcTTTCaATTGGTTGTGGACTTGATACAAGGTTTG^ 

GACAAATTAGGTGGTAT AAC CITGATTTG C CAGAGGTTATGGAGATAAGA 
AAATTaTTTTTTGAAGAG CATGAAAGAGTTACTAATATAGCAAAATCAGC 
CCrAGATGaAACTTGGACACGGGAGGTAAATCCCXAAAATGCC^ 
T AATCGT GTCAGAAGGTGTTTTAATGTTtCTtAAAAG 
ACTTTTcTTCATATCCTGACAAATTCATTT^ 

TGATTTGTGTCATAAGGAAATGATTAATAAAGGAAAGCAACATGAT^ 
TAAAGTATATGGATACAGAATTTCAGTTTGGTATCACAGA 
ATTGTGGATTTAGACCCTAAATTAAAGCAAATAAATCT 
AGATGAGATGAGCAAATTTGAGTTAGG CACACTTCGCTCTTTAjCTTCCAA 
CAATTCGTAAATTTAATAATTGTTTAGGTGTGTACX^ 

SEQ ID NO: 4904 
STRAIN H36B 

AAACATCCGATACTTAATGATCAAAAATCCTTAGCA 
ATTGTTGAACAGATAGAATATGATTTTGATAAATTCGATAA 
TTCTTTTTATGCAa CATTAGCTAGAATTCGCGTTATGGATAG AGAAAT CA 
AAAAATTTATTAGAGAAAATCCAAATAGTCATATC<nTTCAATTGGCIX^ 
GgACTTGATACAAGGTTTGAAAGAGTCGATAATGGACAAATrAGGTGGT^ 
TAACCTTGATTTGCCAGAGGTTATGGAGAT^ 
' AGCATGAAAGAGTTACTAATATAG CAAAATCAGCCcTAGATGAAAClTGG 
ACACGGG AG GTAAA TCCCCAAAATGCCCCTTTTCT AATCG TGTCAGAAGG 
TGTTTTAATGTTTOTAAAAGAAGATGACGTAGA 
TGACAAATTCATTTAGCCAATTTATGGCACAATTTGA1 
GAAATGATTAATAAAGGAAAGCAACATGATACAGTAAAGTATATGGATAC 
AGAATTTCAGTTGGGTATCACAGATGGTCATGAAATTGTGG 
CTAAATTAAAGCAAATAAATCTGATTAACTTTACAGA^ 
TTTGAGTTAGGCACACTTCG CTCTTTACTTCCAACAATTCGTAAATTTAA 
TAATTGTTTAGGTGTGTACGAATATAAAGCATC 

SEQ ID NO: 4905 
STRAIN 18RS21 

AAC7VTCCGATACTTAATGATCAAAAATCCTTAGCAAT 

TGTTGAACAGATAGAATATGATTTTGATAAAT^ 

CTTTTTATGCAACATTAGCTAGAATTC^ 

AAATTTATTAGAGAAAATCCAAATAGTCaAATCCTTTCA 

ACTTGATACAAGGTITGAAAGAGTCGATAATGGAC^ 

ACCTTGATTTGCCAGAGGTTATGGAGATAAGAAAATTATT^ 

CATGAAAGAGTTACTAATATAGCAAAATCAGC<XTAGATGAAAC^ 

ACGGGAGQTAAA TCCCCAAAATGCCCCTTTTCT AATC^ 

TTTTAftlQTTTCTAAAAGAAGATGACG^ 



830 



WO 2004/018646 



PCT/US2003/026827 



Table 49: Comparative Sequences related to SAG1502 



ACAAATTCATTTAGCQ\ATTTATGGCACa 

AATGATTAATAAAGGAAAG CAACATGATACAGTAAAGTATATGGAT ACAG 

AATTTCAGTTTGGTATCACAGATGGTCATGAGATT^ 

AAATTAAAG CAAATAAATCTGATTAACTTTACAGATGAGATGAGCAAATT 

TGAGTTAGGCACACTTCXSCTCTTTACTTCCAACAATTC^ 

ATTGTTTAGGTGTGTACGAAtATAaaGCATC 

SEQ ID NO; 4906 
STRAIN M732 

AAACATCCXIRT ACTTAATGATCAAAAATCCTT AG CAATTGTTGAACA 

GATAGAATATGATTTGGATAAATTCXATAATTCAGAAGL-rrClU-l-lTATG 

CAACATTAGCTAGAATTCGCGTTATGGATAGAGAAATCAAAAAA^ 

AGAGAAAATCCAAATAGTCAAATCCTTTCAATTGG?rTG 

AAGGTTTGAAAGAGTCX^TAATGGACAAATTAGGTGGTATAACCTTGA^ 

TGCCAGAGGTTATGGAGATAAGAAAATTATTTTTTGAA^ 

GTTACTAATATAGCAAAAT CAGCCCTAGATGAAACTTGGACAC^^ 

AAATCCCCAAAATGCCCCTTTTCTAATCGTGTCAGAA 

TTCTAAAAgAAGATGACGTAGAGACTTTTCrrCAtAT 

TTTAGCCAATTTATGGCaCAATTTGATTTGTGTCATAAGG 

TAAAGGAAAGCAACATGATACAGTAAAGTATATGGATACAGAATTTCAGT 

TTGGTATCACAGATGGTCATGAGATTGTGGATTTAGACCCT 

CAAATAAATCTGATT AACTTTACAGATGAGATGAG CAAATTTGAGTTAgG 

CACAC?ITCGCTCTTTACTTCCAACAATTCX3TA 

G t GTGTAOGAAT ATAAAGCATC 

SEQ ZD NO i 4907 
STRAIN COH1 

AAACATCCGATACTTAATGATCAAAAATCCTTAGCAA 
TTGTTGAACAGATAGAATATGATTTGGATAAATTCG^ 
TCTTTTTATGCMCATTAGCTAGAATTCGCGT^ 

AAAATTTATTAGAGAAAATCCAAATAGTCAAATCCTTTCAATTGGT^ 

GACTTGATACAAGGTTTGAAAGAGTCGATAATGGACAAATTAGGTGG 

AACCTTGATTTGCCAGAGGTTATGGAGATAA^ 

GCATGAAAGAGTTACTAATATAGCAAAATCAGCC 

CACGGGAGGTAAATCCCCAAAATGCCCCTTTTCTAATC^ 

GTTTTAATGTTTCTAAAAGAAGATGACGTAGAG^ 

GACAAATTCATTTAGCCAATTTATGGCACAATTTGATT^ 

AAATGATTAATAAAGGAAAGCAACATGATACAGTAAAGTATATGGATACA 

GAATTTCAGTTTGGTATCACAGATGGTCATGAGA 

TAAATTAAAGCAAATAAATCTGATTAACTTTACAGATGAGATGAG CAAAT 

TTGAGTTAGGCACACTTCGCTCTTTACTTCCAACAATTCGTA 

AATTGTTTAGGTGTGTACGAATATAAAGCATC 

SEQ ID NOt 4908 
STRAIN M781 

AAACATCCGATACTTAATGATCA 

AAAATOCTTAGCAATTGTTGAACAGATAGAATATGATT^ 
ATAATTCaSAAGCTTCTTTTTATC 

GATAGAGAAATCAAAAAATTTATTAGAGAAAATCCAAATAGTCAAATCCT 
TTCAATTGGTTGTGGACrrGATACAAGGTTTGAA 

AAATTAGGTGGTATAACCTTGATTTGCCAGAGGTTATGGAGATAAGAA 
TTATTTTTTGAAGAG CATGAAAGAGTTACTAATATAGCAAAATCAGCCCT 
AGATCAAACTTGGACACGGGAGGTAAATCCCCAAAAT^ 
TCXrTGTCAGAAGGTGTTTTAATGTTTCT 

TTTCTTCATATCCTGACAAAT t CATTTAGCCAATTTAt GGCACAATTTGA 

TTTGTGTCATAAGGAAATGATTAATAAAGGAAAGCAACATGATAGACT 

AGTATATGGATAC1AGAATTTCAGTTTGCTAT 

GTGGATTTAgACCCTAAATTAAAGCAAATAAATCTOATT 

TGAGATGAGCAAATTTGAGTTAGGCACACTTCGCrCrriACTT 

TTCGTAARTTTAATAAT tGTTTAGGTGTGTACGAATATAAAG CATC 

SEQ ID NOt 4909 
STRAIN CJB1X0 

AAACATCOQATACTTAATGATCAAAAATCCTTAGCAA 
TTGTTGAACAGATAGAATATGATTTTGATAAA!^^ 
TCTTTTTATGCAACATTAGCTAGAATTCGCGT^ 
AAAATTTATTAGAGAAAATCGAAATAGTGAAA 
GACTTGATACAAGGTTTGAAAGAGTCGATAATGGACAA 
AACCITGATTTGCTCAGAGGTTATGGAGATAAGAAAAT^ 
GCATCAAAGAGTTACTAATATAGCAAAATCAGCC^ 
CACGGGAGGTAAATCCCCAAAATGCCCCTTITCTAATCG^ 
GTTTTAATI»IT1V1VUVAAQAAGATGACGTAG^ 
' GACAAATTCATrrAGCCAATTrATGGCACAATTTGAl 
• AAATGATTAATAAAGGAAAGCAACATGATACAGTAAAGTAT^ 
GAATTTCAGTTTGGTATCACAGATGGTCAT^ 
TAAATTAAAGCAAATAAAT CTGATTA ACTTrACAGATGAGA^ 
TTGAGTTAGGCACACTTCG CTCTTTACnTCCAACAATTCGTAAATTTAAT 
AATTGTTTAGGTGTGTACGAATATAAAGCATC 

SEQ ID NOt 4910 
STRAIN 1X6 9NT 

AAACATOCGATACTTAATGATCAAAAATCCT^ 
TGTTGAACAGATAGAATATGATTTTGATAAATTCGATA^ 
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CTTTTTATGCAACATTAGCTAGAATTO 

AAATTTATTAGAGAAAATCCAAATAGTCATATCXTITTCrATTGGTTGTGG 

ACTTGATACAAGGTTTGAAAGAGTCGATAATGGACAAATTAGGTGGTATA 

ACCITGATTTGCCAGAGGTTATGGAGATAAGAAAATTATTT^ 

CATGAAAGAGTTACTAATATAGCTVAAATCAGCCCTAGATGAAACrTGGAC 

ACAGGAGGTAAATCCCCAAAATGCCCC1T1TCTGATCGTGTCAGAA 

TTTTAATGTTTCTAAAAGAAGATGACXnAGAGACTTTTcTT^ 

ACAAATTCATTTAGCCAATTTATGG C^CAATTTGATTTGTG t CAGAAGGA 

AATG ATTAATAAA6GAAAG CAACATGATACAGTAAAGTATATGGATACAG 

AATTTCAGTTTGGTATCACAGATGGTCATGAAAT^ 

AAATTAAAG CAAATAAATCTGATTAACTTTACAGATGAGATGAGCAAATT 

TGAGTTAGGCACACTTaSCTCrrTTACTTCCAACAA^ 

ATTGTTTAGGTGTGTACGAATATAAAGCATC 

SEQ ID NO j 4911 
STRAIN JM9130013 

AGCAATTGTTGAACAGATAGAATATGATT 
TTGATAAATTCX^TAATTCAGAAGCTTCT^ 

ATTCG CGTTATGGAT AGAGAAATCAAAAAATTTATTAGAGAAAATCXZAAR. 

TAGTCATATCCTTTCAATTGGCTOTGGACTTGAT^ 

TCGATAATGGACAAATTAGGTGGTATAACCTTGATTTC 

GAGATAAGAAAAOTATTTTTTGAAGAGCATGAAAGAGTTACTAATATAG C 

AAAATCAGCCCTAGATGAAACTTGGACACGGG^ 

CCCCTTTTCTAATCGTGTCAGAAGGTGTTTTAA 

GACX5TAGAGAL"rilTCUU'CATATCCTGACAAATTCATTTAGCCAA 

GGCACAATTTGATTTGTGTCAgAAGGAAATGA 

ATGATACAGTAAAGTATATGGATACTIGAATTTCA^ 

GGTCATGAAATTGTGGATTTAGACCCrAAATTAAAGCAAA 

TAACITTACAGATGAGATGAGCAAATTTGAGT^ 

TACTTCCAACAATTCGTAAATTTAATAATTGTTTAGG^ 

AAAGCATC 
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msa42193 
msa42193.2 
msa42193.2 



2{l76_090 
fl76_CJB110 
(176_18RS21 



msa42193 . 2 ( 176__2603 
msa42193 . 2 \ 176_A909 
msa42193 . 2 { 17 SJ20H1 ' 
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AAACATCCGA 
-AACATCCGA 
AAACATCCGA 
AAACATCCGA 
AAACATCCGA 
AAACATCCGA 
AAACATCCGA 
AAACATCCGA 



taatga 

TACTtaatga 
TACT taatga 
TACTtaatga 
TACTtaatga 
TACTtaatga 
TACTtaatga' 
TACTtaatga 
TACTtaatga 



tcaaaaatcc 
tcaaaaatcc 
tcaaaaatcc 
tcaaaaatcc 
tcaaaaatcc 
tcaaaaatcc 
tcaaaaatcc 
tcaaaaatcc 
tcaaaaatcc 



AAACATCCGA TACTtaatga tcaaaaatcc 



ttAGCAATTG 
ttAGCAATTG 
ttAGCAATTG 
ttAGCAATTG 
ttAGCAATTG 
ttAGCAATTG 
ttAGCAATTG 
ttAGCAATTG 
ttAGCAATTG 
— AGCAATTG 
ttAGCAATTG 
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TTGAACAGAT 
TTGAACAGAT 
TTGAACAGAT 
TTGAACAGAT 
TTGAACAGAT 
TTGAACAGAT 
TTGAACAGAT 
TTGAACAGAT 
TTGAACAGAT 
TTGAACAGAT 
TTGAACAGAT 



msa42193 . 2 { 176_090 
msa42193 . 2 ( 176_CJB110 ' 
maa42193 . 2 { 176JL8RS21 
msa42193 . 2 fl76_2603 
msa42193 .21 176_A909 
msa42 193 .2 176_COHl 
msa42193 .2 176_M732 
msa42193.2 176_M781 
msa42193 . 2 { 176_H36B 
msa42193 . 2 { 176_JM9130013 
msa42193.2{l76_1169NT 
Consensus 
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AGAATATGAT 
AGAATATGAT 
AGAATATGAT 
AGAATATGAT 
AGAATATGAT 
AGAATATGAT 
AGAATATGAT 
AGAATATGAT 
AGAATATGAT 
AGAATATGAT 
AGAATATGAT 



TTtGATAAAT 
TTtGATAAAT 
TTtGATAAAT 
TTtGATAAAT 
TTtGATAAAT 
TTgGATAAAT 
TTgGATAAAT 
TTgGATAAAT 
TTtGATAAAT 
TTtGATAAAT 
TTtGATAAAT 



TCGATAATTC 
TCGATAATTC 
TCGATAATTC 
TCGATAATTC 
TCGATAATTC 
TCGATAATTC 
TCGATAATTC 
TCGATAATTC 
TCGATAATTC 
TCGATAATTC 
TCGATAATTC 



AGAAGCTTCT 
AGAAGCTTCT 
AGAAGCTTCT 
AGAAGCTTCT 
AGAAGCTTCT 
AGAAGCTTCT 
AGAAG CTTC T 
AGAAGCTTCT 
AGAAGCTTCT 
AGAAGCTTCT 
AGAAGCTTCT 
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TTTTATGCAA 
TTTTATGCAA 
TTTTATGCAA 
TTTTATGCAA 
TTTTATGCAA 
TTTTATGCAA 
TTTTATGCAA 
TTTTATGCAA 
TTTTATGCAA 
TTTTATGCAA 
TTTTATGCAA 



msa42193 . 2 { 176_090 
rasa42193 . 2 { 176_CJB110 ' 
msa42193.2{176 18RS21 
msa42193 . 2 f 176_2603 
msa42193 . 2 176_A909 
msa42193.2 176 COH1 
msa42193 . 2 176_M732 
msa42193.2 176_M781 
msa42193.2{l76 H36B 
msa42193 . 2 (176_JM9130013 
msa42193 . 2 { 176_1169NT 
Consensus 



101 

CATTAGCTAG 
CATTAGCTAG 
CATTAGCTAG 
CATTAGCTAG 
CATTAGCTAG 
CATTAGCTAG 
CATTAGCTAG 
CATTAGCTAG 
CATTAGCTAG 
CATTAGCTAG 
CATTAGCTAG 



AaTTCGCGTT 
AaTTCGCGTT 
AaTTCGCGTT 
AwTTCGCGTT 
AaTTCGCGTT 
AaTTCGCGTT 
AaTTCGCGTT 
AaTTCGCGTT 
AaTTCGCGTT 
AaTTCGCGTT 
AaTTCGCGTT 



ATGGATAGAG 
ATGGATAGAG 
ATGGATAGAG 
ATGGATAGAG 
ATGGATAGAG 
ATGGATAGAG 
ATGGATAGAG 
ATGGATAGAG 
ATGGATAGAG 
ATGGATAGAG 
ATGGATAGAG 



AAATCAAAAA 
AAATCAAAAA 
AAATCAAAAA 
AAATCAAAAA 
AAATCAAAAA 
AAATCAAAAA 
AAATCAAAAA 
AAATCAAAAA 
AAATCAAAAA 
AAATCAAAAA 
AAATCAAAAA 



150 

ATTTATTAGA 
ATTTATTAGA 
ATTTATTAGA 
ATTTATTAGA 
ATTTATTAGA 
ATTTA TTAGA 
ATTTATTAGA 
ATTTATTAGA 
ATTTATTAGA 
ATTTATTAGA 
ATTTATTAGA 



msa42193.2{l76J)90 
msa42193 . 2 { 176_CJB110 
msa42193 . 2 { 176_18RS21 
rasa42 193.2(176 2603 
msa4 2193 . 2 { 176~A909 
msa42193.2{176 CO HI 



151 

GAAAATCCAA 
GAAAATCCAA 
GAAAATCCAA 
GAAAATCCAA 
GAAAATCCAA 
GAAAATCCAA 



ATAGTCAaAT 
ATAGTCAaAT 
ATAGTCAaAT 
ATAGTCAaAT 
ATAGTCAaAT 
ATAGTCAaAT 



CCTTTCaATT 
CCTTTCaATT 
CCTTTCaATT 
CCTTTCaATT 
CCTTTCaATT 
CCTTTCaATT 



GGtTGTGGAC 
GGtTGTGGAC 
GGtTGTGGAC 
GGtTGTGGAC 
GGtTGTGGAC 
GGtTGTGGAC 



200 

TTGATACAAG 
TTG ATACAAG 
TTGA TACAAG 
TTGATACAAG 
TTGATACAAG 
TTGATACAAG 



832 



WO 2004/018646 



PCT/US2003/026827 



Table 49: Comparative Sequences related to SAG1S02 



msa42193 . 2 ( 176J4732 
msa42193.2{l76Jf781 
msa4il93 . 2 { 176_H36B 
msa42193.2{l76_JM9130013 
msa42193 . 2 { 176 JL169NT 
Consensus 



GAAAATCCAA ATAGTCAaAT CCTTTCaATT 
GAAAATCCAA ATAGTCAaAT CCTTTCaATT 
GAAAATCCAA ATAGTCAtAT CCTTTCaATT 
GAAAATCCAA ATAGTCAtAT CCTTTCaATT 
GAAAATCCAA ATAGTCAtAT CCTTTCtATT 



GGtTGTGGAC TTGATACAAG 
GGtTGTGGAC TTGATACAAG 
GGcTGTGGAC TTGATACAAG 
GGTTGTGGAC TTGATACAAG 
GGtTGTGGAC TTGATACAAG 



msa42193 . 2 { 176_090 [ 
msa42193 . 2 [ 176_CJB110 
msa42193 . 2 { 176JL8RS21 
msa42193 . 2 { 176_2603 ' 
msa42193 . 2 \ 176_A909 
msa42193.2 \176jCOHl 
nisa42X93 . 2 176_M732 
msa42193.2 176_M781 
msa42 193 . 2 { 176_H3 6B 
msa42193 . 2 { 176_JM9130013 
tnsa42193 . 2 { 176_1169NT 
Consensus 



201 

GTTTGAAAGA 
GTTTGAAAGA 
GTTTGAAAGA 
GTTTGAAAGA 
GTTTGAAAGA 
GTTTGAAAGA 
GTTTGAAAGA 
GTTTGAAAGA 
GTTTGAAAGA 
GTTTGAAAGA 
GTTTGAAAGA 



GTCGATAATG 
GTCGATAATG 
GTCGATAATG 
GTCGATAATG 
GTCGATAATG 
GTCGATAATG 
GTCGATAATG 
GTCGATAATG 
GTCGATAATG 
GTCGATAATG 
GTCGATAATG 



GACAAATTAG 
GACAAATTAG 
GACAAATTAG 
GACAAATTAG 
GACAAATTAG 
GACAAATTAG 
GACAAATTAG 
GACAAATTAG 
GACAAATTAG 
GACAAATTAG 
GACAAATTAG 



GTGGTATAAC 
GTGGTATAAC 
GTGGTATAAC 
GTGGTATAAC 
GTGGTATAAC 
GTGGTATAAC 
GTGGTATAAC 
GTGGTATAAC 
GTGGTATAAC 
GTGGTATAAC 
GTGGTATAAC 



250 

CTTGATTTGC 
CTTGATTTGC 
CTTGATTTGC 
CTTGATTTGC 
CTTGATTTGC 
CTTGATTTGC 
CTTGATTTGC 
CTTGATTTGC 
CTTGATTTGC 
CTTGATTTGC 
CTTGATTTGC 



msa42193 . 2 { 176_090 ' 
msa42193.2(l76 CJB110 
msa42193 . 2 {176~18RS21 ( 
tnsa42193 . 2 f 176_2603 
msa42193 . 2 \ 176_A909 j 
msa42193 . 2 < 176_C0H1 
msa42193.2- 176~M732 ( 
msa42193.2 176_M781 
msa42193 . 2 { 176_H36B 
msa42193 . 2{l76_JM9130013 
msa42193.2{l76_1169NT 
Consensus 



251 

CAGAGGTTAT 
CAGAGGTTAT 
CAGAGGTTAT 
CAGAGGTTAT 
CAGAGGTTAT 
CAGAGGTTAT 
CAGAGGTTAT 
CAGAGGTTAT 
CAGAGGTTAT 
CAGAGGTTAT 
CAGAGGTTAT 



GGAGATAAGA 
GGAGATAAGA 
GGAGATAAGA 
GGAGATAAGA 
GGAGATAAGA 
GGAGATAAGA 
GGAGATAAGA 
GGAGATAAGA 
GGAGATAAGA 
GGAGATAAGA 
GGAGATAAGA 



AAATTATTTT 
AAATTATTTT 
AAATTATTTT 
AAATTATTTT 
AAATTATTTT 
AAATTATTTT 
AAATTATTTT 
AAATTATTTT 
AAATTATTTT 
AAATTATTTT 
AAATTATTTT 



TTGAAGAGCA 
TTGAAGAGCA 
TTGAAGAGCA 
TTGAAGAGCA 
TTGAAGAGCA 
TTGAAGAGCA 
TTGAAGAGCA 
TTGAAGAGCA 
TTGAAGAGCA 
TTGAAGAGCA 
TTGAAGAGCA 



300 

TGAAAGAGTT 
TGAAAGAGTT 
TGAAAGAGTT 
TGAAAGAGTT 
TGAAAGAGTT 
TGAAAGAGTT 
TGAAAGAGTT 
TGAAAGAGTT 
TGAAAGAGTT 
TGAAAGAGTT 
TGAAAGAGTT 



msa421 93 . 2 { 17 6_0 9 0 ] 
msa42193 . 2 { 176_CJB110 
msa42193 . 2 { 176_18RS21 
msa42193 .2 (176_2603 ' 
msa42193.2(176_A909 
insa42193 . 2 1 176_COHl' 
msa42193 .2 176_M732 
insa42193 . 2 176_M781 
msa42193 . 2 (176~H36B 
msa42193 . 2 {176_OM9130013 
msa42193.2{l76_1169NT 
Consensus 



301 

ACTAATATAG 
ACTAATATAG 
ACTAATATAG 
ACTAATATAG 
ACTAATATAG 
ACTAATATAG 
ACTAATATAG 
ACTAATATAG 
ACTAATATAG 
ACTAATATAG 
ACTAATATAG 
********** 



CAAAATCAGC 
CAAAATCAGC 
CAAAATCAGC 
CAAAATCAGC 
CAAAATCAGC 
CAAAATCAGC 
CAAAATCAGC 
CAAAATCAGC 
CAAAATCAGC 
CAAAATCAGC 
CAAAATCAGC 
********** 



CaTAGATGAA 
CaTAGATGAA 
CcTAGATGAA 
CcTAGATGAA 
CcTAGATGAA 
CcTAGATGAA 
CcTAGATGAA 
CCTAGATGAA 
CcTAGATGAA 
CcTAGATGAA 
CcTAGATGAA 



ACTTGGACAC 
ACTTGGACAC 
ACTTGGACAC 
ACTTGGACAC 
ACTTGGACAC 
ACTTGGACAC 
ACTTGGACAC 
ACTTGGACAC 
ACTTGGACAC 
ACTTGGACAC 
ACTTGGACAC 



*.******** ********** 



350 

gGGAGGTAAA 
gGGAGGTAAA 
gGGAGGTAAA 
gGGAGGTAAA 
gGGAGGTAAA 
gGGAGGTAAA 
gGGAGGTAAA 
gGGAGGTAAA 
gGGAGGTAAA 
gGGAGGTAAA 
aGGAGGTAAA 
.********* 



msa42193 . 2 { 176_090 
msa42193 . 2 { 176 CJB110 
msa42193 . 2 { 176_18RS2 1 
msa42193 .2{176_2603 
msa42193 . 2 { 176_A909 
msa42 193 .2 176_C0H1 
msa42193 .2 176_M732 
msa42193 .2 176 J4781 
maa42193 . 2 { 176 _H36B 
msa42193 . 2 { 176_JM9130013 
msa42193.2{l76_1169NT 
Consensus 



351 

TCCCCAAAAT 
TCCCCAAAAT 
TCCCCAAAAT 
TCCCCAAAAT 
TCCCCAAAAT 
TCCCCAAAAT 
TCCCCAAAAT 
TCCCCAAAAT 
TCCCCAAAAT 
TCCCCAAAAT 
TCCCCAAAAT 
********** 



GCCCCTTTTC 
GCCCCTTTTC 
GCCCCTTTTC 
GCCCCTTTTC 
GCCCCTTTTC 
GCCCCTTTTC 
GCCCCTTTTC 
GCCCCTTTTC 
GCCCCTTTTC 
GCCC CTTTT C 
GCCCCTTTTC 
********** 



TaATCGTGTC 
TaATCGTGTC 
TaATCGTGTC 
TaATCGTGTC 
TaATCGTGTC 
TaATCGTGTC 
TaATCGTGTC 
TaATCGTGTC 
TaATCGTGTC 
TaATCGTGTC 
TgATCGTGTC 
*>******** 



AGAAGGTGTT 
AGAAGGTGTT 
AGAAGGTGTT 
AGAAGGTGTT 
AGAAGGTGTT 
AGAAGGTGTT 
AGAAGGTGTT 
AGAAGGTGTT 
AGAAGGTGTT 
AGAAGGTGTT 
AGAAGGTGTT 
********** 



400 

TTAATGTTTC 
TTAATGTTTC 
TTAATGTTTC 
TTAATGTTTC 
TTAATGTTTC 
TTAATGTTTC 
TTAATGTTTC 
TTAATGTTTC 
TTAATGTTTC 
TTAATGTTTC 
TTAATGTTTC 
********** 



msa42193 . 2 { 176_090 ) 
msa42193.2(l76 - CJB110 
msa42193 . 2 { 176_18RS21 
msa42193 . 2 ( 176_2603 
msa42193 .2 Vl76_A909' 
msa42193.2 176_COHl' 
msa42193.2 176 M732 
msa42193 .2 176_M781 
msa42193 . 2 { 176_H36B 
msa42193 . 2 { 176_JM9130013 
roaa42193 . 2 { 176JL169NT 
Consensus 



401 

TAAAAGAAGA 
TAAAAGAAGA 
TAAAAGAAGA 
TAAAAGAAGA 
TAAAAGAAGA 
TAAAAGAAGA 
TAAAAGAAGA 
TAAAAGAAGA 
TAAAAGAAGA 
TAAAAGAAGA 
TAAAAGAAGA 



TGACGTAGAG 
TGACGTAGAG 
TGACGTAGAG 
TGACGTAGAG 
TGACGTAGAG 
TGACGTAGAG 
TGACGTAGAG 
TGACGTAGAG 
TGACGTAGAG 
TGACGTAGAG 
TGACGTAGAG 



ACTTTTCTTC 
ACTTTTCTTC 
ACTTTTCTTC 
ACTTTTCTTC 
A CTTTTCTTC 
ACTTTTCTTC 
ACTTTTCTTC 
ACTTTTCTTC 
ACTTTTCTTC 
ACTTTTCTTC 
A CTTTTCTTC 



ATATCCTGAC 
ATATCCTGAC 
ATATCCTGAC 
ATATCCTGAC 
ATATCCTGAC 
ATATCCTGAC 
ATATCCTGAC 
ATATCCTGAC 
ATATCCTGAC 
ATATCCTGAC 
ATATCCTGAC 



450 

AAATTCATTT 
AAATTCATTT 
AAATTCATTT 
AAATTCATTT 
AAATTCATTT 
AAATTCATTT 
AAATTCATTT 
AAATTCATTT 
AAATTCATTT 
AAATTCATTT 
AAATTCATTT 



msa42193.2{l76 090 
msa42X93.2(l76 CJB110 
msa42193 . 2 { 176 18RS21 
msa42 193 . 2 { 176_2603 
msa42193. 2(176 A909 



451 

AGCCAATTTA TGGCACAATT TGATTTGTGT 
AGCCAATTTA TGGCACAATT TGATTTGTGT 
AGCCAATTTA TGGCACAATT TGATTTGTGT 
AGCCAATTTA TGGCACAATT TGATTTGTGT 
AGCCAATTTA TGGCACAATT TGATTTGTGT 



500 

CAtAAGGAAA TGATTAATAA 
CAtAAGGAAA TGATTAATAA 
CAtAAGGAAA TGATTAATAA 
CAtAAGGAAA TGATTAATAA 
CAtAAGGAAA TGATTAATAA 



833 



WO 2004/018646 



PCT/US2003/026827 



Table 49: Comparative Sequences related to SAG1502 



msa42193 . 2 { 176_C0H1 
msa42193.2<176_M732 
msa4 2 193 . 2 ( 176_M78 1 
msa4 2 1 9 3 . 2 { 176_H3 6B 
tnsa42193 . 2 {176_JM9130013 
msa42193 . 2{ 176JL169NT 
Consensus 



AGCCAATTTA TGGCACAATT TGATTTGTGT CAtAAGGAAA TGATTAATAA 
AGCCAATTTA TGGCACAATT TGATTTGTGT CAtAAGGAAA TGATTAATAA 
AGCCAATTTA TGGCACAATT TGATTTGTGT CAtAAGGAAA TGATTAATAA 
AGCCAATTTA TGGCACAATT TGATTTGTGT CAgAAGGAAA TGATTAATAA 
AGCCAATTTA TGGCACAATT TGATTTGTGT CAgAAGGAAA TGATTAATAA 
AGCCAATTTA TGGCACAATT TGATTTGTGT CAgAAGGAAA TGATTAATAA 



msa42193.2{l76_090' 
tnsa42193 . 2 f 176_CJB110 ' 
maa42193 . 2 { 176_18RS21 ' 
msa42193.2(l76 2603* 
msa42193 . 2 176~A909 ' 
msa42 193 . 2 { 176_COHl ' 
msa42193 . 2 ? 176_M732 
msa42193 .2 i 176_M78l' 
msa42193.2{176_H36B 
msa42193 . 2 { 176_JM9130013 
msa42193 . 2 { 176__1169NT^ 
Consensus 



501 

AGGAAAGCAA 
AGGAAAGCAA 
AGGAAAGCAA 
AGGAAAGCAA 
AGGAAAGCAA 
AGGAAAGCAA 
AGGAAAGCAA 
AGGAAAGCAA 
AGGAAAGCAA 
AGGAAAGCAA 
AGGAAAGCAA 



CATGATACAG 
CATGATACAG 
CATGATACAG 
CATGATACAG 
CATGATACAG 
CATGATACAG 
CATGATACAG 
CATGATACAG 
CATGATACAG 
CATGATACAG 
CATGATACAG 



TAAAGTATAT 
TAAAGTATAT 
TAAAGTATAT 
TAAAGTATAT 
TAAAGTATAT 
TAAAGTATAT 
TAAAGTATAT 
TAAAGTATAT 
TAAAGTATAT 
TAAAGTATAT 
TAAAGTATAT 



GGATACAGAA 
GGATACAGAA 
GGATACAGAA 
GGATACAGAA 
GGATACAGAA 
GGATACAGAA 
GGATACAGAA 
GGATACAGAA 
GGATACAGAA 
GGATACAGAA 
GGATACAGAA 



550 

TTTCAGTTtG 
TTTCAGTTtG 
TTTCAGTTtG 
TTTCAGTTtG 
TTTCAGTTtG 
TTTCAGTTtG 
TTTCAGTTtG 
TTTCAGTTtG 
TTTCAGTTgG 
TTTCAGTTtG 
TTTCAGTTtG 



msa42193.2{l76_090 
msa42193 . 2{ 176_CJB110 ' 
maa42193 . 2 { 176_18RS21 
mfla42193 . 2 (176J2603 
msa42193.2{l76 A909 
msa42193 - 2 1 176~COHl 
msa42193 .2 176~M732 
msa42193 .2 176~M781 
maa42193.2{176~H36B 
msa42193 . 2 { 176_OM9130013 
msa42193 .2{176__1169NT 
Consensus 



551 

GTATCACAGA 
GTATCACAGA 
GTATCACAGA 
GTATCACAGA 
GTATCACAGA 
GTATCACAGA 
GTATCACAGA 
GTATCACAGA 
GTATCACAGA 
GTATCACAGA 
GTATCACAGA 



TGGTCATGAg 
TGGTCATGAg 
TGGTCATGAg 
TGGTCATGAg 
TGGTCATGAg 
TGGTCATGAg 
TGGTCATGAg 
TGGTCATGAg 
TGGTCATGAa 
TGGTCATGAa 
TGGTCATGAa 



ATTGTGGATT 
ATTGTGGATT 
ATTGTGGATT 
ATTGTGGATT 
ATTGTGGATT 
ATTGTGGATT 
ATTGTGGATT 
ATTGTGGATT 
ATTGTGGATT 
ATTGTGGATT 
ATTGTGGATT 



TAGACCCTAA 
TAGACCCTAA 
TAGACCCTAA 
TAGACCCTAA 
TAGACCCTAA 
TAGACCCTAA 
TAGACCCTAA 
TAGACCCTAA 
TAGACCCTAA 
TAGACCCTAA 
TAGACCCTAA 



600 

ATTAAAGCAA 
ATTAAAGCAA 
ATTAAAGCAA 
ATTAAAGCAA 
ATTAAAGCAA 
ATTAAAGCAA 
ATTAAAGCAA 
ATTAAAGCAA 
ATTAAAGCAA 
ATTAAAGCAA 
ATTAAAGCAA 



rasa42193 . 2 { 176_090 
msa42193 . 2 { 176_CJB110 
rasa42193 . 2 { 176_18RS21 
msa42193 . 2 { 176_2603 
msa42193 . 2 f 176_A909 
msa42193 . 2 176_C0H1 
rasa42193.2 176_M732 
msa42193 . 2 { 176_M781 
msa42193 . 2 { 176_H36B 
msa42193.2{l76_JM9130013 
msa421 93 . 2 { 176_1169NT 
Consensus 



601 

ATAAATCTGA 
ATAAATCTGA 
ATAAATCTGA 
ATAAATCTGA 
ATAAATCTGA 
ATAAATCTGA 
ATAAATCTGA 
ATAAATCTGA 
ATAAATCTGA 
ATAAATCTGA 
ATAAATCTGA 



TTAACTTTAC 
TTAACTTTAC 
TTAACTTTAC 
TTAACTTTAC 
TTAACTTTAC 
TTAACTTTAC 
TTAACTTTAC 
TTAACTTTAC 
TTAACTTTAC 
TTAACTTTAC 
TTAACTTTAC 



AGATGAGATG 
AGATGAGATG 
AGATGAGATG 
AGATGAGATG 
AGATGAGATG 
AGATGAGATG 
AGATGAGATG 
AGATGAGATG 
AGATGAGATG 
AGATGAGATG 
AGATGAGATG 



AGCAAATTTG 
AGCAAATTTG 
AGCAAATTTG 
AGCAAATTTG 
AGCAAATTTG 
AGCAAATTTG 
AGCAAATTTG 
AGCAAATTTG 
AGCAAATTTG 
AGCAAATTTG 
AGCAAATTTG 



650 

AGTTAGGCAC 
AGTTAGGCAC 
AGTTAGGCAC 
AGTTAGGCAC 
AGTTAGGCAC 
AGTTAGGCAC 
AGTTAGGCAC 
AGTTAGGCAC 
AGTTAGGCAC 
AGTTAGGCAC 
AGTTAGGCAC 



msa42193.2{l76 090 
msa42193 .2f 176_CJB110 
msa42193 . 2 { 176_18RS21 ' 
msa42193. 2(176 2603* 
msa42193.2il76_A909 
maa42193 . 2 f 176_C0H1 
msa42193 .21 176_M732 
msa42 193 .2 176_M78 1 
msa4 2 193 . 2 { 176_H3 6B 
0isa42193.2{l76 JM9130013 
msa42193.2{l76_1169NT' 
Consensus 



651 

ACTTCGCTCT 
ACTTCGCTCT 
ACTTCGCTCT 
ACTTCGCTCT 
ACTTCGCTCT 
ACTTCGCTCT 
ACTTCGCTCT 
ACTTCGCTCT 
ACTTCGCTCT 
ACTTCGCTCT 
ACTTCGCTCT 



TTACTTCCAA 
TTACTTCCAA 
TTACTTCCAA 
TTACTTCCAA 
TTACTTCCAA 
TTACTTCCAA 
TTACTTCCAA 
TTACTTCCAA 
TTACTTCCAA 
TTACTTCCAA 
TTACTTCCAA 



CAATTCGTAA 
GAATTCGTAA 
CAATTCGTAA 
CAATTCGTAA 
CAATTCGTAA 
CAATTCGTAA 
CAATTCGTAA 
CAATTCGTAA 
CAATTCGTAA 
CAATTCGTAA 
CAATTCGTAA 



ATTTAATAAT 
ATTTAATAAT 
ATTTAATAAT 
ATTTAATAAT 
ATTTAATAAT 
ATTTAATAAT 
ATTTAATAAT 
ATTTAATAAT 
ATTTAATAAT 
ATTTAATAAT 
ATTTAATAAT 



700 

TGTTTAGGTG 
TGTTTAGGTG 
TGTTTAGGTG 
TGTTTAGGTG 
TGTTTAGGTG 
TGTTTAGGTG 
TGTTTAGGTG 
TGTTTAGGTG 
TGTTTAGGTG 
TGTTTAGGTG 
TGTTTAGGTG 



msa42193.2{l76_090 
msa42193 . 2 j 176_CJB110 ' 
msa42193.2{176_18RS2l' 
mfla42193.2{l76_2603' 
msa42193.2(176_A909 
msa42193 . 2 176_C0H1 ' 
msa42193.2 176 M732 
msa42193.2 1762M781 
msa42 193 . 2 { 176_H3 6B 
msa42193 . 2 { 176_JM9130013 
maa42193 . 2 { 176_1169NT; 

Consensus 



701 

TGTACGAATA 
TGTACGAATA 
TGTACGAATA 
TGTACGAATA 
TGTACGAATA 
TGTACGAATA 
TGTACGAATA 
TGTACGAATA 
TGTACGAATA 
TGTACGAATA 
TGTACGAATA 



719 

TAAAGCATC 
TAAAGCATC 
TAAAGCATC 
TAAAGCATC 
TAAAGCATC 
TAAAGCATC 
TAAAGCATC 
TAAAGCATC 
TAAAGCATC 
TAAAGCATC 
TAAAGCATC 



SBQ ID NO i 4912 

STRAIN 2603 frame: 1 

KHPILNlXJKSUVIVEQIBYDFDKFDNSEASFYATIaARXRVMDRBI KKFIREKPNSQI LS I 
GCGLOTRPERVDNGQ IRWYNLDLrPBVME I RKLPFBBHERVTNIAKSALDBTWTRBVNPQN 
APFLIVSEXJV1MFLKEDDVETFLHILTNSFS 



834 



WO 2004/018646 



PCTAJS2003/026827 



Table 49: Comparative Sequences related to SAG1502 



FQFGITDGHEIVDLDPKLKQINLINFTDEMSKFELGTLRSLLPTI RKFNNCLGVYEYKA 

SEQ ID NO j 4913 
STRAIN 090 frame: 2 

NDQKSLAIVEQI EYDFDKFDNSEASFYATLARI RVMDRE I KKFIRENPNSQI LSIGCGLD 
TRFERVDNGQI RWYNLDLPEVMBI RKLFFEBHERVTNIAKSAIDBTWTREVNPQNAPFL I 
VS EG VLM FL KEDD VET FLH I LTNS FSQFMAQ FDLCHKEM I NKGKQHDTVKYMDTE FQ FG I 
TDGHE I VDLDPKLKQ IKLI NFTDEMSKFEI/n'LRSIjLPTI RKFl^CIiGVYE 

SEQ ID NO i 4914 
STRAIN A909 frame: 1 

KHP I LNDQKSLAI VEQI EYDFDKFDNSEAS FYATLARIRVMDRE I KKFI RENPNSQILS I 
GCGLDTRFERVDNGQ I RWYNLDLPEVMBI RKLFFEEHERVTN I AKSALDETWTREVNPQN 
APFL I VS EGVLMFLKEDDVETFLH I LTNS FS QFMAQFDLCHKEM I NKG KQHDTVKYMDTE 
FQFG I TDGHE I VDLDPKLKQ INL I NFTDEMSKFBLGTLRSLLPTI RKFNNCLGVYEYKA 

SEQ ID NO: 4915 

STRAIN H36B frame : 1 

KHP I LNDQKSLAI VEQI EYDFDKFDNSBAS FYATLARI RVMDREI KKFI RENPNSHI LSI 

GCGLDTRFERVDNGQ I RWYNLDLPEVME I RKLFFEEHERVTN I AKSALDETWTREVNPQN 

APFLIVSEGVLMFLKEDDVBTFLHILTNSFSQFMAQFDLCQKEMINKGK^^ 

FQLG ITDGHE I VDLDPKLKQ INL I NFTDEMSKFEI^TLRSLLPT IRKFNNCLGVYEYKA 



SEQ ID NO: 4916 
STRAIN 18RS21 frame: 3 

HP I LNDQKSLAI VEQIEYDFDKFDNSEAS FYATLARI RVMDRB I KKF I RENPNSQI LS I G 
CGLDTRFERVDNGQ I RWYNLDLPEVME I RKLFFEEHERVTNI AKSALDETWTREVNPQNA 
PFTjIVSEGVLMFLKBDDVETFLHILTNSFSQFMAQFDIiCHK 
QFGITDGHEIVDLDPKLKQINLINFTDEMSKFEIXnTjRSLLPTIRK^ 

SEQ ID NO: 4917 

STRAIN M732 frame: 1 

KHPI LNDQKSLAI VEQIEYDLDKFDNSEAS FYATLARI RVMDREI KKFI RENPNSQI LSI 
GCGLDTRFERVDNGQ I RWYNLDLPEVME I RKLFFEEHERVTN lAKSALDETWTREVNPQN 
APFL I VSEGVLMFLKEDDVETFLH I LTNS FSQFMAQFDLCHKEM I NKGKQHDTVKYMDTE 
FQFGITDGHEIVDIiDPKLKQINLINFTDEMSKFELGTLRSLLPTIRKF 

SSQ ID NO: 4918 
STRAIN COH1 frame: 1 

KHPI LNDQKSLAI VEQI EYDLDKFDNSEAS FYATLARI RVMDRE I KKF I RENPNS Q I LS I 
GCGLDTRFERVDNGQ I RWYNLDLPEVME I RKLFFBEHERVTNIAKSALDETWTREVNPQN 
APFLI VSEGVLMFLKEDDVETFLH I LTNSFSQFMAQFDLCHKEMI NKGKQHDTVKYMDTE 
FQFGITDGHE IVDIjDPKLKQINLINFTDEMSKFELGTLRSIjLPTIRKFNNCLGV^ 



SSQ ID NO: 4919 

STRAIN M781 frame: 1 

KHPI LNDQKSLAI VEQI EYDLDKFDNSEASFYATLARIRVMDREI KKFI RENPNSQI LS I 
GCGLDTRFERVDNGQ I RWYNLDLPEVME I RKLFFEEHFJiVTN I AK^ 
ABFLIVSEGVLMFLiKEDDVETFLHILT^TSFSQFMAQFDIjCHKEMINK^ 
FQFGITDGHBIVDLDPKLKQINLINFTDEMSKFELGTLRSL^ 

SEQ ID NO: 4920 
STRAIN GJB110 frame: 1 

KHPI LNDQKSLAI VEQI EYDFDKFDNSEAS FYATLARIRVMDRE I KKFI RENPNSQI LS I 
GCGLDTRFERVDNGQ I RWYNLDLPEVME I RKLFFEEHERVTNI AKSAIDKWrREVNPQN 

FQFGITDGHEIVDIjDPKLKQINLINFTDEMSKFELGTLRS 

SEQ ID NO: 4921 

STRAIN 1169NT frame: 1 

KHPI LNDQKSLAI VEQI EYDFDKFDNSEAS FYATLARIRVMDRE I KKFI RENPNSHI LS I 
GCGLDTRFERVDNGQ I RWYNLDLPEVME I RKLFFEEHERVTN I AKSALDETWTQEVNPQN 
AP FL I VS EGVI^FLKEDDVETFLH I LTNS FS QFMAQFDLCQKEM I NKGKQHDTVKYMDTE 
FQFGITDGHE I VDLDPKLKQ I NLINFTDEMSKFELGTLRSI^PTIR 

SEQ ID NO: 4922 

STRAIN JM9130013 frame: 2 

AI VEQI EYDFDKFDNSEAS FYATLARI RVMDRE I KKF I RENPNSHI LS I GCGLDTRFERV 
DNGQ I RWYNLDLPEVME I RKLFFEEHERVTNI AKSALDETWTREVNPQNAPFL I VSEGVL 
MFLKBDDVETFLHILTNSFSQFMAQFDLCQKEMINKGKQHDTVKYMDTC 
VDLDPKLKQ INL I NFTDEMSKFBLGTLRSLLPT I RKFNN^ 

PRETTY of: /biotmp/msa42204 .2{*} January 21, 2003 OS: 05 . 



msa42204 . 2 { 176_H36B 
msa42204 . 2 { 176_JM9130013 
msa4 22 04 . 2 { 17 6JS 9 0 
msa42204. 2(176 1BRS21 
maa42204.2(l76 2603 
maa42204 . 2 {176_A909 
msa42204 . 2 { 176_CJB110 



1 * 50 

khpilndqks 1AIVEQIEYD f DKFDNSEAS FYATLARiRV MDREIKKFIR 

AIVEQIEYD f DKFDNSEAS FYATLARiRV MDREIKKFIR 

ndqks 1AIVEQIEYD f DKFDNSEAS FYATLARIRV MDREIKKFIR 

-hpilndqks 1AIVEQIEYD f DKFDNSEAS FYATLARiRV MDREIKKFIR 
khpilndqks 1AIVEQIEYD f DKFDNSEAS FYATLARxRV MDREIKKFIR 
khpilndqks 1AIVEQIEYD f DKFDNSEAS FYATLARiRV MDREIKKFIR 
khpilndqks 1AIVEQIEYD fDKFDNSEAS FYATLARiRV MDREIKKFIR 
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Table 49: Comparative Sequences related to SAG1502 



msa4 2 2 0 4 . 2 ( 17 6_COHl > 
msa42204 . 2 1 176_M732 J 
msa42204 . 2 { 176J4781 J 
msa42204 . 2 { 176_1169NT> 
Consensus 



msa42204. 2(176 H36B 
tnsa42204 . 2 { 176_JM9130013 
msa42204.2{l76_090 
msa42204 . 2 { 176_18RS21 
msa42204.2{l76_2603 
msa42204 . 2 { 176_A909 
msa42204 . 2 { 176_CJB110 
msa42204 . 2 { 176_COHl 
msa42204.2<176 M732 
msa42204 . 2 { 176~M781 
msa42204.2{l76_1169NT' 
Consensus 



msa42204.2{l76_H36B 
tnsa42204 . 2 { 176_JM9130013 
msa42204 . 2 { 176_090 
msa422 04 . 2 { 176_18RS21 
msa42204 . 2 f 17 6_2603 
msa42204.2{l76 A909 
nuaa422 04 . 2 { 176_CJB110 
msa42204 . 2 f 176_C0H1 
msa42204 . 2 ( 176_M732 
msa42204 . 2 { 176JM781 
msa42204 . 2 { 176_1169NT 
Consensus 



rasa42204 . 2 { 176_H36B 
msa42204 . 2 {l76_JM9130013 
msa42204 . 2 { 176_090 
msa42204 . 2 { 176_18RS21 
msa42204 . 2 f 176_2603 
msa42204 . 2 {176_A909 
rasa422 04 . 2 { 176 JCJB110 
rasa42204 . 2 { 176_COHl 
msa42204 . 2 { 176J032 
msa42204.2{l76_M781 
msa42204 . 2 { 176_1169NT> 
Consensus 



msa42204 .2{176_H36BJ 
msa42204 . 2 { 176_JM9130013 
msa422 04 . 2 { 176_0 90 
msa42204 - 2 { 176_18RS21 
tnsa42204 - 2 f 176_2603 
msa42204 . 2 (176_A909 
msa42204 . 2 { 176_CJB1 10 
msa42204 . 2 { 176_C0H1 
msa42204.2{l76 M732 
msa42204 . 2 { 176~M781 
msa42204 . 2 { 176_1169NT' 
Consensus 



khpilndqks 1AIVEQIBYD 1DKFDNSEAS FYATLARiRV MDREIKKFIR 
khpilndqks 1AIVEQIEYD 1DKFDNSEAS FYATLARiRV MDREIKKFIR 
khpilndqks 1AIVEQIEYD 1DKFDNSEAS FYATLARiRV MDREIKKFIR 
khpilndqks lAIVEQIEYD f DKFDNSEAS FYATIARiRV MDREIKKFIR 



51 

ENPNShlLSI 
ENPNShlLSI 
ENPNSqILSI 
ENPNSqILSI 
ENPNSqILSI 
ENPNSqILSI 
ENPNSqILSI 
ENPNSqILSI 
ENPNSqILSI 
ENPNSqILSI 
ENPNShlLSI 



GCGLDTRFER 
GCGLDTRFER 
GCGLDTRFER 
GCGLDTRFER 
GCGLDTRFER 
GCGLDTRFER 
GCGLDTRFER 
GCGLDTRFER 
GCGLDTRFER 
GCGLDTRFER 
GCGLDTRFER 



VDNGQI RWYN 
VDNGQIRWYN 
VDNGQI RWYN 
VDNGQIRWYN 
VDNGQIRWYN 
VDNGQIRWYN 
VDNGQIRWYN 
VDNGQIRWYN 
VDNGQIRWYN 
VDNGQIRWYN 
VDNGQIRWYN 



LDLPEVMEIR 
LDLPBVMEIR 
LDLPEVMEIR 
LDLPEVMEIR 
LDLPEVMEIR 
LDLPEVMEIR 
LDLPEVMEIR 
LDLPEVMEIR 
LDLPEVMEIR 
LDLPEVMEIR 
LDLPEVMEIR 



100 

KLFFEEHERV 
KLFFEEHERV 
KLFFEEHERV 
KLFFEEHERV 
KLFFEEHERV 



KLFFEEHERV 
KLFFEEHERV 
KLFFEEHERV 
KLFFEEHERV 
KLFFEEHERV 



101 

TNIAKSA1DE 
TNIAKSA1DE 
TNIAKSAiDE 
TNIAKSA1DE 
TNIAKSAIDE 
TNIAKSAIDE 
TNIAKSAiDE 
TNIAKSAIDE 
TNIAKSAIDE 
TNIAKSAIDE 
TNIAKSAIDE 



TWTrEVNPQN 
TWTrEVNPQN 
TWTrEVNPQN 
TWTrEVNPQN 
TWTrEVNPQN 
TWTrEVNPQN 
TWTrEVNPQN 
TWTrEVNPQN 
TWTrEVNPQN 
TWTrEVNPQN 
TWTqEVNPQN 



APFLIVSEGV 
APFLIVSEGV 
APFLIVSEGV 
APFLIVSEGV 
APFLIVSEGV 
APFLIVSEGV 
APFLIVSEGV 
APFLIVSEGV 
APFLIVSEGV 
APFLIVSEGV 
APFLIVSEGV 



LMFLKEDDVB 
LMFLKEDDVE 
LMFLKEDDVE 
LMFLKEDDVE 
LMFLKEDDVE 
LMFLKEDDVE 
LMFLKEDDVE 
LMFLKEDDVE 
LMFLKEDDVB 
LMFLKEDDVB 
LMFLKEDDVE 



150 

TFLHILTNSF 
TFLHILTNSF 
TFLHILTNSF 
TFLHILTNSF 
TFLHILTNSF 
TFLHILTNSF 
TFLHILTNSF 
TFLHILTNSF 
TFLHILTNSF 
TFLHILTNSF 
TFLHILTNSF 



151 

SQFMAQFDLC 
SQFMAQFDLC 
SQFMAQFDLC 
SQFMAQFDLC 
SQFMAQFDLC 
SQFMAQFDLC 
SQFMAQFDLC 
SQFMAQFDLC 
SQFMAQFDLC 
SQFMAQFDLC 
SQFMAQFDLC 



qKEMINKGKQ 
qKEMINKGKQ 
hKEMINKGKQ 
hKEMINKGKQ 
hKEMINKGKQ 
hKEMINKGKQ 
hKEMINKGKQ 
hKEMINKGKQ 
hKEMINKGKQ 
hKEMINKGKQ 
qKEMINKGKQ 



HDTVKYMDTE 
HDTVKYMDTE 
HDTVKYMDTE 
HDTVKYMDTE 
HDTVKYMDTE 
HDTVKYMDTE 
HDTVKYMDTE 
HDTVKYMDTE 
HDTVKYMDTE 
HDTVKYMDTE 
HDTVKYMDTE 



FQ1GITDGHE 
FQfGITDGHE 
FQfGITDGHE 
FQfGITDGHE 
FQfGITDGHE 
FQfGITDGHE 
FQfGITDGHE 
FQfGITDGHE 
FQfGITDGHE 
FQfGITDGHE 
FQfGITDGHE 



200 

IVDLDPKLKQ 
IVDLDPKLKQ 
IVDLDPKLKQ 
IVDLDPKLKQ 
IVDLDPKLKQ 
IVDLDPKLKQ 
IVDLDPKLKQ 
IVDLDPKLKQ 
IVDLDPKLKQ 
IVDLDPKLKQ 
IVDLDPKLKQ 



201 

INLINFTDEM 
INLINFTDEM 
INLINFTDEM 
INLINFTDEM 
INLINFTDEM 
INLINFTDEM 
INLINFTDEM 
INLINFTDEM 
INLINFTDEM 
INLINFTDEM 
INLINFTDEM 



SKFBLGTLRS 
SKFELGTLRS 
SKFELGTLRS 
SKFBLGTLRS 
SKFBLGTLRS 
SKFBLGTLRS 
SKFELGTLRS 
SKFELGTLRS 
SKFBLGTLRS 
SKFELGTLRS 
SKFELGTLRS 



LLPTIRKFNN 
LLPTIRKFNN 
LLPTIRKFNN 
LLPTIRKFNN 
LLPTIRKFNN 
LLPTIRKFNN 
LLPTIRKFNN 
LLPTIRKFNN 
LLPTIRKFNN 
LLPTIRKFNN 
LLPTIRKFNN 



239 

CLGVYEYKA 
CLGVYEYKA 
CLGVYEYKA 
CLGVYEYKA 
CLGVYEYKA 
CLGVYEYKA 
CLGVYEYKA 
CLGVYEYKA 
CLGVYEYKA 
CLGVYEYKA 
CLGVYEYKA 
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Table 50: Comparative Sequences relating to SAG 1024 



SEQ ID NO. 5001 
STRAIN 2603 

ATGAAAAAA.CAAAAACTATTACTGCTTATTGGAGGCTTA 

GCATGTAAGGAT TCAAA AATCC CAGA AAAC CX3CACAAAGGAAGAGTACXIAAGCTGAACAA 

AATTTTAAACCGTTTTTTGAGTTTT^ 

AAATACTTACTATTAGTATCGGATTCA^ 

ATTCAAGATTT AAAAATUUU^TAAGGATTT AGG GAAGTTTG AAACAAG AAAAAGT CAAAT A 

GAAAAGCCXjGGTGGCTATAATGAGTTAGAAAATAAAGAGGT 

AATAATATAGTTTATCCAAAAGGAAAACCIGAATATTA 

gcaatggatactaaagaattaaaagaattaaaaaaattaa^ 
aaacatccggaaactgagttgaaagatataacatatgaattgccgacacagtc^^ 

ATTAAAAAA 

SEQ ID NO. 5002 
STRAIN 090 

taaggattcaaaaatcccagaaaaccgcacaaag 

gaagagtaccaagctgaac/vaaattttaaactgttt^ 

acaaaaatataaagatttgaacaaaatacaaaaatacttactattagtat 

CGGATTCAGGTGATG CATTAG ATTT AGAAT ATTT CTATAGTATTCAAGAT 

TTAAAAAAAAATAAGGATTTAGGGAAGTTTGAAACAAGAAAAAGTCAAAT 

AGAAAAGCCGGX5TGGCTATAATGAGTTAGAAAATAAAGAGGTCCCATTTO 

AATATTTTAAAAATAATATAGTTTATCCAAAAGGAAAACCGAATATTACA 

TTTGATGACTTT ATT AT CGGAG CAATGGAT ACTAAAGAATT AAAAAAATT 

AAAAGTAAAAAGTTATTTJVTTAAAACATCCGGAAAC^ 

TAACATATGAATTG C CGACACAGTCGAAG CTT ATTAAAAAA 

SEQ XD NO. 5003 
STRAIN 18RS21 

TAAGGATTCAAAAATCCCAGAAAACCGCACAAAGGAAG 



AAAGATAAAGATTTGAGCAAAATACAAAAATACTTACTATTAGTATCGGA 

TTCAGGTGATGCATTAGAlT w rAGAATATTTCTATAGTATTCAAGATTTAA 

AAAAAAATAAGGATTTAGGGAAGTTTGAAACAAGAAAAAGTCAAATAGAA 

AAGCCGGGTGGCTATAATGAGTTAGAAAATAAAGAGGTCCCATTTGAATA 

TTTTAAAAAT AATATAGTTTAT CCAAAAGG AAAAC CGAATATTACATTTG 

ATGACTTTATTATCGGAGCAATGGATACTAAAGAATTAAAAG 

GAATTAAAAAAATTAAAAGTAAAAAGTTATTTATTAAAACATCCGGAAAC 

TGAGTTGAAAGATATAACATATGAATTGCCGGCACAGTCGAAGCT^ 

AAAAA 

PRETTY of t /blotmp/msa212269.2{*} February 10, 2003 05x07 

1 50 

msa212269.2{l84_090} : 

msa212269.2{l84 2603 1 atgaaaaaac aaaaactatt actgcttatt ggaggcttat taataatgat 

msa212269 .2{l84_18RS2l} 

Consensus ********** ********** ********** ********** ********** 

51 100 

msa212269.2{l84 090 J TAAGG ATTCAAAAAT CCCAGAAAAC CGCACAAAGG 

tnsa212269.2{l84_2603) aatgatgaca gcatgTAAGG ATTCAAAAAT CCCAGAAAAC CGCACAAAGG 

msa212269.2{l84_18RS2l) TAAGG ATTCAAAAAT CCCAGAAAAC CGCACAAAGG 

Consensus ********** ********** ********** ********** ********** 



tnsa212269.2{l84_090) 
raaa2122 69 . 2 { 184_2603 > 
msa2 12269 .2 { 184JL8RS21 } 
Consensus 



101 . 150 

AAGAGTACCA AGCTGAACAA AATTTTAAAC tGTTTTTTGA GTTTTTAGCA 
AAGAGTACCA AGCTGAACAA AA TTTTA AAC cGTTTTTTGA GTTTTTA GCA 
AAGAGTACCA AGCTGAACAA AATTTTAAAC cGTTTTTTGA GTTTTTAGCA 



msa2 12269 . 2 { 184_090 } 
msa212269 . 2 { 184_2603 > 
msa212269 . 2 { 184_18RS21 ) 
Consensus 



151 200 
CAAAAAtATA AAGATTTGAa CAAAATACAA AAATACTTAC TATTAGTATC 
CAAAAAgATA AAGATTTGAg CAAAATACAA AAATACTTAC TATTAGTATC 
CAAAAAgATA AAGATTTGAg CAAAATACAA AAATACTTAC TATTAGTATC 



msa212269 . 2 { 184_090 
msa212269.2{l84_2603 
msa212269 . 2 { 184_18RS21 
Consensus 



201 250 
GGATTCAGGT GATGCATTAG ATTTAGAATA TTTCTATAGT ATTCAAGATT 
GGATTCAGOT GATGCATTAG ATTTAGAATA TTTCTATAGT ATTCAAGATT 
GGATTCAGGT GATGCATTAG ATTTAGAATA TTTCTATAGT ATTCAAGATT 



msa212269 . 2 { 184_090 
tnsa212269 . 2 { 184_2 603 
msa212269.2{l84_18RS21 
Consensus 



251 • 300 

TAAAAAAAAA TAAGGATTT A GGGAAGTTTG AAACAAGAAA AAGTCAAATA 
TAAAAAAAAA TAAGGATTT A GGGAAGTTTG AAACAAGAAA AAGTCAAATA 
TAAAAAAAAA TAAGGATTTA GGGAAGTTTG AAACAAGAAA AAGTCAAATA 



msa212269 . 2 { 184_090 J 
msa212269 . 2 { 184_2603 J 
msa212269.2{lB4_18RS21} 
Consensus 



301 350 
GAAAAGCCGG GTGGCTATAA TGAGTTAGAA AATAAAGAGG TCCCATTTGA 
GAAAAGCCGG GTGGCTATAA TGAGTTAGAA AATAAAGAGG TCCCATTTGA 
GAAAAGCCGG GTGGCTATAA TGAGTTAGAA AATAAAGAGG TCCCATTTGA 
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Table 50: Comparative Sequences relating to SAG 1024 



351 400 
msa212269.2{l84 090} ATATTTTAAA AATAATATAG- TTTATCCAAA AGGAAAACCG AATATTACAT 
msa212269.2(l84 2603} ATATTTTAAA AATAATATAG TTTATCCAAA AGGAAAACCG AATATTACAT 
msa212269.2{l84_18RS2l} ATATTTTAAA AATAATATAG TTTATCCAAA AGGAAAACCG AATATTACAT 
Consensus ********** ********** ********** ********** ********** 

401 450 

msa212269.2{l84 090} TTGATGACTT TATTATCGGA GCAATGGATA CT 

insa212269.2{l84 2603} TTGATGACTT TATTATCGGA GCAATGGATA CT aaagaatta 

msa212269.2{l84_18RS21} TTGATGACTT TATTATCGGA GCAATGGATA CTaaagaatt aaaagaatta 
Consensus ********** ********** ********** ** 

451 50° 
AAAGAATTAA AAAAATTAAA AGTAAAAAGT TATTTATTAA AACATCCGGA 
AAAGAATTAA AAAAATTAAA AGTAAAAAGT T ATTTA TTAA AACATCCGGA 
AAAGAATTAA AAAAATTAAA AGTAAAAAGT TATTTATTAA AACATCCGGA 



msa212269 . 2 { 184_090 
msa212269 . 2 { 184_2603 
msa212269.2{l84_18RS21 
Consensus 



msa212269.2{l84_090} 
msa212269.2{l84_2603} 
msa212269.2{l84_18RS2l} 
Consensus 



501 550 
AACTGAGTTG AAAGATATAA CATATGAATT GCCGaCACAG TCGAAGCTTA 
AACTGAGTTG AAAGATATAA CATATGAATT GCCGaCACAG TCGAAGCTTA 
AACTGAGTTG AAAGATATAA CATATGAATT GCCGgCACAG TCGAAGCTTA 



551 

msa212269.2{l84__090} TTAAAAAA 
maa212269.2{184_2603> TTAAAAAA 
rasa2 12269 . 2 { 184_18RS21 } TTAAAAAA 
Consensus ******** 



SEQ ZD NO. 5004 

STRAIN 2603 frames 1 

MKKQKLLLLIGGLLIMIMMTACKDSKI PENRTKEEYQAEQNFKPFFEFLAQKDKDLSKIQ 
KYLLLVSDSGDAIiDLEYFY S I QDLKKNKDLGKFETRKSQ I EKPGGYNELENKEVPFEYF K 
NNIVYPKGKPNITFDDFI IGAMDTKBLKELKKLKVKSYLLKHPETELKD I TYELPTQ SKL 
IKK 

SEQ ID NO. 5005 

STRAIN 090 frame* 2 

KDSKI PENRTKEBYQAEQ^KLFFEFLAQKYKDLNKIQKYLLLVSDSGDAI^DLEYFY^ I Q 
DIiKKmODI/SKFETRKSQIEKPGGYNELENKBVPPBYFKNNIVYP I GAM 

m-KELKKLKVKSYLLKHPETEX.KDITYELPTQSKL.I KK 

SEQ ID HO. 5006 
STRAIN 18RS21 frame » 2 

KDSKI PENRTKEEYQAEQNFKPFFEFLAQKDKDLSKI QKYLLLVSDSGDALDLEYFYS I Q 
DLKKNKDLGKFETRKSQ I EKPGGYNELENKBVPPEYFKNN I VYPKGKPN ITFDDF 1 1 GAM 
DTKELKEIJCELKKLKVKSYIiLKHPETEIiKDITYELPAQSKLI KK 



PRETTY oft /biotmp/msa212547.2{*} February 10, 2003 05:11 .. 

1 50 

msa212547.2{l84 18RS21} KDSKI PEN RTKEEYQAEQ NFKpFFBFLA 

msa212547.2{l84 2603} mkkqJcllllt ggllimimmt acKDSKIPEN RTKEEYQAEQ NFKpFFBFLA 

msa2 12 54 7 . 2 { 18 4_0 9 0 } KDSKI PEN RTKEEYQAEQ NFKLFFEFLA 

Consensus ********** ********** ********** ********** ***-****** 

51 100 
raaa212547.2{l84 18RS21) QKdKDLsKIQ KYLLLVSDSG DALDIiEYFYS IQDLKKNKDL G KFETR KSQI 
msa212547.2{lB4 2603} QKdKDLsKIQ KYLLLVSDSG DALDLEYFYS IQDLKKNKDL G KFETR KSQI 
msa212547.2{l84_090) QKyKDLnKIQ KYLLLVSDSG DALDLEYFYS IQDLKKNKDL GKFETRKSQI 
Consensus *♦-***-*•* ********** ********** ********** ********** 

101 150 
msa212547.2{l84 18RS21} EKPGGYNELE NKBVPFEYFK NNIVYPKGKP NITFDDFIIG AMDTkelkel 
msa212547.2{l84 2603} EKPGGYNELE NKBVPFEYFK NNIVYPKGKP NITFDDFIIG AMDT. . .kel 

msa212547.2{l84_090) EKPGGYNELE NKBVPFEYFK NNIVYPKGKP NITFDDFIIG AMDT 

Consensus ********** ********** ********** ********** **** 



151 186 
KELKKLKVKS YLLKHPETEL KDITYELPaQ SKLIKK 

. k __ _ KELKKLKVKS YLLKHPETEL KDITYELPtQ SKLIKK 

msa212547.2{lB4_090j KELKKLKVKS YLLKHPETEL KDITYELPtQ SKLIKK 
Consensus ********** ********** ********-* 



msa212547.2{l84_18RS2lJ 
msa212547 . 2 {184_2603 } 
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Table 51: Comparative Sequences relating to SAG0677 



SBQ ZD NO. 5101 
STRAIN 2603 

ttgaataataaaggtgtcggtggcgatggtgtccaaatttatcaatacta 

tatcaaaatggacaacaataaaccttacttaagtcccaaagataagacta 

ctgtagagaagttagaagatcgctggaaaaaaattactttcaaagttcag 

gatactggcattggtttgaaagacgtttatcttcaatctgttaagtatgt 

tggtggtggcaataataatttagaccttatcacacctccaggatttaaaa 

aagaaga t aaaaaag t tgaaaaaccaaaa 1 1 agac eg t c c accaggaa 1 1 

gatttaccagcaccaacttcaatgagaagttttgattattcaaccccacc 

gggaactaagccaagcaaacccaaagatagtttatcaactcctccaggtt 

tcccagatttaaacacgccgccggatgaagcaccaaaggatagtaaaaaa 

gacgctattgaagataaatcaggagcaattaaatatgctaagtctcttca 

acttagctttgttgatggccctattttagctagcaaagtaaatggcaaaa 

tattacaagtcgaatctgatggcaaattagtcattcctagaaatgctttg 

tcagctaatcaatttgatgacactagtcttaaaatttatcgtaataataa 

tcgcaataaagaaattactatcacaacagattattttgcagatacaaaat 

atgtcaatatcacagcggttgactatttgagcaatactacttttgagcaa 

ttagctactggtgaaacagtagattaccatgccattgtattttcaagctt 

tgctgctattaaagacaagggtggtaagatttatgttaacgataaattgc 

aagaaacttctcgtatagcgcttaaagataaatctgttaagattggtatt 

gaattaccaaatgatgtcagacatattgatagtttatctgttcgtcgttt 

gaatgaggttaaaactgttgataatatcttgaaaaatgatgaacaagaca 

ttaatctcagcaaaacttaccaattaaaatacaacccgacaaatcgtcgt 

ctagagtttactattaataacattaactcaagttcagaaatcatgaccac 

tttcaaagatggaaagatgccagaattggttgaacaaaaagatgtttctt 

tggatataaacgatatggacatgagtaagtttaaaactattcgacttgga 

cgaaaggattctgaatttaagggacaacttattgcaaaaactggaacagt 

tgaattagatatgtttttcaaacaatctcaagacccagcttcaattatta 

aaaaaatataccttatccaaaatggtgttccaaatgaattgaaaaaattt 

gactctagttttggtttaactgaaagtcagatagatggatactatattta 

taaagatgcaattaaccttaaatttaaattaaccagtggtgcaagtctta 

aagttgtttataaagggcaagaagatccatatagtcatcagaaagaagat 

atgactaaaaaaggtgaacagctcagtcattcaactcaagccaatgaaaa 

tacagcaaaagtaacctttgctaatattgactggtcacattatagtaagg 

ttactgtgaatggaaaagaagttgttaaaggtagtgagttacctttaact 

aaaggatggacaacatttgtattacataaaacagaaaattcattaaatgif 

taaaagtttgattatggagacgggtagtgtaagtaagaaagttcaacaac 

ttcctttaagtcctagattatctaaaaataagcatatgagggatatgcta 

cttactatgcaaaaagattcagcgtattacgaaacaagtgacagtctagt 

ccttcgaattaatctcactgcagatactaaacttaattttaatgctgtta 

aaggagcgagtgctcttactgaaaatatgatgatgagacagtttgcagtt 

gctggaccacaagatgatcctgttagtgaacataaatacccatcagtatt 

tctcttaactcctgccttattggaaactgctagtgaggcaactctaaatg 

gtaaggaaatcacagcatctggtattatcggtcacatcaaggatggtgat 

aaaagcaagcatgttgaagtcaaaatggtgaatgaaaatggagacatgct 

aggaacccctgttattattcaaggtaaagacttgactaatcgaacaaaac 

cattaatgagtggacgtagagtactttatgccggtaaacaatatgagttc 

eggge taaat taccact tagtcgt t tt aacact tggat tagggt tgaagt 

ggtaacagaagcaggagagaaagcaagtattgttcgtcgcatgttctttg 

accaatcagttccagagcttaacacagcagttgctaaacgtgatttgact 

tctgatactgctcttatccacatcgttgccaaagatgactctctaaaact 

aaaattatatcaagatgattcattacttgaatctgfctgataaaaccggtc 

tttatagttttagaaatggtgtagaaatcactaaagatatgacagtacca 

ctagaatttggagataatattattaagttatctgctgttgacttatcaaa 

ttatcgtcgtaatgagacccttcatatctatagaaaccgttttgatgtta 

aagcaagccaaatgacagctgacaaaggagctaaagtaactgtggatatg 

ttgatgaagcacttagttgttccagaaatggcaggagcttatacattaac 

aa t cgacgaagc t ccaaacacaaa tgaa t caggaa tgt t aacaaaege t a 

aagtatcgattcattatgtaaatggtggtgttgataaagttgatgttccg 

attaaagtagttgacttagaagctattcgtaaagctgaagaagcacgtaa 

agctgaagaagcacgtaaagctgaagaagcacgtaaagctgaagagggac 

ataaaacccaagaagcacctatagttgaagaaggctacaaggttaataac 

gttcatcaaactgatactacagttaaagcgtctgatttaccaaagactaa 

gacagtttccgcagttcatatggctagaacagacaataaacagataactt 

cacat cagacacatg t tgaa aaacaaattaaaaatacattgcca tec act 

ggtgacagcaaacgtggttattatatcactggaatggctatcgttatgct 

gagtgtattatttagtttagctaaaaagtttaaaagcaaatat 

SBQ ZD NO. 5102 
STRAIN A909 

TTGAATAATAAAGGTGTCGGTGGCGAT 
GGTCTCCAAATTTATGAATACTATATC^ 
CTTAAGTCCO^AAGATAAGACTACTGTAGAGAAGTTAGAA 
AAAAAATTACITTOWlGTTCAGGATACTGGCAT^ 

TATCACACCTCCAGGATTTAAAAAAJGAAGAT^ 

AATTAGACCXSTCCACCAGGAATTGATTTACCa CCACCAACTTCAATGAGA 

AGTTTTQATTATTCAACCCCACOGGGAACrAAGCCAAGC^ 

TAGTTTATCAACTCCTCCAGOTTTCCCAGATTT^ 

AAGCACTAAAGGAT AGTAAAAAAGACGCTATTGAAGATAAATCAGQAG CA 
AT^AAATATGCTAAGTCTCTTCAACTTAG CITTGTTQATQACCCTATTTT 
AG CTAGCAAAGTAAATGGCAAAATATTAGAAGTCGAAT^ 
TAGTCATTCCTAGAAATGCTTTGTCAG CTAATCAATTTGATGACACTAGT 
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CTTAAAATTTATCGTAATAATAATCGCAATAAAGAAATTACTATC^CAAC 

AGATTATTTTGC7VGAT AC^WU^ATATGTCAATATCACAG CGGTTGACTATT 

TGAGCAATACTACTTTTGAGCAATTAGCTACTGGTGAAAC^^ 

CATGCGATTGTATTTTCAAGC'.LTrG CTGCT ATTAAAGACAAGGGTGGTAA 

GATTTATGTTAA03ATAAATTGCAAGAAACTTCTCGTATAGCGCTTAAA 

ATAAATCTGTTAAGATTGGTATTGAATTACC^ATGATGTCAGACATA^ 

GATAGTTTATCTCnTCGTCGTTTGAATGAGGTTAAAACTGTTG 

CITGAAAAATGATGAACAAGACATTAATCTCAG CAAAACTTACCAATTAA 

AATACAACC CGACAAATCGTCGTCTAGAGTTTACTATTAATAACATTAAC 

TCAAGTTCAGAAATCATGACCACrTTCAAAGATGGAAAGATC 

GGTTGAaCAAAAAGATGTTTCTITGGATATAaaCGATATG^ 

AGTTTAAAACTATTCGACTTGGACGAAAGGATTCTGAA 

CTTATTG CAAAAACTGGAAC^GTTGAATTAGATATGTTTTTC 

TCAAGACCXlAGCTrCAATTATTAAAAAAATATACCTTATCC^^ 

TTCX^AAATGAATTGAAAAAATTTGACTCTAGTTTT^ 

C^GATAGATGGATACTATATTTATAAAGATGCAATTAACCTC^ 

ATTAACCMTGGTGCMGTCTTAAAGTTGTTTATAA^ 

CATATAGTCATCAGAAAGAAGATATGACTAAAAAAGGTGAACAGCTCAGT 

CATTCAACT CAAGCXZAATGAAAATACAGCAAAAOT AACCT^ 

TGACTGGTCACATrATAGTAAGGTTACTGTGAATGGAAA^ 

AAGGTAGTGAGTTACCTTTAACTAAAGGATGGACAACATTTC 

AAAACAGAAAATTCATTAAATGTTAAAAGTTTGATTATGGAGAC 

TGTAAOTAAGAAAGTTCAACAACTTCCTTTAAGTCCTAGATTATCTAAAA 

ATAAGCATATGAGGGATATGCTACTTACTATGCAAAAAGATTCAGCGTAT 

TACGAaaCAAGTGACAGTCTAGTCCTTCGAATTAATCTCACTC 

TAAACITAATTTTAATGCrGTTAAAGGAGCGAGTG 

TGATGATGAGACAGTITGCAGTTGCTGGACCACAAGATGATC 

GAACATAAATACCCATCAGTATTrCTCTTAACTCCTG CCTTATTGGAAAC 

TGCTAGTGAGGCAACTCTaAATGGTAAGGAAATCACAGCA 

TCGGTCACATCAAGGATGGTGATAAAAGCAAGCATGTTGAAG^ 

GTGAATGAAAATGGAGACATGCTAGGAACCCCTGTTATTATT^^ 

AGACTTGACTAATCGAACAAAACCATTAATGAGTGGAC^ 

ATGCCGGTAAACAATATGAGTT CCGGGCTAAATrACCACTTAGTCGTTTT 

AACACTTGGATTAGGGTTGAAGTGGTAACAGAAGCAGGAGAGAAAGCAAG 

TATTGTTCGTCGCATGTTCTTTGACGAAT 

CAGTTGCTAAACXnXlATTTGACTTCTGATACTGCTCTTATCCA 

GCCAAAGATGACTCTCTAAAACTAAAATTATATCAAGATGATTCATTACT 

TGAATClXn'TGATAAAACCXSGTCTTTATAGTTTTA 

TCACTAAAGATATGACAGTACC^CTAGAATTTGGAGATAATATTAT^ 

TTATCTGCTGTTGACTTATCaAATTATOCTO^ 

CTATAGAAACCGTTTTGATGTTA7\AGCAAGCCAAATGA 

GAGCTAAAGTAACTGTGGATATGTTGATGAAGCACTTA^ 

ATGGCAGGAGCITATACATTAACAATCGACGAAGATCCAAACACAAA^ 

ATCAGGAATGTTAACAAACGCrAAAGTATCGATTCTVITATGTAAATC 

GTGTTGATAAAGTTGATGTTCCGATTAAAGTAGTTGAC 

CGTAAAGCTGAAGAAGCACATAAAGCTGACGAAG CACGTAAAGCTGAAGA 

AGCACGTAAAGCTGAAGAAGCACGTAAAGCTGAAGAAGCACGTAAAGCTG 

AAGAGGGACAT aAAAC CCAAGAAG CAC CTATAGTTG AAGAAGGCTACAAG 

GTTAATAACGTTCATCAAACTGATACTACAGTTAAAGCGTCTGATCT 

AAAGACTAAOACAGTTTCCCCAGTTCATATCMCT^ 

AGATAACTTC^CATCAGACACATGITGAAAAACAAATTAAAAATA 

SBQ ID MO. 5103 
STRAIN H3 6B 

TGGTGTCCAAATTTATCAATACrATATCAAAATGGACAACAATAAACCrT 
ACTTAAGTC C CAAAGAT AAGACTACTGTAGAGAAGTTAG a aGATCGCTGG 
AAAAAAATTACTTTCAAAGTT CAGGATACTGGCATTGGTTTGAAAGACGT 
TTATCTTCAATCTGTTAAGTATGTTGGTGGTGGC^ 

TTAT CACAC CTC C!AGGATTTAAAAAAGAAG ATAAAAAAGTTGAAAAACCA 
AAATTAGACCGTCCACCAGGAATTGATTTACCA^ 

AAGTTTTGATTATTCAACCCCACCGGGAACTAAGCCAAG CAAACCCAAAG 

ATAGTTTATCAACTCCrCCAGGTTTCCCAGATTTAAACAC^ 

GAAGCACTAAAGGATAGTAAAAAAGACX5CTATTGAAGATAAATCAGGAGC 

AATTAAATATGCTAAGTCTCTTCAACTTAGCTTTGITG^ 

TAGCTAGCAAAGTAAATGGCAAAATATTACAAGTCGAATC 

TTAGTCATTCCTAGAAATGCTTTGTCAGCTAATCAATTTG^ 

TCTTAAAATTTATCCTAATAATAATCGCAATAAAGAAAT^ 

CAGATTATTTTGCAQATACAAAATATGTCAATATCAC^ 

TTGAGCAATACTACTTTTGAGCAATTAGCT^ 

CCATGCCJATTCTAtTTTCAAGCTTTGCTGCT 

AGATTTATGTCAAC<*ATAAATTGCAAGAAACTTCT 

GATAAATCTGTTAAGATTGGTOTrGAATTACCAAATG^ 

TGATAGTrTATCTGTT0OTOGTTTGAATOAGX5TT 

TCTTGAAAAATGATGAACAAGA<^TTAATCTCAGCAAA^ 

AAATACAACCCX3ACAAATCGTCGTCTAGAXi"i"i _ iACTATTAATAACATTAA 

CTCAAGTTCAGAAATCATGAC<^C"i"i , l'CAAAGATGGAA 

I^GTTGAACAAAAAGATGIUUVIU'IX^TATAAACGATATGGACATGAGT 

AAGTTTAAAACTATTCQACTTGGACGAAAGGATTC^ 

ACTTATTGCAAAAACTGGAACAGTTGAATTAGATATGTTTTT^ 

CTCAAGACCCAGCTTCAATTATTAAAAAAATATACCrTATCCAA 

GfTTCCAAATGAATTGAAAAAATTTGACTCTAti'r^ 

TCAGATAGATGGATACTATATTTATAAAGATGCAATTAACCT^ 

AATTAACC!AGTGGTGCAAGTCITAAAGTIX3TTT 
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CCATATAG t CATCAGAAAGAAGATATGACTAAAAAAGGTGAACAG CTCAG 

TCATTCAACT C7VAGCCAATGAAAATACAG CAAAAGTAACCTTTGCTAATA 

TTGACTGGTCACATTATAGTAAGGTTACTGTGAATG^ 

AAAGGTAGTGAOTTACCTTTAACTAAAGGATGGACAA 

TAAAACAGAAAATTCATTAAATGTTAAAAGTITGATTATGGAQACGGGTA 

GTGTAAGTAAGAAAGTTCAACAACTTCCTTTAAGTC^ 

AATAAGCATATGAGGGATATGCTACTTACTATGCAAAAAGATTCAGCX5TA 

TTACXSAAACAAGTGACAGTCrAGTOTrrCGAATTA^ 

CTAAACTTAATTTTAATGCTGTTAAAGGAGCGAGTGCTCTT 

ATGATGATGAGACAGTTTGCAGTTGCTGGACCACM 

TGAACATAAATACCCATCAGTATTTCTCTTAACTC^^ 

CTGCTAGTGAGG CaACTCTAAATGGTAAGGAAATCACAG CATCTGGTATT 

ATCX^TCACATCAAGGATGGtGATAAAAGCAAGCATGTTGAAGT 

GGTGAATGAAAATGGAGACATGCTAGGAACCCCTGTC 

AAGACITGACTAATOGAACAAAACCATTAATO 

TATGCCGGTAAACAATATGAGTTCCGGGCTAAATTACCACTTAGTCX5TTT 
TAACaCTTGGATTAGGGTTGAAGTGGTAACAGAAGCAGGAGAGAAAG CAA 
GTATTGTTCETCGCATGTTCTTTGACCAATC^^ 
GCAGTTGCTAAAOGTGATTTGACTTCTGATACT 

TGCCAAAGATGACTCTCTAAAACTAAAATTATATCAAGATGATTCATTAC 
TTGAATCTGTTGATAAAACCXX3TCTTTATAGTTTTAGAAATC 
ATCACTAAAGATATGACAGTACCACTAGAATTTGGAGATAATATTACTAA 
GTTATCTGCTGTPGACTTATCAAATTATC^ 

TCTATAGAAACCGTTTTGATGTTAAAGCAAGCC^ CTGACAAA 
GGAGCTAAAGTAACTGTGGATATGTTGATGAAGCAC^ 
AATGGCAGGAGCTTATACMTAACAATCXSACGA 
AATCAGGAATGTTAACAAACGCTAAAGTATOGAT^ 

GGTGTTGATAAAGt tGATGTTCOGATTAAAGTAGTTGACTTAGAAGCTAT 

TCGTAAAGCTGAAGAAGCACATAAAGCTGAOSAAGCACGTAAAG CTGAAG 

AAGCACGTAAAGCTGACGAAGCACATAAAGpTGAAGAAGTA 

GAAGAAGCACATAAAGTCGAAGAAGCACGTAAAGCTGAA 

AACCCAAGAAGCACCTATAGTTGAAGAAGGCTACAAGC 

ATCAAACTGATACTACAGTTAAAGCXTrcrGATTTACCAA^ 

GTTTCCGCAGTTCATATGGCTAGAACAGACAATAAACAGATAAC^ 

TCAGACACATG 

SKQ ZD NO. 5104 
STRAIN 18RS21 

TTGAATAATAAAGGTGTCGGTGGCGATGGTGTCCAA 
ATTTATCAATACIATATaVAAATGGACAACAATAA 

CAAAGATAAGACTACTGTAGAGAAGTTAGAAGATCGCTGGAAAAAAATTA 
< CTTTCAAAGTTCAGGATACTGG CATTGGTTTGAAAGACGTTTATCTTCAA 
TCTCTTAAGTATGTTGGTGGTGGCAATAATAA 

TCCAGGATTTAAAAAAGAAGATAAAAAAGTTGAAAAACCAAAATTA^ 
GTCCACCAGGAATTGATTTACX1AGCACCAACTTCAATGAGA 
TATTCAACCCC^CCGGGAACTAAGCCAAGCJWVCCCAAAGATAGTT^ 
AACTCCTCCAGGTTTCCC^VGATTTAAACACGCC^ 

AGGATAGTAAAAAAGACGCTATTGAAGATAAATCAGGAGCAATTAAATAT 
GCTAAGTCTCTTCAACrTAGCTT^ 

AGTAAATGGOUUUVTATTACAAGTCGAATCTGATGGCAAA 

CTAGAAATGCTTTGTCAGCTAATGAATTTG^ 

TATCGTAATAATAATCGCAATAAAGAAATTACT^ 

TGCAGATACAAAATATGTC3VATATCACAGCGGTTGACT^ 

CTACTTTTGAGCAATTAGCTACTGGTCAAACACT 

GT ATTTTCAAGCTTTG CTGCTATTAAAGACAAGGGTGGTAAGATITATGT 

TAACGATAAATTGCAAGAaACTTCTOGTATAGCXSCTTAAAG 

TTAAGATTGGTATTGAATTACCAAATGATGTC^ 

TCTGTTCGTCGTTTGAATGAGGTTAAAACTGTTC 

TGATGAACAAGACATTAATCTCAGCAAaACTTACCA^ 

CGACAAATCGTCGTCrAGAGTTTACTATTAATAACATTAACT 

GAAATCATGACCACT/ITCAAAGATGGAAAGATGCCAGAATTG 

AAAAQAT G ' rri^ri TGGATATaAAOGATATGGACATGA^ 

CTATTCGACTTGGACXSAAAGGATTCTGAATTrAAGGGA 

AAAACTX3GAACAGTTGAATTAGATATGTCT 

AGCTTCAATTATTAAAAAAATATACJCTrATCCAAAATC 

AATTGAAAAAATTTGACTCTAGTTTTGGTTT 

GGATACTATATTTATAAAGATGCAATTAACCTTAAATTTAAATTAAC^ 

TGGTG CAAGTCTTAAAGTTGTTTATAAAGGGCAAGAAGATCCATATA^ 

ATCAGAAAGAAGATATGACTAAAAAAGGTGAACAGCTCA^ 

CAAGCCAATGAAAATACAGCAAAAGTAACCTTTGCT 

ACATTATAGTAAGGTTACTGTGAATGGAAAAGAAGTTGTTAAAGGTAGTC 

AGTTACXTITTAACTAAAGGATGGACAACATTIXn'ATTA 

AATTCATTAAATGTTAAAAGTTTGATTATG^ 

GAAAGTTCAACAACTTCCTTTAAGTCCrAGA 

TGAGGGATATGCTACTTACTATGCAAAAAGATTCAGCGT 

AGTGACAGTCrAGTCCTTCGAATTAATCTCACro 

TTTTAATGCTGTTAAAGGAGCGAGTG CTCTTA 

GACAGTTTGCAGTTGCTGGACCACAAGATGATC^ 

TACX^CATCAGTATTTCTCTTAACTCCTGCCTTATTG 

GGCAACTCTAAATGGTAAGGAAATCACAGCATCTGGTATTAT^ 

TCAAGGATGGTGATAAAAGCAAGCATGTTOAAGTCAA^ 

AATGGAGACATGCTAGGAACCCCTGTTATTATTCAAGOT 

TAATCGAACAAAACCATTAATGAGTGGACGTAGAGTACTTTATG 
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AACAATATGAGTTCCGGX3CTAAATTACCACCT 

ATTAGGGTTGAAGTGGTAACAGAAG CAGGAGAGAAAG CAAGTATTGTTCG 

TCGCATGTrCTTTGACCAATCAGTTCCAGAGCTTAAC^ 

AACGTGATTTGACTTCTGATACTGCTCTT^ 

GACTCTCTAAAACTAAAATTATATC^GATGATTt^TTACtTGAATCTGT 

TGATAAAACCGGTCTTTATAGTTTTAGAAATGGTGTAG^ 

ATATGACAGTACCACTAjGAATTTGCM 

GTTGACTTATC^UVATTATCGTCGTAATGAGACCCriT^ 

CCGTTTTGATGTTAAAGCAAGCCAAATGACAGCTGACAAAG^ 

TAACTGTGGaTATGTTGATGAAGCACITAGTTGTTCCAGA^ 

GCTTATACATTAAC^TCGACXSAAGCTCCAAACACAAATGAATCAG^ 

GfTTAACAAACGCTAAAGTATCGATTCATTATGT^ 

AAGTTGATGTTCCGATTAAAGTAGTTGACTTAGAAGCT^^ 

GAAGAAGCACGTAAAGCTGAAGAAGCACGTAAAGCTGAAGAGGGACATAA 

AACCCAAGAAGCACCTATAGTTGAAGAAGGCTACAAGGTTAATAACGTTC 

ATCAAACTGATACTACAGTTAAAGCGTCTGATTTACCAA^ 

GTTTCCGCAGTrCATATGGCTAGAACAGACAATAAACAGATAACTTCACA 

TCAGACACATGTTGAA 

SEQ ID NO. 5105 
STRAIN M732 

TTGAATAATAAAGGTGTCGGTGGCGATGGTGTCC 

AAATTTATCAATACTATATCAAAATGGACAACAATAAACCTTAC^ 

CCCAAAGATAAGACrrACTGTAGAGAAGTTAGAAGATCGCT GGAAA AAAAT 

TACTTTCAAAGTTCAGGATACTGQCATTGGTTTQA^ 

AATCTGTTAAGTATGTTGGTGGTGGCAATAATAATITAGAC^ 

CCTCGAGGATTTAAAAAAGAAGATAAAAAAGTTCLAAAAAC CAAAATTAGA 

CCGTCCacCAGGAATTGATTTACCAGC^CCAACTTCAATGAG^ 

ATTATTCAACCCCACCXKXyUVCTAAGCCAAGCAAACCCAAAGATAGTTTA 

TCAACTCCTCCAGGTTTCCCAGATTTAAACACGGCGCCGGATGAAG CCAC 

CAAAGGATAGTAAAAAAGACGCEATTGAAGATAAATCAGGAG CAATTAAA 

TATGGTAAGTCrCTrCAACTTAGCTTTGTTGATG^ 

CAAAGTAAATGGCAAAATATTACAAGTCGAATCTGATGGCAAATTAGTCA 

TTCCTAGAAATGCTTTGTCAGCTAATCAATTTGATG^ 

ATTTATCGTAATAATAATCGCAATAAAGAAATTACTATCACAACAGATTA 

TTTTCCAGATACAAAATATGTCAATATCACAGCGGTTrGACT 

ATACTACTTTTGAGCAATTAGCTACTGGTGAAAC^ 

ATTGTATTTTCAAGCTTTGCTGCTATTAAAGACA^ 

TGTTAACGATAAATTGCAAGAAACTTCTCX3TATAGCGCTTAAA 

CTGTTAAGATTGGTATTGAATTACCAAATCATG^ 

TTATCTGTTCGTCXnTTGAATGAGGTTAAAACTGTTGATAATATCTTGAA 

AAATGATGAACAAGACATEAATCTCAGCAAAACTTO 

ACCCGACAAATCX5TCX7rCTAGAGTTTACTATTAATAAC^TTAACTCAAGT 

TCWSAAATCATGACCACTTTCAAAGATGGAAAGATGCCA^ 

ACAAAAAGATGTTTCTTTGGATATAAACX^T^ 

AAACTATTCGACTTGGACGAAAGGATTCTGAATTTAAGGG^ 

GCAAAAACTGGAACAGTTGAATTAGATATGTTTTTC^ 

CCCAGCTTCAATTATTAAAAAAATA1ACCTTATCCAAAATGG tGTTCCAA 

ATGAATTGAAAAAATTTGACTCTAGTTTTGGTOT 

GATGGATACTATATTTMAAAGATGCAATTAACC^ 

CAGTGGTGCAAGTCTTAAAGTTGTTTATAAAGGGCAAGAAGATC^ 

GTCATCAGAAAGAAGATATGACTAAAAAAGGTGAACAGCTCAGTCATTCA 

ACTCAAGCC7UVTGAAAATACAGCAAAAGTAACCTTTGCTAATATTGACTO 

GTCACATTATAGTAAGGTTACTGTGAATGGAAAAGAAGTTGGTAAAGGTA 

GTGAGTTACCITTAACTAAAGGATGGACAACATTTGTATTACATAAAACA 

GAAAATTCATTAAATGTTAAAAGTTTGATTATGGAGACGGOT 

TAAGAAAGTTCAACAACTTcCOTTAAGTCCTAGATTATCTAAAAATAAGC 

ATATGAGGGATATGCTACTTACTATGCAAAAAGATTCAGCGTATTACG 

ACAAGTGACAGTCTAGTCCTTCGAATTAATCTCACTC 

TAATTTTAATGCTGTTAAAGGAGCGAGTGCTCTTACTGAAAATATGATG^ 

TGAGACAGTTTGCAGTTGCTGGACCACAAGATGAT 

AAATACCCATCAGTaTTTCTCrTAACTCCTGCCTTATTGGAAaCTC 

TGAGGCAACTCTAAATGGTAAGGAAATCACAGCATCTGGTATTATCGGTC 

ACATCAAGGATGGTGATAAAAGCAAQCAlXJrTG 

GAAAATGGAGACATGCTAGGAACCCCTGTTATTATTCAAGGTAAAGAC^ 

GACTAATCGAACAAAACCATTAATGAGrGGACOTAGAGTACTT^ 

GT AAACAATATGAGTTCCGGGCTAAATTACCACTT AG t CGTTTTAACACT 

TGGATTAGG<nTGAAGTGaTAACAGAAGCAGGAGAGAAAGCAAGTATTGT 

TCGTCGCATGTTCTTTGACCAATCAGTTCCAGAGC^ 

CTAAACGTGATTTGACTTCTGATACTG CTCTTATCCACATCGTTGCCAAA 

GATGACTCTCTAAAACTAAAATTATATCAAGATGATT 

TGTIXlATAAAACCGGlVriTATAGTTTTAGAAA^ 

AAGATATGACAGTACCACTAGAATTTGGAGATAATATTATTAAGTTATCT 

GCTGTTGACTTATCAAATTATCGTCGTAATGAG^ 

AAACCGTTTTGATGTTAAAGCAAGCCAAATGACA^ 

AAGTAACTGTGGATATGTTGATGAAGCACTrTAGTTGT^ 

GGAGCTTATACATTAACAATCGACGAAG CTCCAAACACAAATGAATCAGG 

AATGTTAACAAACX5CTAAAGTATCGATTCATTA 

ATAAAGTTGATGTrCCGATTAAAQTAGTTGACTT 

GCTGAAOAAGCACATAAAGCriX3ACGAAGCACGTAAAGCTGAAGAAG 

TAAAGCTGAAGAAG CACATAAAGCTGAAGAAGTACGTAAAGCTGAAGAAG 

CACATAAAGTCGAAGAAGCACGTAAAG CTGAAGAGGGACATAAAACCCAA 

GAAGC^CCTATAGTrGAAGAAGGCTACAAAGTTAATA^ 
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TGATACT ACAGTTAAAG CGTCTGATTTACCAAAGACT AAGACAGTTTCCG 
C^GTTCATATGGCTAGAA(^^CMTAAAC^GATAACTrCACATCAGACA 
CATGTTGAAAA 

SEQ ZD NO. 5106 
STRAIN COHX 

TTGAATAATAAAGGTGTCGGTGG CGATGGT 
GTCX^AAATTTATCAATACTATATCAAAATGGACAACAAT^ 
AAGTCCCAAAGATAAGACTACnxn'AGAGAAGTTAGAAGATCGCTGGAAAA 
AAATTACTTTCAAAGTTGAGGATACTGG CATTGGTTTCAAAGACGTTTAT 
CHTCAATCTGTT AAGTATGTTGGTGGTGGCMTAATAATTTAGAC CTTAT 
CACACCTCCAGGATTTAAAAAAGAAGATAAAAAAGTTGAAAAACCAAAAT 
TAGACCGTCCACCAGGAATTGATTTACCAGCACC^CTrCAATGAGAA 
TTTGATTATTCAACCCCACCGGGAACTAAGCX^UIGCAAACCCAAAGATAG 
TTTATCAACTCCTCCAGG t TTCCCAGATTTAAACACG CCG CCGGATGAAG 
CCaCCAAAGGATAGTAAAAAAGACG CTATTGAAGATAAATCAGGAGCAAT 

CTAGCAAAGTAAATGGCAAAATATTACAAGTCGAATCTGATGGCT^ 

GTCATTCCTAGAAATGCTITGTCAGCTAATCAATTTGATGA 

TAAAATTTATCGTAATAATAATCGCAATAAAGAAATTACTATCACAACAG 

ATTATTTTG CAGATACAAAATATGT CAAT ATCACAG CGGTTGACTATTTG 

AGCAATACTACTTTTGAGCAATTAGCTACTGGTGAAA 

TGCCATTGTATTTTCAAGCTTTGCTGCTATTAA^ 

TTTATGTTAACQATAAATTGCAAGAAACT^CTCGTATAGCGCTTAAAGAT 

AAATCTtrTTAAGATTGGTMTOAA 

TAGTTTATCTGTTCGTCGTTTGAATGAGGTTAAAAC^^ 

TGAAAAATGATGAACAAGACATTAATCTCAGCAAAACTTACO^TTAAAA 

TACAACCCGACAAATCGTCGTCTAGAGTITACTATTAATAACATTAACrC 

AAGTTCAGAAAT CATGACCACTTTCAAAGATGGAAAGATG CCAG AATTGG 

TTGAACAAAAAGATGTTTCTITGGATATAAACGATATGGAC^ 

TTTAAAACTATT CGACTTGGACGAAAGGATTCTGARTTT AAGGGACAACT 

TATTGCAAAAACKX3AACAGTTGAATTAGATATC 

AAGACCCAGCTTCAATTATTAAAAAAATATACCTTATCCAAAA 

CCAAATGAATTGAAAAAATTTGACTCTAGTTTTGGTT^ 

GATAGATGGATACTATATTTATAAAGATGCAATTAACCTTAAATTTAAAT 

TAACCAGTGGTGCAAGTCTTAAAGTTGTTTATAAAGGGCAAG 

TATAGTCATCAGAAAGAAGATATGACTAAAAAAGGTGAACAGCTC^VGT^ 

TTCAACTCAAGCCAATCAAAATACAGCAAAAGTAACCTrTGCTAATATTG 

ACTGGTCACATTATAGTAAGGTTACTGTGAATGG 

GGTAGTGAGTTACCTTTAACTAAAGGATGGACAACATTTGTATTACATAA 

AACAGAAAATTCATTAAATGTTAAAAGTTrGATTATGGAG^ 

TAAGTAAGAAAGTTCAACAACTTCCITTAAGTCCTAgATTAT 

AAGCATATGAGGGATATGCTACTTACTMGCAAAAAGATTCAGCm'ATTA 

OSAAACAAGTGACAGTCTAGTCCrTCGAATTAATCT 

AACTTAATTTTAATGCTGTTAAAGGAGCGAGTGCTCTTACTGAAAATATC 

ATGATGAGACAGTTTGCAGTTG CTGGACCACAAGATGATCCTGTTAGTGA 

ACAT AAATACCCATCAGTATTT C7TCTTAACT CCTG CCTTATTGGAAACTG 

CTAGTGAGGCAACTCTAAATGGTAAGGAAATCACAGCATCT^ 

GGTCACATCAAGGATGGTGATAAAAGCAAGCATGTTGAAGTCAAAATGGT 

GAATGAAAATGGAGACATGCTAGGAACCCCTGTTATra 

ACTT6ACTAATCGAACAAAACCATTAATGAGTGGACOT 

GCCGGTAAACAATATGAGTTCCGGGCTAAATTACCACTTAGTCG'rJL'rrAA 

CACTrGGATTAGGGTTGAAGTGGTAACAGAAGCAGGAGAGA 

TTGTTCGTCGCATGTTCTTTGACCAAT^^ 

GTTGXTIAAACGTGATTtGACTTCTGATACTG^ 

CAAAGATGACTCTCTAAAaC TAAA ATT ATATCA AGATG 

AATCTGTrGATAAAACCGGTCTTTATAGTTTTAGAAATC 

ACTAAAGATATGACAGTACCACTAGAATTTGG 

ATCTGCTGTTGACTTATCAAATTATCGTCGT^ 

ATAGAAACCGTTTTGATGTTAAAGCAAGCCAAATGAC 

GCTAAAGTAACTGTGGATATGTTGATGAAGGACTTAG^ 

GGCAGGAGCTTATACATTAACAATCGACGAAGCTCCAAACACAAATGAAT 

CAGGAATGTTAACAAACGCTAAAGTATCGATTCATTATGT^ 

GTTGATAAAGTTGATGTTCCGATTAAAGTAGTT^ 

TAAAGCTGAAGAAGCACATAAAGCTGACGAAGCAa?rAAAGCTGAAGAAG 

CACX^AAAGCrGAAGAAGCACATAAAGCTGAAGAAGTACGTA 

GAAGCACATAAAGTCX-iAAGAAGCACGTAAAGCTGAA^ 

CCAAGAAGCACCTATAGTTGAAGAAGGCTACAAAGTTAATAAOT 

AAACTGATACTACAGTTAAAGCGTCTGATTTACCAAAGACTAAGACAGTT 

TCCGCAGTTCATATCGCTAGAACAGACAATAAACAGATAA^^ 

GACACATGT 

SEQ XD NO. 5X07 
STRAIN M781 

TTGAATAATAAAGGTGTCGGTGGCGATGGT 
GTCCAAATTTATCAATACTATATCAAAATGGACAACAATAAA^ 
AAGTCCCAAAGATAAGACT ACTGTAGAGAAGTTAG AAGATCG CTGGAAAA 
AAATTACTTTCAAAGTTCAGGATACTGGCATTGGTTTC 
CTTCAATCTGTTAAOTATGTTOGTOGTGGCAft 

CACACCTC^GOATTTAAAAAAGAAGATAAAAAAGTTGAAAAACCAAAAT 
TAGACCGTCCACCAGGAATTGATTTACCAGCACCA^ 

TTTATCAACTCCTCCAGGTTKXX^VGATTTA 
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CCaCCAAAGGATAGTAAAAAAGACGCTATTGAAGATAAATCAGGAGCAAT 

TAAATATGCTAAGTCTCTTCAACTTAGCTTTGTTG 

CTAGCAAAGTAAATGGCAAAATATTACAAGTCX^TCrGATG^ 

GTCATTCCT AGAAATGCTTTGTCAG CTAATCAATTTGATG ACACTAGTCT 

TAAaATTTATCGTAATAATAATCGCAATAAAGAAATTaCTATCACAACAG 

ATlAl'rriGCAGATACAAAATATGTCAATATCACAGCGGTTGACTA 

AGCAATACTACTTTTGAGCAATTAGCTACTGGT^ 

TGCCATTGTATTTTCAAGCTTTGCTGCTATTAAAGA^ 

TTTATGTTAACGATAAATTGCAAGAAACTTCTCGTATAG CGCTTAAAGAT 

AAATCTGTTAAGATTGGTATTGAATTACCAAATGAl^^ 

TAG1TTATCTGTTCGTCGTTTGAATGAGGTTAAAACTGTTGATAATA 

TGAAAAATGATGAACAAGACATTAATCTCAGCAAAACTTACCAAT^ 

TACAACCCX3ACAAATCX3TCGTCTAGAGTTTACrATTAATAACATTAACTC 

AAGTTCAGAAATCATGAC CACTT TCAAAGAT^ 

TTGAACAAAAAGATGl"l"lCrriGGATATAAACGATATGGACATGAGTAAG 
TTTAAAACTATTCX1ACTTGGAGGAAAGGATTCTGAATTT 
TATTGCAAAAACTGGAACAGTTGAATTAGATATGTTTTTCAAACAATCTC 
AAGACCCAGCTTCAATTATTAAAAAAATATACCTT 

CCAAATGAATTG AAAAAATTTG ACT CT AGTTTTG G TTTAACTGAAAGT CA 

GATAGATGGATACTATATTTATAAAGATGCMTTAACCTTAAATTTAAAT 

TAACCAGTGGTGCAAGTCOTAAAGTTGTTTATAAAGGGCAAGAAGATCCA 

TATAGTCATCTUSAAAGAAGATATGACTAAAAAAGGTGAACAGCTCAGTC^ 

TTCAACTCAAGCCAATGAAAATACAGCAAAAGTAACCTTTGC^^ 

ACTGGTCACATTA'IAOTAAGGTTACTGTGAATGGA 

GGTAGTGAGTTACCTTTAACTAAAGGATGGACAACATTTGTATTACATAA 

AACAGAAAATTCATTAAATGTTAAAAGTTTGATTATGGAG^ 

TAAGTAAGAAAGTTCAACAACTTCCTTTAAGTCCrAGATTATCTAAAAAT 

AAGCATATGAGGGATATGCTACTTACTATGCAAAAAGATTCAGCGTATTA 

GGAAACAAGTGACAGTCTAGTCCTTCGAATT^ 

AACTTAATTTTAATGCTGTTAAAGGAG CGAGTGCTCTTACTGAAAAT ATG 

ATGATGAGACAGTTTGCAGTTGCTGGACCACAAGATGATCCTC 

AGATAAATACOCATCACTATTTCTCTTAACTCCT^ 

CTAGTGAGGCAACTCTAAATGGTAAGGAAATCACAGCATCTGGTATrATC 

GGTCACATCAAGGATGGTGATAAAAGCAAGCATGTTGAAGT^ 

GAATGAAAATGGAGACATG CTAGGAACCCCTGTTAT7T ATTCAAGGTAAAQ 

ACTTGACTAATCGAACAAAACCATTAATGAGTGGACGTAGAGTACTITA 

GCCGGTAAACAATATGAGTTCCGGGCTAAATTACCACITAGT^^ 

CACTTGGATTAGGGTTGAAGTGGTAACAGAAG CAGGAGAGAAAGCAAGTA 

TTGTTCSSTCGCATGTTCTTTGACX^TCAGTTC 

GTTGCTAAACGTGATTTGACTTCTGAT^ 

CAAAGATGACTCTCTAAAACTAAAATTATATCAAGAT^ 

AATCTGTTGATAAAACCGGTCTITATAGTTTTAGAAATGGTGTAGA 

ACEAAAGATATGACAGTACCACTAGAATTTGGAGATAATATTATTAAGTT 

ATCTGCTGTTGACTTATCAAATXATCGTCff 

ATAGAAACCGTTTTOATGTTAAAGCAAGCCAAATGACAGCT^ 

GCTAAAGTAACIGTGGATATGTTGATGAAGCACTTAGTrGTTCCAGA 

GGCAGGAGCTTATACATTAACAATCGACGAAGCTCCAAACACAAATGAAT 

CAGGAATGTTAACAAACGCTAAAGTATCGATTCATTATGTAAATGGTGGT 

GTTGATAAAGTTGATGTTC<X2ATTAAAGTAGT^ 

TAAAGCTGAAGAAGCACATAAAGCTGACGAAGCACGTAAAGCIGAAGAAG 

CAOGTAAAGCTCAAGAAGCaCATAAAGCTGAAGAAGTACX^ 

GAAGCACATAAAGTCX3AAGAAGCACCX3TAAAGCTGAAGAGGGACATAAAA 

CCCAAGAAGCACCTATAGTTGAAGAAGGCTACAAAGTTAATAACGTTCAT 

CAAACTGATACTACAGTTAAAGCGTCTGATTTACCAAAGACTAAGACAGT 

TTCCGC^GTTCATATGGCTAGAACAGACAATAAACAGA^ 

AGACACATGTTG 

SEQ ZD MO. 5109 
STRAIN JM9130013 

TGGTGTCCAAATTTATCAATACTATATCAAAATGGACAACAATAAAC 
CITACTTAAGTCCGAAAGATAAGACTACTGTAGAGA^ 
TGGAAAAAAATTACTTTCAAAGTTCAGGATACIXSGCATTGGT^ 
CGTTTATCrTCAATCTGTTAAGTATGTTGGTG^ 

ACCTTATCACACCTCCAGGATTTAAAAAAGAAGATAAAAAAGTrGAAAAA 

CCAAAATTAGACCGTCCACCAGGAATTGATTTACCAGCACCAACTTCAAT 

GAGAAGTTTTGATTATTCAACCCCACCGGGAACrAAGCCAA^ 

AAGATAGTTTATCAACTCCTCCAGGTTTCCCAGATTTAAACACGCCG CCG 

GATGAAGCACCAAAGGATAGTAAAAAAGACGCTATTGAAGATAAATCAGG 

AGGAATTAAATATGCTAAGTCTCTTCAACTTAGCTTTC 

TTTTAGCTA GCAAAGT AAATGG CAAAAT ATTACAAGT CGAAT CTGATGG C 

AAATTAGTCATTCCTAGAAATGCTTTGTCAGCTAATC 

TAGTCTTAAAATTTATCGTAATAATAATCGCAATAAAGAAAITACT 

CAACAGATTATTTTGCAGATACAAAATATGTCAATATCACAGC^ 

TATTTGAGCAaTACTACTTTTGAGCAATTAGCTACro 

TTACCATGCCATTGTATTTTCAAGCTTTGCTGCT 

GTAAGATTTATGTTAACGATAAATTGCAAGAAACTTCTCGTATAGCG 

AAAGATAAATCTGTTAAGATTGGTATO3AATIACCAAATGATCT 

TATTGATAGTTTATC l X gl U'lXi l ^ 

ATATCTTGAAAAATGATGAACAAGACATTAATCTrCAG CAAAACTTACCAA 

TTAAAATACAACCCGACAAATCGTCGTCTAGAGTTTACTATTAATAACAT 

TAACTCAAGTTCAGAAATCATOACCACTTTCAAAGATG 

AATTGGTTGAACAAAAAGATGTTTCTTTGGATATAAAO 

AGTAAGTTTAAAACTATTCGACTTGGACGAAAGGA^ 
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AGAACITATTGCAAAAACTG GAACAGTTGAATTAGATATGTTTTTCAAAC 
AATCTCAAGACCCAGCTTCAATTATTAAAAAAAT ATACCT TATCCAAAAT 
GGTGTTCCAAATGAATTGAAAAAATTTGACTCT^ 

AAGTCAGATAGATGGATACTATATTTATAAAG ATGC AATTAACCTTAAAT 

TTAAATTAACCAGTGGTGCAaGTCTTAAAGTTGTTTATAAAG^ CAAGAA 

GATCCATATAGTCATCAGAAAGAAGATATGACTAAAArAGGTGAACAGCT 

CAGTCATTCAACTCAAGCXIAATGAAAATACAG CAAAAGTAACCTTTG CTA 

ATATTGACTGGTCACATTATAGTAAGGTTACIGTGAATGGAAAA^ 

GGTAAAGGTAGTGAGTTACCT1"1'AACTAAAGGATGGACAACATTTGTATT 

ACATAAAACAGAAAATTC^TTAAATGTTAAAAGTTTGATTATGGAGACGG 

GTAGTOTAAGTAAGAAAGTTCAACAACTTCCTTTAAGTC 

AAAAATAAGCATATGAGGGATATGCTACTTACTATGCAAAAAGATTCAGC 

GTATTA(XAAACAAGTGACAGTCTAGTCCITCGAATTAATCT 

ATAXTTAAACTTAATTTTAATGCTGTTAAAGGAGCGAGTGCTCT^ 

AATATGATGATGAGACAGTTTG CAGTTGCTGGACCACAAGATGATCCTGT 

TAGTGAACATAAATACCCATGAGTATTTCTCTTAACT 

AAACTGCTAGTGAGGGAACrCTAAATGGTAAGG^ 

ATTATCGGTCAC^TCAAGGATGGTGATAAAAGCAAGCATGTTGAAGTCAA 

AATGGTGAATGAAAATGGAGACATGCTAGGAACCCCTG^ 

GTAAAGACTTGACTAATCX3AACAAAACCATTAATGAGTGGACGTAGAGTA 

C1UUATGCCGGTAAACAATATGAGTTCCGGGCTAAATTACCACTTAGTCG 

TTTTAACACTTGGATTAGGGTTGAAGTGGTAACAGAAGCAGGAgaG 

cAaGTATTGTTCGTCGCATGTTCrrTGACC^TCAGT^ 

ACAGCAGTTGCTAAACGTGATITGACTTCTGATACTGCT^ 

CGTTGCCAAAGATQACTCTCTAAAACTAAAATTATATCAAGATGATTCAT 

TACTTGAATCTGTTGATAAAACCGGTCTTTATAGTTT^ 

GAAATC^CTAAAGATATGACAGTACCACTAGAATTTGGAGATAATATTAT 

TAAGTTATCTGCICTTGACTTATCAAATTATCCT 

ATATCTATAGAAACCGTTTTGATGTTAAAGCAAGCCAAATG^ 

AAAGGAGCTAAAGTAACTGTGGATATGTTGATGAAGCACTTAGTTGTTCC 

AGAAATGGCAGGAGCTTATACATTAACAATCX^CGAAGCTCCAAAC^CAA 

ATGAATCAGGAATGTTAACAAACGCTAAAGTATCGATTCATTATGTAAA 

GGTGGTGTTGATAAAGTTGATGTTC03ATTAA 

TATTCXTTAAAGCTX3AAGAAGCACATAAAGCTGACGAAGCA 

AAGAAGCACGTAAAG CTGAAGAAG CACAT AAAGCTGAAGAAGTA CGT AAA 

GCTGAAGAAGCACATAAAGTCGAAGAAGCACCOTAAAGCTGAAGAGGGAC 

ATAAAAtXXIAAGAAGCACCTATAGTTGAAGAAGGCT 

GTTCATCAAACTGATACTACAGITAAAGCG^CTGATTTACGAAAGACTAA 

GACAGTTTCCGCAGTTCATATGGCTAGAACAGACAATAAACAGATAAC 

CACATCAGACACATGTTG 



MSA Alignment Results: Pretty output 

PRETTY of: /biotmp/msa235280.2{*} December 10, 2002 05x12 



msa23 52 8 0 . 2 { 195_C0H1 
msa235280.2fl95 M732 
rasa235280. 2(195 M781 
msa235280.2{195_H36B 
maa235280.2{l95 JM9130013 
msa235280.2{l95_18RS21 
rasa235280 . 2 f 195J2603 
rasa235280 . 2 { 195_A909 
Consensus 



1 SO 
ttgaataata aaggtgtcgg tggcgaTGGT GTCCAAATTT ATCAATACTA 
ttgaataata aaggtgtcgg tggcgaTGGT GTCCAA ATTT ATCAATACTA 
ttgaataata aaggtgtcgg tggcgaTGGT GTCCAAATTT ATCAATACTA 

TGGT GTCCAA ATTT ATCAATACTA 

TGGT GTCCAAATTT ATCAATACTA 

ttgaataata aaggtgtcgg tggcgaTGGT GTCCAAATTT ATCAATACTA 
ttgaataata aaggtgtcgg tggcgaTGGT GTCCAA ATTT ATCAATACTA 
ttgaataata aaggtgtcgg tggcgaTGGT GTCCAAATTT ATCAATACTA 

********** ********** 



msa235280.2fl95_COHl 
msa235280. 2(195 H732 
msa235280 .2 [ 19S_M781 
msa235280 . 2 { 195_H36B 
msa235280.2{l95 JM9130013 
msa235280.2{l95_18RS21 
msa23 5280 . 2 f 195_2603 
msa2352B0.2{195_A909 
Consensus 



51 

TATCAAAATG 
TATCAAAATG 
TATCAAAATG 
TATCAAAATG 
TATCAAAATG 
TATCAAAATG 
TATCAAAATG 
TATCAAAATG 



GACAACAATA 
GACAACAATA 
GACAACAATA 
GACAACAATA 
GACAACAATA 
GACAACAATA 
GACAACAATA 
GACAACAATA 



AACCTTACTT 
AACCTTACTT 
AACCTTACTT 
AACCTTACTT 
AACCTTACTT 
AACCTTACTT 
AACCTTACTT 
AACCTTACTT 



AAGTCCCAAA 
AAGTCCCAAA 
AAGTCCCAAA 
AAGTCCCAAA 
AAGTCCCAAA 
AAGTCCCAAA 
AAGTCCCAAA 
AAGTCCCAAA 



100 

GATAAGACTA 
GATAAGACTA 
GATAAGACTA 
GATAAGACTA 
GATAAGACTA 
GATAAGACTA 
GATAAGACTA 
GATAAGACTA 



msa235280.2(l95 COH1. 
msa235280.2(195_M732 
msa235280. 2(195 M781 
msa235280.2{l95_H36B 
msa235280 .2{195_JM9130013 
msa235280 . 2 { 195_18RS2 1 
msa235280 . 2 ( 195_260 3 
msa235280.2{195_A909 
Consensus 



msa235280.2 
msa235280.2 
msa235280 .2 
msa235280.2 



195_COHl 
195 M732 
195~M781 
195 H36B 



101 

CTGTAGAGAA 
CTGTAGAGAA 
CTGTAGAGAA 
CTGTAGAGAA 
CTGTAGAGAA 
CTGTAGAGAA 
CTGTAGAGAA 
CTGTAGAGAA 



GTTAGAAGAT 
GTTAGAAGAT 
GTTAGAAGAT 
GTTAGAAGAT 
GTTAGAAGAT 
GTTAGAAGAT 
GTTAGAAGAT 
GTTAGAAGAT 



CGCTGGAAAA 
CGCTGGAAAA 
CGCTGGAAAA 
CGCTGGAAAA 
CGCTGGAAAA 
CGCTGGAAAA 
CGCTGGAAAA 
CGCTGGAAAA 



AAATTACTTT 
AAATTACTTT 
AAATTACTTT 
AAATTACTTT 
AAATTACTTT 
AAATTACTTT 
AAATTACTTT 
AAATTACTTT 



150 

CAAAGTTCAG 
CAAAGTTCAG 
CAAAGTTCAG 
CAAAGTTCAG 
CAAAGTTCAG 
CAAAGTTCAG 
CAAAGTTCAG 
CAAAGTTCAG 



151 200 

GATACTGGCA TTGGTTTGAA AGACGTTTAT CTTCAATCTG TTAAGTATGT 
GATACTGGCA TTGGTTTGAA AGACGTTTAT CTTCAATCTG TTAAGTATGT 
GATACTGGCA TTGGTTTGAA AGACGTTTAT CTTCAATCTG TTAAGTATGT 
GATACTGGCA TTGGTTTGAA AGACGTTTAT CTTCAATCTG TTAAGTATGT 
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msa235280 . 2 { 195_JM9130013 ) 
msa2352B0.2{l95_18RS21) 
maa235280 . 2 { 195_2603 J 
msa235280.2{l95_A909) 
Consensus 



msa235280.2{l95_COHl 
Oisa235280 . 2 { 195_M732 
msa235280 . 2 I 195_M781 
msa235280 . 2 { 195_H36B 
msa235280.2{l95_JM9130013 
msa235280 . 2 { 195_18RS21 
msa235280 . 2 { 195_2603 
msa235280 . 2 { 195_A909 
Consensus 



GATACTGGCA TTGGTTTGAA AGACGTTTAT CTTCAATCTG TTAAGTATGT 
GATACTGGCA TTGGTTTGAA AGAC GTTTA T CTTCAATCTG TTAAGTATGT 
GATACTGGCA TTGGTTTGAA AGACGTTTAT CTTCAATCTG TTAAGTATGT 
GATACTGGCA TTGGTTTGAA AGACGTTTAT CTTCAATCTG TTAAGTATGT 



201 

TGGTGGTGGC 
TGGTGGTGGC 
TGGTGGTGGC 
TGGTGGTGGC 
TGGTGGTGGC 
TGGTGGTGGC 
TGGTGGTGGC 
TGGTGGTGGC 



AATAATAATT 
AATAATAATT 
AATAATAATT 
AATAATAATT 
AATAATAATT 
AATAATAATT 
AATAATAATT 
AATAATAATT 



TAGACCTTAT 
TAGACCTTAT 
TAGACCTTAT 
TAGACCTTAT 
TAGACCTTAT 
TAGACCTTAT 
TAGACCTTAT 
TAGACCTTAT 



CACACCTCCA 
CACACCTCCA 
CACACCTCCA 
CACACCTCCA 
CACACCTCCA 
CACACCTCCA 
CACACCTCCA 
CACACCTCCA 



\» 

250 

GGATTTAAAA 
GGATTTAAAA 
GG ATTTA AAA 
GGATTTAAAA 
GGATTTAAAA 
GGATTTAAAA 
GGATTTAAAA 
GGATTTAAAA 



msa235280 . 2 ( 195_C0H1 
msa235280.2(195_M732 
msa235280.2(195_M781 
mea2 35280 . 2 { 19S_H36B 
msa23S280.2{l95_JM9130013 
msa235280.2{l95_18RS21 
msa235280.2{l95_2603 
maa235280.2{l95_A909 
Consensus 



251 

AAGAAGATAA 
AAGAAGATAA 
AAGAAGATAA 
AAGAAGATAA 
AAGAAGATAA 
AAGAAGATAA 
AAGAAGATAA 
AAGAAGATAA 



AAAAGTTGAA 
AAAAGTTGAA 
AAAAGTTGAA 
AAAAGTTGAA 
AAAAGTTGAA 
AAAAGTTGAA 
AAAAGTTGAA 
AAAAGTTGAA 



AAACCAAAAT 
AAACCAAAAT 
AAACCAAAAT 
AAACCAAAAT 
AAACCAAAAT 
AAACCAAAAT 
AAACCAAAAT 
AAACCAAAAT 



TAGACCGTCC 
TAGACCGTCC 
TAGACCGTCC 
TAGACCGTCC 
TAGACCGTCC 
TAGACCGTCC 
TAGACCGTCC 
TAGACCGTCC 



300 

ACCAGGAATT 
ACCAGGAATT 
ACCAGGAATT 
ACCAGGAATT 
ACCAGGAATT 
ACCAGGAATT 
ACCAGGAATT 
ACCAGGAATT 



msa235280 . 2 { 195__COHl 
msa2 3 52 8 0 . 2 f 195_M73 2 
msa235280 .2( 195_M781 
msa2 35280 . 2 { 195_H36B 
msa235280 . 2 { 195_JM9130013 
msa235280 . 2 { 195_18RS21 
msa235280 . 2 ( 195_2603 
msa2 35280 . 2 { 195_A909 
Consensus 



301 

GATTTACCAg 
GATTTACCAg 
GATTTACCAg 
GATTTACCAg 
GATTTACCAg 
GATTTACCAg 
GATTTACCAg 
GATTTACCAc 



CACCAACTTC 
CACCAACTTC 
CACCAACTTC 
CACCAACTTC 
CACCAACTTC 
CACCAACTTC 
CACCAACTTC 
CACCAACTTC 



AATGAGAAGT 
AATGAGAAGT 
AATGAGAAGT 
AATGAGAAGT 
AATGAGAAGT 
AATGAGAAGT 
AATGAGAAGT 
AATGAGAAGT 



TTTGATTATT 
TTTGATTATT 
TTTGATTATT 
TTTGATTATT 
TTTGATTATT 
TTTGATTATT 
TTTGATTATT 
TTTGATTATT 



350 

CAACCCCACC 
CAACCCCACC 
CAACCCCACC 
CAACCCCACC 
CAACCCCACC 
CAACCCCACC 
CAACCCCACC 
CAACCCCACC 



msa2 3 52 8 0 . 2 ( 19 5 _COHl 
msa2 35280 . 2 { 195_M732 
msa235280 . 2 { 195_M781 
raaa235280 . 2 { 195_H36B 
msa235280 .2{l95_JM9130013 
msa235280 . 2 { 195_18RS21 
ma a235280. 2 {195_2603 
msa235280 . 2 { 195_A909 
Consensus 



351 

GGGAACTAAG 
GGGAACTAAG 
GGGAACTAAG 
GGGAACTAAG 
GGGAACTAAG 
GGGAACTAAG 
GGGAACTAAG 
GGGAACTAAG 



CCAAGCAAAC 
CCAAGCAAAC 
CCAAGCAAAC 
CCAAGCAAAC 
CCAAGCAAAC 
CCAAGCAAAC 
CCAAGCAAAC 
CCAAGCAAAC 



CCAAAGATAG 
CCAAAGATAG 
CCAAAGATAG 
CCAAAGATAG 
CCAAAGATAG 
CCAAAGATAG 
CCAAAGATAG 
CCAAAGATAG 



TTTATCAACT 
TTTATCAACT 
TTTATCAACT 
TTTATCAACT 
TTTATCAACT 
TTTATCAACT 
TTTATCAACT 
TTTATCAACT 



400 

CCTCCAGGTT 
CCTCCAGGTT 
CCTCCAGGTT 
CCTCCAGGTT 
CCTCCAGGTT 
CCTCCAGGTT 
CCTCCAGGTT 
CCTCCAGGTT 



msa235280 . 2 { 195_COHl 
msa2 35280.2(19 5 JM73 2 
maa235280 . 2 { 195_M78 1 
mea235280 . 2 { 195_H36B 
msa235280 .2{l95_jJM9130013 
msa235280 . 2 { 195_18RS21 
msa235280 . 2 ( 195_2603 
msa2352B0 . 2 { 195JV909 
Consensus 



401 

TCCCAGATTT 
TCCCAGATTT 
TCCCAGATTT 
TCCCAGATTT 
TCCCAGATTT 
TCCCAGATTT 
TCCCAGATTT 
TCCCAGATTT 



AAACACGCCG 
AAACACGCCG 
AAACACGCCG 
AAACACGCCG 
AAACACGCCG 
AAACACGCCG 
AAACACGCCG 
AAACACGCCG 



CCGGATGAAG 
CCGGATGAAG 
CCGGATGAAG 
CCGGATGAAG 
CCGGATGAAG 
CCGGATGAAG 
CCGGATGAAG 
CCGGATGAAG 



cCACcAAAGG 
cCACcAAAGG 
cCACcAAAGG 
.CACtAAAGG 
.CACCAAAGG 
.CACCAAAGG 
.CACCAAAGG 
.CACtAAAGG 



450 

ATAGTAAAAA 
ATAGTAAAAA 
ATAGTAAAAA 
ATAGTAAAAA 
ATAGTAAAAA 
ATAGTAAAAA 
ATAGTAAAAA 
ATAGTAAAAA 



msa235280 . 2{ 195__C0H1 
tnsa2 3 52 8 0 . 2 { 19 5__M73 2 
maa23 5280 . 2 { 195_M78 1 
msa2 3 52 80 . 2 { 19 5_H3 6B 
msa2 3 52 8 0 . 2 { 19 5_JM9 1 3 0 0 1 3 
msa235280 . 2 { 195_18RS21 
rasa235280.2(l95_2603 
raaa235280.2{195_A909 
Consensus 



451 

AGACGCTATT 
AGACGCTATT 
AGACGCTATT 
AGACGCTATT 
AGACGCTATT 
AGACGCTATT 
AGACGCTATT 
AGACGCTATT 



GAAGATAAAT 
GAAGATAAAT 
GAAGATAAAT 
GAAGATAAAT 
GAAGATAAAT 
GAAGATAAAT 
GAAGATAAAT 
GAAGATAAAT 



CAGGAGCAAT 
CAGGAGCAAT 
CAGGAGCAAT 
CAGGAGCAAT 
CAGGAGCAAT 
CAGGAGCAAT 
CAGGAGCAAT 
CAGGAGCAAT 



TAAATATGCT 
TAAATATGCT 
TAAATATGCT 
TAAATATGCT 
TAAATATGCT 
TAAATATGCT 
TAAATATGCT 
TAAATATGCT 



500 

AAGTCTCTTC 
AAGTCTCTTC 
AAGTCTCTTC 
AAGTCTCTTC 
AAGTCTCTTC 
AAGTCTCTTC 
AAGTCTCTTC 
AAGTCTCTTC 



maa23S2B0.2{l95_COHl 
msa235280 . 2 { 195_M732 
maa235280.2(195 M781 
msa235280 . 2 { 195_H36B 
msa2 3 52 8 0 . 2 { 19 5_JM913 0 013 
msa235280. 2(195 18RS21 
msa235280.2(l95 2603 
msa235280 . 2 { 195~A909 
Consensus 



501 

AACTTAGCTT 
AACTTAGCTT 
AACTTAGCTT 
AACTTAGCTT 
AACTTAGCTT 
AACTTAGCTT 
AACTTAGCTT 
AACTTAGCTT 



TGTTGATGaC 
TGTTGATGaC 
TGTTGATGaC 
TGTTGATGaC 
TGTTGATGaC 
TGTTGATGaC 
TGTTGATGgC 
TGTTGATGaC 



CCTATTTTAG 
CCT ATTTTA G 
CCTATTTTAG 
CCTATTTTAG 
CCTATTTTAG 
CCTATTTTAG 
CCTATTTTAG 
CCTATTTTAG 



CTAGCAAAGT 
CTAGCAAAGT 
CTAGCAAAGT 
CTAGCAAAGT 
CTAGCAAAGT 
CTAGCAAAGT 
CTAGCAAAGT 
CTAGCAAAGT 



550 

AAATGGCAAA 
AAATGGCAAA 
AAATGGCAAA 
AAATGGCAAA 
AAATGGCAAA 
AAATGGCAAA 
AAATGGCAAA 
AAATGGCAAA 



846 



WO 2004/018646 
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msa235280 .2(195 COH1 
msa23S280.2(195~~M732 
msa23 52 8 0 . 2 f 19 5~M78 1 
rasa2 3 52 8 0 . 2 { 1 9 5"H3 6B 
msa235280.2{l95_JM9130013 
mfla23S280 .2{l95_18RS21 
msa235280 .2(195 2603 
msa2 3 52 8 0 . 2 { 19 53^90 9 
Consensus 



551 

ATATTACAAG 
ATATTACAAG 
ATATTACAAG 
ATATTACAAG 
ATATTACAAG 
ATATTACAAG 
ATATTACAAG 
ATATTACAAG 



TCGAATCTGA 
TCGAATCTGA 
TCGAATCTGA 
TCGAATCTGA 
TCGAATCTGA 
TCGAATCTGA 
TCGAATCTGA 
TCGAATCTGA 



TGGCAAATTA 
TGGCAAATTA 
TGGCAAATTA 
TGGCAAATTA 
TGGCAAATTA 
TGGCAAATTA 
TGGCAAATTA 
TGGCAAATTA 



GTCATTCCTA 
GTCATTCCTA 
GTCATTCCTA 
GTCATTCCTA 
GTCATTCCTA 
GTCATTCCTA 
GTCATTCCTA 
GTCATTCCTA 



600 

GAAATGCTTT 
GAAATGCTTT 
GAAATGCTTT 
GAAATGCTTT 
GAAATGCTTT 
GAAATGCTTT 
GAAATGCTTT 
GAAATGCTTT 



maa2 3 52 8 0 . 2 ( 1 9 5_COHl 
msa235280.2fl95_M732 
msa235280.2{l95_M781 
msa2352B0 . 2 { 195_H36B 
msa235280 . 2 { 195_JM9130013 
msa235280 . 2 { 195_18RS21 
msa235280.2(l95_2603 
msa235280.2{195_A909 
Consensus 



601 

GTCAGCTAAT 
GTCAGCTAAT. 
GTCAGCTAAT 
GTCAGCTAAT 
GTCAGCTAAT 
GTCAGCTAAT 
GTCAGCTAAT 
GTCAGCTAAT 



CAATTTGATG 
CAATTTGATG 
CAATTTGATG 
CAATTTGATG 
CAATTTGATG 
CAATTTGATG 
CAATTTGATG 
CAATTTGATG 



ACACTAGTCT 
ACACTAGTCT 
ACACTAGTCT 
ACACTAGTCT 
ACACTAGTCT 
ACACTAGTCT 
ACACTAGTCT 
ACACTAGTCT 



TAAAATTTAT 
TAAAATTTAT 
TAAAATTTAT 
TAAAATTTAT 
TAAAATTTAT 
TAAAATTTAT 
TAAAATTTAT 
TAAAATTTAT 



650 

CGTAATAATA 
CGTAATAATA 
CGTAATAATA 
CGTAATAATA 
CGTAATAATA 
CGTAATAATA 
CGTAATAATA 
CGTAATAATA 



msa235280.2 195_COHl 
msa235280 .2 195_M732 
maa235280.2 195JM781 
msa23 52 8 0 . 2 { 19 5_H3 6B 
msa235280.2{l95_JM9130013 
msa235280 . 2 { 195_18RS21 
msa235280.2(l95_2603 
msa235280 . 2 { 195_A909 
Consensus 



651 

ATCGCAATAA 
ATCGCAATAA 
ATCGCAATAA 
ATCGCAATAA 
ATCGCAATAA 
ATCGCAATAA 
ATCGCAATAA 
ATCGCAATAA 



AGAAATTACT 
AGAAATTACT 
AGAAATTACT 
AGAAATTACT 
AGAAATTACT 
AGAAATTACT 
AGAAATTACT 
AGAAATTACT 



ATCACAACAG 
ATCACAACAG 
ATCACAACAG 
ATCACAACAG 
ATCACAACAG 
ATCACAACAG 
ATCACAACAG 
ATCACAACAG 



ATTATTTTGC 
ATTATTTTGC 
ATTATTTTGC 
ATTATTTTGC 
ATTATTTTGC 
ATTATTTTGC 
ATTATTTTGC 
ATTATTTTGC 



700 

AGATACAAAA 
AGATACAAAA 
AGATACAAAA 
AGATACAAAA 
AGATACAAAA 
AGATACAAAA 
AGATACAAAA 
AGATACAAAA 



msa235280.2< 195^COHl 
msa235280.2i 195_M732 
rasa235280.2< 195_M781 
rasa235280 . 2 { 195_H36B 
rasa23S280.2{l95_JM9130013 
msa235280.2{l95_18RS21 
msa235280.2{l95_2603 
msa23 52 80 . 2 { 19 5_A909 
Consensus 



701 

TATGTCAATA 
TATGTCAATA 
TATGTCAATA 
TATGTCAATA 
TATGTCAATA 
TATGTCAATA 
TATGTCAATA 
TATGTCAATA 



TCACAGCGGT 
TCACAGCGGT 
TCACAGCGGT 
TCACAGCGGT 
TCACAGCGGT 
TCACAGCGGT 
TCACAGCGGT 
TCACAGCGGT 



TGACTATTTG 
TGACTATTTG 
TGACTATTTG 
TGACTATTTG 
TGACTATTTG 
TGACTATTTG 
TGACTATTTG 
TGACTATTTG 



AGCAATACTA 
AGCAATACTA 
AGCAATACTA 
AGCAATACTA 
AGCAATACTA 
AGCAATACTA 
AGCAATACTA 
AGCAATACTA 



750 

CTTTTGAGCA 
CTTTTGAGCA 
CTTTTGAGCA 
CTTTTGAGCA 
CTTTTGAGCA 
CTTTTGAGCA 
CTTTTGAGCA 
CTTTTGAGCA 



msa23 52 8 0 . 2 { 19 5_COHl ; 
tnsa235280.2(l95_M732 
msa235280. 2(195 M781 
msa235280.2{19S_H36B 
msa235280.2{l95_JM9130013 
msa235280 . 2 { 195_18RS2 1 
msa235280.2fl95 2603 
msa235280.2{195_A909 
Consensus 



751 

ATTAGCTACT 
ATTAGCTACT 
ATTAGCTACT 
ATTAGCTACT 
ATTAGCTACT 
ATTAGCTACT 
ATTAGCTACT 
ATTAGCTACT 



GGTGAAACAG 
GGTGAAACAG 
GGTGAAACAG 
GGTGAAACAG 
GGTGAAACAG 
GGTGAAACAG 
GGTGAAACAG 
GGTGAAACAG 



TAGATTACCA 
TAGATTACCA 
TAGATTACCA 
TAGATTACCA 
TAGATTACCA 
TAGATTACCA 
TAGATTACCA 
TAGATTACCA 



TGCCATTGTA 
TGCCATTGTA 
TGCCATTGTA 
TGCCATTGTA 
TGCCATTGTA 
TGCCATTGTA 
TGCCATTGTA 
TGCCATTGTA 



800 

TTTTCAAGCT 
TTTTCAAGCT 
TTTTCAAGCT 
TTTTCAAGCT 
TTTTCAAGCT 
TTTTCAAGCT 
TTTTCAAGCT 
TTTTCAAGCT 



tnsa235280.2(l95 COH1 
msa235280.2 195~M732' 
msa235280.2 19S_M7S1 
insa235280 . 2 { 195^H36B 
msa235280.2{l95_JM9130013 
msa235280.2{l95_18RS21 
msa235280.2{l95 2603 
maa235280.2{195[A909 
Consensus 



801 

TTGCTGCTAT 
TTGCTGCTAT 
TTGCTGCTAT 
TTGCTGCTAT 
TTGCTGCTAT 
TTGCTGCTAT 
TTGCTGCTAT 
TTGCTGCTAT 



TAAAGACAAG 
TAAAGACAAG 
TAAAGACAAG 
TAAAGACAAG 
TAAAGACAAG 
TAAAGACAAG 
TAAAGACAAG 
TAAAGACAAG 



GGTGGTAAGA 
GGTGGTAAGA 
GGTGGTAAGA 
GGTGGTAAGA 
GGTGGTAAGA 
GGTGGTAAGA 
GGTGGTAAGA 
GGTGGTAAGA 



TTTATGTtAA 
TTTATGTtAA 
TTTATGTtAA 
TTTATGTcAA 
TTTATGTtAA 
TTTATGTtAA 
TTTATGTtAA 
TTTATGTtAA 



850 

OGATAAATTG 
CGATAAATTG 
CGATAAATTG 
CGATAAATTG 
CGATAAATTG 
CGATAAATTG 
CGATAAATTG 
CGATAAATTG 



msa23 52 8 0 . 2 f 19 5_COHl 
msa235280.2(195_M732 
msa235280 . 2 { 195_M781 
msa235280.2{195_H36B, 
tnsa235280 . 2 {195_JM9130013 
msa235280 . 2 { 195_18RS21 
msa235280 . 2( 195_2603 
msa23S280 . 2{ 195_A909 
Consensus 



851 

CAAGAAACTT 
CAAGAAACTT 
CAAGAAACTT 
CAAGAAACTT 
CAAGAAACTT 
CAAGAAACTT 
CAAGAAACTT 
CAAGAAACTT 



CTCGTATAGC 
CTCGTATAGC 
CTCGTATAGC 
CTCGTATAGC 
CTCGTATAGC 
CTCGTATAGC 
CTCGTATAGC 
CTCGTATAGC 



GCTTAAAGAT 
GCTTAAAGAT 
GCTTAAAGAT 
GCTTAAAGAT 
GCTTAAAGAT 
GCTTAAAGAT 
GCTTAAAGAT 
GCTTAAAGAT 



AAATCTGTTA 
AAAT CTGTTA 
AAATCTGTTA 
AAATCTGTTA 
AAATCTGTTA 
AAATCTGTTA 
AAATCTGTTA 
AAATCTGTTA 



900 

AGATTGGTAT 
AGATTGGTAT 
AGATTGGTAT 
AGATTGGTAT 
AGATTGGTAT 
AGATTGGTAT 
AGATTGGTAT 
AGATTGGTAT 



msa235280.2(l95 COH1 
msa235280.2(195_M732 
msa235280.2(195_M781 
msa235280. 2(195 H36B 
rosa235280.2{l95_JM9130013 



901 

TGAATTACCA AATGATGTCA 
TGAATTACCA AATGATGTCA 
TGAATTACCA AATGATGTCA 
TGAATTACCA AATGATGTCA 
TGAATTACCA AATGATGTCA 



950 

GACATATTGA TAGTTTATCT GTTCGTCGTT 
GACATATTGA TAGTTTATCT GTTCGTCGTT 
GACATATTGA TAGTTTATCT GTTCGTCGTT 
GACATATTGA TAGTTTATCT GTTCGTCGTT 
GACATATTGA TAGTTTATCT GTTCGTCGTT 



847 



WO 2004/018646 



PCT/US2003/026827 



Table 51: Comparative Sequences relating to SAG0677 



rasa235280.2{l95_18RS2l) 
msa235280 . 2 ( 195_2603 J 
msa235280 . 2 { 195_A909 } 
Consensus 



TGAATTACCA AATGATGTCA GACATATTGA TAGTTTATCT GTTCGTCGTT 
TGAATTACCA AATGATGTCA GACATATTGA TAGTTTATCT GTTCGTCGTT 
TGAATTACCA AATGATGTCA GACATATTGA TAGTTTATCT GTTCGTCGTT 



msa235280.2 195_COHl 
msa235280 . 2 |l95_M732 
msa235280 . 2 195_M781 
msa235280 . 2{ 195_H36B 
msa235280.2{l95_JM9130013 
msa235280.2{l95_18RS21 
msa23 528 0.2(195 2603 
msa235280 . 2 { 195~A909 
Consensus 



951 

TGAATGAGGT 
TGAATGAGGT 
TGAATGAGGT 
TGAATGAGGT 
TGAATGAGGT 
TGAATGAGGT 
TGAATGAGGT 
TGAATGAGGT 



TAAAACTGTT 
TAAAACTGTT 
TAAAACTGTT 
TAAAACTGTT 
TAAAACTGTT 
TAAAACTGTT 
TAAAACTGTT 
TAAAACTGTT 



GATAATATCT 
GATAATATCT 
GATAATATCT 
GATAATATCT 
GATAATATCT 
GATAATATCT 
GATAATATCT 
GATAATATCT 



TGAAAAATGA 
TGAAAAATGA 
TGAAAAATGA 
TGAAAAATGA 
TGAAAAATGA 
TGAAAAATGA 
TGAAAAATGA 
TGAAAAATGA 



1000 
TGAACAAGAC 
TGAACAAGAC 
TGAACAAGAC 
TGAACAAGAC 
TGAACAAGAC 
TGAACAAGAC 
TGAACAAGAC 
TGAACAAGAC 



msa23 5280 . 2 f 19 5 _COHl 
msa235280.2{l95_M732 
msa235280 . 2 f 195_M781 
msa2 3 52 8 0 . 2 { 195_H36B 
msa235280 . 2 { 195_JM9130013 
msa235280.2{l95 18RS21 
msa235280.2{l95_2603 
msa235280 . 2{ 195_A909 
Consensus 



1001 

ATTAATCTCA 
ATTAATCTCA 
ATTAATCTCA 
ATTAATCTCA 
ATTAATCTCA 
ATTAATCTCA 
ATTAATCTCA 
ATTAATCTCA 



GCAAAACTTA 
GCAAAACTTA 
GCAAAACTTA 
GCAAAACTTA 
GCAAAACTTA 
GCAAAACTTA 
GCAAAACTTA 
GCAAAACTTA 



CCAATTAAAA 
CCAATTAAAA 
CCAATTAAAA 
CCAATTAAAA 
CCAATTAAAA 
CCAATTAAAA 
CCAATTAAAA 
CCAATTAAAA 



TACAACCCGA 
TACAACCCGA 
TACAACCCGA 
TACAACCCGA 
TACAACCCGA 
TACAACCCGA 
TACAACCCGA 
TACAACCCGA 



1050 
CAAATCGTCG 
CAAATCGTCG 
CAAATCGTCG 
CAAATCGTCG 
CAAATCGTCG 
CAAATCGTCG 
CAAATCGTCG 
CAAATCGTCG 



msa2 3 52 8 0 . 2 { 1 95_COHl 
ma a2 3 52 8 0 . 2 { 19 5 _M73 2 
msa235280 . 2( 195J4781 
msa2 3 528 0 . 2 { 195_H36B 
msa235280 . 2 { 195_JM9130013 
msa235280 . 2 { 195_18RS21 
msa235280 . 2 { 195_2603 
msa235280.2{l95_A909 
Consensus 



1051 

TCTAGAGTTT 
TCTAGAGTTT 
TCTAGAGTTT 
TCTAGAGTTT 
TCTAGAGTTT 
TCTAGAGTTT 
TCTAGAGTTT 
TCTAGAGTTT 



ACTATTAATA 
ACTATTAATA 
ACTATTAATA 
ACTATTAATA 
ACTATTAATA 
ACTATTAATA 
ACTATTAATA 
ACTATTAATA 



ACATTAACTC 
ACATTAACTC 
ACATTAACTC 
ACATTAACTC 
ACATTAACTC 
ACATTAACTC 
ACATTAACTC 
ACATTAACTC 



AAGTTCAGAA 
AAGTTCAGAA 
AAGTTCAGAA 
AAGTTCAGAA 
AAGTTCAGAA 
AAGTTCAGAA 
AAGTTCAGAA 
AAGTTCAGAA 



1100 
ATCATGACCA 
ATCATGACCA 
ATCATGACCA 
ATCATGACCA 
ATCATGACCA 
ATCATGACCA 
ATCATGACCA 
ATCATGACCA 



msa2 35280.21 195_COHl 
msa235280 . 2 f 195_M732 
msa235280.2{l95_M781 
msa23 52 8 0 . 2 { 195_H3 6B 
msa23S280 . 2 { 195_JM9130013 
msa235280.2{l95_18RS21 
maa235280 . 2( 195_2603 
msa235280.2{l95_A909 
Consensus 



1101 

CTTTCAAAGA 
CTTTCAAAGA 
CTTTCAAAGA 
CTTT CAAAGA 
CTTTCAAAGA 
CTTTCAAAGA 
CTTTCAAAGA 
CTTTCAAAGA 



TGGAAAGATG 
TGGAAAGATG 
TGGAAAGATG 
TGGAAAGATG 
TGGAAAGATG 
TGGAAAGATG 
TGGAAAGATG 
TGGAAAGATG 



CCAGAATTGG 
CCAGAATTGG 
CCAGAATTGG 
CCAGAATTGG 
CCAGAATTGG 
CCAGAATTGG 
CCAGAATTGG 
CCAGAATTGG 



TTGAACAAAA 
TTGAACAAAA 
TTGAACAAAA 
TTGAACAAAA 
TTGAACAAAA 
TTGAACAAAA 
TTGAACAAAA 
TTGAACAAAA 



1150 
AGATGTTTCT 
AGATGTTTCT 
AGATGTTTCT 
AGATGTTTCT 
AGATGTTTCT 
AGATGTTTCT 
AGATGTTTCT 
AGATGTTTCT 



msa2 3 52 8 0 . 2 ( 195__C0H1 
msa235280 . 2 f 195_M732 
msa2 3 52 8 0 . 2 ( 195_M7 8 1 
msa2 3 52 6 0 . 2 { 19 5_H3 6B 
msa235280 . 2{ 195JJM9130013 
msa235280 . 2 { 19S_18RS21 
msa235280. 2(195 2603 
msa235280 . 2{ 195~A909 
Consensus 



1151 

TTGGATATAA 
TTGGATATAA 
TTGGATATAA 
TTGGATATAA 
TTGGATATAA 
TTGGATATAA 
TTGGATATAA 
TTGGATATAA 



ACGATATGGA 
ACGATATGGA 
ACGATATGGA 
ACGATATGGA 
ACGATATGGA 
ACGATATGGA 
ACGATATGGA 
ACGATATGGA 



CATGAGTAAG 
CATGAGTAAG 
CATGAGTAAG 
CATGAGTAAG 
CATGAGTAAG 
CATGAGTAAG 
CATGAGTAAG 
CATGAGTAAG 



TTTAAAACTA 
TTTAAAACTA 
TTTAAAACTA 
TTTAAAACTA 
TTTAAAACTA 
TTTAAAACTA 
TTTAAAACTA 
TTTAAAACTA 



1200 
TTCGACTTGG 
TTCGACTTGG 
TTCGACTTGG 
TTCGACTTGG 
TTCGACTTGG 
TTCGACTTGG 
TTCGACTTGG 
TTCGACTTGG 



msa235280 . 2 { igS^COHl 
msa235280 . 2f 195_M732 
msa235280 . 2 { 195_M781 
msa235280.2{195_H36B 
msa235280 . 2{ 195_JM9130013 
insa235280.2(l95_18RS21 
msa235280 . 2 ( 195_2603 
msa235280 . 2 { 195_A909 
Consensus 



1201 

ACGAAAGGAT 
ACGAAAGGAT 
ACGAAAGGAT 
ACGAAAGGAT 
ACGAAAGGAT 
ACGAAAGGAT 
ACGAAAGGAT 
ACGAAAGGAT 



TCTGAATTTA 
TCTGAATTTA 
TCTGAATTTA 
TCTGAATTTA 
TCTGAATTTA 
TCTGAATTTA 
TCTGAATTTA 
TCTGAATTTA 



AGGGACAACT 
AGGGACAACT 
AGGGACAACT 
AGGGACAACT 
AGGGACAACT 
AGGGACAACT 
AGGGACAACT 
AGGGACAACT 



TATTGCAAAA 
TATTGCAAAA 
TATTGCAAAA 
TATTGCAAAA 
TATTGCAAAA 
TATTGCAAAA 
TATTGCAAAA 
TATTGCAAAA 



1250 
ACTGGAACAG 
ACTGGAACAG 
ACTGGAACAG 
ACTGGAACAG 
ACTGGAACAG 
ACTGGAACAG 
ACTGGAACAG 
ACTGGAACAG 



msa235280 . 2( 195_C0H1 
rasa235280.2(19SJ4732 
msa235280 . 2( 195_M781 
msa235280 . 2 { 195_H36B 
msa235280 . 2{ 195_JM9130013 
msa235280 . 2 { 195_18RS21 
msa23 5280 . 2 ( 195.2603 
rasa235280 . 2 { 195_A909 
Consensus 



1251 

TTGAATTAGA 
TTGAATTAGA 
TTGAATTAGA 
TTGAATTAGA 
TTGAATTAGA 
TTGAATTAGA 
TTGAATTAGA 
TTGAATTAGA 



TATGTTTTTC 
TATGTTTTTC 
TATGTTTTTC 
TATGTTTTTC 
TATGTTTTTC 
TATGTTTTTC 
TATGTTTTTC 
TATGTTTTTC 



AAACAATCTC 
AAACAATCTC 
AAACAATCTC 
AAACAATCTC 
AAACAATCTC 
AAACAATCTC 
AAACAATCTC 
AAACAATCTC 



AAGACCCAGC 
AAGACCCAGC 
AAGACCCAGC 
AAGACCCAGC 
AAGACCCAGC 
AAGACCCAGC 
AAGACCCAGC 
AAGACCCAGC 



1300 
TTCAATTATT 
TTCAATTATT 
TTCAATTATT 
TTCAATTATT 
TTCAATTATT 
TTCAATTATT 
TTCAATTATT 
TTCAATTATT 



1301 



1350 



848 



WO 2004/018646 



PCT/US2003/026827 



Table 51: Comparative Sequences relating to SAG0677 



msa235280.2( 195_COHl 
msa235280 .2(195_M732 
rasa2 3 52 8 0 . 2 I 19 5_M7 8 1 
msa235280. 2(195 H36B 
msa235280 . 2 { 195_JM9130013 
msa235280.2{l95_18RS21 
msa235280.2(l95_2603 
ma a2 3 5280 . 2{ 195_A909 
Consensus 



AAAAAAATAT 
AAAAAAATAT 
AAAAAAATAT 
AAAAAAATAT 
AAAAAAATAT 
AAAAAAATAT 
AAAAAAATAT 
AAAAAAATAT 



ACCTTATCCA 
ACCTTATCCA 
ACCTTATCCA 
ACCTTATCCA 
ACCTTATCCA 
ACCTTATCCA 
ACCTTATCCA 
ACCTTATCCA 



AAATGGTGTT 
•AAATGGTGTT 
AAATGGTGTT 
AAATGGTGTT 
AAATGGTGTT 
AAATGGTGTT 
AAATGGTGTT 
AAATGGTGTT 



CCAAATGAAT 
CCAAATGAAT 
CCAAATGAAT 
CCAAATGAAT 
CCAAATGAAT 
CCAAATGAAT 
CCAAATGAAT 
CCAAATGAAT 



TGAAAAAATT 
TGAAAAAATT 
TGAAAAAATT 
TGAAAAAATT 
TGAAAAAATT 
TGAAAAAATT 
TGAAAAAATT 
TGAAAAAATT 



msa235280 . 2 { 195_C0H1 
m8a235280.2(195_M732 
msa2352B0 . 2 J 195_M7B1 
msa235280.2(195_H36B 
msa235280 ,2{l95_JM9130013 
msa235280 . 2 { 195_18RS21 
msa235280 . 2 { 195_2603 
msa235280 . 2 { 195_A909 . 

Consensus 



1351 

TGACTCTAGT 
TGACTCTAGT 
TGACTCTAGT 
TGACTCTAGT 
TGACTCTAGT 
TGACTCTAGT 
TGACTCTAGT 
TGACTCTAGT 



TTTGGTTTAA 
TTTGGTTTAA 
TTTG GTTTA A 
TTTGGTTTAA 
TTTGGTTTAA 
TTTGGTTTAA 
TTTGGTTTAA 
TTTGGTTTAA 



CTGAAAGTCA 
CTGAAAGTCA 
CTGAAAGTCA 
CTGAAAGTCA 
CTGAAAGTCA 
CTGAAAGTCA 
CTGAAAGTCA 
CTGAAAGTCA 



GATAGATGGA 
GATAGATGGA 
GATAGATGGA 
GATAGATGGA 
GATAGATGGA 
GATAGATGGA 
GATAGATGGA 
GATAGATGGA 



1400 
TACTATATTT 
TACTATATTT 
TACTATATTT 
TACTATATTT 
TACTATATTT 
TACTATATTT 
TACTATATTT 
TACTATATTT 



msa235280 . 
msa235280. 
msa235280. 
msa2352B0 , 
msa235280.2{l95 
msa235280.2f 
msa235280. 
msa235280. 



2{195_C0H1 
2(195_M732 
2(195_M781 
2{195__H36B 
JM9130013 
195_18RS21 
2{l95_2603 
2{195_A909 
Consensus 



1401 

ATAAAGATGC 
ATAAAGATGC 
ATAAAGATGC 
ATAAAGATGC 
ATAAAGATGC 
ATAAAGATGC 
ATAAAGATGC 
ATAAAGATGC 



AATTAACCTT 
AATTAACCTT 
AATTAACCTT 
AATTAACCTT 
AATTAACCTT 
AATTAACCTT 
AATTAACCTT 
AATTAACCTT 



AAATTTAAAT 
AAATTTAAAT 
AAATTTAAAT 
AAATTTAAAT 
AAATTTAAAT 
AAATTTAAAT 
AAATTTAAAT 
AAATTTAAAT 



TAACCAGTGG 
TAACCAGTGG 
TAACCAGTGG 
TAACCAGTGG 
TAACCAGTGG 
TAACCAGTGG 
TAACCAGTGG 
TAACCAGTGG 



1450 
TGCAAGTCTT 
TGCAAGTCTT 
TGCAAGTCTT 
TGCAAGTCTT 
TGCAAGTCTT 
TGCAAGTCTT 
TGCAAGTCTT 
TGCAAGTCTT 



msa235280.2{l95 COH1 
ma a23 52 8 0.2 | 19 5 M732 
msa235280 . 2 f 195™M781 
msa23 5280 . 2 { 195_H36B 
msa235280 . 2 { 195_JM9130013 
msa235280 . 2 { 195_18RS21 
msa235280 . 2 / 195_2603 
msa2352 80 . 2 { 195_A909 [ 
Consensus 



1451 

AAAGTTGTTT 
AAAGTTGTTT 
AAAGTTGTTT 
AAAGTTGTTT 
AAAGTTGTTT 
AAAGTTGTTT 
AAAGTTGTTT 
AAAGTTGTTT 



ATAAAGGGCA 
ATAAAGGGCA 
ATAAAGGGCA 
ATAAAGGGCA 
ATAAAGGGCA 
ATAAAGGGCA 
ATAAAGGGCA 
ATAAAGGGCA 



AGAAGATCCA 
AGAAGATCCA 
AGAAGATCCA 
AGAAGATCCA 
AGAAGATCCA 
AGAAGATCCA 
AGAAGATCCA 
AGAAGATCCA 



TATAGTCATC 
TATAGTCATC 
TATAGTCATC 
TATAGTCATC 
TATAGTCATC 
TATAGTCATC 
TATAGTCATC 
TATAGTCATC 



1500 
AGAAAGAAGA 
AGAAAGAAGA 
AGAAAGAAGA 
AGAAAGAAGA 
AGAAAGAAGA 
AGAAAGAAGA 
AGAAAGAAGA 
AGAAAGAAGA 



msa2 3 52 8 0 . 2 { 19 5_C0H1 
msa235280 . 2 I 195J4732 
msa235280.2ll95_M781 
msa235280 . 2 { 195_H36B 
msa235280 . 2{ 195_JM9130013 
msa235280 . 2 {l95_18RS21 
msa235280 . 2 { 195_2603 
msa2 3 52 8 0 . 2 { 195_A9 0 9 
Consensus 



1501 

TATGACTAAA 
TATGACTAAA 
TATGACTAAA 
TATGACTAAA 
TATGACTAAA 
TATGACTAAA 
TATGACTAAA 
TATGACTAAA 



AaAGGTGAAC 
AaAGGTGAAC 
AaAGGTGAAC 
AaAGGTGAAC 
AaAGGTGAAC 
AaAGGTGAAC 
AaAGGTGAAC 
AaAGGTGAAC 



AGCTCAGTCA 
AGCTCAGTCA 
AGCTCAGTCA 
AGCTCAGTCA 
AGCTCAGTCA 
AGCTCAGTCA 
AGCTCAGTCA 
AGCTCAGTCA 



TTCAACTCAA 
TTCAACTCAA 
TTCAACTCAA 
TTCAACTCAA 
TTCAACTCAA 
TTCAACTCAA 
TTCAACTCAA 
TTCAACTCAA 



1550 
GCCAATGAAA 
GCCAATGAAA 
GCCAATGAAA 
GCCAATGAAA 
GCCAATGAAA 
GCCAATGAAA 
GCCAATGAAA 
GCCAATGAAA 



msa235280 . 2 ( 195_COHl 
msa235280.2{l95_M732 
msa235280. 2(195 M781 
msa2 3 52 8 0 . 2 { 19 5~H3 6B 
msa235280 . 2 { 195_JM9130013 
msa2 352 80 . 2 { 19S_18RS2 1 
msa235280.2{l95 2603 
msa235280.2{1953A909^ 
Consensus 



1551 

ATACAGCAAA 
ATACAGCAAA 
ATACAGCAAA 
ATACAGCAAA 
ATACAGCAAA 
ATACAGCAAA 
ATACAGCAAA 
ATACAGCAAA 



AGTAACCTTT 
AGTAACCTTT 
AGTAACCTTT 
AGTAACCTTT 
AGTAACCTTT 
AGTAACCTTT 
AGTAACCTTT 
AGTAACCTTT 



GCTAATATTG 
GCTAATATTG 
GCTAATATTG 
GCTAATATTG 
GCTAATATTG 
GCTAATATTG 
GCTAATATTG 
GCTAATATTG 



ACTGGTCACA 
ACTGGTCACA 
ACTGGTCACA 
ACTGGTCACA 
ACTGGTCACA 
ACTGGTCACA 
ACTGGTCACA 
ACTGGTCACA 



1600 
TTATAGTAAG 
TTATAGTAAG 
TTATAGTAAG 
TTATAGTAAG 
TTATAGTAAG 
TTATAGTAAG 
TTATAGTAAG 
TTATAGTAAG 



msa235280.2{l95 COH1 
msa2 3 52 8 0 . 2 { 19 S*M732 
msa235280 . 2 (195J4781 
msa23 528 0 . 2 { 195_H3 6B 
msa23 5280 . 2 { 195_JM9130013 
msa235280.2{l95_18RS21 
msa2 3 52 8 0 . 2 { 1 95J2 603 
msa23 52 8 0 . 2 { 195_A90 9 
Consensus 



1601 

GTTACTGTGA 
GTTACTGTGA 
GTTACTGTGA 
GTTACTGTGA 
GTTA CTGTGA 
GTTACTGTGA 
GTTACTGTGA 
GTTACTGTGA 



ATGGAAAAGA 
ATGGAAAAGA 
ATGGAAAAGA 
ATGGAAAAGA 
ATGGAAAAGA 
ATGGAAAAGA 
ATGGAAAAGA 
ATGGAAAAGA 



AGTTGgTAAA 
AGTTGgTAAA 
AGTTGgTAAA 
AGTTGgTAAA 
AGTTGgTAAA 
AGTTGtTAAA 
AGTTGtTAAA 
AGTTGgTAAA 



GGTAGTGAGT 
GGTAGTGAGT 
GGTAGTGAGT 
GGTAGTGAGT 
GGTAGTGAGT 
GGTAGTGAGT 
GGTAGTGAGT 
GGTAGTGAGT 



1650 
TACCTTTAAC 
TAC CTTTA AC 
TACCTTTAAC 
TACCTTTAAC 
TACCTTTAAC 
TACCTTTAAC 
TACCTTTAAC 
TACCTTTAAC 



rasa235280 . 2 f 195_C0H1 
msa2 3 5 2 8 0 . 2 { 1 95J4732 
msa235280 . 21 195_M781 
msa235280.2{l95_H36B 
msa235280 . 2 { 195_JM9130013 
msa235280 . 2{ 195_18RS21 



16S1 

TAAAGGATGG 
TAAAGGATGG 
TAAAGGATGG 
TAAAGGATGG 
TAAAGGATGG 
TAAAGGATGG 



ACAACATTTG 
ACAACATTTG 
ACAACATTTG 
ACAACATTTG 
ACAACATTTG 
ACAACATTTG 



TATTACATAA 
TATTACATAA 
TATTACATAA 
TATTACATAA 
TATTACATAA 
TATTACATAA 



AACAGAAAAT 
AACAGAAAAT 
AACAGAAAAT 
AACAGAAAAT 
AACAGAAAAT 
AACAGAAAAT 



1700 
TCATTAAATG 
TCATTAAATG 
TCATTAAATG 
TCATTAAATG 
TCATTAAATG 
TCATTAAATG 



849 



WO 2004/018646 



PCT/US2003/026827 



Table 51: Comparative Sequences relating to SAG0677 



msa235280 .2{l95_2603} TAAAGGATGG ACAACATTTG TATTACATAA AACAGAAAAT TCATTAAATG 
msa235280.2{195_A909} TAAAGGATGG ACAACATTTG TATTACATAA AACAGAAAAT TCATTAAATG 
Consensus ********** ********** ********** ********** ********** 



msa2352B0 . 2 { 195_COHl 
msa235280 . 2 { 19S_M732 
msa235280.2(195 M7B1 
msa235280.2{195~H36B 
msa235280.2{l95_JM9130013 
msa2352B0 . 2 { 195_18RS21 
msa235280.2f 195 2603 
msa235280 . 2 { 195_A909 
Consensus 



1701 

TTAAAAGTTT 
TTAAAAGTTT 
TTAAAAGTTT 
TTAAAAGTTT 
TTAAAAGTTT 
TTAAAAGTTT 
TTAAAAGTTT 
TTAAAAGTTT 



GATTATGGAG 
GATTATGGAG 
GATTATGGAG 
GATTATGGAG 
GATTATGGAG 
GATTATGGAG 
GATTATGGAG 
GATTATGGAG 



ACGGGTAGTG 
ACGGGTAGTG 
ACGGGTAGTG 
ACGGGTAGTG 
ACGGGTAGTG 
ACGGGTAGTG 
ACGGGTAGTG 
ACGGGTAGTG 



TAAGTAAGAA 
TAAGTAAGAA 
TAAGTAAGAA 
TAAGTAAGAA 
TAAGTAAGAA 
TAAGTAAGAA 
TAAGTAAGAA 
TAAGTAAGAA 



1750 
AGTTCAACAA 
AGTTCAACAA 
AGTTCAACAA 
AGTTCAACAA 
AGTTCAACAA 
AGTTCAACAA 
AGTTCAACAA 
AGTTCAACAA 



msa2 35280. 2 ( 19 5_COHl 
msa235280 .2 <195_M732 
msa235280 . 2 { 195_M781 
msa235280 . 2 { 195_H36B 
msa235280 . 2{ 195_JM9130013 
msa235280 . 2 {l95_18RS21 
msa235280.2{l95_2603 
msa235280 .2{195_A909 
Consensus 



1751 

CTTCCTTTAA 
CTTCCTTTAA 
CTTCCTTTAA 
CTTCCTTTAA 
CTTCCTTTAA 
CTTCCTTTAA 
CTTC CTTTA A 
CTTCCTTTAA 



GTCCTAGATT 
GTCCTAGATT 
GTCCTAGATT 
GTCCTAGATT 
GTCCTAGATT 
GTCCTAGATT 
GTCCTAGATT 
GTCCTAGATT 



ATCTAAAAAT 
ATCTAAAAAT 
ATCTAAAAAT 
ATCTAAAAAT 
ATCTAAAAAT 
ATCTAAAAAT 
ATCTAAAAAT 
ATCTAAAAAT 



AAGCATATGA 
AAGCATATGA 
AAGCATATGA 
AAGCATATGA 
AAGCATATGA 
AAGCATATGA 
AAGCATATGA 
AAGCATATGA 



1800 
GGGATATGCT 
GGGATATGCT 
GGGATATGCT 
GGGATATGCT 
GGGATATGCT 
GGGATATGCT 
GGGATATGCT 
GGGATATGCT 



. msa235280.2(l95_eOHl 
msa235280.2 195_M732' 
msa235280 .2 195J4781 
msa235280 .2{195_H36B 
msa235280.2{l95_JM9130013 
msa235280.2{l95_18RS21 
msa235280 . 2 ( 195J2603 
msa235280 . 2 { 195_A909 
Consensus 



1801 

ACTTACTATG 
ACTTACTATG 
ACTTACTATG 
ACTTACTATG 
ACTTACTATG 
ACTTACTATG 
ACTTACTATG 
ACTTACTATG 



CAAAAAGATT 
CAAAAAGATT 
CAAAAAGATT 
CAAAAAGATT 
CAAAAAGATT 
CAAAAAGATT 
CAAAAAGATT 
CAAAAAGATT 



CAGCGTATTA 
CAGCGTATTA 
CAGCGTATTA 
CAGCGTATTA 
CAGCGTATTA 
CAGCGTATTA 
CAGCGTATTA 
CAGCGTATTA 



CGAAACAAGT 
CGAAACAAGT 
CGAAACAAGT 
CGAAACAAGT 
CGAAACAAGT 
CGAAACAAGT 
CGAAACAAGT 
CGAAACAAGT 



1850 
GACAGTCTAG 
GACAGTCTAG 
GACAGTCTAG 
GACAGTCTAG 
GACAGTCTAG 
GACAGTCTAG 
GACAGTCTAG 
GACAGTCTAG 



msa235280 . 2 f 195_COHl 
msa235280 . 2 195_M732 ' 
msa235280.2 195_M781 
msa235280 . 2 { 195_H36B 
msa235280 . 2 { 195_JM9130013 
msa235280 . 2 { 195_18RS21 
msa2352B0 .2 fl95_2603 
msa235280 . 2 {195_A909 
Consensus 



1851 

TCCTTCGAAT 
TCCTTCGAAT 
TCCTTCGAAT 
TCCTTCGAAT 
TCCTTCGAAT 
TCCTTCGAAT 
TCCTTCGAAT 
TCCTTCGAAT 



TAATCTCACT 
TAATCTCACT 
TAATCTCACT 
TAATCTCACT 
TAATCTCACT 
TAATCTCACT 
TAATCTCACT 
TAATCTCACT 



GCAGATACTA 
GCAGATACTA 
GCAGATACTA 
GCAGATACTA 
GCAGATACTA 
GCAGATACTA 
GCAGATACTA 
GCAGATACTA 



AACTTAATTT 
AACTTAATTT 
AACTTAATTT 
AACTTAATTT 
AACTTAATTT 
AACTTAATTT 
AACTTAATTT 
AACTTAATTT 



1900 
TAATGCTGTT 
TAATGCTGTT 
TAATGCTGTT 
TAATGCTGTT 
TAATGCTGTT 
TAATGCTGTT 
TAATGCTGTT 
TAATGCTGTT 



msa2 3 52 8 0 . 2 { 19 5_C0H1 
maa235280 . 2 (195_M732 
msa23S280.2{l95_M781 
msa235280.2{195 H36B 
rasa235280.2{l95 JM9130013 
msa235280 . 2 { 195_18RS21 
msa235280 - 2 ( 195_2603 
msa235280 . 2 { 195_A909 
Consensus 



1901 

AAAGGAGCGA 
AAAGGAGCGA 
AAAGGAGCGA 
AAAGGAGCGA 
AAAGGAGCGA 
AAAGGAGCGA 
AAAGGAGCGA 
AAAGGAGCGA 



GTGCTCTTAC 
GTGCTCTTAC 
GTGCTCTTAC 
GTGCTCTTAC 
GTGCTCTTAC 
GTGCTCTTAC 
GTGCTCTTAC 
GTGCTCTTAC 



TGAAAATATG 
TGAAAATATG 
TGAAAATATG 
TGAAAATATG 
TGAAAATATG 
TGAAAATATG 
TGAAAATATG 
TGAAAATATG 



ATGATGAGAC 
ATGATGAGAC 
ATGATGAGAC 
ATGATGAGAC 
ATGATGAGAC 
ATGATGAGAC 
ATGATGAGAC 
ATGATGAGAC 



1950 
AGTTTGCAGT 
AGTTTGCAGT 
AGTTTGCAGT 
AGTTTGCAGT 
AGTTTGCAGT 
AGTTTGCAGT 
AGTTTGCAGT 
AGTTTGCAGT 



msa235280 . 2 { 195_C0H1 
m8a235280 . 2 { 195J4732 
msa235280.2{l95_M781 
msa2 3 52 8 0 . 2 { 19 5_H3 6B 
msa2 35280 . 2 { 195_JM9130013 
msa235280 . 2 { 195_18RS21 
msa2352B0 ,2{195_2603 
msa235280 . 2 { 195_A909 
Consensus 



1951 

TGCTGGACCA 
TGCTGGACCA 
TGCTGGACCA 
TGCTGGACCA 
TGCTGGACCA 
TGCTGGACCA 
TGCTGGACCA 
TGCTGGACCA 



CAAGATGATC 
CAAGATGATC 
CAAGATGATC 
CAAGATGATC 
CAAGATGATC 
CAAGATGATC 
CAAGATGATC 
CAAGATGATC 



CTGTTAGTGA 
CTGTTAGTGA 
CTGTTAGTGA 
CTGTTAGTGA 
CTGTTAGTGA 
CTGTTAGTGA 
CTGTTAGTGA 
CTGTTAGTGA 



ACATAAATAC 
ACATAAATAC 
ACATAAATAC 
ACATAAATAC 
ACATAAATAC 
ACATAAATAC 
ACATAAATAC 
ACATAAATAC 



2000 
CCATCAGTAT 
CCATCAGTAT 
CCATCAGTAT 
CCATCAGTAT 
CCATCAGTAT 
CCATCAGTAT 
CCATCAGTAT 
CCATCAGTAT 



msa235280 . 2 { 195_C0H1 
msa235280.2(l95_M732 
msa235280.2(195 M781 
tnsa235280.2{195~H36B 
msa23 52 8 0 . 2 { 1 9 5_JM913 0 013 
rasa235280 . 2 { 195_18RS21 
msa235280.2{l95 2603 
msa235280 . 2 { 19S"A909 
Consensus 



2001 

TTCTCTTAAC 
TTCTCTTAAC 
TTCTCTTAAC 
TTCTCTTAAC 
TTCTCTTAAC 
TTCTCTTAAC 
TTCTCTTAAC 
TTCTCTTAAC 



TCCTGCCTTA 
TCCTGCCTTA 
TCCTGCCTTA 
TCCTGC CTTA 
TCCTGC CTTA 
TCCTGCCTTA 
TCCTGCCTTA 
TCCTGCCTTA 



TTGGAAACTG 
TTGGAAACTG 
TTGGAAACTG 
TTGGAAACTG 
TTGGAAACTG 
TTGGAAACTG 
TTGGAAACTG 
TTGGAAACTG 



CTAGTGAGGC 
CTAGTGAGGC 
CTAGTGAGGC 
CTAGTGAGGC 
CTAGTGAGGC 
CTAGTGAGGC 
CTAGTGAGGC 
CTAGTGAGGC 



2050 
AACTCTAAAT 
AACTCTAAAT 
AACTCTAAAT 
AACTCTAAAT 
AACTCTAAAT 
AACTCTAAAT 
AACTCTAAAT 
AACTCTAAAT 



maa23528 0 . 2 { 195_COHl } 



2051 2100 
GGTAAGGAAA TCACAGCATC TGGTATTATC GGTCACATCA AGGATGGTGA 



850 



WO 2004/018646 



PCT/US2003/026827 



Table 51: Comparative Sequences relating to SAG0677 



msa235280 .2(l95_M732} GGTAAGGAAA 

msa235280.2(195_M781 GGTAAGGAAA 

msa235280.2{195_H36B GGTAAGGAAA 

msa235280.2{l95_JM9130013 ■ GGTAAGGAAA 

cnsa235280.2{l95_18RS21 > GGTAAGGAAA 

msa235280.2ll95_2603 ) GGTAAGGAAA 

msa235280.2{195_A909} GGTAAGGAAA 

Consensus ********** 



TCACAGCATC 
TCACAGCATC 
TCACAGCATC 
TCACAGCATC 
TCACAGCATC 
TCACAGCATC 
TCACAGCATC 



TGGTATTATC 
TGGTATTATC 
TGGTATTATC 
TGGTATTATC 
TGGTATTATC 
TGGTATTATC 
TGGTATTATC 



GGTCACATCA 
GGTCACATCA 
GGTCACATCA 
GGTCACATCA 
GGTCACATCA 
GGTCACATCA 
GGTCACATCA 



AGGATGGTGA 
AGGATGGTGA 
AGGATGGTGA 
AGGATGGTGA 
AGGATGGTGA 
AGGATGGTGA 
AGGATGGTGA 



210X 

msa2 3 52 8 0 . 2 ( 19 5_COHl } TAAAAGCAAG 

msa235280.2< 195 M732) TAAAAGCAAG 

msa235280.2 195J4781J TAAAAGCAAG 

msa235280.2{195_H36B TAAAAGCAAG 

msa235280.2{l95_JM9130013 TAAAAGCAAG 

rasa235280.2{l95_18RS21 TAAAAGCAAG 

msa235280.2(l95_2603> TAAAAGCAAG 

msa235280.2(195_A909} TAAAAGCAAG 

Consensus ********** 



CATGTTGAAG 
CATGTTGAAG 
CATGTTGAAG 
CATGTTGAAG 
CATGTTGAAG 
CATGTTGAAG 
CATGTTGAAG 
CATGTTGAAG 



TCAAAATGGT 
TCAAAATGGT 
TCAAAATGGT 
TCAAAATGGT 
TCAAAATGGT 
TCAAAATGGT 
TCAAAATGGT 
TCAAAATGGT 



GAATGAAAAT 
GAATGAAAAT 
GAATGAAAAT 
GAATGAAAAT 
GAATGAAAAT 
GAATGAAAAT 
GAATGAAAAT 
GAATGAAAAT 



2150 
GGAGACATGC 
GGAGACATGC 
GGAGACATGC 
GGAGACATGC 
GGAGACATGC 
GGAGACATGC 
GGAGACATGC 
GGAGACATGC 



2151 

msa235280.2fl95_COHl} TAGGAACCCC 

msa235280.2fl95_M732l TAGGAACCCC 

msa235280.2(195_M78l} TAGGAACCCC 

msa235280.2{195_H36B TAGGAACCCC 

msa235280.2{l95_OM9130013 TAGGAACCCC 

msa235280.2{l9 5_1 8RS2 1 J TAGGAACCCC 

msa235280.2{l95_2603 TAGGAACCCC 

msa235280.2{l95_A909} TAGGAACCCC 

Consensus ********** 



TGTTATTATT 
TGTTATTATT 
TGTTATTATT 
TGTTATTATT 
TGTTATTATT 
TGTTATTATT 
TGTTATTATT 
TGTTATTATT 



CAAGGTAAAG 
CAAGGTAAAG 
CAAGGTAAAG 
CAAGGTAAAG 
CAAGGTAAAG 
CAAGGTAAAG 
CAAGGTAAAG 
CAAGGTAAAG 



ACTTGACTAA 
ACTTGACTAA 
ACTTGACTAA 
ACTTGACTAA 
ACTTGACTAA 
ACTTGACTAA 
ACTTGACTAA 
ACTTGACTAA 



2200 
TCGAACAAAA 
TCGAACAAAA 
TCGAACAAAA 
TCGAACAAAA 
TCGAACAAAA 
TCGAACAAAA 
TCGAACAAAA 
TCGAACAAAA 



msa235280 .2( 195_COHl] 
msa235280. 2(195 M732 
msa235280.2fl95"M781 
msa235280. 2(195 H36BJ 
msa235280 .2 { 195_JM9130013 
msa235280 . 2 { 195_18RS21 
msa235280 . 2 ( 195_2603 ] 
tnsa235280.2{195_A909 t 
Consensus 



msa2352B0 . 2 f 195_C0H1 
rasa235280.2 195_M732 
tnsa235280 .2 195_M781 
msa235280.2{195_H36B 
msa235280 . 2 { 195JJM9130013 
msa235280 . 2 { 195_1BRS21 
msa235280.2{l95_2603 
msa23528 0 . 2 { 195_A909 . 

Consensus 



msa235280.2(195_COHi; 
msa235280.2{l95_M732 
Tnsa235280.2(195_M781 
msa23 5280. 2 { 195 H36B 
msa2 3 52 80 . 2 { 19 5_JM9 13 0013 
msa235280 . 2 { 195_18RS21 
msa235280. 2(195 2603 
msa235280.2{195_A909 
Consensus 



msa235280.2{195_COHl 
tnsa235280.2 195 M732 
msa235280.2 195_M781 
msa235280 . 2 { 195_H36B 
msa235280 . 2 { 195_OM9130013 
msa235280 . 2 { 195_18RS21 
msa235280.2fl95_2603 » 
msa235280.2{l95_A909 \ 
Consensus 



tnsa235280 .2 195_C0H1 
Cisa235280.2 195_M732 
cnsa2 3528 0.2 195_M781 
maa235280 . 2 { 195__H36B 
msa235280 . 2 { 195_JM9130013 
tnsa235280.2{l95 18RS21 
maa235280,2{l95 2603 



2201 

CCATTAATGA 
CCATTAATGA 
CCATTAATGA 
CCATTAATGA 
CCATTAATGA 
CCATTAATGA 
CCATTAATGA 
CCATTAATGA 



GTGGACGTAG 
GTGGACGTAG 
GTGGACGTAG 
GTGGACGTAG 
GTGGACGTAG 
GTGGACGTAG 
GTGGACGTAG 
GTGGACGTAG 



AGTACTTTAT 
AGTACTTTAT 
AGTACTTTAT 
AGTACTTTAT 
AGTACTTTAT 
AGTACTTTAT 
AGTACTTTAT 
.AGTACTTTAT 



GCCGGTAAAC 
GCCGGTAAAC 
GCCGGTAAAC 
GCCGGTAAAC 
GCCGGTAAAC 
GCCGGTAAAC 
GCCGGTAAAC 
GCCGGTAAAC 



2250 
AATATGAGTT 
AATATGAGTT 
AATATGAGTT 
AATATGAGTT 
AATATGAGTT 
AATATGAGTT 
AATATGAGTT 
AATATGAGTT 



2251 

CCGGGCTAAA 
CCGGGCTAAA 
CCGGGCTAAA 
CCGGGCTAAA 
CCGGGCTAAA 
CCGGGCTAAA 
CCGGGCTAAA 
CCGGGCTAAA 



TTACCACTTA 
TTACCACTTA 
TTACCACTTA 
TTACCACTTA 
TTACCACTTA 
TTACCACTTA 
TTACCACTTA 
TTACCACTTA 



GTCGTTTTAA 
GTCGTTTTAA 
GTCGTTTTAA 
GTCGTTTTAA 
GTCGTTTTAA 
GTCGTTTTAA 
GTCGTTTTAA 
GTCGTTTTAA 



CACTTGGATT 
CACTTGGATT 
CACTTGGATT 
CACTTGGATT 
CACTTGGATT 
CACTTGGATT 
CACTTGGATT 
CACTTGGATT 



2300 
AGGGTTGAAG 
AGGGTTGAAG 
AGGGTTGAAG 
AGGGTTGAAG 
AGGGTTGAAG 
AGGGTTGAAG 
AGGGTTGAAG 
AGGGTTGAAG 



2301 

TGGTAACAGA 
TGGTAACAGA 
TGGTAACAGA 
TGGTAACAGA 
TGGTAACAGA 
TGGTAACAGA 
TGGTAACAGA 
TGGTAACAGA 



AGCAGGAGAG 
AGCAGGAGAG 
AGCAGGAGAG 
AGCAGGAGAG 
AGCAGGAGAG 
AGCAGGAGAG 
AGCAGGAGAG 
AGCAGGAGAG 



AAAGCAAGTA 
AAAGCAAGTA 
AAAGCAAGTA 
AAAGCAAGTA 
AAAGCAAGTA 
AAAGCAAGTA 
AAAGCAAGTA 
AAAGCAAGTA 



TTGTTCGTCG 
TTGTTCGTCG 
TTGTTCGTCG 



TTGTTCGTCG 
TTGTTCGTCG 
TTGTTCGTCG 



2350 
CATGTTCTTT 
CATGTTCTTT 
CATGTTCTTT 
CATGTTCTTT 
CATGTTCTTT 
CATGTTCTTT 
CATGTTCTTT 
CATGTTCTTT 



2351 

GACCAATCAG 
GACCAATCAG 
GACCAATCAG 
GACCAATCAG 
GACCAATCAG 
GACCAATCAG 
GACCAATCAG 
GACCAATCAG 



TTCCAGAGCT 
TTCCAGAGCT 
TTCCAGAGCT 
TTCCAGAGCT 
TTCCAGAGCT 
TTCCAGAGCT 
TTCCAGAGCT 
TTCCAGAGCT 



TAACACAGCA 
TAACACAGCA 
TAACACAGCA 
TAACACAGCA 
TAACACAGCA 
TAACACAGCA 
TAACACAGCA 
TAACACAGCA 



GTTGCTAAAC 
GTTGCTAAAC 
GTTGCTAAAC 
GTTGCTAAAC 
GTTGCTAAAC 
GTTGCTAAAC 
GTTGCTAAAC 
GTTGCTAAAC 



2400 
GTGATTTGAC 
GTGATTTGAC 
GTGATTTGAC 
GTGATTTGAC 
GTGATTTGAC 
GTGATTTGAC 
GTGATTTGAC 
GTGATTTGAC 



2401 

TTCTGATACT 
TTCTGATACT 
TTCTGATACT 
TTCTGATACT 
TTCTGATACT 
TTCTGATACT 
TTCTGATACT 



GCTCTTATCC 
GCTCTTATCC 
GCTCTTATCC 
GCTCTTATCC 
GCTCTTATCC 
GCTCTTATCC 
GCTCTTATCC 



ACATCGTTGC 
ACAT CGTTG C 
ACATCGTTGC 
ACATCGTTGC 
ACATCGTTGC 
ACATCGTTGC 
ACATCGTTGC 



CAAAGATGAC 
CAAAGATGAC 
CAAAGATGAC 
CAAAGATGAC 
CAAAGATGAC 
CAAAGATGAC 
CAAAGATGAC 



2450 
TCTCTAAAAC 
TCTCTAAAAC 
TCTCTAAAAC 
TCTCTAAAAC 
TCTCTAAAAC 
TCTC TAAAAC 
TCTCTAAAAC 



851 



WO 2004/018646 



PCT7US2003/026827 



Table 51: Comparative Sequences relating to SAG0677 



msa235280 .2{l95_A909} TTCTGATACT GCTCTTATCC ACATCGTTGC CAAAGATGAC TCTCTAAAAC 
Consensus ********** ********** ********** ********** ********** 



msa235280.2< 195_C0H1 
rasa23S2B0.2 195J4732 
msa235280.2 'l95_M781 
msa235280 . 2 { 195JH36B 
msa235280.2{l95_JM9130013 
rasa235280 . 2 { 195_18RS21 
msa235280.2(l95_2603 
msa235280 . 2 { 195_A909 
Consensus 



2451 

TAAAATTATA 
TAAAATTATA 
TAAAATTATA 
TAAAATTATA 
TAAAATTATA 
TAAAATTATA 
TAAAATTATA 
TAAAATTATA 



TCAAGATGAT 
TCAAGATGAT 
TCAAGATGAT 
TCAAGATGAT 
TCAAGATGAT 
TCAAGATGAT 
TCAAGATGAT 
TCAAGATGAT 



TCATTACTTG 
TCATTACTTG 
TCATTACTTG 
TCATTACTTG 
TCATTACTTG 
TCATTACTTG 
TCATTACTTG 
TCATTACTTG 



AATCTGTTGA 
AATCTGTTGA 
AATCTGTTGA 
AATCTGTTGA 
AATCTGTTGA 
AATCTGTTGA 
AATCTGTTGA 
AATCTGTTGA 



2500 
TAAAACCGGT 
TAAAACCGGT 
TAAAACCGGT 
TAAAACCGGT 
TAAAACCGGT 
TAAAACCGGT 
TAAAACCGGT 
TAAAACCGGT 



msa235280 . 2 ( 195_C0H1 
msa235280 . 2 f 195_M732 
msa235280 . 2 { 195_M7B1 
<nsa235280 . 2[ 195_H36B 
msa235280.2{l95_JM9130013 
msa235280.2{l95 - 18RS21 
tnsa235280.2{l95_2603 
msa235280.2{195_A909 
Consensus 



2501 

CTTTATAGTT 
CTTTATAGTT 
CTTTATAGTT 
CTTTATAGTT 
CTTTATAGTT 
CTTTATAGTT 
CTTTATAGTT 
CTTTATAGTT 



TTAGAAATGG 
TTAGAAATGG 
TTAGAAATGG 
TTAGAAATGG 
TTAGAAATGG 
TTAGAAATGG 
TTAGAAATGG 
TTAGAAATGG 



TGTAGAAATC 
TGTAGAAATC 
TGTAGAAATC 
TGTAGAAATC 
TGTAGAAATC 
TGTAGAAATC 
TGTAGAAATC 
TGTAGAAATC 



ACTAAAGATA 
ACTAAAGATA 
ACTAAAGATA 
ACTAAAGATA 
ACTAAAGATA 
ACTAAAGATA 
ACTAAAGATA 
ACTAAAGATA 



2550 
TGACAGTACC 
TGACAGTACC 
TGACAGTACC 
TGACAGTACC 
TGACAGTACC 
TGACAGTACC 
TGACAGTACC 
TGACAGTACC 



msa235280 . 2{ 195_C0H1 
tttsa235280 . 2 { 195_M732 
msa235280 . 2 ( 195_M781 
msa235280 . 2 { 195_H36B 
msa235280.2{l95J7M9130013 
msa2352B0.2{l95_18RS21 
msa235280.2(l95_2603 
rasa235280 . 2 { 195_A90 9 
Consensus 



2551 

ACTAGAATTT 
ACTAGAATTT 
ACTAGAATTT 
ACTAGAATTT 
ACTAGAATTT 
ACTAGAATTT 
ACTAGAATTT 
ACTAGAATTT 



GGAGATAATA 
GGAGATAATA 
GGAGATAATA 
GGAGATAATA 
GGAGATAATA 
GGAGATAATA 
GGAGATAATA 
GGAGATAATA 



TTAtTAAGTT 
TTAtTAAGTT 
TTAtTAAGTT 
TTAcTAAGTT 
TTAtTAAGTT 
TTAtTAAGTT 
TTAtTAAGTT 
TTAtTAAGTT 



ATCTGCTGTT 
A' 
A' 

ATCTGCTGTT 
ATCTGCTGTT 
ATCTGCTGTT 
ATCTGCTGTT 
ATCTGCTGTT 



2600 
GACTTATCAA 
GACTTATCAA 
GACTTATCAA 
GACTTATCAA 
GACTTATCAA 
GACTTATCAA 
GACTTATCAA 
GACTTATCAA 



msa235280-2 195_C0H1 
jnsa235280.2 195J4732 
msa235280 . 2 195J4781 
msa235280 . 2 { 195_H36B 
msa235280.2{l95 JM9130013 
msa235280.2{l95_18RS21 
maa235280 . 2 [ 195_2603 
maa235280.2{l95_A909 
Consensus 



2601 

ATTATCGTCG 
ATTATCGTCG 
ATTATCGTCG 
ATTATCGTCG 
ATTATCGTCG 
ATTATCGTCG 
ATTATCGTCG 
ATTATCGTCG 



TAATGAGACC 
TAATGAGACC 
TAATGAGACC 
TAATGAGACC 
TAATGAGACC 
TAATGAGACC 
TAATGAGACC 
TAATGAGACC 



CTTCATATCT 
CTTCATATCT 
CTTCATATCT 
CTTCATATCT 
CTTCATATCT 
CTTCATATCT 
CTTCATATCT 
CTTCATATCT 



ATAGAAACCG 
ATAGAAACCG 
ATAGAAACCG 
ATAGAAACCG 
ATAGAAACCG 
ATAGAAACCG 
ATAGAAACCG 
ATAGAAACCG 



2650 

TTTTGATGTT 
TTTTGATGTT 
TTTTGATGTT 
TTTTGATGTT 
TTTTGATGTT 
TTTTGATGTT 
TTTTGATGTT 
TTTTGATGTT 



msa235280.2 195_COHl 
msa235280.2 195_M732 
tnsa235280 . 2 195_M78 1 
msa23 52 8 0 - 2 { 195_H36B 
msa235280 ,2{l95_JM9130013 
msa235280 . 2 { 195_1BRS21 
tnsa2352 80 . 2 { 195_2 603 
msa235280 . 2 { 195_A909 
Consensus 



2651 

AAAGCAAGCC 
AAAGCAAGCC 
AAAGCAAGCC 
AAAGCAAGCC 
AAAGCAAGCC 
AAAGCAAGCC 
AAAGCAAGCC 
AAAGCAAGCC 



AAATGACAGC 
AAATGACAGC 
AAATGACAGC 
AAATGACAGC 
AAATGACAGC 
AAATGACAGC 
AAATGACAGC 
AAATGACAGC 



TGACAAAGGA 
TGACAAAGGA 
TGACAAAGGA 
TGACAAAGGA 
TGACAAAGGA 
TGACAAAGGA 
TGACAAAGGA 
TGACAAAGGA 



GCTAAAGTAA 
GCTAAAGTAA 
GCTAAAGTAA 
GCTAAAGTAA 
GCTAAAGTAA 
GCTAAAGTAA 
GCTAAAGTAA 
GCTAAAGTAA 



2700 
CTGTGGATAT 
CTGTGGATAT 
CTGTGGATAT 
CTGTGGATAT 
CTGTGGATAT 
CTGTGGATAT 
CTGTGGATAT 
CTGTGGATAT 



msa235280 . 2{l95_C0Hi; 
msa2 3 52 8 0 . 2 { 1 95_M73 2 
msa235280 . 2 (195_M781 
msa2352 80 . 2 { 195_H36B 
msa235280.2{l95_JM9130013 
msa2 352 8 0 . 2 { 19 5_1 8RS2 1 
msa235280 . 2 (195_2603 
msa235280. 2(195^909 
Consensus 



2701 

GTTGATGAAG 
GTTGATGAAG 
GTTGATGAAG 
GTTGATGAAG 
GTTGATGAAG 
GTTGATGAAG 
GTTGATGAAG 
GTTGATGAAG 



CACTTAGTTG 
CACTTAGTTG 
CACTTAGTTG 
CACTTAGTTG 
CACTTAGTTG 
CACTTAGTTG 
CACTTAGTTG 
CACTTAGTTG 



TTCCAGAAAT 
TTCCAGAAAT 
TTCCAGAAAT 
TTCCAGAAAT 
TTCCAGAAAT 
TTCCAGAAAT 
TTCCAGAAAT 
TTCCAGAAAT 



GGCAGGAGCT 
GGCAGGAGCT 
GGCAGGAGCT 
GGCAGGAGCT 
GGCAGGAGCT 
GGCAGGAGCT 
GGCAGGAGCT 
GGCAGGAGCT 



2750 
TATACATTAA 
TATACATTAA 
TATACATTAA 
TATACATTAA 
TATACATTAA 
TATACATTAA 
TATACATTAA 
TATACATTAA 



msa235280.2l 195_COHl 
msa235280.2l 195_M732 
msa235280.2 195_M7B1 
msa235280.2{l95_H36B 
rasa235280.2{l95_JM9130013 
msa235280 . 2 { 195_18RS21 
tnsa235280 . 2 f 195_2603 
msa235280.2(l9S_A909 
Consensus 



2751 

CAATCGACGA 
CAATCGACGA 
CAATCGACGA 
CAATCGACGA 
CAATCGACGA 
CAATCGACGA 
CAATCGACGA 
CAATCGACGA 



AGcTCCAAAC 
AGcTCCAAAC 
AGCTCCAAAC 
AGcTCCAAAC 
AGcTCCAAAC 
AGcTCCAAAC 
AGcTCCAAAC 
AGaTCCAAAC 



ACAAATGAAT 
ACAAATGAAT 
ACAAATGAAT 
ACAAATGAAT 
ACAAATGAAT 
ACAAATGAAT 
ACAAATGAAT 
ACAAATGAAT 



CAGGAATGTT 
CAGGAATGTT 
CAGGAATGTT 
CAGGAATGTT 
CAGGAATGTT 
CAGGAATGTT 
CAGGAATGTT 
CAGGAATGTT 



2800 
AACAAACGCT 
AACAAACGCT 
AACAAACGCT 
AACAAACGCT 
AACAAACGCT 
AACAAACGCT 
AACAAACGCT 
AACAAACGCT 



msa235280 
msa235280 



,2(195 COHlJ 
2{1953 



M732) 



2801 2850 
AAAGTATOGA TTCATTATGT AAATGGTGGT GTTGATAAAG TTGATGTTCC 
AAAGTATCGA TTCATTATGT AAATGGTGGT GTTGATAAAG TTGATGTTCC 



852 



WO 2004/018646 



PCT/US2003/026827 



Table 51: Comparative Sequences relating to SAG0677 



msa2 3 52 8 0 . 2 f 1 9 5_M7 8 1 
maa235280 . 2 { 195_H36B 
msa235280.2{l95_JM9130013 
msa235280 . 2 { 195_18RS21 
msa235280.2{l95_26O3 
msa235280.2{195_A909 
Consensus 



msa235280.2{ 19 5_C0H1 
msa235280 . 2 { 195J4732 
msa235280.2(l95_M781 
msa235280. 2(195 H36B 
rasa235280 . 2 { 195_JM9130013 
msa235280 . 2 { 195_18RS21 
msa235280.2fl95 2603 
msa235280 . 2 { 195~A909 
Consensus 



AAAGTATCGA 
AAAGTATCGA 
AAAGTATCGA 
AAAGTATCGA 
AAAGTATCGA 
AAAGTATCGA 



TTCATTATGT 
TTCATTATGT 
TTCATTATGT 
TTCATTATGT 
TTCATTATGT 
TTCATTATGT 



AAATGGTGGT 
AAATGGTGGT 
AAATGGTGGT 
AAATGGTGGT 
AAATGGTGGT 
AAATGGTGGT 



GTTGATAAAG 
GTTGATAAAG 
GTTGATAAAG 
GTTGATAAAG 
GTTGATAAAG 
GTTGATAAAG 



TTGATGTTCC 
TTGATGTTCC 
TTGATGTTCC 
TTGATGTTCC 
TTGATGTTCC 
TTGATGTTCC 



2851 2900 
GATTAAAGTA GTTGACTTAG AAGCTATTcg taaagctgaa gaagcacata 
GATTAAAGTA GTTGACTTAG AAGCTATTcg taaagctgaa gaagcacata 
GATTAAAGTA GTTGACTTAG AAGCTATTcg taaagctgaa gaagcacata 
GATTAAAGTA GTTGACTTAG AAGCTATTcg taaagctgaa gaagcacata 
GATTAAAGTA GTTGACTTAG AAGCTATTcg taaagctgaa gaagcacata 

GATTAAAGTA GTTGACTTAG AAGCTATT 

GATTAAAGTA GTTGACTTAG AAGCTATT 

GATTAAAGTA GTTGACTTAG AAGCTATTcg taaagctgaa gaagcacata 



msa235280 . 2{ 19S_C0H1 
msa235280.2{195_M732 
msa23S280 . 2[ 195_M781 
msa235280.2(195_H36B 
msa235280.2{l95 JM9130013 
msa235280.2{l95 18RS21 
msa235280. 2(195 2603 
msa23528p.2{l95~A909 
Consensus 



msa235280.2{l95_COHl 
msa235280 .2(195_M732 
rasa23 52 8 0 . 2 { 19 5_M7 8 1 
msa235280 .2{195_H36B 
msa235280 . 2 { 195_JM9130013 
msa235280 . 2 { 195_18RS2 1 
msa23528 0 . 2 f 195_2603 
msa235280 . 2 { 195_A909 
Consensus 



2901 2950 
aagctgacga agcacgtaaa gctgaagaag caCGTAAAGC TGAaGAAGCA 
aagctgacga agcacgtaaa gctgaagaag caCGTAAAGC TGAaGAAGCA 
aagctgacga agcacgtaaa gctgaagaag caCGTAAAGC TGAaGAAGCA 
aagctgacga agcacgtaaa gctgaagaag caCGTAAAGC TGAcGAAGCA 
aagctgacga agcacgtaaa getgaagaag caCGTAAAGC TGAaGAAGCA 

CGTAAAGC TGAaGAAGCA 

. .' cgtaaa gctgaagaag caCGTAAAGC TGAaGAAGCA 

aagctgacga agcacgtaaa gctgaagaag caCGTAAAGC TGAaGAAGCA 



2951 3000 
CaTAAAGCTG AAGAAGtAcg taaagctgaa gaagcacata aagtcgaaga 
CaTAAAGCTG AAGAAGtAcg taaagctgaa gaagcacata aagtcgaaga 
CaTAAAGCTG AAGAAGtAcg taaagctgaa gaagcacata aagtcgaaga 
CaTAAAGCTG AAGAAGtAcg taaagctgaa gaagcacata aagtcgaaga 
CaTAAAGCTG AAGAAGtAcg taaagctgaa gaagcacata aagtcgaaga 

CgTAAAGCTG AAGAAGcA 

CgTAAAGCTG AAGAAGcA 

CgTAAAGCTG AAGAAGcA 



msa23 528 0 . 2 { 19 5 JC0H1 ] 
msa235280.2{l95_M732 
m8a235280.2fl95_M78i; 
msa235280.2{195_H36B 
msa235280.2{l95_JM9130013 
rasa235280.2{l95_18RS21 
msa23 5280 . 2 { 195_2603 
msa235280.2(195_A909 
Consensus 



3001 

agca.CGTAA 
agca . CGTAA 
agcacCGTAA 
agca . CGTAA 
agcacCGTAA 

CGTAA 

CGTAA 

CGTAA 



AGCTGAAGAG 
AGCTGAAGAG 
AGCTGAAGAG 
AGCTGAAGAG 
AGCTGAAGAG 
AGCTGAAGAG 
AGCTGAAGAG 
AGCTGAAGAG 



GGACATAAAA 
GGACATAAAA 
GGACATAAAA 
GGACATAAAA 
GGACATAAAA 
GGACATAAAA 
GGACATAAAA 
GGACATAAAA 



CCCAAGAAGC 
CCCAAGAAGC 
CCCAAGAAGC 
CCCAAGAAGC 
CCCAAGAAGC 
CCCAAGAAGC 
CCCAAGAAGC 
CCCAAGAAGC 



3050 
ACCTATAGTT 
ACCTATAGTT 
ACCTATAGTT 
ACCTATAGTT 
ACCTATAGTT 
ACCTATAGTT 
ACCTATAGTT 
ACCTATAGTT 



msa235280 . 2 195JXH1 
msa235280 . 2 195_M732 
rasa235280.2 195 M781 
msa235280 . 2 { 1955l36B 
msa235280 . 2 ( 195_JM9130013 
msa2352B0 . 2 { 195_18RS21 
msa235280 . 2 { 195J2603 
msa235280 . 2 {195_A909 
Consensus 



3051 

GAAGAAGGCT 
GAAGAAGGCT 
GAAGAAGGCT 
GAAGAAGGCT 
GAAGAAGGCT 
GAAGAAGGCT 
GAAGAAGGCT 
GAAGAAGGCT 



ACAAaGTTAA 
ACAAaGTTAA 
ACAAaGTTAA 
ACAAg GTTA A 
ACAAgGTTAA 
ACAAgGTTAA 
ACAAgGTTAA 
ACAAgGTTAA 



TAAGGTTCAT 
TAACGTTCAT 
TAACGTTCAT 
TAACGTTCAT 
TAACGTTCAT 
TAACGTTCAT 
TAACGTTCAT 
TAACGTTCAT 



CAAACTGATA 
CAAACTGATA 
CAAACTGATA 
CAAACTGATA 
CAAACTGATA 
CAAACTGATA 
CAAACTGATA 
CAAACTGATA 



3100 
CTACAGTTAA 
CTACAGTTAA 
CTACAGTTAA 
CTACAGTTAA 
CTACAGTTAA 
CTACAGTTAA 
CTACAGTTAA 
CTACAGTTAA 



msa235280.2(l95 C0H1 
insa235280 . 2 195J4732 
msa235280.2 195 M781 
msa235280 . 2{195~H36B 
msa235280.2{l95_JM9130013 
msa235280 . 2 { 195_18RS21 
msa235280. 2(195 2603 
msa235280 . 2 { 195_A909 
Consensus 



msa235280.2(l95 COH1 
msa235280.2{l95_M732 
n»sa235280.2{l95_M781 
msa235280 . 2 { 195_H36B 
rosa235280.2{l95_JM9130013 
msa235280.2{l95_18RS21 
msa235280 . 2{ 195_2603 
tnsa2352B0. 2(195 A909 



3101 3150 
AGCGTCTGAT TTACCAAAGA CTAAGACAGT TTCCGCAGTT CATATGGCTA 
AGCGTCTGAT TTACCAAAGA CTAAGACAGT TTCCGCAGTT CATATGGCTA 
AGCGTCTGAT TTACCAAAGA CTAAGACAGT TTCCGCAGTT CATATGGCTA 
AGCGTCTGAT TTACCAAAGA CTAAGACAGT TTCCGCAGTT CATATGGCTA 
AGCGTCTGAT TTACCAAAGA CTAAGACAGT TTCCGCAGTT CATATGGCTA 
AGCGTCTGAT TTACCAAAGA CTAAGACAGT TTCCGCAGTT CATATGGCTA 
AGCGTCTGAT TTACCAAAGA CTAAGACAGT TTCCGCAGTT CATATGGCTA 
AGCGTCTGAT TTACCAAAGA CTAAGACAGT TTCCGCAGTT CATATGGCTA 

3151 3200 

GAACAGACAA TAAACAGATA ACTTCACATC AGACACATGt 

GAACAGACAA TAAACAGATA ACTTCACATC AGACACATGt TGAAAA 

GAACAGACAA TAAACAGATA ACTTCACATC AGACACATGt TG 

GAACAGACAA TAAACAGATA ACTTCACATC AGACACATG 

GAACAGACAA TAAACAGATA ACTTCACATC AGACACATGt TG 

GAACAGACAA TAAACAGATA ACTTCACATC AGACACATGt TGAA > 

GAACAGACAA TAAACAGATA ACTTCACATC AGACACATGt TGAAAAACAA 
GAACAGACAA TAAACAGATA ACTTCACATC AGACACATGt TGAAAAACAA 



853 



WO 2004/018646 



PC17US2003/026827 



Table 51: Comparative Sequences relating to SAG0677 



Consensus 



msa235280.2j 
msa235280 . 2\ 
msa235280 .2\ 
msa235280 .2\ 



195_COHl 
195_M732 
195 M781 
195~H36B 



msa2 3 52 8 0 . 2 { 1 9 5_JM9 13 0 013 
msa235280. 2(195 18RS21 
msa235280 . 2 ( 195_2603 
msa235280 . 2 { 195_A909 
Consensus 



3201 



3250 



ATTAAAAATA cattgccatc cactggtgac agcaaacgtg gttattatat 
ATTAAAAATA 



msa235280.2{l9S_COHl 
msa2352B0 . 2 { 195_M732 
msa235280. 2(195 M781 
msa235280.2{l95_H36B 
maa235280.2{l95 JM9130013 
msa235280 . 2 {T95_18RS21 
msa235280. 2(195 2603 
msa2 3 52 8 0 . 2 { 19 S"A90 9 
Consensus 



3251 



3300 



cactggaatg gctatcgtta tgctgagtgt attatttagt ttagctaaaa 



3301 



3317 



msa235280.2 195 COH1 
msa23 5280 . 2 195~M732 
msa235280 . 2 195~~M781 
msa235280 . 2 { 195~H36B 
msa235280 .2{195_OM9130013 
msa2352'60.2{l95 18RS21 
msa2352B0.2(l95_2603 
msa235280 . 2 { 195 JV909 
Consensus 



agtttaaaag caaatat 



********** ******* 



SEQ XD NO. 5110 
STRAIN 2603 frame: 1 

LNNKGVGGDGVQIYQYYIKMDNNKPYLSPKDKTTVEKLEDRWKKIT 
IiQSVKYVGGGNlSNIiDLITPPGFKKBDKKVHKPKIiDRPPG I DLPAFTSMRS FDYSTPPGTK 
PSKPKDSI*STPPGPPDLNTPPDEAPKDS KKDAI EDKSGA I KYAKSLQLSFVDGP I LAS KV 
NGKI LQVESDGKLVI PRNALSANQ FDDTS LKI YRNNNRNKE I T I TTD YFADTKYVNI TAV 
DYLSNTTFEQIATGETVDYHAIVFSSFAAI KDKGGKIYVNDKLQBTSRIALKDKSVKIGI 
BLPNDVRHI DSI^SVRRLNEVKTVDNI LKNDEQDIN^ 
SSEIMTTFKIXSKMPELVEQKDVSLDINDMDMSKFKTIRIjGRKD 

MPPKQSQDPAS I IKKI YIiIQNGVPNELKKFX)SSFGLTESQIDGYY I YKDAINIjKFKLTSG 

ASLKVVYKIK2EDPYSHQKEDOTKKGEQLSHSTQANENTAKVTFANIDWS 

VVKG SELPLTKGWTTFVLHKTENSLNVKS L IMETGSVS KXVQQLPLS PRLS KNKHMRDML 

LTMQKDSAYYBTSDSLVLRINLTADTKLNFNAVKGASALT 

HKYPSVFIiLTPALLETASEATLNGKE I TASGI IGHIKDGDKSKHVEVKMVNENGDMLGTP 

VIICXSKDLTNRTKPIJ^GRRVLYAGKQYEFRAKLPLSRFNTWIRVEVVTEA^ 

MF FDQ S VPELNTAVAKRDLTSDTAL IH I VAKDDS LKLKL YQDDSLLES VDKTGL YS FRNG 

VEITKDMTVPLEFGDNI IKLSAVDLSNYRRNETLHIYRNRFDVKASC^ADKGAKVTVDM 

IJ4KHLVVPEMAGAYTLTI DEAPNTNESGMLTNAKVS I HYVNGGVDKVDVP I KWDLEAI R 

KAEEARKAEEARIWEEARKAEEGHKTQEAPIVEEGYKVNNVHQro 

AVHMARTDNKQITSHQfTHVEKQI KNTLPSTGOSKRGYYITGMAI V^u^SVLFSIAKKFKSK 
Y 

SEQ ID NO. 5111 
STRAIN A909 frame: 1 

LNNKGVGGDGVQI YQYYI KMDNNKPYLSPKDKTTVEKT .KDRWKKITFKVQDTGIGLKDVY 
IiQSVKYVGGGNNNLDLITPPGFKKEDKKVEKPKLDRPPGIDLPPPTSMRSFDYSTPPGTX 
PSKPKDSLSTPPGPPDLNTPPDEALKD SKKDAI EDKSGAI KYAKSLQLS FVDDP I LASKV 
NGKI LQVESDGKLVI PRNALSANQFDDTSLKI YRNNNRNKE IT I TTDYFADTKYVNITAV 
D YLSNTTPEQLATGETVD YHAI VFSS FAAI KDKGGKI YVNDKLQBTSRIALKDKS VKIG I 
ELPND VRH I D SL»SVRRLNEVKTVDN I LKNDEQD I NLS KTYQL KYNPTNRRLEFT I NN INS 
SSEIMTTFKIX3KMPELVEQKDVSI^INDMDMSKFKTIRIiGRraS 

MFFKQSQDPASI IKKIYLIQNGVPNELKKFDSSFGLTESQIDGYYIYKDAINLKFKLTSG 

ASLKVVYKGQEDPYSHQKEDWTKKGEQLSHSTQANENTAKV^ 

VGKGSELPLTKGWITF^HKTENSUIVKSLIMETGSV 

LTMQ KDSAYYET SD S LVLR I NLTADTKl^Fl^VKGASALTENMMMRQFAVAG PQDD PVSE 
HKYPSVFLLTPALLETASEATLNGKBITASGI I GH I KDGDKS KHVBVKMVNENGDMLGTP 
VI I QGKDLTNRTKPLMSGRRVLYAGKQYEFRAKLPLS RFNTW I RVEWTEAGEKAS I VRR 
MFFDQSVPELN^A\^KRDLTSin , ALIHIVAKDDSLKl J KLYQDDSLLESVDKTGLYSFRNG 
VEITKDMTVPLEPGDNI I KLSAVDLSOTRBNBTLHI YRNRFDVKASQMTADKQAKVTVDM 
LMKHLVVPEMAGAYTLT I DEDPNTNESGMLTNAKVS I HYVNGGVDKVDVP I KWDLEAI R 
KAEEAHKADEARKAEEARKAEEARKABEARKAEEGHKTQEAP I VEEGYKVNNVHQTDTTV 
KASDLPKTKTVSAVHMARTDNKQITSHQTHVEKQI KN 

SEQ ZD NO* 5112 

STRAIN H36B frame: 2 

GVQIYQYYIKMDNNKPYI^PKDKTXVEKLBDRWKKITFKVQDTQIGLK^ 

GNNNLDL ITP PG FKKEDKKVEKPKLDRP PG I DLPAPTSMRS FD YSTP PGTKP SKPKDSL S 

TPPGFPDL^PPDEAUCDSKKDAIEDKSGAIKYAKSLQLSFTO^ 



854 



WO 2004/018646 



Table 51: Comparative Sequences relating to SAG0677 



DGKLVI PRNALSANQFDDTSLKIYRNNNRNKE IT I TTD YFADTKYVN I TAVDYLSNTTFE 
QIATGETVDYHAI VFSS FAAI KDKGGKI YVNDKLQETSRI ALKDKSVKI G I ELPNDVRH I 
DSLSVRRLNEVKTVDNILKNDBQDINLSKTYQLKYNPTN^ 

DGKMPELVEQKDVSLDINDMDMSKPKT I RLGRKDSEFKGQLI AKTGTVELDM FFKQSQDP 

ASI I KKIYLI QNGVPNELKKFDSSFGLTESQIDGYY IYKDAI NLKFKLTSGASLKWYKG 

QEDPYSHQKEDMTKKGEQLSHSTQANENTAKVTFANIDWSHYSKVTVbKSKE^ 

T KGWTTFVLHKTENS LNVKS L I METGS VS KKVQQLPLS PRL»S KNKHMRDMLLTMQ KDSAY 

YETSDSLVI^INLTADTKI^FNAVKGASALTENM>I^ 

TPALLETASEATLNGKE ITASGI IGHI KDGDKSKHVEVKMVNENGM4IjGTPVI IQGKDLT 
NRTKPLM SGRRVLYAG KQYE FRAKL PLSRFNT WI RVEWTEAGEKAS I VRRMFFDQSVPE 
LNTAVAKRDLTS DTAL I H I VAKDDSLKLKL YQDD SLLES VDKTGLYS FRNGVE I T KDMTV 
PLETODNITKLSAVDLSNYRRNETLHIYRNRFDVKASQOTADKGAKVT^ 
MAGAYTLTI DEAPNTNE SGMLTNAKVS I HYVNGGVDKVDVPI KWDLEAIRKAEEAHKAD 
EARKAEEARKADEAHKAEEVRKAEEAHKVEEARKAEEGHKTQEIAPIVEEGYKV^ 
TTVKASDLPICrKTVS AVHMARTDNKQ I TSHQTH 

SEQ XD NO. 5113 
STRAIN 18RS21 frame: 1 

LNNKG VGGDGVQ I YQYY I KMDNNKPYLSPKDKTTVEKLEDRWKKITFKVQDTGIGLKDVY 
I^SVKYVGGGNNNI^LITPPGFKKEDKKVEKPKLDRPPGI^ 

PSKPKDSIiSTPPGFPDLNTPPDEAPKDSKKDAI EDKSGAI KYAKSLQLSFVDDPILASKV • 
NGKI LQVESDGKLVI PRNALSANQFDDTSLKI YRNNNRNKE I TITTDYFADTKYVNITAV 
DYLSNTT FBQLATGETVDYHAI VF SS FAAI KDKGGKI YVNDKLQETSRI ALKDKSVKIGI 
ELPNDVRHIDSLSVRRLNEVTCTVDNILKNDEQDINIiS 
SSEIMTTFKDGKMPELVEQKDVSLDINDMDMSKFKTIRIiGRK^ 
MFFKQSQDPASIIKKIYLIQNGVPNELKKFDSSFGLTESQIDGYYIYKDAINI^ 
ASIiKVVYKGQEDPYSHQKEDMTKKGEQIiSHSTQANENTAKVTFANI DWSHYSKVTVNGKE 
VVKGSELPLTKGWTTFVIiHKTENSLN\nffiIjIMETGSV 

LTMQKDSAYYET SD SLVLRI NLTADTKLNF^VKGAS ALTENMMMRQFAVAG PQDDP VS E 
HKYPSVFIiTPALLETASEATLNGKEITASGI IGHIKDGDKSKHVEVKMVNENGDMLGTP 
VI IQGKDLTNRTKPIJ4SGRRVLYAGKQYEFRAKLPLSRFNTWIRVEVVTEAGE 
MFFDQSVPBIjNTAVAKRDLTSDTAL I HI VAKDDSLKLKLYQDDSLLESVDKTGLYSFRNG 
VEITKDMTVPLBFGDNI I KLSAVDLSNYRRNETIiHIYT^NRFDVKASQMTADKGAK^ 
LMKHLVVPEMAGAYTIiT I DEAPNTNESGMLTNAKVS I HYVNGGVDKVDVP I KWDLEAI R 
KAEEARKAEEARKAEEGHKTQEAP I VEEGYKVNNVHG/ITn?TVKASDLPKTKTVSAVHMAR 
TDNKQITSHQTHVB 

SEQ XD NO. 5114 

STRAIN M732 frame: 1 

LNNKG VGGDGVQIYQYYI KMDNNKP YLS PKDKTTVEKLEDRWKKI TFKVQDTG I GLKDVY 
LQSVKYVGGGNNNI*DLiITPPGFKKEDKKVE KPKLDRPPGI DLPAPTSMRS FDYST PPGTK 
PSKPKDSLSTPPGFPDLNTPPDEATKG . . KRRY . R . IRSN . I C . VSST . LC . . PYFS . QS 
KWQNITSRI . WQISHS . KCFVS .SI..H.S. NLS . . . SQ . RNYYHNRLFCRYKI CQYHSG 
. LFEQYYF . AI SYW . NSRLPCHCIFKLCCY . RQGW . DLC . R . IARNFSYSA . R . I C . DWY 
. ITK . CQTY . .FICSSFE.G.NC. .YLEK. .TRH . S QQNL P I KI QPDKS S SRVYY . .H.L 
KFRNHDHFQRWKDARIG . T KRCFFG YKRYGHE . V . NYSTWTKGF . I . GTTYCKNWNS . IR 
YVFQTISRPSFNY . KNIPYPKWCSK . IEKI . L . FWFN . KSDRWI LYL . RCN .P.I. INQW 
CKS . SCL .RARRSI . SSERRYD . KR . TAQS FNSSQ . KYSKSNLC . Y . LVTL . . GYCEWKR 
SW.R. . VTFN . RMDNICIT .NRKFIKC . KFDYGDG . CK. ESSTTSFKS . 1 1 . K. AYEGYA 
TYYAKRFSVLRNK . QSSPSN . SHCRY . T . F . CC . RSECSY . KYDDBTVCSCWTTR . SC . . 
T.IPISISLNSCLIGNC. . GNSKW . GNHSI WYYRSHQGW . . KQAC . SQNGE . KWRHARNP 
CYYSR . RLD . SNKTINEWT . STLCR . TI . VPG . ITT . SF . HLD . G . SGNRSRRESKYCSS 
HVL.PISSRA.HSSC.T.FDF.YCSYPHRCQR.LSKTKIISR.FIT.IC. .NRSL.F.KW 
CRNH . RYDSTTRIWR. YY . VICC . LIKLSS . . DPSYL . KPF . C . SKPNDS . QRS . SNCGY 
VDEALSCSRNGRSLYINNRRSSKHK . IRNVNKR . S IDSLCKWWC . . S . CSD . SS . LRSYS 
. S . RST . S . RST . S . RST . S . RST . S . RST . S . RST . SRRST . S . RGT . NPRSTYS . RRL 
QS . . RSSN . YYS . SV.FTKD . DSFRSSYG . NRQ . TDNFTSDTC . K 

SEQ XD NO. 5115 

STRAIN COH1 frame t 1 

LNNKG VGGDGVQIYQYYI KMDNNKPYLSPKDKTTVEKLEDRWKKITFKVQDTGI GLKDVY 
LQSVKYVGGGNNNIiDLITPPGFKKEDKKVEKPKLDRPPGIDLPAPTS 
PSKPKDSLSTPPGFPDLNTPPDEATKG . . KRRY . R . IRSN . I C . VSST .LC. . PYFS . QS 
KWQNITSRI. WQISHS. KCFVS. S I.. H.S. NLS. . .SQ. RNYYHNRLFCRYKI CQYHSG 
. LFEQYYF. AI SYW. NSRLPCHCIFKLCCY. RQGW. DLC. R. IARNFSYSA. R. IC.DWY 
.ITK. CQTY. .FICSSFE.G.NC. .YLEK. .TRH. SQQNLPIKIQPDKSSSRVYY. .H.L 
KFRNHDHFQRWKDARIG . TKRCFFGYKRYGHE . V . NYSTWTKGF . I . GTTYCKNWNS . I R 
YVFQTISRPSFNY . KNI PYPKWCSK . I EKI . L . FWFN . KSDRWI LYL . RCN .P.I. INQW 
CKS . SCL . RARRS I . SSERRYD . KR . TAQS FNSSQ . KYSKSNLC . Y . LVTL . . GYCEWKR 
SW.R. . VTFN. RMDNICIT. NRKFIKC. KFDYGDG. CK. ESSTTSFKS. II .K. AYEGYA 
TYYAKRFSVLRNK . QSSPSN . SHCRY .T.F.CC. RSECSY . KYDDETVCSCWTTR . SC . . 
T.IPISISLNSCLIGNC. .GNSKW. GNHSI WYYRSHQGW. . KQAC . SQNGE . KWRHARNP 
CYYSR . RLD . SNKTINEWT . STLCR .TI . VPG . ITT . SF . HLD . G . SGNRSRRESKYCSS 
HVL . PISSRA .HSSC.T . FDF . YCSYPHRCQR . LSKTKI I SR . FIT . IC . .NRSL . F . KW 
CRNH . RYDSTTRIWR . YY . VICC . LIKLSS . . DPSYL . KPF. C . SKPNDS . QRS . SNCGY 
VDEALSCSRNGRSLYINNRRSSKHK . I RNVNKR . S IDSLCKWWC . . S . CSD . SS . LRSYS 
. S. RST. S. RST. S. RST. S. RST. S. RST. S .RST. SRRST. S .RGT. NPRSTYS. RRL 
QS. .RSSN. YYS. SV.FTKD. DSFRSSYG. NRQ. TDNFTSDTC 

SEQ XD NO. 5116 
STRAIN M781 frame* 1 

LNNKGVGGDGVQ I YQYY I KMDNNKPYLS P KDKTTVEKLBDRWKKI TFKVQDTG I GLKDVY 
LQSVKYVGGGNNNLDLITPPGF1CKEDKKVEKPKLDRPPO I DLPAPTSMRS FDYSTPPGTK 



855 
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PSKPKDSLSTPPGFPDLNTPPDEATKG . . KRRY .R.I RSN . I C . VSST . LC . . PYPS . QS 
KWQMITSRI . WQISHS . KCPVS .SI . -H.S. NLS . . . SQ . RNYYHNRLFCRYKI CQYHSG 
. LFEQYYF . AIS YW . NSRLPCHCI FKLCCY . RQGW . DLC . R . IARNFSYSA . R . IC . DWY 
.ITK.CQTY. .FICSSFE.G.NC. .YLEK. .TRH. SQQNLPIKIQPDKSSSRVYY. .H.L 
KFRNHDH FQRWKDAR I G . TKRCFFGYKRYGHE . V.NYSTWTKGF . I . GTTYCKNWNS . IR 
YVFQTISRPSFNY . KNI PYPKWCSK. IBKI . L . FWFN . KSDRWILYL*. RCN. P.I. INQW 
CKS . SCL . RARRSI . SSERRYD . KR .TAQSFNSSQ . KYSKSNLC . Y . LVTL . . GYCEWKR 
SW.R. - VTFN . RMDNICIT - NRKFI KC . KFDYGDG . CK . ESSTTSFKS .II. K . AYEGYA 
TYYAKRFSVLRNK. QSSPSN . SHCRY .T.F.CC. RSECSY . KYDD BTVCS CWTTR . SC . . 
T . I PI SI SLNSCLIGNC . . GNSKW . GNHS IWYYRSHQGW . . KQAC . SQNGB . KWRHARNP 
CYYSR . RLD . SNKXrNEWT . STLCR . TI . VPG . ITT . SF . HLD . G . SGNRSRRESKYCSS 
HVIi . PISSRA . HSSC.T. FDF . YCSYPHRCQR . LSKTKI ISR . FIT . IC . . NRSL. .F.KW 
CRNH . RYDSTTRIWR . YY.VICC . LIKLSS . . DPSYL . KPF . C . SKPNDS .QRS . SNCGY 
VDEALSCSRNGRSLYINNRRSSKHK . I RNVNKR . S IDSLCKWWC . . S . CSD . SS . LRSYS 
.S.RST.S.RST.S.RST.S.RST.S.RST.S.RST.SRRSTVKLKRDIKPKKHL.LKKA 
TKLITFIKLILQLKRLIYQRLRQFPQFIWIiEQTINR.LHIRHML 

3EQ ID HO. 5117 

STRAIN JM9130013 frame: 2 

GVQI YQYYI KMDNNKPYLS PKDKTTVEKLEDRWKKITFKVQDTG I GLKDVYLQS VKYVGG 
GNNNLDL I TP PG FKKEDKKVEKPKLDRPPG I DLPAPTSMRS FDYSTPPGTKPS KPKDSLS 
TP PG FPDLNTPPDEAPKDSKKDAI BDKSGAI KYAKSLQLS FVDDP ILAS KVNGKI LQVES 
DGKLVI PRNALS ANQFDDTSLKI YRNNNRNKE IT I TTD YFADTKYVN ITAVD YLSNTTFE 
QLATGETVDYHAI VFSSFAAIKDKGGKI YVNDKLQETSRIALKDKSVKIGI ELPNDVRHI 
DSIjSVRRLNEVKTVDNILKNDEOJ3INLSKTYQLKYN^ 

DGKMPEIjVEQKDVSLDINDMmSKFKTIRIiGRKDSEFKGQLIAKTGTVELDM 
ASI I KKIYLIQNGVPNELKKFDSSFGLTESQIDGYYIYKDAINLKFKLTSGASLKVVYKG 
QEDPYSHQKEDMTKXGEQLSHSTQANENTAKVTFANIDWSHYSKV^ 
TKGWTTFVLHKTENSLNVKSL I METGSVS KKVQQLPLS PRLS KNKHMRDMLLTMQKDS AY 
YETSDSL VLRI NLTADTKLNFNAVKGASALTENMMMRQFAVAGPQDDFVS EHKY P SVFLL 
TPALLETASEATLNGKE I TASG I IGHIKDGDKSKHVEVKMVNENGDMLGTPVI IQGKDLT 
NRTKPU4SGRRVLYAGKQYEFRAKLPLSRFNTWI RVEWTEAGEKAS rVRRMFFDQSVPE 
LNTAVAKRDLTSDTALI HI VAKDDSLKLKLYQDD SIjLESVDKTGLYS FRNGVEITKDMTV 
PLEFGDNI IKLSAVDLSNYRRNETLHI YRNRFDVKASQMTADKGAKVTIVDMLMKHLVVPE 
MAGAYTLT I DEAPNTNESGMLTNAKVS IHYVNGGVDKVDVP I KWDLEAI RKAEEAHKAD 
EARKAEEARKAEEAHKAEEVRKAEEAHKVEEAP . S . RGT . NPRSTYS .RRLQG . .RSSN. 
YYS . SV. FTKD . DSFRSSYG .NRQ . TDNFTSDTC 

PRBTTY of 8 /biotmp/msa235427.2{*} December 10, 2002 05:18 



msa235427.2{l95_H36B 
maa235427 . 2 { 195_JM9130013 
maa23S427 . 2 { 195_18RS21 



msa235427.2 
msa235427.2 
msa235427.2 
msa235427.2 
msa235427.2 



195_2603 
195 A909 
195~C0H1 
195_M732 
195_M781 
Consensus 



G 

G 

LNNKGVGGDG 
LNNKGVGGDG 
LNNKGVGGDG 
LNNKGVGGDG 
LNNKGVGGDG 
LNNKGVGGDG 



VQI YQYYI KM 
VQI YQYYI KM 
VQIYQYYIKM 
VQI YQYYI KM 
VQIYQYYIKM 
VQIYQYYIKM 
VQIYQYYIKM 
VQIYQYYIKM 



DNNKPYLSPK 
DNNKPYLSPK 
DNNKPYLSPK 
DNNKPYLSPK 
DNNKPYLSPK 
DNNKPYLSPK 
DNNKPYLSPK 
DNNKPYLSPK 



DKTTVEKLED 
DKTTVEKLED 
DKTTVEKLED 
DKTTVEKLED 
DKTTVEKLED 
DKTTVEKLED 
DKTTVEKLED 
DKTTVEKLED 



50 

RWKKITFKVQ 
RWKKITFKVQ 
RWKKITFKVQ 
RWKKITFKVQ 
RWKKITFKVQ 
RWKKITFKVQ 
RWKKITFKVQ 
RWKKITFKVQ 



msa235427.2{l95_H36B 
msa235427.2{l95_JM9130013 
msa235427.2{l95_18RS21 



msa235427.2 
msa235427.2 
msa235427 .2 
rasa235427.2 
msa235427.2 



195_2603 
195_A909 
195_C0H1 
195J4732 
195J4781 
Consensus 



51 

DTGIGLKDVY 
DTGIGLKDVY 
DTGIGLKDVY 
DTGIGLKDVY 
DTGIGLKDVY 
DTGIGLKDVY 
DTGIGLKDVY 
DTGIGLKDVY 



LQSVKYVGGG 
LQSVKYVGGG 
LQSVKYVGGG 
LQSVKYVGGG 
LQSVKYVGGG 
LQSVKYVGGG 
LQSVKYVGGG 
LQSVKYVGGG 



NNNLDLITPP 
NNNLDLITPP 
NNNLDLITPP 
NNNLDLITPP 
NNNLDLITPP 
NNNLDLITPP 
NNNLDLITPP 
NNNLDLITPP 



GFKKEDKKVE 
GFKKEDKKVE 
GFKKEDKKVE 
GFKKEDKKVE 
GFKKEDKKVE 
GFKKEDKKVE 
GFKKEDKKVE 
GFKKEDKKVE 



100 

KPKLDRPPGI 
KPKLDRPPGI 
KPKLDRPPGI 
KPKLDRPPGI 
KPKLDRPPGI 
KPKLDRPPGI 
KPKLDRPPGI 
KPKLDRPPGI 



msa235427 . 2 { 195JI36B 
ms 3235427 . 2 { 195_JM9130013 
msa235427.2{l95_18RS21 



msa235427.2 
msa235427.2 
msa235427.2 
msa235427.2 
msa235427.2 



195J2603 
195_A909 
195JCOH1 
195 M732 
19531781 
Consensus 



101 

DLPaPTSMRS 
DLPaPTSMRS 
DLPaPTSMRS 
DLPaPTSMRS 
DLPpPTSMRS 
DLPaPTSMRS 
DLPaPTSMRS 
DLPaPTSMRS 



FDYSTPPGTK 
FDYSTPPGTK 
FDYSTPPGTK 
FDYSTPPGTK 
FDYSTPPGTK 
FDYSTPPGTK 
FDYSTPPGTK 
FDYSTPPGTK 



PSKPKDSLST 
PSKPKDSLST 
PSKPKDSLST 
PSKPKDSLST 
PSKPKDSLST 
PSKPKDSLST 
PSKPKDSLST 
PSKPKDSLST 



PPGFPDLNTP 
PPGFPDLNTP 
PPGFPDLNTP 
PPGFPDLNTP 
PPGFPDLNTP 
PPGFPDLNTP 
PPGFPDLNTP 
PPGFPDLNTP 



150 

PDEAlKdskK 
PDEApKdskK 
PDEApKdskK 
PDEApKdskK 
PDEAlKdskK 
PDEAtKg. .K 
PDEAtKg. . K 
PDEAtKg . . K 



msa235427 . 2 { 195_H36B 
msa235427.2{l95 JM9130013 
msa235427 . 2 { 195_18RS21 



msa235427.2 
msa235427.2 
msa23S427.2 
msa235427.2 
msa235427.2 



195 2603 
195~A909 
195_C0H1 
195_M732 
195J4781 
Consensus 



151 

daiedksgal 
daledksgal 
daiedksgal 
daledksgal 
daiedksgal 
rry.r.irsn 
rry.r.irsn 
rry.r.irsn 



kyakslqlsf 
kyakslqlsf 
kyakslqlsf 
kyakslqlsf 
kyakslqlsf 

.iC.VBBt .1 
.iC.VBBt .1 

.ic.vsst .1 



vddPilaskv 
vddPilaskv 
vddPilaskv 
vdgPilaskv 
vddPilaskv 
c. .Pyfs.qs 
c. .Pyfs.qs 
c. .Pyfs.qs 



ngkilqvesd 
ngkilqvesd 
ngkilqvesd 
ngkilqvesd 
ngkilqvesd 
kwqnitsri. 
kwqnitsri . 
kwqnitsri. 



200 

gklvlprnal 
gklvipmal 
gklvipmal 
gklvipmal 
gklvipmal 
wqishs .kef 
wqishs.kcf 
wqishs. kef 
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msa2 3 5427 . 2 { 1 9 5_H3 6B 
msa23S427.2{l95 JM9130013 
msa23S427 .2{l95_18RS21 



msa235427 .2 
msa235427.2 
msa235427.2 
msa235427.2 
msa235427.2 



195_2603 
195_A909 
195_OOHl 
195_M732 
195_M781 
Consensus 



201 

eanqfddtsl 
sanqfddtsl 
eanqfddtsl 
sanqfddtsl 
sanqfddtsl 
vs .si . .h.s 
va .si . .h.s 
vs. si. .h.s 



kiyrnnnrnk 
kiyrnnnrnk 
kiyrnnnrnk 
kiyrnnnrnk 
kiyrnnnrnk 
.nls. . .sq. 
.nls. . .sq. 
.nls. . .sq. 



eitittdyFa 
eitittdyFa 
eitittdyFa 
eitittdyFa 
eitittdyFa 
rnyyhnrlFc 
rnyyhnrlFc 
rnyyhnrlFc 



dtKyvnitav 
dtKyvnitav 
dtKyvnitav 
dtKyvnitav 
dtKyvnitav 
ryKicqyhsg 
ryKicqyhsg 
ryKicqyhsg 



250 

dylsnttFeq 
dylsnttFeq 
dylsnttFeq 
dylsnttFeq 
dylsnttFeq 
•IfeqyyF.a 
.lfeqyyF.a 
.IfeqyyF.a 



msa23S427.2{l95 H36B 
rasa23 5427 ,2{l95_JM913 0013 
TOSa235427.2(l95 18RS21 



msa235427.2 
msa235427.2 
msa235427.2 
msa235427.2 
msa235427.2 



195_2603 
195JV909 
195_C0H1 
195_M732 
195_M781 
Consensus 



251 

latgetvdyh 
latgetvdyh 
latgetvdyh 
latgetvdyh 
latgetvdyh 
isyw.nsrlp 
isyw.nsrlp 
isyw.nsrlp 



tnsa2 3 54 2 7 . 2 { 19 5JH3 6B 
msa23S427 . 2{195_JM9130013 
msa235427 . 2 { 195_18RS21 



msa235427 
msa235427 . 
msa235427< 
msa235427 
msa235427 



195_2603 
195_A909 
195_COHl 
195_M732 
195_M781 
Consensus 



msa2 3 54 27 . 2 { 195_H3 6B 
msa235427.2{l95_JM9130013 
msa235427 .2{l95_18RS21 



msa235427.2 
msa235427 .2 
msa235427.2 
msa235427 .2 
msa235427.2 



195_2603 
195_A909 
195_C0H1 
195_M732 
19S_M781 
Consensus 



maa235427 . 2 { 195_H36B 
rasa23S427 .2{l95_JM9130013 
msa235427 . 2 { 19S_18RS21 



msa235427.2 
msa235427.2 
msa23S427.2 
msa235427.2 
msa235427.2 



19S_2603 
195_A909 
195.COH1 
195_M732 
195_M781 
Consensus 



msa235427 . 2 { 195_H36B 
msa235427 . 2 { 19S_JM9130013 
mea235427 . 2 { 195_18RS21 



insa235427.2 
msa235427.2 
msa235427.2 
msa23S427.2 
msa235427.2 



19S_2603 
195_A909 
195J30H1 
195_M732 
19SJ4781 
Consensus 



tnsa235427 
msa235427.2{l95 
msa235427.2{ 
msa235427. 
msa235427. 
msa235427 . 
msa235427. 
msa235427. 



2{l95_H36B 
_JM9 130013 
195 18RS21 



19S_2603 
195_A909 
195 C0H1 
19SJ4732 
195_M781 
Consensus 



aivfssfaai 
aivf ssfaai 
aivfssfaai 
aivfssfaai 
aivfssfaai 
chcifklccy 
chcifklccy 
chcifklccy 



kdkGgkiyvn 
kdkGgkiyvn 
kdkGgkiyvn 
kdkGgkiyvn 
kdkGgkiyvn 
.rqGw.dlc. 
-rqGw.dlc. 
.rqGw.dlc . 



dklqetsria 
dklqetsria 
dklqetsria 
dklqetsria 
dklqetsria 
r . iamf sys 
r . iamf sys 
r .iarnfsys 



300 

lkdksvkigi 
lkdksvkigi 
lkdksvkigi 
lkdksvkigi 
lkdksvkigi 
a.r.ic.dwy 
a.r .ic.dwy 
a.r.ic.dwy 



301 

elpndvrhid 
elpndvrhid 
elpndvrhid 
elpndvrhid 
elpndvrhid 
.itk.cqty. 
.itk.cqty. 
.itk.cqty. 



msa235427 . 2 { 195_H36B 
msa235427.2{l95_JM9130013 
rasa235427.2{l95_18RS21 
msa235427.2{l95_2603 



slsvrrlnev 
slsvrrlnev 
slsvrrlnev 
slsvrrlnev 
slsvrrlnev 
.f icssfe.g 
.f icssfe.g 
.f icssfe.g 



ktvdniLknd 
ktvdniLknd 
ktvdniLknd 
ktvdniLknd 
ktvdniLknd 
.nc. .yLek. 
,nc. .yLek. 
.nc. .yLek. 



eqdinlskty 
eqdinlskty 
eqdinlskty 
eqdinlskty 
eqdinlskty 
. trh . sqqnl 
. trh.sqqnl 
. trh . sqqnl 



350 

qlKynPtnrr 
qlKynPtnrr 
qlKynPtnrr 
qlKynPtnrr 
qlKynPtnrr 
piKiqPdkss 
piKiqPdkss 
piKiqPdkss 



351 

lef tinnins 
leftinnins 
leftinnins 
leftinnins 
leftinnins. 
srvyy . .h.l 
srvyy. .h.l 
srvyy. .h.l 



sseimttFkd 
sseirottFkd 
sseimttFkd 
sseimttFkd 
sseimttFkd 
kfrnhdhFqr 
kfrnhdhFqr 
kfrnhdhFqr 



gKmpelveqK 
gKmpelveqK 
gKmpelveqK 
gKmpelveqK 
gKmpelveqK 
wKdarig.tK 
wKdarig.tK 
wKdarig . t K 



dvsldindmd 
dvsldindmd 
dvsldindmd 
dvsldindmd 
dvsldindmd 
rcf fgykryg 
rcf fgykryg 
rcf fgykryg 



400 

mskfktirlg 
mskfktirlg 
mskfktirlg 
mskfktirlg 
mskfktirlg 
he.v.nystw 
he.v.nystw 
he.v.nystw 



401 

rKdsefkGql 
rKdsefkGql 
rKdsefkGql 
rKdsefkGql 
rKdsefkGql 
tKgf .i.Gtt 
tKgf .i.Gtt 
tKgf .i.Gtt 



iaKtgtveld 
iaKtgtveld 
iaKtgtveld 
iaKtgtveld 
iaKtgtveld 
ycKnwns . ir 
ycKnwns . ir 
ycKnwns . ir 



mf FkqsqdPa 
mfFkqsqdPa 
mf FkqsqdPa 
mfFkqsqdPa 
mfFkqsqdPa 
yvFqtisrPs 
yvFqtisrPs 
yvFqtisrPs 



siikKiyliq 
siikKiyliq 
siikKiyliq 
siikKiyliq 
siikKiyliq 
f ny . Knipyp 
fny.Knipyp 
f ny . Knipyp 



450 

ngvpnelkKf 
ngvpnelkKf 
ngvpnelkKf 
ngvpnelkKf 
ngvpnelkKf 
kwcsk.ieKi 
kwcsk.ieKi 
kwcsk.ieKi 



451 

dssFgltesq 
dssFgltesq 
dssFgltesq 
dssFgltesq 
dssFgltesq 
.l.Fwfn.ks 
.l.Fwfn.ke 
.l.Fwfn.ks 



idgyyiykda 
idgyyiykda 
idgyyiykda 

idgyyiykda 

idgyyiykda 
drwilyl . rc 
drwilyl . rc 
drwilyl. rc 



inlkfkltsg 
inlkfkltsg 
inlkfkltsg 
inlkfkltsg 
inlkfkltsg 
n.p.i.inqw 
n.p.i .inqw 
n.p.i.inqw 



aslkwykgq 
aslkwykgq 
aslkwykgq 
aslkwykgq 
aslkwykgq 
cks . scl . ra 
cks . scl . ra 
cks. scl. ra 



500 

edpyshqked 
edpyshqked 
edpyshqked 
edpyshqked 
edpyshqked 
rrsl.sserr 
rrsi . sserr 
rrsi.sserr 



501 

mtkkgeqlsh 
mtkxgeqlsh 
mtkkgeqlsh 
mtkkgeqlsh 
mtkkgeqlsh 
yd . kr . taqs 
yd.kr. taqs 
yd. kr. taqs 



stqanentaK 
stqanentaK 
stqanentaK 
stqanentaK 
stqanentaK 
fnssq.kysK 
fnssq.kysK 
fnssq.kysK 



vtfanidwsh 
vtfanidwsh 
vtfanidwsh 
vtfanidwsh 
vtfanidwsh 
snlc.y.lvt 
snlc.y.lvt 
snlc.y. lvt 



yskvtvngKe 
yskvtvngKe 
yskvtvngKe 
yskvtvngKe 
yskvtvngKe 
1 . . gycewKr 
1. .gycewKr 
1 . .gycewKr 



550 

vgkgselplt 
vgkgselplt 
wkgselplt 
wkgselplt 
vgkgselplt 
sw.r. .vtfn 
.vtfn 
.vtfn 



sw.r. 
sw.r. 



551 600 
kgwttfvlhk tenslnvksl imetGsvskk vqqlplsprl Bknkhmrdml 
kgwttfvlhk tenslnvksl imetGsvskk vqqlplsprl sknkhrardml 
kgwttfvlhk tenslnvksl imetGsvskk vqqlplsprl sknkhmrdml 
kgwttfvlhk tenslnvksl imetGsvskk vqqlplsprl sknkhmrdml 
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Table 51: Comparative Sequences relating to SAG0677 



maa235427.2 
msa23 542*7 .2 
msa235427.2 
msa235427.2 



195_A909> 
195^COHl) 
195_M732> 
195_M78l} 
Consensus 



kgwttfvlhk tenslnvksl iraetGsvskk vqqlplsprl sknkhmrdml 
.rmdnicit. nrkfikc.kf dygdG.ck.e ssttsfks.i i.k.ayegy. 
.rmdnicit. nrkfikc.kf dygdG.ck.e ssttsfks.i i.k.ayegy. 
.rmdnicit. nrkfikc.kf dygdG.ck.e ssttsfks.i i.k.ayegy. 



msa235427 
msa235427.2{l95 
msa235427.2{ 
msa23S427 . 
msa235427 . 
msa235427. 
msa235427 . 
msa235427 . 



2{195_H36B 
JM9130013 
195 18RS21 



195J2603 
195JV909 
195_COHl 
195_M732 
195_M781 
Consensus 



601 

iTmqkdsayy 
lTmqkdsayy 
ITmqkdsayy 
lTmqkdsayy 
lTmqkdsayy 
aTyyakrf sv 
aTyyakrfsv 
aTyyakrf sv 



etsdslvlri 
etsdslvlrl 
etsdslvlri 
etsdslvlri 
etsdslvlri 
lrnk.qssps 
lrnk.qssps 
lrnk.qssps 



Nltadtklnf 
Nltadtklnf 
Nltadtklnf 
Nltadtklnf 
Nltadtklnf 
N.shcry.t. 
N.shcry.t . 
N.shcry.t. 



navkgaSalt 
navkgaSalt 
navkgaSalt 
navkgaSalt 
navkgaSalt 
f . cc . rSecs 
f .cc.rSecs 
f .cc.rSecs 



650 

enmmmrqf av 
enmmmrqf av 
erimnunrqf av 
enmmmrqf av 
enmmmrqf av 
y.kyddetvc 
y . kyddetvc 
y . kyddetvc 



msa235427 . 2 { 19S_H36B 
msa235427 .2{l95_JM9130013 
msa235427 .2{195_18RS21 



msa235427.2 
msa235427.2 
msa235427.2 
msa23S427.2 
msa235427.2 



195_2603 
195JV909 
195_COHl 
195 M732 
195~M781 
Consensus 



651 

agpqddpvse 
agpqddpvse 
agpqddpvse 
agpqddpvse 
agpqddpvse 
scwttr.sc . 
scwttr.sc. 
scwttr.sc. 



hkypsvfllt 
hkypsvfllt 
hkypsvfllt 
hkypsvfllt 
hkypsvfllt 
.t.ipisisl 
.t.ipisisl 
.t.ipisisl 



palLetasea 
palLetasea 
palLetasea 
palLetasea 
palLetasea 
nscLignc . . 
nscLignc . . 
nscLignc . . 



tlngkeitaS 
tlngkeitaS 
tlngkeitaS 
tlngkeitaS 
tlngkeitaS 
gnskw.gnhS 
gnskw.gnhS 
gnskw.gnhS 



700 

giighikdGd 
giighikdGd 
giighikdGd 
giighikdGd 
giighikdGd 
iwyyrshqGw 
iwyyrshqGw 
iwyyrshqGw 



msa235427.2{l95_H36B 
msa235427.2{l95 JM9130013 
maa235427 . 2 { 195_18RS21 



msa23 5427.2 
msa235427.2 
msa235427.2 
msa235427.2 
msa235427.2 



195_2603 
195_A909 
195_C0H1 
195_M732 
195_M781 
Consensus 



701 

ksKhvevkmv 
ksKhvevkmv 
ksKhvevkmv 
ksKhvevkmv 
ksKhvevkmv 
. . Kqac . sqn 
. . Kqac . sqn 
. . Kqac ■ sqn 



nEngdmlgtp 
nEngdmlgtp 
nEngdmlgtp 
nEngdmlgtp 
nEngdmlgtp 
gE.kwrham 
gE . kwr harn 
gE.kwrham 



viiqgkdltn 
viiqgkdltn 
viiqgkdltn 
viiqgkdltn 
viiqgkdltn 
pcyysr . rid 
pcyysr.rld 
pcyysr. rid 



rtkplmsgrr 
rtkplmsgrr 
rtkplmsgrr 
rtkplmsgrr 
rtkplmsgrr 
. snktinewt 
. snktinewt 
. snktinewt 



750 

vlyagkqyef 
vlyagkqyef 
vlyagkqyef 
vlyagkqyef 
vlyagkqyef 
.stlcr. ti. 
. etlcr .ti. 
. stlcr. ti. 



msa235427.2{l95_H36B; 
msa235427 . 2 { 195.JM9130013 ' 
msa2 3 54 27 . 2 { 1 95_1 8RS2 1 
tnsa235427 . 2{19S_2603 
msa235427 .2 195_A909 
msa235427 . 2 195_C0H1 
msa235427.2 195J4732 
msa235427.2{l95_M781 
Consensus 



751 

raklplsrfn 
raklplsrfn 
raklplsrfn 
raklplsrfn 
raklplsrfn 
vpg.itt.sf 
vpg.itt.sf 
vpg.itt.sf 



twirvewte 
twirvewte 
twirvewte 
twirvewte 
twirvewte 
.hld.g.sgn 
.hld.g.sgn 
.hld.g.sgn 



agekasivrr 
agekaSivrr 
agekaSivrr 
agekaSivrr 
agekaSivrr 
rsrreSkycs 
rsrreSkycs 
rsrreSkycs 



mf f dqsvpel 
mf fdqsvpel 
mf f dqsvpel 
mf fdqsvpel 
mf fdqsvpel 
shvl.pissr 
shvl .pissr 
shvl .pissr 



800 

ntavakrdlt 
ntavakrdlt 
ntavakrdlt 
ntavakrdlt 
ntavakrdlt 
a.hssc.t .f 
a.hssc.t .f 
a.hssc.t. f 



msa2 3 5427 . 2 { 1 95_H36B 
msa235427 . 2 { 195_JM9130013 
msa235427 . 2 { 195_18RS21 



msa235427.2 
msa235427.2 
msa235427.2 
msa235427.2 
msa235427.2 



195_2603 
195_A909 
195_COHl 
195_M732 
195_M781 
Consensus 



801 

sdtalihiva 
sdtalihiva 
sdtalihiva 
sdtalihiva 
sdtalihiva 
df .ycsyphr 
df .ycsyphr 
df .ycsyphr 



kddsLklkly 
kddsLklkly 
kddsLklkly 
kddsLklkly 
kddsLklkly 
cqr.Lsktki 
cqr .Lsktki 
cqr.Lsktki 



qddsllesvd 
qddsllesvd 
qddsllesvd 
qddsllesvd 
qddsllesvd 
isr.fit.ic 
isr.fit.ic 
isr.fit.ic 



ktglysfrng 
ktglysfrng 
ktglysfrng 
ktglysfrng 
ktglysfrng 
. .nrsl .f .k 
. .nrsl .f .k 
. .nrsl .f .k 



850 

veitkdmtvp 
veitkdmtvp 
veitkdmtvp 
veitkdmtvp 
veitkdmtvp 
wcrnh . ryds 
wcrnh.ryds 
wcrnh . ryds 



msa235427 . 2 { 195_H36B 
msa23S427.2{l95_JM9130013 
msa235427 . 2 { 195_18RS2 1 



msa235427.2 
msa235427.2 
msa235427.2 
msa235427.2 
msa235427.2 



195_2603 
195_A909 
195_C0H1 
195J473 2 
195J4781 
Consensus 



851 

lefgdnitkl 
lefgdniikl 
lefgdniikl 
lefgdniikl 
lefgdniikl 
ttriwr.yy. 
ttriwr.yy. 
ttriwr.yy. 



savdlsnyrr 
savdlsnyrr 
savdlsnyrr 
savdlsnyrr 
savdlsnyrr 
vicc.likls 
vicc.likls 
vicc.likls 



netlhiYrnr 
netlhiYrnr 
netlhiYrnr 
netlhiYrnr 
netlhiYrnr 
s. .dpsYl.k 
s. .dpsYl.k 
8. .dpsYl.k 



fdvkaSqmta 
fdvkaSqmta 
fdvkaSqmta 
fdvkaSqmta 
fdvkaSqmta 
pf . c . Skpnd 
pf . c . Skpnd 
pf .c. Skpnd 



900 

dkgakvtvdm 
dkgakvtvdm 
dkgakvtvdm 
dkgakvtvdm 
dkgakvtvdm 
s . qrs . sncg 
8 . qrs . sncg 
b . qrs . sncg 



msa235427 . 2 { 195JK36B 
msa235427.2{l95 JM9130013 
msa23S427.2{l95_18RS21 



msa235427.2 
msa235427.2 
msa235427.2 
msa235427.2 
msa235427.2 



195 2603 
195~A909 
195_C0H1 
195J4732 
195J4781 
Consensus 



901 

lmkhlwpem 
lmkhlwpem 
lmkhlwpem 
lmkhlwpem 
• lmkhlwpem 
yvdealscsr 
yvdealscsr 
yvdealscsr 



aGaytltide 
aGaytltide 
aGaytltide 
aGaytltide 
aGaytltide 
nGrslyinnr 
nGrslyinnr 
nGrslyinnr 



apntnesgml 
apntnesgml 
apntnesgml 
apntnesgml 
dpntnesgral 
rsakhk.irn 
rsskhk . irn 
rsakhk.irn 



tNakvSIhyv 
tNakvSIhyv 
tNakvSIhyv 
tNakvSIhyv 
tNakvSIhyv 
vNkr .SIdsi 
vNkr.SIdsl 
vNkr.SIdel 
_* #* 



950 

nggvdkvdvp 
nggvdkvdvp 
nggvdkvdvp 
nggvdkvdvp 
nggvdkvdvp 
ckwwc . . a . c 
ckwwc. 
ckwwc. 



8 .C 

a.c 
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msa235427 . 2 { 195_H36B 
msa235427 . 2 { 195_JM9130013 
msa235427.2{l95_18RS21 



msa235427 
maa23S427 . 
msa235427 . 
msa235427. 
msa235427 



195 2603 
195~A909 
195~COHl 
195_M732 

195_M781 
Consensus 



951 1000 
ikwdleair kaeeahkade arkaeearka deahkaeevr kaeeahkvee 
ikwdleair kaeeahkade arkaeearka eeahkaeovr kaeeahkvee 

ikwdlea irkaee arkaeearka eeghktqeap iveegykvnn 

ikwdleair kaeearkaee arkaeearka eeghktqeap iveegykvnn 
ikwdleair kaeeahkade arkaeearka eearkaeear kaeeghktqe 
sd.ss.lrsy s.s.rst.s. rst.s.rst. s.rst.s.rs t.s.rst.sr 
sd.ss.lrsy s.s.rst.s. rst.s.rst. s.rst.s.rs t.s.rst.sr 
sd.ss.lrsy s.s.rst.s. rst.s.rst. s.rst.s.rs t.s.rst.sr 



msa235427 . 2 { 195_H36B 
msa235427 . 2 {l95_JM9130013 
msa235427 . 2 { 195_18RS21 



msa235427.2 
msa235427.2 
msa235427.2 
msa235427.2 
msa235427.2 



195_2603 
195_A909 
195_COHl 
195_M732 
195_M781 
Consensus 



1001 

arkaeeghkt 
ap.s.rgt.n 
vhqtdttvka 
vhqtdttvka 
apiveegykv 
rst .s.rgt. 
rst .s.rgt . 
rstvklkrdi 



qeapiveegy 
prstys.rrl 
sdlpktktvs 
sdlpktktvs 
nnvhqtdttv 
npr stys . rr 
nprstys . rr 
kpkkhl.lkk 



kvnnvhqtdt 
qg. .rssn.y 
avhraartdnk 
avhmartdnk 
kasdlpktkt 
lqs. .rssn. 
Iqs . . rssn . 
atklitfikl 



tvkasdlpkt 
ys.sv.f tkd 
qitshqthve 
qitshqthve 
vsavhmartd 
yys .sv. f tk 
yys .sv. f tk 
ilqlkrliyq 



1050 
ktvsavhmar 
.dsfrssyg. 

kqikntlpst 
nkqitshqth 
d.ds£rssyg 
d. dsfrssyg 
rlrqfpqfiw 



msa235427 .2{195_H36B) 
msa235427.2{l95_OM9130013> 
msa235427.2{l95_18RS21J 



msa235427 . 
msa235427 
msa235427. 
msa235427 . 
msa235427, 



195_2603 
195__A909 
195_OOHl 
195_M732' 
195_M78i; 
Consensus 



1051 

tdnkqitshq th — 
nrq.tdnfts dtc- 



1081 



gdskrgyyit gmaivmlsvl fslakkfksk y 

vekqikn 

.nrq.tdnf t sdTC 

.nrq.tdnft sdTC.k - 

leqtinr.lh irhml — 
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SEQ ZD HO. 5201 
STRAIN 090 

AGC6ATACCTTTAATTTTGATATTGACCAAATTGCAGA 

CAATGCTATCACTAAAACAGATAAAACAACAGAAATTAriTCCAACCA^ 

CAACAAGCCAAACTGGG CAAATTGCCTTTTTTGAAAAACTAACACCAGCA 

CAAAAGTCTCCTATCTCTGAAAAAACACCAGCTTTG 

CGGCGATCAAAATGCGCICCrTGATTTTGGACAA 

TTAATACCACTC^TTAATCATATCITGTC^ 

CCTCAAGTTGATGATTTACTAAAAAATGCrA^ 

TATTG CCAAATATAAAGATGCTACTTCCGGCAGAATT^ 

ACTTGATTCIAAAAATTATTGAAAGAAAGCAAGAC 

TATTTTGACTCACIAAAACATCGAG CAAAAAATGGATATGATGGCaGCGAA 
TGTTGTCAAACAAGAAGATACTTTGGCAAGAAATATCG t CTCTG CTGAAA 
TGCTCATTGAAGATAATACTAAATCTATTGA 

GCTt tTATTGAATCgAGTCAAGCCGAGGCTGCTAATCG t GCAaGCCACTT 
ACAACAAGAAATTCTAGCATTAGATAGCCaAACXn'cCGAGTATCAAAT tA 
AAAGT aACCAATTAGCTCGAATGACTGAAGTTAT CAATACCCTCGAACAG 
CAACATACTGAATATGTCAGCCGTCTCTACGTTGC^ 
ACAGATGCGAAACITGGTCAAAGTATCGTCAGATATGCGTCAGAAACT^ 
GCATGTTACGTCGAAATACXATTCCAACA 

TTAGGCATGATGCAACAATCTGTCAAATCCGGTGTCACTrcCTG^ 

TGTCAACGCTAATAATGCAGGATTGCAGATGCT^ 

AAG03ATTCCGATGTTAGAGAAGACCXXACAAAGCCCCACTC 

AAATCTGTCACTGCATTAGCTGAAAGCTTAGTGGCT 

TATOGCTGCCATAGACAAAGGACGTAAGGAACXnXSCCCaATTGGAATCTG 

CTXjTTATTAAATCGGCTGAAACAATCAAT^^ 

AAAAAAATAGTTOAAGCCTTACTCAACGAAGGTaAATCT 

AGTTGATGAGTCT 

SEQ XD HO. 5202 
STRAIN A 909 

AGOGATACU"I"rrAArri"lt^TATTGACCAAATTGCAGA 
CAATGCTATCACTAAAACAGATAAAACAACAGAAATTATTTCCAAC 
CAACAAGCCAAACTGGG C^AATTGCCrrrTT'I'GAAAAACTAACACCAGCA 
CAAAAGTCTGCTATCTCTGAAAAAACACCA^ 
CGGTGACCAAAATGCGCTCCTTGATTT^ 

TTAATACCACTGTTAAT CAT AT CTTGTCTGAG CAGAAAAAAATTCAAATT 
CCTCAAGTTG ATGATTT ACT AAAAAATGCTAAT CG CGAACTAAATGGATT 
TATTG CCAAATATAAAGATG CTACTCCGGCAG A^TTAGAGAAAAAACCAA 
ACTTGATTCAAAAATTATTCAAACAAAG CAAGACCTCGCTACAGGAA'TTT 
TATTTTGACTCACAAAACATCGA^ 

TGTTGTCAAACAAGAAGATACTTTGGCAAG CTGAAA 

TGCT(2ATTGAAGATAATACTAAATCTATTGAAAATTTGGT^ 

GCTTTTATTGAATOJAGTCAAGCXXSA^ 

ACAACAAGAAATTCT AG CATTAGATAG CCAAACG T CCGAGT ATCAAATTA 

AAAGTAACX^AATTAGCTCGAATGACnXjAAGTTA^ 

CAACATACTXjAATATGTCAGCCGTCTCTACXJITGC^ 

ACAGATGCGAAACTTGGTCAAAGTATCCTCAGATATGCZGTCAAAAACrrTG 
C<ATGTTACGTCGAAATACCATTCCAACaATGA^ 

TTAGGCATGATGCAACAATCTGTCAAATCCGGTGTCACTG CTGATGCTAT 

TGTCAACGCTAAT AATG CAG CATTG CAGATG CTGG CTGAAACTAG TAAAG 

AAGCGATTCC^GATGTTAGAGAAGACCGCACA 

AAATCTGTCACTCCATTAGCTGAAAGCTTAGTG 

TATCGCTGCCATAGACAAAGGACX3T 

CTGTTATTAAATCXMCrGAAACAATCAAT^ 

AGtTGATGAGTCT 

SEQ ID HO. 5203 
STRAIN H36B 

AGCXSaTACCTTTAATTTTGATATTGACCAAATTC 

AATGCTATCACTAAAACAC^TAAAAGAACAGAAATTATT^ 

AACAAGCCAAACTGGGCAAATTGCCTTTTT^ 

AAAAjGTCTGCTATCTCTGAAAAAACA^ 

GGTGACXAAAATGCGCTCtTITGATTTTG 

TAATACXZAXnXJITAATCATATCTT^ 

CTCAAGTTX1ATGATTTACTAAAAAATGCTAATO 

ATTGCCAAATATAAAGATGCTACTCCGGCAG^^ 

CTTGATTCAAAAATTATTCAAACAAAGCAAGAC^ 

ATlT'iXjACTCACAAAACATCXSAGCAAAAAATGGATATGA 

GTTGTCAAAGAAGAAGATACTTTGGCAAGAAATA 

GCItlATTGAAGATAATACTAAATCTATTGAAAATT^ 

CTt tTATTGAATCGAGTCAAGCCXaAgGCTGCCA^ 

OVACAAGAAATTCTAGCATTAGATAGCCAAACCT 

AAGTAACXAATTAGCKXIAATGACTGAAGTTATCA 

AACATACTGAATATGTCAGCCXjTCTCT^ 

CAGATGCGAAACTTGGTCAAAGTATCGTCAGATA 

CATGTTACt^CGAAATACXATTCCA 

TAGGC^TGATCCAACAATCTGTCAAATCCGGT^ 

GTCAACGCTAATAATGCAGC^TTGCAGATGCTGGCTG 

AG CGATTCCGATGTTAGAQAAX3ACCGCACAA 

AATCTGTCACTG C^TTATCTGAAAGCTTAGTGGCTCAAAAT AATGGTATT 
AT^GCHX3CCATAGACAAAGK3ACOT 
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TGTTATTAAATCGGCTGAAACAATCAATGATTCTGTCAAA^ 
AAAAAATAGTTGAAG CCTTACTCAaCGAAGGT aAATCTACCCAAGAAAAA 
GTTGATGAGTCT 

SEQ ZD NO. 5204 
STRAIN 18RS21 

TTTTGATATTGACCAAATTG CAGACAATG CTATCACT AAAACAGAT AAAA 

CAACAGAAATTATTTCCAACCAGAC^ 

TTTTTTGAAAAACTAACACCAGCACAAAAGTCTGCTA 

ACXSVGCTTTGOTAGATACrTTTGTCGGCGATCAAAATC 

TTGGACAATC CGCAGTAGAAGG CGTTAATACCACTGTTAATCAT ATCTTG 

TCTQAGCAGAAAAAAATT^AAATTCCTCAAGTTGATGATTTACTAAAAAA 

TGCTAATCXS02AACTAAATGGATTTATTGCCAAATATAAAGATC 

CGGCAGAATTAGAGAAAAAACCAAACTTGATTCAAAAAT^ 

AGCAAGACCTCGCTACAGGAATTTTATTTTGACrCA 

AAAAATGGATATGATGGCAGCGAATGTTGTCAAACAAGAAGATACTT^ 

CAAQAAATATCGTCTCTGCTGAAATGCTCATTGAAGATAA 

ATTGAAAATTTG<3TTGGAGTTATTG CTTTTATTGAATCGAGTCAAGCCGA 

GGCTGCTAATCGTGCAAGCCACITACAACAAGAAATTCTAGCATTAG 

GCCAAACGTCCGAGTATOWVTTAAAAGTAACCAATTAGCrCGAATGACT 

GAAGTTATCAAT ACCCTCGAACAGCAACATCCTGAATATGTCAG CCXyrCT 

CTACGTTGCATGGGCAACAACACCACAGATGCGAAACTO 

CGTCAGATATGCGTCMAAACTTGGCATGTTACOT^ 

ACAATGAAACTCTCAATCGCTCAGTTAGGCATGATGCAAC^ 

ATCCGGTGTCACTGCTGATGCTATTGTCAACGCTAATAATGCAG CATTGC 

AGATGCTGGCTGAAACTAGTAAAGAAGCGATTCCGATGTTAGAGAAGACC 

GCACAAAGCCCCACTGTTTCTATTAAATCTGTCACTC 

CTTAGTGGCTCAAAATAATGGTATTATCGCTGCCATAGACAAAGGACGTA 

AGGAACGTGCCCaATTGGAATCTGCTGTTATTAAATCGGCTGA 

AATGATTCTCTCAAAATTO5TGATAAAAAAATAGTTGAAG 

CGAAGGTaAATCTACCCAAGAAAAAGTTGATGAGTCT 

SEQ ZD NO. 5205 
STRAIN M732 

AGCX3ATACCTTTAATTTTGATATTGACCAAATTGCAGAC 

AATG CTATCACTAAAACAGATAAAACAACAGAAATTATTTCCAACCAGAC 

AACAAGCCAAACTGGGCAAATraCCTTTTTTGAAAAACTAA 

AAAAGTCTG CTATCT CTGAAAAAACACCAG^lU^lGGTAGATACrri'J.'GT C 

GGTGACCAAAATCCX3CTCCTTGATTTTGGACA 

TAATACTACTGTTAATCATATCTI<?rCTGAGCAGA 

CrCAAGTTGATGATTTACTAAAAAATGCTAATCG CGAACTAAATGGATTT 

ATTGCCAAATATAAAGATGCTACTCCGGCAGAATTAGAGAAAA 

CTTGATTCAAAAATTATTCAAACAAAGCAAGACCTC3GCT 

ATTTTGACTCACAAAACAT CGAGC AAAAAATGGATATGATGG CAG CAAAT 

GTTGTCAAACAAGAAGATACTTTGGCAAGAAATATCGTCTCTGCTGAAAT 

GCTCATTGAAGATAATACTAAATCTATTGAAAATTTGGT^ 

CTTTTATTGAATCGAGTCAAGCCGAGGCTGCCAATCGTC 

CAACAAGAAATTCTAGCATTA13ATAGCCAAACGTCCGAATATCAAATTAA 

AAGTAACCAATTAGCC<X3AATGACTGAAGTTATCAATACCCTCGAACAGC 

AACATACGGAATATGTCAGCCGTCTCTACGTTC 

CAGATGCGAAACTTGGTCAAAGTATCGTCAGATATGCGTCAGAAACl'IX^ 
TATGTTACGTCGAAATACC^TTCCAACAATGAAAC^ 
TAGQCATGATGCAACAATCTGTCAAATCCGGTGTCACT^ 
GTCAACGCTAATAATG CAGCATTGCAAATGCTGG CTGAAACTAGTAAAGA 
AGCGATTCCGATGTTAGAGAAGACCGCACAAAGCCCCACTGTTTCT 
AATCTGTCACK3CATTAGCTGAAAG CTTAGTGGCTCAAAATAATGGTATT 
ATCGCTGCCATAGACAAAGGACGTAAGGAACGTGCCCAAT^ 
TGTTATTAAATCGGCTGAAACAATCAATGATT^ 

AAAAAATAGTTGAAGCCTTACTCAACGAAGGTAAATCTACCCAAGAAAAA 
G 

SEQ ZD NO. 5206 
STRAIN COH1 

CTAAAACAGATAAAACAACAGAAATTATTTCCAACCAGACAACAAGCCAA 

ACTGGGCAAATTGCCTTTTTTGLAAAAACTAAC^ 

TwTCTCTGAAAAAACACXAGCrTTGGTAGA^ 

ATG CGCTCCTTGATTTTGGACAATCCGCAGTAGAAGGCGTTAAT ACTACT 

GTTAATCATATCTTGTCIX^GCAGAAAAAAATTCAAA 

TOATTTACTAAAAAATGCTAATCGCX3AACTAAATGGATTTATTO 

ATAAAGATGCTACTCCGGCaGAATTAGAGAAAAAACCAAACTTGATT^ 

AAATTATTCAAACAAAGCAAGACCTCGCTACAGGAATTTTAT^ 

ACAAAACATCGAGCAAAAAATGGATATGATGGCAGOW^TGTTGTCAAAC 

AAGAAQATACTTTGGCAAQAAAT ATCGT CTCTG 

GATAATACTAAATCTATTGAAAATTTGGTTGGAGTTATTG 

ATCGAGTCAAGCCGAgGCTGCCAATCGlXiCaAGCCACT^ 

TTCTAGCaTTAGATAG<X^VAACGTCCX3AATATCAAATTAAAAGTAACCAA 

TTAGCCCGAATGACTGAaGTTATCAaTaCCCTCGAACAG 

aTATGTCAG CCGTCTCTACGTTGCATGGGCAAC^CACCACAGATGCQAA 

ACTTGGTCAAAGTATCGTCAGATATGCGTCAGAAACTTGGTATGTTA 

cgaaataccattccaacaatgaaa^ 
gcaacaatctgtcaaatcoggtgtcactgctgatgctat^ 
ataatgcag cattg caaatg ctgg crtgaaactagtaaagaag cg attccg 

ATGTTAGAGAAGACCGCACAAAGCCCCA^ 
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TGCATTAGCTGAAAGCTTAGTGGCTCAAA 

TAGACAAAGGACGTAAGGAACGTGCCCAATTAGAATCTGCTGTTATTA^ 
TCGG CTGAAACAATCAATGATTCTGTCAAAATTCGTGATAAAAAAATAGT 
TGAAQCCTTACTCAaOGAAGGTAAATCTACCCAAGAAAAAGTTGATGAGT 
CT 

SEQ ZD NO. 5207 
STRAIN N781 

TTTTGATATTGACCAAATTGCAGACAATGCT^ 

CSU^CAGAAATTATTTCCAACCAGACAACAAGCCAAAC^ 

TTTTTTGAAAAACTAACACCAGCACAAAAGTCTGCT^ 

ACCAGCT1TGGTAGATACTTTTGTCGGTGACCAAAATGCGCT 

TTGGACAATCCGCAGTAGAAGGCGTTAATACTACTG^^ 

TCTGAGCAGAAAAAAATTCAAATTCCTCAAGTTGATC^ 

TGCTA^TCG03AACTAAATGGATTTATTGCCAAATATAAAGATGCTACT 

CGGCAGAATTAGAGAAAAAACCAAACTTGATT 

AGCAAGACCTCGCTACAGGAATTTTATTT^ 

AAAAATGGATATGATGG CAGCAAATGTTGTC7W\CAAGAAGATACTTTGG 

C1AAQAAATATCGTCTCTGCTGAAATGCTCATTGAAGATAATACTAAATCT 

AITGAAAATTTGGTTGGAGTTATTGCTTTTATTC 

GGCTGCCS\ATCGTGCAAGCCACTTACAACAAGAAATTCTAG 

GCCAAACGTCCGAATATCAAATTAAAAGTAACCAATTAGCCCGAATGACT 

GAAGTTATCAATACCCTCGAACMCAACATACGGAATATGTCAGCCGTCT 

CTACGTTGCATGGG CAAQ^CACCACAGATGCGAAACTTGGTCAAAGTAT 

CGTCAGATATGCGT CAGAAACTTGGTATGTTACGT CG AAATACCATTCCA 

ACAATGAAACTCTCAATCGCTCAGTTAGGCATGATC 

ATCCGGTGTCACTG CTGATGCTATTGTCAACGCrAATAATGCAGCATTGC 

AAATG CTGG CTG AAACT AGT AAAGAAG CGATTCCG ATGTT AGAGAAGAC C 

GCACAAAGCCXXLACTGTTTCTATTAAATCIOT 

CTTAGTGGCTCAAAATAATGGTATTATCGCTGCCATAGA 

AGGAACXn^CCCAATTAGAATCl^CTGrrATTAAATCGGCrGAAACAATC 

AATGArTCTGTCAAAATTCGTGATAAAAAAATAGTTGAAGCCTTACT 

CGAAGGTAAATCTACCCAAGAAAAAGTTGATGAGTCT 

SEQ ZD NO. 5208 
STRAIN CJB110 

TTTTGATATTGACCAAATTGCAGACAATGCT 

CAACAGAAATTATTTCCAACCAGACAACAAGCCAAA^^ 

TTTTTTGAAAAACTAACACCAGCACAAAAGTCTG 

TTGGACAATCCG CAGTAGAAGG CGTT AAT ACCACTGTTAATCAT ATCTTG 

TCTGAGCAGAAAAAAAXTCAAATTCCTCAAGTTGATGATTT^ 

TGCTAATCGCGAACTAAATGGATTTATTGCCAAATATAAAGATGCTACTC 

CGGCAGAATTAGAGAAAAAACCAAACTTGATTCAAAAATTAT^ 

AGCAAGACCTCX3CTACAGGAATTTTATTTTGA 

AAAAATGGATATGATGGCAGCGAATGTTGTCAAACAAGAAGATAC^ 

CAAGAAATATOGTCTCroCIGAAATGCrCA 

ATTGAAAATTTGGTTGGAGTTATTGCTTTT^ 

GGCTGCTAATCGTCCAAGCCACTTACAACAAGAAATTCTAGC^TrAGATA 

GCCAAACGTCCGAGTATCAAATTAAAAGTAACCAATTAGCTCGAA 

GAAGTTATCAATACCCTCXSAACAGCAaCATACrGAATATC 

CTACGTTGCATGGGCaAC^CACCACAGATGCGAAACTTGGTCAAAGTAT 

CGTCAGATATGCCTCAGAAACTTGGCATGTTACGTC 

ACAATGAAACTCTCAATCGCrrCAGTTAGGCATGA^ 

ATCCGGTGTCACTGCTGATGCTATTGTCAAOGCrAAT^ 

AGAT<XTOGCTgAAA CTAG TAAAGAA^ 

GCACAAAGCCC^ACTCn'TTCTATTAAATCTGTCA 

CTTAGTGGCTCAAAATAATG^TATTATCG 

AGGAaCGTGCCCAATTGGAATCIGCTGTTATTAAAT^ 

AATGATTCTGTCAAAATTCGTGATaAAAAAATAGTTGAAGCCT^ 

CX3AAGGTAAATCTACCCAAGAAAAAGTTGATGAGTCT 

SEQ ID NO. 5209 
STRAIN 116 9NT 

GCAGACAATGCTATCACTAAAACAGATAAAACAACAG 

CCAGACMCAAGCCAAACTGGGCAAATTGCCrin-rriXiAAAAACTAAC^C 

CAGCACAAAAGTCTG CTATCTCTGAAAAAACACCAGCTTTGGTAGATACT 

TTTGTCGGTGACCAAAATGaSCTCCTTG^ 

AGGCGTTAATACCACTGTTAATCATATCTTGTCT^ 

AAATTCCTCAAGTTGATGATTTACIAAAAAATGCTAA 

GGATTTATTGCCAAATATAAAGATG CTACTCXXX3CAGAATTAGAGAAAAA 

ACCAAA CTTGAT CCAAAAATTATTCAAACAAAG 

AATTTTATTTTGACTCACAAAACATCGAGCAAAAAAT^ 

GCAAATGTTGTCAAACAAGAAGATACITTGGCAAGAAA^ 

TGAAATGCTCATTGAAGATAATACTAAATCTATTGA 

TTATTGCTTTTATTGAATCGAGTCAAG CC^ 

CACTTACAACAAGAAATTCTAGCATTAGATAGCCAA^ 

AATTAAAAGTAACCAATTAG CTCGAATGACTGAAGTTATCAATACCCTCG 

AaCAGCAACATACTGAATATGTCAGCCGTCTCTACGTTC 

aCACCACAGATGOQAAACTTCGTCAAACTATCGTCAQATATO 

ACTTGG CATGTTACXJTCGAAATACCA^CCAACAATG AAACT CTCAAT^ 

CTCAOTTAGGCATGATGCAACAATCTGTCAAATC^ 

GCrATTGTCAACGCTAATAATGCAG CATTGCAGATGCTGGCTGAAACTAG 
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TAAAGAAGCX^TTCCGATGTTAGAGAAGACCGCACAAAGCCCCACTGTTT 
CTATT AAAT CTGTCACTGCATT AG CTX1AAAGCTTAGTGGCTCAAAATAAT 
GGTATTATCX5CTGCC^TAGACAAAG<^CX3TAAGGAA03TGCCCA^ 
ATCTGCTCTTATTAAATCGGCTGAAACAATCAATC 

GTGATAAAAAAATAGITGAAGCCTrACTCAACGAAGGTaAATCTACCCAA 
GAAAAAGTTGATGAGTCT 

SEQ ZD HO. 5210 
STRAIN JM9130013 

AGOGATACCTTTAATTTTGATATTGACXIAAATTGCAGAC 
AATGCTATCACTAAAACAGATAAAACAACAGAAATTATTTCCAACC^ 
AACAAGCCAAACKXKSCAAATTGCCl'i'1'l'iU'GAAAAACT 
AAAAGTCTGCTATCTCTGA7VAAAACACCAGCTTO 

GGTGACCAAAATGCGCTCCTTGATTTTGGACAATCOG CAGTAGAAGGCGT 

TAATACX^CTGTTAATCATATCTTGTC^^ 

CTCAAGTTGATGATTTACTAAAAAATGCTAATCGCGAACT 

ATTGCCTU^TATAAAGATGCTACTCCGGCAGAATTAGAGAAAAAACCAAA 

CTTGATTCAAAAATTATTCAAAGAAAGCAAGACCT 

ATTTTGACTCACAAAACATCGAGCAAAAAATGGATATGATG^ 

GTTGTCAAACAAGAAGATACTTTGGCAAGAAATATCGT^ 

GCTCATTGAAGATAATACTAAATCTATTGAAAATTTGGTC 

CTTTTATTGAATcGAGT(ZAAGCCGAGG CTG CCAATCGTG CAAGCCACTTA 

CAACAAGAAATTCTAGCATTAGATAGCCAAACGTCC^ tAA 

AAGTaACCAATTAGCTCGAATGACIXSAAGTTATCAATACCCT 

AACATACTGAATATGTCAG CCGTCTCTACGTTGCATGGG CAACAACACCA 

CAGATGCGAAACTTGGTCAAAGTATCGTCAGATAT^ 

CATGTTAOGTCXaAAATACCATTCCAACAATGAAACTCTCA^ 

TAGGOVTGATGCAACAATCTGTCaAATCCGGTGT^ 

GTCAACGCTAATAATGCAGCATTGCAGATGCT 

AGCGATTCCGATGTTAGAGAAGACCGCACAAAGCCCCACTGTTTCrATTA 

AATCTGTCACTGC^TTAGCI^AAAGCTTAGTGGCT 

ATCX3CTGCCATAGACAAAGGaCGTAAGGAACX3TC 

TGTTATTAAATCXX3CIX3AAACAATCAATG^ 

AAAAAATAGTTGAAGCCTTACfCAACGAAGCT 

GTTGATGAGTCT 

SEQ ID NO. 5211 
STRAIN 2603 

agcgatacctttaattttgatattgaccaaattgcagacaatgctatcac 
taaaacagataaaacaacagaaattatttccaaccagacaacaagccaaa 
ctgggcaaattgccttttttgaaaaactaacaccagcacaaaagtctgct 
atctctgaaaaaacaccagctttggtagatacttttgtcggcgatcaaaa 
tgcgctccttgattttggacaatccgcagtagaa^gcgttaataccactg 
ttaatcatatcttgtctgagcagaaaaaaattcaaattcctcaagttgat 
gatttactaaaaaatgctaatcgcgaactaaatggatttattgccaaata 
taaagatgctactccggcagaattagagaaaaaaccaaacttgattcaaa 
■ aattattcaaacaaagcaagacctcgctacaggaattttattttgactca 
caaaacatcgagcaaaaaatggatatgatggcagcgaatgttgtcaaaca 
agaagatactttggcaagaaatatcgtctctgctgaaatgctcattgaag 
ataatactaaatctattgaaaatttggttggagttattgcttttattgaa 
tcgagtcaagccgaggctgctaatcgtgcaagccacttacaacaagaaat 
tctagcattagatagccaaacgtccgagtatcaaattaaaagtaaccaat 
tagctcgaatgactgaagttatcaataccctcgaacagcaacatcctgaa 
tatgtcagccgtctctacgttgcatgggcaacaacaccacagatgcgaaa 
cttggtcaaagtatcgtcagatatgcgtcagaaacttggcatgttacgtc 
gaaataccattccaacaatgaaactctcaatcgctcagttaggcatgatg 
caacaatctgtcaaatccggtgtcactgctgatgctattgtcaacgctaa 
taatgcagcattgcagatgctggctgaaactagtaaagaagcgattccga 
tgttagagaagaccgcacaaagccccactgtttctattaaatctgtcact 
gcattagctgaaagcttagtggctcaaaataatggtattatcgctgccat 
agacaaaggacgtaaggaacgtgcccaattggaatctgctgttattaaat 
cggctgaaacaatcaatgattctgtcaaaattcgtgataaaaaaatagtt 
gaagccttactcaacgaaggtaaatctacccaagaaaaagttgatgagtc 
t 



PRETTY of: /biotrap/msal3607 . 2 {* } April 22, 2002 03:55 



rasal3607 . 2 f 201JX>H1 
rasal3607.2{201_M781 
msal3607 . 2 {201_090 
msal3607 . 2 (201_CJB110 
msal3607.2{201_18RS21 
msal3607. 2(201 2603 
msal3607 .2 (201~A909 
msal3607 . 2 {201_H36B 
msal3607.2{201_JM9130013 
msal3607 . 2 {201J.169NT 
insal3607 . 2 {201_M732 



1 50 

C 

TTTTGA TATTGACCAA ATTGCAGACA ATGCTATCAC 

AGCGATACCT TTAATTTTGA TATTGACCAA ATTGCAGACA ATGCTATCAC 

TTTTGA TATTGACCAA ATTGCAGACA ATGCTATCAC 

TTTTGA TATTGACCAA ATTGCAGACA ATGCTATCAC 

AGCGATACCT TTAATTTTGA TATTGACCAA ATTGCAGACA ATGCTATCAC 
AGCGATACCT TTAATTTTGA TATTGACCAA ATTGCAGACA ATGCTATCAC 
AGCGATACCT TTAATTTTGA TATTGACCAA ATTGCAGACA ATGCTATCAC 
AGCGATACCT TTAATTTTGA TATTGACCAA ATTGCAGACA ATGCTATCAC 

GCAGACA ATGCTATCAC 

AGCGATACCT TTAATTTTGA TATTGACCAA ATTGCAGACA ATGCTATCAC 
Consensus ********** ********** ********** ********** ********** 
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msal 3 6 0 7 . 2 1 2 0 1JZOH1 \ 
rasal3607.2{201_M78l' 
msal3607.2{201 090 
msaX3607 . 2 f 201_CJBllo' 
msal3607.2{201_18RS21 
msal3607.2{201J2603 
msal3607.2l201_A909 
msal3 60 7 . 2 { 2 0 l'_H3 6B 
msal 3 607 . 2 {201_JM9130013 
msal3607.2{201_1169NT 
msal3607.2{201_M732 
Consensus 



51 

TAAAACAGAT 
TAAAACAGAT 
TAAAACAGAT 
TAAAACAGAT 
TAAAACAGAT 
TAAAACAGAT 
TAAAACAGAT 
TAAAACAGAT 
TAAAACAGAT 
TAAAACAGAT 
TAAAACAGAT 
********** 



AAAACAACAG 
AAAACAACAG 
AAAACAACAG 
AAAACAACAG 
AAAACAACAG 
AAAACAACAG 
AAAACAACAG 
AAAACAACAG 
AAAACAACAG 
AAAACAACAG 
AAAACAACAG 
********** 



AAATTATTTC 
AAATTATTTC 
AAATTATTTC 
AAATTATTTC 
AAATTATTTC 
AAATTATTTC 
AAATTATTTC 
AAATTATTTC 
AAATTATTTC 
AAATTATTTC 
AAATTATTTC 
********** 



CAACCAGACA 
CAACCAGACA 
CAACCAGACA 
CAACCAGACA 
CAACCAGACA 
CAACCAGACA 
CAACCAGACA 
CAACCAGACA 
CAACCAGACA 
CAACCAGACA 
CAACCAGACA 
********** 



100 

ACAaGCCAAA 
ACAaGCCAAA 
ACAaGCCAAA 
ACAaGCCAAA 
ACAaGCCAAA 
ACAaGCCAAA 
ACAaGCCAAA 
ACAaGCCAAA 
ACAaGCCAAA 
ACAaGCCAAA 
ACAaGCCAAA 
********** 



msal3607.2(201_COHi; 
msal3607.2{201_M781 ( 
rasa'13607 . 2 {201_090 
msal3607 .2 { 201_CJB110' 
msal3607.2{201_18RS21 
msal3607. 2(201 2603' 
msal3607 .2(26l~A909' 
rasal3607.2{201_H36B 
msal3607 . 2 {201_JM9130013 
tnsal3607 . 2 {201_1169NT 
msal3 607 . 2 { 2 01_M73 2 
Consensus 



101 

CTGGGCAAAT 
CTGGGCAAAT 
CTGGGCAAAT 
CTGGGCAAAT 
CTGGGCAAAT 
CTGGGCAAAT 
CTGGGCAAAT 
CTGGGCAAAT 
CTGGGCAAAT 
CTGGGCAAAT 
CTGGGCAAAT 
********** 



TGCCTTTTTT 
TGCCTTTTTT 
TGCCTTTTTT 
TGCCTTTTTT 
TGCCTTTTTT 
TGCCTTTTTT 
TGCCTTTTTT 
TGCCTTTTTT 
TGCCTTTTTT 
TGCCTTTTTT 
TGCCTTTTTT 
********** 



GAAAAACTAA 
GAAAAACTAA 
GAAAAACTAA 
GAAAAACTAA 
GAAAAACTAA 
GAAAAACTAA 
GAAAAACTAA 
GAAAAACTAA 
GAAAAACTAA 
GAAAAACTAA 
GAAAAACTAA 
********** 



CACCAGCACA 
CACCAGCACA 
CACCAGCACA 
CACCAGCACA 
CACCAGCACA 
CACCAGCACA 
CACCAGCACA 
CACCAGCACA 
CACCAGCACA 
CACCAGCACA 
CACCAGCACA 
********** 



150 

AAAGTCTGCT 
AAAGTCTGCT 
AAAGTCTGCT 
AAAGTCTGCT 
AAAGTCTGCT 
AAAGTCTGCT 
AAAGTCTGCT 
AAAGTCTGCT 
AAAGTCTGCT 
AAAGTCTGCT 
AAAGTCTGCT 
********** 



msal3607.2{201_COHi; 
msal3607.2{201 M781 
msa!3607.2{201_090 
msal3 6 0 7 - 2 f 2 0 1_C JB11 0 
msa!3607 .2 {201_18RS21 
rasal3607 .2{201_2603 
msal3 6 0 7 . 2 { 2 01_A9 0 9 
msal3 607 . 2 { 2 01_H3 6B 
msal3607.2{201_JM9130013 
msal3607.2{201_1169NT 
msal3607.2{201_M732 
Consensus 



msal3607 . 2 { 201_COH1 
msal3607.2{201_M781 
msal3607.2{201_090 
msal3607.2{201 CJB110 
rasal3607.2{20O8RS21 
msal3607 .2 " 
msal3607 .2 
msal3607.2 
msal3607.2{201_JM9130013 
msal3607 . 2 {201_1169NT 
msal3607.2{201_M732 
Consensus 




151 

wTCTCTGAAA 
aTCTCTGAAA 
aTCTCTGAAA 
aTCTCTGAAA 
aTCTCTGAAA 
aTCTCTGAAA 
aTCTCTGAAA 
aTCTCTGAAA 
aTCTCTGAAA 
aTCTCTGAAA 
aTCTCTGAAA 



AAACACCAGC 
AAACACCAGC 
AAACACCAGC 
AAACACCAGC 
AAACACCAGC 
AAACACCAGC 
AAACACCAGC 
AAACACCAGC 
AAACACCAGC 
AAACACCAGC 
AAACACCAGC 



TTTGGTAGAT 
TTTGGTAGAT 
TTTGGTAGAT 
TTTGGTAGAT 
TTTGGTAGAT 
TTTGGTAGAT 
TTTGGTAGAT 
TTTGGTAGAT 
TTTGGTAGAT 
TTTGGTAGAT 
TTTGGTAGAT 



ACTTTTGTCG 
ACTTTTGTCG 
ACTTTTGTCG 
ACTTTTGTCG 
ACTTTTGTCG 
ACTTTTGTCG 
ACTTTTGTCG 
ACTTTTGTCG 
ACTTTTGTCG 
ACTTTTGTCG 
ACTTTTGTCG 



200 

GtGAcCAAAA 
GtGAcCAAAA 
GcGAtCAAAA 
GcGAtCAAAA 
GcGAtCAAAA 
GcGAtCAAAA 
GtGAcCAAAA 
GtGAcCAAAA 
GtGAcCAAAA 
GtGAcCAAAA 
GtGAcCAAAA 



201 

TGCGCTCCTT 
TGCGCTCCTT 
TGCGCTCCTT 
TGCGCTCCTT 
TGCGCTCCTT 
TGCGCTCCTT 
TGCGCTCCTT 
TGCGCTCCTT 
TGCGCTCCTT 
TGCGCTCCTT 
TGCGCTCCTT 
********** 



GATTTTGGAC 
GATTTTGGAC 
GATTTTGGAC 
GATTTTGGAC 
GA TTTTG GAC 
GATTTTGGAC 
GATTTTGGAC 
GATTTTGGAC 
GATTTTGGAC 
GATTTTGGAC 
GATTTTGGAC 
********** 



AATCCGCAGT 
AATCCGCAGT 
AATCCGCAGT 
AATCCGCAGT 
AATCCGCAGT 
AATCCGCAGT 
AATCCGCAGT 
AATCCGCAGT 
AATCCGCAGT 
AATCCGCAGT 
AATCCGCAGT 
********** 



AGAAGGCGTT 
AGAAGGCGTT 
AGAAGGCGTT 
AGAAGGCGTT 
AGAAGGCGTT 
AGAAGGCGTT 
AGAAGGCGTT 
AGAAGGCGTT 
AGAAGGCGTT 
AGAAGGCGTT 
AGAAGGCGTT 
********** 



250 

AATACtACTG 
AATACtACTG 
AATACCACTG 
AATACCACTG 
AATACCACTG 
AATACCACTG 
AATACCACTG 
AATACCACTG 
AATACCACTG 
AATACCACTG 
AATACtACTG 
*****_**** 



msal3607.2{201 COHl| 
msal3607.2{201_M781 
msal3607.2{201_090' 
msal3607 . 2 (201_CJB110 
msa!3607 .2 (201_18RS21 
msal3607 .2 {201_2603 
msal3 607 . 2 <201_A909 
msal3607.2{201_H36B 
msal3607 . 2 {201_JM9130013 
rasal3607 .2 {201_1169NT 
msal3607.2{201_M732 
Consensus 



251 

TTAATCATAT 
TTAATCATAT 
TTAATCATAT 
TTAATCATAT 
TTAATCATAT 
TTAATCATAT 
TTAATCATAT 
TTAATCATAT 
TTAATCATAT 
TTAATCATAT 
TTAATCATAT 
********** 



CTTGTCTGAG 
CTTGTCTGAG 
CTTGTCTGAG 
CTTGTCTGAG 
CTTGTCTGAG 
CTTGTCTGAG 
CTTGTCTGAG 
CTTGTCTGAG 
CTTGTCTGAG 
CTTGTCTGAG 
CTTGTCTGAG 
********** 



CAGAAAAAAA 
CAGAAAAAAA 
CAGAAAAAAA 
CAGAAAAAAA 
CAGAAAAAAA 
CAGAAAAAAA 
CAGAAAAAAA 
CAGAAAAAAA 
CAGAAAAAAA 
CAGAAAAAAA 
CAGAAAAAAA 
********** 



TTCAAATTCC 
TTCAAATTCC 
TTCAAATTCC 
TTCAAATTCC 
TTCAAATTCC 
TTCAAATTCC 
TTCAAATTCC 
TTCAAATTCC 
TTCAAATTCC 
TTCAAATTCC 
TTCAAATTCC 
********** 



300 

TCAAGTTGAT 
TCAAGTTGAT 
TCAAGTTGAT 
TCAAGTTGAT 
TCAAGTTGAT 
TCAAGTTGAT 
TCAAGTTGAT 
TCAAGTTGAT 
TCAAGTTGAT 
TCAAGTTGAT 
TCAAGTTGAT 
********** 



msal3 6 07 . 2 { 2 01_COH1 } 



301 350 
GATTTACTAA AAAATGCTAA TCGCGAACTA AATGGATTTA TTGCCAAATA 
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msal3607.2{201_M78l] 
msal3607.2{201_090 i 
msal3607.2{201_CJB110, 
tnsal3607 .2 {201_18RS21 
msal3607 . 2 ( 201_2603 
msal3607.2(201_A909 
I rasal3607.2{201_H36B 
msal3607.2{201_JM9130013 
msal3607 .2 {201JL169NT 
rasal3607 .2{201_M732 
Consensus 



msal3607. 2(201 COH1 
msal3607.2{201_M781 
msal3607.2{201_090 
msal3607.2(201_CJB110 
msal3607.2{201_18RS21 
msal3607-2(201Jfr603 
msal3607.2l201_A909 
msal3607.2{201_H36B 
msal3607.2{201_JM9130013 
rasal3607.2{201_1169NT 
msal3607.2{201JM732 
Consensus 



GATTTACTAA 
GATTTACTAA 
GATTTACTAA 
GATTTACTAA 
GATTTACTAA 
GATTTACTAA 
GATTTACTAA 
GATTTACTAA 
GATTTACTAA 
GATTTACTAA 
********** 

351 

TAAAGATGCT 
TAAAGATGCT 
TAAAGATGCT 
TAAAGATGCT 
TAAAGATGCT 
TAAAGATGCT 
TAAAGATGCT 
TAAAGATGCT 
TAAAGATGCT 
TAAAGATGCT 
TAAAGATGCT 



AAAATGCTAA 
AAAATGCTAA 
AAAATGCTAA 
AAAATGCTAA 
AAAATGCTAA 
AAAATGCTAA 
AAAATGCTAA 
AAAATGCTAA 
AAAATGCTAA 
AAAATGCTAA 
********** 



TCGCGAACTA 
TCGCGAACTA 
TCGCGAACTA 
TCGCGAACTA 
TCGCGAACTA 
TCGCGAACTA 
TCGCGAACTA 
TCGCGAACTA 
TCGCGAACTA 
TCGCGAACTA 
********** 



AATGGATTTA 
AATGGATTTA 
AATGGATTTA 
AATGGATTTA 
AATGGATTTA 
AATGGATTTA 
AATGGATTTA 
AATGGATTTA 
AATGGATTTA 
AATGGATTTA 
********** 



ACTCCGGCAG 
ACTCCGGCAG 
ACTCCGGCAG 
ACTCCGGCAG 
ACTCCGGCAG 
ACTCCGGCAG 
ACTCCGGCAG 
ACTCCGGCAG 
ACTCCGGCAG 
ACTCCGGCAG 
ACTCCGGCAG 



AATTAGAGAA 
AATTAGAGAA 
AATTAGAGAA 
AATTAGAGAA 
AATTAGAGAA 
AATTAGAGAA 
AATTAGAGAA 
AATTAGAGAA 
AATTAGAGAA 
AATTAGAGAA 
AATTAGAGAA 



AAAACCAAAC 
AAAACCAAAC 
AAAACCAAAC 
AAAACCAAAC 
AAAACCAAAC 
AAAACCAAAC 
AAAACCAAAC 
AAAACCAAAC 
AAAACCAAAC 
AAAACCAAAC 
AAAACCAAAC 



TTGCCAAATA 
TTGCCAAATA 
TTGCCAAATA 
TTGCCAAATA 
TTGCCAAATA 
TTGCCAAATA 
TTGCCAAATA 
TTGCCAAATA 
TTGCCAAATA 
TTGCCAAATA 
********** 

400 

TTGATtCAAA 
TTGATtCAAA 
TTGATtCAAA 
TTGATtCAAA 
TTGATtCAAA 
TTGATtCAAA 
TTGATtCAAA 
TTGATtCAAA 
TTGATtCAAA 
TTGATcCAAA 
TTGATtCAAA 



msal3 607 . 2 { 2 0 l_COHl ] 
msal3607.2{201 - M781 i 
msal3607.2{201_090 
msal3607 .2* 201_CJB110 
msal3607.2{201_lBRS21 
msal36O7.2(201_2603 
msal3 607 . 2 { 2 01_A9 0 9 
msal3607.2{201_H36B 
msal3607.2{201_JM9130013 
msal3607.2{201_1169NT 
tnsal3 6 07 . 2 { 2 01_M732 
Consensus 



msal3607.2{201_COHi; 
msal3607.2{201_M78i; 
. rasal3607.2{201_090; 
msal3607.2(201_CJB110 
msal3607.2{201_18RS21 
msal3607.2(201_2603 
rasal3607,2 201_A909 
• msa!3607.2{201_H36B 
msal3607 . 2 {201_JM9130013 
rasal3607.2{201_1169NT 
msal3607.2{201_M732 
Consensus 



msal3 607 . 2 { 2 01_COH1 \ 
msal3607.2{20l""M781 
rosal3607.2{2oT_090 
msal3607. 2(201 CJB110 
msal3607 . 2 {201~18RS21 
msal3607.2{201_J2603 
msal3607.2 201_A909 
msal3607.2{201_H36B 
msal3607.2{201_JM9130013 
msal3607.2{201 1169NT 
msal3607 .2 {201_M732 
Consensus 



msal3607 . 2 (201_COH1 
msal3607.2{201_M7Bl 
msal3607 • 2 {201_090 
msal3607.2{201_CJB110 
msa!3607 . 2 {201_18RS21 



401 

AATTATTCAA 
AATTATTCAA 
AATTATTCAA 
AATTATTCAA 
AATTATTCAA 
AATTATTCAA 
AATTATTCAA 
AATTATTCAA 
AATTATTCAA 
AATTATTCAA 
AATTATTCAA 
********** 

451 

CAAAACATCG 
CAAAACATCG 
CAAAACATCG 
CAAAACATCG 
CAAAACATCG 
CAAAACATCG 
CAAAACATCG 
CAAAACATCG 
CAAAACATCG 
CAAAACATCG 
CAAAACATCG 
********** 

501 

AGAAGATACT 
AGAAGATACT 
AGAAGATACT 
AGAAGATACT 
AGAAGATACT 
AGAAGATACT 
AGAAGATACT 
AGAAGATACT 
AGAAGATACT 
AGAAGATACT 
AGAAGATACT 
********** 

551 



ACAAAGCAAG 
ACAAAGCAAG 
ACAAAGCAAG 
ACAAAGCAAG 
ACAAAGCAAG 
ACAAAGCAAG 
ACAAAGCAAG 
ACAAAGCAAG 
ACAAAGCAAG 
ACAAAGCAAG 
ACAAAGCAAG 
********** 



ACCTCgCTAC 
ACCTOgCTAC 
ACCTCgCTAC 
ACCTCgCTAC 
ACCTCgCTAC 
ACCTCgCTAC 
ACCTCgCTAC 
ACCTCgCTAC 
ACCTCgCTAC 
ACCTCaCTAC 
ACCTCgCTAC 
*****.**** 



AGGAATTTTA 
AGGAATTTTA 
AGGA ATTTTA 
AGGAATTTTA 
AGGAATTTTA 
AGGAATTTTA 
AGGAATTTTA 
AGGAATTTTA 
AGGAATTTTA 
AGGAATTTTA 
AGGAATTTTA 
********** 



AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
********** 



GGATATGATG 
GGATATGATG 
GGATATGATG 
GGATATGATG 
GGATATGATG 
GGATATGATG 
GGATATGATG 
GGATATGATG 
GGATATGATG 
GGATATGATG 
GGATATGATG 
********** 



GCAGCaAATG 
GCAGCaAATG 
GCAGCgAATG 
GCAGCgAATG 
GCAGCgAATG 
GCAGCgAATG 
GCAGCgAATG 
GCAGCgAATG 
GCAGCgAATG 
GCAGCaAATG 
GCAGCaAATG 
*****.**** 



450 

TTTTGACTCA 
TTTTGACTCA 
TTTTGACTCA 
TTTTGACTCA 
TTTTGACTCA 
TTTTGACTCA 
TTTTGACTCA 
TTTTGACTCA 
TTTTGACTCA 
TTTTGACTCA 
TTTTGACTCA 
********** 

500 

TTGTCAAACA 
TTGTCAAACA 
TTGTCAAACA 
TTGTCAAACA 
TTGTCAAACA 
TTGTCAAACA 
TTGTCAAACA 
TTGTCAAACA 
TTGTCAAACA 
TTGTCAAACA 
TTGTCAAACA 
********** 



TTGGCAAGAA 
TTGGCAAGAA 
TTGGCAAGAA 
TTGGCAAGAA 
TTGGCAAGAA 
TTGGCAAGAA 
TTGGCAAGAA 
TTGGCAAGAA 
TTGGCAAGAA 
TTGGCAAGAA 
TTGGCAAGAA 
********** 



ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
ATATCGTCTC 
**.******** 



TGCTGAAATG 
TGCTGAAATG 
TGCTGAAATG 
TGCTGAAATG 
TGCTGAAATG 
TGCTGAAATG 
TGCTGAAATG 
TGCTGAAATG 
TGCTGAAATG 
TGCTGAAATG 
TGCTGAAATG 
********** 



ATAATACTAA ATCTATTGAA AATTTGGTTG GAGTTAtTGC 
ATAATACTAA ATCTATTGAA AATTTGGTTG GAGTTAtTGC 
ATAATACTAA ATCTATTGAA AATTTGGTTG GAGTTAtTGC 
ATAATACTAA ATCTATTGAA AATTTGGTTG GAGTTAtTGC 
ATAATACTAA ATCTATTGAA AATTTGGTTG GAGTTAtTGC 



550 

CTCATTGAAG 
CTCATTGAAG 
CTCATTGAAG 
CTCATTGAAG 
CTCATTGAAG 
CTCATTGAAG 
CTCATTGAAG 
CTCATTGAAG 
CTCATTGAAG 
CTCATTGAAG 
CTCATTGAAG 
********** 

600 

TTTTATTGAA 
TTTTATTGAA 
TTTTATTGAA 
TTTTATTGAA 
TTTTATTGAA 



865 



WO 2004/018646 



PCTAJS2003/026827 



Table 52: Comparative Sequences relating to SAG 1823 



msal3607 . 2 {201_2603 } 
msal3607.2{201_A909} 
rasaI3607.2{201_H36Bj 
msal3607 . 2 {201_JM913 0013 > 
msal3607 . 2 {201_1169NT> 
msal3607 . 2 {201_M732} 
Consensus 



msaX3607.2{201_COHi: 
msal3607 . 2 {201_M781* 
msal3607.2{201_090 
msa!3607 .2 { 201_CJB110 
msal3607 . 2 {201_18RS21 
msal3607.2{201_2603 
msal3607 . 2 {201_A909 
msal3607.2{201_H36B 
msal3607.2{201_JM9130013 
msal3607 . 2 {201_1169NT 
msal3607.2{201_M732* 
Consensus 



usal3607.2{201_COHl 
insal3607.2{201_M781 
msal3607.2{201_090 
rasal3607 . 2 f 201_CJB110 
rasal36Q7.2{201_18RS21 
msal3607 . 2 (201_2603 
msal3607 . 2 {201_A909 
msal3607.2{201_H36B 
msal3607.2{201_JM9130013 
msal3 607 . 2 { 201JL169NT 
tnsal3607 . 2 {201_M732 
Consensus 



Tnsal3607.2{201_COHi; 
msal3607.2{201_M78i; 
msal3 6 0 7 . 2 { 2 01_090 
msal3607 . 2 {201_CJB110 
msal3607 . 2 {201_1BRS21 
rasal3607 . 2 (201_2603 
insal3607.2{201_A909 
msal3607.2{201_H36B 
msal3607.2{201_JM9130013 
msal3607 . 2 {201_1169NT 
• msa!3607.2{201_M732~ 
Consensus 



msal3 6 07 . 2 { 2 01_COH1 ] 
msal3607.2{201_M781 
msal3607.2{201_090| 
msal3607.2{201_CJB110 
msal3607 . 2 {201_18RS21 
msal3607.2{201_2603 
msal3607 . 2 ( 201_A909 
msal3607.2{201_H36B 
msa!3607.2{201_JM9130013 
msal3607 . 2 {201_1169NT 
msal3607.2{201_M732 
Consensus 



rasal3607.2{201_COHl 
msal3607.2{201_M781 
msal3607.2{201_090 
msal3607 . 2 {201_CJB110 
msal3607 . 2 {201_18RS21 
msal3607.2f201_2603 
msal3607.2{201_A909 



ATAATA CTAA 
ATAATACTAA 
ATAATACTAA 
ATAATACTAA 
ATAATACTAA 
ATAATACTAA 
********** 

601 

TCGAGTCAAG 
TCGAGTCAAG 
TCGAGTCAAG 
TCGAGTCAAG 
TCGAGTCAAG 
TCGAGTCAAG 
TCGAGTCAAG 
TCGAGTCAAG 
TCGAGTCAAG 
TCGAGTCAAG 
TCGAGTCAAG 
********** 

651 

TCTAGCATTA 
TCTAGCATTA 
TCTAGCATTA 
TCTAGCATTA 
TCTAGCATTA 
TCTAGCATTA 
TCTAGCATTA 
TCTAGCATTA 
TCTAGCATTA 
TCTAGCATTA 
TCTAGCATTA 
********** 

701 

TAGCcCGAAT 
TAGCcCGAAT 
TAGCt CGAAT 
TAGCtCGAAT 
TAGCt CGAAT 
TAGCtCGAAT 
TAGCtCGAAT 
TAGCtCGAAT 
TAGCtCGAAT 
TAGCtCGAAT 
TAGCcCGAAT 
****.***** 

751 

TATGTCAGCC 
TATGTCAGCC 
TATGTCAGCC 
TATGTCAGCC 
TATGTCAGCC 
TATGTCAGCC 
TATGTCAGCC 
TATGTCAGCC 
TATGTCAGCC 
TATGTCAGCC 
TATGTCAGCC 
********** 



ATCTATTGAA 
ATCTATTGAA 
ATCTATTGAA 
ATCTATTGAA 
ATCTATTGAA 
ATCTATTGAA 
********** 



AATTTGGTTG 
AATTTGGTTG 
AATTTGGTTG 
AATTTGGTTG 
AATTTGGTTG 
AATTTGGTTG 
********** 



GAGTTAtTGC 
GAGTTAwTGC 
GAGTTAtTGC 
GAGTTAtTGC 
GAGTTAtTGC 
GAGTTAtTGC 
******.*** 



CCGAGGCTGC 
CCGAGGCTGC 
CCGAGGCTGC 
CCGAGGCTGC 
CCGAGGCTGC 
CCGAGGCTGC 
CCGAGGCTGC 
CCGAGGCTGC 
CCGAGGCTGC 
CCGAGGCTGC 
CCGAGGCTGC 
********** 



cAATCGTGCA 
CAATCGTGCA 
tAATCGTGCA 
tAATCGTGCA 
tAATCGTGCA 
tAATCGTGCA 
cAATCGTGCA 
cAATCGTGCA 
CAATCGTGCA 
cAATCGTGCA 
CAATCGTGCA 
_********* 



AGCCACTTAC 
AGCCACTTAC 
AGCCACTTAC 
AGCCACTTAC 
AGCCACTTAC 
AGCCACTTAC 
AGCCACTTAC 
AGCCACTTAC 
AGCCACTTAC 
AGCCACTTAC 
AGCCACTTAC 
********** 



GATAGCCAAA 
GATAGCCAAA 
GATAGCCAAA 
GATAGCCAAA 
GATAGCCAAA 
GATAGCCAAA 
GATAGCCAAA 
GATAGCCAAA 
GATAGCCAAA 
GATAGCCAAA 
GATAGCCAAA 
********** 



CGTCCGAaTA 
CGTCCGAaTA 
CGTCCGAgTA 
CGTCCGAgTA 
CGTCCGAgTA 
CGTCCGAgTA 
CGTCCGAgTA 
CGTCCGAgTA 
CGTCCGAgTA 
CGTCCGAgTA 
CGTCCGAaTA 
*******.** 



TCAAATTAAA 
TCAAATTAAA 
TCAAATTAAA 
TCAAATTAAA 
TCAAATTAAA 
TCAAATTAAA 
TCAAATTAAA 
TCAAATTAAA 
TCAAATTAAA 
TCAAATTAAA 
TCAAATTAAA 
********** 



TTTTATTGAA 
TTTTATTGAA 
TTTTATTGAA 
TTTTATTGAA 
TTTTATTGAA 
TTTTATTGAA 
********** 

650 

AACAAGAAAT 
AACAAGAAAT 
AACAAGAAAT 
AACAAGAAAT 
AACAAGAAAT 
AACAAGAAAT 
AACAAGAAAT 
AACAAGAAAT 
AACAAGAAAT 
AACAAGAAAT 
AACAAGAAAT 
********** 

700 

AGTAACCAAT 
AGTAACCAAT 
AGTAACCAAT 
AGTAACCAAT 
AGTAACCAAT 
AGTAACCAAT 
AGTAACCAAT 
AGTAACCAAT 
AGTAACCAAT 
AGTAACCAAT 
AGTAACCAAT 
********** 



GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
********** 



ATCAATACCC 
ATCAATACCC 
ATCAATACCC 
ATCAATACCC 
ATCAATACCC 
ATCAATACCC 
ATCAATACCC 
ATCAATACCC 
ATCAATACCC 
ATCAATACCC 
ATCAATACCC 
********** 



TCGAACAGCA 
TCGAACAGCA 
TCGAACAGCA 
TCGAACAGCA 
TCGAACAGCA 
TCGAACAGCA 
TCGAACAGCA 
TCGAACAGCA 
TCGAACAGCA 
TCGAACAGCA 
TCGAACAGCA 
********** 



GTCTCTACGT 
GTCTCTACGT 
GTCTCTACGT 
GTCTCTACGT 
GTCTCTACGT 
GTCTCTACGT 
GTCTCTACGT 
GTCTCTACGT 
GTCTCTACGT 
GTCTCTACGT 
GTCTCTACGT 
********** 



TGCATGGGCA 
TGCATGGGCA 
TGCATGGGCA 
TGCATGGGCA 
TGCATGGGCA 
TGCATGGGCA 
TGCATGGGCA 
TGCATGGGCA 
TGCATGGGCA 
TGCATGGGCA 
TGCATGGGCA 
********** 



ACAACACCAC 
ACAACACCAC 
ACAACACCAC 
ACAACACCAC 
ACAACACCAC 
ACAACACCAC 
ACAACACCAC 
ACAACACCAC 
ACAACACCAC 
ACAACACCAC 
ACAACACCAC 
********** 



801 

CTTGGTCAAA 
CTTGGTCAAA 
CTTGGTCAAA 
CTTGGTCAAA 
CTTGGTCAAA 
CTTGGTCAAA 
CTTGGTCAAA 



GTATCGTCAG 
GTATCGTCAG 
GTATCGTCAG 
GTATCGTCAG 
GTATCGTCAG 
GTATCGTCAG 
GTATCGTCAG 



ATATGCGTCA 
ATATGCGTCA 
ATATGCGTCA 
ATATGCGTCA 
ATATGCGTCA 
ATATGCGTCA 
ATATGCGTCA 



gAAACTTGGt 
gAAACTTGGt 
gAAACTTGGc 
gAAACTTGGc 
gAAACTTGGc 
gAAACTTGGc 
aAAACTTGGc 



750 

ACATaCgGAA 
ACATaCgGAA 
ACATaCtGAA 
ACATaCtGAA 
ACATcCtGAA 
ACATcCtGAA 
ACATaCtGAA 
ACATaCtGAA 
ACATaCtGAA 
ACATaCtGAA 
ACATaCgGAA 
****.*.*** 

800 

AGATGCGAAA 
AGATGCGAAA 
AGATGCGAAA 
AGATGCGAAA 
AGATGCGAAA 
AGATGCGAAA 
AGATGCGAAA 
AGATGCGAAA 
AGATGCGAAA 
AGATGCGAAA 
AGATGCGAAA 
********** 

850 

ATGTTACGTC 
ATGTTACGTC 
ATGTTACGTC 
ATGTTACGTC 
ATGTTACGTC 
ATGTTACGTC 
ATGTTACGTC 



866 



WO 2004/018646 



PCT/US2003/026827 



Table 52: Comparative Sequences relating to SAG 1823 



msal3607.2{201_H36B} 
msal3607 . 2 {201_JM9130013} 
msal3607.2{201 1169NT} 
msal3607.2{201_M732} 
Consensus 



msal3607.2{201 COH1; 
rasal3607.2{20l2M781 
msal3607.2{201_090 
msal3607 . 2 ( 201_CJB110 
msal3607.2{201__18RS21 
'201J2603 
201_A909 
201 H36B 



msal3€07 .2 
msal3607 .2 

rosal3607.2 v _ 

msal36O7.2{201 JM9130013 
msal3607 . 2 {201_1169NT 
msal3607.2{201_M732 
Consensus 



CTTGGTCAAA GTATCGTCAG ATATGCGTCA aAAACTTGGc 
CTTGGTCAAA GTATCGTCAG ATATGCGTCA aAAACTTGGc 
CTTGGTCAAA GTATCGTCAG ATATGCGTCA aAAACTTGGc 
CTTGGTCAAA GTATCGTCAG ATATGCGTCA gAAACTTGGt 
********** ********** ********** .********- 

851 

GAAATACCAT 
GAAATACCAT 
GAAATACCAT 
GAAATACCAT 
GAAATACCAT 
'GAAATACCAT 
GAAATACCAT 
GAAATACCAT 
GAAATACCAT 
GAAATACCAT 
GAAATACCAT 



TCCAACAATG 
TCCAACAATG 
TCCAACAATG 
TCCAACAATG 
TCCAACAATG 
TCCAACAATG 
TCCAACAATG 
TCCAACAATG 
TCCAACAATG 
TCCAACAATG 
TCCAACAATG 



AAACTCTCAA 
AAACTCTCAA 
AAACTCTCAA 
AAACTCTCAA 
AAACTCTCAA 
AAACTCTCAA 
AAACTCTCAA 
AAACTCTCAA 
AAACTCTCAA 
AAACTCTCAA 
AAACTCTCAA 



TCGCTCAGTT 
TCGCTCAGTT 
TCGCTCAGTT 
TCGCTCAGTT 
TCGCTCAGTT 
TCGCTCAGTT 
TCGCTCAGTT 
TCGCTCAGTT 
TCGCTCAGTT 
TCGCTCAGTT 
TCGCTCAGTT 



ATGTTACGTC 
ATGTTACGTC 
ATGTTACGTC 
ATGTTACGTC 
********** 

900 

AGGCATGATG 
AGGCATGATG 
AGGCATGATG 
AGGCATGATG 
AGGCATGATG 
AGGCATGATG 
AGGCATGATG 
AGGCATGATG 
AGGCATGATG 
AGGCATGATG 
AGGCATGATG 



rasal3607.2(201_COHi; 
rasal3607.2{201_M781 
insal36O7.2{2Ol_090 t 
msal3607 , 2 {201_CJB110 
msal3607.2{201_18RS21 
rasal3607.2{201_2603 
rasal3607 . 2 {201_A909 
msal3607.2{201_H36B 
msal3607 .2{201__JM9130013 
msal3607 . 2 {201JL169NT 
rosal3607 . 2 {201_M732 
Consensus 



rasal3 6 0 7 . 2 { 2 0 l_COHl ] 
msal3607 . 2 {2 01_M781 
msal3607.2{201_090 
msal3607.2{201jCJB110 
msal3607.2{201_18RS21 
msal3607.2(201_2603 
msal3607.2{201_A909 
rasal3607.2(201_H36B 
msal3607 . 2 {201_JM9130013 
msal3607.2{201_lie9NT 
msal3607 .2{201_M732 
Consensus 



tnsal3 607 . 2 { 2 0 l_COHl : 
msal3607.2{201_J478l' 
rasal3607.2{201_090 , 
msa!3607 . 2 (201_CJB110 
msal3607 .2 (201_18RS21 
'201_2603 
201_A909 
201 H36B 



msal3607.2 
msal3607 .2 
msa!3607.2 
msal3607 . 2 {201_JM9130013 
msal3607.2{201_1169NT 
msal3607.2{201_M732 
Consensus 



901 

CAACAATCTG 
CAACAATCTG 
CAACAATCTG 
CAACAATCTG 
CAACAATCTG 
CAACAATCTG 
CAACAATCTG 
CAACAATCTG 
CAACAATCTG 
CAACAATCTG 
CAACAATCTG 
********** 

951 

TAATGCAGCA 
TAATGCAGCA 
TAATGCAGCA 
TAATGCAGCA 
TAATGCAGCA 
TAATGCAGCA 
TAATGCAGCA 
TAATGCAGCA 
TAATGCAGCA 
TAATGCAGCA 
TAATGCAGCA 
********** 

1001 

TGTTAGAGAA 
TGTTAGAGAA 
TGTTAGAGAA 
TGTTAGAGAA 
TGTTAGAGAA 
TGTTAGAGAA 
TGTTAGAGAA 
TGTTAGAGAA 
TGTTAGAGAA 
TGTTAGAGAA 
TGTTAGAGAA 



TCAAATCCGG 
TCAAATCCGG 
TCAAATCCGG 
TCAAATCCGG 
TCAAATCCGG 
TCAAATCCGG 
TCAAATCCGG 
TCAAATCCGG 
TCAAATCCGG 
TCAAATCCGG 
TCAAATCCGG 
********** 



TTGCAaATGC 
TTGCAaATGC 
TTGCAgATGC 
TTGCAgATGC 
TTGCAgATGC 
TTGCAgATGC 
TTGCAgATGC 
TTGCAgATGC 
TTGCAgATGC 
TTGCAgATGC 
TTGCAaATGC 
*****.**** 



TGTCACTGCT 
TGTCACTGCT 
TGTCACTGCT 
TGTCACTGCT 
TGTCACTGCT 
TGTCACTGCT 
TGTCACTGCT 
TGTCACTGCT 
TGTCACTGCT 
TGTCACTGCT 
TGTCACTGCT 
********** 



GATGCTATTG 
GATGCTATTG 
GATGCTATTG 
GATGCTATTG 
GATGCTATTG 
GATGCTATTG 
GATGCTATTG 
GATGCTATTG 
GATGCTATTG 
GATGCTATTG 
GATGCTATTG 
********** 



TGGCTGAAAC 
TGGCTGAAAC 
TGGCTGAAAC 
TGGCTGAAAC 
TGGCTGAAAC 
TGGCTGAAAC 
TGGCTGAAAC 
TGGCTGAAAC 
TGGCTGAAAC 
TGGCTGAAAC 
TGGCTGAAAC 
********** 



TAGTAAAGAA 
TAGTAAAGAA 
TAGTAAAGAA 
TAGTAAAGAA 
TAGTAAAGAA 
TAGTAAAGAA 
TAGTAAAGAA 
TAGTAAAGAA 
TAGTAAAGAA 
TAGTAAAGAA 
TAGTAAAGAA 
********** 



GACCGCACAA 
GACCGCACAA 
GACCGCACAA 
GACCGCACAA 
GACCGCACAA 
GACCGCACAA 
GACCGCACAA 
GACCGCACAA 
GACCGCACAA 
GACCGCACAA 
GACCGCACAA 



AGCCCCACTG 
AGCCCCACTG 
AGCCCCACTG 
AGCCCCACTG 
AGCCCCACTG 
AGCCCCACTG 
AGCCCCACTG 
AGCCCCACTG 
AGCCCCACTG 
AGCCCCACTG 
AGCCCCACTG 



TTTCTATTAA 
TTTCTATTAA 
TTTCTATTAA 
TTTCTATTAA 
TTTCTATTAA 
TTTCTATTAA 
TTTCTATTAA 
TTTCTATTAA 
TTTCTATTAA 
TTTCTATTAA 
TTTCTATTAA 



950 

TCAACGCTAA 
TCAACGCTAA 
TCAACGCTAA 
TCAACGCTAA 
TCAACGCTAA 
TCAACGCTAA 
TCAACGCTAA 
TCAACGCTAA 
TCAACGCTAA 
TCAACGCTAA 
TCAACGCTAA 
********** 

1000 
GCGATTCCGA 
GCGATTCCGA 
GCGATTCCGA 
GCGATTCCGA 
GCGATTCCGA 
GCGATTCCGA 
GCGATTCCGA 
GCGATTCCGA 
GCGATTCCGA 
GCGATTCCGA 
GCGATTCCGA 
********** 

1050 
ATCTGTCACT 
ATCTGTCACT 
ATCTGTCACT 
ATCTGTCACT 
ATCTGTCACT 
ATCTGTCACT 
ATCTGTCACT 
ATCTGTCACT 
ATCTGTCACT 
ATCTGTCACT 
ATCTGTCACT 



msal3607 .2{201_COHl] 
msal3607.2{201_M781 
msal3607.2{201_090 
mBal3607.2{201_CJBllo' 
tnsal3607.2{201__18RS21 
msal3607.2{201_2603 
msal3607. 2(201 A909 
rasal3607 . 2 (201_H36B 
msal3607.2{201_JM9130013 
msal3607 . 2 {201 JL169NT 



1051 

GCATTAgCTG 
GCATTAgCTG 
GCATTAgCTG 
GCATTAgCTG 
GCATTAgCTG 
GCATTAgCTG 
GCATTAgCTG 
GGATTAtCTG 
GCATTAgCTG 
GCATTAgCTG 



AAAGCTTAGT 
AAAGCTTAGT 
AAAGCTTAGT 
AAAGCTTAGT 
AAAGCTTAGT 
AAAGCTTAGT 
AAAGCTTAGT 
AAAGCTTAGT 
AAAGCTTAGT 
AAAGCTTAGT 



GGCTCAAAAT 
GGCTCAAAAT 
GGCTCAAAAT 
GGCTCAAAAT 
GGCTCAAAAT 
GGCTCAAAAT 
GGCTCAAAAT 
GGCTCAAAAT 
GGCTCAAAAT 
GGCTCAAAAT 



AATGGTATTA 
AATGGTATTA 
AATGGTATTA 
AATGGTATTA 
AATGGTATTA 
AATGGTATTA 
AATGGTATTA 
AATGGTATTA 
AATGGTATTA 
AATGGTATTA 



1100 
TCGCTGCCAT 
TCGCTGCCAT 
TCGCTGCCAT 
TCGCTGCCAT 
TCGCTGCCAT 
TCGCTGCCAT 
TCGCTGCCAT 
TCGCTGCCAT 
TCGCTGCCAT 
TCGCTGCCAT 



867 



WO 2004/018646 



PCT/US2003/026827 



Table 52: Comparative Sequences relating to SAG 1823 



msal3607.2{201_M732} 
Consensus 



msal3 6 07 . 2 { 2 01_COH1 : 
msal3607.2{201_M78i; 
msa 1 3 6 0 7 . 2 { 2 0 1_0 9 0 ( 
msal3607.2{201_CJB110' 
msal3607 . 2 {201_18RS21 
rasal3607.2{201_2603 
msal3607.2{201_A909 
msal3607.2{201_H36B 
msal3607.2{201_JM9130013 
msal3607 . 2 {201_1169NT 
rasal3607 .2{201_M732 
Consensus 



GCATTAgCTG AAAGCTTAGT GGCTCAAAAT AATGGTATTA TCGCTGCCAT 
******_*** ********** ********** ********** ********** 



msal3 6 0 7 . 2 { 2 01_COH1 
msal3607.2{201_M7Bl 
rasal3607.2{201_090 
msal3607.2{201_CJB110 
msal3607 .2{201_18RS21 
msal3607.2{201_2603 
msal3607.2{201_A909 
msal3607.2{201__H36B 
msal3607.2{201_JM9130013 
rasal3607 . 2 {201JL169NT 
msal3607 . 2 {201_M732 
Consensus 



msal3607.2{201_COHl 
msal3607 . 2 {201_M781 
rasal3607 . 2 {201_090 
msal3 607 . 2 f 201_CJB110 
msal3607.2{201_18RS21 
*201 2603 
201~A909 
■201 H36B 



msal3607 .2 
tnsal3607.2 
msal3607.2 _ 
msal3607 . 2 {201_JM9130013 
msal3607.2{201_1169NT 
msal3607.2{201_M732 
Consensus 



1101 

AGACAAAGGA 
AGACAAAGGA 
AGACAAAGGA 
AGACAAAGGA 
AGACAAAGGA 
AGACAAAGGA 
AGACAAAGGA 
AGACAAAGGA 
AGACAAAGGA 
AGACAAAGGA 
AGACAAAGGA 
********** 

1151 

CGGCTGAAAC 
CGGCTGAAAC 
CGGCTGAAAC 
CGGCTGAAAC 
CGGCTGAAAC 
CGGCTGAAAC 
CGGCTGAAAC 
CGGCTGAAAC 
CGGCTGAAAC 
CGGCTGAAAC 
CGGCTGAAAC 
********** 

1201 

GAAGCCTTAC 
GAAGCCTTAC 
GAAGCCTTAC 
GAAGCCTTAC 
GAAGCCTTAC 
GAAGCCTTAC 
GAAGCCTTAC 
GAAGCCTTAC 
GAAGCCTTAC 
GAAGCCTTAC 
GAAGCCTTAC 
********** 



CGTAAgGAAC 
CGTAAgGAAC 
CGTAAgGAAC 
CGTAAgGAAC 
CGTAAgGAAC 
CGTAAgGAAC 
CGTAAaGAAC 
CGTAAaGAAC 
CGTAAgGAAC 
CGTAAgGAAC 
CGTAAgGAAC 
*****.**** 



AATCAATGAT 
AATCAATGAT 
AATCAATGAT 
AATCAATGAT 
AATCAATGAT 
AATCAATGAT 
AATCAATGAT 
AATCAATGAT 
AATCAATGAT 
AATCAATGAT 
AATCAATGAT 
********** 



GTGCCCAATT 
GTGCCCAATT 
GTGCCCAATT 
GTGCCCAATT 
GTGCCCAATT 
GTGCCCAATT 
GTGCCCAATT 
GTGCCCAATT 
GTGCCCAATT 
GTGCCCAATT 
GTGCCCAATT 
********** 



aGAATCTGCT 
aGAATCTGCT 
gGAATCTGCT 
gGAATCTGCT 
gGAATCTGCT 
gGAATCTGCT 
aGAATCTGCT 
aGAATCTGCT 
aGAATCTGCT 
aGAATCTGCT 
aGAATCTGCT 
.********* 



TCTGTCAAAA 
TCTGTCAAAA 
TCTGTCAAAA 
TCTGTCAAAA 
TCTGTCAAAA 
TCTGTCAAAA 
TCTGTCAAAA 
TCTGTCAAAA 
TCTGTCAAAA 
TCTGTCAAAA 
TCTGTCAAAA 
********** 



TTCGTGATAA 
TTCGTGATAA 
TTCGTGATAA 
TTCGTGATAA 
TTCGTGATAA 
TTCGTGATAA 
TTCGTGATAA 
TTCGTGATAA 
TTCGTGATAA 
TTCGTGATAA 
TTCGTGATAA 
********** 



TCAACGAAGG 
TCAACGAAGG 
TCAACGAAGG 
TCAACGAAGG 
TCAACGAAGG 
TCAACGAAGG 
TCAACGAAGG 
TCAACGAAGG 
TCAACGAAGG 
TCAACGAAGG 
TCAACGAAGG 
********** 



TAAATCTACC 
TAAATCTACC 
TAAATCTACC 
TAAATCTACC 
TAAATCTACC 
TAAATCTACC 
TAAATCTACC 
TAAATCTACC 
TAAATCTACC 
TAAATCTACC 
TAAATCTACC 
********** 



CAAGAAAAAG 
CAAGAAAAAG 
CAAGAAAAAG 
CAAGAAAAAG 
CAAGAAAAAG 
CAAGAAAAAG 
CAAGAAAAAG 
CAAGAAAAAG 
CAAGAAAAAG 
CAAGAAAAAG 
CAAGAAAAAG 
********** 



1150 
GTTATTAAAT 
GTTATTAAAT 
GTTATTAAAT 
GTTATTAAAT 
GTTATTAAAT 
GTTATTAAAT 
GTTATTAAAT 
GTTATTAAAT 
GTTATTAAAT 
GTTATTAAAT 
GTTATTAAAT 
********** 

1200 
AAAAATAGTT 
AAAAATAGTT 
AAAAATAGTT 
AAAAATAGTT 
AAAAATAGTT 
AAAAATAGTT 
AAAAATAGTT 
AAAAATAGTT 
AAAAATAGTT 
AAAAATAGTT 
AAAAATAGTT 
********** 

1250 
ttgatgagtc 
ttgatgagtc 
ttgatgagtc 
ttgatgagtc 
ttgatgagtc 
ttgatgagtc 
ttgatgagtc 
ttgatgagtc 
ttgatgagtc 
ttgatgagtc 



TOSal3607.2{20l_COHl 1 
rasal3607.2(201_M78l| 
msal3607.2{201_090| 
msal3607 . 2 {201_CJB110' 
rasal3607 . 2 {201_I8RS21 
rasal3607.2{201_2603 
rasal3607.2i201_A909 
msal3 6 07 . 2 { 2 01 _H3 6B 
msal3607 . 2 {201_JM9130013 
msal3 607 . 2 { 201_1169NT 
rasal3607.2{201_M732 
Consensus 



1251 

t 

t 

t 

t 

t 

t 

t 

t 

t 

t 



SEQ ID HO. 5212 

STRAIN _090 frame: 1 

SDTFNPD IDQ I ADNAITKTDKTTE 1 1 SNQTTSQTGQX AFPBKLTPAQKSAI SEKTPALVD 
TFVGD^IALI^FGQSAVEOVNTTVNHILSEQKKIQI POVDDLLKNANRELNGFIAKYKDA 
TPAELEKKPNL I QKL FKQS KTSLQE PYFDS QN I EQKMDMMAANVVKQEDTLARN IVSAEM 
LIEDNTKSIENLVGVIAFIESSQAEAANRASHLQQEIIJ^ 

IimjEQQHTEYVSRLYVAMATTPQMRNLVKVSSDMRQKUSMI^RRNTI PTMKLS I AQLGMM 
QQSVKSGVTADAI VNANNAALQMLAETS KEAI PMLEKTAQS PTVS I KS VTALAESLVAQN 
KG I IAAI DKGRKBRAQLESAVI KSAET INDSVKI RDKKI VEALliNEGKSTQEKVDE 9 

SEQ ZD HO. 52013 
STRAIN A909 frames 1 

SDTFNFDIDQX ADNA ITKTDKTTE 1 1 SNQTTSQTGQI AFFBKLTPAQKSAISBKTPALVD 
TFVGDQNALLD FGQSAVEGVNTTVNH I LSEQKKIQI PQVDDLLKNANRELNGFIAKYKDA 
TPAELEKKPNLIQKLFKQSKTSLQEFYFDSQNI BQKMimAANVVKQEDTLARNIVSAEM 
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LIBDNTKSIENLVGVXAFI ESSQAEAANRASHLQQE I LALDSQTSEYQI KSNQLARMTEV 
'INTLEQQHTEYVSRLYVAWATTPQMRNLVKVSSDMRQKIiGMLRRNTI PTMKLS IAQLGMM 
C»SVKSGVTAnAIVNANNAALQMIABTSKEAI PMLEKTAQSPTVSIKSVTALAESLVAQN 
NGI I AAIDKGRKERAQLESAVI KSAETINDS VKI RDKKI VEALLNEGKSTQEKVDBS 

SEQ ZD NO. 5214 
STRAIN H36B frame: 1 

SDTFNHJIDQIADNAITIO^KrTBIISNQTTSQTGQIAPFEKLTPAQKSAISBICrPALV^ 
TFVGDQNALLDFGQSAVEGVNTTVNHI LSEQKKI Q I PQVDDLLKNANRELNGF I AKYKDA 
TPABXiEKKPNL I QKLFKQS KTSLQE FYFDSQN I EQKMDMMAANVVKQEDTLARN I VSAEM 
L I EDNTKS I ENLVGV I AF I ESSQAEAANRASHLQQE I LALDSQTSEYQI KSNQLARMTEV 
INTLEQQHTEYVSRLYVAWATTPQMRNLVKVS SDMRQKLGMLRRNT I PTMKLS I AQL04M 
QQSVKSGVTADAI VNANNAALQMLAETSKEAI PMLEKTAQSPTVS I KSVTALSE SLVAQN 
NGI IAAIDKGRKERAQLESAVIKSAETINDSVKIRDKXIVEALLNEGKS^ 

SEQ ID NO. 5215 
STRAIN 1BRS21 frame: 2 

FD I DQIADNA I TKTD KTTE I 1 SNQTTSGTGQI AFFEKLTPAQKSA I SEKTPALVDTFVGD 
QNALLDFGQSAVEGVNTTVNHI LS EQKKI Q I PQfVDDLLKNANRELNG P I AKYKDAT P AEL 
EKKPNLI QKLFKQSKTSIiQEFY PDSQN IEQKMDMMAANVVKQEDTIJU^NI VSAEMLI EDN 
TKS I ENLVGVI AF I ESS QAEAANRASHLQQE I LALDSQTS E YQ I KSNQLARMTEV I NTLE 
QQHP EYVS RLYVAWATTPQMRNLVKVS SDMRQKLGMLRRNT I PTMKLS I AQLGMMQQSVK 
SGVTADAI VNANNAALQMLAETSKEAI PMLEKTAQSPTVS I KSVTALAESLVAQNNGI IA 
A I DKGRKERAQLESAVI KSAET I NDSVKI RDKKI VEALLNEGKSTQEKVDES 

SEQ ZD NO. 5216 
STRAIN M732 frames 1 

SDTFNFDIDQIADNAITKTDKTTEIISNQTTSQTCQIAFFEK^ 

TFVGDQNALLDFGQSAVEGVNTTVNHI LSEQKKI QI PQVDDLLKNANRELNGFIAKYKDA 
TPAELEKKPNLIQKLFKQSKTSLQEFYFDSQNIEQKMDMMAANVVKQEDTLARNIVSA 
LI EDNTKS IENLVGVIAFIESSQAEAANRASHLQQBILALDSGT 

INTLECQHTBYVSRLYVAWATTPQMRNLVKVSSDMRQKLGMLRROT IAQLGMM ' 

QQSVKSGVTADAIVNANNAALQMLAETSKEAI PMLEKTAQSPTVS I KSVTALAES LVAQN 
NGI I AAI DKGRKERAQLESAVI KSAETINDS VKI RDKKI VEALLNEGKSTQEK 

SEQ ID NO. 5217 

STRAIN OOH1 frame: 3 

KTDKTTEI I SNQTTCQTGQ I AFFEKLTPAQKSAX S EKTPALVDT FVGDQNALLD FGQSAV 

EGVNTTVNHI LSEQKKI QI PQVDDLLKNANRELNG F I AKYKDATPABLE KKPNL I QKLFK 

QSKTSLQEFYFDSQNIEQKMDMMAANVVKQEDTLARNIVSAEMLIEDN^ 

FI ES S QAEAANRASHLQQE I LALDSQTSEYQI KSNQLARMTEVINTLEQQHTEYVSRLYV 

AWATT PQMRNLVKVS SDMRQKLGMLRRNTI PTMKLS I AQLGMMQQS VKSGVTADAI VNAN 

NAALQMLAETSKEAI PMLEKTAQSPTVS I KSVTALAESLVAQNNGI I AAI DKGRKERAQL 

ESAVI KSAET I NDSVKI RDKKI VEALLNEGKSTQE KVDES 

SEQ ID NO. 5218 

STRAIN GOH1 frame: 3 

KTDKTTEI I SNQTTCQTGQ I AF FEKLT PAQKSAXS EKTP ALVDTFVGDQNALLD FGQSAV 
EGVNTTVNHI LSEQKKI Q I PQVDDLLKNANRELNGFIAKYKDATPABLEKKPNLI QKLFK 
QSKTSLQEFYFDSQNIEQKMDMMAANVVKQEDTLARNI VSAEMLI EDNTKS IENLVGVI A 
FIESSQAEAANRA^HLQQE I LALDSQfTSEYQI KSNQLARMTEV 

AWATTPQMRNLVKVS SDMRQKLGMLRRNT I PTMKLS I AQLGMMQQSVKSGVTADAI VNAN 
NAALQMLAETSKEAI PMLEKTAQS PTVS I KSVTALAE SLVAQNNG 1 1 AAI DKGRKERAQL 
ES AVI KSAET I NDSVKI RDKKI VEALLNEGKSTQEKVDES 

SEQ ID NO. 5219 

STRAIN M781 frame: 2 

FDIDQIADNAXT KI'DKITE I I SNQTTS QTGQ IAF FEKLTPAQKSAI SBKTPALVDTFVGD 
QNALLDFGQSAVEGVNTTVNHILSEQKKIQI PQVDDLLKNANRELNGFIAKYKDATPAEL 
EKKPNLI QKLFKQSKTSLQE FYFDSQNI EQKMDMMAANVVKQEDTLARNI VSAEMLI EDN 
TKSIENLVGVIAFIESSQAEAANRASHLOQEILALDSQTSEYQI KSNQLARMTEVI NTLE 
QQHTEYVS RL YVAWATTPQMRNLVKVSSDMRQKLGMLRRNT I PTMKLS IAQLGMM QQSVK 
SGVTADAI VNANNAALQMLAETSKEAI PMLEKTAQSPTVS I KSVTALAESLVAQNNGI I A 
AI DKGRKERAQLESAVI KSAET I ND S VKI RDKKI VEALLNEGKSTQEKVDES 

SEQ ZD NO. 5220 
STRAIN CJB110 frame: 2 

FDIDQIADNAITKTDKTTEI I SNQTTS QTGQ IAF FEKLT PAQKSAI S EKTPALV UT F VGD 
QNALLDFGQSAVEGVNTTVNHI LSEQKKI Q I PQVDDLLKNANRELNGFIAKYKDATPAEL 
EKKPNL I QKL FKQS KTSLQE FYFDS QN I EQKMDMMAANVVKQEDTLARN I VSAEML I EDN 
TKS I ENLVGVI API ESSQAEAANRASHLQQE I LALDSQTSEYQI KSNQLARMTEV I NTLE 
QG^EYVSRLYVAWATTPQMRNLVKVSSIIMRQKLGMLRRNTI PTMKLS I AQLGMMQQSVK 
SGVTADAI VNANNAALQMLiAET SKEAI PMLEKTAQ S PTVS I KSVTALAE S LVAQNNG 1 1 A 
AI DKGRKERAQLESAVI KSAET IND SVKI RDKKI VEALLNEGKSTQEKVDES 

SEQ ZD NO. 5221 
STRAIN 1169NT frame t 1 

ADNAITKTDKTTBIISNQTTSQTGQIAFFEKLTPAQKSAISEOT 

FGQSAVEGVNTTVNHILSEQKKIQI PQVDDLLKNANRBIiNGF IAKYKDATPAELEKKPNL 
IQKLFKQSKTSLQEFYFDSQNI EQKMDMMAANVVKQEDTLARNI VSAEML I EDNTKS I EN 
LVGVIAF I ESSQAEAANRASHLQQE I LALDSQTSEYQI KSNQLARMTEV I NTLEQQHTEY 
VSRLYVAWATTPQMRNL VKVS SDMRQKLGMLRRNT I PTMKLS I AQLGMMQQS VKSGVTAD 
AI VNANNAALQMLAETSKEAI PMLEKTAQSPTVS I KSVTALAESLVAQNNGI IAAIDKGR 
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KERAQLESAVI KSAETINDSVKI RDKKI VEALLNEGKSTQEKVDES 

SEQ ID HO. 5222 

STRAIN JM9130013 frame: 1 

SDTFNFTDIDQIADNAITKTDKTTEIISNQTTSQTGQIAFFBKLTPAQKSAI SEKTPALVD 

TFVGDQNALLDFGQSAVEGVNTTVNHI LSEQKKI QI PQVDDLLKNANRELNGFIAKYKDA 

TPAELEKKPNLIQKLFKQSKTSIiQEFYFDSQNIEQKMDMMAANWK^ 

LI EDNTKS I ENLVGVIAF I ESSCAEAANRASHLQQEILALDSQTSEYQI KSNQLARMTBV 

INTLEQQHTEYVSRLYVAWATTPQMRNLVKVSSDMRQKIX3MLRRNTI PTMKLS I AQLGMM 

QQSVKSGVTADAI VNANNAALQMLAETSKEAI PMLEKTAQSPTVS IKSVTALAESLVAQN 

NG 1 1 AA I DKGRKERAQLESAVI KSAETINDSVKI RDKKI VEALLNEGKSTQEKVDES 



SEQ ID NO. 5223 

STRAIN 2603 frame: 1 

SDTFNFDIDQIADNAITKTDKTTE 1 1 SNQTTS QTGQI AFFEKLTPAQKSAI SEKTPALVD 
TFVGDQNALLDFGQSAVEGVNTTVNHI LS EQKKI QI PQVDDLLKNANRELNGF I AKYKDA 
T PAELEKKPNL I QKLFKQSKTSIjQE FYFDSQN I BQKMDMMAANVVKQEDTLARNI VSAEM 
L I EDNTKS I ENLVGVI AFI E SS QAEAANRASHLQQE I LALDS QTSE YQI KSNQLARMTBV 
I NTLEQQHPE YVS RIiYVAWATT PQMRNIiVKVS S DMRQKLGMLRRNT I PTMKLS I AQLGMM 
QQSVKSGVTADAI VNANNAALQMLAETSKEAI PMLEKTAQSPTVS I KS VTALAE SLVAQN 
NGI IAAIDKGRKERAQLESAVI KSAETINDSVKI RDKKI VEALI^NEGKSTQ 

PRETTY of: /biotmp/msa28369.2{*} April 22, 2002 04:27 



msa28369.2{201_090 
msa28369 . 2 {201_1169NT ( 
msa28369.2{201_A909 ( 
msa28369 . 2 {201_JM9130013 
msa28369.2{201_COHl 

msa28369.2{201_CJB110 
rasa28369 . 2 f 201_M781 
msa28369.2(201_2603 
msa28369.2{201_H36B 

tnsa28369.2{201_18RS21 
msa28369.2{201_M732 
Consensus 



sdtfnfdidq 

sdtfnfdidq 
sdtfnfdidq 



fdidq 

fdidq 

sdtfnfdidq 
sdtfnfdidq 

fdidq 

sdtfnfdidq 



iadnaitKTD 
-adnaitKTD 
iadnaitKTD 
iadnaitKTD 

KTD 

iadnaitKTD 
iadnaitKTD 
iadnaitKTD 
iadnaitKTD 
iadnaitKTD 
iadnaitKTD 
*** 



KTTEIISNQT 
KTTEIISNQT 
KTTEIISNQT 
KTTEIISNQT 
KTTEIISNQT 
KTTEIISNQT 
KTTEIISNQT 
KTTEIISNQT 
KTTEIISNQT 
KTTEIISNQT 
KTTEIISNQT 
********** 



TsQTGQIAFF 
TsQTGQIAFP 
TsQTGQIAFF 
TSQTGQIAFP 
TcQTGQIAFF 
TsQTGQIAFF 
TsQTGQIAFF 
TsQTGQIAFF 
TsQTGQIAFF 
TsQTGQIAFF 
TsQTGQIAFF 
*„******** 



50 

EKLTPAQKSA 
EKLTPAQKSA 
EKLTPAQKSA 
EKLTPAQKSA 
EKLTPAQKSA 
EKLTPAQKSA 
EKLTPAQKSA 
EKLTPAQKSA 
EKLTPAQKSA 
EKLTPAQKSA 
EKLTPAQKSA 
********** 



msa28369 .2{201_090; 
msa28369.2{201_1169NT 
msa28369.2{201_A909 ( 
msa28369.2{201_JM9130013| 
msa28369.2{201_COHl' 
rasa28369 . 2 {201_CJB110 
msa28369.2f201_M781 
msa28369.2i201_2603 
msa28369.2{201_H36B 
rasa28369.2{201_18RS21 
xnsa28369.2{201_M732 
Consensus 



51 

i SEKTPALVD 
iSEKTPALVD 
i SEKTPALVD 
iSEKTPALVD 
XSEKTPALVD 
iSEKTPALVD 
iSEKTPALVD 
iSEKTPALVD 
iSEKTPALVD 
iSEKTPALVD 
iSEKTPALVD 
_********* 



TFVGDQNALL 
TFVGDQNALL 
TFVGDQNALL 
TFVGDQNALL 
TFVGDQNALL 
TFVGDQNALL 
TFVGDQNALL 
TFVGDQNALL 
TFVGDQNALL 
TFVGDQNALL 
TFVGDQNALL 



DFGQSAVEGV 
DFGQSAVEGV 
DFGQSAVEGV 
DFGQSAVEGV 
DFGQSAVEGV 
DFGQSAVEGV 
DFGQSAVEGV 
DFGQSAVEGV 
DFGQSAVEGV 
DFGQSAVEGV 
DFGQSAVEGV 



********** ********** 



NTTVNHILSE 
NTTVNHILSE 
NTTVNHILSE 
NTTVNHILSE 
NTTVNHILSE 
NTTVNHILSE 
NTTVNHILSE 
NTTVNHILSE 
NTTVNHILSE 
NTTVNHILSE 
NTTVNHILSE 
********** 



100 

QKKIQIPQVD 
QKKIQIPQVD 
QKKIQIPQVD 
QKKIQIPQVD 
QKKIQIPQVD 
QKKIQIPQVD 
QKKIQIPQVD 
QKKIQIPQVD 
QKKIQIPQVD 
QKKIQIPQVD 
QKKIQIPQVD 
********** 



msa28369.2{201_090] 
msa28369 . 2 {201_1169NT ( 
msa28369.2{201_A909 ) 
msa28369.2{201_JM9130013 
msa2 83 69 . 2 { 2 0 l_COHl 
rasa28369.2{201_CJB110 
msa28369.2{201_M781 
msa28369 .2 (201_2603 
msa28369.2{201_H36B 
msa28369.2{201_18RS21 
rasa28369.2{201_M732 
Consensus 



101 

DLLKNANREL 
DLLKNANREL 
DLLKNANREL 
DLLKNANREL 
DLLKNANREL 
DLLKNANREL 
DLLKNANREL 
DLLKNANREL 
DLLKNANREL 
DLLKNANREL 
DLLKNANREL 
********** 



NGFIAKYKDA 
NGFIAKYKDA 
NGFIAKYKDA 
NGFIAKYKDA 
NGFIAKYKDA 
NGFIAKYKDA 
NGFIAKYKDA 
NGFIAKYKDA 
NGFIAKYKDA 
NGFIAKYKDA 
NGFIAKYKDA 
********** 



TPAELEKKPN 
TPAELEKKPN 
TPAELEKKPN 
TPAELEKKPN 
TPAELEKKPN 
TPAELEKKPN 
TPAELEKKPN 
TPAELEKKPN 
TPAELEKKPN 
TPAELEKKPN 
TPAELEKKPN 
********** 



LIQKLFKQSK 
LIQKLFKQSK 
LIQKLFKQSK 
LIQKLFKQSK 
LIQKLFKQSK 
LIQKLFKQSK 
LIQKLFKQSK 
LIQKLFKQSK 
LIQKLFKQSK 
LIQKLFKQSK 
LIQKLFKQSK 
********** 



150 

TSLQEFYFDS 
TSLQEFYFDS 
TSLQEFYFDS 
TSLQEFYFDS 
TSLQEFYFDS 
TSLQEFYFDS 
TSLQEFYFDS 
TSLQEFYFDS 
TSLQEFYFDS 
TSLQEFYFDS 
TSLQEFYFDS 
********** 



msa28369.2{201_090 
msa28369 . 2 {201_1169NT 
msa28369.2{201_A909 
msa28369 . 2 {201_JM9130013 
msa2B369.2{201_COHl 
msa28369 . 2 {201_CJB110 



msa26369.2 
msa28369.2 
msa28369 .2 



201_M781 
201_2603 
201 H36B 



151 

QNIEQKMDMM 
QNIEQKMDMM 
QNIEQKMDMM 
QNIEQKMDMM 
QNIEQKMDMM 
QNIEQKMDMM 
QNIEQKMDMM 
QNIEQKMDMM 
QNIEQKMDMM 



AANWKQEDT 
AANWKQEDT 
AANWKQEDT 
AANWKQEDT 
AANWKQEDT 
AANWKQEDT 
AANWKQEDT 
AANWKQEDT 
AANWKQEDT 



LARNIVSAEM 
LARNIVSAEM 
LARNIVSAEM 
LARNIVSAEM 
LARNIVSAEM 
LARNIVSAEM 
LARNIVSAEM 
LARNIVSAEM 
LARNIVSAEM 



LI EDNTKS IE 
LI EDNTKS IE 
LIEDNTKSIE 
LI EDNTKS IE 
LIEDNTKSIE 
LIEDNTKSIE 
LIEDNTKSIE 
LIEDNTKSIE 
LIEDNTKSIE 



200 

NLVGViAFIE 
NLVGViAFIE 
NLVGVxAFIE 
NLVGViAFIE 
NLVGViAFIE 
NLVGViAFIE 
NLVGViAFIE 
NLVGViAFIE 
NLVGViAFIE 
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Table 52: Comparative Sequences relating to SAG 1823 



msa28369 . 2 {201_18RS21> 
msa28369.2{201_M732} 
Consensus 



QNIEQKMDMM AANWKQEDT LARNIVSAEM LIEDNTKSIE NLVGViAFIE 
QNIEQKMDMM AANWKQEDT LARNIVSAEM LIEDNTKSIE NLVGViAFIE 
********** ********** ********** ********** *****_**** 



msa28369.2{201_090' 
msa28369.2{201_1169NT 
msa28369.2{201_A909| 
msa28369 . 2 {201_JM913 0013 ' 
msa2 8 3 6 9 . 2 { 2 0 1__C0H1 
msa28369.2{201_CJB110 
msa28369.2{201_M781 
msa28369.2(201 2603 
msa28369.2{201~H36B 
msa2 83 6 9 . 2 { 2 01_18RS2 1 
msa28369.2{201_M732 
Consensus 



201 

SSQAEAANRA 
SSQAEAANRA 
SSQAEAANRA 
SSQAEAANRA 
SSQAEAANRA 
SSQAEAANRA 
SSQAEAANRA 
SSQAEAANRA 
SSQAEAANRA 
SSQAEAANRA 
SSQAEAANRA 



SHLQQEILAL 
SHLQQEILAL 
SHLQQEILAL 
SHLQQEILAL 
SHLQQEILAL 
SHLQQEILAL 
SHLQQEILAL 
SHLQQEILAL 
SHLQQEILAL 
SHLQQEILAL 
SHLQQEILAL 



DSQTSEYQIK 
DSQTSEYQIK 
DSQTSEYQIK 
DSQTSEYQIK 
DSQTSEYQIK 
DSQTSEYQIK 
DSQTSEYQIK 
DSQTSEYQIK 
DSQTSEYQIK 
DSQTSEYQIK 
DSQTSEYQIK 



SNQLARMTEV 
SNQLARMTEV 
SNQLARMTEV 
SNQLARMTEV 
SNQLARMTEV 
SNQLARMTEV 
SNQLARMTEV 
SNQLARMTEV 
SNQLARMTEV 
SNQLARMTEV 
SNQLARMTEV 



250 

INTLEQQHtE 
INTLEQQHtE 
INTLEQQHtE 
INTLEQQHtE 
INTLEQQHtE 
INTLEQQHtE 
INTLEQQHtE 
INTLEQQHpE 
INTLEQQHtE 
INTLEQQHpE 
INTLEQQHtE 



********** ********** ********** ********** ********_* 



msa28369.2{201_090 
msa283 69 . 2 {201_1169NT 
rasa28369.2{201_A909 
msa28369.2{201_JM9130013 
msa2 8 3 6 9 . 2 { 2 0 l_COHl 
msa28369.2{201_CJB110 
msa28369.2(201_M781 
msa28369.2(201_2603 
msa28369.2{2 01_H36B 
msa28369.2{201_18RS21 
msa28369.2{201_M732 
Consensus 



251 

YVSRLYVAWA 
YVSRLYVAWA 
YVSRLYVAWA 
YVSRLYVAWA 
YVSRLYVAWA 
YVSRLYVAWA 
YVSRLYVAWA 
YVSRLYVAWA 
YVSRLYVAWA 
YVSRLYVAWA 
YVSRLYVAWA 
********** 



TTPQMRNLVK 
TTPQMRNLVK 
TTPQMRNLVK 
TTPQMRNLVK 
TTPQMRNLVK 
TTPQMRNLVK 
TTPQMRNLVK 
TTPQMRNLVK 
TTPQMRNLVK. 
TTPQMRNLVK 
TTPQMRNLVK 



VSSDMRQKLG 
VSSDMRQKLG 
VSSDMRQKLG 
VSSDMRQKLG 
VSSDMRQKLG 
VSSDMRQKLG 
VSSDMRQKLG 
VSSDMRQKLG 
VSSDMRQKLG 
VSSDMRQKLG 
VSSDMRQKLG 



********** ********** 



MLRRNTIPTM 
MLRRNTIPTM 
MLRRNTIPTM 
MLRRNTIPTM 
MLRRNTIPTM 
MLRRNTIPTM 
MLRRNTIPTM 
MLRRNTIPTM 
MLRRNTIPTM 
MLRRNTIPTM 
MLRRNTIPTM 
********** 



300 

KLSIAQLGMM 
KLSIAQLGMM 
KLSIAQLGMM 
KLSIAQLGMM 
KLSIAQLGMM 
KLSIAQLGMM 
KLSIAQLGMM 
KLSIAQLGMM 
KLSIAQLGMM 
KLSIAQLGMM 
KLSIAQLGMM 
********** 



msa28369.2{201_090 
msa28369.2{201_1169NT' 
msa28369.2{201_A909 
msa28369 .2 {201_JM9130013 
ms a2 8 3 6 9 . 2 { 2 0 l_COH 1 
msa28369.2{201_CJB110 
msa28369.2{201_M781 
msa28369.2{201_2603 
msa28369.2{201JB36B 
msa28369.2{201_18RS21 
msa28369.2{201_M732 
Consensus 



301 

QQSVKSGVTA 
QQSVKSGVTA 
QQSVKSGVTA 
QQSVKSGVTA 
QQSVKSGVTA 
QQSVKSGVTA 
QQSVKSGVTA 
QQSVKSGVTA 
QQSVKSGVTA 
QQSVKSGVTA 
QQSVKSGVTA 
********** 



DAIVNANNAA 
DAIVNANNAA 
DAIVNANNAA 
DAIVNANNAA 
DAIVNANNAA 
DAIVNANNAA 
DAIVNANNAA 
DAIVNANNAA 
DAIVNANNAA 
DAIVNANNAA 
DAIVNANNAA 
********** 



LQMLAETSKE 
LQMLAETSKE 
LQMLAETSKE 
LQMLAETSKE 
LQMLAETSKE 
LQMLAETSKE 
LQMLAETSKE 
LQMLAETSKE 
LQMLAETSKE 
LQMLAETSKE 
LQMLAETSKE 



AIPMLEKTAQ 
AIPMLEKTAQ 
AIPMLEKTAQ 
AIPMLEKTAQ 
AIPMLEKTAQ 
AIPMLEKTAQ 
AIPMLEKTAQ 
AIPMLEKTAQ 
AIPMLEKTAQ 
AIPMLEKTAQ 
AIPMLEKTAQ 



********** ********** 



350 

SPTVSIKSVT 
SPTVSIKSVT 
SPTVSIKSVT 
SPTVSIKSVT 
SPTVSIKSVT 
SPTVSIKSVT 
SPTVSIKSVT 
SPTVSIKSVT 
SPTVSIKSVT 
SPTVSIKSVT 
SPTVSIKSVT 
********** 



msa28369. 2 {201_090' 
msa28369.2{201_1169NT' 
msa28369.2{201_A909' 
tnsa28369 . 2 {201_OM9130013 ' 
msa28369.2{201_COHl 
msa28369 . 2 (201_CJB110 
msa28369.2{201_M781 
rasa28369 . 2 f 201_2603 
msa28369 . 2 {201_H36B 
msa28369 . 2 {201JL8RS21 
msa28369.2{201_M732 
Consensus 



351 

ALaESLVAQN 
ALaESLVAQN 
ALaESLVAQN 
ALaESLVAQN 
ALaESLVAQN 
ALaESLVAQN 
ALaESLVAQN 
ALaESLVAQN 
ALsESLVAQN 
ALaESLVAQN 
ALaESLVAQN 
**-******* 



NGIIAAIDKG 
NGIIAAIDKG 
NGIIAAIDKG 
NGIIAAIDKG 
NGIIAAIDKG 
NGIIAAIDKG 
NGIIAAIDKG 
NGIIAAIDKG 
NGIIAAIDKG 
NGIIAAIDKG 
NGIIAAIDKG 
********** 



RKERAQLESA 
RKERAQLESA 
RKERAQLESA 
RKERAQLESA 
RKERAQLESA 
RKERAQLESA 
RKERAQLESA 
RKERAQLESA 
RKERAQLESA 
RKERAQLESA 
RKERAQLESA 
********** 



VIKSAETIND 
VIKSAETIND 
VIKSAETIND 
VIKSAETIND 
VIKSAETIND 
VIKSAETIND 
VIKSAETIND 
VIKSAETIND 
VIKSAETIND 
VIKSAETIND 
VIKSAETIND 
********** 



400 

SVKIRDKKIV 
SVKIRDKKIV 
SVKIRDKKIV 
SVKIRDKKIV 
SVKIRDKKIV 
SVKIRDKKIV 
SVKIRDKKIV 
SVKIRDKKIV 
SVKIRDKKIV 
SVKIRDKKIV 
SVKIRDKKIV 
********** 



rasa28369.2{201_090; 
msa28369 .2 {201_1169NT 
msa28369.2{201_A909' 
msa28369.2{201_JM9130013 
msa28369 . 2 {201_COH1 
msa28369.2{201_CJB110 
msa26369.2{201_M781 
msa28369 . 2 <2 01J2603 
msa28369.2{201_H36B 
msa28369.2{201_18RS21 
msa28369.2{201_M732 
Consensus 



401 

EALLNEGKST 
EALLNEGKST 
EALLNEGKST 
EALLNEGKST 
EALLNEGKST 
EALLNEGKST 
EALLNEGKST 
EALLNEGKST 
EALLNEGKST 
EALLNEGKST 
EALLNEGKST 
********** 



417 
QEKvdes 
QEKvdes 
QEKvdes 
QEKvdes 
QEKvdes 
QEKvdes 
QEKvdes 
QEKvdes 
QEKvdes 
QEKvdes 

QEK 

*** 
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Table 53: Comparative Sequences relating to SAG 0755 



SEQ ID NO. 5301 
STRAIN 2603 

acaaatactttgaaaaaagaattagttgaagctaaaaagacaattccatc 
cgtaaaagcttcaaaagtaccgcaaaaatcaacatcatcgaaagataaag 
agtttgttcttaaaccgattatcgatgtctctggttggcaacttcctaag 
gagattgattacgatacgctttcaaaaaatatttcaggtgttgttattcg 
tgtctttggtggatcaaagatatctaagactaataacgctgcttatacaa 
ctggaatcgataaatcgtttaagacccatatcaaagaatttcaaaagcga 
aatatcccagtag'ctgtctacagttatgcacttggttcaagtgttaaaga 
aatgaaagaagaggctcagatattttataagaatgcagctccttacaaac 
caactttttattggattgacgtagaagaggagacaatgtctaacatgaat 
aaaggtgtccaagcattccgaaaagaattaaaaagacttggtgctaaaaa 
tgttggtatctacattggtacttactttatgactgagcaaggcatctctg 
taaaaggatttgacgctgtttggattccaacttatggtagcgattctgga 
tactatgaagcggctccgcaaactgaacttaaatacgatttacaccaata 
cacctctcaaggttatctaccaggawtcaatcaaccgcttgatttaaatc 
aaattgcagttaataaagacaagaagaaaacttatgagaaactttttgga 
aaagtaaaagag 

SEQ ID NO. 5302 
STRAIN 090 

ACAAATACITTGAAAAAAGAATTAG 

TTGAAGCTAAAAAGAC^TTCCATCCGTAAAAGCTTCAAAAGTACCGCAA 
AAATCAACATCATCGAAAGATAAAGAGUUTC^^^ 
TGTCTCrGGTTGGCAACTTCCTAAGGAGAT^ 
AAAATATTTCAGGTGTTGTTATTCGTGTCTT^ 

AAGACTAATAACX5CTGCTTATAC^CTGGAATCGATAAATCGTTTAA 

CCATATCAAAGAATTTCAAAAG CXSAAATATCXX^GTAGCTGTCTACAGTT 

ATGCACTTGGTTCAAGTGTTAAAGAAATGAAAGAAGA CTCAGATATTT 

TATAAGAATGCAGCTCCTTAGAAACCAACTTTTTATTGGA^^ 

AGAGGAGACAATGTCTAACATGAATAAAGGTGTC 

AATTAAAAAGACTTGGTGCTAAAAATGTTGGTATCTACA^ 

TTTATGACTGAGCAAGGCATCTXriOT 

TCCAACTTATGGTAGCX5ATTCTGGATACTATGAAGOGGCT 

AACTTAAATACXIATTTACACCAATACACCTCTCAAGGT^ 

TTCIAATCAACCGCTTGATTTAAATCAAATTGCAGTTA 

GAAAACTTATGAGAAACTTTTTGGAAAAGTAAAAGAG 

SEQ XD NO. 5303 
STRAIN A909 

ACAAATACTTTGAAAAAAGAATTAGTTGAAGCTAAAA 
AGACAATTCCATCCGTAAAAGCTTCAAAAGTACCGCAAAA^ 

GCAACTTCCTAAGGAGATTGATTACXaATACGCTTTCAA^ 
GTGTTGTTATTCGTCTCTTTGGTGGATCAAA 

GCTGCTTATACAACTGGAATCGATAAATCGTTTAAGACCGATATC^ 
ATTTCAAAAGCGAAATATCCCAGTAGCTGTCTACAGTTATGCACTTG^ 
CAAG TGTT AAAGAAATGAAAGAAG AGG CT CAG AT ATTTT AT AAGAATG CA 
GCTCCTTACAAACCAACTTTTTATTGGAT^ 

GTCTAACATGAATAAAGGTGTCCAAGCATTCCGAAAAGAATTAAAAAGAC 
TTGGTGCTAAAAATGTTGGTATCTACATTGGTACTTACT 
CAAGGCATCrCTGTAAAAGGATTTGACGCTGTTTGGA^ 
TAGCX5ATTCTGGATACTATGAAGCGGCTC CGCAAACTGAACTTAAATACG 
ATTTACACCAATACACCTCrCAAGGTTAT CTACCAGGATTCAATCAACCG 
CTTGATTTAAATCAAATTG CAGTTAATAAAGACAAGAAGAAAACTTATGA 
GAAACTTTTTGGAAAAGTAAAAGAG 



SEQ ID NO. 5304 
STRAIN H36B 

ACAAATACTTTGAAAAAAGAATTAG 

TTGAAGCTAAAAAGACAATTCCATCC3TAAAAGCTTC^ 

AAATCAACATCATCGAAAGATAAAGAGTTTGTTCTTA 

TGTCTCTGGTTGGCAACTTCCTAAGGAGATTGAT^ 

AAAATATTTCAGGTGTTGTTATTCX3TGTC 

AAGAC^AATAACGCroCTrTATACAACTGGAATCG^ 

CCATATCAAAGAATTTCAAAAGCGAAATATCCCA^ 

ATGCACTTGGTTCAAGTGTTAAAGAAATG^ 

TATAAGAATGCAGCTC^TTTACAAACCAACTTT^ 

AGAGGAGAGAATGTCTAACATGAATAAAGGTGTC^^ 

AATTAAAAAGACTTGGTGCTAAAAATGTTGGTAT^ 

TTTATGACTOAGCAAGGCATCrrCrGTAAAAGGATT^ 

T<X!AACrrATGOTAGCGATTCTGGATACTAT^ 

AACrrAAATACGATTTACACCMTACACCTC 

TTCAATCAACCGCTTGATTTAAATQ 

GAAAACTTATGAGAAAC1UT"1UX3GAAAAGTAAAAGAG 

SEQ ID NO. 5305 
STRAIN 18RS21 

ACAAATACTTTGAAAAAAGAATT AGTTGAAG CT AAAAA 
GACAATTCOVTCCtrrAAAAGCTTCAAAAGTACCGCAA 
CGAAAGATAAAGAGTTTGTTCTTAAACCGATTAT^ 
CAACTKXTAAGGAGATTGATTACX^TACG CiTrCAAAAAATATTTCAGG 
TGTTGTTATTCGTGTCTTTGGTX3GATCAAAGA 
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CTGCTTATACAACTGGAAT CGATAftATCGTTTAAGAC CCATATCAAAGAA 
TTTCAAAAGCGAAATATCCCAGTAGCTGTCTACAGTTATGCA . 
AAGTGTTAAAGAAATGAAAGAAGAGGCTCAGATATTTTATAAGAATCCAG 
CTCJCTTACAAACCAACTTTTTATTGG^ 

TCTAACATGAATAAAGGTGTCCAAGCATTCCGAAAAGAATTAAAAAGACT 

TGGTG CT AAAAATGTTGGT ATCTACATTGGTACTTACTT^ 

AAGGCATCTCTCTAAAAGGATTTGACGCTGTTTGG 

AGCX5ATTCTX3GATACTATGAAGCX3G CTCCGCA^ 

TTTACACCAATACACXrrCTCAAGGTTATCTACCAGGAT^^ 

TTGATTTAAATCAAATTGCAGTTAATAAAGACAAGAAGAAA 

AAACTTITTGGAAAAGTAAAAGAG 

SEQ ID HO. 5306 
STRAIN M732 

ACAAATACTTTGAAAAAAGAATTAGTTGAAGCTAAA 

AAGACAATTC CATCCGTAAAAG CTTCAAAAGT ACCGCAAAAATCAACATC 

ATCXSAAAGATAAAGA GTiUXjlTClT AAACCG^ 

GG CAACITCCTAAGGAG ATTGATT ACGATAC^ 

GGTGTTGTTATT CGTATCTTTGGTGGATCAAAGATATCT AAG ACTAATAA 
CGCTG CTTATACAACTGGAATCGATAAATCGTTTAAGACCCATATCAAAG 
AATTTCAAAAGCX5AAATAT CCCAGTAGCTGTCT^ 

TCAAGTGTTAAAGAAATGAAAGAAGAGGCTCAGATATTTTATAAGAATGC 

AGCTCCTTACAAaCCAACTTTTTATTGGATTGACGTAGAAGAGG^ 

TGTCTAACATGAATAAAGGTGTCCAAG CATTC CX5 AAAAGAGTTAAAAAGA 

CITGGTGCT AAAAATGTTGGTATCTACAT CGGTACTTACTTT ATGACTGA 

GCAAGGTATCrCTGTAAAAGGATTTGACGCTGTTTGG^ 

GTAGCGATTCTGGATACTATGAAGCAGCTCCACAAACTGAA 

GATTTACACCAATACACCTCTCAAGGTTATCTACCAGGATTCAAT^ 

GCTTGATTTAAATCAAATTGCAGTTAATAAAGACAAGA^ 

AGAAACTTTTTGGAAAAGTAAAAGAG 

SEQ ID NO. 5307 
STRAIN COH1 

ACAAATACITTGAAAAAAGAATTAGTTGAAG CTAAAA 

AGACAATTCCATCCGTAAAAGCTTCAAAAGTACCGCAAAAATCAAC^ 

TCGAAAGATAAAGAGTTTGTTCTTAAACCGATTO 

GCAACITCCTAAGGAGATTGATTACGATACGCTTTCA 

GTGTTGTTATTCGTATCTTTGGTGGATCAAAGATATCTA^ 

GCTGCTTATACAACTGGAATCGATAAATCGTTTAAGACCCATATCAA^ 

ATTTCAAAAGCXSAAATATCCCAGTAGCTGTCr^ 

CAAGTGTTAAAGAAATGAAAGAAGAGGCTCAGATAl"l"l"rATAAGA 

GCTCCTTACAAACCAACTTTTTATTGGATTGACGTAGAW 

GTCTAACATGAATAAAGGTGTCCAAGCATTCCGAAAAGAGTTAAAAAG^ 

T1XX5TGCTAAAAATGTTGGTATCTACAT03GTACT^ 

CAAGGTATCTCTGTAAAAGGATTTGACGCTGTTIX^ 

TAGCGATTCTGGATACTATGAAGCAGCTCCACAAACrGAACT^ 

AITTACACCAATACAC<n < CTCAAGGTTATCTACC^ 

CTTGATTTAAATCAAATTGCAGTTAATAAAGACA^ 

GAAACTTTTTGGAAAAGTAAAAGAG 

SEQ ID NO. 5308 
STRAIN M781 

ACAAATACTTTGAAAAAAGAATTAGTTGAAGCTAAA 

AAGACAATTCCATCcGTAAAAGCTTCAAAAGTACCGCAAAAATCAA 

ATCGAAAGATAAAGAGTTTGTTCTTAAACCX^TTATCGATGTCT 

GGCAACTTCCTAAGGAGATTGATTACXSATACGCTTT^ 

GGTGTTGTTATTCGTATCTTTGOTGGATCAAA 

CGCTGCTrATACAACTGGAATCGATAAATcGTTTAAGAC^ 

AATTTCAAAAGCGAAATATCCCAGTAGCTGTCTACAOT^ 

TCAAGTGTTAAAGAAATGAAAGAAGAGGCTCAGATAl-I'lTATAAGAATGC 

AGCTCCTTACAAACCAACTTTTTatTGGATTGACGTAGAAGAG 

TGTCTAACATGAATAAAGGTGTCCAAGCATTCCXj 

CiTGGTG CTAAAAATGTTGGTATCrrACZATCGGTACTrACl"lTATGACTGA 
GCAAGGTATCTCTGTAAAAGGATTTGACGCTOTTTG 
GTAGCGATTCTGGATACTATGAAGCAGCTCCACAAACTGAA^ 
GATTTAC^CCAATACACCTCTCAAGGTTATCT 

GCTTGATTTAAATCAAATTG CAGTTAATAAAGACAAGAAGAAAACTTATG 
AGAAACTTTTTGGAAAAGTAAAAGAG 

SEQ ID NO. 5309 
STRAIN CJB110 

AAATACTTTGAAAAAAGAATTAGTTGAAGCTAAAAAGACAATTC 

TAAAAGCTTCAAAAGTACCGCAAAAATCAACATCATCGAAAGAT 

TTTGTTCTTAAACCGATTATCGATGTCTCTGGT^ 

GATTGATTACGATACGCTTTCAAAAAATATTTCAG 

TCTTTGGTGGATCAAAGATATCTAAGACTAATAACGC^ 

GGAATCX5ATAAATCGTTTAAQACC CAT ATCAAAGAATTTCAAAAGCGAAA 

TATCCCAGTAGCTOTCTACAGTTATGCACTTGGTTC^ 

TOAAAGAAGAGGCTCAGATATTTTATAAGAATGC^ 

ACTITTTATTGGATTGACGTAGAAGAGGAGACAAT^ 

AGGTGTCQUVGCATTCCGAAAAGAATTAAAAAGACTTGGTO 

TTGOTATCTACATTGGTACTTACTTTAT^ 

AAAGGATTTGACKXn , GTTT<3GATTCCA^ 
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CTATGAAGCGGCTCCGCAAACTCAACTTA^ 
CCTCTCAAGGTTATCTACCAGGATTC^TC^ 
ATTACAGTTAATAAAGACAAGAAGAAAACITATGAGAAACTTT^ 
AGTAAAAGAQ 

SEQ ID NO. 5310 
STRAIN 116 9NT 

ACAAATACTTTCAAAAAAGAATTACTTGAAG CTAAAAAGACAATTCC 
ATCCGTAAAAGCTTCAAAAGTACCGCAAAAATCAACATCATCGAAAGATA 
AAGAGTTTGTTCITAAACCGATTATCG^ CAACTTCCT 
AAGGAGATTGATTACGATACGCTTTCAAAAAAT^^ 

TCGTGTCTri^TGGATCAAAGATATCTAAGACTAATAACGCTGCTTATA 
CAACTGGAATCGATAAATCGTTTAAGACCCATATCAAAGAATTTCA^ 
CGAAATATCCXZAGTAGCTGTCTACAGTTATGCACTTGGTT(^^ 
AGAAATGAAAGAAGAGGCTCAGATATTTTATAAGAATGCAGCTCCTTACA 
AACCAACTTTTTATTGGATTGACGTAG AAG AG GAGACAATGTCT AACATG 
AATAAAGGTGTCCAAGC^TTCCGAAAAGAATTAAAAAGACTTG 
AAATGTTGGTATCTAC^TCGGTACTTACTTTATGACrGAG CAAGGTATCT 
CTGTAAAAGGATTTGACGCTGTTTG GATTCCAACTTATGGTAGCGATTCT 
GGATACT ATGAAG CAGCTCCGCAAACTGAACTTAAATACGATTTACACCA 
ATACACCTCTCAAGGTTATCTACCAGGATTCAA^ 

ATCAAATTG CAGTTAATAAAGACAAGAAGAAAACTTATGAGAAACTTTTT 
GGAAAAGTAAAAGAG 



SEQ ID HO. 5311 
STRAIN JM9130013 

AGAAATACTTTGAAAAAAGAATTAG 

TTGAAGCTAAAAAGACAATTCCATCCGTAAAAGCTTCAAAAGTACCGCAA 
AAATCAACATCATCGAAAGATAAAGAGTi"l^U-lX:-lTAAACCGATTATCGA 
TXSTCTCTGGTTGGCAACTTCCTAAGGAGATT^ 
AAAATATTTCAGGTGTTGTTATTCGTGTCTT^ 

AAGACTAATAACGCTGCITATACAACTGGAATCGATAAATCGTTTAAG^ 

CCATATGAAAGAATTTCAAAAG CGAAATATCCCAGTAGCTGTCTACAGTT 

ATGCACTTGGTTCAAGTGTTAAAGAAATGAAAGAAGAGGC 

TATAAGAATGCAGCTCCTTACAAACCAACTTTTTATTGGAT^ 

AGAGGAGACAATGTCTAACATG AATAAAGGTGTCCAAG CATTCCGAAAAG 

AATTAAAAAGACTTGGTGCTAAAAATGTTGGTATCTAC^ 

TTTATGACTGAGCAAGGCATCTCrGTAAAAGGACT 

TCCAACTTATGGTAGCGATT CTGGATACTATGAAGCGGCTCCGCAAACTG 
AACITAAATACGATTTACACCAA^ 
TTCAATCAACCXJCTTGATTTAAATCAA^ 
GAAAACTTATGAGAAACTTTTTGGAAAAGTAAAAGAG 

PRETTY ofs /biotmp/msa2 1441.2 {*} January 20, 2003 03:46 



m8a21441.2{206 090; 
msa21441.2{206 18RS21 
msa21441 . 2 ( 2l)6_2603 
msa21441 . 2 j 206_A909 
msa2 144 1 . 2 { 2 0 6_H3 6B 
maa21441 . 2 {206_JM913 0013 
msa21441 . 2 {206_CJB110 
msa21441.2(206_COHl 
msa21441 . 2 { 206_M732 
msa21441.2{206_M781 
maa21441 . 2 { 206_1169NT 
Consensus 



acAAATACTT 
acAAATACTT 
acAAATACTT 
acAAATACTT 
acAAATACTT 
acAAATACTT 
— AAATACTT 
acAAATACTT 
acAAATACTT 
acAAATACTT 
acAAATACTT 



TGAAAAAAGA 
TGAAAAAAGA 
TGAAAAAAGA 
TGAAAAAAGA 
TGAAAAAAGA 
TGAAAAAAGA 
TGAAAAAAGA 
TGAAAAAAGA 
TGAAAAAAGA 
TGAAAAAAGA 
TGAAAAAAGA 



ATTAGTTGAA 
ATTAGTTGAA 
ATTAGTTGAA 
ATTAGTTGAA 
ATTAGTTGAA 
ATTAGTTGAA 
ATTAGTTGAA 
ATTAGTTGAA 
ATTAGTTGAA 
ATTAGTTGAA 
ATTAGTTGAA 



GCTAAAAAGA 
GCTAAAAAGA 
GCTAAAAAGA 
GCTAAAAAGA 
GCTAAAAAGA 
GCTAAAAAGA 
GCTAAAAAGA 
GCTAAAAAGA 
GCTAAAAAGA 
GCTAAAAAGA 
GCTAAAAAGA 



50 

CAATTCCATC 
CAATTCCATC 
CAATTCCATC 
CAATTCCATC 
CAATTCCATC 
CAATTCCATC 
CAATTCCATC 
CAATTCCATC 
CAATTCCATC 
CAATTCCATC 
CAATTCCATC 



msa21441 . 2 {206_090 
msa2 1441 . 2 { 206_18RS21 
msa21441 . 2 [ 206_2603 
msa21441 . 2 { 206_A909 
msa21441.2(206_H36B 
msa21441.2{206_JM9130013 
msa21441 . 2 { 206_CJB110 
msa21441 . 2 ( 2 0 6_C0H1 
msa2 1441 . 2 { 206_M732 
tnsa21441 . 2 { 206_M7 81 
msa21441.2{206_1169NT 
Consensus 



51 

CGTAAAAGCT 
CGTAAAAGCT 
CGTAAAAGCT 
CGTAAAAGCT 
CGTAAAAGCT 
CGTAAAAGCT 
CGTAAAAGCT 
CGTAAAAGCT 
CGTAAAAGCT 
CGTAAAAGCT 
CGTAAAAGCT 



TCAAAAGTAC 
TCAAAAGTAC 
TCAAAAGTAC 
TCAAAAGTAC 
TCAAAAGTAC 
TCAAAAGTAC 
TCAAAAGTAC 
TCAAAAGTAC 
TCAAAAGTAC 
TCAAAAGTAC 
TCAAAAGTAC 



CGCAAAAATC 
CGCAAAAATC 
CGCAAAAATC 
CGCAAAAATC 
CGCAAAAATC 
CGCAAAAATC 
CGCAAAAATC 
CGCAAAAATC 
CGCAAAAATC 
CGCAAAAATC 
CGCAAAAATC 



AACATCATCG 
AACATCATCG 
AACATCATCG 
AACATCATCG 
AACATCATCG 
AACATCATCG 
AACATCATCG 
AACATCATCG 
AACATCATCG 
AACATCATCG 
AACATCATCG 



100 

AAAGATAAAG 
AAAGATAAAG 
AAAGATAAAG 
AAAGATAAAG 
AAAGATAAAG 
AAAGATAAAG 
AAAGATAAAG 
AAAGATAAAG 
AAAGATAAAG 
AAAGATAAAG 
AAAGATAAAG 



rasa21441 . 2 { 206_090 
msa21441 . 2 { 206_18RS21 
msa21441 . 2 ( 206_2603 
msa2 14 4 1 . 2 [ 2 0 6_A9 0 9 
tns a2 1 4 4 1 . 2 { 2 0 6_H3 6 B 
msa2144 1 . 2 { 2 06__JM913 0 0 13 
msa21441.2{206_CJB110 
rasa21441 . 2 (206_00H1 
msa21441.2{206_M732 



101 

AGTTTGTTCT 
AGTTTGTTCT 
AGTTTGTTCT 
A GTTTGTT CT 
AGTTTGTTCT 
AGTTTGTTCT 
AGTTTGTTCT 
A GTTTGTT CT 
A GTTTG T T CT 



TAAACCGATT 
TAAACCGATT 
TAAACCGATT 
TAAACCGATT 
TAAACCGATT 
TAAACCGATT 
TAAACCGATT 
TAAACCGATT 
TAAACCGATT 



ATCGATGTCT 
ATCGATGTCT 
ATCGATGTCT 
ATCGATGTCT 
ATCGATGTCT 
ATCGATGTCT 
ATCGATGTCT 
ATCGATGTCT 
ATCGATGTCT 



CTGGTTGGCA 
CTGGTTGGCA 
CTGGTTGGCA 
CTGGTTGGCA 
CTGGTTGGCA 
CTGGTTGGCA 
CTGGTTGGCA 
CTGGTTGGCA 
CTGGTTGGCA 



150 

ACTTCCTAAG 
ACTTCCTAAG 
ACTTCCTAAG 
ACTTCCTAAG 
ACTTCCTAAG 
ACTTCCTAAG 
ACTTCCTAAG 
ACTTCCTAAG 
ACTTCCTAAG 



874 



WO 2004/018646 



PCT/US2003/026827 



Table 53: Comparative Sequences relating to SAG 0755 



maa21441.2{206_M78l) AGTTTGTTCT TAAACCGATT ATCGATGTCT CTGGTTGGCA ACTTCCTAAG 
msa21441 . 2 { 206_1169NT) AGTTTGTTCT TAAACCGATT ATCGATGTCT CTGGTTGGCA ACTTCCTAAG 
Consensus ********** ********** ********** ********** ********** 



msa2 1441 . 2 { 206_090 
msa21441.2{206 18RS21 
msa21441. 2(206 2603 
msa21441.2{206~A909 
msa2 144 1 . 2 { 2 0 6_H3 6B 
msa21441 . 2 (206_JM9130013 
msa21441 . 2{206_CJB110 
msa21441 . 2 ( 206_COH1 
msa21441 . 2 <206_M732 
msa21441.2(206~M781 
msa21441.2(206_1169NT 
Consensus 



151 

GAGATTGATT 
GAGATTGATT 
GAGATTGATT 
GAGATTGATT 
GAGATTGATT 
GAGATTGATT 
GAGATTGATT 
GAGATTGATT 
GAGATTGATT 
GAGATTGATT 
GAGATTGATT 



ACGATACGCT 
ACGATACGCT 
ACGATACGCT 
ACGATACGCT 
ACGATACGCT 
ACGATACGCT 
ACGATACGCT 
ACGATACGCT 
ACGATACGCT 
ACGATACGCT 
ACGATACGCT 



TTCAAAAAAT 
TTCAAAAAAT 
TTCAAAAAAT 
TTCAAAAAAT 
TTCAAAAAAT 
TTCAAAAAAT 
TTCAAAAAAT 
TTCAAAAAAT 
TTCAAAAAAT 
TTCAAAAAAT 
TTCAAAAAAT 



ATTTCAGGTG 
ATTTCAGGTG 
ATTTCAGGTG 
ATTTCAGGTG 
ATTTCAGGTG 
ATTTCAGGTG 
ATTTCAGGTG 
ATTTCAGGTG 
ATTTCAGGTG 
ATTTCAGGTG 
ATTTCAGGTG 



200 

TTGTTATTCG 
TTGTTATTCG 
TTGTTATTCG 
TTGTTATTCG 
TTGTTATTCG 
TTGTTATTCG 
TTGTTATTCG 
TTGTTATTCG 
TTGTTATTCG 
TTGTTATTCG 
TTGTTATTCG 



msa21441.2{206_090! 
msa21441 . 2 { 206_18RS21 
msa21441.2{206_2603 ( 
msa21441 . 2 (206_A909 
msa2 144 1 . 2 { 2 06_H36B 
tnsa21441 . 2 { 206_JM9130013 
. msa21441 . 2 { 206__CJB110 
msa21441 . 2 { 206_COH1 
msa21441 . 2 { 206_M732 
msa21441 . 2 (206_M781 
msa21441.2{206_1169NT! 

Consensus 



201 

TgTCTTTGGT 
TgTCTTTGGT 
TgTCTTTGGT 
TgTCTTTGGT 
TgTCTTTGGT 
TgTCTTTGGT 
TgT CTTTG GT 
TaTCTTTGGT 
TaTCTTTGGT 
TaTCTTTGGT 
TgTCTTTGGT 



GGATCAAAGA 
GGATCAAAGA 
GGATCAAAGA 
GGATCAAAGA 
GGATCAAAGA 
GGATCAAAGA 
GGATCAAAGA 
GGATCAAAGA 
GGATCAAAGA 
GGATCAAAGA 
GGATCAAAGA 



TATCTAAGAC 
TATCTAAGAC 
TATCTAAGAC 
TATCTAAGAC 
TATCTAAGAC 
TATCTAAGAC 
TATCTAAGAC 
TATCTAAGAC 
TATCTAAGAC 
TATCTAAGAC 
TATCTAAGAC 



TAATAACGCT 
TAATAACGCT 
TAATAACGCT 
TAATAACGCT 
TAATAACGCT 
TAATAACGCT 
TAATAACGCT 
TAATAACGCT 
TAATAACGCT 
TAATAACGCT 
TAATAACGCT 



250 

GCTTATACAA 
GCTTATACAA 
GCTTATACAA 
GCTTATACAA 
GCTTATACAA 
GCTTATACAA 
GCTTATACAA 
GCTTATACAA 
GCTTATACAA 
GCTTATACAA 
GCTTATACAA 



*-* 



msa21441.2{206_090] 
msa21441.2{206 18RS21 
msa21441 . 2 ( 206_2603 
msa21441 . 2 1 206__A909 ' 
msa21441 . 2 { 206_H36B 
tnsa21441. 2 (206_JM9130013 ' 
msa21441 . 2{206__CJB110 
msa2l441. 2(206 COH1 
msa21441.2(206 M732 
msa21441 . 2 (206~M781 
msa21441 . 2{206_1169NT 
Consensus 



251 

CTGGAATCGA 
CTGGAATCGA 
CTGGAATCGA 
CTGGAATCGA 
CTGGAATCGA 
CTGGAATCGA 
CTGGAATCGA 
CTGGAATCGA 
CTGGAATCGA 
CTGGAATCGA 
CTGGAATCGA 



TAAATCGTTT 
TAAATCGTTT 
TAAATCGTTT 
TAAATCGTTT 
TAAATCGTTT 
TAAATCGTTT 
TAAATCGTTT 
TAAATCGTTT 
TAAATCGTTT 
TAAATCGTTT 
TAAATCGTTT 



AAGACCCATA 
AAGACCCATA 
AAGACCCATA 
AAGACCCATA 
AAGACCCATA 
AAGACCCATA 
AAGACCCATA 
AAGACCCATA 
AAGACCCATA 
AAGACCCATA 
AAGACCCATA 



TCAAAGAATT 
TCAAAGAATT 
TCAAAGAATT 
TCAAAGAATT 
TCAAAGAATT 
TCAAAGAATT 
TCAAAGAATT 
TCAAAGAATT 
TCAAAGAATT 
TCAAAGAATT 
TCAAAGAATT 



300 

TCAAAAGCGA 
TCAAAAGCGA 
TCAAAAGCGA 
TCAAAAGCGA 
TCAAAAGCGA 
TCAAAAGCGA 
TCAAAAGCGA 
TCAAAAGCGA 
TCAAAAGCGA 
TCAAAAGCGA 
TCAAAAGCGA 



msa21441.2{206_090 
msa21441 . 2 {206_18RS21 
msa21441-2(206_2603 
msa2 144 1 . 2 1 2 0 6_A9 09 
msa2 144 1.2{20 6_H3 6B 
msa2 144 1 . 2 { 2 0 6_tfM913 0 0 13 
msa21441 . 2 { 206_CJB110 
msa21441 . 2 { 206_COH1 
msa21441 . 2{206_M732 
msa21441.2{206_M7Bl 
rasa21441.2(206_1169NT j 
Consensus 



301 

AATATCCCAG 
AATATCCCAG 
AATATCCCAG 
AATATCCCAG 
AATATCCCAG 
AATATCCCAG 
AATATCCCAG 
AATATCCCAG 
AATATCCCAG 
AATATCCCAG 
AATATCCCAG 



TAGCTGTCTA 
TAGCTGTCTA 
TAGCTGTCTA 
TAGCTGTCTA 
TAGCTGTCTA 
TAGCTGTCTA 
TAGCTGTCTA 
TAGCTGTCTA 
TAGCTGTCTA 
TAGCTGTCTA 
TAGCTGTCTA 



CAGTTATGCA 
CAGTTATGCA 
CAGTTATGCA 
CAGTTATGCA 
CAGTTATGCA 
CAGTTATGCA 
CAGTTATGCA 
CAGTTATGCA 
CAGTTATGCA 
CAGTTATGCA 
CAGTTATGCA 



CTTGGTTCAA 
CTTGGTTCAA 
CTTGGTTCAA 
CTTGGTTCAA 
CTTGGTTCAA 
CTTG GT TCAA 
CTTGGTTCAA 
CTTGGTTCAA 
CTTGGTTCAA 
CTTGGTTCAA 
CTTGGTTCAA 



350 

GTGTTAAAGA 
GTGTTAAAGA 
GTGTTAAAGA 
GTGTTAAAGA 
GTGTTAAAGA 
GTGTTAAAGA 
GTGTTAAAGA 
GTGTTAAAGA 
GTGTTAAAGA 
GTGTTAAAGA 
GTGTTAAAGA 



msa21441 . 2 { 206_090 
msa21441.2{206 18RS21 
msa21441 . 2 (206_2603 
msa2 144 1 . 2 ( 2 0 6_A9 09 
msa21441 . 2 (206_H36B 
msa2 144 1 . 2 { 2 06_JM913 0 0 13 
msa21441 . 2 { 206_CJB110 
tnsa21441 . 2 (206_COH1 
msa21441 . 2 (206_M732 
msa21441 . 2 (206_M781 
msa21441 . 2 { 206_1169OT 
Consensus 



351 

AATGAAAGAA 
AATGAAAGAA 
AATGAAAGAA 
AATGAAAGAA 
AATGAAAGAA 
AATGAAAGAA 
AATGAAAGAA 
AATGAAAGAA 
AATGAAAGAA 
AATGAAAGAA 
AATGAAAGAA 



GAGGCTCAGA 
GAGGCTCAGA 
GAGGCTCAGA 
GAGGCTCAGA 
GAGGCTCAGA 
GAGGCTCAGA 
GAGGCTCAGA 
GAGGCTCAGA 
GAGGCTCAGA 
GAGGCTCAGA 
GAGGCTCAGA 



TATTTTATAA 
TATTTTATAA 
TATTTTATAA 
TATTTTATAA 
TATTTTATAA 
TATTTTATAA 
TATTTTATAA 
TATTTTATAA 
TATTTTATAA 
TATTTTATAA 
TATTTTATAA 



GAATGCAGCT 
GAATGCAGCT 
GAATGCAGCT 
GAATGCAGCT 
GAATGCAGCT 
GAATGCAGCT 
GAATGCAGCT 
GAATGCAGCT 
GAATGCAGCT 
GAATGCAGCT 
GAATGCAGCT 



400 

CCTTACAAAC 
CCTTACAAAC 
CCTTACAAAC 
CCTTACAAAC 
CCTTACAAAC 
CCTTACAAAC 
CCTTACAAAC 
CCTTACAAAC 
CCTTACAAAC 
CCTTACAAAC 
CCTTACAAAC 



tnaa21441.2{206_090 
msa21441.2{206_18RS21 
msa21441 .2 (206_2603 
msa21441.2i206_A909 
msa2144 1 . 2 { 206_H3 6B 
msa21441.2{206_JM9130013 
msa21441 . 2 { 206_CJB110 
msa2 1441.2(20 6_COHl 



401 

CAACTTTTTA 
CAACTTTTTA 
CAACTTTTTA 
CAA CTTTTTA 
CAACTTTTTA 
CAACTTTTTA 
CAACTTTTTA 
CAACTTTTTA 



TTGGATTGAC 
TTGGATTGAC 
TTGGATTGAC 
TTGGATTGAC 
TTGGATTGAC 
TTGGATTGAC 
TTGGATTGAC 
TTGGATTGAC 



GTAGAAGAGG 
GTAGAAGAGG 
GTAGAAGAGG 
GTAGAAGAGG 
GTAGAAGAGG 
GTAGAAGAGG 
GTAGAAGAGG 
GTAGAAGAGG 



AGACAATGTC 
AGACAATGTC 
AGACAATGTC 
AGACAATGTC 
AGACAATGTC 
AGACAATGTC 
AGACAATGTC 
AGACAATGTC 



450 

TAACATGAAT 
TAACATGAAT 
TAACATGAAT 
TAACATGAAT 
TAACATGAAT 
TAACATGAAT 
TAACATGAAT 
TAACATGAAT 



875 



WO 2004/018646 



PCT/US2003/026827 



Table 53: Comparative Sequences relating to SAG 0755 



msa21441.2(206_M732) CAACTTTTTA TTGGATTGAC GTAGAAGAGG AGACAATGTC TAACATGAAT 

msa21441.2(206_M78l) CAACTTTTTA TTGGATTGAC GTAGAAGAGG AGACAATGTC TAACATGAAT 

maa21441.2{206_1169NT} CAA CTTTTT A TTGGATTGAC GTAGAAGAGG AGACAATGTC TAACATGAAT 

Consensus ********** ********** ********** ********** ********** 



msa2144X . 2 { 206J590 
msa2144 1.2(2 06JL8RS2 1 
msa21441. 2(206 2603 
msa21441 . 2 ( 206^909 
msa21441.2(206__H36B 
msa21441.2(206_JM9130013 
msa2 14 4 1 . 2 { 2 0 6_CJB1 10 
msa21441.2(206 COH1 
msa21441 .2 (206~M732 
msa21441.2{206_M7Bl 
msa21441 . 2 (206_1169NT 
Consensus 



451 

AAAGGTGTCC 
AAAGGTGTCC 
AAAGGTGTCC 
AAAGGTGTCC 
AAAGGTGTCC 
AAAGGTGTCC 
AAAGGTGTCC 
AAAGGTGTCC 
AAAGGTGTCC 
AAAGGTGTCC 
AAAGGTGTCC 



AAGCATTCCG 
AAGCATTCCG 
AAGCATTCCG 
AAGCATTCCG 
AAGCATTCCG 
AAGCATTCCG 
AAGCATTCCG 
AAGCATTCCG 
AAGCATTCCG 
AAGCATTCCG 
AAGCATTCCG 



AAAAGAaTTA 
AAAAGAaTTA 
AAAAGAaTTA 
AAAAGAaTTA 
AAAAGAaTTA 
AAAAGAaTTA 
AAAAGAaTTA 
AAAAGAgTTA 
AAAAGAgTTA 
AAAAGAgTTA 
AAAAGAaTTA 



AAAAGACTTG 
AAAAGACTTG 
AAAAGACTTG 
AAAAGACTTG 
AAAAGACTTG 
AAAAGACTTG 
AAAAGACTTG 
AAAAGACTTG 
AAAAGACTTG 
AAAAGACTTG 
AAAAGACTTG 



500 

GtGCTAAAAA 
GtGCTAAAAA 
GtGCTAAAAA 
GtGCTAAAAA 
GtGCTAAAAA 
GtGCTAAAAA 
GtGCTAAAAA 
GtGCTAAAAA 
GtGCTAAAAA 
GtGCTAAAAA 
GcGCTAAAAA 



msa21441 . 2 { 206 J>90 ' 
msa21441 . 2 { 206_18RS21 
msa2 144 1 . 2 { 206_2603 
rasa21441. 2(206 A909 
rasa2 144 1 . 2 { 2 06~H3 6B 
msa21441.2(206_JM9130013 
msa21441 . 2 {206_CJB110 
msa21441. 2(206 COH1 
msa21441 . 2 ( 206~M732 
rasa21441.2(206_M781 
msa21441 . 2{206_1169NT 
Consensus 



501 

TGTTG GTATC 
TGTTGGTATC 
TGTTGGTATC 
TGTTGGTATC 
TGTTGGTATC 
TGTTGGTATC 
TGTTGGTATC 
TGTTGGTATC 
TGTTGGTATC 
TGTTGGTATC 
TGTTGGTATC 



TACATtGGTA 
TACATtGGTA 
TACATtGGTA 
TACATtGGTA 
TACATtGGTA 
TACATtGGTA 
TACATtGGTA 
TACATcGGTA 
TACATcGGTA 
TACATcGGTA 
TACATcGGTA 



CTTACTTTAT 
CTTACTTTAT 
CTTACTTTAT 
CTTACTTTAT 
CTTACTTTAT 
CTTACTTTAT 
CTTACTTTAT 
CTTACTTTAT 
CTTACTTTAT 
CTTACTTTAT 
CTTACTTTAT 



GACTGAGCAA 
GACTGAGCAA 
GACTGAGCAA 
GACTGAGCAA 
GACTGAGCAA 
GACTGAGCAA 
GACTGAGCAA 
GACTGAGCAA 
GACTGAGCAA 
GACTGAGCAA 
GACTGAGCAA 



550 

GGcATCTCTG 
GGcATCTCTG 
GGcATCTCTG 
GGcATCTCTG 
GGcATCTCTG 
GGcATCTCTG 
GGcATCTCTG 
GGtATCTCTG 
GGtATCTCTG 
GGtATCTCTG 
GGtATCTCTG 



msa21441 . 2 { 206_090; 
msa21441.2(206_18RS21 
msa21441 .2 (206J2603 ( 
msa2 144 1 . 2 ( 2 06__A9 0 9 
msa21441 . 2 { 206_H36B 
msa21441 . 2 { 206_JM9130013 
tnsa2 1441 . 2 { 2 0 6_CJB1 10 
msa21441 . 2 (206_COH1 
msa21441.2(206_M732 
msa2l441. 2(206 J4781 
msa21441 . 2 { 206_1169NT 
Consensus 



551 

TAAAAGGATT 
TAAAAGGATT 
TAAAAGGATT 
TAAAAGGATT 
TAAAAGGATT 
TAAAAGGATT 
TAAAAGGATT 
TAAAAGGATT 
TAAAAGGATT 
TAAAAGGATT 
TAAAAGGATT 



TGACGCTGTT 
TGACGCTGTT 
TGACGCTGTT 
TGACGCTGTT 
TGACGCTGTT 
TGACGCTGTT 
TGACGCTGTT 
TGACGCTGTT 
TGACGCTGTT 
TGACGCTGTT 
TGACGCTGTT 



TGGATTCCAA 
TGGATTCCAA 
TGGATTCCAA 
TGGATTCCAA 
TGGATTCCAA 
TGGATTCCAA 
TGGATTCCAA 
TGGATTCCAA 
TGGATTCCAA 
TGGATTCCAA 
TGGATTCCAA 



CTTATGGTAG 
CTTATGGTAG 
CTTATGGTAG 
CTTATGGTAG 
CTTATGGTAG 
CTTATGGTAG 
CTTATGGTAG 
CTTATGGTAG 
CTTATGGTAG 
CTTATGGTAG 
CTTATGGTAG 



600 

CGATTCTGGA 
CGATTCTGGA 
CGATTCTGGA 
CGATTCTGGA 
CGATTCTGGA 
CGATTCTGGA 
CGATTCTGGA 
CGATTCTGGA 
CGATTCTGGA 
CGATTCTGGA 
CGATTCTGGA 



msa21441.2{206 090 
msa21441. 2(206 18RS21 
msa21441.2(206_2603 
msa21441.2(206_A909 
msa2 1441 .2(2 06_H3 6B 
msa21441 . 2 {206_JM9130013 
msa21441. 2(206 CJB110 
msa21441. 2(206 COH1 
msa21441. 2(206 M732 
msa21441 . 2 ( 206_M781 
msa21441.2(206_1169NT 
Consensus 



601 

TACTATGAAG 
TACTATGAAG 
TACTATGAAG 
TACTATGAAG 
TACTATGAAG 
TACTATGAAG 
TACTATGAAG 
TACTATGAAG 
TACTATGAAG 
TACTATGAAG 
TACTATGAAG 



CgGCTCCgCA 
CgGCTCCgCA 
CgGCTCCgCA 
CgGCTCCgCA 
CgGCTCCgCA 
CgGCTCCgCA 
CgGCTCCgCA 
CaGCTCCaCA 
CaGCTCCaCA 
CaGCTCCaCA 
CaGCTCCgCA 



AACTGAACTT 
AACTGAACTT 
AACTGAACTT 
AACTGAACTT 
AACTGAACTT 
AACTGAACTT 
AACTGAACTT 
AACTGAACTT 
AACTGAACTT 
AACTGAACTT 
AACTGAACTT 



AAATACGATT 
AAATACGATT 
AAATACGATT 
AAATACGATT 
AAATACGATT 
AAATACGATT 
AAATACGATT 
AAATACGATT 
AAATACGATT 
AAATACGATT 
AAATACGATT 



650 

TACACCAATA 
TACACCAATA 
TACACCAATA 
TACACCAATA 
TACACCAATA 
TACACCAATA 
TACACCAATA 
TACACCAATA 
TACACCAATA 
TACACCAATA 
TACACCAATA 



msa21441.2{206_090; 
msa21441.2(206_18RS21 
msa21441 . 2 (206_2603 ' 
msa21441.2(206_A909 
msa21441 . 2 { 206_H3 6B 
maa21441-2{206 JM9130013 
msa21441.2(206 CJB110 
msa2 14 4 1 . 2 ( 206_COH1 
• tnsa21441.2 206_M732 
msa21441 . 2 (206_M781 
msa21441 . 2 (206_1169NT 
Consensus 



651 

CACCTCTCAA 
CACCTCTCAA 
CACCTCTCAA 
CACCTCTCAA 
CACCTCTCAA 
CACCTCTCAA 
CACCTCTCAA 
CACCTCTCAA 
CACCTCTCAA 
CACCTCTCAA 
CACCTCTCAA 



GGTTATCTAC 
GGTTATCTAC 
GGTTATCTAC 
GGTTATCTAC 
GGTTATCTAC 
GGTTATCTAC 
GGTTATCTAC 
GGTTATCTAC 
GGTTATCTAC 
GGTTATCTAC 
GGTTATCTAC 



CAGGAtTCAA 
CAGGAtTCAA 
CAGGAwTCAA 
CAGGAtTCAA 
CAGGAtTCAA 
CAGGAtTCAA 
CAGGAtTCAA 
CAGGAtTCAA 
CAGGAtTCAA 
CAGGAtTCAA 
CAGGAtTCAA 



TCAACCGCTT 
TCAACCGCTT 
TCAACCGCTT 
TCAACCGCTT 
TCAACCGCTT 
TCAACCGCTT 
TCAACCGCTT 
TCAACCGCTT 
TCAACCGCTT 
TCAACCGCTT 
TCAACCGCTT 



700 

GATTTAAATC 
GATTTAAATC 
GATTTAAATC 
GATTTAAATC 
GATTTAAATC 
GATTTAAATC 
GATTTAAATC 
GATTTAAATC 
GATTTAAATC 
GATTTAAATC 
GATTTAAATC 



msa21441 . 2 { 206_090 
msa21441.2(206 18RS21 
msa21441 . 2 ( 206_2603 
msa21441 .2 (206_A909 
msa2 144 1 . 2 { 206_H3 6B 
msa21441.2{206_JM9130013 
msa21441.2{206_CJB110 



701 

AAATTgCAGT 
AAATTgCAGT 
AAATTgCAGT 
AAATTgCAGT 
AAATTgCAGT 
AAATTgCAGT 
AAATTaCAGT 



TAATAAAGAC 
TAATAAAGAC 
TAATAAAGAC 
TAATAAAGAC 
TAATAAAGAC 
TAATAAAGAC 
TAATAAAGAC 



AAGAAGAAAA 
AAGAAGAAAA 
AAGAAGAAAA 
AAGAAGAAAA 
AAGAAGAAAA 
AAGAAGAAAA 
AAGAAGAAAA 



CTTATGAGAA 
CTTATGAGAA 
CTTATGAGAA 
CTTATGAGAA 
CTTATGAGAA 
CTTATGAGAA 
CTTATGAGAA 



750 

ACTTTTTGGA 
A CTTTTTGG A 
ACTTTTTGGA 
A CTTTTTG GA 
ACTTTTTGGA 
A CTTTTTGG A 
ACTTTTTGGA 



876 



WO 2004/018646 



PCT/US2003/026827 



Table 53: Comparative Sequences relating to SAG 0755 



msa2 144 1,2(2 06_COH1 
msa2 144 1 . 2 ( 2 06_M732 ' 
msa2 14 4 1 . 2 { 2 0 6_M7 B 1 
msa2144l.2{206_1169NT 
Consensus 



msa21441.2{206 090' 
ms a2 14 4 1 . 2 { 2 0 6JL8RS2 1 ' 
msa21441.2(206 2603' 
msa21441 .2(2063^909' 
msa21441.2{206_H36B 
msa21441 . 2 {206_JM9130013 
msa21441.2{206 CJB110 
msa21441.2(206 COH1 
msa21441 .2 (206J4732 
msa21441 . 2 { 206J4781 
msa21441 . 2 { 206_1169NT 
Consensus 



AAATTgCAGT TAATAAAGAC AAGAAGAAAA CTTATGAGAA ACTTTTTGGA 
AAATTgCAGT TAATAAAGAC AAGAAGAAAA CTTATGAGAA ACTTTTTGGA 
AAATTgCAGT TAATAAAGAC AAGAAGAAAA CTTATGAGAA A CTTTTT GGA 
AAATTgCAGT TAATAAAGAC AAGAAGAAAA CTTATGAGAA ACTTTTTGGA 



751 762 
AAAGTAAAAG AG 
AAAGTAAAAG AG 
AAAGTAAAAG AG 
AAAGTAAAAG AG 
AAAGTAAAAG AG 
AAAGTAAAAG AG 
AAAGTAAAAG AG 
AAAGTAAAAG AG 
AAAGTAAAAG AG 
AAAGTAAAAG AG 
AAAGTAAAAG AG 



SEQ IB NO. 5312 
STRAIN 2603 frame: 1 

TNTLKKELVEAKKTI PS VKASKVPQKSTS SKDKEFVLKP 

ISGWIRVPGGSKI SKTNNAAYTTGIDKSFKTHI KEFQKRNI PVAVYSYALGSSVKEMKE 

EAQIFYKNAAPYKPTFYWIDVEEETMSNMNKGVQAFRKELKJU^^ 

GISVKGFDAWIPTYGSDSGYYEAAPQTELKYDLHQYTS 

KKKTYEKLFGKVKE 

SEQ ZD NO. 5313 
STRAIN 090 frame: 1 

TNTLKKBLVEAKKT I PS VKASKVPQKSTS S KDKB FVLKP I IDVSGWQLPKEIDYDTLSKN 
I SGWI RVFGGSKI S KTNNAAYTTGI DKSFKTHI KEFQKRNI PVAVYS YALG SSVKEMKE 
KAQI FYKNAAPYKPT FYW I DVEEETMSNMNKGVQAFRKELKRLGAKNVG I YI GTYFMTEQ 
GI SVKGFDAVWI PTYGSDSG YYEAAPQTELKYDLHQYTSQGYLPGFNQPLDIjNQ I AVNKD 
KKKTYEKLFGKVKE 

SEQ XD NO. 5314 

STRAIN A909 frame: 1 

TNTLKKELVEAKKTIPSVKASKVPQKSTSSKDKEFVLKPI IDVSGWQLPKEIDYDTLSKN 
ISGWIRVFGGSKI SKTNNAAYTTGIDKS FKTHI KEFQKRNI PVAVYSYALGSSVKEMKE 
EAQI FYKNAAPYKPT FYWI DVEEBTMSNMNKGVCAFRKELKRLGAKNVGI YIGTYFMTEQ 
GI SVKGFDAVW I PTYGSDSG YYEAAPQTELKYDLHQYTSCGYLPGFNQPLDLNQ I AVNKD 
KKKTYEKLFGKVKE 

SEQ ID NO. 5315 
STRAIN H36B frame: 1 

TNTLKKBLVEAKKT I PS VKASKVPQKSTS SKDKEFVLKP I IDVSGWQLPKEIDYDTLSKN 
I SGWIRVFGGSKI SKTNNAAYTTGIDKSFKTHIKEFQKRNI PVAVYSYALGSSVKEMKE 
EAQI FYKNAAP YKPTFYWI DVEEETMSNMNKGVQAFRKELKRI/3AKNVG I YI GTYFMTEQ 
GISVKGFDAVWI PTYGSDSGYYEAAPQTELKYDLHQYTSQGYLPGFNQPIjDLNQIAVNKD 
KKKTYEKLFGKVKE 

SEQ ID NO. 5316 
STRAIN 18RS21 frame: 1 

TNTLKKBLVEAKKT I PS VKASKVPQKSTSSKDKEFVIiKP I ID 

ISGWIRVFGGSKI SKTNNAAYTTGIDKSFKTHI KEFQKRNI PVAVYSYALGSSVKEMKE 
EAQI FYKNAAPYKPT FYWIDVEEF/IWSNMNKGVQA 

GISVKGFDAVWI PTYGSDSGYYEAAPGTELKYDIiHQYTSQGYLPGFNQPLDLNQI AVNKD 
KKKTYEKLFGKVKE 

SEQ ID NO. 5317 
STRAIN M732 frame: 1 

TNTLKKELVEAKKTI PS VKASKVPQKSTS SKDKEFVLKP I IDVSGWQLPKEIDYDTLSKN 
I SGWIRI FGGSKI SKTNNAAYTTGIDKSFKTHI KEFQKRNI PVAVYSYALGSSVKEMKE 
EAQI FYKNAAPYKPT FYW I DVEEBTMSNMNKGVQAFP 

GI SVKGFDAVWI PTyGSDSGYYEAAPQTELKYDLHQYTSQGYLPGFNQPLDLNQI AVNKD 
KKKTYEKLFGKVKE 

SEQ ZD NO. 5318 
STRAIN COH1 frame: 1 

TNTLKKELVEAKKTI PSVKASKVPQKSTSSKDKEFVLKPI IDVSGWQLPKEIDYDTLSKN 
I SGWIRI FGGSKI SKTNNAAYTTGIDKSFKTHI KEFQKRNI PVAVYSYALGSSVKEMKE 
EAQ I FYKNAAP YKPTFYWI DVEEETMSNMNKGVQAFRKELKRLGAKNVG I Y I GTYFMTEQ 
GI SVKGFDAVWI PTYGSDSGYYEAAPQTELKYDI^Q^SCGYLPGFNQPI^IjNQIAVNKD 
KKKTYEKLFGKVKE 

SEQ XD NO. 5319 
STRAIN M781 frame: 1 

TNTLKKELVEAKKTI PSVKASKVPQKSTSSKDKEFVLKPI IDVSGWQLPKEIDYDTLSKN 
I SGWIRIFGGSKI SKTNNAAYTTGIDKSFKTHIKEFQKRNI PVAVYSYALGSSVKEMKE 
EAQI FYKNAAPYKPT FYWI DVBEETMSNMNKGVQAFRKE^ 

GISVKGFDAVWI PTYQ SDSG YYEAAPQTBLKYDLHQYTS QGYLPGFNQPLDLNQ IAVNKD 
KKKTYEKLFGKVKE 
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SEQ ID NO. 5320 
STRAIN CJB110 frame t 2 

NTLKKELVEAKKTI PSVKASKVPQKSTSSKDKEFVLKPI I DVSGWQLPKE I DYDTLSKNI 
SGWI RVFGGSKISKTNNAAYTTGIDKSFKTHI KEFQKRNI PVAVYS YALGSSVKEMKEE 
AQ I FYKNAAPYKPTFYW I DVEBETMSNMNKGVQAFRKELKRLGAKNVG I Y IGTYFMTEQG 
ISVKGFDAVWIPTYGSDSGYYEAAPQTELKYDIjHQYTSQ^YLPGFTCQPLDI^^ 
KKTYEKLFGKVKE 

SEQ IB NO. 5321 

STRAIN 1169NT frames 1 

TNTLKKELVEAKKTI PSVKASKVPQKSTSSKDKEFVLKPI IDVSGWQLPKEIDYDTtiSKN 
I SGWI RVFGGS KI SKTNNAAYTTG I DKSFKTHI KBFQKRN I PVAVYS YALG SSVKBMKE 
EAQI FYKNAAP YKPTFYWI DVEEBTMSNMNKGVQAPRKELKRLGAKNVG I Y IGTYFMTEQ 
GISVKGFDAVWI PTYGSDSGYYEAAPQTEI1KYDI1HQYTSQGYLPGFNQPLDLNQIAVNKD 
KKKTYBKLFGKVKB 



SEQ ID HO. 5322 

STRAIN JM9130013 frame: 1 

TNTLKKELVEAKKTI PS VKASKVPQKSTS S KDKE FVLKP I IDVSG WQLPKE I DYDTL SKN 
I SGWIRVFGGSKI SKTNNAAYTTGIDKSFKTHI KEFQKRNI PYAVYSYALGSSVKEMKE 
EAQ I FYKNAAPYKPTFYW I DVEEETMSNMNKGVQAFRKE^ 

GI SVKGFDAVWI PTYGSDSGYYEAAPQTELKYDLHQYTSQGYLPGFNQPI^I^QIAVNKD 
KKKTYEKLFGKVKE 

PRETTY oft /biotmp/msa21641.2{*} January 20, 2003 03i59 



msa21641.2{206_090; 
msa21641 . 2 { 206_1169NT 
msa2 1641 . 2 { 206_18RS2 1 
msa21641.2{206_2603 
msa21641.2{206_A909 
msa21641 . 2 {206_H36B 
msa21641.2{206_JM9130013 
msa2 164 1.2(2 06_COH1 
msa21641.2{206_M732 
msa21641 . 2 {206_M781 
msa21641 . 2 { 206_CJB110 
Consensus 



msa21641.2{206_090; 
msa21641.2(206_1169NT 
msa21641.2{206_18RS2l' 
msa21641.2f206_2603 
msa21641.2(206_A909 
msa2 164 1 . 2 { 2 0 6_H3 6B 
msa21641.2{206_JM9130013 
msa21641.2(206_COHl 
msa21641.2{206_M732 
msa21641 . 2 {206_M781 
msa21641 . 2 { 206_GJB110 
Consensus 



tNTLKKELVE 
tNTLKKELVE 
tNTLKKELVB 
tNTLKKELVE 
tNTLKKELVE 
tNTLKKELVE 
tNTLKKELVE 
tNTLKKELVE 
tNTLKKELVE 
tNTLKKELVE 
-NTLKKELVE 
_********* 

51 

EIDYDTLSKN 
EIDYDTLSKN 
EIDYDTLSKN 
EIDYDTLSKN 
EIDYDTLSKN 
EIDYDTLSKN 
EIDYDTLSKN 
EIDYDTLSKN 
EIDYDTLSKN 
EIDYDTLSKN 
EIDYDTLSKN 



AKKTIPSVKA 
AKKTIPSVKA 
AKKTIPSVKA 
AKKTIPSVKA 
AKKTIPSVKA 
AKKTIPSVKA 
AKKTIPSVKA 
AKKTIPSVKA 
AKKTIPSVKA 
AKKTIPSVKA 
AKKTIPSVKA 
********** 



SKVPQKSTSS 
SKVPQKSTSS 
SKVPQKSTSS 
SKVPQKSTSS 
SKVPQKSTSS 
SKVPQKSTSS 
SKVPQKSTSS 
SKVPQKSTSS 
SKVPQKSTSS 
SKVPQKSTSS 
SKVPQKSTSS 



KDKE FVLKP I 
KDKE FVLKP I 
KDKEFVLKPI 
KDKE FVLKP I 
KDKEFVLKPI 
KDKEFVLKPI 
KDKEFVLKPI 
KDKEFVLKPI 
KDKEFVLKPI 
KDKEFVLKPI 
KDKEFVLKPI 
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IDVSGWQLPK 
IDVSGWQLPK 
IDVSGWQLPK 
IDVSGWQLPK 
IDVSGWQLPK 
IDVSGWQLPK 
IDVSGWQLPK 
IDVSGWQLPK 
IDVSGWQLPK 
IDVSGWQLPK 
IDVSGWQLPK 



********** ********** ********** 



ISGWIRvFq 
ISGWTRvFG 
ISGWIRvFG 
ISGWIRvFG 
ISGWIRvFG 
ISGWIRvFG 
ISGWIRvFG 
ISGWIR1FG 
ISGWIR1PG 
ISGWIRiFG 
ISGWIRvFG 



GSKISKTNNA 
GSKISKTNNA 
GSKISKTNNA 
GSKISKTNNA 
GSKISKTNNA 



GSKISKTNNA 
GSKISKTNNA 
GSKISKTNNA 
GSKISKTNNA 
GSKISKTNNA 



AYTTGIDKSF 
AYTTGIDKSF 
AYTTGIDKSF 
AYTTGIDKSF 
AYTTGIDKSF 
AYTTGIDKSF 
AYTTGIDKSF 
AYTTGIDKSF 
AYTTGIDKSF 
AYTTGIDKSF 
AYTTGIDKSF 



100 

KTHIKEFQKR 
KTHIKEFQKR 
KTHIKEFQKR 
KTHIKEFQKR 
KTHIKEFQKR 
KTHIKEFQKR 
KTHIKEFQKR 
KTHIKEFQKR 
KTHIKEFQKR 
KTHIKEFQKR 
KTHIKEFQKR 



msa21641 . 2 { 206_0 90 ' 
msa21641 . 2 f 206_1169NT; 
msa21641 . 2 { 206_18RS21 
msa2 164 1 . 2 ( 206_2 603 
msa2 164 1.2(2 06_A909 
msa21641.2{206_H36B 
msa21641.2{206 JM9130013 
. msa21641.2(206_COHl 
msa21641 . 2 f206_M732 
msa21641.2{206_M7Bl 
msa21641.2{206_CJB110 
Consensus 



101 

NIPVAVYSYA 
N I PVAVYS YA 
NIPVAVYSYA 
NIPVAVYSYA 
NIPVAVYSYA 
NIPVAVYSYA 
NIPVAVYSYA 
NIPVAVYSYA 
NIPVAVYSYA 
NIPVAVYSYA 
NIPVAVYSYA 



LGSSVKEMKB 
LGSSVKEMKE 
LGSSVKEMKB 
LGSSVKEMKB 
LGSSVKEMKB 
LGSSVKEMKE 
LGSSVKEMKB 
LGSSVKEMKB 
LGSSVKEMKB 
LGSSVKEMKE 
LGSSVKEMKE 



EAQIFYKNAA 
EAQIFYKNAA 
EAQIFYKNAA 
EAQIFYKNAA 
EAQIFYKNAA 
EAQIFYKNAA 
EAQIFYKNAA 
EAQIFYKNAA 
EAQIFYKNAA 
EAQIFYKNAA 
EAQIFYKNAA 



PYKPTFYWID 
PYKPTFYWID 
PYKPTFYWID 
PYKPTFYWID 
PYKPTFYWID 
PYKPTFYWID 
PYKPTFYWID 
PYKPTFYWID 
PYKPTFYWID 
PYKPTFYWID 
PYKPTFYWID 



150 

VEEETMSNMN 
VBBETMSNMN 
VEEETMSNMN 
VEEETMSNMN 
VEEETMSNMN 
VEEETMSNMN 
VEEETMSNMN 
VEEETMSNMN 
VEEETMSNMN 
VEEETMSNMN 
VEEETMSNMN 



msa21641.2{206_090 
msa21641 . 2 f 206_1169NT 
msa21641.2{206_18RS21 
maa21641 . 2 ( 206_2603 
msa21641.2(206_A909 
msa21641.2{206 H36B 
msa21641 . 2 {206_JM9130013 
msa2 164 1 . 2 f 2 0 6_COHl 
msa21641 . 2f 206_M732 
msa2 1 64 1 . 2 { 2 06_M7 8 1 
msa21641 . 2 { 206_CJB110 
Consensus 



151 

KGVQAFRKEL 
KGVQAFRKEL 
KGVQAFRKEL 
KGVQAFRKEL 
KGVQAFRKEL 
KGVQAFRKEL 
KGVQAFRKEL 
KGVQAFRKEL 
KGVQAFRKEL 
KGVQAFRKEL 
KGVQAFRKEL 



KRLGAKNVGI 
KRLGAKNVGI 
KRLGAKNVGI 
KRLGAKNVGI 
KRLGAKNVGI 
KRLGAKNVGI 
KRLGAKNVGI 
KRLGAKNVGI 
KRLGAKNVGI 
KRLGAKNVGI 
KRLGAKNVGI 



YIGTYFMTEQ 
YIGTYFMTEQ 
YIGTYFMTEQ 
YIGTYFMTEQ 
YIGTYFMTEQ 
YIGTYFMTEQ 
YIGTYFMTEQ 
YIGTYFMTEQ 
YIGTYFMTEQ 
YIGTYFMTEQ 
YIGTYFMTEQ 



GISVKGFDAV 
GISVKGFDAV 
GISVKGFDAV 
GISVKGFDAV 
GISVKGFDAV 
GISVKGFDAV 
GISVKGFDAV 
GISVKGFDAV 
GISVKGFDAV 
GISVKGFDAV 
GISVKGFDAV 



200 

WIPTYGSDSG 
WIPTYGSDSG 
WIPTYGSDSG 
WIPTYGSDSG 
WIPTYGSDSG 
WIPTYGSDSG 
WIPTYGSDSG 
WIPTYGSDSG 
WIPTYGSDSG 
WIPTYGSDSG 
WIPTYGSDSG 
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msa21641.2{206_090 
msa21641.2{206_1169NT 
msa21641 . 2 {206_1BRS21 
msa21641.2(206_2603 
msa2l641. 2(206 A909 
msa21641 . 2{206~H36B 
msa21641.2{206 JM9130013 
msa21641.2~{206_COHl 
msa21641 . 2 f 206_M732 
msa21641.2{206_M781 
msa21641 . 2 { 206_CJB110 
Consensus 



201 

YYEAAPQTEL 
YYEAAPQTEIi 
YYEAAPQTEL 
YYEAAPQTEL 
YYEAAPQTEL 
YYEAAPQTEL 
YYEAAPQTEL 
YYEAAPQTEL 
YYEAAPQTEL 
YYEAAPQTEL 
YYEAAPQTEL 



KYDLHQYTSQ 
KYDLHQYTSQ 
KYDLHQYTSQ 
KYDLHQYTSQ 
KYDLHQYTSQ 
KYDLHQYTSQ 
KYDLHQYTSQ 
KYDLHQYTSQ 
KYDLHQYTSQ 
KYDLHQYTSQ 
KYDLHQYTSQ 



GYLPGfNQPL 
GYLPGfNQPL 
GYLPGfNQPL 
GYLPGxNQPL 
GYLPGfNQPL 
GYLPGfNQPL 
GYLPGfNQPL 
GYLPGfNQPL 
GYLPGfNQPL 
GYLPGfNQPL 
GYLPGfNQPL 



DLNQIaVNKD 
DLNQIaVNKD 
DLNQIaVNKD 
DLNQIaVNKD 
DLNQIaVNKD 
DLNQIaVNKD 
DLNQIaVNKD 
DLNQIaVNKD 
DLNQIaVNKD 
DLNQIaVNKD 
DLNQItVNKD 



250 

KKKTYEKLFG 
KKKTYEKLPG 
KKKTYEKLFG 
KKKTYEKLFG 
KKKTYEKLFG 
KKKTYEKLFG 
KKKTYEKLFG 
KKKTYEKLFG 
KKKTYEKLFG 
KKKTYEKLFG 
KKKTYEKLFG 



msa21641 . 2 { 206_090 
msa21641 ^^oe^liegNT 1 
msa21641.2{206_lBRS21 
msa21641.2f 206_2603 
msa21641.2{206_A909' 
msa21641 . 2 (206_H36B 
msa21641.2{206_JM9130013 
msa2l641 .2 { 206_COH1 
msa21641.2(206_M732 
msa21641 . 2 { 206_M7 Bl 
msa21641 . 2 {206_CJB110 
Consensus 



251 

KVKE 

KVKE 

KVKE 

KVKE 

KVKE 

KVKE 

KVKE 

KVKE 

KVKE 

KVKE 

KVKE 

*** + 
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SEQ ID NO. 5401 
STRAIN 2603 

TTGACTCACAAAAATATATTATTAAC^TTATATTTGGATTATTT 

ATGATTATATTATCAGCATGTGGTATGTCTAATAAGGJ^ 

GAACATTATCAAAAGGAAAAGAAAATTACTATTGGATTT^ 

GGATTTGAAAGTCGTTCIXK3TGACTATACCGG CTTTC CTAATG CTGTT 

TTTAAAGAATACKSGTATTTCAGTGAAATGGCAGCC^ 

GAACTTAATAATGGTAATATAGACCTITATTTGGAATGGTTATO CAGAACGT 

GCTAAAAAAGTCGCTTTTACAAACCCATATATGAATAATCATCAAGTAATTGTTA 

ACTTCATC^CATATTAATAGTATTAAGGATATGAAGGGGAAAAAACT 

GG1TCATCTGGTTTTGATGCTTTTAACGCTAAACCT 

GGAAAAGAAGCAGTTCAATAGGATACTTTCACTCAGGC^ 

CGTATTGATGGTCTTTTGATTGATGAAGTTTATGCTAACTA 

AATATAAAAGCTTATTATTTTGTTAAAACTGCTTATGAAGGAG 

GCTCGTAAAGTTGATCGTAGACTAATTGAAAAGATTA^ 

AATAAGGGGAGATTT CAAAAAATCTCTTACAAATGGTTTGGTGAAGATC 

GAA 

SEQ ID NO. 5402 

STRAIN 090 

ATTGGGaACATTATC 

AAAAGGAAAAGAAAATTACTATTGGATTTGATAATACTTTTG 

GGATTTGAAAGCGGTTCTGGTGACTAtACCGGCTTT^ 

TAATGCTGTTT1TAAAGAATACGGTATTTCAGTGAAA 

ACTGGGATATGAAAGAAACTGAACTTAATAATGGTAATATAG 

TGGAATGGTTATTCAAAAACGGCAGAACGTGCTAAAAAAGT CGu r 

AAACCCATATATGAATAATCATCAAGTAATTGTTACrAAAAC^ 

ATATTAATAGTATTAAGGATATGAAGGGGAAAAAACTAGGAGCCCAGTCG 

GGTTCATCTGGTTTTGATGCTTTTAA^ 

GTTTGTAAAAGGAAAAGAAGCAGTTC^TACGATACTTTCACTCAG^ 

TGATTGATTTAAAAAATAACCGTATTGATGGTCTTTTGATT^ 

TATGCTAACTATTATTTAAAGCAAGAAGGAAATATAAAAGCTTATTATTT 

TGTTAAAACTGCTTATCAAGGAGAAAATTTTGTAGTAGGAGCT 

TTGATCGTAGACTAATTGAAAAGATTAACAAAGCT TTCT 

AATAAGGGAAAATTTCAAAAAATCTCTrAOVAATGGT^ 

TTATAGTAAAGAA 

SSQ ID NO. 5403 
STRAIN A909 

ATTGGG 

aACATTATCAAAAGGAAAAGAAAATTACTATTGGATTT^ 

GTTCCTATGGGATTTGAAAGTCXJrTCTGGTGACrATA 

TGATTTAGCT AATGCTGTTTTTAAAGAATACGGTA^ C 

AGCCTATTAACTGGGATAtgAAAGAAACTGAACTTAATAATGOT 

GACCTTATTTGGAATGGTTATTCAAAAACGGCAGAACGTG CTA 

CGCTTTTACAAACCCATATATGAATAATCATCAAGTAATTGTTAC^ 

CTTCATCACATATTAATAGTATTAAGGATATGAAGGGGAAAAAACTAGGA 

GCCCAGTOGGGTTCATCTGGTTTTGATGCTTO 

TTTAAAAAAGTTTGTAAAAGGAAAAGAAGCAG bTCAATACGATACTTTCA 
CTCAGGCTTTGATTGATTTAAAAAATAACC^ 

GATGAAGTTTATGCTAACTATTATTTAAAGCAAGAAGGAAATATAAAAGC 
TTATTATTTTGTTAAAACTGCTTATCAAGGAGAAA^ 
CTCGTAAAGTTGAT CGTAGACTAATTGAAAAGATTAACMAGCTTTCA^ 
0«XrrrCATAATAAGGGGAGATTTCAAAAAATCfC^ 
TGAAGATGTTTATAGTAAAGaA 

SEQ ID NO. 5404 

STRAIN H36B 

ATTGGGAACATTATCAAAAGGAAAAGAAAATTACTATTGGATT 

TGATAATAC" riU " l\j TT C CTATGGGATTTGA AA^ 

CCXaGCTTTGATATTGATTTAGCTAAl^ 

TCAGTGAAATGG CAGCCTATTAACTGGGATAT^ 

TAATGGTAATATAGACCTTATTTGGAA 

GTGCTAAAAAAGTCG CTTTTACAAACCCATATATGAATAATCATCAAGTA 

ATTGTTACTAAAACTTCATCACATATTA 

GAAAAAACTAGGAGCCCAGTCGGGTTCATCTGGTTTTGATC 

CTAAACXTGATATTT^AAAAAAGTTTGTAAAAGGAAAAGA^ CAG tTCAA 

TACGATACTTTCACTCaVGGCTTTGATTGATTTA 

TGGTCTTTTGATTGATGAAGTtTATGCTAACTAT^ 

GAAATATAAAAGCTTATTATTTTGTTAAAACTX-^^ 

TITGTAGTAGGAGCTCGTAAAGTTGATCGTAGACTAATTGA 

CAAAGCTTTCAAACAGCTTCATAATAAGGGGAGATT^ 

ACAAATGGTTTGGTGAAGATGTTTATAGTAAAGAA 

SEQ ID NO. 5405 

STRAIN 18RS21 

ATTGGGAACATTA 

TCAAAAGQAAAAQAAAATTACTATTGGATTTGAT AA 

TGGGATTTGLAAAGTCGTTCTGGTGACTAtACCGG 

GCTAATGCTGTTTTTAAAGAATACGGTATTTCAGTG 

TAACTGGGATATGAAAGAAACTGAACTTAATAATGGTAATAT 

TTTGGAATGGTTATTCAAAAACGGCAGAACGTG CTAA AA 

ACAAACCCATATATGAATAATGATCAAGTAATTGTT^ 
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ACAT ATTAATAGTATTAAGGAT ATGAAGGGGAAAAAACTAGG AG CCCAGT 
CGGGTTCATCTGGTTTTGATGCTTTTAACX3 CT AAACCTGATATTTT AAAA 
AAGTTTGTAAAAGGAAAAGAAGCAGTTCAATACGATACTTTCA 
TTTGATTGATTTAAAAAATAACCGTATTGATGGT 

TTTATGCTAACTATTATTT AAAGCA^ AAGGAAATATAAAAG CTTATTAT 
TTTGTTAAAACTG CTTATCAAGGAGAAAATTTTGTAGTAGGAGCTC GTAA 
AGTTGATCGTAGACTAATTGAAAAGATXAACAAAGCTTC 
ATAATAAGGGGAGATTTCAAAAAATCTCn^ACAAATGGTTTG 
GTTTATAGTAAAGAA 

SEQ ZD NO. 5406 
STRAIN M732 

ATTGGGAACATTATCAAAAGGAAAAGAAAATTACTATTGGAT^ 

TACTTTTGTTCCTATGGGATTTGAAAGTCGTTCT 

TTGATATTGATTTAGCTAATGCTGTTTT^ 

AAATGGCAGCCTATTAACTGGGATATGAAAGAAACIXSAACI^ 

TAATATAGACCTTATTTGGAATGGTTATTCA^ 

AAAAAGTCX3CTTTTACAAACCCATATATGAA 

ACTAAAACTTC^TCACATATTAATAGTATTAAGGATATGAAGGGGAAAAA 
ACTAGGAGCCCAGTCC4GGTTCATCTGGTTTT^ 
CIK3ATATTTTAAAAAAGTTTC4TAAAAGGA 
ACITTCACTCAGGCTTTGATTGATT^ 

TTTG ATTGATGAAGTTTATG CT AACTATTATTTAAAGCAAGAAGGAAAT A 

TAAAAGCTTATTATTTTGTTAAAACTGCITO 

GTAGGAGCTCGTAAAGTTGATCGTAGACTAATTGAAAAGATTA^ 

TTTCAAACAGCTTCATAATAAGGGGAGATTTCAAAAAATCT 

GGTTTGGTGAAGATGTTTATAGTAAAGAA 

SEQ ZD NO. 5407 

STRAIN COH1 

ATTGGGAACATTATCAAAAGGAAAAGAAAATTACTATTGGA 

TTGATATTGATTTAGCTAATGCTGTTTT^ 

AAATGGCAGCCTATTAACTGGGATATGAAAGAAAC^ 

TAATATAGACCTTATTTGCAATGGTTATTCAAAAACGG 

AAAAAGTCGCITTTACAAACXX1ATATATGAATAATCA 

ACTAAAACTTCATCACATATTAATAGTATTAAGG1ATATGAAG 

ACTAGGAGCCCAGTCX3GGTTCATCTGGTTTTGATGC"r 

CTGATATTTTAAAAAAGTTTGTAAAAGGAAAAGAA^ 

ACTTTCACTCAGGCTTTGATTGATTTAA 

TTTGATTGATGAAGTTTATG CTAACrATTATTTAAAGCAAGAAGGAAAT A 

TAAAAGCITATTATTTTGTTAAAACIG 

GTAGGAGCTCGTAAAGTTGATCGTAGACTAAT^ 

TTTCAAACAGCTTCATAATAAGGGGAGATTTCA 

GGTTTGGTGAAGATGTTTATAGTAAAGAA 

SEQ ZD NO. 5408 
STRAIN M781 

ATTGGGAACATTATCAAAAGGAAAAGAAAATTACTATTGGATT^ 

TTTGATATTGATIT AGCTAATG CTGTTTTT AAAGAAT ACXXH 1 ATTTCAGT 

GAAATGGCAGCCTATTAACTGGGATATGAAAGA 

GTAATATAGACCTTATTTGGAATCJGTTAT^ 

AAAAAAGTCGCTTTTACAAACCXTATATATGAAT^ 

TACTAAAACTTCATCACATATTAATAGTATTA 

AACTAGGAGCCCAGTCGGGTTCATCTGGTTTTGATGC^ 

CCTCATATTTTAAAAAAGTTTGTAAAAG 

TACTTTCACTCAGGCITTGATTGATTTA 

TTTTGATTGATGAAGTTTATGCTAACTATTATT^ 

ATAAAAGCTTATTATTTTGTTAAAACTGCTTATCAAGGAGAAAA 

AGTAGGAGCTCGTAAAGTTGATCGTAGACTAATTGAAA 

CTTTCAAACAGCTTCATAATAAGGGGAGATTTCAA 

TGGTTTGGTGAAGATGTTTATAGTAAAGaA 

SEQ ZD NO. 5409 
STRAIN CJB110 

ATTGGGAACATTATCAAAAGGAAAAGAAAATTACTATTGGATT^ 

ACTTTTGTTCCTATGGGATTTGAAAGTCGTTCT^^ 

TOATATTGATTTAGCTAATGCTGTTTTTAA 

AATGGCAGCCTATTAACTGGGATATGAAAGAAACTGAAC^ 

AATATAGACCITATTTGGAATGGTTATTC^ 

AAAAGTCXKTTTTTACAAACXXATATATGAATA 

CTAAAACTTCATCAGATATTAATAGTATTAAGGATATGAAGGG 

CTAGGAGrcCAGTCGGGTTC^VnrK3GTT^ CTTTTAACGCTAAACC 

TGATATTTTAAAAAAGTTTGTAAAAGGAAAAGAAGCAGTT^ 

CTTTCACTOWGGCTrTGATTGATTTAA 

TTQATTGATQAAGTTTATGC!TAACTATTATTTAAAG 

AAAAG CTTATTATTTTGTTAAAACTGCTTATCAAGG^ 

TAGGAGCrCGTAAAGTTGATCGTAGACrAATTOAAAA 

TTCAAACAGCTTCATAATAAGGGGAaATTTCAAA 

GTTTGGTGAAGATGTTTATAGTAAAGAA 

SEQ ZD NO. 5410 



881 



WO 2004/018646 



PCT/US2003/026827 



Table 54: C mparative Sequences relating to SAG0949 



STRAIN 1169NT 

ATTGGGAAC^TTATCAAAAGGAAAAGA 
TACTTTTGTTCCTATGGGATTTGAAAGTC^^ 
TTGATATTGATTTAGCTAATGCTGTTTTTAAAGAATA 
AAATGGCAGCCTATTAACTGGGATATGAAAGAAACTGAACT 
TAATATAGACCTTATTTGGAATGGTTATTCAAAAACGGCAGAACGTC 
AAAAAGTCG CTTTT ACAAACCCATATATGAAT AATCATC^AGTAATTGTT 
ACTAAAACTTCATCACATATTAATAGTATTAAGGATATaAAGGGGAAAAA 
ACTAGGAGCCCAGTCGGGTTCATCTGGriu-itlATGC-ril^rAATGCrAAAC 
CiraCATTTTAAAAAAGTTTGTAAAAGGAAAAGAA^ 
ACTTTCACT CAGGCTITGATTGATTTAAAAAATAACCGTATTGAT^ 
TTTGATTGATGAAGTTTATGCTAACTATTATTTAAA 
TAAAAGCTTATTATTTTGTT AAAACTG CTTATCAAGGAGAAAATTTTGTA 
. GTAGGAGCTCGCAAAGTTGATCGTAGACTAATTGAAAAGATTAA 
TTTCAAACAGCTTCATAATAAGGGGAAATTTCAAAAAAT CTCTTACAAAT 
GGTTTGGTGAAGATGTTTATAGTAAAGAA 



SBQ XD NO. 5411 
STRAIN OM9130013 

ATTGGGAACATTATC 

AAAAG<3AAAAOAAAATTACTATTGGATTTGATA^ 
GGATTTGAAAGTCXSTTCTGGTGACTAtACCGGCTTT^ 
TAATGCTGTTTTTAAAGAATACGGTATTTCAGTGAAAT^ 
ACTGG<3ATATGAAAGAAACTGAACTTAATAATGGTA 
TGGAATGGTTATTCAAAAACGG CAGAACGTGCTAAAAAAGTCGCTTTTAC 

AT ATT AATAGTATT AAGGATATGAAGGGGAAAAAACTAGGAG CCCAGTCG 
GGTTCATCTGGTTTTGATGCITTTA^ 

GTTTGTAAAAGGAAAAGAAGCAGTTCAATACGATACTTTCACT 

TGATTGATTTAAAAAATAACCXSTATTGATGGTC^ 

TATGCTAACTATTATTTAAAGCAAGAA GGAA ATATA 

TGTTAAAACTGCTTATCAAGGAGAAAATTTT 

TTGATCX3TAGACTAATTGAAAAGATTAACAAAGCTTTCA 

AATAAGGGGAGATTTCAAAAAATCTCTTACAAATGGTITGGTGA 

TTATAGTAAAGAA 

PRETTY of: /biotmp/msa39314 . 2 { *} February 18, 2003 11:01 



. nma39314 . 2 {225_18RS2i; 
msa39314.2f225_2603 
maa39314.2{225_A909 
mea3 93 14 . 2 { 225 jCJBl 1 0 
msa3 93 14 . 2 { 22 5JCOH1 
msa39314 . 2 (225_H36B 
msa39314.2{225_KM9130013 
msa3 93 14 . 2 { 22 5_M7 3 2 
msa39314 . 2 (225_M781 
tnsa39314.2{225_090 
msa39314.2{225_1169NT 
Consensus 



50 



ttgactcaca aaaatatatt attaaccatt atatttggat tatttatgat 



msa39314.2{225_18RS2i; 
msa39314.2{225_2603 ( 
msa39314 . 2 { 225_A909 
msa39314 .2 {225_CJB110 
msa3 93 14 . 2 { 2 2 5_C0H1 
msa3 93 14 . 2 { 225_H3 6B 
msa39314.2{225_KM9130013 
msa39314.2{225_M732 
msa39314.2{225_M781 
msa39314.2{225_090 
rnsa39314.2{225_1169NT 
Consensus 



51 



100 



tatattatca gcatgtggta tgtctaataa ggaaatggct ggtattgata 



msa39314 . 2 {225JL8RS21 
msa39314 . 2 { 225_2603 
msa39314.2{225_A909 
msa39314.2{225_CJB110 
msa39314. 2(225 COH1 
msa39314 . 2 {225 H36B 
msa39314.2(225 KM9130013 
msa39314 . 2 (225J4732 
tnsa39314 . 2{225_M781 
msa39314.2{225 090 
msa39314.2{225_1169NT 
Consensus 



msa39314.2{225_18RS2lJ 
msa39314 . 2 {225.2603 } 



101 

ATTGGGAACA 
ATTGGGAACA 
ATTGGGAACA 
ATTGGGAACA 
ATTGGGAACA 
ATTGGGAACA 
ATTGGGAACA 
ATTGGGAACA 
ATTGGGAACA 
ATTGGGAACA 
ATTGGGAACA 



TTATCAAAAG 
TTATCAAAAG 
TTATCAAAAG 
TTATCAAAAG 
TTATCAAAAG 
TTATCAAAAG 
TTATCAAAAG 
TTATCAAAAG 
TTATCAAAAG 
TTATCAAAAG 
TTATCAAAAG 



GAAAAGAAAA 
GAAAAGAAAA 
GAAAAGAAAA 
GAAAAGAAAA 
GAAAAGAAAA 
GAAAAGAAAA 
GAAAAGAAAA 
GAAAAGAAAA 
GAAAAGAAAA 
GAAAAGAAAA 
GAAAAGAAAA 



TTACTATTGG 
TTACTATTGG 
TTACTATTGG 
TTACTATTGG 
TTACTATTGG 
TTACTATTGG 
TTACTATTGG 
TTACTATTGG 
TTACTATTGG 
TTACTATTGG 
TTACTATTGG 



150 

ATTTGATAAT 
ATTTGATAAT 
ATTTGATAAT 
ATTTGATAAT 
ATTTGATAAT 
ATTTGATAAT 
ATTTGATAAT 
ATTTGATAAT 
ATTTGATAAT 
ATTTGATAAT 
ATTTGATAAT 



151 200 
A CTTTTQTT C CTATGGGATT TGAAAGtCGT TCTGGTGACT ATACCGGCTT 
A CTTTTGTT C CTATGGGATT TGAAAGtCGT TCTGGTGACT ATACCGGCTT 



882 



WO 2004/018646 



PCT/US2003/026827 



Table 54: Comparative Sequences relating to SAG0949 



m9a3 9314 . 2 { 22 5_A909 ' 
msa393 14 . 2 ( 225_CJB110 ' 
tnsa39314 . 2 { 225_00H1 ' 
ms a3 9 3 1 4 . 2 { 2 2 5_H3 6 B 
msa39314.2{225_KM9130013' 
msa3 9314 . 2 { 225_M732 
ms a3 9 3 1 4 . 2 { 2 2 5_M7 8 1 
msa3 9314 . 2 { 225__090 
msa3 93 14 . 2 { 2 2 5_1 16 9NT 
Consensus 



A CTTTTG TTC 
ACTTTTGTTC 
A CTTTTG TTC 
ACTTTTGTTC 
ACTTTTGTTC 
ACTTTTGTTC 
ACTTTTGTTC 
ACTTTTGTTC 
A CTTT T GT TC 
********** 



CTATGGGATT 
CTATGGGATT 
CTATGGGATT 
CTATGGGATT 
CTATGGGATT 
CTATGGGATT 
CTATGGGATT 
CTATGGGATT 
CTATGGGATT 
********** 



TGAAAGtCGT 
TGAAAGtCGT 
TGAAAGtCGT 
TGAAAGtCGT 
TGAAAGtCGT 
TGAAAGtCGT 
TGAAAGtCGT 
TGAAAGcCGT 
TGAAAGtCGT 



TCTGGTGACT 
TCTGGTGACT 
TCTGGTGACT 
TCTGGTGACT 
TCTGGTGACT 
TCTGGTGACT 
TCTGGTGACT 
TCTGGTGACT 
TCTGGTGACT 



ATACCGG CTT 
ATACCGGCTT 
ATACCGGCTT 
ATACCGGCTT 
ATACCGGCTT 
ATACCGGCTT 
ATACCGGCTT 
ATACCGGCTT 
ATACCGGCTT 



******_*** ********** ********** 



msa39314.2{225_18RS21 
msa39314 . 2 ( 225_2603 
msa3 93 14 . 2 { 2 25_A9 09 
msa393 14 . 2{225_CJB110 
msa3 9314 . 2 ( 2 2 5_COHl 
ms a3 93 14 . 2 { 2 2 5_H3 6B 
msa39314 . 2 {225_KM9130013 
msa39314.2{225_M732 
msa39314 . 2 (225_M781 
msa39314.2{225_090 
mea39314.2{225_1169NT 
Consensus 



201 

TGATATTGAT 
TGATATTGAT 
TGATATTGAT 
TGATATTGAT 
TGATATTGAT 
TGATATTGAT 
TGATATTGAT 
TGATATTGAT 
TGATATTGAT 
TGATATTGAT 
TGATATTGAT 



TTAGCTAATG 
TTAGCTAATG 
TTAGCTAATG 
TTAGCTAATG 
TTAGCTAATG 
TTAGCTAATG 
TTAGCTAATG 
TTAGCTAATG 
TTAGCTAATG 
TTAGCTAATG 
TTAGCTAATG 



CTGTTTTTAA 
CTGTTTTTAA 
CTGTTTTTAA 
CTGTTTTTAA 
CTGTTTTTA A 
CTGTTTTTAA 
CTGTTTTTAA 
CTGTTTTTAA 
CTGTTTTTAA 
CTGTTTTT AA 
CTGTTTTT AA 



AGAATACGGT 
AGAATACGGT 
AGAATACGGT 
AGAATACGGT 
AGAATACGGT 
AGAATACGGT 
AGAATACGGT 
AGAATACGGT 
AGAATACGGT 
AGAATACGGT 
AGAATACGGT 



250 

ATTTCAGTGA 
ATTTCAGTGA 
ATTTCAGTGA 
ATTTCAGTGA 
ATTTCAGTGA 
ATTTCAGTGA. 
ATTTCAGTGA 
ATTTCAGTGA 
ATTTCAGTGA 
ATTTCAGTGA 
ATTTCAGTGA 



msa3 93 14 . 2 { 225_18RS21 ' 
msa39314 . 2 { 225_2603 ' 
msa3 93 14 . 2 { 2 2 5_A9 0 9 ' 
msa3 9314 . 2 {225_CJB110 
msa3 9314. 2 { 2 2 5_COHl 
msa39314.2(225_H36B 
msa39314 . 2{225_KM9130013 
msa39314 . 2 {225_M732 
msa3 93 14 . 2 { 225_M7 8 1 
msa39314.2{225 090 
msa3 9314.2(22 5_1 169NT 
Consensus 



251 

AATGGCAGCC 
AATGGCAGCC 
AATGGCAGCC 
AATGGCAGCC 
AATGGCAGCC 
AATGGCAGCC 
AATGGCAGCC 
AATGGCAGCC 
AATGGCAGCC 
AATGGCAGCC 
AATGGCAGCC 



TATTAACTGG 
TATTAACTGG 
TATTAACTGG 
TATTAACTGG 
TATTAACTGG 
TATTAACTGG 
TATTAACTGG 
TATTAACTGG 
TATTAACTGG 
TATTAACTGG 
TATTAACTGG 



GATATGAAAG 
GATATGAAAG 
GATATGAAAG 
GATATGAAAG 
GATATGAAAG 
GATATGAAAG 
GATATGAAAG 
GATATGAAAG 
GATATGAAAG 
GATATGAAAG 
GATATGAAAG 



AAACTGAACT 
AAACTGAACT 
AAACTGAACT 
AAACTGAACT 
AAACTGAACT 
AAACTGAACT 
AAACTGAACT 
AAACTGAACT 
AAACTGAACT 
AAACTGAACT 
AAACTGAACT 



300 

tAATAATGGT 
tAATAATGGT 
tAATAATGGT 
tAATAATGGT 
tAATAATGGT 
tAATAATGGT 
tAATAATGGT 
tAATAATGGT 
tAATAATGGT 
tAATAATGGT 
CAATAATGGT 



msa3 93 14 . 2 { 22 5_1 8RS2 1 ] 
msa3 9 3 14 . 2 { 2 2 5_2 603 
msa39314 . 2 (225_A909 
msa39314.2{225 CJB110 
rasa39314 . 2 { 225_C0H1 
msa39314.2(225_H36B 
msa39314.2(225_KM9130013 
msa3 9314 . 2 { 225_M73 2 
msa39314.2{225__M781 
msa39314.2{225__090 
msa39314.2{225_1169NT 
Consensus 



301 

AATATAGACC 
AATATAGACC 
AATATAGACC 
AATATAGACC 
AATATAGACC 
AATATAGACC 
AATATAGACC 
AATATAGACC 
AATATAGACC 
AATATAGACC 
AATATAGACC 



TTATTTGGAA 
TTATTTGGAA 
TTATTTGGAA 
TTATTTGGAA 
TTATTTGGAA 
TTATTTGGAA 
TTATTTGGAA 
TTATTTGGAA 
TTATTTGGAA 
TTATTTGGAA 
TTATTTGGAA 



TGGTTATTCA 
TGGTTATTCA 
TGGTTATTCA 
TGGTTATTCA 
TGGTTATTCA 
TGGTTATTCA 
TGGTTATTCA 
TGGTTATTCA 
TGGTTATTCA 
TGGTTATTCA 
TGGTTATTCA 



AAAACGGCAG 
AAAACGGCAG 
AAAACGGCAG 
AAAACGGCAG 
AAAACGGCAG 
AAAACGGCAG 
AAAACGGCAG 
AAAACGGCAG 
AAAACGGCAG 
AAAACGGCAG 
AAAACGGCAG 



350 

AACGTGCTAA 
AACGTGCTAA 
AACGTGCTAA 
AACGTGCTAA 
AACGTGCTAA 
AACGTGCTAA 
AACGTGCTAA 
AACGTGCTAA 
AACGTGCTAA 
AACGTGCTAA 
AACGTGCTAA 



msa3 93 14 . 2 { 22 5_1 8RS2 1 j 
msa3 93 14 . 2 { 2 2 5_2 6 0 3 
msa39314 . 2 { 225_A909 . 
msa39314 .2{225_CJB110 
• msa39314.2{225jCOHl' 
msa39314.2(225_H36B 
msa39314.2{225_KM9130013 
ms a3 9 3 14 . 2 { 22 5J47 32 
msa3 93 14 . 2 { 22 5_M7 8 1 
msa3 93 14 . 2 { 225_090 
msa39314 . 2{225_1169NT 
Consensus 



351 

AAAAGTCGCT 
AAAAGTCGCT 
AAAAGTCGCT 
AAAAGTCGCT 
AAAAGTCGCT 
AAAAGTCGCT 
AAAAGTCGCT 
AAAAGTCGCT 
AAAAGTCGCT 
AAAAGTCGCT 
AAAAGTCGCT 



TTTACAAACC 
TTTACAAACC 
TTTACAAACC 
TTTACAAACC 
TTTA CAAACC 
TTTACAAACC 
TTTACAAACC 
TTTACAAACC 
TTTACAAACC 
TTTACAAACC 
TTTACAAACC 



CATATATGAA 
CATATATGAA 
CATATATGAA 
CATATATGAA 
CATATATGAA 
CATATATGAA 
CATATATGAA 
CATATATGAA 
CATATATGAA 
CATATATGAA 
CATATATGAA 



TAATCATCAA 
TAATCATCAA 
TAATCATCAA 
TAATCATCAA 
TAATCATCAA 
TAATCATCAA 
TAATCATCAA 
TAATCATCAA 
TAATCATCAA 
TAATCATCAA 
TAATCATCAA 



400 

GTAATTGTTA 
GTAATTGTTA 
GTAATTGTTA 
GTAATTGTTA 
GTAATTGTTA 
GTAATTGTTA 
GTAATTGTTA 
GTAATTGTTA 
GTAATTGTTA 
GTAATTGTTA 
GTAATTGTTA 



msa39314.2{225_18RS2i; 
msa39314.2{225_2603 
msa39314.2{225 A909 
msa39314. 2(225 CJB110 
msa39314.2{225 COH1 
msa3 93 14 . 2 { 2 25~H3 6B 
rasa3 93 14 . 2 { 2 2 5_KM913 00 1 3 
msa39314.2{225 M732 
cnsa39314.2{225 M781 
msa39314. 2(225^090 
msa39314.2{225_1169NT 
Consensus 



401 

CTAAAACTTC 
CTAAAACTTC 
CTAAAACTTC 
CTAAAACTTC 
CTAAAACTTC 
CTAAAACTTC 
CTAAAACTTC 
CTAAAACTTC 
CTAAAACTTC 
CTAAAACTTC 
CTAAAACTTC 



ATGACATATT 
ATCACATATT 
ATCACATATT 
ATCACATATT 
ATCACATATT 
ATCACATATT 
ATCACATATT 
ATCACATATT 
ATCACATATT 
ATCACATATT 
ATCACATATT 



AATAGTATTA 
AATAGTATTA 
AATAGTATTA 
AATAGTATTA 
AATAGTATTA 
AATAGTATTA 
AATAGTATTA 
AATAGTATTA 
AATAGTATTA 
AATAGTATTA 
AATAGTATTA 



AGGATATGAA 
AGGATATGAA 
AGGATATGAA 
AGGATATGAA 
AGGATATGAA 
AGGATATGAA 
AGGATATGAA 
AGGATATGAA 
AGGATATGAA 
AGGATATGAA 
AGGATATGAA 



450 

GGGGAAAAAA 
GGGGAAAAAA 
GGGGAAAAAA 
GGGGAAAAAA 
GGGGAAAAAA 
GGGGAAAAAA 
GGGGAAAAAA 
GGGGAAAAAA 
GGGGAAAAAA 
GGGGAAAAAA 
GGGGAAAAAA 



msa393 14 . 2 { 22 5_18RS21 } 



451 500 

CTAGGAGCCC AGTCGGGTTC ATCTGGTTTT GATGCTTTTA AcGCTAAACC 



883 



WO 2004/018646 



PCT/US2003/026827 



Table 54: Comparative Sequences relating to SAG0949 



msa39314.2{225_2603 
msa39314.2{225j\909 
msa39314.2{225_OJB110 
msa39314 . 2 (225_COHl 
msa39314 . 2 (225_H36B 
msa39314. 2(225 KM9130013 
rosa39314 . 2 f 225J4732 
msa39314.2(225_M781 
msa393 14 . 2 { 225_090 
msa39314.2{225_1169NT 
Consensus 



CTAGGAGCCC 
CTAGGAGCCC 
CTAGGAGCCC 
CTAGGAGCCC 
CTAGGAGCCC 
CTAGGAGCCC 
CTAGGAGCCC 
CTAGGAGCCC 
CTAGGAGCCC 
CTAGGAGCCC 
********** 



AGTCGGGTTC 
AGTCGGGTTC 
AGTCGGGTTC 
AGTCGGGTTC 
AGTCGGGTTC 
AGTCGGGTTC 
AGTCGGGTTC 
AGTCGGGTTC 
AGTCGGGTTC 
AGTCGGGTTC 
********** 



ATCTGGTTTT 
ATCTGGTTTT 
ATCTGGTTTT 
ATCTGGTTTT 
ATCTGGTTTT 
ATCTGGTTTT 
ATCTGGTTTT 
ATCTGGTTTT 
ATCTGGTTTT 
ATCTGGTTTT 
********** 



GATGCTTTTA 
GATGCTTTTA 
GATGCTTTTA 
GATGCTTTTA 
GATGCTTTTA 
GATGCTTTTA 
GATGCTTTTA 
GATGCTTTTA 
GATGCTTTTA 
GATGCTTTTA 
********** 



AcGCTAAACC 
AcGCTAAACC 
AcGCTAAACC 
AcGCTAAACC 
AcGCTAAACC 
AcGCTAAACC 
AcGCTAAACC 
AcGCTAAACC 
AtGCTAAACC 
AtGCTAAACC 
*_******** 



msa39314.2(225_18RS21 
ms a3 93 14 . 2 { 2 2 5_26 03 
msa39314 . 2 (225_A909 
msa393 14 . 2 { 225_CJB110 
msa3 93 14 . 2 f 2 25_COHl 
msa39314.2{225_H36B 
msa39314.2(225_KM9130013 
msa39314.2{225_M732 
msa39314.2(225_M781 
msa3 93 14 . 2 { 225_0 9 0 
* msa39314.2{225_1169NT 
Consensus 



501 

TGAtATTTTA 
TGAtATTTTA 
TGAtATTTTA 
TGAtATTTTA 
TGAtATTTTA 
TGAtATTTTA 
TGAtATTTTA 
TGAtATTTTA 
TGAtATTTTA 
TGAtATTTTA 
TGAcATTTTA 



AAAAAGTTTG 
AAAAAGTTTG 
AAAAAGTTTG 
AAAAAGTTTG 
AAAAAGTTTG 
AAAAAGTTTG 
AAAAA GTTT G 
AAAAAGTTTG 
AAAAAGTTTG 
AAAAAGTTTG 
AAAAAGTTTG 



TAAAAGGAAA 
TAAAAGGAAA 
TAAAAGGAAA 
TAAAAGGAAA 
TAAAAGGAAA 
TAAAAGGAAA 
TAAAAGGAAA 
TAAAAGGAAA 
TAAAAGGAAA 
TAAAAGGAAA 
TAAAAGGAAA 



AGAAGCAGTT 
AGAAGCAGTT 
AGAAGCAGTT 
AGAAGCAGTT 
AGAAGCAGTT 
AGAAGCAGTT 
AGAAGCAGTT 
AGAAGCAGTT 
AGAAGCAGTT 
AGAAGCAGTT 
AGAAGCAGTT 



550 

CAATACGATA 
CAATACGATA 
CAATACGATA 
CAATACGATA 
CAATACGATA 
CAATACGATA 
CAATACGATA 
CAATACGATA 
CAATACGATA 
CAATACGATA 
CAATACGATA 



msa39314.2{22S_18RS21 
msa39314.2(225_2603 
msa39314.2(225_A909 
msa39314.2{225_CJB110 
msa39314 . 2 (225_C0H1 
msa3 93 14 . 2 { 2 2 5JK3 6B 
msa39314.2{22S_KM9130013 
msa39314 . 2 (225_M732 
ms a3 9 3 14 . 2 { 2 2 5_M7 8 1 
msa3 93 14 . 2 { 22 5_090 
msa39314 . 2 { 225_1169NT 
Consensus 



551 

CTTTCACTCA 
CTTTCACTCA 
CTTTCACTCA 
CTTTCACTCA 
CTTTCACTCA 
CTTTCACTCA 
CTTTCACTCA 
CTTTCACTCA 
CTTTCACTCA 
CTTTCACTCA 
CTTTCACTCA 



GGCTTTGATT 
GGCTTTGATT 
GGCTTTGATT 
GGCTTTGATT 
GGCTTTGATT 
GGCTTTGATT 
GGCTTTGATT 
GGCTTTGATT 
GGCTTTGATT 
GGCTTTGATT 
GGCTTTGATT 



GATTTAAAAA 
GATTTAAAAA 
GATTTAAAAA 
GATTTAAAAA 
GATTTAAAAA 
GATTTAAAAA 
GATTTAAAAA 
GATTTAAAAA 
GATTTAAAAA 
GATTTAAAAA 
GATTTAAAAA 



ATAACOGTAT 
ATAACCGTAT 
ATAACCGTAT 
ATAACCGTAT 
ATAACCGTAT 
ATAACCGTAT 
ATAACCGTAT 
ATAACCGTAT 
ATAACOGTAT 
ATAACCGTAT 
ATAACCGTAT 



600 

TGATGGTCTT 
TGATGGTCTT 
TGATGGTCTT 
TGATGGTCTT 
TGATGGTCTT 
TGATGGTCTT 
TGATGGTCTT 
TGATGGTCTT 
TGATGGTCTT 
TGATGGTCTT 
TGATGGTCTT 



msa39314 . 2 { 225_18RS21 
msa39314 . 2 f 225_2603 ' 
msa39314.2{225_A909 
rosa39314.2{225jCJB110 
rasa39314 . 2 { 225_COHl 
raaa39314.2{225_H36B 
maa39314 . 2 (225_KM9130013 
msa39314.2(225_M732 
msa39314 . 2 { 225_M781 
rasa3 9314.2(22 5_0 9 0 
msa39314.2{225_1169NT 
Consensus 



601 

TTGATTGATG 
TTGATTGATG 
TTGATTGATG 
TTGATTGATG 
TTGATTGATG 
TTGATTGATG 
TTGATTGATG 
TTGATTGATG 
TTGATTGATG 
TTGATTGATG 
TTGATTGATG 



AAGTTTATGC 
AAGTTTATGC 
AAGTTTATGC 
AAGTTTATGC 
AAGTTTATGC 
AAGTTTATGC 
AAGTTTATGC 
AAGTTTATGC 
AAGTTTATGC 
AAGTTTATGC 
AAGTTTATGC 



TAACTATTAT 
TAACTATTAT 
TAACTATTAT 
TAACTATTAT 
TAACTATTAT 
TAACTATTAT 
TAACTATTAT 
TAACTATTAT 
TAACTATTAT 
TAACTATTAT 
TAACTATTAT 



TTAAAGCAAG 
TTAAAGCAAG 
TTAAAGCAAG 
TTAAAGCAAG 
TTAAAGCAAG 
TTAAAGCAAG 
TTAAAGCAAG 
TTAAAGCAAG 
TTAAAGCAAG 
TTAAAGCAAG 
TTAAAGCAAG 



650 

AAGGAAATAT 
AAGGAAATAT 
AAGGAAATAT 
AAGGAAATAT 
AAGGAAATAT 
AAGGAAATAT 
AAGGAAATAT 
AAGGAAATAT 
AAGGAAATAT 
AAGGAAATAT 
AAGGAAATAT 



msa39314 . 2 { 225_18RS21 ' 
msa39314.2{225_2603 
msa39314.2(225_A909 
msa393 14 . 2 { 225_CJB110 
ms a3 93 14 . 2 { 2 2 5_C0H1 
msa39314 . 2{225_H36B 
maa39314 . 2 {225_KM9130013 
msa39314 . 2 { 225_M732 
msa39314.2{225_M781 
msa39314.2{225_090 
msa39314.2{225_1169NT 
Consensus 



651 

AAAAGCTTAT 
AAAAGCTTAT 
AAAAGCTTAT 
AAAAGCTTAT 
AAAAGCTTAT 
AAAAGCTTAT 
AAAAGCTTAT 
AAAAGCTTAT 
AAAAGCTTAT 
AAAAGCTTAT 
AAAAGCTTAT 



TATTTTGTTA 
TATTTTGTTA 
TATTTTGTTA 
TATTTTGTTA 
TATTTTGTTA 
TATTTTGTTA 
TATTTTGTTA 
TATTTTGTTA 
TATTTTGTTA 
TATTTTGTTA 
TATTTTGTTA 



AAACTGCTTA 
AAACTGCTTA 
AAACTGCTTA 
AAACTGCTTA 
AAACTGCTTA 
AAACTGCTTA 
AAACTGCTTA 
AAACTGCTTA 
AAACTGCTTA 
AAACTGCTTA 
AAACTGCTTA 



TCAAGGAGAA 
TCAAGGAGAA 
TCAAGGAGAA 
TCAAGGAGAA 
TCAAGGAGAA 
TCAAGGAGAA 
TCAAGGAGAA 
TCAAGGAGAA 
TCAAGGAGAA 
TCAAGGAGAA 
TCAAGGAGAA 



700 

AATTTTGTAG 
AATTTTGTAG 
AATTTTGTAG 
AATTTTGTAG 
AATTTTGTAG 
AATTTTGTAG 
AATTTTGTAG 
AATTTTGTAG 
AATTTTGTAG 
AATTTTGTAG 
AATTTTGTAG 



msa39314. 2(225 18RS21; 
rasa39314 . 2 f 225_2603 
msa39314.2(225_A909 
msa39314 . 2 ( 225_CJB110 
msa3 9314 . 2 { 225_C0H1 
msa3 93 14 . 2 ( 2 2 5_H3 6B 
msa3 93 14 . 2 { 225_KM913 0013 
msa39314 .2{225_M732 
msa39314 . 2 (225_M781 
msa39314 ,2{225_090 
• msa39314 . 2 (225_1169NT 
Consensus 



701 

TAGGAGCTCG 
TAGGAGCTCG 
TAGGAGCTCG 
TAGGAGCTCG 
TAGGAGCTCG 
TAGGAGCTCG 
TAGGAGCTCG 
TAGGAGCTCG 
TAGGAGCTCG 
TAGGAGCTCG 
TAGGAGCTCG 



tAAAGTTGAT 
tAAAGTTGAT 
tAAAGTTGAT 
tAAAGTTGAT 
tAAAGTTGAT 
tAAAGTTGAT 
tAAAGTTGAT 
tAAAGTTGAT 
tAAAGTTGAT 
CAAAGTTGAT 
cAAAGTTGAT 



CGTAGACTAA 
CGTAGACTAA 
CGTAGACTAA 
CGTAGACTAA 
CGTAGACTAA 
CGTAGACTAA 
CGTAGACTAA 
CGTAGACTAA 
CGTAGACTAA 
CGTAGACTAA 
CGTAGACTAA 



TTGAAAAGAT 
TTGAAAAGAT 
TTGAAAAGAT 
TTGAAAAGAT 
TTGAAAAGAT 
TTGAAAAGAT 
TTGAAAAGAT 
TTGAAAAGAT 
TTGAAAAGAT 
TTGAAAAGAT 
TTGAAAAGAT 



750 

TAACAAAGCT 
TAACAAAGCT 
TAACAAAGCT 
TAACAAAGCT 
TAACAAAGCT 
TAACAAAGCT 
TAACAAAGCT 
TAACAAAGCT 
TAACAAAGCT 
TAACAAAGCT 
TAACAAAGCT 



751 



600 



884 



WO 2004/018646 PCT/US2003/026827 
Table 54: Comparative Sequences relating to SAG0949 



msa39314.2{22S_18RS21 
msa3 93 14 . 2 { 2 2 5_2 6 03 
msa39314 . 2 (225__A909 
msa39314.2{225_CJB110 
msa39314. 2(225 OOH1 
msa3 9 3 1 4 . 2 { 2 2 5_H3 6B 
msa39314.2{225_KM9130013 
msa39314.2(225_M732 
msa39314.2{225_M781 
msa39314.2{225_090 
msa39314 . 2 { 225_1169NT 
Consensus 



TTCAAACAGC 
TTCAAACAGC 
TTCAAACAGC 
TTCAAACAGC 
TTCAAACAGC 
TTCAAACAGC 
TTCAAACAGC 
TTCAAACAGC 
TTCAAACAGC 
TTCAAACAGC 
TTCAAACAGC 



TTCATAATAA 
TTCATAATAA 
TTCATAATAA 
TTCATAATAA 
TTCATAATAA 
TTCATAATAA 
TTCATAATAA 
TTCATAATAA 
TTCATAATAA 
TTCATAATAA 
TTCATAATAA 



GGGgAgATTT 
GGGgAgATTT 
GGGgAgATTT 
GGGgAgATTT 
GGGgAgATTT 
GGGgAgATTT 
GGGgAgATTT 
GGGgAgATTT 
GGGgAgATTT 
GGGaAaATTT 
GGGgAaATTT 



CAAAAAATCT 
CAAAAAATCT 
CAAAAAATCT 
CAAAAAATCT 
CAAAAAATCT 
CAAAAAATCT 
CAAAAAATCT 
CAAAAAATCT 
CAAAAAATCT 
CAAAAAATCT 
CAAAAAATCT 



CTTACAAATG 
CTTACAAATG 
CTTACAAATG 
CTTACAAATG 
CTTACAAATG 
CTTACAAATG 
CTTACAAATG 
CTTACAAATG 
CTTACAAATG 
CTTACAAATG 
CTTACAAATG 



rasa393 14 . 2 { 2 25JL8RS2 1 
msa39314 . 2 (225_2603 j 
msa39314 . 2 (225_A909 
msa39314 . 2 { 225_CJB110 ( 
msa3 9314.21 22 5_COHl 
tns a3 9 3 14 . 2 { 2 2 5_H3 6B 
msa39314.2{225 KM9130013 
tnsa39314.2(225_M732 
msa39314.2{225_M781 
msa3 93 14 . 2 { 225_090 
msa39314.2{22SJL169NT > 
Consensus 



801 

GTTTGGTGAA 
GTTTGGTGAA 
GTTTGGTGAA 
GTTTGGTGAA 
GTTTGGTGAA 
GTTTGGTGAA 
GTTTGGTGAA 
GTTTGGTGAA 
GTTTGGTGAA 
GTTTGGTGAA 
GTTTGGTGAA 



GATGTTTATA 
GATGTTTATA 
GATGTTTATA 
GATGTTTATA 
GATGTTTATA 
GATGTTTATA 
GATGTTTATA 
GATGTTTATA 
GATGTTTATA 
GATGTTTATA 
GATGTTTATA 



828 
GTAAAGAA 
GTAAAGAA 
GTAAAGAA 
GTAAAGAA 
GTAAAGAA 
GTAAAGAA 
GTAAAGAA 
GTAAAGAA 
GTAAAGAA 
GTAAAGAA 
GTAAAGAA 



SEQ ZD NO. 5412 

STRAIN 2603 frame: 1 

LTHKNILLTIIFGLFMI ILSACGMSNKEMAGI DNWEHYQKEKKITIGFDNTFVPMGFESR 
SGDYTGFDIDLANAVFKEYG I SVKWQPINWDMKETELNNGNI DLI WNGYSKTAERAKKVA 
FTNPYMNNHQVT VTKTSSHINS IKDMKGKKLGAQSGSSGFDAFNAKPDILKKFVKGKBAV 
QYDTFTQAL IDLKNNRI DGLLIDEVYANYYLKQEGNI KAYYFVKTAYQGENFWGARKVD 
RRLI EKINKAFKQLHNKGRFQKI S YKWFGEDVYSKE 



SSQ ZD HO. 5413 

STRAIN 090 frame: 3 

WEHYQKEKKITIGFDNTFVPMGFESRSGDYTGFDIDIANAVFKEYGISVKWQPINWDMKE 
TBLNNGN I DL I WNGY S KTAERAKKVAFTNP YMNNHQVI VTKTS SHI NS I KDMKG KKLGAQ 
SGSSGFnAFNAKPDILKKFVKGKEAVQYDTFTOALIDLKNmiTC 

GNI KAYYFVKTAYQGENFVVGARKVDRRL I EKINKAFKQLHNKGKFQKI SYKWFGEDVYS 
KB 



SKQ ZD NO. 5414 

STRAIN A909 frame: 3 

WBHYQKEKKI TIG FDNTFVPMG FBSRSGDYTG FD I DLANAVFKEYG I SVKWQP I NWDMKE 
TELNNGNIDL I WNGYSKTAERAKKVAFTNPYMNNHQVI VTKTSSHINS I KDMKGKKLGAQ 
SGSSGFDAFNAKPDI LKKFVKG KEAVQYDTFTQAL IDLKNNRI DGLL I DEVYANYYIiKQE 
GNI KAYYFVKTAYQGENFWGARKVDRRIil EKINKAFKQLHNKGRFQKI SYKWFGEDVYS 
KB 

SBQ ZD NO. 5415 

STRAIN H36B frame: 3 

WEHYQKEKKITI GFDNTFVPMGFESRSGDYTGFD IDLANAVFKEYGI SVKWQP I NWDMKE 
TBLNNGNIDLI WNGYSKTAERAKKVAFTNPYMNNHQVIVTKTSSHINS I KDMKGKKLGAQ 
SGSSGFDAFNAKPDIIJOCFVKGKEAVQYDTFTQALIDLKNNR^ 

GNI KAYYFVKTAYQGENFVVGARKVDRRL I EKINKAFKQLHNKGRFQKI SYKWFGEDVYS 
KB 

SBQ ZD NO. 5416 
STRAIN 18RS21 frame: 3 

WBHYQKBKKITI GFDNTFVPMGFESRSGDYTGFD I DLANAVFKEYGI SVKWQP I NWDMKE 
TBLNNGN IDL I WNGYSKTAERAKKVAFTNPYMNNHQV I VTKTSSHINS I KDMKGKKLGAQ 
SGSSGFDAFNAKPDI LKKFVKG KEAVQYDTFTQALIDLKNNRI 

GN I KAYYFVKTAYQGENFVVGARKVDRRL I EKINKAFKQLHNKGRFQKI SYKWFGEDVYS 
KB 

SBQ ZD NO. 5417 

STRAIN M732 frame: 3 

WEHYQKEI<KITIGFDNTFVPMGFESRSGDYTGFDIDIiANAVFKEYGISVKWQPINWDMKE 

TELNNGNI DLI WNGYSKTAERAKKVAFTNPYMNNHQV I VTKTSSHINS I KDMKGKKLGAQ 

SGSSGFDAFNAKFDIIoKKFVKGKEAVQYDTFTQALIDIiKNNRID 

GNIKAYYFVKTAYQGENFVVGARKVDRRLIEKINKAFKQliHNKGRFQra 

KB 

SBQ ZD NO. 5418 

STRAIN C0H1 frame: 3 

WBHYQKEKKITIGFDNTFVPMGFESRSGDYTGFDIDLANAVFKBYGI SVKWQP I NWDMKE 

TBLNNGN IDL I WNGYSKTABRAKKVAFTNPYMNNHQV I VTKTSSHINS I KDMKGK^ 

SGSSGFDAFNAKPDI LKKFVKGKEAVQYDTFTQALIDliKNNRIDGI^ 

GNI KAYYFVKTAYQGENFVVGARKVDRRL I EKINKAFKQLHNKGRFQKI SYKWFGEDVYS 

KB 



885 



WO 2004/018646 



PCTAJS2003/026827 



Table 54: C mparative Sequences relating to SAG0949 



SEQ XD NO. 5419 
STRAIN M781 frame i 3 

WEHYQKEKKITIQPDNTFVPMGFESRSGDYTGFDIDIiANAVPKEYGISVKWQPlNWDM^ 

TEl^TNGNIDLIWNGYSKTABRAKKVAFTNPYMNNHQVIVTKTSSHINSIKDM 

SGSSG FDAFNAKPD I LKKFVKG KEAVQ YDTFTQAL I DLKNNR I DGLL I DEVYANYYLKQE 

GNIKAYYFVKTAYQGENFWGARKVDRRL I EKINKAFKQLHNKBRFQKI SYKWFGEDVYS 

KB 

SEQ ID NO. 5420 

STRAIN CJB110 frame: 3 

WEHYQKEKKITIGFDNTFVPMG FESRSGDYTGFDI DLANAVFKBYGI S VKWQP I NWDMKE 
TELNNGNIDLIWNGYSKTAERAKKVAFTNPYMNNHQVIVTKTSSH INS I KDMKGKKLGAQ 
SGSSG FDAFNAKPDI LKKFVKGKEAVQYDTFTQAL I DLKNNR I DGLL I DEVYANYYLKQE 
GNIKAYYFVKTAYQGENFWGARKVDRRLI EKINKAFKQ SYKWFGEDVYS 
KB 

SEQ XD NO. 5421 
STRAIN 1169NT frame* 3 

WEHYQKBKKI TI GFDNTFVPMGFESRSGDYTGFD I DLANAVFKBYGI SVKWQP I NWDMKE 
TELNNGNIDLIWNGYSKTAERAKKVAFTNPYMNNHQVIVTKTSSHINSIKD^ 
SGSSGPDAFNAKPDI LKKFVKGKEAVQYDTFTQALIDLKNNRIDGIiLIDEVYANYYLKQE 
GNIKAYYFVKTAYQGENFVVGARKVDRRLI BKINKAFKQLHNKGKFQKI SYKWFGEDVYS 
KB 



SEQ XD NO. 5422 

STRAIN JM9130013 frame* 3 

WEHYQKEKKITIGFDNTFVPMGFESRSGDYTGFDIDLANAVFKEYGISVKWQPI 

TELNNGNIDLIWNGYSKTAERAKKVAFTNPYMNN^Q 

SGSSGFDAFNAKPDILKKFVKGKEAVQYDTFTQALIDLKK^ 

GNIKAYYFVTCTAYQGENFVVGARKVDRRLIEKINKAFKQLHNKG 

KB 

PRETTY of s /biotmp/msa45901.2{*} February 19, 2003 03t09 . 



msa45901.2{225_090; 
msa45901.2{225_1169NT 
msa45901.2{225_18RS21 
msa45901 . 2 (225_2603 
msa45901.2{225_A909 
msa45901 . 2 {225_CJB110 
msa4 5901.21 225_COHl 
msa4 590 1 . 2 { 2 2 5_H3 6B 
msa45901.2{225_JM9130013 
msa45901.2(22S_M732 
msa45901.2{225_M781 
Cone ensue 



1 50 

WEHYQK EKKITIGFDN 

WEHYQK EKKITIGFDN 

WEHYQK EKKITIGFDN 

lthknillti ifglfmiile acgmsnkema gidnWBHYQK EKKITIGFDN 

WEHYQK EKKITIGFDN 

WEHYQK EKKITIGFDN 

WEHYQK EKKITIGFDN 

WEHYQK EKKITIGFDN 

WEHYQK EKKITIGFDN 

WEHYQK EKKITIGFDN 

WEHYQK EKKITIGFDN 



rasa45901 . 2 { 225_0 90 ] 
msa45901.2(225_1169NT 
mea4 5901 . 2 { 225_18RS21 
msa4 5901. 2 {225_2603 
msa45901 . 2 (225_A909 
msa45901.2{225_CJB110 
msa45901 . 2f225_COHl 
msa45901 . 2 {225_H36B 
rasa45901 . 2 {225_JM9130013 
raea45901 . 2 f 225_M732 
maa45901 . 2 {225_M781 
Consensus 



51 

TFVPMGFBSR 
TFVPMGFESR 
TFVPMGFBSR 
TFVPMGFESR 
TFVPMGFBSR 
TFVPMGFESR 
TFVPMGFESR 
TFVPMGFESR 
TFVPMGFBSR 
TFVPMGFESR 
TFVPMGFESR 



SGDYTGFDID 
SGDYTGFDID 
SGDYTGFDID 
SGDYTGFDID 
SGDYTGFDID 
SGDYTGFDID 
SGDYTGFDID 
SGDYTGFDID 
SGDYTGFDID 
SGDYTGFDID 
SGDYTGFDID 



LANAVFKEYG 
LANAVFKBYG 
LANAVFKEYG 
LANAVFKBYG 
LANAVFKEYG 
LANAVFKEYG 
LANAVFKBYG 
LANAVFKBYG 
LANAVFKEYG 
LANAVFKEYG 
LANAVFKEYG 



ISVKWQPINW 
I SVKWQP INW 
ISVKWQPINW. 
ISVKWQPINW 
ISVKWQPINW 
ISVKWQPINW 
ISVKWQPINW 
ISVKWQPINW 
ISVKWQPINW 
ISVKWQPINW 
ISVKWQPINW 



100 

DMKETBLNNG 
DMKETELNNG 
DMKBTELNNG 
DMKETELNNG 



D MKETB LNNG 
DMKBTELNNG 
DMKETBLNNG 
DMKBTELNNG 
DMKETBLNNG 
DMKBTELNNG 



msa45901 . 2 {225_090 
maa45901 . 2 ( 225_1169NT 
msa45901.2{225_18RS21 
mea45901 . 2 f 225_2603 
mea45901 . 2 { 225_A909 
msa45901.2{225 CJB110 
msa45901 .2 ( 225_COHl 
msa45901.2{225 H36B 
msa45901 . 2 {225_JM9130013 
msa45901 . 2 ( 225_M732 
msa45901.2{225_M781 
Consensus 



101 

NIDLIWNGYS 
NIDLIWNGYS 
NIDLIWNGYS 
NIDLIWNGYS 
NIDLIWNGYS 
NIDLIWNGYS 
NIDLIWNGYS 
NIDLIWNGYS 
NIDLIWNGYS 
NIDLIWNGYS 
NIDLIWNGYS 



KTAERAKKVA 
KTABRAKKVA 
KTAERAKKVA 
KTABRAKKVA 
KTAERAKKVA 
KTAERAKKVA 
KTAERAKKVA 
KTABRAKKVA 
KTAERAKKVA 
KTABRAKKVA 
KTABRAKKVA 



FTNPYMNNHQ 
FTNPYMNNHQ 
FTNPYMNNHQ 
FTNPYMNNHQ 
FTNPYMNNHQ 
FTNPYMNNHQ 
FTNPYMNNHQ 
FTNPYMNNHQ 
FTNPYMNNHQ 
FTNPYMNNHQ 
FTNPYMNNHQ 



VIVTKTSSHI 
VIVTKTSSHI 
VIVTKTSSHI 
VIVTKTSSHI 
VIVTKTSSHI 
VIVTKTSSHI 
VIVTKTSSHI 
VIVTKTSSHI 
VIVTKTSSHI 
VIVTKTSSHI 
VIVTKTSSHI 



150 

NSIKDMKGKK 
NSIKDMKGKK 
NSIKDMKGKK 
NSIKDMKGKK 
NSIKDMKGKK 
NSIKDMKGKK 
NSIKDMKGKK 
NSIKDMKGKK 
NSIKDMKGKK 
NSIKDMKGKK 
NSIKDMKGKK 



msa45901.2{225_090 
msa45901 . 2 {225_1169NT 
raaa45901.2{225_18RS21 
maa4S901.2{225_2603 
msa45901 . 2 (225_A909 
msa45901.2{225 CJB110 



151 

LGAQSGSSGF 
LGAQSGSSGF 
LGAQSGSSGF 
LGAQSGSSGF 
LGAQSGSSGF 
LGAQSGSSGF 



DAFNAKPDIL 
DAFNAKPDIL 
DAFNAKPDIL 
DAFNAKPDIL 
DAFNAKPDIL 
DAFNAKPDIL 



KKFVKGKEAV 
KKFVKGKEAV 
KKFVKGKEAV 
KKFVKGKEAV 
KKFVKGKEAV 
KKFVKGKEAV 



QYDTFTQALI 
QYDTFTQALI 
QYDTFTQALI 
QYDTFTQALI 
QYDTFTQALI 
QYDTFTQALI 



200 

DLKNNRIDGL 
DLKNNR IDG Li 
DLKNNRIDGL 
DLKNNRIDGL 
DLKNNRIDGL 
DLKNNRIDGL 



886 



WO 2004/018646 



PCT/US2003/026827 



Table 54: Comparative Sequences relating to SAG0949 



msa45901.2{225 COH1 
msa45901 . 2 { 225^H3 6B 
msa45901.2(225_JM9130013 
m8a45901.2{225 M732 
msa45901.2(225~M7Bl 
Consensus 



msa45901.2{225_090; 
msa45901 . 2( 225_1169NT 
tnsa45901.2(225_18RS21 ( 
msa45901 . 2 { 225_2603 
msa45901.2(22S_A909 
msa45901. 2(225 CJB110 
msa45901 . 2 (225_C0H1 
msa4S901.2(225_H36B 
msa45901.2{225_JM9130013 
msa45901 . 2 { 225_M732 
msa45901 . 2 { 225_M781 
Consensus 



msa45901.2{225_090; 
msa45901. 2(225 1169NT 
msa45901.2(225_18RS2r 
mea45901.2{225J2603 i 
msa45901.2(225 A909 
msa45901.2{225 CJB110 
msa4 59 0 1 . 2 { 2 2 5_COHl 
msa45901. 2(225 H36B 
msa45901 . 2 { 225_JM9130013 
msa45901.2{225_M732 
msa45901 . 2 (22S_M781 
Consensus 



LGAQSGSSGF DAFNAKPDIL KKFVKGKEAV QYDTFTQALI DLKNNRIDGL 

LGAQSGSSGF DAFNAKPDIL KKFVKGKEAV QYDTFTQALI DLKNNRIDGL 

LGAQSGSSGF DAFNAKPDIL KKFVKGKEAV QYDTFTQALI DLKNNRIDGL 

LGAQSGSSGF DAFNAKPDIL KKFVKGKEAV QYDTFTQALI DLKNNRIDGL 

LGAQSGSSGF DAFNAKPDIL KKFVKGKEAV QYDTFTQALI DLKNNRIDGL 



201 

LIDEVYANYY 
LIDEVYANYY 
LIDEVYANYY 
LIDEVYANYY 
LIDEVYANYY 
LIDEVYANYY 
LIDEVYANYY 
LIDEVYANYY 
LIDEVYANYY 
LIDEVYANYY 
LIDEVYANYY 



LKQEGNIKAY 
LKQEGNIKAY 
LKQEGNIKAY 
LKQEGNIKAY 
LKQEGNIKAY 
LKQEGNIKAY 
LKQEGNIKAY 
LKQEGNIKAY 
LKQEGNIKAY 
LKQEGNIKAY 
LKQEGNIKAY 



YFVKTAYQGE 
YFVKTAYQGE 
YFVKTAYQGE 
YFVKTAYQGE 
YFVKTAYQGE 
YFVKTAYQGE 
YFVKTAYQGE 
YFVKTAYQGE 
YFVKTAYQGE 
YFVKTAYQGE 
YFVKTAYQGE 



NFWGARKVD 
NFWGARKVD 
NFWGARKVD 
NFWGARKVD 
NFWGARKVD 
NFWGARKVD 
NFWGARKVD 
NFWGARKVD 
NFWGARKVD 
NFWGARKVD 
NFWGARKVD 



250 

RRLIEKINKA 
RRLIEKINKA 
RRLIEKINKA 
RRLIEKINKA 
RRLIEKINKA 
RRLIEKINKA 
RRLIEKINKA 
RRLIEKINKA 
RRLIEKINKA 
RRLIEKINKA 
RRLIEKINKA 



251 

FKQLHNKGkF 
FKQLHNKGkF 
FKQLHNKGrF 
FKQLHNKGrF 
FKQLHNKGrF 
FKQLHNKGrF 
FKQLHNKGrF 
FKQLHNKGrF 
FKQLHNKGrF 
FKQLHNKGrF 
FKQLHNKGrF 



QKISYKWFGE 
QKISYKWFGB 
QKISYKWFGE 
QKISYKWFGE 
QKISYKWFGE 
QKISYKWFGE 
QKISYKWFGE 
QKISYKWFGE 
QKISYKWFGB 
QKISYKWFGE 
QKISYKWFGE 



276 
DVYSKE 
DVYSKE 
DVYSKE 
DVYSKE 
DVYSKE 
DVYSKE 
DVYSKE 
DVYSKE 
DVYSKE 
DVYSKE 
DVYSKE 



887 



WO 2004/018646 



PCT/US2003/026827 



Table 55: Comparative Sequences relating to SAG1592 



SEQ ID HO. 5501 

STRAIN 2603 

ATGCTTAAATCTTTT^TTGATTTTCITAGTTCG CTITTACCAAAAAAATATTTCT CCAGCT 

TTCCCAGCTAGCTGTCGTTATCGTCCAACTTC 

AAACATGGTCTAAAAGGTGTGTTGATGGGGA 



ATATCAGAT 

SEQ ID NO. 5502 
STRAIN 090 

TTCCCAGCTAGCrGTCXTTTATCGTCCAAC^ 
AGCTATTCAAAAACATGGTCTAAAAGGTGTOTTGATGGGGATTC 



CATTTTAGCTT 

SEQ ID NO. 5503 
STRAIN A909 

TTCCCAGCTAGCTGTCGTTATCGTCCAACtTGCTCTACGTA^ 
AGCTATTCAAAAACATGGTCTAAAAGGTGTGTTGATC 
TTTTGCGATGTCATCCCTTAGCCCAC^ 
CATTTTAgCTTAAGACGTAATAAAACGGATATA 

SEQ ID NO. 5504 

STRAIN H36B 

TTCXrCAGCTAGCTGTCGTTATOGTCCaACTTGCTCTACOT 
AGCTATTCAAAAACATGGTCTAAAAGGTGTTCTGATGGGG^ 
TTTTGCGATGTCATC<XrTTAGCCCACX3GAGGAA^ 
CATTTTAGCTTAAGACGTAATAAAAOGGATATATCAGAT 

SEQ ID NO. 5505 
STRAIN 18RS21 

TTCCCAGCTAGCTGTCGTTATCGTCCAACTTGCTCrr^ 
AGCTATTCAAAAACATGGTCTAAAAGGTGTGTTGATG 
T1TTGCGATGTCATCCCTTAGCCCACGGAGGAA 
CATTTTAG CTTAAGACGTAATAAAACGGAT AT ATCAGAT 

SEQ ID NO. 5506 

STRAIN M732 

TTCCCAGCTAGCTGTCGTTATCGTCCAACTTGCTC^ 
AGCTATTCAAAAACATGGTCTAAAAGGTGTGTTGATG^ 
TTTTGCGATGTCATCCCirAgCCCACGGAGGAAATGATCCTCTC 
CATTTTAGCTTAAGACX3TAATAAAACGGATATATCAGAT 

SEQ ID NO. 5507 
STRAIN COH1 

TTCCCAG CTAGCTGTCGTTATCGTCCAACTTG CTCTACGTATATGATAGAAGCTATTCAA 

AAACATGGTCTAAAAGGTGTGTTGATGGGGATTGCACGT 

GCCCACXX^GGAAATGAtCCTGtCCCTGATC^TTTTAGCT 

SEQ ID NO. 5508 
STRAIN M781 

TTCCCAGCTAGCTGTCX3TTATCGTCCAACTTC 
AGCTATTCAAAAACATGGTCTAAAAGGTGTGTTGAT^ 
TTTTGCGATGTCATCCCTTAGCCCACGGAGGAAATGATC 
CATTTTAGCTTAAGACGTAATAAAACGGATATATCAGAT 

SEQ ID NO. 5509 
STRAIN CJB110 

TTCCCAGCTAGCTGTCGTTATCGTCCA^ 
AGCTATTCAAAAACATGGTCTAAAAGGTGTGTTG^ 
TTTTGCGATGTCATCOTrTAGCCCACGGA^ 
CATTTTAGCTTAAGACGTAATAAAACGGATATATCAGAT 

SEQ ID NO. 5510 
STRAIN 1169NT 

TTCXCAGCTAGCTGTCGTTATCGTCCAACTrGCTCT 
AGCTATTraAAAACATGGTCTAAAAGGTGTGGTG^ 
TTTTGCGATGTCATCCCTrAGCCCACXSGAG 
TATTTTAGCrrTAAGACGTAATAAAACGGATATATCAGAT 

SEQ ID NO. 5511 
STRAIN JM9130013 

TTCCCAGCTAGCTGTCGTTATCGTCCAACTTGC^ 
AGCTATTCAAAAACATGGTCTAAAAGGTGOT 

CATTTTAGCTTAAGACGTAATAAAACXK1ATATATCAGAT 



PRETTY of : / bio tmp/tnaa 119306 . 2 {* } April 29, 2003 06i23 

1 50 

msall9306.2{233 H36B) - ~- 

. rasall9306 . 2 { 233_JM9130013 } 



888 



WO 2004/018646 



PCT/US2003/026827 



Table 55: Comparative Sequences relating to SAG1592 



msall9306.2{233_090' 
msall9306.2{233_18RS21 
msall9306.2(233_2603 
msall9306.2{233_A909 
msall9306.2{233_CJB110 
msall9306.2{233_COHl 
ms all 93 06 . 2 { 2 3 3_M73 2 
msall9306.2{233_M781 
msall9306 . 2 { 233_1169NT 
Consensus 



msall9306. 2{233_H36B 
msall9306.2{233_JM9130013! 
msall9306.2{233_090 
msall9306 ,2{233_18RS21 
msall9306.2{233_2603 
maall9306.2{233_A909 
msall9306 . 2 { 233_CJB110 
msall9306 .2{233_COHl 
msall9306 . 2 { 233_M732 
msall9306 . 2{ 233_M781 
msall9306.2(233_1169NT 
Consensus 



mflall9306.2(233_H36B 
msall9306.2(233_JM9130013 
msall9306.2{233_090 
msall9306 . 2 { 233_18RS21 
rasall9306.2(233_2603 
msall9306.2{233 - A909 
msall9306 . 2 { 233_CJB110 
msall9306.2(233jCOHl 
msall93 06 . 2 { 233_M73 2 
msall9306.2(233_M781 
msall9306.2{233_1169NT: 
Consensus 



msall9306.2{233_H36B; 
msal!9306.2{233_JM9130013 
msall9306 . 2 (233_090 

msall9306 ,2(233_18RS21 
msal!9306 . 2 (233_2603 
maall9306.2{233_A909 

msall9306.2{233_CJB110 
msaXX9306.2(233_COHl 
msall9306.2(233_M732 
msall9306.2{233J«781 

rasall9306.2(233_1169NT 



atgcttaaat cttttttgat tttcttagtt cgcttttacc aaaaaaatat 

51 1°0 

TTCCCAGCTA GCTGTCGTTA TCGTCCAACT TGCTCTACGT 

TTCCCAGCTA GCTGTCGTTA TCGTCCAACT TGCTCTACGT 

TTCCCAGCTA GCTGTCGTTA TCGTCCAACT TGCTCTACGT 

TTCCCAGCTA GCTGTCGTTA TCGTCCAACT TGCTCTACGT 

ttctccagct TTCCCAGCTA GCTGTCGTTA TCGTCCAACT TGCTCTACGT 

TTCCCAGCTA GCTGTCGTTA TCGTCCAACT TGCTCTACGT 

TTCCCAGCTA GCTGTCGTTA TCGTCCAACT TGCTCTACGT 

TTCCCAGCTA GCTGTCGTTA TCGTCCAACT TGCTCTACGT 

TTCCCAGCTA GCTGTCGTTA TCGTCCAACT TGCTCTACGT 

TTCCCAGCTA GCTGTCGTTA TCGTCCAACT TGCTCTACGT 

TTCCCAGCTA GCTGTCGTTA TCGTCCAACT TGCTCTACGT 



101 

ATATGATAGA 
ATATGATAGA 
ATATGATAGA 
ATATGATAGA 
ATATGATAGA 
ATATGATAGA 
ATATGATAGA 
ATATGATAGA 
ATATGATAGA 
ATATGATAGA 
ATATGATAGA 



AGCTATTCAA 
AGCTATTCAA 
AGCTATTCAA 
AGCTATTCAA 
AGCTATTCAA 
AGCTATTCAA 
AGCTATTCAA 
AGCTATTCAA 
AGCTATTCAA 
AGCTATTCAA 
AGCTATTCAA 



AAACATGGTC 
AAACATGGTC 
AAACATGGTC 
AAACATGGTC 
AAACATGGTC 
AAACATGGTC 
AAACATGGTC 
AAACATGGTC 
AAACATGGTC 
AAACATGGTC 
AAACATGGTC 



TAAAAGGTGT 
TAAAAGGTGT 
TAAAAGGTGT 
TAAAAGGTGT 
TAAAAGGTGT 
TAAAAGGTGT 
TAAAAGGTGT 
TAAAAGGTGT 
TAAAAGGTGT 
TAAAAGGTGT 
TAAAAGGTGT 



150 

tcTGATGGGG 
tcTGATGGGG 
gtTGATGGGG 
gtTGATGGGG 
gtTGATGGGG 
gtTGATGGGG 
gtTGATGGGG 
gtTGATGGGG 
gtTGATGGGG 
gtTGATGGGG 
ggTGATGGGG 
..******** 



msall9306. 2(233 H36B 
msa!19306 . 2 { 233_JM9130013 ( 
msall9306.2{233_090 
msall9306.2{233_18RS21 
msall9306.2{233_2603 
msall9306.2{233_A909 
msall9306.2{233_CJB110 
rasall9306. 2(233 COH1 
msall9306.2(233_M732 
msall9306 . 2 { 233_M781 
msall9306 . 2 { 233_116 9NT 
Consensus 



151 200 
ATTGCACGTA TTTTGCGATG TCATCCCTTA GCCCACGGAG GAAATGATCC 
ATTGCACGTA TTTTGCGATG TCATCCCTTA GCCCACGGAG GAAATGATCC 
ATTGCACGTA TTTTGCGATG TCATCCCTTA GCCCACGGAG GAAATGATCC 
ATTGCACGTA TTTTGCGATG TCATCCCTTA GCCCACGGAG GAAATGATCC 
ATTGCACGTA TTTTGCGATG TCATCCCTTA GCCCACGGAG GAAATGATCC 
ATTGCACGTA TTTTGCGATG TCATCCCTTA GCCCACGGAG GAAATGATCC 
ATTGCACGTA TTTTGCGATG TCATCCCTTA GCCCACGGAG GAAATGATCC 
ATTGCACGTA TTTT GCGATG TCATCCCTTA GCCCACGGAG GAAATGATCC 
ATTGCACGTA TTTTGCGATG TCATCCCTTA GCCCACGGAG GAAATGATCC 
ATTGCACGTA TTTTGCGATG TCATCCCTTA GCCCACGGAG GAAATGATCC 
ATTGCACGTA TTTTGCGATG TCATCCCTTA GCCCACGGAG GAAATGATCC 

201 249 
TGTCCCTGAT cATTTTAGCT taagacgtaa taaaacggat atatcagat 
TGTCCCTGAT cATTTTAGCT taagacgtaa taaaacggat atatcagat 

TGTCCCTGAT cATTTTAGCT t " 

TGTCCCTGAT cATTTTAGCT taagacgtaa taaaacggat atatcagat 
TGTCCCTGAT cATTTTAGCT taagacgtaa taaaacggat atatcagat 

TGTCCCTGAT cATTTTAGCT taagacgtaa taaaacggat ata 

TGTCCCTGAT cATTTTAGCT taagacgtaa taaaacggat atatcagat 

TGTCCCTGAT cATTTTAGCT 

TGTCCCTGAT cATTTTAGCT taagacgtaa taaaacggat atatcagat 
TGTCCCTGAT cATTTTAGCT taagacgtaa taaaacggat atatcagat 
TGTCCCTGAT tATTTTAGCT taagacgtaa taaaacggat atatcagat 
********** _********* 



SEQ XD NO. 5512 
STRAIN 2603 frame* 1 

MLKSFLI FLVRFYQKNI S PAFP ASCRYRPTCSTYM I EAI QKHGLKGVLMG IARI LRCHPL 
AHGGNDPVPDHFSLRRNKTDISD 



SEQ ZD NO. 5513 
STRAIN 090 frame: 1 

FPAS CRYRPTCSTYM I EAI QKHGLKGVLMG IARILRCHPLAHGGNDPVPDHFS 



SEQ XD NO. 5514 

STRAIN A909 frame i 1 

FPAS CRYRPTCSTYM I EAI QKHGLKGVLMG IARI LRCHPLAHGGNDPVPDHFSLRRNKTD 
I 



SEQ ZD NO. 5515 
STRAIN H36B frame t 1 
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FPAS CRYRFTCSTYM I EAI QKHGLKGVLMG I ARI LRCHPLAHGGNDPVPDHFSLRRNKTD 
ISD 

SEQ ZD NO. 5516 
STRAIN 18RS21 frame: 1 

FPASCRYRPTCSTYM I EAI QKHGLKGVLMG IARI LRCHPLAHGGNDPVPDHPSLRRNKTD 
ISD 

SEQ ID NO. 5517 
STRAIN M732 frame: 1 

PPASCRYRPTCSTYM I EAI QKHGLKGVLMG IARI LRCHPLAHGGNDPVPDHFSLRRNKTD 
ISD 

SEQ ZD NO. 5518 
STRAIN COH1 frame t 1 

PPASCRYRPTCSTYM I EAI QKHGLKGVLMG IARI LRCHPLAHGGNDPVPDHFS 

SEQ ZD NO. 5519 
STRAIN M781 frame* 1 

PPASCRYRPTCSTYM I EAI QKHGLKGVLMG IARI LRCHPLAHGGNDPVPDHFSLRRNKTD 
ISD 

SEQ ZD NO. 5520 
STRAIN CJB110 frame t 1 

FPASCRYRPTCSTYM I EAI QKHGLKGVLMG IARI LRCHPLAHGGNDPVPDHPSLRRNKTD 
ISD 

SEQ ZD NO. 5521 
STRAIN 1169NT frame: 1 

FPASCRYRPTCSTYMI EAI QKHGLKGWMGI ARI IJIC3IPLAHGGNDPVPDYFSLRRNKTD 
ISD 



SEQ ZD NO. 5522 

STRAIN JM9130013 frame: 1 

FPASCRYRPTCSTYMI EAI QKHGLKGVLMG I ARILRCHPLAHGGNDPVPDHPSLRRNKTD 
ISD 

PRETTY Of : /biotmp/msall9415 . 2 { *} April 29, 2003 06:25 



msall941S.2{233_090; 
msall9415 . 2 (233_18RS21 
msall9415 . 2 f 233_C0H1 
msall9415.2{233_A909 
msall9415 . 2 (233_2603 
maall9415 . 2 (233_CJB110 
msall9415 . 2 (233_H36B 
msall9415 .2 {233_JM9130013 
msall9415.2(233_M732 
msall9415 . 2 (233_M781 
msall9415 . 2 { 233_1169NT \ 
Consensus 



1 50 

PPASCRYRPT CSTYMIEAIQ KHGLKGVlMG 

PPASCRYRPT CSTYMIEAIQ KHGLKGVlMG 

PPASCRYRPT CSTYMIEAIQ KHGLKGVlMG 

PPASCRYRPT CSTYMIEAIQ KHGLKGVlMG 

mlksfliflv rfyqknispa PPASCRYRPT CSTYMIEAIQ KHGLKGVlMG 

PPASCRYRPT CSTYMIEAIQ KHGLKGVlMG 

PPASCRYRPT CSTYMIEAIQ KHGLKGVlMG 

PPASCRYRPT CSTYMIEAIQ KHGLKGVlMG 

PPASCRYRPT .CSTYMIEAIQ KHGLKGVlMG 

PPASCRYRPT CSTYMIEAIQ KHGLKGVlMG 

PPASCRYRPT CSTYMIEAIQ KHGLKGVvMG 



rasall941S . 2 { 233__090 ] 
msall9415 ..2{233_18RS21 ( 
msall9415.2{233_COHl 
msall9415.2{233_A909' 
msall9415.2(233_2603 
msall9415 . 2 { 233_CJB110 
msall941S.2{233_H36B 
msall9415. 2(233 JM9130013 
rasall9415.2{233JM732 
msall9415. 2(233 M781 
msall94 15 . 2 { 233_1169NT ) 
Consensus 



51 

IARILRCHPL 
IARILRCHPL 
IARILRCHPL 
IARILRCHPL 
IARILRCHPL 
IARILRCHPL 
IARILRCHPL 
IARILRCHPL 
IARILRCHPL 
IARILRCHPL 
IARILRCHPL 
********** 



83 



AHGGNDPVPD 
AHGGNDPVPD 
AHGGNDPVPD 
AHGGNDPVPD 
AHGGNDPVPD 
AHGGNDPVPD 
AHGGNDPVPD 
AHGGNDPVPD 
AHGGNDPVPD 
AHGGNDPVPD 
AHGGNDPVPD 
********** 



hFS 

hFSLRRNKTD 

hFS 

hFSLRRNKTD 
hFSLRRNKTD 
hFSLRRNKTD 
hFSLRRNKTD 
hFSLRRNKTD 
hFSLRRNKTD 
hFSLRRNKTD 
yFSLRRNKTD 
_********* 



ISD 



I — 
ISD 
ISD 
ISD 
ISD 
ISD 
ISD 
ISD 
*** 
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SBQ XD NO. S601 
STRAIN 2603 

aagaagcttacttttatttgggatttagatgggacattaatagattcgta 
tgtaccaattatggaagctcttgaagaaacctatcgtcattttggtttaa 
tatttgataaagaattaatccatgaatatattttacaggaatcagtgggg 
aaattattggtaaacctttcagaggaagagcaaatacctcatgaaaaact 
gaaagcatattttacaaaagaacaagaaagtcgagattctaaaatacatt 
taatgccatatgcaaaagagattttagaatggaccaaagaacaagatatc 
cccaattttatgtatacacataaaggagcaagtacgcattcagtgttgga 
aaccttgcagatctctcattattttgatgaaattttaactggtgtttcgg 
gattcgagcgaaaaccacatccacaagggattaattatttagttaaacga 
tattctttagataaatcaatgacttattacataggagatcgtccactaga 
tttggaggttgctcaaaatgctggtataaaatccataaacttaaggttag 
agaattccaaagaaaactataatatttcaagtctcaaagatataatatca 
cttgatttcactcgtttggat 

SEQ XD NO. 5602 
STRAIN COH1 

AAGAAGCITACTTTTATTTGGGA^ 

TAGATTCGTATGTACCAATTATGGAAGCTeiTGAAGAAACCrAT 

TTTGGCTTAATATTTGATAAAGAATTAATCCATO 

ATCAGTGGGGCAATTATTGGTAAACCTTTC^ 

ATGAAAAACTTGAAAGCATATTTTACAAAAGAACAA^ 

AAAATACATTTAATGCGATATGCAAAAGAOATTTTA 

AC^AGATATTCCCAATTTTATGTATACACATAAAGGAGCAAGTACGCATT 

CAGTGTTGGAAACCrTGCAGATCTCTCATTAT^ 

GGTGTTTCGGGATTCGAGCQAAAACCACATCCACAAGGGATTAAT^ 

AGTTAAAC^TA 1UV1"1T AGATAAATCAATGACTTATTACATAGGAQATC 

GTCCACTAGATTTGGAGGTTGCTCAAAATGCT^ 

TTAAGGTTAGAGAATTCCAAAGAAAACTATAATA^ 

TATAATATCACTTGATTTCACTCGTTTGGAT 

SEQ XD NO. 5603 
STRAIN A909 

AAGAAGCITACTTTTATTTGGGATTT^ 

AGATTCGTATGTACCAATTATGGAAGCTCTT^ 
ATTT^ATAAAGAATTAATCCATGAATATATTTTACAG 

AAACCTTTCAGAGGAAGAGCAAATACCTCATGA CATATTTTACAAAAGA 

ACAAGAAAGTCGAGATTCTAAAATACATTTAATGCCATATC 

GACCAAAGAACAAGATATCCCCAATTTTATGTATACACATAAAGGAG 

AGTGTTGGAAACCTTGCAGATCTCTCATTATTT^ 

ATTCGAGCGAAAACCACATCCACAAGKK5ATTAATTA 

TAAATCAATGACTTATTACATAGGAGATCXSTCC^ 

TGGTATAAAATCCATAAACTTAAGGTTAGAGAATTCCAAAGAAAACTA^ 
TCTCAAAGATATAATATCACTTGATTTCACTCGT 

SEQ XD NO. 5604 
STRAIN H36B 

AAGAAGCTTACTTTTATTTGGGATTTAGATGGGA^ 

TATGTACCAATTATGGAAGCTCTTGAAGAAACCT^ 

AAAGAATTAATCCATGAATATATTTTACAGGA 

TCAGAGGAAGAGCAAATACCTCATGAAAAACTG 

AGTC<3AGATTCTAAAATACATTTAATGCCATATGCAAA^ 

GAACAAGATATCCCCAATTTTATGTATACAC^TAAAGGAGCA CAGTGTTG 

GAAACCTTGCAGATCTCTCATTATTTTGATGAAAT^ 

CGAAAACCACATCCACAAGGGATTAATTATTTAGTTAAACGA 

ATGACTTATTACATAGGAGATCGTCCACTAGATTTGGAG^ 

AAATCCATAAACTTAAGGTTAGAGAATTCCAAAGAAAACTATAAT 

GATATAATATCACTTGATTTCACTCXsrri'GGAT 

SEQ XD NO. 5605 
STRAIN 18RS21 

AAGAAGCTITACTTTTATTTGGGATTTAGATGGG^ 

CXSTATGTACCAATTATGGAAGCrcTTGAAGAAACCTATC 

ATAAAGAATTAATCCATGAATATATTTTACA^ 

TTTCAGAGGAAGAGCAAATACCTCATGAAAAACTGA 

AAAGTCXSAGATTCTAAAATACATTTAATGCCATA 

AAGAACAAGATATCCCCAATTTTATGTATACACATA 

TGGAAACCTTX3CAGATCTCTCATTATTTTC 

AGCGAAAACCACATCCACAAGGGATTAATTATT^ 

CAATGACTTATTACATAGGAGATCGTCCACrAGATTTGG 

TAAAATCCATAAACTTAAGGTTAGAGAATTCCAAAG 

AAGATATAATATCACTrGATTTCACTOGTTTGGAT 

SEQ XD NO. 5606 
STRAIN M732 

AAGAAGCTTACTTTTATTTGGGATTTAGATGGG^ 

TCGTATGTACCAATTATGGAAGCTCTTGAAGAAACCT 

GATAAAQAAT^AATCCATOAATATATTTTACA 

CTTTCAGAGGAAGAGCAAATACCTCATGAAAAACTCAAAGC^ 

GAAAGTCGAGATTCTAAAATACATTTAATGCCATA^ 

AAAGAACAAGATATTCCCAATTTTATGTATACACATAAAG 
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TTGGAAACCTIGCAGATCTCTCATTATTTTGATGAA^ 

GAGCGAAAACCACATCGAC^U^GGGATTAATTATTTAGTTO 

TCAATGACTTATTACATAGGAGATCGTCCACTAGATT^ 

ATAAAATCCATAAACTTAAGGTTAGAGAATTCOVAAGAAAACT^^ 

AAAGATATAATATCACITGATTTCACTCGTrTGGAT 

SEQ ID NO. 5607 
STRAIN CJB1 10 

AAGAAGCTTACTTTTATTTGGGATTTAGATGGGACATT 

AATAGATTCGTATGTACCAATTATGGAAGCTCTTGAAGAAACCT 

AATATTTGATAAAGAATTAATCCSVTGAATATATTTTACA^ 

GGTAAAC CTTTCAGAGGAAGAG CAAAT ACCTCATGAAAAACTGAAAG CATATTTTACAAA 
AGAACAAGAAAGTCGAGATTCTAAAATACATTTAATG CCATATGCAAAAGAGATTTT AGA 
. ATGGACGAAAGAACAAGATATCCCCAATTTTA 
TTCAGTGTTGGAAACCTTGCAGATCTCTCATTA^ 
TGGATTCGAGCXSAAAACCACATCCACAAGGGATTAATTATT^ 
AGATAAATCAATGACTITATTACATAGGAGATCGTCCCCrAGATTTGG^ 

AAGTCTCAAGGATATAATATC^CITGATTTCACTCGTT 

SEQ ZD NO. 5608 
STRAIN 1169NT 

aAGAAGCTTA Cl ' l " lTA TTTGGGATTTAGATGGGACATO 

TAGAAGCTCTTGAAGAAACCTATCXSTCATTTTG^ 

ATGAATATATTTTACAGGAATCAGTGGGGAAATTAT^ 

AAATACCI^TGAAAAACTGAAAGCATATTTTACAAAAGAACAAQ 

AAATACATTTAATGCCATACGCAAAAGAGATTTTAGAATGGACC^ 

CC2VATTTTATGTATACACATAAAGGAGCAAGTACG 

TCTCTCATTATTTTGATGAAATlTTAACrrGGlV 

CACAAGGGATTAATTATTTAGTTAAACGATATTCTTTAGATAAA 

TAGGAGATCGTCCCCTAGATTrGGAGGTTGCTCAAAATC 

TAAGGTTAGAGAATTCCAAAGAAAACTATAATATTTCAAGTCT^ 

TTGATTTCACTCGTTTGGAT 

SBQ ZD NO. 5609 
STRAIN JM9 130013 

AAGAAGCTTACi"riTATTTGGGATTTAGATGGGACATTAATAGA 

TTCGTATGTACCAATTATGGAAGCTCTTGAAGAAACXn'ATCGTCA 

TGATAAAGAATTAATCCATGAATATATTTTACAGGAATCAGT^^ 

CCTTTC^GAGGAAGAGCAAATACXjrCATGAAAAACTGAAAG CATATITTACAAAAGAACA 

AGAAAGTCGAGATTCTAAAATACATTTAATGCCATATGCAA 

CAAAGAACAAGATATCCCCAATTTTATGTATACACA^ 

GTTGGAAACCTTGCAGATCTCTCATTATTTTGATC 

CGAGCGAAAACCACATCCACAAGGGATTAATTATTTAGTTAA 

ATCAATGACrTATTACATAGGAGATCGTCCACIAG CTCAAAATGCTGG 

TATAAAATCCATAAACTTAAGGTTAGAGAATTCCAAAGAAAACT 

CAAAGATATAATATCACTTGATTTCACTCGT 

SEQ ZD NO. 5610 

STRAIN (feO 

AAGAAGCTTACTTTTATTTGG 

GATTTAGATGGGACATTAATAGATTCGTATGTACC^ 

TGAAGAAACCTATCGTCATTTTGGCTTAA^^ 

ATG^TATATTTTACAGGAATCAGTGGGGCAAITATTG 

GAGGAAGAG CAAATACCTCATGAAAAACTGAAAGCATATTTTACAAAAGA 

ACAAGAAAGTCGAGATTCTAAAATACATTTAATG CCA^ 

TTTTAGAATGGACGAAAGAACAAGATATCCCC^ 

AAAGGAGOVAGTAOTCATTCAGTGTTGGAAACCrTGCAGATC 

CACAAGGGATTAATTATTrAGTTAAACGATAl"lVriTAGATAAATCAA^ 
ACTTATTACATAGGAGATCGTCCX!CTAGATTTGG C 
TGGTATAAAATCCATAAACTTAAGGTTAGAGAATTCCAAAGAAAACTATA 
ATATTTCAAGTCTCAAGGATATAATATCAC^ 

SEQ ZD NO. S611 
STRAIN M781 

AAGAAGCTTACTTTTATTTGGGATTTAGATGGGACATT^ 

ATGTACCAATTATGQAAGCTCTTGAAGAAA(XriATCX3TCA 

ATATTTGATAAAGAATTAATCCATGAATATATTTTACAGGAATC 

GCAATTATTGGTAAACCTTTCAGAGGAAGAGCAAATACCTC^ 

TGAAAGCATATTTTACAAAAGAACAAGAAAGTOSAGATTyTAAAA 

TTAATGCCATATGCAAAAGAGATTTTAGAATGGAC 

TCCCAATTTTATGTATACACAT AAAGQ AGCAAG TACG CATTCAGT GTTG G 
AAACCTTGCAGATCTCTCATTATtTTGATGAAAT^ 

GGATTCGAGCGAAAACCACATC CACAAGGGATTAATTATTTAGTTAAACG 

ATATTCrrrAGATAAATCAATGACTTATTACATAGGAGA^ 

ATTTGGAGGTTGCrCAAAATGCTGGTATAAAATCCATA 

GAGAATTCCAAAGAAAACTATAATATTTCAAGTCTCAAAGATATAATATC 

ACTTGATTTCACTCGT 

PRETTY of: /biotrnp/mfla45163 .2 {*} January 21, 2003 06:53 . 
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msa4S163.2(240_18RS2V 
msa45163.2{240_2603 | 
msa45163 . 2 1 240_A909 ( 
msa4 5 16 3 . 2 { 24 0_H3 6B 
msa45163.2{240 JM9130013 
rasa45163 .2(240_COHl 
msa45163.2{240_M732 
msa45163 . 2 { 240_M781 
rasa45163.2{240_090 
msa45163 . 2 { 240 JCJB110 
msa45163.2{240_1169NT 
Consensus 



AAGAAGCTTA 
AAGAAGCTTA 
AAGAAGCTTA 
AAGAAGCTTA 
AAGAAGCTTA 
AAGAAGCTTA 
AAGAAGCTTA 
AAGAAGCTTA 
AAGAAGCTTA 
AAGAAGCTTA 
AAGAAGCTTA 



CTTTTATTTG 
CTTTTATTTG 
CTTTTATTTG 
CTTTTATTTG 
CTTTTATTTG 
CTTTTATTTG 
CTTTTATTTG 
CTTTTATTTG 
CTTTTATTTG 
CTTTTATTTG 
CTTTTATTTG 



GGATTTAGAT 
GGATTTAGAT 
GGATTTAGAT 
GGATTTAGAT 
GGATTTAGAT 
GGATTTAGAT 
GGATTTAGAT 
GGATTTAGAT 
GGATTTAGAT 
GGATTTAGAT 
GGATTTAGAT 



GGGACATTAA 
GGGACATTAA 
GGGACATTAA 
GGGACATTAA 
GGGACATTAA 
GGGACATTAA 
GGGACATTAA 
GGGACATTAA 
GGGACATTAA 
GGGACATTAA 
GGGACATTAA 



50 

TAGATTCGTA 
TAGATTCGTA 
TAGATTCGTA 
TAGATTCGTA 
TAGATTCGTA 
TAGATTCGTA 
TAGATTCGTA 
TAGATTCGTA 
TAGATTCGTA 
TAGATTCGTA 
TAGATTCGTA 



msa45163 . 2 { 240_18RS21 
msa45163 . 2 ( 240_2603 
msa45163.2{240_A909 
msa45163.2{240_H36B 
msa45163 . 2 {240_JM9130013 
msa45163 . 2 (240_COH1 
msa45163 . 2 ( 240_M732 
msa45163.2{240_M7Bl 
msa45163.2{240_090 
msa45163 ,2{240_CJB110 
msa45163.2{240_1169OT 
Consensus 



51 

TGTACCAATT 
TGTACCAATT 
TGTACCAATT 
TGTACCAATT 
TGTACCAATT 
TGTACCAATT 
TGTACCAATT 
TGTACCAATT 
TGTACCAATT 
TGTACCAATT 
TGTACCAATT 



ATgGAAGCTC 
ATgGAAGCTC 
ATgGAAGCTC 
ATgGAAGCTC 
ATgGAAGCTC 
ATgGAAGCTC 
ATgGAAGCTC 
ATgGAAGCTC 
ATgGAAGCTC 
ATgGAAGCTC 
ATaGAAGCTC 



TTGAAGAAAC 
TTGAAGAAAC 
TTGAAGAAAC 
TTGAAGAAAC 
TTGAAGAAAC 
TTGAAGAAAC 
TTGAAGAAAC 
TTGAAGAAAC 
TTGAAGAAAC 
TTGAAGAAAC 
TTGAAGAAAC 



CTATCGTCAT 
CTATCGTCAT 
CTATCGTCAT 
CTATCGTCAT 
CTATCGTCAT 
CTATCGTCAT 
CTATCGTCAT 
CTATCGTCAT 
CTATCGTCAT 
CTATCGTCAT 
CTATCGTCAT 



100 

TTTGGtTTAA 
TTTGGtTTAA 
TTTGGtTTAA 
TTTGGtTTAA 
TTTGGtTTAA 
TTTGGcTTAA 
TTTGGcTTAA 
TTTGGCTTAA 
TTTGGcTTAA 
TTTGGcTTAA 
TTTGGcTTAA 



msa45163 . 2 {240 JL8RS21 \ 
msa45163 . 2 (240_2603 
Itisa45163 . 2 (240_A909 
msa45163.2{240_H36B 
tnsa4S163.2{240_JM9130013 
msa45163.2(240_COHl 
msa45163.2(240_M732 
msa45163 .2{240_M781 
insa45163.2{240_090 
rasa45163.2{240_CJB110 
msa45163 . 2 {240_1169NT 
Consensus 



msa45163.2{240_18RS2i; 
msa45163 . 2 { 240J2603 ( 
msa45163.2{240_A909 
msa45163 . 2 (240_H36B 
msa45163 . 2 {240_JM9130013 
msa4 5163 . 2 { 24 0_C0H1 
xnsa45163.2 (240 M732 
msa45163 . 2 { 240 J4781 
rasa45163 .2{240_090 
msa45163 . 2 { 240_CJB110 
msa45163.2{240_1169NT 
Consensus 



101 

TATTTGATAA 
TATTTGATAA 
TATTTGATAA 
TATTTGATAA 
TATTTGATAA 
TATTTGATAA 
TATTTGATAA 
TATTTGATAA 
TATTTGATAA 
TATTTGATAA 
TATTTGATAA 
********** 

151 

aAATTATTGG 
aAATTATTGG 
aAATTATTGG 
aAATTATTGG 
aAATTATTGG 
CAATTATTGG 
cAATTATTGG 
CAATTATTGG 
.CAATTATTGG 
CAATTATTGG 
aAATTATTGG 



AGAATTAATC 
AGAATTAATC 
AGAATTAATC 
AGAATTAATC 
AGAATTAATC 
AGAATTAATC 
AGAATTAATC 
AGAATTAATC 
AGAATTAATC 
AGAATTAATC 
AGAATTAATC 
********** 



CATGAATATA 
CATGAATATA 
CATGAATATA 
CATGAATATA 
CATGAATATA 
CATGAATATA 
CATGAATATA 
CATGAATATA 
CATGAATATA 
CATGAATATA 
CATGAATATA 
********** 



TTTTACAGGA 
TTTTACAGGA 
TTTTACAGGA 
TTTTACAGGA 
TTTTACAGGA 
TTTTACAGGA 
TTTTACAGGA 
TTTTACAGGA 
TTTTACAGGA 
TTTTACAGGA 
TTTTACAGGA 
********** 



TAAAC CTTT C 
TAAACCTTTC 
TAAACCTTTC 
TAAAC CTTT C 
TAAACCTTTC 
TAAACCTTTC 
TAAACCTTTC 
TAAACCTTTC 
TAAACCTTTC 
TAAACCTTTC 
TAAACCTTTC 



AGAGGAAGAG 
AGAGGAAGAG 
AGAGGAAGAG 
AGAGGAAGAG 
AGAGGAAGAG 
AGAGGAAGAG 
AGAGGAAGAG 
AGAGGAAGAG 
AGAGGAAGAG 
AGAGGAAGAG 
AGAGGAAGAG 



CAAATACCTC 
CAAATACCTC 
CAAATACCTC 
CAAATACCTC 
CAAATACCTC 
CAAATACCTC 
CAAATACCTC 
CAAATACCTC 
CAAATACCTC 
CAAATACCTC 
CAAATACCTC 



150 

ATCAGTGGGG 
ATCAGTGGGG 
ATCAGTGGGG 
ATCAGTGGGG 
ATCAGTGGGG 
ATCAGTGGGG 
ATCAGTGGGG 
ATCAGTGGGG 
ATCAGTGGGG 
ATCAGTGGGG 
ATCAGTGGGG 
********** 

200 

ATGAAAAACT 
ATGAAAAACT 
ATGAAAAACT 
ATGAAAAACT 
ATGAAAAACT 
ATGAAAAACT 
ATGAAAAACT 
ATGAAAAACT 
ATGAAAAACT 
ATGAAAAACT 
ATGAAAAACT 



ms a4 5163 . 2 { 24 0_1 8RS2 1 
msa45163 . 2 (240_2603 
tnsa45163 . 2 f 240_A909 
msa45163.2{240_H36B 
tnsa45163.2{240_JM9130013 
msa45163 . 2 { 240_COH1 
msa45163.2(240_M732 
msa45163.2{240_M781 
msa45163 .2{240_090 
msa45163 . 2 (240^013110 
msa45163 . 2 { 240_1169NT 
Consensus 



201 

GAAAGCATAT 
GAAAGCATAT 
GAAAGCATAT 
GAAAGCATAT 
GAAAGCATAT 
GAAAGCATAT 
GAAAGCATAT 
GAAAGCATAT 
GAAAGCATAT 
GAAAGCATAT 
GAAAGCATAT 



TTTACAAAAG 
TTTACAAAAG 
TTTACAAAAG 
TTTACAAAAG 
TTTACAAAAG 
TTTA CAAAAG 
TTTACAAAAG 
TTTACAAAAG 
TTTACAAAAG 
TTTACAAAAG 
TTTACAAAAG 



AACAAGAAAG 
AACAAGAAAG 
AACAAGAAAG 
AACAAGAAAG 
AACAAGAAAG 
AACAAGAAAG 
AACAAGAAAG 
AACAAGAAAG 
AACAAGAAAG 
AACAAGAAAG 
AACAAGAAAG 



TCGAGATTcT 
TCGAGATTcT 
TCGAGATTcT 
TCGAGATTCT 
TCGAGATTcT 
TCGAGATTcT 
TCGAGATTcT 
TCGAGATTyT 
TCGAGATTCT 
TCGAGATTcT 
TCGAGATTcT 



250 

AAAATACATT 
AAAATACATT 
AAAATACATT 
AAAATACATT 
AAAATACATT 
AAAATACATT 
AAAATACATT 
AAAATACATT 
AAAATACATT 
AAAATACATT 
AAAATACATT 



msa45163.2{240_18RS2l' 
msa45163.2{240_2603 
msa4 5163 . 2 { 240_A909 
tnsa45163.2{240 H36B 
msa45163 . 2 {240_JM9130013 
insa45163 . 2 (240_COH1 
msa4 5163 . 2 ( 240_M732 
msa45163 -2(240 M781 
msa45163.2{240_090 
msa45163.2(240_CJB110 
rasa45163.2{240_1169NT 
Consensus 



251 

TAATGCCATA 
TAATGCCATA 
TAATGCCATA 
TAATGCCATA 
TAATGCCATA 
TAATGCCATA 
TAATGCCATA 
TAATGCCATA 
TAATGCCATA 
TAATGCCATA 
TAATGCCATA 



tGCAAAAGAG 
tGCAAAAGAG 
tGCAAAAGAG 
tGCAAAAGAG 
tGCAAAAGAG 
tGCAAAAGAG 
tGCAAAAGAG 
tGCAAAAGAG 
tGCAAAAGAG 
tGCAAAAGAG 
CGCAAAAGAG 



ATTTTAGAAT 
ATTTTAGAAT 
ATTTTAGAAT 
ATTTTAGAAT 
ATTTTAGAAT 
ATTTTAGAAT 
ATTTTAGAAT 
ATTTTAGAAT 
ATTTTAGAAT 
ATTTTAGAAT 
ATTTTAGAAT 



GGACCAAAGA 
GGACCAAAGA 
GGACCAAAGA 
GGACCAAAGA 
GGACCAAAGA 
GGACCAAAGA 
GGACCAAAGA 
GGACCAAAGA 
GGACCAAAGA 
GGACCAAAGA 
GGACCAAAGA 



300 

ACAAGATATc 
ACAAGATATc 
ACAAGATATc 
ACAAGATATc 
ACAAGATATc 
ACAAGATATt 
ACAAGATATt 
ACAAGATATt 
ACAAGATATc 
ACAAGATATc 
ACAAGATATc 



893 



WO 2004/018646 
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Table 56: Comparative Sequences relating t SAG0806 



msa45163 . 2 {240_18RS21 
msa45163. 2(240 2603 
maa45163 . 2 (240~A909 
msa4 516 3 . 2 { 2 4 0_H3 6B 
maa45163.2(240_JM9130013 
msa45163 . 2 { 240_COH1 
msa45163 . 2 ( 240J4732 
msa45163.2{240 M781 
msa45163 .2{240_090 
msa4S163.2(240 CJB110 
maa45163 .2(240~1169NT 
Consensus 



301 

CCCAATTTTA 

cccaatttta 

CCCAATTTTA 
CCCAATTTTA 
CCCA ATTTTA 
CCCAATTTTA 
CCCAATTTTA 
CCCAATTTTA 
CCCAATTTTA 
CCCAA TTTTA 
CCCAATTTTA 



TGTATACACA 
TGTATACACA 
TGTATACACA 
TGTATACACA 
TGTATACACA 
TGTATACACA 
TGTATACACA 
TGTATACACA 
TGTATACACA 
TGTATACACA 
TGTATACACA 



TAAAGGAGCA 
TAAAGGAGCA 
TAAAGGAGCA 
TAAAGGAGCA 
TAAAGGAGCA 
TAAAGGAGCA 
TAAAGGAGCA 
TAAAGGAGCA 
TAAAGGAGCA 
TAAAGGAGCA 
TAAAGGAGCA 



AGTACGCATT 
AGTACGCATT 
AGTACGCATT 
AGTACGCATT 
AGTACGCATT 
AGTACGCATT 
AGTACGCATT 
AGTACGCATT 
AGTACGCATT 
AGTACGCATT 
AGTACGCATT 



350 

CAGTGTTGGA 
CAGTGTTGGA 
CAGTGTTGGA 
CAGTGTTGGA 
CAGTGTTGGA 
CAGTGTTGGA 
CAGTGTTGGA 
CAGTGTTGGA 
CAGTGTTGGA 
CAGTGTTGGA 
CAGTGTTGGA 



msa45163 . 2 { 240_18RS21 
msa45163.2(240_2603 
msa45163 . 2 ( 240_A909 
msa4S 16 3 . 2 { 2 4 0_H3 6B 
msa45163 .2(240 JM9130013 
msa45163.2 j240_COHl 
msa45163.2(240_M732 
msa4 5 1 63 . 2 ( 2 4 0_M7 8 1 
msa45163 . 2 { 24 0_090 
msa45163. 2(240 CJB110 
msa45163 . 2 (240~1169NT 
Consensus 



351 

AACCTTGCAG 
AACCTTGCAG 
AACCTTGCAG 
AACCTTGCAG 
AACCTTGCAG 
AACCTTGCAG 
AACCTTGCAG 
AACCTTGCAG 
AACCTTGCAG 
AACCTTGCAG 
AACCTTGCAG 



ATCTCTCATT 
ATCTCTCATT 
ATCTCTCATT 
ATCTCTCATT 
ATCTCTCATT 
ATCTCTCATT 
ATCTCTCATT 
ATCTCTCATT 
ATCTCTCATT 
ATCTCTCATT 
ATCTCTCATT 



ATTTTGATGA 
ATTTTGATGA 
ATTTTGATGA 
ATTTTG ATGA 
ATTTTGATGA 
ATTTTGATGA 
ATTTTGATGA 
ATTTTGATGA 
ATTTTG ATGA 
ATTTTGATGA 
ATTTTGATGA 



AATTTTAACT 
AATTTTAACT 
AATTTTAACT 
AATTTTAACT 
AATTTTAACT 
AATTTTAACT 
AATTTTAACT 
AATTTTAACT 
AATTTTAACT 
AATTTTAACT 
AATTTTAACT 



400 

GGTGTTTCgG 
GGTGTTTCgG 
GGTGTTTCgG 
GGTGTTTCgG 
GGTGTTTCgG 
GGTGTTTCgG 
GGTGTTTCgG 
GGT GTTT CgG 
GGTGTTTCtG 
GGTGTTTCt:G 
GGTGTTTCgG 



msa45163.2(240 18RS21 
msa45163.2{240 2603 
tnsa45163 . 2 { 240~A909 
msa45163 . 2 { 240_H36B 
msa45163.2(240_JM9130013 
msa45 163 . 2 { 2 4 0_COH1 
msa45163 - 2 ( 240_M732 
msa45163 . 2 { 24 0_M7 81 
msa45163.2{240 090 
msa45163.2(240 CJB110 
msa45163 .2(240JL169NT 
Consensus 



401 

GATTCGAGCG 
GATTOGAGOG 
GATTCGAGCG 
GATTCGAGCG 
GATTCGAGCG 
GATTCGAGCG 
GATTCGAGCG 
GATTCGAGCG 
GATTCGAGCG 
GATTCGAGCG 
GATTCGAGCG 



AAAACCACAT 
AAAACCACAT 
AAAACCACAT 
AAAACCACAT 
AAAACCACAT 
AAAACCACAT 
AAAACCACAT 
AAAACCACAT 
AAAACCACAT 
AAAACCACAT 
AAAACCACAT 



CCACAAGGGA 
CCACAAGGGA 
CCACAAGGGA 
CCACAAGGGA 
CCACAAGGGA 
CCACAAGGGA 
CCACAAGGGA 
CCACAAGGGA 
CCACAAGGGA 
CCACAAGGGA 
CCACAAGGGA 



TTAATTATTT 
TTAATTATTT 
TTAATTATTT 
TTAATTATTT 
TTAATTATTT 
TTAATTATTT 
TTAATTATTT 
TTAATTATTT 
TTAATTATTT 
TTAATTATTT 
TTAATTATTT 



450 

AGTTAAACGA 
AGTTAAACGA 
AGTTAAACGA 
AGTTAAACGA 
AGTTAAACGA 
AGTTAAACGA 
AGTTAAACGA 
AGTTAAACGA 
AGTTAAACGA 
AGTTAAACGA 
AGTTAAACGA 



msa45163.2{240 18RS21 
msa45163 . 2 (240_2603 
ixisa45163.2{240_A90^ 
msa45163.2{240_H36B 
msa45163.2{240 JM9130013 
msa45163 .21 240_COH1 
msa45163.2(240_M732 
msa45163 L 2 { 240_M7 8 1 
msa4 51 63 . 2 { 2 4 0_0 9 0 
msa45163 . 2 (240_CJB110 
msa45163.2(240_1169NT 
Consensus 



451 

TATTCTTTAG 
TATTCTTTAG 
TATTCTTTAG 
TATTCTTTAG 
TATTCTTTAG 
TATTCTTTAG 
TATTCTTTAG 
TATTCTTTAG 
TATTCTTTAG 
TATTCTTTAG 
TATTCTTTAG 



ATAAATCAAT 
ATAAATCAAT 
ATAAATCAAT 
ATAAATCAAT 
ATAAATCAAT 
ATAAATCAAT 
ATAAATCAAT 
ATAAATCAAT 
ATAAATCAAT 
ATAAATCAAT 
ATAAATCAAT 



GACTTATTAC 
GACTTATTAC 
GACTTATTAC 
GACTTATTAC 
GACTTATTAC 
GACTTATTAC 
GACTTATTAC 
GACTTATTAC 
GACTTATTAC 
GACTTATTAC 
GACTTATTAC 



ATAGGAGATC 
ATAGGAGATC 
ATAGGAGATC 
ATAGGAGATC 
ATAGGAGATC 
ATAGGAGATC 
ATAGGAGATC 
ATAGGAGATC 
ATAGGAGATC 
ATAGGAGATC 
ATAGGAGATC 



500 

GTCCaCTAGA 
GTCCaCTAGA 
GTCCaCTAGA 
GTCCaCTAGA 
GTCCaCTAGA 
GTCCaCTAGA 
GTCCaCTAGA 
GTCCaCTAGA 
GTCCcCTAGA 
GTCCcCTAGA 
GTCCcCTAGA 



rosa45163.2{240 18RS21 
ntsa45163 . 2 (240_2603 ' 
tnsa4 5 1 63 . 2 { 24 0_A909 
msa45163.2(240_H36B 
msa45163.2(240 JM9130013 
nisa45163 .2(240 COH1 
msa45163 . 2 (240J4732 
msa45163.2(240_M781 
msa45163.2{240 090 
msa45163. 2(240 CJB110 
msa45163 . 2 { 240~1169NT 
Consensus 



501 

TTTGGAGGTT 
TTTGGAGGTT 
TTTGGAGGTT 
TTTGGAGGTT 
TTTGGAGGTT 
TTTGGAGGTT 
TTTGGAGGTT 
TTTGGAGGTT 
TTTGGAGGTT 
TTTGGAGGTT 
TTTGGAGGTT 



GCTCAAAATG 
GCTCAAAATG 
GCTCAAAATG 
GCTCAAAATG 
GCTCAAAATG 
GCTCAAAATG 
GCTCAAAATG 
GCTCAAAATG 
GCTCAAAATG 
GCTCAAAATG 
GCTCAAAATG 



CTGGTATAAA 
CTGGTATAAA 
CTGGTATAAA 
CTGGTATAAA 
CTGGTATAAA 
CTGGTATAAA 
CTGGTATAAA 
CTGGTATAAA 
CTGGTATAAA 
CTGGTATAAA 
CTGGTATAAA 



ATCCATAAAC 
ATCCATAAAC 
ATCCATAAAC 
ATCCATAAAC 
ATCCATAAAC 
ATCCATAAAC 
ATCCATAAAC 
ATCCATAAAC 
ATCCATAAAC 
ATCCATAAAC 
ATCCATAAAC 



550 

TTAAGGTTAG 
TTAAGGTTAG 
TTAAGGTTAG 
TTAAGGTTAG 
TTAAGGTTAG 
TTAAGGTTAG 
TTAAGGTTAG 
TTAAGGTTAG 
TTAAGGTTAG 
TTAAGGTTAG 
TTAAGGTTAG 



551 600 

msa45163.2{240_18RS2l) AGAATTCCAA AGAAAACTAT AATATTTCAA GTCTCAAaGA TATAATATCA 

msa4 5163 .2(240 26031 AGAATTCCAA AGAAAACTAT AATATTTCAA GTCTCAAaGA TATAATATCA 

tnsa45163.2(240~A909> AGAATTCCAA AGAAAACTAT AATATTTCAA GTCTCAAaGA TATAATATCA 

maa45163.2{240__H36B> AGAATTCCAA AGAAAACTAT AATATTTCAA GTCTCAAaGA TATAATATCA 

msa45163 .2 (240_JM9130013 \ AGAATTCCAA AGAAAACTAT AATATTTCAA GTCTCAAaGA TATAATATCA 

msa45163.2(240_COHl) AGAATTCCAA AGAAAACTAT AATATTTCAA GTCTCAAaGA TATAATATCA 

msa45163 .2(240_M732 > AGAATTCCAA AGAAAACTAT AATATTTCAA GTCTCAAaGA TATAATATCA 

msa45163 .2{240_M7811 AGAATTCCAA AGAAAACTAT AATATTTCAA GTCTCAAaGA TATAATATCA 

m sa45163 .2{240_090 J AGAATTCCAA AGAAAACTAT AATATTTCAA GTCTCAAgGA TATAATATCA 

msa45163.2|240_CJB110) AGAATTCCAA AGAAAACTAT AATATTTCAA GTCTCAAgGA TATAATATCA 

msa45163.2{240_1169NT} AGAATTCCAA AGAAAACTAT AATATTTCAA GTCTCAAgGA TATAATATCA 



894 



WO 2004/018646 
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Table 56: Comparative Sequences relating to SAG0806 



Consensus 



msa4 S163 . 2 { 240_18RS2 1 
msa45163 . 2 (240_2603 ' 
msa45163 . 2 { 240_A909 
rasa4 5163 . 2 { 24 0_H3 6B > 
msa45163.2{240_JM9130013 f 
rasa45163.2f240_COHl> 
msa45163 . 2 f 240J4732 t 
msa45163.2{240 M781 | 
msa45163.2{240_090 
msa45163 . 2 ( 240_CJB110 
maa45163 . 2 { 240_1169NT 
Consensus 

SEQ ZD NO. 5612 
STRAIN 2603 frame: 1 
KKLTF I WDLDGTLI DSYVP I MEALEETYRHFGL I FDKELIHEYI LQESVGKLLVNLSEEB 
QI PHEKLKAYFTKEQESRDS KI HLMPYAKE ILEWTKEQDI PNFMYTHKGASTHSVLETLQ 
I SHYFDE I LTGVSGFERKPHPQG I NYLVKRYSLDKSMTYY IGDRPLDLEVAQNAGI KS IN 
LRLBNSKENYN I SSLKD 1 1 SLDFTRLD 

SEQ ID NO* 5613 

STRAIN A909 frame i 1 

KKLTF IWDLDGTLIDS YVP IMEALEETYRHFGL I FDKELI HE YI LQESVGKLLVNLSEEE 
QIPHEKLKAYFTKBQBSRDSKI HLMPYAKE ILEWTKEQDI PNFMYTHKGASTHSVLETLQ 
I SHYFDE I LTGVSGFERKPHPQG I NYLVKRYS LDKSMTYY I GDRPLDLEVAQNAG I KS I N 
LRLENSKENYNI SSLKD I ISLDFTR 

SEQ ZD NO* 5614 

STRAIN H36B frame: 1 

KKLTF I WDLDGTL I DSYVP I MEALEETYRHFGL I FDKELIHEYI LQESVGKLLVNLSEBB 
QI PHEKLKAYFTKEQESRDSKI HLMPYAKE ILEWTKEQD I PNFMYTHKGASTHSVLETLQ 
I SHYFDBILTGVSGFI3RKPHPQG INYLVKRYSLDKSMTYY I GDRPLD LEVAQNAG I KS IN 
LRLENSKENYNI SSLKD 1 1 SLDFTRLD 

SEQ ZD NO. 5615 
STRAIN 18RS21 frame: 1 

KKLTFITOLDGTLIDSYVPIMEALEETYRHFGLIFDKKLIHEYIIiQESVG 
QI PHEKLKAYFTKEQESRDSKIHLMPYAKB ILEWTKEQD I PNFMYTHKGASTHSVLETLQ 
I SHYFDE I LTGVSGFERKPHPQG I NYLVKRYS LDKSMTYY I GDRPLDLEVAQNAG IKSIN 
LRLENSKENYNI SSLKD 1 1 SLDFTRLD 

SEQ ZD NO. 5616 

STRAIN M732 frame: 1 

KKLTFIWDLDGTLIDSYVPIMEALEETYRHFGLI FDKEL I HEY I LQESVGQLLVNLSEEE 
QIPHEKLKAYFTKEQF^FJDSKI HLMPYAKE ILEWTKEQDI PNFMYT^ 
I SHYFDEI LTGVSGFI2RKPHPQGINYLVKRYSLDKSMTYY I GDRPLDLEVAQNAG I KS IN 
LRLENSKENYNI SSLKD 1 1 SLDFTRLD 

SEQ ZD NO. 5617 

STRAIN COH1 frame: 1 

KKLTFIWDI^DGTLIDSYVPIMEALEETYRHFGLI FD KEL I HEY I LQESVGQLLVNLS EEE 
QI PHEKLKAYFTKEQESRDSKI HLMPYAKE ILEWTKEQD I PNFMYTHKGASTHSVLETLQ 
I SHYFDE I LTGVSGFEFJCPHPQG INYLVKRYS LDKSMTYY I GDRPLDLEVAQN^ I KS IN 
LRIjENSKEKYNI SSLKD 1 1 SLDFTRLD 

SEQ ZD NO. 5618 
STRAIN CJBllO frame: 1 

KKLTFIWDIiDGTLIDSYVPIMEALBETYRHFGLI FDKEL I HEY I LQESVGQLLVNLSEEE 
QI PHEKLKAYFTKEQESRDSKI HLMPYAKE I LEWTKEQD I PNFMYTHKGASTHSVLETLQ 
I SHYFDE I LTG^SG FERKPHPQG I NYLVKRYS IjDKSMTYY I 
LRLENSKENYNI SSLKD 1 1 SLDFTR 

SEQ ZD NO. 5619 
STRAIN 1169NT frame: 1 

KKLTF IWDLDGTLI DSYVP I IEALEETYRHFGLI FDKELIHEYI LQESVGKLLVNLSEEE 
QI PHEKLKAYFTKEQESRDSKI HLMPYAKE ILEWTKEQD I PNFMYTHKGASTHSVLETLQ 
I SHYFDE I LTGVSGFERKPHPQG I NYLVKRYS LD KSMTYY IGDRPLDLEVAQNAG I KS IN 
LRLENSKENYNI SSLKD 1 1 SLDFTRLD 

SEQ ZD NO. 5620 

STRAIN JM9130013 frame: 1 

KKLTFIWDLDGTLIDSYVPIMEALBETYRHFGLI FDKELIHEYI LQESVGKLLVNLSEEE 
QIPHEKLKAYFTKEQESRDSKIHLMPYAKEILEWTKEQDI PNFMYTHKGASTHSVLETLQ 
I SHYFDE I LTGVSG FBRKPHPQG INYLVKRYS LDKSMTYY I GDRPLDLEVAQNAG I KS I N 
LRLENSKENYNI SSLKD I ISLDFTR 

SEQ ZD NO. 5621 
STRAIN 090 frame: 1 

KKLTF I WDLDGTLI DSYVP IMEALEETYRHFGLI FDKEL I HEY I LQESVGQLLVNLSEEE 
QI PHEKLKAYFTKEQESRDSKI HLMPYAKE I LEWTKEQD I PNFMYTHKGASTHSVLETLQ 



601 621 
CTTGATTTCA CTCGTttgga t 
CTTGATTTCA CTCGTttgga t 

CTTGATTTCA CTCGT 

CTTG ATTT CA CTCGTttgga t 

CTTGATTTCA CTCGT 

CTTGATTTCA CTCGTttgga t 
CTTGATTTCA CTCGTttgga t 
CTTGATTTCA CTCGT-—— - 
CTTGATTTCA CTCGT——- - 

CTTGATTTCA CTCGT t- - 

CTTGATTTCA CTCGTttgga t 
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Table 56: C mparative Sequences relating to SAG0806 



I SHY PDE I LTGVSG FERKPH PQG I NYLVKRYS LD KSMTYY I GDR P LDLEVAQNAG I KS I N 
LRLENSKENYNISSLKDIISLDFTR 



SEQ XD MO. 5622 
STRAIN M781 frame t 1 

KKLTF I WDLDGTIil DSYVP I MEALEET YRHFGLI FDKEliI HEY I LQESVGQLLVNLS EES 
QI PHEKL KAYFTKEQES RDX KI HLMPYAKE I LEWTKEQD I PNFMYTHKGASTHSVLETLQ 
I SHYFDB I LTGVSGFERKPHPQG I NYLVKRYSLDKSMTYY I GDRPLDLEVAQNAG I KS IN 
LRLENS KENYNI SSLKD 1 1 SLDFTR 

PRETTY of: /biotmp/msa45645 . 2{*} January 21, 2003 06:57 



msa45645.2{240 18RS21 
msa4S645.2{240_A909 
maa45645.2{240_JM9130013 
maa45645.2{240_2603 
msa45645.2{240_H36B 
msa45645.2{240_090 1 
msa4564S.2{240_CJB110' 
msa45645.2(240_M781 
msa45645. 2(240 COH1 
rasa45645 . 2 (240_M732 
msa45645.2{240_1169NT 
Consensus 



KKLTF I WD LD 
KKLTF I WDLD 
KKLTFIWDLD 
KKLTF I WDLD 
KKLTFIWDLD 
KKLTFIWDLD 
KKLTFIWDLD 
KKLTFIWDLD 
KKLTFIWDLD 
KKLTFIWDLD 
KKLTFIWDLD 



GTLIDSYVPI 
GTLIDSYVPI 
GTLIDSYVPI 
GTLIDSYVPI 
GTLIDSYVPI 
GTLIDSYVPI 
GTLIDSYVPI 
GTLIDSYVPI 
GTLIDSYVPI 
GTLIDSYVPI 
GTLIDSYVPI 



tnEALEETYRH 
mEALEETYRH 
mEALEETYRH 
mEALEETYRH 
mEALEETYRH 
mEALEETYRH 
mEALEETYRH 
mEALEETYRH 
mEALEETYRH 
mEALEETYRH 
iBALEETYRH 



FGLIFDKELI 
FGLIFDKELI 
FGLIFDKELI 
FGLIFDKELI 
FGLIFDKELI 
FGLIFDKELI 
FGLIFDKELI 
FGLIFDKELI 
FGLIFDKELI 
FGLIFDKELI 
FGLIFDKELI 



50 

HEYILQESVG 
HEYILQESVG 
HEYILQESVG 
HEYILQESVG 
HEYILQESVG 
HEYILQESVG 
HEYILQESVG 
HEYILQESVG 
HEYILQESVG 
HEYILQESVG 
HEYILQESVG 



msa45645 . 2 { 240 JL8RS21 
msa45645.2{240_A909 
msa45645.2{240 JM9130013 
msa4 564 5 . 2 ( 2 4 0_2 603 
msa45645.2{240 H36B 
msa45645.2{240_090 
msa45645 . 2 { 240_CJB110 
msa45645.2{240_M781 
msa45645 . 2 { 240_COH1 
msa45645 . 2 (240_M732 
msa45645.2{240_1169NT 
Consensus 



51 1 

kLLVNLSEBB 
kLLVNLSEEE 
kLLVNLSEEB 
kLLVNLSEEE 
kLLVNLSEEB 
qLLVNLSEEE 
qLLVNLSEBE 
qLLVNLSEEE 
qLLVNLSEEE 
qLLVNLSEEE 
kLLVNLSEEE • 



Q I PHEKL KAY 
QIPHEKLKAY 
Q I PHEKL KAY 
QIPHEKLKAY 
QIPHEKLKAY 
QIPHEKLKAY 
QIPHEKLKAY 
QIPHEKLKAY 
QIPHEKLKAY 
QIPHEKLKAY 
QIPHEKLKAY 



FTKEQESRDs 



FTKEQBSRDs 
FTKEQESRDs 



FTKEQESRDs 
FTKEQESRDs 



_********* ********** *********_ 



KI HLMPYAKE 
KI HLMPYAKE 
KI HLMPYAKE 
KI HLMPYAKE 
KI HLMPYAKE 
KI HLMPYAKE 
KI HLMPYAKE 
KI HLMPYAKE 
KI HLMPYAKE 
KI HLMPYAKE 
KI HLMPYAKE 
********** 



100 

I LEWTKEQD I 
I LEWTKEQD I 
I LEWTKEQD I 
I LEWTKEQD I 
I LEWTKEQD I 
I LEWTKEQD I 
I LEWTKEQD I 
I LEWTKEQD I 
I LEWTKEQD I 
I LEWTKEQD I 
I LEWTKEQD I 
********** 



msa45645.2{240_18RS21 
msa45645.2{240_A909 
msa45645.2{240_JM9130013 
msa45645 . 2 {240_2603 
msa45645.2{240_H36B 
msa45645.2{240_090 
maa45645.2{240_CJB110 
msa45645.2(240_M781 
msa4564 5 . 2(240_COH1 
msa45645-2{240_M732 
msa4 5645 . 2 { 240JL169NT 
Consensus 



101 

PNFMYTHKGA 
PNFMYTHKGA 
PNFMYTHKGA 
PNFMYTHKGA 
PNFMYTHKGA 
PNFMYTHKGA 
PNFMYTHKGA 
PNFMYTHKGA 
PNFMYTHKGA 
PNFMYTHKGA 
PNFMYTHKGA 



STHSVLETLQ 
STHSVLETLQ 
STHSVLETLQ 
STHSVLETLQ 
STHSVLETLQ 
STHSVLETLQ 
STHSVLETLQ 
STHSVLETLQ 
STHSVLETLQ 
STHSVLETLQ 
STHSVLETLQ 



ISHYFDEILT 
ISHYFDEILT 
ISHYFDEILT 
ISHYFDEILT 
ISHYFDEILT 
ISHYFDEILT 
ISHYFDEILT 
ISHYFDEILT 
I SHYFDB I LT 
ISHYFDEILT 
ISHYFDEILT 



GVSG FERKPH 
GVSGFERKPH 
GVSGFERKPH 
GVSGFERKPH 
GVSGFERKPH 
GVSGFERKPH 
GVSGFERKPH 
GVSGFERKPH 
GVSGFERKPH 
GVSGFERKPH 



150 

PQGINYLVKR 
PQGINYLVKR 
PQGINYLVKR 
PQGINYLVKR 
PQGINYLVKR 
PQGINYLVKR 
PQGINYLVKR 
PQGINYLVKR 
PQGINYLVKR 
PQGINYLVKR 
PQGINYLVKR 



msa45645.2{240_18RS21 
tnsa4S645.2{240_A909 
msa45645.2{240 JM9130013 
msa45645 . 2 (240_2603 
msa45645 . 2 (240 H36B 
rasa45645.2{240 090 
msa4S645 . 2 { 240_CJB1 10 
msa45645.2(240_M781 
msa4S645.2(240 COH1 
msa45645 . 2 (240_M732 
msa45645 . 2 {240_1169NT; 

Consensus 



151 

YSLDKSMTYY 
YSLDKSMTYY 
YSLDKSMTYY 
YSLDKSMTYY 
YSLDKSMTYY 
YSLDKSMTYY 
YSLDKSMTYY 
YSLDKSMTYY 
YSLDKSMTYY 
YSLDKSMTYY 
YSLDKSMTYY 



IGDRPLDLEV 
IGDRPLDLEV 
IGDRPLDLEV 
IGDRPLDLEV 
IGDRPLDLEV 
IGDRPLDLEV 
IGDRPLDLEV 
IGDRPLDLEV 
IGDRPLDLEV 
IGDRPLDLEV 
IGDRPLDLEV 



AQNAGIKSIN 
AQNAGIKSIN 
AQNAGIKSIN 
AQNAGIKSIN 
AQNAGIKSIN 
AQNAGIKSIN 
AQNAGIKSIN 
AQNAGIKSIN 
AQNAGIKSIN 
AQNAGIKSIN 
AQNAGIKSIN 



LRLENSKENY 
LRLENSKENY 
LRLENSKENY 
LRLENSKENY 
LRLENSKENY 
LRLENSKENY 
LRLENSKENY 
LRLENSKENY 
LRLENSKENY 
LRLENSKENY 
LRLENSKENY 



200 

NISSLKDIIS 
NISSLKDIIS 
NISSLKDIIS 
NISSLKDIIS 
NISSLKDIIS 
NISSLKDIIS 
NISSLKDIIS 
NISSLKDIIS 
NISSLKDIIS 
NISSLKDIIS 
NISSLKDIIS 



msa45645 . 2 {240JL8RS21 ] 
msa4564S.2{240_A909 ( 
msa4 564 5 . 2 { 24 0_JM9 13 00 13 ' 
msa45645 . 2 ( 240_2603 
mfla45645.2{240 H36B 
msa45645.2{240_090 
msa45645 . 2 { 240_CJB110 
msa4 564 5 . 2 { 24 0_M7 8 1 
msa4 5645 . 2 ( 240_COH1 
msa4S645.2{240_M732 
rasa45645.2{240_1169NT 
Consensus 



201 

LDFTRld 
LDFTR — 
LDFTR — 
LDFTRld 
LDFTRld 
LDFTR — 
LDFTR — 
LDFTR — 
LDFTRld 
LDFTRld 
LDFTRld 
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SEQ ID NO: 5701 
STRAIN 2603 

ATGCTTATGACAAAAATAATAGGACTGACAGGAQGGATAGCTTCT 

GGAAAGTCAACGGTAACAAAAATAATACGAGAATGAGGTT^ 

CAAGTGGTTCATAAATTGCAAGCTAAGGGTGGGAAACTTTACCAAG 

TTGGGTCCCGAGATACnTGATGCTGATGGTGAGTTGGATAGACCA 

ATTTTTGCTAATCCAGACAATATGAAGA 

CAAGAGTTAGCATGTCAG CGCGACCAATTAAAACAAACAGAAGAGATATTTTTCATGG^ 

ATTCCTTTATTGATTGAAGAAAAGTATATAAAATGGTTTGAT^ 

GTTGATAAAGAAAAACAATTACAACGATTAATGGCrcOT 

GCAGAATTACGACTTTCACACCAAATGCCTTTAACAGATAAA 

ATTATTGACIAATAAT^XFrGATTTAATAACTTTAA 

CX3TTTA 

SEQ XD NO: 5702 
STRAIN 090 

AAGTCAACGGTAACAAAAATAATACGAGAATCAG 

GTTTTAAAGTCATAGATGCXK5ATCAAGTGGTTCATAAATTC CTAAG 

GGTGGGAAACTTTACCAAGOTTTATTAGAATG 

TGATGCTGATGGTGAGTTGGATAGACCAAAGCTTTCT 

CTAATCCAGACAATATGAAGACATCAGCTAGGCTACAAAATAOT 

CGTOUUSAGTTAGCATGTaVGaSCGACCAAT^ 

ATTITTCGTGGATATTCCTTTATTGATT 

TTGATGAGATTTGGTTGGTATTTCTTGATAA^ 

TTAATGGCCCGTAACAACTACACTCGAGAAGAAGCAGAATTAC^ 

ACACCAAATGCCTTTAACAGATAAAAAAAGTTTCX5CT 

ATAATAATGGTGATTTAATAACTTTAAAAGAGCAAATATTGGATGCT 

CAACGTTTA 

SEQ XD NO: 5703 
STRAIN A909 

AAGTCAACGGTAACAAAAATAATACGAGAATCAG 

GTTTTAAAGTCATAGATGCGGATCAAGTGGTTCA^ 

GGTGGGAAACTTTACCAAGCTTTATTAGAATG^^ 

TGATGCTGATGGTGAGTTGGATAGACCAAAGCTTTCT 

CTAATCCAGAGAATATGAAGACATCAGCTA 

CGTCAAGAGTTAGCATGTCAGCGCX3ACCAATTAAA^ 

ATTTTTCATGGATATTCCrTTATTGATTGAAGAAAAGTATATA 

TTGATGAGArriWl'JXSGTATrreTTGATAAAGAAAAACAAT^ 

TTAATGGCCOGTaAC!AACrACAGTCGAGAAGAAGCAGAATTACX^CTTTC 

ACACCAAATGCCTTTAACAGATAAAAAAAGTTTCGCTA 

ACAATAATGGTGATTTAATAACTTTAAAAGAGCAA^ 

CAACGTTTA 

SEQ XD NO: 5704 
STRAIN H36B 

AAGTCAACGGTAACAAAAATAATACGJVGAATCAGG 

TTTT AAAGTCATAGATGCGGATC^GTGGTTCATAAATTG CAAGCTAAGG 
GTGGGAAAC1TTACCAAGCTTTATTAGAATGGTTGGOT 
GATGCTGATGGTGAGTTGGATAGACCAAAGCTTTC^^ 
TAATCCAGAOATATGAAGACATCAGCTAG 

GTCAAGAGTTAG CATGT CAG CG CGACCAATTAAAACAAACAGAAGAGAT A 

TTTTTCATGGATATTCCITTATTX^TTGAAGAAA 

TGATGAGATTTGGTTGGTATTTGTra 

TAATGGCCCG tlAACAACTACAGTCGAGAAGAAGCGGAATTACGACTT^ 
CACCAAATACCTTTAACAGATAAAAAAAGTTTCGCT^^ 
TAATAATGGTGATTTAATAACTTTAAAAGAGCAAAT^ 
AACGTTTA 

SEQ XD NO: 5705 
STRAIN 18RS21 

AAGTCAACX3GTAACAAAAATAATACGAGAATCAGG 

TTTTAAAGTCATAGATGCGGATCAAGTGGTTCATAAATTC 

GTGGGAAACTTTACCAAGCTTTATTAGAATGGTTG 

GATGCTGATGGTGAGTTGGATAGACCAAAGCTTTCT 

TAATCCAGACAATATGAAGAC^TCAGCTAGGCTACAAAATAG 

GTCAAGAGTTAG CATGTCAGCGCGACX^VATTAA 

TTTTTC^TGGATATTCCTTTATTGATTGAAGA 

TGATGAGATTTGGTTGGTATTTGTTGATA 

TAATGGCCCGTAACAACTACAGTCGAGAAGAAGCAGAAT^ 

CACCAAATGCCTTTAAC^AGATAAAAAAAGTTTOGCT^ 

QUVTAATGGTGATTTAATAACTTTAAAAGAGC^ 

AACGTTTA 

SEQ ID NO: 5706 
STRAIN M732 

AAGTCAACGGTAACAAAAATAATACGAGAATCAGGTT 

TTAAAGTCATAGATGCGGATCAAGTGGTTCATAAATTGCAAGCT 

GGGAAACTITTACCAAGCTTTATTAGAAT^ 

TGCTGATGGTGAGTTGGATAGACCAAAGCT^ 

ATCCAGACAATAT<3AAGACATCAGCT!AGGCTAC^ 

CAAGAGTTAGCATG^SPCAGCGOGACCAATTAAAAC^^ 
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TTTCATGGATATTCCITTATTGATTGAAGAA 
ATGAGATTTGGTTGGTATTTGTTGATAAAGAAAAACAATC^ 

atggcccgtaacmciacagtcgagaagaagcagaattA^ 

ccaaatgcctttaacagataaaaaaagtttcgctact 

ataatggtg attt aataactttaaaagag caaatatixx^tg ctcttcaa 

CGTTTA 

SEQ ID NO: 5707 
STRAIN COHl 

AAGTCAACGGTAACAAAAATAATACGAGAATCAGGT 

TTTAAAGTC^TAGATGCGGATC^GTGGTTCATAAATTGCAAGCTAAGGG 

TGGGAAACTTTAa^VAGCTTTATTAGAATGGTTGGGTCCCGAGAT 

ATGCTGATGGTGAGTTGGATAGAC CAAAG CTTTCTCAAATGATTTTTGCT 

AATCCAGACAATATGAAGACATCAGCTAGGCTACAAAATAGTATCATTCG 

TCAAGAGTTAGCATGTCAGCX5CGACCAATTAAAACAAACAGAAGAGATAT 

TTTTCATGGATATTCCTTTATTGATTGAAGAAAAGTATATAAA^ 

GATGftGATTTGGTTGGTATTTGTTGATAAAGAAA 

AATCGCCCGTcLACAACTACAGTCGAGAAGAAGCAGAATTACXl^ 

ACCAAATGCCTTTAACAGATAAAAAAAGTTTCG CTAGTCTTATTATTGAC 

AATAATGGTGATTTAATAACTTTAAAAGAGCAA 

ACGTTTA 

SEQ ID NO x 5708 
STRAIN M781 

AAGTCAACGGTAACAAAAATAATACGAGAATCAGG 

TTTTAAAGTCAT AGATGCXXIATCAAGTGGTTCA^ CAAG CTAAGG 

GTGGGAAACTTTACCAAGCTTTATTAGAATGGTTGGGTCC 

GATGCTGATGGTGAGTTGGATAGACCAAAGCT^ 

TAATCCAGACAATATGAAGACATCAGCrrAGGCTACAAAATAGTATC^ 

GTCAAGAGTTAG CATGTCAGCG CGACCAATTAAAACAAACAGAAGAGATA 

TTTTTCATGGATATTCCTTTATTGATTGAAGA 

TGATGAGATTTGGTTGGTATTTGTTGATAAAGAAAAACS^ 

TAATGGCCXXSTAACAACTACAGTCGAGAAGAAGCAGAATTA^ 

C^CCAAATGCCTTTAACAGATAAAAAAAGTTTCGCTAGTC^ 

CAATAATGGTGATTTAATAACTTTAAAAGAG CAAATATTGGATGCTCTTC 

AACGTTTA 

SEQ ID NO: 5709 
STRAIN CJB110 

AAGTCAACGGTAACAAAAATAATACGAGAA 

TCAGGTIT^AAAGTCATAGATGCGGATCAAGTGGTTCATAAAT^ 

TAAGGGTGGGAAACTTTACCAAGCTTTATTAGAATGCTTO 

TACTTGATG CTGATGGTGAGTTGGATAGACC^AAGCTTrCTCAAATGATT 

TTTGCTAATCCAGACAATATGAAGACATCAGCrAG 

CATTCGTCAAGAGTXAGCATGTCAGCGCGACCAATTAAAACAAACA^ 

AGATATTTTTCGTGGATATTCCTTTATTGATTGA 

TGGTTTGATGAGATTTGGTTGGTATTTGTTGATA 

ACGATTAATGGCCXXn^aACAACTACAGTOGAGAA GAA GCAGAATTACGAC 
TTTCACACCAAATGCCTTTAACAGATATVAAAAAGTTTC^ 
ATTAATAATAATGGTGATTTAATAACTTTAAAAGAGCAAATATTGGATGC 
TCTTCAACGTTTA 

SEQ ID NO: 5710 
STRAIN 1169NT 

AAGTCAACGGTAACAAAAATAATACGAGAATCAGG 

TTTTAAAGTCATAGATGCGGATCAAGTGGTTCATAAATrc 

GTGGGAAACTTTACCAAGCTTTATTAGAA TCGT^ 

GATGCTGATGGTGAGTTGGATAGACCAAAGCITrCTCA 

TAATCCAGACAATATGAAGACATCAGCTAGGCTACAAAATAGTATCATTC 

GTCAAGAGTTAGCATGTCAG CGCGACCAATTAAAACAAACA^ 

TTTTTCATGGATATTCCTTTATTGA 

TCATGAGATTTGGTTGGTATTTGTTGATAAAGAAAAAC^ 

TAATGGCC03TAACAACTACAGTCGAGA AGAA GCAGAAT TA(^ C-ri-I<^ 

CACCAAATACCTT^AACAGATAAAAAAAGTl'l'CGCTAGT^ 

TAATAATGGTGATTTAATAACTTTAAAAGAGCAAATGTTGGATGCTC^ 

AACGTTTA 

SEQ ID NO: 57X1 
STRAIN JM9130013 

AAGTCAACGGTAACAAAAATAATACGAGAATCAGGT 

TTTAAAGTCATAGATGCGGATCAAGTGGTTCATAAAT^ 

TGGGAAACTTTACCAAGCTTTATTAGAATGGTTGG 

ATGCTGATGGTGAGTTGGATAGACCAAAGCTTT'CT 

AATCCAGACAATATGAAGACATCAGCTAGGCTAO^ 

TCAAGAGTTAGCATGTCAGCGCGACCAATTAAAACAAACA^ 

TITTCATGGATATTCCTTTATTGATTGAAGAAAAGTATATA 

GATGAGATTTGGTTGGTATTTGTTGATAAAGAAAAACAAT^ 

AATGGCCCGTAACAACTACAGTCGAGAAGAAGCGGAATTAOG^ 

ACCAAATACCTTTAACAGATAAAAAAAGTTTCGCT AGTCT TA 

AATAATGGTGATTT AATAACTTTAAAAGAG CAAATGTTGGATGCTCTTCA 

ACGTTTA 
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PRETTY of: /biotrap/msa221059.2{*} February 10, 2003 07:07 



msa221059.2{245_H36B 
tnsa221059.2{245_JM9130013 
msa221059.2{245_1169NT 
msa2210S9 . 2 {245_090 
msa221059.2{245_CJB110 
msa221059 . 2 { 245_18RS21 



msa221059.2 
maa221059.2 
msa221059 .2 
tnsa2210S9.2 
msa221059.2 



24S_2603 
245_A909^ 
245 COHl' 
245~M732 
245~M78l] 
Consensus 



50 
-AA 
-AA 
-AA 
-AA 
-AA 
-AA 



atgcttatga caaaaataat aggactgaca ggagggatag cttctggaAA 

... AA 

AA 

AA 

AA 



msa221059 . 2 { 245_H36B 
msa221059.2{245_JM9130013 
msa221059 . 2 { 245_1169NT 
msa221O59.2{245_090 
msa221059.2{245_CJB110 
msa221059.2{24S_18RS21 



tnsa221059.2 
msa221059.2 
msa221059.2 
msa221059.2 
msa221059.2 



245_2603 
245_A909 
245_COHl 
245_M732 
245_M781 
Consensus 



51 

GTCAACGGTA 
GTCAACGGTA 
GTCAACGGTA 
GTCAACGGTA 
GTCAACGGTA 
GTCAACGGTA 
GTCAACGGTA 
GTCAACGGTA 
GTCAACGGTA 
GTCAACGGTA 
GTCAACGGTA 



msa221059.2{245_H36B; 
msa221059.2{245_JM9130013 
msa221059 . 2 { 245_1169NT 
msa221059.2{245_090 
rasa221059 . 2 { 245_CJB110 
msa221059.2(245_18RS21 



msa221059.2 
msa221059.2 
msa221059.2 
msa221059.2 
msa221059.2 



245_2603 
245 A909 
245~COHl 
245_M732 
245_M781 
Consensus 



msa221059.2{245_H36B 
msa221059 . 2 {245_JM9130013 
msa221059 . 2 { 245JL169NT 
rasa221059 . 2 { 245_090 
msa221059.2t245_CJB110 
msa221059 . 2 (245_18RS21 



ins 3221059. 2 
msa221059.2 
msa221059.2 
msa221059.2 
msa221059.2 



245_2603 
245_A909 
245_C0H1 
245_M732 
245JW78* 
Consensus 



msa221059 .2{245_H36B 
msa221059 . 2 { 245JIM9130013 
msa221059 . 2 {245_1169NT 
msa221059.2{245 090 
msa221059.2{245_CJB110 
msa221059.2{245_18RS21 



msa221059.2 
msa221059.2 
msa221059.2 
msa221059.2 
maa221059.2 



245 2603 
24S~A909 
245~C0H1 
245_M732 
245JM781 
Consensus 



ACAAAAATAA 
ACAAAAATAA 
ACAAAAATAA 
ACAAAAATAA 
ACAAAAATAA 
ACAAAAATAA 
ACAAAAATAA 
ACAAAAATAA 
ACAAAAATAA 
ACAAAAATAA 
ACAAAAATAA 



TACGAGAATC 
TACGAGAATC 
TACGAGAATC 
TACGAGAATC 
TACGAGAATC 
TACGAGAATC 
TACGAGAATC 
TACGAGAATC 
TACGAGAATC 
TACGAGAATC 
TACGAGAATC 



AGGTTTTAAA 
AGGTTTTAAA 
AGGTTTTAAA 
AGGTTTTAAA 
AGGTTTTAAA 
AGGTTTTAAA 
AGGTTTTAAA 
AGG TTTT AAA 
AGGTTTTAAA 
AGGTTTTAAA 
AGGTTTTAAA 



100 

GTCATAGATG 
GTCATAGATG 
GTCATAGATG 
GTCATAGATG 
GTCATAGATG 
GTCATAGATG 
GTCATAGATG 
GTCATAGATG 
GTCATAGATG 
GTCATAGATG 
GTCATAGATG 



101 

CGGATCAAGT 
CGGATCAAGT 
CGGATCAAGT 
CGGATCAAGT 
CGGATCAAGT 
CGGATCAAGT 
CGGATCAAGT 
CGGATCAAGT 
CGGATCAAGT 
CGGATCAAGT 
CGGATCAAGT 



GGTTCATAAA 
GGTTCATAAA 
GGTTCATAAA 
GGTTCATAAA 
GGTTCATAAA 
GGTTCATAAA 
GGTTCATAAA 
GGTTCATAAA 
GGTTCATAAA 
GGTTCATAAA 
GGTTCATAAA 



TTGCAAGCTA 
TTGCAAGCTA 
TTGCAAGCTA 
TTGCAAGCTA 
TTGCAAGCTA 
TTGCAAGCTA 
TTGCAAGCTA 
TTGCAAGCTA 
TTGCAAGCTA 
TTGCAAGCTA 
TTGCAAGCTA 



AGGGTGGGAA 
AGGGTGGGAA 
AGGGTGGGAA 
AGGGTGGGAA 
AGGGTGGGAA 
AGGGTGGGAA 
AGGGTGGGAA 
AGGGTGGGAA 
AGGGTGGGAA 
AGGGTGGGAA 
AGGGTGGGAA 



150 

ACTTTACCAA 
ACTTTACCAA 
ACTTTACCAA 
ACTTTACCAA 
ACTTTACCAA 
ACTTTACCAA 
ACTTTACCAA 
ACTTTACCAA 
ACTTTACCAA 
ACTTTACCAA 
ACTTTACCAA 



151 

GCTTTATTAG 
GCTTTATTAG 
GCTTTATTAG 
GCTTTATTAG 
GCTTTATTAG 
GCTTTATTAG 
GCTTTATTAG 
GCTTTATTAG 
GCTTTATTAG 
GCTTTATTAG 
GCTTTATTAG 



AATGGTTGGG 
AATGGTTGGG 
AATGGTTGGG 
AATGGTTGGG 
AATGGTTGGG 
AATG GTTG GG 
AATGGTTGGG 
AATG GTTGG G 
AATGGTTGGG 
AATGGTTGGG 
AATGGTTGGG 



TCCCGAGATA 
TCCCGAGATA 
TCCCGAGATA 
TCCCGAGATA 
TCCCGAGATA 
TCCCGAGATA 
TCCCGAGATA 
TCCCGAGATA 
TCCCGAGATA 
TCCCGAGATA 
TCCCGAGATA 



CTTGATGCTG 
CTTGATGCTG 
CTTGATGCTG 
CTTGATGCTG 
CTTGATGCTG 
CTTGATGCTG 
CTTGATGCTG 
CTTGATGCTG 
CTTGATGCTG 
CTTGATGCTG 
CTTGATGCTG 



200 

ATGGTGAGTT 
ATGGTGAGTT 
ATGGTGAGTT 
ATGGTGAGTT 
ATGGTGAGTT 
ATGGTGAGTT 
ATGGTGAGTT 
ATGGTGAGTT 
ATGGTGAGTT 
ATGGTGAGTT 
ATGGTGAGTT 



201 

GGATAGACCA 
GGATAGACCA 
GGATAGACCA 
GGATAGACCA 
GGATAGACCA 
GGATAGACCA 
GGATAGACCA 
GGATAGACCA 
GGATAGACCA 
GGATAGACCA 
GGATAGACCA 



AAGCTTTCTC 
AAGCTTTCTC 
AAGCTTTCTC 
AAGCTTTCTC 
AAGCTTTCTC 
AAGCTTTCTC 
AAGCTTTCTC 
AAGCTTTCTC 
AAGCTTTCTC 
AAGCTTTCTC 
AAGCTTTCTC 



AAATGATTTT 
AAATGATTTT 
AAATGATTTT 
AAATGATTTT 
AAATGATTTT 
AAATGATTTT 
AAATGA TTTT 
AAATGATTTT 
AAATGATTTT 
AAATGATTTT 
AAATGATTTT 



TGCTAATCCA 
TGCTAATCCA 
TGCTAATCCA 
TGCTAATCCA 
TGCTAATCCA 
TGCTAATCCA 
TGCTAATCCA 
TGCTAATCCA 
TGCTAATCCA 
TGCTAATCCA 
TGCTAATCCA 



250 

GACAATATGA 

GACAATATGA 

GACAATATGA 

GACAATATGA 

GACAATATGA 

GACAATATGA 

GACAATATGA 

GACAATATGA 

GACAATATGA ' 

GACAATATGA 

GACAATATGA 



msa221059 . 2 { 245_H36B 
msa221059.2{245_JM9130013 
mS a221059.2{245_1169NT 
msa221059,2{245_090 
xnfla221059 . 2 (245_CJB110 
msa221059 . 2 (245_18RS21 



msa221059.2 
msa221059.2 
msa221059.2 
. tnsa221059.2 



245_2603 
245 A909 
245~C0H1 
245~M732 



251 

AGACATCAGC. 
AGACATCAGC 
AGACATCAGC 
AGACATCAGC 
AGACATCAGC 
AGACATCAGC 
AGACATCAGC 
AGACATCAGC 
AGACATCAGC 
AGACATCAGC 



TAGGCTACAA 
TAGGCTACAA 
TAGGCTACAA 
TAGGCTACAA 
TAGGCTACAA 
TAGGCTACAA 
TAGGCTACAA 
TAGGCTACAA 
TAGGCTACAA 
TAGGCTACAA 



AATAGTATCA 
AATAGTATCA 
AATAGTATCA 
AATAGTATCA 
AATAGTATCA 
AATAGTATCA 
AATAGTATCA 
AATAGTATCA 
AATAGTATCA 
AATAGTATCA 



TTCGTCAAGA 
TTCGTCAAGA 
TTCGTCAAGA 
TTCGTCAAGA 
TTCGTCAAGA 
TTCGTCAAGA 
TTCGTCAAGA 
TTCGTCAAGA 
TTCGTCAAGA 
TTCGTCAAGA 



300 

GTTAGCATGT 
GTTAGCATGT 
GTTAGCATGT 
GTTAGCATGT 
GTTAGCATGT 
GTTAGCATGT 
GTTAGCATGT 
GTTAGCATGT 
GTTAGCATGT 
GTTAGCATGT 
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msa221059.2{245_M78l} 
Consensus 



rasa221059.2{245_H36B* 
ms a2 2 10 59 . 2 { 24 5_JM9 13 0 0 13 
msa221059 . 2 { 245_1169NT 
msa221059. 2 {245_090 
msa221059.2(245 CJB110 
msa221059 . 2 { 245_18RS2 1 



AGACATCAGC TAGGCTACAA AATAGTATCA TTCGTCAAGA GTTAGCATGT 



msa221059.2 
msa2210S9.2 
msa2210S9.2 
tnsa221059.2 
msa221059.2 



245_2603 
245 A909 
245~COHl 
245J4732 
245_M7B1 
Consensus 



301 

CAGCGCGACC 
CAGCGCGACC 
CAGCGCGACC 
CAGCGCGACC 
CAGCGCGACC 
CAGCGCGACC 
CAGCGCGACC 
CAGCGCGACC 
CAGCGCGACC 
CAGCGCGACC 
CAGCGCGACC 



AATTAAAACA 
AATTAAAACA 
AATTAAAACA 
AATTAAAACA 
AATTAAAACA 
AATTAAAACA 
AATTAAAACA 
AATTAAAACA 
AATTAAAACA 
AATTAAAACA 
AATTAAAACA 



AACAGAAGAG 
AACAGAAGAG 
AACAGAAGAG 
AACAGAAGAG 
AACAGAAGAG 
AACAGAAGAG 
AACAGAAGAG 
AACAGAAGAG 
AACAGAAGAG 
AACAGAAGAG 
AACAGAAGAG 



ATATTTTTCa 
ATATTTTTCa 
ATATTTTTCa 
ATATTTTTCg 
ATATTTTTCg 
ATATTTTTCa 
ATATTTTTCa 
ATATTTTTCa 
ATATTTTTCa 
ATATTTTTCa 
ATATTTTTCa 



350 

TGGATATTCC 
TGGATATTCC 
TGGATATTCC 
TGGATATTCC 
TGGATATTCC 
TGGATATTCC 
TGGATATTCC 
TGGATATTCC 
TGGATATTCC 
TGGATATTCC 
TGGATATTCC 



rasa221059 . 2 {245_H36B 
msa221059 . 2 { 245_JM9130013 
msa221059 . 2 { 24 5_1169NT 
msa221059 . 2 { 245_090 
msa221059 .2{24S_CJB110 
msa221059 . 2 ( 245_18RS21 



msa221059.2 
msa221059.2 
msa221059.2 
rasa221059.2 
msa221059.2 



245_2603 
245_A909 
245_COHl 
245_M732 
245J4781 
Consensus 



351 

TTTATTGATT 
TTTATTGATT 
TTTATTGATT 
TTTATTGATT 
TTTATTGATT 
TTTATTGATT 
TTTATTGATT 
TTTATTGATT 
TTTATTGATT 
TTTATTGATT 
TTTATTGATT 



GAAGAAAAGT 
GAAGAAAAGT 
GAAGAAAAGT 
GAAGAAAAGT 
GAAGAAAAGT 
GAAGAAAAGT 
GAAGAAAAGT 
GAAGAAAAGT 
GAAGAAAAGT 
GAAGAAAAGT 
GAAGAAAAGT 



ATATAAAATG 
ATATAAAATG 
ATATAAAATG 
ATATAAAATG 
ATATAAAATG 
ATATAAAATG 
ATATAAAATG 
ATATAAAATG 
ATATAAAATG 
ATATAAAATG 
ATATAAAATG 



GTTTGATGAG 
GTTTGATGAG 
GTTTGATGAG 
GTTTGATGAG 
GTTTGATGAG 
GTTTGATGAG 
GTTTGATGAG 
GTTTGATGAG 
GTTTGATGAG 
GTTTGATGAG 
GTTTGATGAG 



400 

ATTTGGTTGG 
ATTTG GTTGG 
ATTTGGTTGG 
ATTTGGTTGG 
ATTTGGTTGG 
ATTTGGTTGG 
ATTTGGTTGG 
ATTTGGTTGG 
ATTTGGTTGG 
ATTTGGTTGG 
ATTTGGTTGG 



maa221059.2{245_H36B 
msa221059.2{245_JM9130013 
msa221059 . 2 { 245_1169NT 
rosa221059 . 2 {245_090 
msa221059.2f245_CJB110 
msa221059 . 2 { 245_18RS21 



rasa221059.2 
rasa221059.2 
msa221059.2 
nisa221059.2 
msa221059.2 



245_2603 
245_A909 
245_COHl 
245 M732 
24531781 
Consensus 



401 

TATTTGTTGA 
TATTTGTTGA 
TATTTGTTGA 
TATTTGTTGA 
TATTTGTTGA 
TATTTGTTGA 
TATTTGTTGA 
TATTTGTTGA 
TATTTGTTGA 
TATTTGTTGA 
TA TTTGTTG A 



TAAAGAAAAA 
TAAAGAAAAA 
TAAAGAAAAA 
TAAAGAAAAA 
TAAAGAAAAA 
TAAAGAAAAA 
TAAAGAAAAA 
TAAAGAAAAA 
TAAAGAAAAA 
TAAAGAAAAA 
TAAAGAAAAA 



CAATTACAAC 
CAATTACAAC 
CAATTACAAC 
CAATTACAAC 
CAATTACAAC 
CAATTACAAC 
CAATTACAAC 
CAATTACAAC 
CAATTACAAC 
CAATTACAAC 
CAATTACAAC 



GATTAATGGC 
GATTAATGGC 
GATTAATGGC 
GATTAATGGC 
GATTAATGGC 
GATTAATGGC 
GATTAATGGC 
GATTAATGGC 
GATTAATGGC 
GATTAATGGC 
GATTAATGGC 



450 

CCGTAACAAC 
CCGTAACAAC 
CCGTAACAAC 
CCGTAACAAC 
CCGTAACAAC 
CCGTAACAAC 
CCGTAACAAC 
CCGTAACAAC 
CCGTAACAAC 
CCGTAACAAC 
CCGTAACAAC 



msa221059 . 2 { 245_H36B 
msa221059 . 2 {245_JM9130013 
msa2 21059. 2{245_1169NT 
rasa221059.2{245_090 
msa221059 . 2 I 245_CJB110 
).2{245J 



msa221059. 
msa221059.2 
msa221059.2 
msa221059.2 
msa221059.2 
msa221059.2 



18RS21 
245_2603 
245_A909 
245_COHl 
245 M732 
245~M781 
Consensus 



451 

TACAGTCGAG 
TACAGTCGAG 
TACAGTCGAG 
TACAGTCGAG 
TACAGTCGAG 
TACAGTCGAG 
TACAGTCGAG 
TACAGTCGAG 
TACAGTCGAG 
TACAGTCGAG 
TACAGTCGAG 



AAGAAGCgGA 
AAGAAGCgGA 
AAGAAGCaGA 
AAGAAGCaGA 
AAGAAGCaGA 
AAGAAGCaGA 
AAGAAGCaGA 
AAGAAGCaGA 
AAGAAGCaGA 
AAGAAGCaGA 
AAGAAGCaGA 



ATTACGACTT 
ATTAOGACTT 
ATTACGACTT 
ATTACGA CTT 
ATTACGACTT 
ATTACGACTT 
ATTACGACTT 
ATTACGACTT 
ATTACGACTT 
ATTACGA CTT 
ATTACGACTT 



TCACACCAAA 
TCACACCAAA 
TCACACCAAA 
TCACACCAAA 
TCACACCAAA 
TCACACCAAA 
TCACACCAAA 
TCACACCAAA 
TCACACCAAA 
TCACACCAAA 
TCACACCAAA 



500 

TaCCTTTAAC 
TaCCTTTAAC 
TaCCTTTAAC 
TgCCTTTAAC 
TgCCTTTAAC 
TgCCTTTAAC 
TgCCTTTAAC 
TgCCTTTAAC 
TgCCTTTAAC 
TgCCTTTAAC 
TgCCTTTAAC 



tnsa221059.2{245_H36B 
msa221059 . 2 {245_JM9130013 
msa221059 . 2 { 24 5_116 9NT 
msa221059.2{245_090 
msa221059 . 2 ( 245_CJB110 
msa221059.2{245_18RS21 



msa221059.2 
msa221059.2 
ntsa221059.2 
msa221059.2 
tnsa221059.2 



245_2603 
245_A909 
245_C0K1 
245_M732 
.24S_M781. 
Consensus 



501 

AGATAAAAAA 
AGATAAAAAA 
AGATAAAAAA 
AGATAAAAAA 
AGATAAAAAA 
AGATAAAAAA 
AGATAAAAAA 
AGATAAAAAA 
AGATAAAAAA 
AGATAAAAAA 
AGATAAAAAA 



AGTTTCGCTA 
AGTTTCGCTA 
AGTTTCGCTA 
AGTTTCGCTA 
AGTTTCGCTA 
AGTTTCGCTA 
AGTTTCGCTA 
AGTTTCGCTA 
AGTTTCGCTA 
AGTTTCGCTA 
AGTTTCGCTA 



GTCTTATTAT 
GTCTTATTAT 
GTCTTATTAT 
GTCTTATTAT 
GTCTTATTAT 
GTCTTATTAT 
GTCTTATTAT 
GTCTTATTAT 
GTCTTATTAT 
GTCTTATTAT 
GTCTTATTAT 



TgAtASTAAT 
TgAtAATAAT 
TgAtAATAAT 
TaAtAATAAT 
TaAtAATAAT 
TgAcAATAAT 
TgAcAATAAT 
TgAcAATAAT 
TgAcAATAAT 
TgAcAATAAT 
TgAcAATAAT 



S50 

GGTGATTTAA 
GGTGATTTAA 
GGTGATTTAA 
GGTGATTTAA 
GGTGATTTAA 
GGTGATTTAA 
GGTGATTTAA 
GGTGATTTAA 
GGTGATTTAA 
GGTGATTTAA 
GGTGATTTAA 



tn3a221059.2{245_H36B| 
msa221059 . 2 {245_JM9130013 t 
msa221 0 5 9 . 2 { 24 5_1 16 9NT 
rasa221059.2{245_090 
rasa221059 . 2 f 245_CJB110 
msa22 10 59 . 2 { 2 4 5_1 8RS2 1 
msa221059.2(245 2603 
msa221059 . 2 f 245~A909 
mBa221059.2{245 C0H1 



551 

TAACTTTAAA 
TAACTTTAAA 
TAACTTTAAA 
TAACTTTAAA 
TAACTTTAAA 
TAACTTTAAA 
TAACTTTAAA 
TAACTTTAAA 
TAACTTTAAA 



AGAGCAAATg 
AGAGCAAATg 
AGAGCAAATg 
AGAGCAAATa 
AGAGCAAATa 
AGAGCAAATa 
AGAGCAAATa 
AGAGCAAATa 
AGAGCAAATa 



TTGGATGCTC 
TTGGATGCTC 
TTGGATGCTC 
TTGGATGCTC 
TTGGATGCTC 
TTGGATGCTC 
TTGGATGCTC 
TTGGATGCTC 
TTGGATGCTC 



591 

TTCAACGTTT A 
TTCAAC GTTT A 
TTCAAC GTTT A 
TTCAACGTTT A 
TTCAAC GTTT A 
TTCAACGTTT A 
TTCAACG TTT A 
TTCAAC GTTT A 
TTCAACGTTT A 



900 



WO 2004/018646 



Table 57: Comparative Sequences relating to SAG 1488 



tnsa221059.2{245 M732) TAACTTTAAA AGAGCAAATa TTGGATGCTC TTCAAC GTTT A 
msa221059 .2{2452M781} TAACTTTAAA AGAGCAAATa TTGGATGCTC TTCAACGTTT A 
Consensus ********** *********- ********** ********** * 

SEQ ZD NO: 5712 
STRAIN 2603 frame: 1 

MLMTKI IGLTGG IASGKSTVTKI I RESGFKVTDADQWHKL&AKGGKLYQALLEWLGPE I 
LDADGELDRP KLSQM I FANPDNMKTSARLQNS 1 1 RQELACQRDQLKQTEE I FFMD I PLL I 
EEKY I KWFDE I WLVFVDKEKQLQRIjMARNNYSRBEAELRI*SHQMPLTDKKSFAS L I IDNN 
GDL I TLKEQ I LDALQRL 

SEQ ID HQs 5713 
STRAIN 090 frame: 1 

KSTVTKI IRESGFKVIDADQVVHKLQAKGGKLYQALIaEWLGPEILDADGEIi^^ 
FANPDNMKT SARLQNS I I RQELACQRDQLKQTEE I FFVDI PLLIEBKYI KWFDE I WLVFV 
DKEKQLQRJ^MARNNYSREEAELRLSHQMPLTDKKSFASLI INNNGDLITLKEQI LDALQR 
L 

SEQ ZD NO: 5714 
STRAIN A909 frame: 1 

KSTVTKI IRESGFKVI DADQVVHKIiQAKGGKLYOALLEWLGPE I LDADGELDRP KLSQM I 
FANPDNMKTSARLQN S I 1 RQELACQRDQLKQTEE I FFMD I PLL I EEKYI KWFDE I WLVFV 
DKEKQLQRI^RNNYSREEAEliRLSHQMPLTDKKS FASL I IDNNGDL I TLKEQ I LDALQR 
L 

SEQ ZD NO: 5715 
STRAIN H36B frame: 1 

KSTVTKI IRESGFKVIDADQVVHKMAKGGKLYQAIJjEWI^ 

FANPDNMKTSARLQN S 1 1 RQELACQRDQLKQTBE I FFMD I PLLIEBKYI KWFDE I WLVFV 
DKEKQLQRLMARNNY SREEAELRL SHQ I PLTDKKS FASL I IDNNGDLITLKEQMLDALQR 
L 

SEQ ZD NO : 5716 
STRAIN 18RS21 frame: 1 

KSTVTKI IRESGFKVIDADQWHKLQAKGGKLYQALLEWIX3PEILDADGEL 
FANPDNMKTSARLQNS 1 1 RQELACQRDQLKQTEE I FFMD I PLL I EEKYI KWFDE I WLVFV 
DKEKQIiQRLMARNNYSREEAELRLSHQMPLTDKKSFASL 1 1 DNNGDL ITLKEQI LDALQR 

I* . 

SEQ ZD NO: 5717 
STRAIN M732 frame: t 

KSTVTKI IRESGFKVIDADQVVHKIjQAKGGKLYQAIJjEWLGPEILDADGELDRPKLSQMI 
FANPDNMKTSARLQNS 1 1 RQELACQRDQLKQTEE I FFMD I PLL I EEKYI KWFDE I WLVFV 
DKBKQLQRLMARNNYSREEABLRLSHQMPLTDKKSFASLI IDNNGDL I TLKEQ I LDALQR 
L 

SEQ ZD NO i 5718 
STRAIN COH1 frame: 1 

KSTVTKI irbsgfkvidadqvvhklqakggklyqallewixspeildadge^ 

FANPDNMKTSARLQNS 1 1 RQELACQRDQLKQTEE I FFMD I PLL I EEKYI KWFDE I WLVFV 
DKBKQLQRLMARNNYSREEAELRLSHQMPLTDKKSFASLI I DNNGDL ITLKEQI LDALQR 
L 

SEQ ZD NO: 5719 
STRAIN M781 frame: I 

KSTVTKI IRBSGFKVIDADQVVHKLQAKGGKLYOJVIjLEWLGPE 

FANPDNMKTSARLQNS 1 1 RQELACQRDQLKQTEE I FFMD I PLLIEBKYI KWFDE I WLVFV 
DKEKQLQRLMARNNYSREEAELRLSHQMPLTDKKSFASLI IDNNGDLITLKEQI LDALQR 
L 

6EQ ZD NO: 5720 
STRAIN CJB1 10 frame: 1 

KSTVTKI IRESGFXVIDADQVVHKLQAKGGKLYO^jLEWLGPEILDADGELDRPKLSQMI 
FANPDNMKTSARLQNS 1 1 RQELACQRDQLKQTEE I FFVD I PLL I EEKY I KWFDE I WLVFV 
DKEKQLQRLMARNNYSREEAELRLSHQMPLTDKKSFASLI INNNGDLITLKEQI LDALQR 
L 

SEQ ZD HQs 5721 
STRAIN 1169NT frame: 1 

KSTVTKI IRESGFKV IDADQVVHKLQAKGGKLYQALIiEWLGPE I LDADGELDRP KLSQMI 
FANPDNMKTSARLQNS 1 1 RQELACQRDQLKQTEE I FFMD I PLL I EEKYI KWFDE I WLVFV 
DKEKQLQRLMARNNYSREEAELRLSHQI PLTDKKSFASL I IDNNGDLITLKEQMLDALQR 
L 

< 

SEQ ZD NO: 5722 
STRAIN JM9130013 frame: 1 

KSTVTKI IRESGFKVIDADQVVHKLQAKGGKLYQJUiLEWI^PEILD^ 
FANPDNMKTSARLQNS 1 1 RQELACQRDQLKQTEE I FFMD I PLLIEBKYI KWFDE I WLVFV 
DKEKQLQRLMARNNYSREEAELRLSHQI PLTDKKS FASL I IDNNGDLITLKEQMLDALQR 
L 



901 
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Table 57: Comparative Sequences relating to SAG 1488 



PRETTY of: /biotmp/msa221398 . 2 { *} February 10, 2003 07il5 



msa221398 .2{245_090 
msa22139S.2(245_CJB110 
msa221398 .2 (24S_1169NT 
msa22 13 98 . 2 { 245_H36B 
msa221398.2{245_JM9130013 
msa221398.2{245JL8RS21 



ms 3221398. 2 
msa221398.2 
msa221398'.2 
msa221398 .2 
msa221398 .2 



245_2603 
245_A909 
24S_COHl 
245_M732 
245_M781 
Consensus 



1 SO 

KSTV TKIIRESGFK VIDADQWHK LQAKGGKLYQ 

KSTV TKIIRESGFK VIDADQWHK LQAKGGKLYQ 

KSTV TKIIRESGFK VIDADQWHK LQAKGGKLYQ 

KSTV TKIIRESGFK VIDADQWHK LQAKGGKLYQ 

KSTV TKIIRESGFK VIDADQWHK LQAKGGKLYQ 

KSTV TKIIRESGFK VIDADQWHK LQAKGGKLYQ 

mlmtkiiglt ggiasgKSTV TKIIRESGFK VIDADQWHK LQAKGGKLYQ 

KSTV TKIIRESGFK VIDADQWHK LQAKGGKLYQ 

KSTV TKIIRESGFK VIDADQWHK LQAKGGKLYQ 

KSTV TKIIRESGFK VIDADQWHK LQAKGGKLYQ 

KSTV TKIIRESGFK VIDADQWHK LQAKGGKLYQ 



msa221398 . 2 { 245_090 
msa2 213 98 . 2 { 24 5_CJB110 
msa221398 . 2 { 24 5_1169NT 
tnsa221398 ,2{245_H36B 
msa221393.2{245_JM9130013 
msa221398.2{245 18RS21 



msa221398 .2 
msa221398 .2 
msa221398.2 
msa221398 .2 
msa221398 .2 



24S_2603 
245_A909 
245_C0H1 
245 M732 
245_M781 
Consensus 



51 

ALLEWLGPEI 
ALLBWLGPEI 
ALLEWLGPEI 
ALLEWLGPEI 
ALLEWLGPEI 
ALLEWLGPEI 
ALLEWLGPEI 
ALLEWLGPEI 
ALLEWLGPEI 
ALLEWLGPEI 
ALLEWLGPEI 



LDADGELDRP 
LDADGELDRP 
LDADGELDRP 
LDADGELDRP 
LDADGELDRP 
LDADGELDRP 
LDADGELDRP 
LDADGELDRP 
LDADGELDRP 
LDADGELDRP 
LDADGELDRP 



KLSQMIFANP 
KLSQMIFANP 
KLSQMIFANP 
KLSQMIFANP 
KLSQMIFANP 
KLSQMIFANP 
KLSQMIFANP 
KLSQMIFANP 
KLSQMIFANP 
KLSQMIFANP 
KLSQMIFANP 



DNMKTSARLQ 
DNMKTSARLQ 
DNMKTSARLQ 
DNMKTSARLQ 
DNMKTSARLQ 
DNMKTSARLQ 
DNMKTSARLQ 
DNMKTSARLQ 
DNMKTSARLQ 
DNMKTSARLQ 
DNMKTSARLQ 



100 

NSIIRQELAC 
NSIIRQBLAC 
NSIIRQELAC 
NSIIRQELAC 
NSIIRQBLAC 
NSIIRQELAC 
NSIIRQELAC 
NSIIRQBLAC 
NSIIRQELAC 
NSIIRQBLAC 
NSIIRQELAC 



msa221398.2{245_090 
msa221398 .2{245_CJB110 
msa22139B.2(245_1169NT 
msa221398 .2{245_H36B 
msa221398 . 2 {245_JM9130013 
msa221398.2{245_18RS21 



ms a221398 .2 
msa221398.2 
msa221398.2 
msa221398.2 
msa221398.2 



245_2603 
24S_A909 
245_COHl 
245_M732 
245_M7B1 
Consensus 



101 

QRDQLKQTEE 
QRDQLKQTEE 
QRDQLKQTEB 
QRDQLKQTEE 



QRDQLKQTEE 
QRDQLKQTEE 
QRDQLKQTEB 
QRDQLKQTEE 
QRDQLKQTEE 
QRDQLKQTEE 



IFFvDIPLLI 
IFFvDIPLLI 
IFFmDIPLLI 
IFFtTiDIPLLI 
IFFmDIPLLI 
IFFmDIPLLI 
IFFmDIPLLI 
IFFmDIPLLI 
IFFmDIPLLI 
IFFmDIPLLI 
IFFmDIPLLI 



EBKYIKHFDE 
EEKYIKWFDB 
EEKYIKWFDE 
EEKYIKWFDB 
EEKYIKWFDE 
EEKYIKWFDE 
EEKYIKWFDE 
EEKYIKWFDE 
EEKYIKWFDE 
EEKYIKWFDE 
EEKYIKWFDE 



IWLVFVDKEK 
I WLVFVDKE K 
IWLVFVDKEK 
IWLVFVDKEK 
IWLVFVDKEK 
IWLVFVDKEK 
IWLVFVDKEK 
IWLVFVDKEK 
IWLVFVDKEK 
IWLVFVDKEK 
IWLVFVDKEK 



150 

QLQRLMARNN 
QLQRLMARNN 
QLQRLMARNN 
QLQRLMARNN 
QLQRLMARNN 
QLQRLMARNN 
QLQRLMARNN 
QLQRLMARNN 



QLQRLMARNN 
QLQRLMARNN 



msa221398.2{245_090 
msa221398 . 2 { 245_CJB110 
msa221398.2{245_1169NT 
rasa221398 . 2 { 24S_H36B 
msa221398.2{245_JM9130013 
msa221398 . 2 { 245_18RS21 



msa221398 .2 
ma 3221398 .2 
msa221398.2 
msa221398.2 
msa221398 .2 



245_2603 
245_A909 
245_COHl 
245_M732 
245_M781 
Consensus 



151 

YSREEAELRL 
YSREEAELRL 
YSREEAELRL 
YSREEAELRL 
YSREEAELRL 
YSREEAELRL 
YSREEAELRL 
YSREEAELRL 
YSREEAELRL 
YSREEAELRL 
YSREEAELRL 



SHQmPLTDKK 
SHQmPLTDKK 
SHQiPLTDKK 
SHQ1PLTDKK 
SHQiPLTDKK 
SHQmPLTDKK 
SHQmPLTDKK 
SHQmPLTDKK 
SHQmPLTDKK 
SHQmPLTDKK 
SHQmPLTDKK 



SFASLIInNN 
SFASLIInNN 
SFASLIIdNN 
SFASLIIdNN 
SFASLIIdNN 
SFASLIIdNN 
SFASLIIdNN 
SFASLIIdNN 
SFASLIIdNN 
SFASLIIdNN 
SFASLIIdNN 



GDLITLKEQi 
GDLITLKEQi 
GDLITLKEQm 
GDLITLKEQm 
GDLITLKEQm 
GDLITLKEQi 
GDLITLKEQi 
GDLITLKEQi 
GDLITLKEQi 
GDLITLKEQi 
GDLITLKEQi 



197 
LDALQRL 
LDALQRL' 
LDALQRL 
LDALQRL 
LDALQRL 
LDALQRL 
LDALQRL 
LDALQRL 
LDALQRL 
LDALQRL 
LDALQRL 



902 



WO 2004/018646 



Table 58: Comparative Sequences relating to SAG0182 



SEQ ZD NO. 5801 

STRAIN 2603 

ATGTTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATTATGft 

CTAAATAATAGTTATTTTAGACAGTTAA^ 

CTTGTCATCATTTTCXK3L T 1 ^ 

GGGGATCGAAGTTTGGTOGAGCGCCCITTTCTAACAAOGAT^ 

G CTAATACAAGGACTTT AGTTATTACAACGG CAAGTTTGGTTGGTGG ACCTC TGGTTGGA 
TCAATTGrrTGGTTTTATTGGAGGAGTC 

TTCTATATTGTCAGTTCAGTTCTAGTCGG CTT 
AAGGAAAACCATCTCTACCCTTCAACAAG CCAAGTTATTTTAATTAGTATTATTGCCGAA 
AGTATCCAGATGCTATTTGTTGGCATTTT^ 
ATTCCAATGATGATTTTAAATAGTTTAGGTTCC^ 
TATTTGTCAAATGAAAGTCAGTTACGCGCAGTTCAAACGAGAGAT 

CGACAGACTCTGCC CTACCTTAGACAAGGTTTGACACCG C^TCTGCTAGGAG CGTTTG C 
GAAATTATAAAGAGGCATACTAACTTTGATGCTGTGGG 



TTATCTAAAAGTGTTATTTTTGATGGCGAACCAAGAW 

TCTTGTCCAGATCACAACTGTCAGTTAAATTCTGCT 

GATAAAACTGTGGGTGCCTTAAAAATGTACTTTGCA^ 

GAGGAAAACCTACTCCTTGGTTTAGCGCAAAT^ 

ACAGAGGAACAAAATAAGTTAGCCAGTATGGa\GAGATAAA 

AACCCTCATTTCTTCnTTAATGCCATTAACACAAT^ 

GATAAAGCACXjTTATGCACTCATGCAGTTAAGTACrri" 

GGTCAGGATCGTGAGGTAACGCTTGAGCAAGAAAAATCA 

GTTGAAAAATTAOGTTTOCCTGATAAATATCAGTTATCTT^ 

AAAATGAAGTTACCACCTTTTGGTTTACAGGTACTC 

TTCAAAGAACOTAAGACGGACAACCATATATTGGTTCAAA 

TATTGTGTTTCTGTTAGTGACAATGGACAAGGAATCT 

GGTCAAGAAACAGTTGCAGAGAGTAAGGGTACAGGTACrc 

AGGCTGAATTTATTATATGGTAGTCTAAGT 

ACAAAAGTTTGGTATCGAATACCTAATAGAATAAGGGAGGATGAGC^ 
TCT 



SEQ ID NO, 5802 
STRAIN 090 

TTGATGGTGTTGTTATTCXZAAAGG CTAGGAATTATTAT 

GATTTTAGCXrrTTTTATTGGTAAATA 

AAGAGCGGTCTAAACGTGAAACGGTAGTACTTGTCATC 

TTTGTTATTATATCTAATATAACAGGAATTGAAATAAAAG 

TTTGGTCGAGCXSCCCrrTTTCTAACAACGATTTC^ 

CTGGTTGGATCAA UWlU X ^rX ' XT ATTGGAGGAGT^ 

AGX3AAGCTTTTCAGGTTCTTTCTATATTCT 

TTGTTAGCGGAAAGATTGGTGATAAGCITAAGGAAA^ 

TCAACAAGCCAAGTTATTTTAATTAGTATT ATTG CCGAAAGTATCCAG^ 

GCTATTTGTTGGTATTTTTACAGGATGGGAACTTGTC^ 

TTCCAATGATGATTTTAAATAGTTTAGGTTCCA 

TTGAAAACTTATTTGTCAAATGAAAGTCAGT^ 

AGATGTTCTTGAATTGACTCX3ACAGACTCTG 

TGACAra3CAATCTGCTAGGAGCGTTTGCGAA^ 

AACTTTGATGCTGTAGGATTAACAGATCGGTCA^ 

TGGTGTTGGCCATGATCACCATATTGCAGGAC^ 

TATCTAAAAGTGTTATTTTTGATGGCGAAC^ 

GCX^CGATTTCTTGTCCAGATCACAACTGTC^ 

AGTTCCTCTAAAAATAAATGATAAAACTGTGGGTGCCTTAAA 

TTGCAGGAGATAAGACAATGTCTGAGGTGGAGGAAAACCTAGTO 

TTAGCGCAAATATTTTCAGGACAACTCGCAAT^ 

AAATAAGTTAGCCAGTATGGCAGAGATAAAGGCTTT^^ 

ACCCTCATTTCTTCTTTAATGCCATTAACACAATTAGTC 

ATTGATTCTGATAAAGCACGTTATGCACTG^ 

TAGAACAAGTTTGCAAGGTGGTCAGGATCGTGAGGTA 

AAAAATCACATGTGGATGCTTATATGAATGTTGAA 

GATAAATATGAGTTATCTTATGATATTAff 

ACCXSCCTTTTGGTTTACAGGTACTGGTAGAGAATGC^ 

TCAAAGAACGTAAGACGGACIAACCATATATTGGT^ 

GGTCATTATTATTGTGTTTCTGTTAGTGAC^ 

TACTATCATTGATAAATTAGGTCAAGAAAOVGTTGC A 

CAGCTACTGCTCTAGTTAATCTAAATAACAGG 

AGTGTAAGTTGCCTTCA'I'l'I"l'rCGAGCGACAAGAATGGT 

GTATCX3AATACCTAATAGAATAAGGGAGGATGAG CATGAAAATTTTAATT 

CT 



SEQ ID NO. 5803 
STRAIN A909 

TTGATGGTGTTGTTATTCCAAAGGCrAGGAATTATTAT 

GATTTTAGCCTTTTTATTGGTAAATAATAGTTATT^^ 

AAGAGOGGTCTAAACGTGAAACGGTAGTCCTTGTCATCA^ 

TTTGlTATTATATCrrAATATAACAGGAATTGAAATAAAAGGGG^ 

TTTGGTCGAGCGCCCTTTTCTAACAACGATTTCTCATTC^ 

CTAATACAAGGACTTTAGTTATTACAACGGC^ 

CXGGTTGGATCAATTGTTGGTTTTATTGGAGGAGT^ 

AGGAAGCITITCAGGTTCTTTCTA 

TXGTTTAGCGGAAAGATTGGTGATAAGCTTAAGGAAAACC^ 
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TCAACAAGCCAAGTTATTTTAATTAGTATTATTGCCGAAAGTAT 

GCTA l " lUXyi TGGC AlTlTr ACAGGATGGGAACTTG TCAAA ^ 

TTCCAATGATGATTTTAAATAGTTTAGGTTCCA^ 

TTGAAAACTTATTTGTCAAATGAAAGTCAGTTACGCGCAGTTCAAA 

AGATGTTCTTGAATTGACrCGACAGACTCK3CCCTACCTTAGACAAG^ 

TGACACCGCAATCTGCTAGGAG CXHTTGCGAAATTATAAAGAG^ CATACT 

AACTTTGATGCTGTGGGATTAACAGATOGGTCAAACGTATTAGCTCATAT 

TGGTGTTGG CCATGATCACCATATTGCAGGACAACCGGTCAAA^ 

TATCTAAAAGTGTTATTTTTGATGGCGAACCAAGAATTG CGCAAGAT 

GCGGCGATTTCTTGTCCAGATCACAACTGTCAGTTAAAT^ 

AGTTCCTCTAAAAATAAATGATAAAACTGTGGGTGCCTTAAAAATGTACT 

TTGCAGGAGATAAGACAATGTCTGAGGTGGAGGAAA 

TTAGCGCAAATATTTTCAGGACAACTGGCAATGGGGA^ 

AAATAAGTTAGCCAGTATGGCAGAGATAAAGGCTTTACAAGCACAAATC3\ 

ACCCTCATTTCTTCTTTAATGCCATTAACACAATTAGTGCATTAATCC^ 

ATTGATTCTGATAAAG CACGTTATGCACTGATGCAGTTAAGTACrTITTT 

TAGAACAAGTTTGCAGGGTGGTCAGGATCXSTGAGGTAACGCT^ 

AAAAATCACATGTGGATGCTTATATGAATGTTGAAAAATTACGTTTCC^ 

GATAAATATCAGTTATCTTATGATATTAGTGCACCAGAAAAAATGAAOTT 

ACCACCTTTTGGTTTACA^GTACTGGTAGAGAATGCA^ 

TCAAAGAACGTAAGA03GACAACCATATATTGGTTCAAATAAAGCCA 

GGTCATTATTATTGTGTTTCTGTTAGTGACAATGGACAAGGAATCT 

TACTATCyVTTGATAAATTAGGTCAAGAAACAGTTC 

CAGGTACTGCTCrAGTTAATCTAAATAACAGGCIXSAATTTATTA 

AGTGTAAGTTGCCTTC^TTTTTCGAGCGAC^^ 

GTATCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAATTTTAATT 
CT 



SEQ ID MO. 5B04 
STRAIN H36B 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATTATG 

ATTTTAG CCriU"lTAlTGGTAAATAATAGTTATTTCAGACAGTTAATTGA 

AGAGCGGTCTAAACXnt3AAAC33GTAGTCXriTGTCAT 

TOnTATTATATCTAATATAACAGGAATTGAAATAAAAGGGGATCGAAGT 

TTCGTCGAGCX^CXrrTrTCTAACA^ 

TAATACAAGGACITTAGTTATTACAACGGCAAG 

TGGTTGGATCAATTGTTGGTTTTATTGGAGGAGTTCATC^ 

GGAAGCTTTTCAGGTTCTTTCTATATT^ 

TGTTAGCGGAAAGATTGGTGATAAGCTTAAGGAAAACCATCTCT 
i CS^CAAGCCAAGTTATTTTAATTAGTATTATTGCCG^ 
CTATTTGTTGGCATTTTTACAGGATGGGAACT^ 
TCCAATGATGATTTTAAATAGTTTAGGTTCC^ 
TGAAAACTTATTTGTCAAATGAAAGTCACnTACGCGCAGTTC 
GATGTTCTTGAATTGACTCGACAGACrCTGCCCTA 

GACACCG CAATCTGCTAGGAGCGTTTGCGAAATTATAAAGAGG GATACTA 

ACTTTGATG CTGTGGGATTAACAGATCGGTCAAACGTATTAGCTCATATO 

GGTGTTGGCCATGATCACCATATTGC^GGACAACCTO 

ATCTAAAAGTGTTATTTTTGATGGCGAACCAAGAATTGCGCAAGAra 

OGGCGATTTCTTGTCCAGATCACAACTGTCAGTTAAAT^ 

GTTCCTCIAAAAATAAATGATAAAACTGTGGGTGCCCT 

TAGCGCAAATATTTTCAGGACAACTGGC^UVTGGGGAT 

AATAAGTTAG CCAGTATGGCAGAGATAAAGGCTITTACAAGCACAA^ 

CCCTCATTTCTTCITTAATGCCATTAAC^ 

TTGATTCTGATAAAGCACGTTATGCACTGATG 

AGAACAAGTTTGCAGCK3TGGTCXGGATCGTGAGCT 

AAAATCACATGTGGATGCTTATATGAATGTTGAAA 

ATAAATATCAGTTATCTTATGATATTAGTGCACCAGAAAAAATGAAGTTA 
CCACCTTTTGGTTTACAGGTACTGGTAGAGAATG CAGTTCGACATGCTTT 
CAAAGAACXTTAAGACGGACAACCATATATTGGTTCAAATAAAGCCAGATG 
GTCATTATTATTGTGTTTCTGTTAGT^ 
ACTATCATTGATAAATTAGGTCAAGAAACAGTTGCA^ 

GTGTAAGTTGCCTTCATTTTTCGAGCGAGAAGA^ 

TATCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAATTTTAATTC 
T 



SEQ ZD MO. 5805 
STRAIN 18RS21 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATTATG 

ATTTTAG CCi'rriUATTGGTAAATAATAGTTArrri'AGACAGTTAATTGA 

AGAGCXSGTCTAAACGTGAAAOGGTAGTCCTTGTCAT^ 

TTGTT ATTATAT CT AATAT AACAGGAATTGAAATAAAAGGGGATCGAAGT 

TTGGTOGAGCX3CCCTTTTCTAACAACGATTTCTC 

TAATACAAGGACTTTACnTATTACAACGG CAAGTTTGGTTGGTGGACCTC 

TGGTTGGATCAATTGTTGGTTTTATTGGAGGA 

GGAAGCTTTTCAGGTTCTTTCTATATTGTCAGTT 

TGTTAGCGGAAAGATTGGTGATAAGCTTAAGGAAAACCATCTCT^ 

CAACAAGOCAAGTTATTTTAATTAGTATTATT^ 

CTATTTGTTGGCATTTTTACAGQATGGGAACTT^ 

TCCAATGATGATTTTAAATAGTTTAGGTTCCACACT^ 

TGAAAACTTATTTGTCAAATGAAAGTCAGTTACGC^^ 

GATGTTCTTGAATTGACTCGACAGACTCrGCX^ 
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GACACCGCAATCTGCTAGGAGCGTrroCGAAATTATAAAGAGGCATACTA 
ALTl'rit^TGCTGTGGGATTAACAGATCGGTCAAACGTATTAG CTCATATT 
GGTGTTGGCCATGATCACCATATTG CAGGACAACCGGTCAAAACAGACTT 
ATCTAAAAGTGTTATTTTTGATGGCGAAC CAAGaATTGCGCAAGATAAAG 
CGGCGATTTCTTGTCCAGATCACAACTreTCAGTTAAAT^ 
GTTCCIX^AAAAATAAATGATAAAACTGTGGGTG CCTTAAAAATGTACTT 
TGCAGGAGATAAGAC^TGTCTGAGGTGGAGGAAAACCTAGTCCTTGGTT 
TAGCGCAAATATTTT CAGGACAACTGGCAATGGGGAT AACAGAGG AACAA 
AATAAGTTAGCCAGTATGGCAGAGATAAAGGCTTTACAAG CACAAATCAA 
CCCTTCATTrCT'rCTTTAATGCCATTAACACAATTAGTGCA 
TTGATTCTGATAAAG CACGTTATGCACTGATG CAGTTAAGT ACTTTTTTT 
AGAACAAGTTTG CAGGGTGGTCAGGATCGTGAGGTAACG CTTGAG CAAGA 
AAAATCACATGTGGATGCTTATATGAATGTTGAAAAATTACGTT^ 
ATAAATATCAGTTATCTTATGATATTAGTG CACCAGAAAAAATGAAGTTA 
CX^CCITTTGGTTTACAGGTACTGGTAGAGAATG CAGTTCGACATG CTTT 
CAAAGAACGTAAGACGGACAACCATATATTGGTTCAAATAAAGCCAGATG 

ACTATCATTGATAAATTAGGTCAAGAAACAGTTG CAGAGAGTAAGGGTAC 
AGGTACTGCTCTAGTTAATCTAAATAACAGGCTGAATTTATTATATGOT 
GTGTAAGTTGCCITCATTTTTCGAG CGACAAGAATGGTACAAAAGTTTGG 
TATCGAATACCTAATAGAATAAGGGAGGATGAG CATGAAAATTTTAATTC 
T 

SEQ ZD NO. 5806 
STRAIN M732 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATTATGAT 

TTTAG<X"lU"ri"iATTGGTAAATAATAGTTATTTCAGACAGTrAATTGAAG 

AGCGGTCTAAACGTGAAACGGTAGTCCTTGTCATCA 

GTTATTATATCTAATATAACAGGAATTGAAATAAAAGGGGATCGAAGTTT 

GGTCGAGCGCCCTTTTCTAACAAOGATTTCCCATTCIX^ 

ATACAAGGACTTTAGTTATTACAACXMCAAGTTTGGTTGGT 

GTTGGATCAATTGTTGGTTTTATTGGAGGAGTTCAT 

AAGCTTTTCAGGTTCTrTCTATATTGT CAGTTCAGTTCTAGTCGGCATTG 

TTAGCGGAAAGATTGGTGATAAGCTTAAGGAAAACCATCTCT 

ACAAGCCAAGTTATTTTAATTAGTATTATTGCCGAAA^ 

ATTTGTTGGCATTTTTACAGGATGGGAACTTGT^ 

CAATGATGATTTTAAATAGTTTAGGTTCCACAC^ 

AAAACTTATTTGTCAAATGAAAGTCAGTTACGCGCA^ 

TGTTCTTGAATTGACTCGACAGACTCrGC^ 

CACCGCAATCTCCTAGGAGCOTTTGCGAAATTATAA 

TTTGATGCTGTGGGATTAACAGATCGGTCAAACX5TATTAGCT . 

TATTGGCCATGATCACC^TATTGCAGGACAAC 

CTAAAAGTGTTATITTTGATGGCXaAACCAAGAATTGCGC^ 

GO^tTTCTTGTCCAGATCACAACTGTCAGTTAAATTC^ 

TCCTCTAAAAATAAATGATAAAACTGTGTGTG CCTTAAAAATGT^ 

CAGGAGATAAGACAATGTCTGAGGTGGAGGAAAACCTAGT^ 

GCG CAAATATrTTCAGGACAACTGG CAATGGGGATAACAGAGGAACAAAA 

TAAGTTAGCCAGTATGGCAGAGATAAAGGCTTTACAAGCACAAATCA 

CTCATTTCTTCTTTAATGCCATTAACACAAT^ 

GATTCTGATAAAGCACGTTATGCACTGATGCAGCT 

AACAAGTTTG CAAGGTGGTCAGGATCGTGAGGTAACG CT TGAGC AAGAAA 

AATCAGATGTGGATGCTTATATGAATGTTGAAAAATTAC\3 

AAATATCAGTTATCTTATGATATTAGTGCACCAGA 

GCCTTTTGGTTTACAGGTACTGGTAGAGAATGCAGT^ 

AAGAACGTAAGACGGACAACCATATATTGGTTCAAATAAAGCCAGATGGT 

CATTATTATTGTGTTTCTGTTAGTGACAATGG^ 

TATCATTQATAAATTAGGTCAAGAAACAGTTGCAGAG^ 

GTACTGCIKnTVSTTAATCTAAATAACA^ 

GTAAGTTGCCTTCATTTTTCGAGCGACAAGAA^^ 

TCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAA^ 

SEQ ZD NO. 5807 
STRAIN COH1 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTAT 

TATQATTTTAGCCTTTTTATTGGTAAATAATAGTTATTTCA^^ 

TTCAAGAGCGGTCTAAACX3TGAAACGGTAGTCCITG^ 

TTGTTTGTTATTATATCTAATATAACAGGAATTGAAATAAAAG 

AAGTTTGGTCXIAGCGCXXTrTTIXrrAACAACGA 



CXn*CTGGTTGGATCAATTGTTGGTTTTATTGGA 

TCAAGGAAGCTTTTCAGGTTCTTTCTATATTGTCAG^ 

GCATTGTTAGCGGAAAGATTGGTGATAAG CTTAAGGAAAACCATCTCTAC 

CCTTCAACAAGCCAAG TrATIT TAAlTAGTATTATTC 

GATCCTATTTGTTGGCATTTTTACAGGAT 

TCATTCCAATGATGATTrTAAATAGTrTAGGTTTCCA 

ATTTTGAAAACTTATTTGTCAAATGAAAGTC^GTTA 

GAGAGATGTTCTTGAATTGACTCGACAGACTCTG CCCTACCTTAGACAAG 

GTTTGACACCGCAATCTGCTAGGAGCGTTTGCGAAATTAT 

ACTAACTTTGATGCTGTGGGATTAACAGATCXKn'CAAACGTAT^ 

TATTGGTGTTGGCCATGATCACCATATTGCAGGACAACC^ 

ACITATCTAAAAGTGTTATITrTGATGGCGAACXZAA^ 

AAAGCGGO(^TTTCTTGTCCAGATCACAACTGT^ 

TGTAGTTCCTCTAAAAATAAATGATAAAACTCTGT 
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ACITTGCAGGAGATAAGACAATGTCTGAGGTGG^ 

GGTTT AGCG CAAATATTTTC^GGACAACTGGCA^ 

ACAAAATAAGTTAGCC^GTATGGCAGAGATAAAGGCT^ 

TCAACCCTCA1"1TL"1TIU'1UAATGCCATTAACAC^ 

OGTATTGATTCTGATAAAGCACGTTATGCACTGA 

TTTTAGAACAAGTTTGC3^AGCTGQTCAGGATC^^ 

AAGAAAAATCACATGTGGATGCTTATATGAATGTTGAAAA^ 

CCTGATAAATATCAGTTATCTTATGATATTAGTG CACCAGAAAAAATGAA 

GTTACCX3CCTTTTGGTTTACAGGTACTGGTAGAGAATGCACT 

CTTTCAAAGAACGTAAGACGGACAACCATATATTGGTTCAAATAAA^ CCA 

GATGGTCATTATTATTGTGTrTCTGTTAGTC 

AG ATACTATCATTGATAAATTAGGT CAAGAAACAGTTGCAGAGAGTAAGG 
GGACAGGTACTGCTCTAGTTAATCrAAATAACA^ 
GGTAGTGTAAGTTG CCTTCATTTTTCX3AG CX^ 

TTGGTATOGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAATTTTA 
ATTCT 

SBQ ZD NO. 5808 
STRAIN M78! 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATTA 

TGATTTTAGCCTTTTrATTGGTAAATAATAGTTATTTCAGACAGTT 

GAAGAGCGGT CTAAACGTGAAACGGTAGTCCTTGT<^^ 

GTTTGTTATTATATCTAATATAACAGGAATTGAAATAAAAGGGGATCGAA 

GTTTGGTCX3AGCGCCCrTTrCTAACAACGATTTCCCATTCTGAC^ 

GCTAATACIAAGGACTTTAGTTATTACAACGGCAAGTTTGGT^ 

TCTGGTTGGATCAATTGTTGGTTTTATTG 

AAGGAAGCTTTTCAGGTTCTTTCTATATTGTCAGTT 

ATTGTTAGOGGAAAGATTGGTX3ATAAGCTTAAGGAA 

TTCAACAAGCCAAGTTATTTTAATTAGTATT 

TGCTATTTGTTGGCATTTTTACAGGATGGGA^ 

ATTCCAATGATGATTTTAAATAGTTTAGGTTCCACACTTTTC 

TTTGAAAACTTATTTGTCAAATGAAAGTCAG tTCAAACGA 

GAGATGTTCTTGAATTGACTCGACAGACTCTC 

TTGACACCXK2AATCTGCTAGGAGCGTTTG CGAAATTATAAAGAGGCATAC 

TAACTTTGATGCTGTGGGATTAACAGATCGGT^ 

TTGGTGTTGGOTVTGATCACCATATTGC^ 

TTATCTAAAAGTGTTATTTTTGATGGCGAA 

AGCX^CGATTTCTTGTCCAGATCACAACTGTCAGTT^ 

TAGTTCCTCTAAAAATAAATGATAAAACTGTG 

TTTGCAGGAGATAAGACAATGTCIX1AGGTGGAGGAAAACCT 

TTTAGCXSCAAATATTTTCAGGAQ^CTGGCAATG 

AAAATAAGTTAGCCAGTATGGCAGAGATAAAGGCrTTACA^ 

AACCCTCATTTCTTCTTTAATGCCATTAAC^ 

TATTGATTCTGATAAAG(^a3TTATGCACTGATGC^ 

TTAGAACAAGTTTGCAAGGTGGTCAGGATCGTGAGGT^ 

GAAAAATCACATGTGGATGCTTA^ATGAATGTTGAAAAATTA 

TGATAAATATCAGTTATCTTATGATATTAGTO 

TAO^CCTTTTGGTTTACAGGTACTGGTAGAGAATG 

TTCAAAGAACGTAAGACGGACAACCATATAT^ 

TGGTCATIATTATrGTGTTTCTGTTAGTGACAATGGAC^ 

ATACTATCATTOATAAATTAGGTCAAGAAACAGTTGCAGAG^ 

ACAGGTACrGCTCTAGTTAATCTAAATAACAG 

TAGTGTAAGTTGCCTTCATTTTrCGAGCGACAAG 

GGTATCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAATTTTAAT 
TCT * 

SEQ ID NO. 5809 
STRAIN CJB1 10 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATTAT 
GATTTTAGCCTTTTTATTGGTAAATAATAGT^ 

AAGAG CGGTCTAAACXnXaAAACGGTAGTACITGT CATCATTTTCGGCTTG 

I VXXilT ATrrATATCTAATATAACAGGAATTGAAATAAAAGGGGATCGAAG 

TTTGGTGGAGCGCCCTTTTCTAACAAOGATTTCCCAT 

CTAATACAAGGACTTTAGTTATTACAACGGCAAGTTTGG^ 

CreGTTGGATCAATTGTTGGTTTTATTGGAGGAGTT^ 

AGGAAGCTTTTOVGGTTCTTTCTATATTGTCA 

TTGTTAGCGGAAAGATTGGTGATAAGCTTAAGGAAAACCATC 

TCAACAAGCICAAGTTATTTTAATTAGTA1TATTC 

GCTATTTGTTGGTATTTTTACAGGATGGGAACr^^ 

TTCCAATGATGATTTTAAATAGTTTAGGTTCCACACI^ 

TTGAAAACTTATTTGTCAAATGAAAGTCAGTTACGCG 

AGATGTTCXTGAATTGACnXXSACAGACTCTGCC^ 

TGACACCXSCAATCTGCTAGGAGOGTTTGOGAAATTATAAAGAG^ 

AACTTTGATGCTCTAGGATTAACAGAXCGCT 

TGGTGTTGGCCATGATCACCATATTGCAG 

TATCTAAAAGTGTTATTTTTGATGGCGAACCAAGAATTG 

GCGGCGAIUTCITGTCCAGATCACAAC^^ 

AGTTCCTCTAAAAATAAATGATAAAACTGTGGGTGCCrTAAAAATCT 
TTGCIAGGAGATAAGACAATGTCTGAGGTGGAGGAAAACCTAGTC 
TTAG CGCAAATATTTTCAGGACAACTGGCAATGGGGATAAC^ 
AAATAAGTTAGCCAGTATGG CAGAGATAAAGGCTTTACAAGCACAAATCA 
ACCCTCATTTTTTCTTTAATCCCATTAACACAATTA^ 
ATTGATTCTGATAAAGCACGTTATG CACKxATGCAGTTAAGTACTTTTTT 
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TAGAACAAGTTTGCAAGGTGCTCA^ 

AAAAATCACATGTGGATGCTTATATGAATGTTGAAAAATTACGTTTC 

GATAAATATCAGTrATCTTATGATATTAGTGCACCAGAAAAAATGAAGTT 

ACCGCCTTTTGGTTTACAGGTACTGGTAGAGAATGCA^ 

TCAAAGAACXSTAAGACGGACAACCATATATTGGTTCA^ 

GGTCATT ATTATTGTGTTTCTGTT AGTGACAAT^ CTCAGA 

TACTATCATTGATAAATTAGGTCAAGAAACAGTTGCAGAGAGTAAG^ 

CAGCTACK3CTCTAGTTAATCTAAATAACAGG 

AGTGTAAGTTGCCITCATTTTTCX^GCGACAAGAATGCT 

GTATCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAATTTTAATT 

CT 

SEQ ZD MO. 5810 
STRAIN U69NT 

TTGATGGTGTTGTTATTCCAAAGGCTAGGAATTATT 
ATGATTTTAGCCTTTTTATTGGTAAATAATAGTTATTTCAG^ 

TGTTTGTTATTATATCTrAATATAACAGGAATTGAAATAAAAGGGGATCGA 

AGTTTGGTCGAG CCCITTTCTAACAACGATTTCTr 

TGCTAATACAAGGACTTTAGTTATTACAACK^ 

CTCTGGTTCGATCAATTGTTGGTTTTATTGGAGGAGT^ 

CAAGGAAGCrrri^GGrrClU'lXn'ATATTGTC^GTTCAG 

CyVTTGTGAGCGGAAAGATTGGTGATAAG CTTAAGGAAAACCATCT CTACC 

CTTCAACAAG CCAAGTTATT1TAATTAGTATTATTGCCGAAAGTATCCAG 

ATGCTA Ti ' lXjl TGGCATTTTTACAGGATGGGAAC^ 

CATTCCAATGATGATTTTAAATAGTTTAGGTTCCACACTTTT 

TTTTGAAAACTTATTTGTCAAAIXSAAAGTCAGT^ 

AGAGATGrTCTTTGAATTGACTCGACAGACTCTGCCCTAC 

TTTGACACCGCAATCTX3CTAGGAGCGTTTGCGAAATTAT 

CT AATTTTGATG CTGTCGGATTAACAGATCGGTCAAACGTATTAG CTCAT 

ATTGGTGTTGGCCATGATCACCATATTGCAGGACAACC^ 

CCTATCTAAAAGTGTTATTTTTGATGGCGAACCA^ 

AAGCGGCGATTTCTTGTCCAGATCACAACTGTCAGT^ 

GTAGTTCCTCTAAAAATAAATGATAAAACTGTGGGTG CCTTAAAAATGT A 

CTTTGCAGGAGATAAGACAATGTCroAGGTGGAG 

GTTTAGCGCAAATATTTTCAGGACAACTGG CAATGGGGATAACAG AGGAA 

CAAAATAAGTTAGCCAGTATGGCAGAGATAAAGGCITTAC^ 

CAACCCTCATTTCTTCTrrAATGCCATTAACACA^ 

GTATTGATTCrGATAAAG CACGTTATG CACTGATGCAGTTAAGTACTTTT 
TTTAGAACAAGTTTGCAAGGTGGTCAGGATCGTGAGGTAACG 
AGAAAAATCACATGTGGATGCTTATATGAATGTTGAAAAATT 
CTGATAAATATCAGTEATCTTATGAT^^ 

TTACCGCCIOTTGGTTTACAGGTACTGGTAGAGAATG CAGTTCGACATG C 

TTTTAAAGAACGTAAGACGGAC^CCATATATTGGTTCAAATAAAGCCAG 

ATGGTCATTATTATTGTGTTTCTGTTAGTGACA^ 

GATACTATCATTCATAAATTAGGTCAAGAAACAGTTX3C^ 

TACAGGTACTGCTCTAGTTAATCrAAATAACAGGCTGAATTTA 

GTAGTGTAAGTTG CCTTCATTTTTCGAGCGACAAGAATGGTAC^ 

TGGTATCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAA'rrri'AA 

TTCT 

SEQ ID NO. S810 
STRAIN JM9130013 

TIX^TGGTCjriXjlTATTCCAAAGGCTAGGAA TTATT 

ATGATTTTAGCCTTTTTATTGGTAAATAATACT 

TGAAGAGCGGTCTAAACGTGaAAQSGTAGTCCTT^ 

TGTTTGTTATTATATCTAATATAACAGGAATTGAA 

AGTTTGGTCGAGCGCCCriTlVrAACAACGATTTCn^ 

TGCTAATACAAGGACTTTAGTTATTACAACGGCAAG'rri 

CTCTGGTTGGATC^TIXnTGGTTTTATTGGAGG 

CAAGGAAGCTTTTCAGGTTCTTTCTATATTC 

CATTGTTAGCGGAAAGATTGGTGATAAGCITAAGGAAAACCAT^ 

CTTCAACAAGCCAAGTTATTTTAATTA 

ATGCTATTTGTTGGCATrrTTACAGGATGGGAA 

CATTCCAATGATGATTTTAAATAGTTTAGGTTCCAC^ 

TTTTGAAAACTTATTTGTCAAATGAAAGTCAGT^ 

AGAOATGTTCTTGAATTC^CTCGACAGACTCTGC^ 

TTIX^CACCGCAATCTGCTAGGAGCGTTTC 

CXAACTTTGATGCTGTGGGATTAACAGATCGGTCAA^ CTCAT 

ATOSGTXnTGGCCATGATCACCMATTG 

CTTATCTAAAAGTGTTATTTTTGATGGCGA^ 

AAGCGGCGATTTCTTGTCCAQATCAQU^ 

GTAGTTCCTCTAAAAATAAATGATAAAACTGfTGGGTGC^ 

CTTTGCAGGAGATAAGACAATGTCTGAGGTCGAGGAA 

GTTTAGCGCAAATATTTTCAGGACAACTGGCAATG 

CAAAATAAGTTAGCCAGTATGGCAGAGATAAAGGCTTT^ 

C^CCCTCAinTCTlVlTiTUVTGCC^ 

CTATTGATTCTGATAAAGCACGTTATGCACTO 

TTTAGAACAAGTTTGCAGGOTGGTCAGGATCGTGAGGTAACGCT^ 

agAAAAATCACATGTGGATGCTTATATGAATGTTGAAAAA 

CTGATAAATATCAGTTATCITATGATATTAGTGCAC^ 

TTACCACCrTTrGGTTTAOVGGTACrrGGT'AG^ 

TlTCAAAGAACGTAAQACGGAC!AACCATATATTG<nTCA 
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ATGGTCATTATTATTGTGTTTCTGTTAGTGACAATGGACAAG 
GATACTATCATTGATAAATTAGGTCAAGAAACAGTTG CAGAGAGTAAGGG 
TACAGGTACTGCTCTAGTTAATCTAAATAACAGGCTGAATTTATTATATG 
GT AGTGT AAGTTGCCTT CATTTTTCGAGCGACAAGAATGGTACAAAAGTT 
TGGTATCGAATACCTAATAGAATAAGGGAGGATGAGCATGAAAATTTTAA 
TTCT 
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TTGATGGTGT 
TTGATGGTGT 
TTGATGGTGT 
TTGATGGTGT 
TTGATGGTGT 
TTGATGGTGT 
TTGATGGTGT 
TTGATGGTGT 
TTGATGGTGT 
TTGATGGTGT 
TTGATGGTGT 



TGTTATTCCA 
TGTTATTCCA 
TGTTATTCCA 
TGTTATTCCA 
TGTTATTCCA 
TGTTATTCCA 
TGTTATTCCA 
TGTTATTCCA 
TGTTATTCCA 
TGTTATTCCA 
TGTTATTCCA 



AAGGCTAGGA 
AAGGCTAGGA 
AAGGCTAGGA 
AAGGCTAGGA 
AAGGCTAGGA 
AAGGCTAGGA 
AAGGCTAGGA 
AAGGCTAGGA 
AAGGCTAGGA 
AAGGCTAGGA 
AAGGCTAGGA 



ATTATTATGA 
ATTATTATGA 
ATTATTATGA 
ATTATTATGA 
ATTATTATGA 
ATTATTATGA 
ATTATTATGA 
ATTATTATGA 
ATTATTATGA 
ATTATTATGA 
ATTATTATGA 
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TTTTAGCCTT 
TTTTAGCCTT 
TTTTAGCCTT 
TTTTAGCCTT 
TTTTAGCCTT 
TTTTAGCCTT 
TTTTAGCCTT 
TTTTAGCCTT 
TTTTAGCCTT 
TTTTAGCCTT 
TTTTAGCCTT 
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TTTATTGGTA 
TTTATTGGTA 
TTTATTGGTA 
TTTATTGGTA 
TTTATTGGTA 
TTTATTGGTA 
TTTATTGGTA 
TTTATTGGTA 
TTTATTGGTA 
TTTATTGGTA 
TTTATTGGTA 



AATAATAGTT 
AATAATAGTT 
AATAATAGTT 
AATAATAGTT 
AATAATAGTT 
AATAATAGTT 
AATAATAGTT^ 
AATAATAGTT' 
AATAATAGTT 
AATAATAGTT 
AATAATAGTT 



ATTTtAGACA 
ATTTtAGACA 
ATTTcAGACA 
ATTTcAGACA 
ATTTcAGACA 
ATTTcAGACA 
ATTTcAGACA 
ATTTcAGACA 
ATTTCAGACA 
ATTTcAGACA 
ATTTCAGACA 



GTTAATTGAA 
GTTAATTGAA 
GTTAATTGAA 
GTTAATTGAA 
GTTAATTGAA 
GTTAATTGAA 
GTTAATTGAA 
GTTAATTGAA 
GTTAATTGAA 
GTTAATTGAA 
GTTAATTGAA 



100 

GAGCGGTCTA 
GAGCGGTCTA 
GAGCGGTCTA 
GAGCGGTCTA 
GAGCGGTCTA 
GAGCGGTCTA 
GAGCGGTCTA 
GAGCGGTCTA 
GAGCGGTCTA 
GAGCGGTCTA 
GAGCGGTCTA 



rasa442667.2{24B_18RS21 
msa442667.2(248_2603 
msa442667 . 2 { 248_A909 
msa442667 . 2 { 248_H36B ( 
msa442667.2{248_JM9130013 
msa442667.2(248_COHl 
ms a4 4 2 6 67 . 2 f 24 8_M7 8 1 
msa442667 . 2 { 248_M732 
msa442667 . 2 {248_090 
msa442667 . 2 f 248_C0B110 
msa442667 . 2 (248_1169NT 
Consensus 



101 

AACGTGAAAC 
AACGTGAAAC 
AACGTGAAAC 
AACGTGAAAC 
AACGTGAAAC 
AACGTGAAAC 
AACGTGAAAC 
AACGTGAAAC 
AACGTGAAAC 
AACGTGAAAC 
AACGTGAAAC 



GGTAGTcCTT 
GGTAGTcCTT 
GGTAGTc CTT 
GGTAGTcCTT 
GGTAGTcCTT 
GGTAGTcCTT 
GGTAGTcCTT 
GGTAGTcCTT 
GGTAGTaCTT 
GGTAGTaCTT 
GGTAGTaCTT 



GTCATCATTT 
GTCATCATTT 
GTCATCATTT 
GTCATCATTT 
GTCATCATTT 
GTCATCATTT 
GTCATCATTT 
GTCATCATTT 
GTCATCATTT 
GTCATCATTT 
GTCATCATTT 



TCGGCTTGTT 
TCGGCTTGTT 
TCGGCTTGTT 
TCGGCTTGTT 
TCGGCTTGTT 
TCGGCTTGTT 
TCGGCTTGTT 
TCGGCTTGTT 
TCGGCTTGTT 
TCGGCTTGTT 
TCGGCTTGTT 



150 

TGTTATTATA 
TGTTATTATA 
TGTTATTATA 
TGTTATTATA 
TGTTATTATA 
TGTTATTATA 
TGTTATTATA 
TGTTATTATA 
TGTTATTATA 
TGTTATTATA 
TGTTATTATA 



msa442667 . 2 { 248_18RS21 
msa442667.2f246_2603 
msa442667 . 2 { 248_A909 
msa442667 .2{248_H36B 
msa442667 . 2 { 248_JM9130013 
msa442667 . 2 f 248_COHl 
msa442667.2(248 M781 
msa442667 . 2 { 24 8_M732 
msa442667 . 2 { 248_090 
msa442667.2{248_CJB110 
msa442667 . 2 { 248_1169NT 
Consensus 



151 

TCTAATATAA 
TCTAATATAA 
TCTAATATAA 
TCTAATATAA 
TCTAATATAA 
TCTAATATAA 
TCTAATATAA 
TCTAATATAA 
TCTAATATAA 
TCTAATATAA 
TCTAATATAA 



CAGGAATTGA 
CAGGAATTGA 
CAGGAATTGA 
CAGGAATTGA 
CAGGAATTGA 
CAGGAATTGA 
CAGGAATTGA 
CAGGAATTGA 
CAGGAATTGA 
CAGGAATTGA 
CAGGAATTGA 



AATAAAAGGG 
AATAAAAGGG 
AATAAAAGGG 
AATAAAAGGG 
AATAAAAGGG 
AATAAAAGGG 
AATAAAAGGG 
AATAAAAGGG 
AATAAAAGGG 
AATAAAAGGG 
AATAAAAGGG 



GATCGAAGTT 
GATCGAAGTT 
GATCGAAGTT 
GATCGAAGTT 
GATCGAAGTT 
GATCGAAGTT 
GATCGAAGTT 
GATCGAAGTT 
GATCGAAGTT 
GATCGAAGTT 
GATCGAAGTT 



200 

TGGTCGAGCG 
TGGTCGAGCG 
TGGTCGAGCG 
TGGTCGAGCG 
TGGTCGAGCG 
TGGTCGAGCG 
TGGTCGAGCG 
TGGTCGAGCG 
TGGTCGAGCG 
TGGTCGAGCG 
TGGTCGAGCG 



msa442667 . 2 {248_18RS2l| 
msa442667 .2(248_2603 
msa442667 . 2 (248_A909 
msa442667 .2{248_H36B 
msa442667.2{248_JM9130013 
msa44 26 67 . 2 { 24 B_C0H1 
msa442667.2(248_M7Bl 
rasa442667 . 2 { 248_M732 
msa442667.2{248_090 
msa442667 . 2 I 248_CJB110 
maa442667.2{248_1169NT 
Consensus 



201 

CCCTTTTCTA 
CCCTTTTCTA 
CCCTTTTCTA 

CCCTTTTCTA 
CCCTTTTCTA 
CC CTTTTC TA 
CCCTTTTCTA 
CCCTTTTCTA 
CCCTTTTCTA 
CCCTTTTCTA 



ACAACGATTT 
ACAACGATTT 
ACAACGATTT 
ACAACGATTT 
ACAACGATTT 
ACAACGATTT 
ACAACGATTT 
ACAACGATTT 
ACAACGATTT 
ACAACGATTT 
ACAACGATTT 



CtCATTCTGA 
CtCATTCTGA 
CtCATTCTGA 
CtCATTCTGA 
CtCATTCTGA 
CcCATTCTGA 
CcCATTCTGA 
CcCATTCTGA 
CcCATTCTGA 
CcCATTCTGA 
CtCATTCTGA 



CTCACTTGCT 
CTCACTTGCT 
CTCACTTGCT 
CTCACTTGCT 
CTCACTTGCT 
CTCACTTGCT 
CTCACTTGCT 
CTCACTTGCT 
CTCACTTGCT 
CTCACTTGCT 
CTCACTTGCT 



250 

AATACAAGGA 
AATACAAGGA 
AATACAAGGA 
AATACAAGGA 
AATACAAGGA 
AATACAAGGA 
AATACAAGGA 
AATACAAGGA 
AATACAAGGA 
AATACAAGGA 
AATACAAGGA 



msa442667.2{248 18RS21) 
msa442667.2{248_2603} 



251 300 
CTTTAGTTAT TACAACGGCA AGTTTGGTTG GTGGACCTCT GGTTGGATCA 
CTTTAGTTAT TACAACGGCA AGTTTGGTTG GTGGACCTCT GGTTGGATCA 



908 



WO 2004/018646 



PCT/US2003/026827 



Table 58: Comparative Sequences relating to SAG0182 



msa442667 . 2 ( 246_A90 9 ' 
tnsa442667.2(248_H36B ( 
msa442667.2{248_JM9130013 
msa442667. 2(248 COH1 
msa442667 . 2 { 24 6 J4781 
msa442667 . 2 { 24 8_M732 
msa442667 . 2 {248_090 
msa442667 . 2 { 248_CJB110 
msa442667 .2{248_1169NT 
Consensus 



CTTTAGTTAT 
CTTTAGTTAT 
CTTTAGTTAT 
CTTTAGTTAT 
CTTTAGTTAT 
CTTTAGTTAT 
CTTTAGTTAT 
CTTTAGTTAT 
CTTTAGTTAT 



TACAACGGCA 
TACAACGGCA 
TACAACGGCA 
TACAACGGCA 
TACAACGGCA 
TACAACGGCA 
TACAACGGCA 
TACAACGGCA 
TACAACGGCA 



AGTTTGGTTG 
AGTTTGGTTG 
AGTTTGGTTG 
AGTTTGGTTG 
AGTTTGGTTG 
AGTTTGGTTG 
AGTTTGGTTG 
AGTTTGGTTG 
AGTTTGGTTG 



GTGGACCTCT 
GTGGACCTCT 
GTGGACCTCT 
GTGGACCTCT 
GTGGACCTCT 
GTGGACCTCT 
GTGGACCTCT 
GTGGACCTCT 
GTGGACCTCT 



GGTTGGATCA 
GGTTGGATCA 
GGTTGGATCA 
GGTTGGATCA 
GGTTGGATCA 
GGTTGGATCA 
GGTTGGATCA 
GGTTGGATCA 
GGTTGGATCA 



msa442667 . 2 { 248_18RS21 
tnsa442667 . 2 { 248_2603 ' 
msa442667. 2(248 A909 
msa442667.2{248_H36B 
msa442667.2{248_JM9130013 
msa442667 . 2 { 248_C0H1 
msa442667 . 2 { 248 J4781 
msa442667 . 2 { 248_M732 
msa442667.2{248_090 
rasa442667 . 2 { 248_CJBli0 
msa442667 . 2 { 248_1169NT 
Consensus 



301 

ATTGTTGGTT 
ATTGTTGGTT 
ATTGTTGGTT 
ATTGTTGGTT 
ATTGTTGGTT 
ATTGTTGGTT 
ATTGTTGGTT 
ATTGTTGGTT 
ATTGTTGGTT 
ATTGTTGGTT 
ATTGTTGGTT 



TTATTGGAGG 
TTATTGGAGG 
TTATTGGAGG 
TTATTGGAGG 
TTATTGGAGG 
TTATTGGAGG 
TTATTGGAGG 
TTATTGGAGG 
TTATTGGAGG 
TTATTGGAGG 
TTATTGGAGG 



AGTTCATCGC 
AGTTCATCGC 
AGTTCATCGC 
AGTTCATCGC 
AGTTCATCGC 
AGTTCATCGC 
AGTTCATCGC 
AGTTCATCGC 
AGTTCATCGC 
AGTTCATCGC 
AGTTCATCGC 



TTTTTTCAAG 
TTTTTTCAAG 
TTTTTTCAAG 
TTTTTTCAAG 
TTTTTTCAAG 
TTTTTTCAAG 
TTTTTTCAAG 
TTTTTTCAAG 
TTTTTTCAAG 
TTTTTTCAAG 
TTTTTTCAAG 



350 

GAAGCTTTTC 
GAAGCTTTTC 
GAAGCTTTTC 
GAAGCTTTTC 
GAAGCTTTTC 
GAAGCTTTTC 
GAAGCTTTTC 
GAAGCTTTTC 
GAAGCTTTTC 
GAAGCTTTTC 
GAAGCTTTTC 



msa442667 . 2 { 248_18RS2 1 
msa442667 . 2 { 248_2603 
tnaa442667 . 2 1 248_A909 
msa442667.2{248_H36B 
msa442667 . 2 { 248_JM9130013 
msa442667.2(248_COHl 
tnsa442667.2(248_M781 
msa442667 . 2 { 24 8_M732 
rasa442667.2{248_090 
msa442667.2(248_CJB110 
msa442667 .2{248_1169NT 
Consensus 



351 

AGGTTCTTTC 
AGGTTCTTTC 
AGGTTCTTTC 
AGGTTCTTTC 
AGGTTCTTTC 
AGGTT CTTT C 
AGGTTCTTTC 
AGGTTCTTTC 
AGGTTCTTTC 
AGGTTCTTTC 
AGGTTCTTTC 



TATATTGTCA 
TATATTGTCA 
TATATTGTCA 
TATATTGTCA 
TATATTGTCA 
TATATTGTCA 
TATATTGTCA 
TATATTGTCA 
TATATTGTCA 
TATATTGTCA 
TATATTGTCA 



GTTCAGTTCT 
GTTCAGTTCT 
GTTCAGTTCT 
GTTCAGTTCT 
GTTCAGTTCT 
GTTCAGTTCT 
GTTCAGTTCT 
GTTCAGTTCT 
GTTCAGTTCT 
GTTCAGTTCT 
GTTCAGTTCT 



AGTCGGCATT 
AGTCGGCATT 
AGTCGGCATT 
AGTCGGCATT 
AGTCGGCATT 
AGTCGGCATT 
AGTCGGCATT 
AGTCGGCATT 
AGTCGGCATT 
AGTCGGCATT 
AGTCGGCATT 



400 

GTtAGCGGAA 
GTtAGCGGAA 
GTtAGCGGAA 
GTtAGCGGAA 
GTtAGCGGAA 
GTtAGCGGAA 
GTtAGCGGAA 
GTtAGCGGAA 
GTtAGCGGAA 
GTtAGCGGAA 
GTgAGCGGAA 



rasa442667.2{248 18RS21 
ntsa442667.2(248_2603 
msa442667.2(248 A909 
msa442667 . 2 { 24 8_H36B 
msa442667.2{248_JM9130013 
msa442667 .2(24 8_COHl 
xnsa442667.2(248 M781 
msa442667 . 2 { 248~M732 
Itisa442667 . 2 {248_090 
msa442667 ,2{24B_CJB110 
msa442667 .2{248_1169NT 
Consensus 



401 

AGATTGGTGA 
AGATTGGTGA 
AGATTGGTGA 
AGATTGGTGA 
AGATTGGTGA 
AGATTGGTGA 
AGATTGGTGA 
AGATTGGTGA 
AGATTGGTGA 
AGATTGGTGA 
AGATTGGTGA 
********** 



TAAGCTTAAG 
TAAGCTTAAG 
TAAGCTTAAG 
TAAGCTTAAG 
TAAGCTTAAG 
TAAGCTTAAG 
TAAGCTTAAG 
TAAGCTTAAG 
TAAGCTTAAG 
TAAGCTTAAG 
TAAGCTTAAG 



GAAAACCATC 
GAAAACCATC 
GAAAACCATC 
GAAAACCATC 
GAAAACCATC 
GAAAACCATC 
GAAAACCATC 
GAAAACCATC 
GAAAACCATC 
GAAAACCATC 
GAAAACCATC 



********** ********** 



TCTACCCTTC 
TCTACCCTTC 
TCTACCCTTC 
TCTACCCTTC 
TCTACCCTTC 
TCTACCCTTC 
TCTACC CTT C 
TCTACCCTTC 
TCTACCCTTC 
TCTACCCTTC 
TCTACCCTTC 
********** 



450 

AACAAGCCAA 
AACAAGCCAA 
AACAAGCCAA 
AACAAGCCAA 
AACAAGCCAA 
AACAAGCCAA 
AACAAGCCAA 
AACAAGCCAA 
AACAAGCCAA 
AACAAGCCAA 
AACAAGCCAA 
********** 



msa442667 .2{248_18RS21 
msa442667.2{248_2603' 
msa442667.2(248_A909 
msa442667. 2(248 H36B 
rasa442667 . 2 { 248_JM9130013 
msa442667 . 2 ( 248 jCOHl 
tnsa442667 . 2 ( 248J4781 
rosa442667.2(24B_M732 
msa442667 . 2 ( 248_090 
msa442667 . 2 ( 248_CJB110 
msa442 667 . 2 { 248_1169NT 
Consensus 



451 

GTTATTTTAA 
GTTATTTTAA 
GTTATTTTAA 
GTTATTTTAA 
GTTATTTTAA 
GTTATTTTAA 
GTTATTTTAA 
GTTATTTTAA 
GTTATTTTAA 
GTTATTTTAA 
GTTATTTTAA 



TTAGTATTAT 
TTAGTATTAT 
TTAGTATTAT 
TTAGTATTAT 
TTAGTATTAT 
TTAGTATTAT 
TTAGTATTAT 
TTAGTATTAT 
TTAGTATTAT 
TTAGTATTAT 
TTAGTATTAT 



TGCCGAAAGT 
TGCCGAAAGT 
TGCCGAAAGT 
TGCCGAAAGT 
TGCCGAAAGT 
TGCCGAAAGT 
TGCCGAAAGT 
TGCCGAAAGT 
TGCCGAAAGT 
TGCCGAAAGT 
TGCCGAAAGT 



ATCCAGATGC 
ATCCAGATGC 
ATCCAGATGC 
ATCCAGATGC 
ATCCAGATGC 
ATCCAGATGC 
ATCCAGATGC 
ATCCAGATGC 
ATCCAGATGC 
ATCCAGATGC 
ATCCAGATGC 



500 

TATTTGTTGG 
TATTTGTTGG 
TATTTGTTGG 
TATTTGTTGG 
TATTTGTTGG 
TATTTGTTGG 
TATTTGTTGG 
TATTTGTTGG 
TATTTGTTGG 
TATTTGTTGG 
TATTTGTTGG 



msa442 667 . 2 { 24 8_1 8RS2 1 
msa442667 . 2 { 248_2603 
msa442667 . 2 ( 248_A909 
msa442667 .2(248_H36B 
msa442667.2{248_JM9130013 
msa442667.2(248 COH1 
msa442667.2(248J4781 
msa442667.2{248 M732 
msa44 2 6 67 . 2 { 2 48__09 0 
msa442667 .2(248_CJB110 
msa442667.2(248_1169NT 
Consensus 



501 

CATTTTTACA 
cATTTTTACA 
CATTTTTACA 
CATTTTTACA 
CATTTTTACA 
CATTTTTACA 
CATTTTTACA 
C ATTTTTA CA 
tATTTTTACA 
tATTTTTACA 
CATTTTTACA 



GGATGGGAAC 
GGATGGGAAC 
GGATGGGAAC 
GGATGGGAAC 
GGATGGGAAC 
GGATGGGAAC 
GGATGGGAAC 
GGATGGGAAC 
GGATGGGAAC 
GGATGGGAAC 
GGATGGGAAC 



TTGTCAAAAT 
TTGTCAAAAT 
TTGTCAAAAT 
TTGTCAAAAT 
TTGTCAAAAT 
TTGTCAAAAT 
TTGTCAAAAT 
TTGTCAAAAT 
TTGTCAAAAT 
TTGTCAAAAT 
TTGTCAAAAT 



GATTGTCATT 
GATTGTCATT 
GATTGTCATT 
GATTGTCATT 
GATTGTCATT 
GATTGTCATT 
GATTGTCATT 
GATTGTCATT 
GATTGTCATT 
GATTGTCATT 
GATTGTCATT 



550 

CCAATGATGA 
CCAATGATGA 
CCAATGATGA 
CCAATGATGA 
CCAATGATGA 
CCAATGATGA 
CCAATGATGA 
CCAATGATGA 
CCAATGATGA 
CCAATGATGA 
CCAATGATGA 



msa442667 . 2 { 248_18RS21 J 



551 600 

TTTTAAATAG TTTAGGTTCC ACACTTTTCC TTGCGATTTT GAAAACTTAT 



909 



WO 2004/018646 



PCT7US2003/026827 



Table 58: Comparative Sequences relating to SAG0182 



msa442667.2( 248_2603} TTTTAAATAQ 

msa442667.2(248_A909 TTTTAAATAG 

msa442667.2{248_H36B TTTTAAATAG 

msa442667.2{248_JM9130013> TTTTAAATAG 

maa4 4 2 6 67 . 2 ( 24 8_COHl J TTTTAAATAG 

msa442667.2(248_M781 > TTTTAAATAG 

msa442667.2{248_M732 ) TTTTAAATAG 

msa442667 .2{248_090 TTTTA AATAG 

msa442667 . 2 ( 248__CJB110 \ TTTTAAATAG 

msa442667.2{248_1169NT) TTTTAAATAG 

Consensus ********** 



TTTAGGTTCC 
TTTAGGTTCC 
TTTAGGTTCC 
TTTAGGTTCC 
TTTAGGTTCC 
TTTAGGTTCC 
TTTAGGTTCC 
TTTAGGTTCC 
TTTAGGTTCC 
TTTAGGTTCC 



ACACTTTTCC 
ACACTTTTCC 
ACACTTTTCC 
ACACTTTTCC 
ACACTTTTCC 
ACACTTTTCC 
ACACTTTTCC 
ACACTTTTCC 
ACACTTTTCC 
ACACTTTTCC 



TTGCGATTTT 
TTGCGATTTT 
TTGCGATTTT 
TTGCGATTTT 
TTGCGATTTT 
TTGCGATTTT 
TTGCGATTTT 
TTGCGATTTT 
TTGCGATTTT 
TTGCGATTTT 



GAAAACTTAT 
GAAAACTTAT 
GAAAACTTAT 
GAAAACTTAT 
GAAAACTTAT 
GAAAACTTAT 
GAAAACTTAT 
GAAAACTTAT 
GAAAACTTAT 
GAAAACTTAT 



601 

msa442667.2{248_18RS2l) TTGTCAAATG 

msa442667.2{ 248_2603) TTGTCAAATG 

msa442667.2(248_A909 TTGTCAAATG 

msa442667.2{248_H36B) TTGTCAAATG 

msa442667.2{248_JM9130013> TTGTCAAATG 

rosa442667.2(248_COHl} TTGTCAAATG 

msa442667 .2{248_M781} TTGTCAAATG 

msa442667.2{248 M732 TTGTCAAATG 

msa442667.2{248_090 TTGTCAAATG 

msa442667.2(24B_CJB110 TTGTCAAATG 

msa442S67 . 2 {248_1169NT} TTGTCAAATG 

Consensus ********** 



AAAGTCAGTT 
AAAGTCAGTT 
AAAGTCAGTT 
AAAGTCAGTT 
AAAGTCAGTT 
AAAGTCAGTT 
AAAGTCAGTT 
AAAGTCAGTT 
AAAGTCAGTT 
AAAGTCAGTT 
AAAGTCAGTT 



ACGCGCAGTT 
ACGCGCAGTT 
ACGCGCAGTT 
ACGCGCAGTT 
ACGCGCAGTT 
ACGCGCAGTT 
ACGCGCAGTT 
ACGCGCAGTT 
ACGCGCAGTT 
ACGCGCAGTT 
ACGCGCAGTT 



CAAACGAGAG 
CAAACGAGAG 
CAAACGAGAG 
CAAACGAGAG 
CAAACGAGAG 
CAAACGAGAG 
CAAACGAGAG 
CAAACGAGAG 
CAAACGAGAG 
CAAACGAGAG 
CAAACGAGAG 



650 

ATGTTCTTGA 
ATGTTCTTGA 
ATGTTCTTGA 
ATGTTCTTGA 
ATGTTCTTGA 
ATGTTCTTGA 
ATGTTCTTGA 
ATGTTCTTGA 
ATGTTCTTGA 
ATGTTCTTGA 
ATGTTCTTGA 



msa442667 .2{248_18RS21] 
msa442667 . 2 { 248_2 603 ' 
tnsa442667 . 2 { 248_A909 
msa442667 . 2 {248_H36B 
msa442667.2{248_JM9130013 
msa442667 . 2 ( 248_COHl 
msa442667 .2(248_M781 
msa442667.2{248 M732 
msa442667 ,2{248_090 
msa442667 . 2 ( 24B_CJB110 
msa442667 . 2 { 248_1169NT 
Consensus 



651 

ATTGACTCGA 
ATTGACTCGA 
ATTGACTCGA 
ATTGACTCGA 
ATTGACTCGA 
ATTGACTCGA 
ATTGACTCGA 
ATTGACTCGA 
ATTGACTCGA 
ATTGACTCGA 
ATTGACTCGA 



CAGACTCTGC 
CAGACTCTGC 
CAGACTCTGC 
CAGACTCTGC 
CAGACTCTGC 
CAGACTCTGC 
CAGACTCTGC 
CAGACTCTGC 
CAGACTCTGC 
CAGACTCTGC 
CAGACTCTGC 



CCTACCTtAG 
CCTACCTtAG 
CCTACCTtAG 
CCTACCTtAG 
CCTACCTtAG 
CCTACCTtAG 
CCTACCTtAG 
CCTACCTtAG 
CCTACCTCAG 
CCTACCTcAG 
CCTACCTtAG 



ACAAGGTTTG 
ACAAGGTTTG 
ACAAGGTTTG 
ACAAGGTTTG 
ACAAGGTTTG 
ACAAG GTTTG 
ACAAGGTTTG 
ACAAGGTTTG 
ACAAG GTTTG 
ACAAGGTTTG 
ACAAGGTTTG 



700 

ACACCGCAAT 
ACACCGCAAT 
ACACCGCAAT 
ACACCGCAAT 
ACACCGCAAT 
ACACCGCAAT 
ACACCGCAAT 
ACACCGCAAT 
ACACCGCAAT 
ACACCGCAAT 
ACACCGCAAT 



701 

msa442667.2{248_18RS2l} CTGCTAGGAG 

msa442667.2(248_2603 CTGCTAGGAG 

msa442667.2(248_A909 CTGCTAGGAG 

maa442667.2{248 H36B CTGCTAGGAG 

msa442667 ,2{248_JM9130013 J CTGCTAGGAG 

msa442667 . 2 ( 248_COHl CTGCTAGGAG 

rasa442667.2(248_M78lJ CTGCTAGGAG 

msa442667 . 2 { 248_M732 J CTGCTAGGAG 

msa442667.2{248_090' CTGCTAGGAG 

msa442667.2{248_CJB110 CTGCTAGGAG 

msa442667 . 2 { 248_1169NT) CTGCTAGGAG 

Consensus ********** 



OGTTTGCGAA 
CGTTTGCGAA 
CGTTTGCGAA 
CGTTTGCGAA 
CGTTTGCGAA 
CGTTTGCGAA 
CGTTTGCGAA 
CGTTTGCGAA 
CGTTTGCGAA 
CGTTTGCGAA 
CGTTTGCGAA 



ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 
ATTATAAAGA 



GGCATACTAA 
GGCATACTAA 
GGCATACTAA 
GGCATACTAA 
GGCATACTAA 
GGCATACTAA 
GGCATACTAA 
GGCATACTAA 
GGCATACTAA 
GGCATACTAA 
GGCATACTAA 



750 

CTTTGATGCT 
cTTTGATGCT 
CTTTGATGCT 
CTTTGATGCT 
cTTTGATGCT 
cTTTGATGCT 
CTTTGATGCT 
CTTTGATGCT 
CTTTGATGCT 
cTTTGATGCT 
tTTTGATGCT 



msa442667 . 2 { 248_18RS21 
msa442667 . 2 {248_2603 
tnsa442667 .2{248_A909 
msa442667.2{248_H36B 
msa442667.2{248 JM9130013 
n»a442667 .2( 248_COHl 
msa442667.2f248_M781 
msa442667.2{248_M732 
msa442667 . 2 { 248_090 
msa442667 ,2f 248_CJB110 
msa442667 . 2 { 248_116 9NT \ 
Consensus 



msa442 667 . 2 { 248_18RS2 1 ' 
msa4 42 667 .2(24 8_2 603 : 
maa442667 . 2 {248_A909 
msa442667.2{248 H36B 
msa442667 .2(248 JM9130013 
msa442667.2(248_COHl 
msa442667.2 248 M781 
tnsa442667 . 2(248^732 
msa442667.2{248_090 
msa442667. 2(248 CJB110 
msa442667 .2{248_1169NT 
Consensus 



751 

GTgGGATTAA 
GTgGGATTAA 
GTgGGATTAA 
GTgGGATTAA 
GTgGGATTAA 
GTgGGATTAA 
GTgGGATTAA 
GTgGGATTAA 
GTaGGATTAA 
GTaGGATTAA 
GTgGGATTAA 



CAGATCGGTC 
CAGATCGGTC 
CAGATCGGTC 
CAGATCGGTC 
CAGATCGGTC 
CAGATCGGTC 
CAGATCGGTC 
CAGATCGGTC 
CAGATCGGTC 
CAGATCGGTC 
CAGATCGGTC 



AAACGTATTA 
AAACGTATTA 
AAACGTATTA 
AAACGTATTA 
AAACGTATTA 
AAACGTATTA 
AAACGTATTA 
AAACGTATTA 
AAACGTATTA 
AAACGTATTA 
AAACGTATTA 



GCTCATATTO 
GCTCATATTG 
GCTCATATTG 
GCTCATATTG 
GCTCATATTG 
GCTCATATTG 
GCTCATATTG 
GCTCATATTG 
GCTCATATTG 
GCTCATATTG 
GCTCATATTG 



800 

GTgTTGGCCA 
GTgTTGGCCA 
GTgTTGGCCA 
GTgTTGGCCA 
GTgTTGGCCA 
GTgTTGGCCA 
GTgTTGGCCA 
GTaTTGGCCA 
GTgTTGGCCA 
GTgTTGGCCA 
GTgTTGGCCA 



801 

TGATCACCAT 
TGATCACCAT 
TGATCACCAT 
TGATCACCAT 
TGATCACCAT 
TGATCACCAT 
TGATCACCAT 
TGATCACCAT 
TGATCACCAT 
TGATCACCAT 
TGATCACCAT 



ATTGCAGGAC 
ATTGCAGGAC 
ATTGCAGGAC 
ATTGCAGGAC 
ATTGCAGGAC 
ATTGCAGGAC 
ATTGCAGGAC 
ATTGCAGGAC 
ATTGCAGGAC 
ATTGCAGGAC 
ATTGCAGGAC 



AACCgGTCAA 
AACCgGTCAA 
AACCgGTCAA 
AACCgGTCAA 
AACCgGTCAA 
AACCgGTCAA 
AACCgGTCAA 
AACCgGTCAA 
AACCaGTCAA 
AACCaGTCAA 
AACCaGTCAA 



AACAGACtTA 
AACAGACtTA 
AACAGACtTA 
AACAGACtTA 
AACAGACtTA 
AACAGACtTA 
AACAGACtTA 
AACAGACtTA 
AACAGACCTA 
AACAGACcTA 
AACAGACCTA 



850 

TCTAAAAGTG 
TCTAAAAGTG 
TCTAAAAGTG 
TCTAAAAGTG 
TCTAAAAGTG 
TCTAAAAGTG 
TCTAAAAGTG 
TCTAAAAGTG 
TCTAAAAGTG 
TCTAAAAGTG 
TCTAAAAGTG 



851 



900 



910 



WO 2004/018646 



PCT/US2003/026827 



Table 58: Comparative Sequences relating to SAG0182 



nwa442667.2{248 18RS21) TTATTTTTGA 

nisa442667.2f248 2603 TT ATTTTTG A 

msa4 4 2667. 2 <248_A909 TT ATTTTTG A 

nisa442667.2{248_H36B' TT ATTTTTG A 

thsa442667.2{248 JM9130013 TTATTTTTGA 

msa442667 ,2f 24B_COHl) TT ATTTTT GA 

rasa442667.2(248JM781} TT ATTTTT GA 

TOSa442667.2{248_M732j TT ATTTTTG A 

msa442667.2{248_090} TTATTTTTGA 

msa442667.2(248_GJB110 \ TT ATTTTTG A 

maa442667 . 2 {248_1169NT} TTATTTTTGA 

Consensus ********** 



TGGCGAACCA 
TGGOGAACCA 
TGGCGAACCA 
TGGCGAACCA 
TGGCGAACCA 
TGGOGAACCA 
TGGCGAACCA 
TGGCGAACCA 
TGGCGAACCA 
TGGCGAACCA 
TGGCGAACCA 



AGAATTGCGC 
AGAATTGCGC 
AGAATTGCGC 
AGAATTGCGC 
AGAATTGCGC 
AGAATTGCGC 
AGAATTGCGC 
AGAATTGCGC 
AGAATTGCGC 
AGAATTGCGC 
AGAATTGCGC 



AAGATAAAGC 
AAGATAAAGC 
AAGATAAAGC 
AAGATAAAGC 
AAGATAAAGC 
AAGATAAAGC 
AAGATAAAGC 
AAGATAAAGC 
AAGATAAAGC 
AAGATAAAGC 
AAGATAAAGC 



GGCGATTTCT 
GGCGATTTCT 
GGCGATTTCT 
GGCGATTTCT 
GGCGATTTCT 
GGCGATTTCT 
GGCGATTTCT 
GGCGATTTCT 
GGCGATTTCT 
GGCG ATTT CT 
GGCGATTTCT 



901 

msa442667.2{248_18RS2l} TGTCCAGATC 

msa442667 . 2 { 248_2603 ) TGTCCAGATC 

tnsa442667.2{248 A909 > TGTCCAGATC 

msa442667 . 2 { 248~H36B | TGTCCAGATC 

tnsa442667.2{248_JM9130013 TGTCCAGATC 

msa442667 . 2 { 248 COH1 f TGTCCAGATC 

msa442667.2i24B"*M781 \ TGTCCAGATC 

msa442667 . 2 { 248J4732 TGTCCAGATC 

msa442667.2{248 090) TGTCCAGATC 

msa442667.2{248 CJB110 TGTCCAGATC 

msa442667.2{248~1169NT} TGTCCAGATC 

Consensus ********** 



ACAACTGTCA 
ACAACTGTCA 
ACAACTGTCA. 
ACAACTGTCA 
ACAACTGTCA 
ACAACTGTCA 
ACAACTGTCA 
ACAACTGTCA 
ACAACTGTCA 
ACAACTGTCA 
ACAACTGTCA 



GTTAAATTCT 
GTTAAATTCT 
GTTAAATTCT 
GTTAAATTCT 
GTTAAATTCT 
GTTAAATTCT 
GTTAAATTCT 
GTTAAATTCT 
GTTAAATTCT 
GTTAAATTCT 
GTTAAATTCT 



GCTATTGTAG 
GCTATTGTAG 
GCTATTGTAG 
GCTATTGTAG 
GCTATTGTAG 
GCTATTGTAG 
GCTATTGTAG 
GCTATTGTAG 
GCTATTGTAG 
GCTATTGTAG 
GCTATTGTAG 



950 

TTCCTCTAAA 
TTCCTCTAAA 
TTCCTCTAAA 
TTCCTCTAAA 
TTCCTCTAAA 
TTCCTCTAAA 
TTCCTCTAAA 
TTCCTCTAAA 
TTCCTCTAAA 
TTCCTCTAAA 
TTCCTCTAAA 



951 

msa442667 . 2 { 248_18RS21 } AATAAATGAT 

msa442667.2(248 2603 AATAAATGAT 

msa442667. 2 J 248~A909 } AATAAATGAT 

msa442667.2{248~H36B AATAAATGAT 

maa442667.2{248_JM9130013 AATAAATGAT 

Ittsa442667 ,2{ 248_COHl AATAAATGAT 

msa44 2667 .2(24 8_M7 81 AATAAATGAT 

rosa442667.2{248_M732} AATAAATGAT 

msa442667.2{248_090 AATAAATGAT 

rasa442 667 . 2 f 24 B_CJB1 1 0 J AATAAATGAT 

msa442667.2{248_1169NT} AATAAATGAT 

Consensus ********** 



AAAACTGTGg 
AAAACTGTGg 
AAAACTGTGg 
AAAACTGTGg 
AAAACTGTGg 
AAAACTGTGt 
AAAACTGTGt 
AAAACTGTGt 
AAAACTGTGg 
AAAACTGTGg 
AAAACTGTGg 



GTGCCTTAAA 
GTGCCTTAAA 
GTGCCTTAAA 
GTGCCTTAAA 
GTGCCTTAAA 
GTGCCTTAAA 
GTGCCTTAAA 
GTGCCTTAAA 
GTGCCTTAAA 
GTGCCTTAAA 
GTGCCTTAAA 



AATGTACTTT 
AATGTACTTT 
AATGTACTTT 
AATGTACTTT 
AATGTACTTT 
AATGTACTTT 
AATGTACTTT 
AATGTACTTT 
AATGTACTTT 
AATGTACTTT 
AATGTACTTT 



1000 
GCAGGAGATA 
GCAGGAGATA 
GCAGGAGATA 
GCAGGAGATA 
GCAGGAGATA 
GCAGGAGATA 
GCAGGAGATA 
GCAGGAGATA 
GCAGGAGATA 
GCAGGAGATA 
GCAGGAGATA 



msa442667.2{248_18RS2l' 
msa442667 . 2 { 248_2603 
msa442667.2{248_A909 
msa442667 . 2 { 24 8_H36B 
msa442667 .2{248_JM9130013 
msa442667.2(248_COHl 
msa442667 . 2 ( 248_M781 
ntsa4 42667 .2(24 8_M73 2 
msa442667 . 2 { 248_090 
msa442667 . 2 f 24B_CJB110 
msa442667 .2{248_1169NT 
Consensus 



msa442667.2{248_18RS2l' 
ntsa442667 . 2 { 248_2603 
msa442667 .2(248_A909 
nsa44 2667 .2(24 8_H36B 
msa442667.2{248_JM9130013 
msa442667.2(248_C0Hl 
msa442667.2{248_M781 
msa442667 . 2 { 248_M732 
msa442667.2{248JD90 
msa442667 . 2 { 248_CJB110 
msa442667 . 2 { 248_1169NT 
Consensus 



msa442667.2{248 18RS21 
msa442667 . 2 ( 248_2603 
rosa442667.2(248_A909 
msa442667 . 2 { 248_H36B 
msa442667.2{248_JM9130013 
msa442667.2f 248 COH1 
tnsa442667 . 2 (248_M781 
rasa442667 . 2 { 248^M732 
msa442667.2{248 090 
msa442667 . 2 ( 248_CJB110 
msa442667.2{248_1169NT 
Consensus 



1001 

AGACAATGTC 
AGACAATGTC 
AGACAATGTC 
AGACAATGTC 
AGACAATGTC 
AGACAATGTC 
AGACAATGTC 
AGACAATGTC 
AGACAATGTC 
AGACAATGTC 
AGACAATGTC 



TGAGGTGGAG 
TGAGGTGGAG 
TGAGGTGGAG 
TGAGGTGGAG 
TGAGGTGGAG 
TGAGGTGGAG 
TGAGGTGGAG 
TGAGGTGGAG 
TGAGGTGGAG 
TGAGGTGGAG 
TGAGGTGGAG 



GAAAACCTAG 
GAAAACCTAG 
GAAAACCTAG 
GAAAACCTAG 
GAAAACCTAG 
GAAAACCTAG 
GAAAACCTAG 
GAAAACCTAG 
GAAAACCTAG 
GAAAACCTAG 
GAAAACCTAG 



TCCTTGGTTT 
TCCTTGGTTT 



TCCTTGGTTT 
TCCTTGGTTT 
TCCTTGGTTT 
TCCTTGGTTT 
TCCTTGGTTT 
TCCTTGGTTT 



1050 
AGCGCAAATA 
AGCGCAAATA 
AGCGCAAATA 
AGCGCAAATA 
AGCGCAAATA 
AGCGCAAATA 
AGCGCAAATA 
AGCGCAAATA 
AGCGCAAATA 
AGCGCAAATA 
AGCGCAAATA 



1051 

TTTTCAGGAC 
TTTTCAGGAC 
TTTTCAGGAC 
TTTTCAGGAC 
TTTTCAGGAC 
TTTTCAGGAC 
TTTTCAGGAC 
TTTTCAGGAC 
TTTTCAGGAC 
TTTTCAGGAC 
TTTTCAGGAC 



AACTGGCAAT 
AACTGGCAAT 
AACTGGCAAT 
AACTGGCAAT 
AACTGGCAAT 
AACTGGCAAT 
AACTGGCAAT 
AACTGGCAAT 
AACTGGCAAT 
AACTGGCAAT 
AACTGGCAAT 



GGGGATAACA 
GGGGATAACA 
GGGGATAACA 
GGGGATAACA 
GGGGATAACA 
GGGGATAACA 
GGGGATAACA 
GGGGATAACA 
GGGGATAACA 
GGGGATAACA 
GGGGATAACA 



GAGGAACAAA 
GAGGAACAAA 
GAGGAACAAA 
GAGGAACAAA 
GAGGAACAAA 
GAGGAACAAA 
GAGGAACAAA 
GAGGAACAAA 
GAGGAACAAA 
GAGGAACAAA 
GAGGAACAAA 



1100 
ATAAGTTAGC 
ATAAGTTAGC 
ATAAGTTAGC 
ATAAGTTAGC 
ATAAGTTAGC 
ATAAGTTAGC 
ATAAGTTAGC 
ATAAGTTAGC 
ATAAGTTAGC 
ATAAGTTAGC 
ATAAGTTAGC 



1101 

CAGTATGGCA 
CAGTATGGCA 
CAGTATGGCA 
CAGTATGGCA 
CAGTATGGCA 
CAGTATGGCA 
CAGTATGGCA 
CAGTATGGCA 
CAGTATGGCA 
CAGTATGGCA 
CAGTATGGCA 



GAGATAAAGG 
GAGATAAAGG 
GAGATAAAGG 
GAGATAAAGG 
GAGATAAAGG 
GAGATAAAGG 
GAGATAAAGG 
GAGATAAAGG 
GAGATAAAGG 
GAGATAAAGG 
GAGATAAAGG 



CTTTACAAGC 
CTTTACAAGC 
CTTTACAAGC 
CTTTACAAGC 
CTTTACAAGC 
CTTTACAAGC 
CTTTACAAGC 
CTTTACAAGC 
CTTTACAAGC 
CTTTA CAAGC 
CTTTACAAGC 



ACAAATCAAC 
ACAAATCAAC 
ACAAATCAAC 
ACAAATCAAC 
ACAAATCAAC 
ACAAATCAAC 
ACAAATCAAC 
ACAAATCAAC 
ACAAATCAAC 
ACAAATCAAC 
ACAAATCAAC 



1150 
CCTCATTTcT 
CCTCATTTcT 
CCTCATTTcT 
CCTCATTTcT 
CCTCATTTcT 
CCTCATTTcT 
CCTCATTTcT 
CCTC ATTT cT 
CCTCATTTcT 
CCTCATTTtT 
CCTCATTTcT 
********-* 



911 



WO 2004/018646 



PCT/US2003/026827 



Table 58: Comparative Sequences relating to SAG0182 



msa442667.2{ 
msa442667 
msa442667 
msa442667 
msa442667.2{248 
msa442667 , 
msa442667 . 
msa442667. 
msa442667 
msa442667.2( 
msa442667.2{ 



248 18RS21 
2 {24 8 2603 
2(248~A909 
2{248_H36B 
_JM9130013 
2(248_COHl 
2(248_M781 
2(246_M732 
2{248_090 
248_CJB110 
248_1169NT 
Consensus 



1151 

TCTTTAATGC 
TCTTTAATGC 
TCTTTAATGC 
TCTTTAATGC 
TCTTTAATGC 
TCTTTAATGC 
TCTTTAATGC 
TCTTTAATGC 
TCTTTAATGC 
TCTTTAATGC 
TCTTTAATGC 
********** 



CATTAACACA 
CATTAACACA 
CATTAACACA 
CATTAACACA 
CATTAACACA 
CATTAACACA 
CATTAACACA 
CATTAACACA 
CATTAACACA 
CATTAACACA 
CATTAACACA 
********** 



ATTAGTGCAT 
ATTAGTGCAT 
ATTAGTGCAT 
ATTAGTGCAT 
ATTAGTGCAT 
ATTAGTGCAT 
ATTAGTGCAT 
ATTAGTGCAT 
ATTAGTGCAT 
ATTAGTGCAT 
ATTAGTGCAT 
********** 



TAATCCGTAT 
TAATCCGTAT 
TAATCCGTAT 
TAATCCGTAT 
TAATCCGTAT 
TAATCCGTAT 
TAATCCGTAT 
TAATCCGTAT 
TAATCCGTAT 
TAATCCGTAT 
TAATCCGTAT 
********** 



1200 
TGATTCTGAT 
TGATTCTGAT 
TGATTCTGAT 
TGATTCTGAT 
TGATTCTGAT 
TGATTCTGAT 
TGATTCTGAT 
TGATTCTGAT 
TGATTCTGAT 
TGATTCTGAT 
TGATTCTGAT 
********** 



msa442667 . 2 {248_18RS21 
msa442667 . 2 ( 248_2603 
msa442667 .2{248_A909 
msa442667 . 2 { 24 S_H36B 
msa442667 . 2 { 248_JM9130013 
msa442667 . 2 (248_COHl 
msa442667 . 2 { 248 J4781 
msa442667.2{248_M732 
msa442667.2{248_090 
msa442667 . 2 (248_CJB110 
msa442667 . 2 { 248_1169NT 
Consensus 



1201 

AAAGCACGTT 
AAAGCACGTT 
AAAGCACGTT 
AAAGCACGTT 
AAAGCACGTT 
AAAGCACGTT 
AAAGCACGTT 
AAAGCACGTT 
AAAGCACGTT 
AAAGCACGTT 
AAAGCACGTT 



ATGCACTGAT 
ATGCACTGAT 
ATGCACTGAT 
ATGCACTGAT 
ATGCACTGAT 
ATGCACTGAT 
ATGCACTGAT 
ATGCACTGAT 
ATGCACTGAT 
ATGCACTGAT 
ATGCACTGAT 



GCAGTTAAGT 
GCAGTTAAGT 
GCAGTTAAGT 
GCAGTTAAGT 
GCAGTTAAGT 
GCAGTTAAGT 
GCAGTTAAGT 
GCAGTTAAGT 
GCAGTTAAGT 
GCA GTTA AGT 
GCAGTTAAGT 



ACTTTTTTTA 
ACTTTTTTTA 
ACTTTTTTTA 
ACTTTTTTTA 
ACTTTTTTTA 
ACTTTTTTTA 
ACTTTTTTTA 
ACTTT TT T T A 
ACTTTTTTTA 
A CTTTTTTT A 
A CTTTTTTT A 



1250 
GAACAA GTTT 
GAACAAGTTT 
GAACAAGTTT 
GAACAAGTTT 
GAACAAGTTT 
GAACAAGTTT 
GAACAAGTTT 
GAACAAGTTT 
GAACAAGTTT 
GAACAAGTTT 
GAACAAGTTT 



msa442667.2{ 
msa442667 . 
msa442667 
msa442667 . 
Rtsa442667.2{248 
msa442667 . 
msa442667 . 
msa442667 . 
msa442667 
msa442667.2{ 
msa442667.2{ 



248_18RS21 
2(246 2603 
2(248~A909 
2(248 H36B 
_JM9130013 
2(248 COH1 
2(248_M781 
2{248_M732 
.2{248_090 
248_CJB110 
248_1169NT 
Consensus 



1251 

GCAgGGTGGT 
GCAgGGTGGT 
GCAgGGTGGT 
GCAgGGTGGT 
GCAgGGTGGT 
GCAaGGTGGT 
GCAaGGTGGT 
GCAaGGTGGT 
GCAaGGTGGT 
GCAaGGTGGT 
GCAaGGTGGT 



CAGGATCGTG 
CAGGATOGTG 
CAGGATCGTG 
CAGGATCGTG 
CAGGATCGTG 
CAGGATCGTG 
CAGGATCGTG 
CAGGATCGTG 
CAGGATCGTG 
CAGGATCGTG 
CAGGATCGTG 



AGGTAACGCT 
AGGTAACGCT 
AGGTAACGCT 
AGGTAACGCT 
AGGTAACGCT 
AGGTAACGCT 
AGGTAACGCT 
AGGTAACGCT 
AGGTAACGCT 
AGGTAACGCT 
AGGTAACGCT 



TGAGCAAGAA 
TGAGCAAGAA 
TGAGCAAGAA 
TGAGCAAGAA 
TGAGCAAGAA 
TGAGCAAGAA 
TGAGCAAGAA 
TGAGCAAGAA 
TGAGCAAGAA 
TGAGCAAGAA 
TGAGCAAGAA 



1300 
AAATCACATG 
AAATCACATG 
AAATCACATG 
AAATCACATG 
AAATCACATG 
AAATCACATG 
AAATCACATG 
AAATCACATG 
AAATCACATG 
AAATCACATG 
AAATCACATG 



msa442667.2{ 
msa442667 
msa442667 . 
msa442667 
tnsa442667.2{248 
msa442667 
msa442667 
msa442667 
msa442667 
msa442667.2( 
rasa442667.2{ 



248_18RS21 
2(248 2603 
2(248~A909 
2{248~H36B 
_JM9130013 
2(248 COH1 
2(248J4781 
2 {248 M732 
.2{24B_090 
248_CJB110 
248_1169NT, 
Consensus 



1301 

TGGATGCTTA 
TGGATGCTTA 
TGGATGCTTA 
TGGATGCTTA 
TGGATGCTTA 
TGGATGCTTA 
TGGATGCTTA 
TGGATGCTTA 
TGGATGCTTA 
TGGATGCTTA 
TGGATGCTTA 



TATGAATGTT 
TATGAATGTT 
TATGAATGTT 
TATGAATGTT 
TATGAATGTT 
TATGAATGTT 
TATGAATGTT 
TATGAATGTT 
TATGAATGTT 
TATGAATGTT 
TATGAATGTT 



GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 



GTTTCCCTGA 
GTTTCCCTGA 
GTTTCCCTGA 
GTTTCCCTGA 
GTTTCCCTGA 
GTTTCCCTGA 
GTTTCCCTGA 
GTTTCCCTGA 
GTTTC CCTGA 
GTTTCCCTGA 
GTTTCCCTGA 



1350 
TAAATATCAG 
TAAATATCAG 
TAAATATCAG 
TAAATATCAG 
TAAATATCAG 
TAAATATCAG 
TAAATATCAG 
TAAATATCAG 
TAAATATCAG 
TAAATATCAG 
TAAATATCAG 



msa442667 . 2 { 248_18RS21 
msa442667 .2(248__2603 
msa442667 . 2 (248_A909 
msa442667.2{248_H36B 
msa442667 . 2 { 248_JM9130013 
me a44 26 67 .2(248 COH1 
msa442667 .2( 248~M781 
msa442667.2{248*"M732 
msa442 667 . 2 { 2 4 8_09 0 
msa442667 . 2 (248_GJBH0 
msa442667 . 2 { 248_1169NT 
Consensus 



1351 

TTATCTTATG 
TTATCTTATG 
TTATCTTATG 
TTATCTTATG 
TTATCTTATG 
TTATCTTATG 
TTATCTTATG 
TTATCTTATG 
TTATCTTATG 
TTATCTTATG 
TTATCTTATG 



ATATTAGTGC 
ATATTAGTGC 
ATATTAGTGC 
ATATTAGTGC 
ATATTAGTGC 
ATATTAGTGC 
ATATTAGTGC 
ATATTAGTGC 
ATATTAGTGC 
ATATTAGTGC 
ATATTAGTGC 



ACCAGAAAAA 
ACCAGAAAAA 
ACCAGAAAAA 
ACCAGAAAAA 
ACCAGAAAAA 
ACCAGAAAAA 
ACCAGAAAAA 
ACCAGAAAAA 
ACCAGAAAAA 
ACCAGAAAAA 
ACCAGAAAAA 



ATGAAGTTAC 
ATGAAGTTAC 
ATGAAGTTAC 
ATGAAGTTAC 
ATGAAGTTAC 
ATGAAGTTAC 
ATGAAGTTAC 
ATGAAGTTAC 
ATGAAGTTAC 
ATGAAGTTAC 
ATGAAGTTAC 



1400 
CaCCTTTTGG 
CaCCTTTTGG 
CaCCTTTTGG 
CACCTTTTGG 
CaCCTTTTGG 
CgCCTTTTGG 
CACCTTTTGG 
CgCCTTTTGG 
CACCTTTTGG 
CACCTTTTGG 
CgCCTTTTGG 



msa442667 . 2 {248_18RS21 
msa442667 . 2 ( 248_2603 
msa442667 . 2 ( 248_A909 
msa442667 . 2 { 24 8_H36B 
rasa442667.2{248_JM9130013 
msa442667 • 2 ( 24 8_COHl 
msa442667.2(248 M781 
mea442667 . 2 {248__M732 
rasa442667. 2(248 090 
msa442667 . 2 (248_CJB110 
msa442667 . 2 { 248_1169NT 
Consensus 



1401 

TTTACAGGTA 
TTTA CAGGTA 
TTTA CAGGTA 
TTTACAGGTA 
TTTA CAGGTA 
TTTACAGGTA 
TTTA CAGGTA 
TTTACAGGTA 
TTTACAGGTA 
TTTACAGGTA 
TTTACAGGTA 



CTGGTAGAGA 
CTGGTAGAGA 
CTGGTAGAGA 
CTGGTAGAGA 
CTGGTAGAGA 
CTGGTAGAGA 
CTGGTAGAGA 
CTGGTAGAGA 
CTGGTAGAGA 
CTGGTAGAGA 
CTGGTAGAGA 



ATGCAGTTcG 
ATGCAGTTcG 
ATGCAGTTcG 
ATGCAGTTcG 
ATGCAGTTcG 
ATGCAGTTcG 
ATGCAGTTcG 
ATGCAGTTcG 
ATGCAGTTaG 
ATGCAGTTaG 
ATGCAGTTcG 



ACATGCTTTc 
ACATGCTTTC 
ACATGCTTTC 
ACATGCTTTC 
ACATGCTTTC 
ACATGCTTTC 
ACATGCTTTc 
ACATGCTTTC 
ACATGCTTTC 
ACATGCTTTC 
ACATGCTTTt 



1450 
AAAGAACGTA 
AAAGAACGTA 
AAAGAACGTA 
AAAGAACGTA 
AAAGAACGTA 
AAAGAACGTA 
AAAGAACGTA 
AAAGAACGTA 
AAAGAACGTA 
AAAGAACGTA 
AAAGAACGTA 



912 



WO 2004/018646 



PCT/US2003/026827 



Table 58: Comparative Sequences relating to SAG0182 



1451 

msa442667 . 2 { 248_18RS21 } AGACGGACAA 

msa442667.2f 248 2603} AGACGGACAA 

msa442667 . 2 ( 248~A909 > AGACGGACAA 

msa442667.2{248 H36B AGACGGACAA 

msa442667. 2 { 248_JM9130013 } AGACGGACAA 

rasa442667 .2(248_COHlJ AGACGGACAA 

msa442667.2(248J1781 '\ AGACGGACAA 

msa442667.2{248J4732 AGACGGACAA 

msa442667.2{248_090 '» AGACGGACAA 

msa442667 . 2 { 248_CJB110 } AGACGGACAA 

msa442667.2{24B_1169NT} AGACGGACAA 

Consensus ********** 



CCATATATTG 
CCATATATTG 
CCATATATTG 
CCATATATTG 
CCATATATTG 
CCATATATTG 
CCATATATTG 
CCATATATTG 
CCATATATTG 
CCATATATTG 
CCATATATTG 



GTTCAAATAA 
GTTCAAATAA 
GTTCAAATAA 
GTTCAAATAA 
GTTCAAATAA 
GTTCAAATAA 
GTTCAAATAA 
GTTCAAATAA 
GTTCAAATAA 
GTTCAAATAA 
GTTCAAATAA 



AGCCAGATGG 
AGCCAGATGG 
AGCCAGATGG 
AGCCAGATGG 
AGCCAGATGG 
AGCCAGATGG 
AGCCAGATGG 
AGCCAGATGG 
AGCCAGATGG 
AGCCAGATGG 
AGCCAGATGG 



1500 
TCATTATTAT 
TCATTATTAT 
TCATTATTAT 
TCATTATTAT 
TCATTATTAT 
TCATTATTAT 
TCATTATTAT 
TCATTATTAT 
TCATTATTAT 
TCATTATTAT 
TCATTATTAT 



1501 

msa442667.2{248_18RS2l) TGTGTTTCTG 

msa442667 .2(24 8_2 603 'i TGTG TTTC TG 

msa442667.2(248_A909 TGTGTTTCTG 

msa442667.2{248_H36B TGTGTTTCTG 

msa442667 . 2 { 248__JM913 0013 TGTGTTTCTG 

msa442667 . 2 {248_C0H1 J TGTGTTTCTG 

msa442667.2{248 - M78l} T GTGT T T CTG 

msa442667.2{248_M732 / TGTGTTTCTG 

msa442667.2{248_090 > TGTGTTTCTG 

msa442 667 . 2 f 24 8_CJB110 ( TGTGTTTCTG 

msa442667.2{248_1169NT} TGTGTTTCTG 

Consensus ********** 



TTAGTGACAA 
TTAGTGACAA 
TTAGTGACAA 
TTAGTGACAA 
TTAGTGACAA 
TTAGTGACAA 
TTAGTGACAA 
TTAGTGACAA 
TTAGTGACAA 
TTAGTGACAA 
TTAGTGACAA 



TGGACAAGGA 
TGGACAAGGA 
TGGACAAGGA 
TGGACAAGGA 
TGGACAAGGA 
TGGACAAGGA 
TGGACAAGGA 
TGGACAAGGA 
TGGACAAGGA 
TGGACAAGGA 
TGGACAAGGA 



ATCTCAGATA 
ATCTCAGATA 
ATCTCAGATA 
ATCTCAGATA 
ATCTCAGATA 
ATCTCAGATA 
ATCTCAGATA 
ATCTCAGATA 
ATCTCAGATA 
ATCTCAGATA 
ATCTCAGATA 



1550 
CTATCATTGA 
CTATCATTGA 
CTATCATTGA 
CTATCATTGA 
CTATCATTGA 
CTATCATTGA 
CTATCATTGA 
CTATCATTGA 
CTATCATTGA 
CTATCATTGA 
CTATCATTGA 



msa442667 . 2 { 248_18RS2i; 
msa442667.2(248 2603, 
msa442667 . 2 ( 248~A909 
msa442667 . 2 { 248_H36B 
msa442667.2{248_JM9130013 
msa442667 . 2 { 248_C0H1 
rasa442667 . 2 { 248_M781 
msa442667 . 2 (248_M732 
msa442667 . 2 {248_090 
msa442667 . 2 { 248_CJB110 
msa442667.2{248_1169NT 
Consensus 



msa442667.2{248_18RS2i; 
rosa442667 . 2 ( 248_2603 
msa442667 . 2 ( 248_A909 
msa442667 . 2 { 248JH36B 
tnsa442667 . 2 { 248_JM9130013 
msa442667 . 2 { 248__C0H1 
msa44 2 667 . 2 { 2 4 B_M7 8 1 
msa442667 . 2 {248_M732 
msa442667 . 2 {248_090 
msa442667 . 2 f 248_CJB110 
rasa442667 . 2 { 248_1169NT 
Consensus 



1551 

TAAATTAGGT 
TAAATTAGGT 
TAAATTAGGT 
TAAATTAGGT 
TAAATTAGGT 
TAAATTAGGT 
TAAATTAGGT 
TAAATTAGGT 
TAAATTAGGT 
TAAATTAGGT 
TAAATTAGGT 



CAAGAAACAG 
CAAGAAACAG 
CAAGAAACAG 
CAAGAAACAG 
CAAGAAACAG 
CAAGAAACAG 
CAAGAAACAG 
CAAGAAACAG 
CAAGAAACAG 
CAAGAAACAG 
CAAGAAACAG 



TTGCAGAGAG 
TTGCAGAGAG 
TTGCAGAGAG 
TTGCAGAGAG 
TTGCAGAGAG 
TTGCAGAGAG 
TTGCAGAGAG 
TTGCAGAGAG 
TTGCAGAGAG 
TTGCAGAGAG 
TTGCAGAGAG 



TAAGGGtACA 
TAAGGGtACA 
TAAGGGtACA 
TAAGGGtACA 
TAAGGGtACA 
TAAGGGgACA 
TAAGGGgACA 
TAAGGGgACA 
TAAGGGtACA 
TAAGGGtACA 
TAAGGGtACA 



1600 
GGTACTGCTC 
GGTACTGCTC 
GGTACTGCTC 
GGTACTGCTC 
GGTACTGCTC 
GGTACTGCTC 
GGTACTGCTC 
GGTACTGCTC 
GGTACTGCTC 
GGTACTGCTC 
GGTACTGCTC 



1601 

TAGTTAATCT 
TAGTTAATCT 
TAGTTAATCT 
TAGTTAATCT 
TAGTTAATCT 
TAGTTAATCT 
TAGTTAATCT 
TAGTTAATCT 
TAGTTAATCT 
TAGTTAATCT 
TAGTTAATCT 



AAATAACAGG 
AAATAACAGG 
AAATAACAGG 
AAATAACAGG 
AAATAACAGG 
AAATAACAGG 
AAATAACAGG 
AAATAACAGG 
AAATAACAGG 
AAATAACAGG 
AAATAACAGG 



CTGAATTTAT 
CTGAATTTAT 
CTGAATTTAT 
CTGAATTTAT 
CTGAATTTAT 
CTGAATTTAT 
CTGAATTTAT 
CTGAATTTAT 
CTGAATTTAT 
CTGAATTTAT 
CTGAATTTAT 



TATATGGTAG 
TATATGGTAG 
TATATGGTAG 
TATATGGTAG 
TATATGGTAG 
TATATGGTAG 
TATATGGTAG 
TATATGGTAG 
TATATGGTAG 
TATATGGTAG 
TATATGGTAG 



1650 
TGTAAGTTGC 
TGTAAGTTGC 
TGTAAGTTGC 
TGTAAGTTGC 
TGTAAGTTGC 
TGTAAGTTGC 
TGTAAGTTGC 
TGTAAGTTGC 
TGTAAGTTGC 
TGTAAGTTGC 
TGTAAGTTGC 



msa442667.2{248_18RS21 
rosa442667 . 2 f 248_2603 
mea442667.2(248_A909 
msa442667.2{248 H36B 
msa442667 . 2 { 248_JM9130013 
tnsa442667. 2(248 COH1 
msa442667.2{248~M781 
msa442667 . 2 { 248 M732 
msa442667 . 2 { 248_090 
msa442667 . 2 f 24 8_CJB11 0 
msa442667 . 2 { 248_1169NT 
Consensus 



1651 

CTTCATTTTT 
CTTCATTTTT 
CTTCATTTTT 
CTTCATTTTT 
CTTCATTTTT 
CTTCATTTTT 
CTTCATTTTT 
CTTCATTTTT 
CTTCATTTTT 
CTTCATTTTT 
CTTCATTTTT 



CGAGCGACAA 
CGAGCGACAA 
CGAGCGACAA 
CGAGCGACAA 
CGAGCGACAA 
CGAGCGACAA 
CGAGCGACAA 
CGAGCGACAA 
CGAGCGACAA 
CGAGCGACAA 
CGAGCGACAA 



GAATGGTACA 
GAATGGTACA 
GAATGGTACA 
GAATGGTACA 
GAATGGTACA 
GAATGGTACA 
GAATGGTACA 
GAATGGTACA 
GAATGGTACA 
GAATGGTACA 
GAATGGTACA 



AAAGTTTGGT 
AAAGTTTGGT 
AAAGTTTGGT 
AAAGTTTGGT 
AAAGTTTGGT 
AAAGTTTGGT 
AAAGTTTGGT 
AAA GTTTG GT 
AAAGTTTGGT 
AAAGTTTGGT 
AAAGTTTGGT 



1700 
ATCGAATACC 
ATCGAATACC 
ATCGAATACC 
ATCGAATACC 
ATCGAATACC 
ATCGAATACC 
ATCGAATACC 
ATCGAATACC 
ATCGAATACC 
ATCGAATACC 
ATCGAATACC 



msa442667 . 2 {248_18RS21 ' 
msa442667 . 2 { 248_2603 , 
msa442667 . 2 (248JV909 
maa442667 . 2 { 248_H36B 
msa442667 ,2{248_JM9130013 
msa442667 . 2 f 248_C0H1 
msa442667. 2(248 M781 
msa442667.2{248 M732 
msa442667.2{248 090 
msa442667 . 2 { 248 JCOBIIO 
msa442667.2{248_1169NT 



1701 

TAATAGAATA 
TAATAGAATA 
TAATAGAATA 
TAATAGAATA 
TAATAGAATA 
TAATAGAATA 
TAATAGAATA 
TAATAGAATA 
TAATAGAATA 
TAATAGAATA 
TAATAGAATA 



AGGGAGGATG 
AGGGAGGATG 
AGGGAGGATG 
AGGGAGGATG 
AGGGAGGATG 
AGGGAGGATG 
AGGGAGGATG 
AGGGAGGATG 
AGGGAGGATG 
AGGGAGGATG 
AGGGAGGATG 



AGCATGAAAA 
AGCATGAAAA 
AGCATGAAAA 
AGCATGAAAA 
AGCATGAAAA 
AGCATGAAAA 
AGCATGAAAA 
AGCATGAAAA 
AGCATGAAAA 
AGCATGAAAA 
AGCATGAAAA 



1740 

TTTTAATTCT 
TTTTAATTCT 
TTTTAATTCT 
TTTTAATTCT 
TTTTAATTCT 
TTTTAATTCT 
TTTTAATTCT 
TTTTAATTCT 
TTTTAATTCT 
TTTTAATTCT 
TTTTAATTCT 
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Consensus 



SEQ ID NO. 5811 
STRAIN 2603 flame: I 

LMVLLFQRLG 1 1 M I LAPLLVNNS YFRQLI EERSKRETWLVI I FGLFVI ISNITGIEIKG 
DRSLVERPFLTTI SHSDSLANTRTLVI TTASLVGGPLVGS I VGFI GGVHRFFQGS PSGSP 
YI VSSVLVGI VSGKIGDKLKENHLYPSTSQVI LI S 1 1 AES IQMLFVG I FTGWELVKMI VI 
PMMILNSLGSTLFIAILKTYI^NESQLRAVQTRDVLELTROT 

1 1 KRHTNFDAVGLTDRSN\rt^I GVGHDHHIAGQPVKTDLSKSVI FDGEPRIAQDKAAI S 

CPDHNCQLNSAIVVPLKINDKTVGALKMYFAGDKTMSEVEENLV^ 

EEQNKLASMAEI KALQAQINPHFFFNAINT I SAL I RI DSDKARYALMQLSTFFRTSLQGG 

QDREVTLBQEKSHVDAYMNVEKLRFPDKYQLSYDI SAPEKMKLP PFGLQVLVEHAVRHAF 

KERKTDNHI LVQI KPDGHYYCVSVSDNGQGI SDTI IDKLGQETVAESKGTGTALVNLNNR 

LNLLYGSVSCIiHFSSDKNGTKVWYRIPNRIREDEHENFNS 

SEQ ZD NO. 5812 
STRAIN 090 frame: 1 

LMVLLFQRLGI IM I LAFLLVNNS YFRQLI EERSKRETWLVI I FGLFVI ISNITGIEIKG 
DRSLVERPFXiTTISHSDSLANTRTLVlTTASLVGGPLVGS I VGF I GGVHRFFQG S PSGSF 
Y I VSS VLVG I VSGKIGDKLKENHLYPSTSQVI L I S I IAES IQMLFVGI FTGWELVKMI VI 
PMM I LNSLGSTLFLAI LKTYI^NE SQLRAVQTRDVLELTRQTLP YliRQGLTPQSARSVCT 
IIKRRTNFDAVGLTDRSNVLAHIGVGHDHHIAGQPVKTDL^ 

C PDHNCQLNSAI VVPLKINDKTVGALKMY FAGDKTMSEVEENLVLGLAQ I FSGQLAMG I T 
EEQNKl^MAEXKAU^INPHFFFNAINTISALIRIDSDKARYAIiMQLSTFFRTSLC^ 
QDRE VTLEQEKSHVDAYMNVEKLRFPDKYQLSYD I SAPEKMKLP PFGLQVLVENAVRHAF 
KERKTDNHILVQIKPDGHYYCVSVSDNGQGISDTI IDKLGQETVAESKGTGTALVNLNNR 
LNLuLYGSVSCLHFSSDKKGTKVWYRI PNRI REDEHENFNS 

SEQ ID NO. 5813 
STRAIN A909 frame: 1 

LMVLLFQRLGI IMILAFIiVNNSYFRQLIEERSKKBTVVLVI IFGLFVI I SNITGIEIKG 
DRSLVERPFLTT I SHSDSLANTRTLVITTASLVGGPLVGS I VGF I GGVHRFFQGS FSGSF 
YI VSS VLVG I VSGKI GDKLKENHLYPSTSQVI LI S 1 1 AES IQMLFVG I FTGWELVKMI VI 
PMMIIiNSLGSTLFIAILKTYIiSNESQLRAVQrRDVLELTR 

1 1 KRHTNFDAVGLTDRSNVLAH I GVGHDHHI AGQPVKTDLSKSVI FDGEPRIAQDKAAI S 
CFDHNCQLNSAI VVPLKINDKTVGALKMYFAGDKTMSEV^ FSGQLAMG IT ■ 

EEQNKLASMAEI KALQAQINPHFFFNAINT I SALI RIDSDKARYALMQLSTFFRTSLQGG 
QDREVTLEQBKSHVDAYMNVEKLRFPDKYQLSYDI SAPEKMKLPPFGLQVLVENAVRHAF 
KERKTDNHI LVQIKPDGHYYCVSVSDNGQG I SDTI IDKLGQETVAESKGTGTALVNLNNR 

LNLLYGS VS CLHFS SDKNGTKVWYRI PNR I REDEHENFNS I 

SEQ ID NO. 5814 
STRAIN H36B frame: 1 

LMVLLFQRLGI IMI LAFLLVNNS YFRQLI EERSKRETVVLVI IFGLFVI ISNITGIEIKG 
DRSLVERPFLTT I SHSDSLANTRTLVITTASLVGGPLVGS I VGFIGGVHRFFQGSFSGS F 
YI VSSVLVGI VSGKIGDKLKENHLYPSTSQVILI S 1 1 AES IQMLFVG I FTGWELVKMI VI 
PMM I LNSLGSTLFLAI LKTYLSNE S QLRAVQTRDVLELTRQTLP YLRQGLTPQSARSVCE 
1 1 KRHTNFDAVGLTDRSNVLAH I GVGHDHH I AGQP VKTDLSKSVT FDGEPRIAQDKAAI S 
CPDHNCQLNSAI WPLKI NDKTVGALKMYFAGDKmSBVEENLVLGLAQ I FSGQLAMG IT 
EEQNKLASMAEI KALQAQINPHFFFNAINTI SALI RI DSDKARYALMQLSTFFRTSLQGG 
OJDRBVTLEQEKSRVDAYMNVEKLRFPDKYQLSYDI SAPEKMKLPPFGLQVLVENAVRHAF 
KERKTDNHI LVQI KPDGHYYCVSVSDNGQGI SDTI IDKLGQETVAESKGTGTALVNLNNR 
LNLLYGSVS CLHFS SDKNGTKVWYRI PNRI REDEHENFNS 

SEQ ID NO. 5815 
STRAIN 18RS21 frame: 1 

LMVLLFQRLG 1 1 Ml LAFLL VNNSYFRQL I EERSKRETVVLVI IFGLFVI ISNITGIEIKG 
DRSLVERPFLTT I SHSDSLANTRTLVITTASLVGGPLVGS I VGFIGGVHRFFQGS FSGS F 
Y I VSSVLVGI VSGKI GDKIjKENHLYPSTSQVI LIS I IAES I QMLFVGI FTGWELVKMI VI 
PMMI I^SLGSTLFLAILKTYIjSNBSQLRAVQTRDVLBLTRQTL 

1 1 KRHTNFDAVGLTDRSNVI^IGVGHDHHIAGQPVKTDLSKSVI FDGEPRIAQDKAAI S 
CPDHNCQI^'SAI VVPLKINDKTVGALKMYFAGD FSGQLAMG IT 

EEQNKLASMAEI KALQAQI NPHFFFNA INT I SALI RI DSDKARYALMQLSTFFRTSLQGG 
QDREVTI*EQEKSHVDAYMNVBKLRFPDKYQLSYDISAPEK^ 

KERKTDNHI LVQI KPDGHYYCVSVSDNGQGI SDTI IDKLGQETVAES KGTGTALVNLNNR 
LNLLYGSVSCXiHFS SDKNGTKVWYRI PNRI REDEHENFNS 

SEQ ID NO. 5816 
STRAIN M732 Game: 1 

LMVI<LFQRLGI IMI IiAFIjLVNNSYFRQLIEBRSKRETVVLVI IFGLFVI ISNITC 
DRSLVERPFLTT I SHSDSliANTRTLVITTASLVGGPLVGS I VGFIGGVHRFFQGSFSGS F 
YIVSSVLVGIVSGKIGDKLKENHLYPSTSQVI LI SI I AESIQMLFVGI FTGWELVKMI VI 
PMMILNSLGSTLFLAILKTYLSNBSQLRAVQ^RDVLBLTRQ 

1 1 KRHTNFDAVGLTDRSNVLAH I G I GHDHH I AGQP VKTDLSKSVI FDGEPRIAQDKAAI S 
CPDHNCOl^SAIVVPIiKINDKTVCALKMYFAGDKTMSEVEEN^ 
EEQNKLASMAEI KALQAQINPHFFFNAINT I SAL I RIDSDKARYALMQLSTFFR^ 
QDREVTLEQE KS HVDAYMNVEKLRFPDKYQLS YD I SAP E KMKLPP FGLQVLVENAVRHAF 
KERKTDNH I LVQ I KPDGHYYCVS VSDNGQG I SDT I IDKLGQETVAESKGTGTALVNLNNR 
LNLLYGSVSCLHFSSDKNGTKVWYRI PNRI REDEHENFNS 

SEQ ID NO. 5817 
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STRAIN COm frame: 1 

LMVLLFQRLG I IMI LAFLLVNNSYFRQLI EBRSKRETWLV 1 1 FGLFVI I SNITGIEIKO 
DRSLVERPPLTT I SHSDSLANTRTLVI TTASLVGGPLVGS I VGF I GGVHRFFQGSPSGS P 
YI VSSVLVG I VSGKIGDKLKENHLYPSTSQVI LI SI I AES IQMLFVGI FTGWELVKM I VI 
PMMI LNSLG STL FLA I LKTYLSNBSQLRAVGfTRDVLELTRQTLPYLRQGLTPQSARSVCE 
I IKRHTMFDAVGLTDRSNVIiAHIGVGHDHHIAGQPVKTDliSKSVI FDGE PRI AQDKAAI S 
CPDHNCQLNSAIWPLKINDKTVCALKMYPAGDKTWSEVEENLVI^ 
EEQNKLASMAE I KALQAQI NPHFFFNA INT I S ALI RI DSDKARYALMQLSTFFRTSLQGG 
QDREVTLEQEKSHVDAYMNVEKLRFPDKYQLSYD I SAPE KMKLP P FGLQ VLVENAVRHAF 
KERKTDNHI LVQI KPDGHYYCVSVSDNGQG I SDT I IDKLGQETVAESKGTGTALVNLNNR 
LNLLYGSVSCLHFS SDKNGTKVWYRIPNRI REDEHENFNS 

SEQ ID NO. 5818 
STRAIN M781 frame: 1 

I24VLLFQR1GIIMILAFLLVNNSYFRQLIEERSKRETVVLVI IFGLPVI ISNITGIEIKG 
DRSLVERPPLTT I SHSDSLANTRTLVI TTASLVGGPLVGS I VGF IGGVHRFFQGSFSGS F 
YIVSSVLVGIVSGKIGDKLKENHLYPSTSQVILI SI I AES IQMLFVGI FTGWELVKMI VI 
PMMI LNSLGSTLFLAI LKTYLSNESQLRAVQTRDVLELTRQTLP YLRQGLTPQSARS VCE 
1 1 KRHTNPDAVGLTDRSNVLAHIGVGHDHHIAGQPVKTDLSKSVI FDGEPRIAQDKAAI S 
CPDHNCQI^SAI V\TPLKI NDKTVCALKMYFAGDKTMSEVEENLVLGIJVQI PSGQLAMGIT 
EEQNKLASMAEI KALQAQINPHFFFNAINTI SALIRIDSDKARYALMQLSTFFRTSLQGG 
QDREVTLEQEKSHVDAYMNVEKLRP PDKYQLS YD rSAPEKMKLPPFGLQVLVENAVRHAF 
KBRKTDNHI LVQI KPDGHYYCVSVSDNGQGI SDT I IDKLGQETVAESKGTGTALVNLNNR 
IjNLLYGSVSCLHPSSDKNGTKVWYRI PNR I REDEHENFNS 

SEQ ID NO. 5819 
STRAIN CJBl 10 frame: I 

LMVLLFQRLGIIMILAPLLVNNSYFRQLIEERSKRBTVVLVI I FGLFVI I SNITGIEIKG 
DRSLVERPFLTTISHSDSIANTRTLVITTASLVGGPLVGSIVGFIGGVHRFFQGSFSGSF 
YI VSSVLVGI VSGKIGDKLKENHLYPSTSQVILI SI I AES IQMLFVGIFTGWELVKMIVI 
PMMI LNSLGSTLFLAI LKTYLSNESQLRAVQTRDVLELTRQTLPYLRQGLTPQSARSVCE 
I IKRHTNFDAVGLTDRSNVIiAHIGVGHDHHIAGQPVKTDLSKSVI FDGEPRIAQDKAAI S 
CPDHNCQLNSAIVVPIiKINDRTVGALKMYFAGDKTMSEVEENLVLG 
EEQNKLASMAEIKALQJVQINPHFPFNAINTISALIRIDSDKARYALMQLSTFFRTSLQGG 
QDREVTLEQBKSHVDAYMNVEKLRFPDKYQLSYDI SAPBKMKLPPFGLQVLVENAVRHAF 
KERKTDNHI LVQI KPDGHYYCVSVSDNGQGI SDT I IDKLGQETVAESKGTGTALVNLNNR 
LNLLYGS VSCLHFSSDKNGTKVWYRI PNRI REDEHENFNS 

SEQ ID NO. 5820 
STRAIN 1 169NT frame: 1 

LMVLLFQRLGI IMILAFLLVNNSYFRQLIEERSKRETVVLVI IFGLFVI ISNITGIEIKG 
DRSLVERPPLTT I SHSDSLANTRTLVITTASLVGGPLVGS I VGFIGGVHRPFQGSFSGSF 
YIVSSVLVGIVSGKIGDKLKENHLYPSTSQVILISIIAESICMLPVGIPTGWELVKMIVI 
PMMILNSLGSTLFLAILKTYLSNESQLRAVQTRDVLELTRQTLPY 

1 1 KRHTNFDAVGLTDRSNVLAHIGVGHDHHIAGQPVKTDLSKSVI FDGEPRIAQDKAAI S 
CPDHNCQLNSAI VVPLKINDKTVGAIjKMYFAGDKTMSEVEENLVLGLAQI PSGQLAMGIT 
EEQNKLASMAEI KALQAQINPHFFPNAINTI SALIRIDSDKARYALMQLSTFFRTSLQGG 
QDREVTLEQEKSHVDAYMNVEKLRP PDKYQLS YD I SAPEKMKLPPFGLQVLVENAVRHAF 
KERKTDNHI LVQI KPDGHYYCVSVSDNGQGI SDT I IDKLGQETVAESKGTGTALVNLNNR 
LNLL YGS VS CLHFS S DKNGTKVWYRI PNR I REDEHENFNS 



SEQ ID NO. 5821 
STRAIN JM9 1300 13 frame: 1 

LMVLLFQRLG I IMI LAFLLVNNSYPRQLI EERSKRETWLVI I FGLFVI ISNITGIEIKG 
DRSLVERPFLTT I S HSDSLANTRTLVI TTASLVGGPLVGS IVGFI GGVHRFFQG S FSGSF 
YI VSSVLVGI VSGKIGDKLKENHLYPSTSQVILI S I IAES IQMLFVGIFTGWELVKMIVI 
PMMILNSLGSTLFLAIIjKTYLSNESQLRAVQTRDVLE^ 

1 1 KRHTNFDAVGLTDRSNVLAHIGVGHDHH IAGQPVKTDLSKSVI FDGEPRIAQDKAAI S 
CPDHNCQLNSAI VVPLKINDKTVGALKMYPAGDKTMSEVEENLVLGLAQ I PSGQLAMGIT 
EEQNKIASMAEIKALQAQINPHFFFNAINTISALIRiDSDKARYALMQLSTFFRTSL^ 
QDREVTLEQEKSHVDAYMNVBKLRPPDKYQLSYDI SAPEKMKLPPFGLQVLVENAVRHAF 
KERKTDNHI LVQI KPDGHYYCVSVSDNGQG I SDTI IDKLGQETVAESKGTGTALVNLNNR 
LNIiLYGSVSCLHFSSDKNGTKVWYRI PNRI REDEHENFNS 

PRETTY of: /biotrap/msa442834 .2{*} January 13, 2003 06x47 . 



msa442834.2{248_090 
msa442834 . 2 i 248_1169NT' 
msa442834.2{248_lBRS21 
msa442834 .2{248_2603 
msa442B34.2{248 A909 
msa442834 . 2 { 248_CJB110 
msa442834.2{248_H36B 
msa442834 . 2 { 248_JM9 130013 
msa442834. 2(248 COH1 
msa442834.2{248_M781 
msa442834.2{248_M732 
Consenaue 



mfla442834.2{248_090} 
msa442834 . 2 { 248_1169NT) 



1 50 
LMVLLFQRLG I IMILAFLLV NNSYFRQLIB ERSKRETWL VI I FGLFVI I 
LMVLLFQRLG I IMILAFLLV NNSYFRQLIE ERSKRETWL VI I FGLFVI I 
LMVLLFQRLG I IMILAFLLV NNSYFRQLIE ERSKRETWL VT I FGLFVI I 
LMVLLFQRLG I IMILAFLLV NNSYFRQLIB ERSKRETWL VI IFGLFVI I 
LMVLLFQRLG I IMILAFLLV NNSYFRQLIE ERSKRETWL VI I FGLFVI I 
LMVLLFQRLG I IMILAFLLV NNSYFRQLIE ERSKRETWL VII FGLFVI I 
LMVLLFQRLG I IMILAFLLV NNSYFRQLIE ERSKRETWL VI I FGLFVI I 
LMVLLFQRLG I IMILAFLLV NNSYFRQLIB ERSKRETWL VI I FGLFVI I 
LMVLLFQRLG I IMILAFLLV NNSYFRQLIB ERSKRETWL VI IFGLFVI I 
LMVLLFQRLG I IMILAFLLV NNSYFRQLIE ERSKRETWL VI IFGLFVI I 
LMVLLFQRLG I IMILAFLLV NNSYFRQLIE ERSKRETWL VI I FGLFVI I 

51 100 
SNITGIEIKG DRSLVERPFL TTISHSDSLA NTRTLVITTA SLVGGPLVGS 
SNITGIEIKG DRSLVERPFL TTISHSDSLA NTRTLVITTA SLVGGPLVGS 
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msa442834.2{248_lBRS2l) SNITGIEIKG 

msa442834.2(248_2603) SNITGIEIKG 

msa442834.2{248_A909} SNITGIEIKG 

msa442834.2{248 CJB110} SNITGIEIKG 

maa442834.2{248_H36B) SNITGIEIKG 

msa442834.2{248_JM9130013 SNITGIEIKG 

msa442834.2(248_COHl < SNITGIEIKG 

msa442834.2l248_M78l} SNITGIEIKG 

msa442834.2{248_M732} SNITGIEIKG 
Consensus 

101 

msa442834.2{248_090) IVGFIGGVHR 

msa442834.2{248_1169NT) IVGFIGGVHR 

msa442834 ,2{248_18RS21 J IVGFIGGVHR 

msa442834.2(248_2603j IVGFIGGVHR 

msa442834.2(248_A909 IVGFIGGVHR 

msa442834 . 2 { 24B_CJB110 IVGFIGGVHR 

maa442834 .2{248_H36B> IVGFIGGVHR 

msa442834.2{248 - JM913O0l3J IVGFIGGVHR 

msa442834.2(248jCOHl IVGFIGGVHR 

msa442834 . 2 { 248_M781 IVGFIGGVHR 

msa442834 .2{248_M732} IVGFIGGVHR 

Consensus ********** 



DRSLVERPFL 
DRSLVERPFL 
DRSIiVERPFL 
DRSLVERPFL 
DRSLVERPFL 
DRSLVERPFL 
DRSLVERPFL 
DRSLVERPFL 
DRSLVERPFL 



TTISHSDSLA 
TTISHSDSLA 
TTISHSDSLA 
TTISHSDSLA 
TTISHSDSLA 
TTISHSDSLA 
TTISHSDSLA 
TTISHSDSLA 
TTISHSDSLA 



NTRTLVITTA 
NTRTLVITTA 
NTRTLVITTA 
NTRTLVITTA 
NTRTLVITTA 
NTRTLVITTA 
NTRTLVITTA 
NTRTLVITTA 
NTRTLVITTA 



********** ********** ********** ********** 



FFQGSFSGSF 
FFQGSFSGSF 
FFQGSFSGSF 
FFQGSFSGSF 
FFQGSFSGSF 
FFQGSFSGSF 
FFQGSFSGSF 
FFQGSFSGSF 
FFQGSFSGSF 
FFQGSFSGSF 
FFQGSFSGSF 



YIVSSVLVGI 
YIVSSVLVGI 
YIVSSVLVGI 
YIVSSVLVGI 
YIVSSVLVGI 
YIVSSVLVGI 
YIVSSVLVGI 
YIVSSVLVGI 
YIVSSVLVGI 
YIVSSVLVGI 
YIVSSVLVGI 



VSGKIGDKLK 
VSGKIGDKLK 
VSGKIGDKLK 
VSGKIGDKLK 
VSGKIGDKLK 
VSGKIGDKLK 
VSGKIGDKLK 
VSGKIGDKLK 
VSGKIGDKLK 
VSGKIGDKLK 
VSGKIGDKLK 



SLVGGPLVGS 
SLVGGPLVGS 
SLVGGPLVGS 
SLVGGPLVGS 
SLVGGPLVGS 
SLVGGPLVGS 
SLVGGPLVGS 
SLVGGPLVGS 
SLVGGPLVGS 
********** 

150 

ENHLYPSTSQ 
ENHLYPSTSQ 
ENHLYPSTSQ 
ENHLYPSTSQ 
ENHLYPSTSQ 
ENHLYPSTSQ 
ENHLYPSTSQ 
ENHLYPSTSQ 
ENHLYPSTSQ 
ENHLYPSTSQ 
ENHLYPSTSQ 



151 

msa442834.2{248_090} VILISIIAES 

msa442834.2(248_1169NT VILISIIAES 

msa442 834 . 2 { 248_18RS21 VILISI IAES 

msa442834*2{248_2603 VILISIIAES 

msa442834.2{248_A909 VILISIIAES 

msa442834.2{248_CJB110> VILISIIAES 

msa442834.2{248__H36B VILISIIAES 

msa442834.2{248_JM9130013 > VILISIIAES 

msa442834.2{248_COHl VILISIIAES 

msa442834.2f24B_M781 ? VILISIIAES 

msa442834.2(248_M732) VILISIIAES 

Consensus ********** 



IQMLFVGIFT 
IQMLFVGIFT 
IQMLFVGIFT 
IQMLFVGIFT 
IQMLFVGIFT 
IQMLFVGIFT 
IQMLFVGIFT 
IQMLFVGIFT 
IQMLFVGIFT 
IQMLFVGIFT 
IQMLFVGIFT 



GWELVKMIVI 
GWELVKMIVI 
GWELVKMIVI 
GWELVKMIVI 
GWELVKMIVI 
GWELVKMIVI 
GWELVKMIVI 
GWELVKMIVI 
GWELVKMIVI 
GWELVKMIVI 
GWELVKMIVI 



PMMILNSLGS 
PMMILNSLGS 
PMMILNSLGS 
PMMILNSLGS 
PMMILNSLGS 
PMMILNSLGS 
PMMILNSLGS 
PMMILNSLGS 
PMMILNSLGS 
PMMILNSLGS 
PMMILNSLGS 



200 

TLFLAILKTY 
TLFLAILKTY 
TLFLAILKTY 
TLFLAILKTY 
TLFLAILKTY 
TLFLAILKTY 
TLFLAILKTY 
TLFLAILKTY 
TLFLAILKTY 
TLFLAILKTY 
TLFLAILKTY 



201 

msa442834 . 2 {248_090 V LSNESQLRAV 

msa442834.2(248_1169NT} LSNESQLRAV 

msa442834.2{248_18RS21J LSNESQLRAV 

tnsa442B34.2{248_2603 ) LSNESQLRAV 

msa442834.2{.248_A909) LSNESQLRAV 

msa442834.2{248_CJB110j LSNESQLRAV 

msa442834 . 2 {248_H36B LSNESQLRAV 

msa442834.2{24B_JM9130013| LSNESQLRAV 

msa442834 . 2 1 248JCOH1 LSNESQLRAV 

rasa442834.2(248 - M781 LSNESQLRAV 

msa442834.2{248_M732) LSNESQLRAV 

Consensus ********** 



QTRDVLELTR 
QTRDVLELTR 
QTRDVLELTR 
QTRDVLELTR 
QTRDVLELTR 
QTRDVLELTR 
QTRDVLELTR 
QTRDVLELTR 
QTRDVLELTR 
QTRDVLELTR 
QTRDVLELTR 



QTLPYLRQGL 
QTLPYLRQGL 
QTLPYLRQGL 
QTLPYLRQGL 
QTLPYLRQGL 
QTLPYLRQGL 
QTLPYLRQGL 
QTLPYLRQGL 
QTLPYLRQGL 
QTLPYLRQGL 
QTLPYLRQGL 



TPQSARSVCE 
TPQSARSVCE 
TPQSARSVCE 
TPQSARSVCE 
TPQSARSVCE 
TPQSARSVCE 
TPQSARSVCE 
TPQSARSVCE 
TPQSARSVCE 
TPQSARSVCE 
TPQSARSVCE 



250 

IIKRHTNFDA 
IIKRHTNFDA 
IIKRHTNFDA 
IIKRHTNFDA 
IIKRHTNFDA 
IIKRHTNFDA 
IIKRHTNFDA 
IIKRHTNFDA 
IIKRHTNFDA 
IIKRHTNFDA 
IIKRHTNFDA 



msa442834 . 2 {248_090 ] 
msa442B34. 2(248 1169NT 
tnsa442834 .2{248JL8RS21 
msa44 28 34 . 2 { 24 8_2 6 0 3 
msa442834.2(248_A909 
msa442834 . 2 {248_CJB110 
msa442834.2{248_H36B 
rasa442834.2{24B_JM9130013 
msa442834.2{248_COHl 
msa442834 .2<248_M781 
msa442834 . 2 { 248 JM732 
Consensus 



msa442834.2{248 - 090 
msa442834.2(248_1169NT 
msa442 834 . 2 { 248_18RS2 1 
pisa442834 .2( 248_2603 
rasa4 4 2 834 . 2 { 24 8_A9 0 9 
msa442834.2{248_CJB110 
msa442834 . 2 { 248_H36B 
msa442B34 . 2 { 248_JM9130013 
msa4428 34 . 2 ( 24 8 JCOH1 
msa442834 .2(24B_M781 
mfla442834.2{248_M732 
Consensus 



msa442834.2{248_090) 



251 

VGLTDRSNVL 
VGLTDRSNVL 
VGLTDRSNVL 
VGLTDRSNVL 
VGLTDRSNVL 
VGLTDRSNVL 
VGLTDRSNVL 
VGLTDRSNVL 
VGLTDRSNVL 
VGLTDRSNVL 
VGLTDRSNVL 



AHIGvGHDHH 
AHIGvGHDHH 
AHIGvGHDHH 
AHIGvGHDHH 
AHIGvGHDHH 
AHIGvGHDHH 
AHIGvGHDHH 
AHIGvGHDHH 
AHIGvGHDHH 
AHIGvGHDHH 
AHIGiGHDHH 



IAGQPVKTDL 
IAGQPVKTDL 
IAGQPVKTDL 
IAGQPVKTDL 
IAGQPVKTDL 
IAGQPVKTDL 
IAGQPVKTDL 
IAGQPVKTDL 
IAGQPVKTDL 
IAGQPVKTDL 
IAGQPVKTDL 



SKSVIFDGEP 
SKSVIFDGBP 
SKSVIFDGEP 
SKSVIFDGBP 
SKSVIFDGEP 
SKSVIFDGBP 
SKSVIFDGEP 
SKSVIFDGEP 
SKSVIFDGEP 
SKSVIFDGEP 
SKSVIFDGBP 



300 

RIAQDKAAIS 
RIAQDKAAIS 
RIAQDKAAIS 
RIAQDKAAIS 
RIAQDKAAIS 
RIAQDKAAIS 
RIAQDKAAIS 
RIAQDKAAIS 
RIAQDKAAIS 
RIAQDKAAIS 
RIAQDKAAIS 



301 

CPDHNCQLNS 
CPDHNCQLNS 
CPDHNCQLNS 
CPDHNCQLNS 
CPDHNCQLNS 
CPDHNCQLNS 
CPDHNCQLNS 
CPDHNCQLNS 
CPDHNCQLNS 
CPDHNCQLNS 
CPDHNCQLNS 



AIWPLKIND 
AIWPLKIND 
AIWPLKIND 
AIWPLKIND 
AIWPLKIND 
AIWPLKIND 
AIWPLKIND 
AIWPLKIND 
AIWPLKIND 
AIWPLKIND 
AIWPLKIND 



KTVgALKMYF 
KTVgALKMYF 
KTVgALKMYF 
KTVgALKMYF 
KTVgALKMYF 
KTVgALKMYF 
KTVgALKMYF 
KTVgALKMYF 
KTVgALKMYF 
KTVcALKMYF 
KTVcALKMYF 



AGDKTMSBVB 
AGDKTMSEVE 
AGDKTMSEVE 
AGDKTMSEVE 
AGDKTMSEVE 
AGDKTMSBVB 
AGDKTMSBVB 
AGDKTMSBVB 
AGDKTMSBVB 
AGDKTMSBVB 
AGDKTMSBVB 



350 

ENLVLGLAQI 
ENLVLGLAQI 
ENLVLGLAQI 
ENLVLGLAQI 
ENLVLGLAQI 
ENLVLGLAQI 
ENLVLGLAQI 
ENLVLGLAQI 
ENLVLGLAQI 
ENLVLGLAQI 
ENLVLGLAQI 



351 400 
FSGQLAMGlt EEQNKLASMA EIKALQAQIN PHFFFNAINT ISALIRIDSD 



916 



WO 2004/018646 



PCT/US2003/026827 



Table 58: Comparative Sequences relating to SAG0182 



msa442834 . 2 f 248_1169NT 
msa442834.2(248_18RS21 
msa442834 .2(248_2603 
msa442834.2{248_A909 
msa442834.2{248_CJB110 
maa4 4 2 8 3 4 . 2 { 24 8_K3 6B 
msa442834 .2 {248_JM913O013 
maa442834 . 2 f 248_C0H1 
msa442B34 . 2 { 248_M78 1 
msa442834.2{248_M732 
Consensus 



FSGQLAMGIT 
FSGQLAMGIT 
FSGQLAMGIT 
FSGQLAMGIT 
FSGQLAMGIT 
FSGQLAMGIT 
FSGQLAMGIT 
FSGQLAMGIT 
FSGQLAMGIT 
FSGQLAMGIT 



EEQNKLASMA 
EEQNKLASMA 
EEQNKLASMA 
EEQNKLASMA 
EEQNKLASMA 
EEQNKLASMA 
EEQNKLASMA 
EEQNKLASMA 
EEQNKLASMA 
EEQNKLASMA 



EIKALQAQIN 
EIKALQAQIN 
EIKALQAQIN 
EIKALQAQIN 
EIKALQAQIN 
EIKALQAQIN 
EIKALQAQIN 
EIKALQAQIN 
EIKALQAQIN 
EIKALQAQIN 



PHFFFNAINT 
PHFFFNAINT 
PHFFFNAINT 
PHFFFNAINT 
PHFFFNAINT 
PHFFFNAINT 
PHFFFNAINT 
PHFFFNAINT 
PHFFFNAINT 
PHFFFNAINT 



ISALIRIDSD 
ISALIRIDSO 
ISALIRIDSD 
tSALIRIDSD 
ISALIRIDSD 
ISALIRIDSD 
ISALIRIDSD 
ISALIRIDSD 
ISALIRIDSD 
ISALIRIDSD 



tnsa442834 ,2{248_090; 
msa442834 . 2 f 248_1 169NT 
msa442834 . 2 { 248_18RS21 
msa442834 ,2{ 248_2603 
msa442834.2{248_A909 
msa442834 . 2 { 24 8_CJB110 
' msa442834.2{248_H36B 
msa442834 . 2 { 248_JM9130 013 
msa442834 . 2 f 248_COHl 
maa442834.2{248_M7Bl 
msa442834 . 2 ( 248_M732 
Consensus 



401 

KARYALMQLS 
KARYALMQLS 
KARYALMQLS 
KARYALMQLS 
KARYALMQLS 
KARYALMQLS 
KARYALMQLS 
KARYALMQLS 
KARYALMQLS 
KARYALMQLS 
KARYALMQLS 



TFFRTSLQGG 
TFFRTSLQGG 
TFFRTSLQGG 
TFFRTSLQGG 
TFFRTSLQGG 
TFFRTSLQGG 
TFFRTSLQGG 
TFFRTSLQGG 
TFFRTSLQGG 
TFFRTSLQGG 
TFFRTSLQGG 



QDREVTLEQE 
QDREVTLEQE 
QDREVTLEQE 
QDREVTLEQE 
QDREVTLEQE 
QDREVTLEQE 
QDREVTLEQE 
QDREVTLEQE 
QDREVTLEQE 
QDREVTLEQE 
QDREVTLEQE 



KSHVDAYMNV 
KSHVDAYMNV 
KSHVDAYMNV 
KSHVDAYMNV 
KSHVDAYMNV 
KSHVDAYMNV 
KSHVDAYMNV 
KSHVDAYMNV 
KSHVDAYMNV 
KSHVDAYMNV 
KSHVDAYMNV 



450 

EKLRFPDKYQ 
EKLRFPDKYQ 
EKLRFPDKYQ 
EKLRFPDKYQ 
EKLRFPDKYQ 
EKLRFPDKYQ 
EKLRFPDKYQ 
EKLRFPDKYQ 
EKLRFPDKYQ 
EKLRFPDKYQ 
EKLRFPDKYQ 



msa442834 . 2 { 248_090 
msa442834 . 2 f 24e_1169NT' 
msa442834.2(248_18RS21 
msa442834 . 2 { 24 8_2 603 
msa442834.2{248_A909 
msa442834 . 2 { 24 8_CJB110 
msa442834.2{248 H36B 
msa442834 . 2 { 248_JM9130013 
msa442834.2(248__COHl 
msa4426 34 .2(248 J4781 
msa442834.2{248_M732 
Consensus 



451 

LSYD I SAPEK 
LSYDISAPEK 
LSYDI SAPEK 
LSYDISAPEK 
LSYDISAPEK 
LSYDISAPEK 
LSYDISAPEK 
LSYDISAPEK 
LSYDISAPEK 
LSYDISAPEK 
LSYDISAPEK 



MKLPPFGLQV 
MKLPPFGLQV 
MKLPPFGLQV 
MKLPPFGLQV 
MKLPPFGLQV 
MKLPPFGLQV 
MKLPPFGLQV 
MKLPPFGLQV 
MKLPPFGLQV 
MKLPPFGLQV 
MKLPPFGLQV 



LVENAVRHAF 
LVENAVRHAF 
LVENAVRHAF 
LVENAVRHAF 
LVENAVRHAF 
LVENAVRHAF 
LVENAVRHAF 
LVENAVRHAF 
LVENAVRHAF 
LVENAVRHAF 
LVENAVRHAF 



KERKTDNHIL 
KERKTDNHIL 
KERKTDNHIL 
KERKTDNHIL 
KERKTDNHIL 
KERKTDNHIL 
KERKTDNHIL 
KERKTDNHIL 
KERKTDNHIL 



500 

VQIKPDGHYY 
VQIKPDGHYY 
VQIKPDGHYY 
VQIKPDGHYY 
VQIKPDGHYY 
VQIKPDGHYY 
VQIKPDGHYY 
VQIKPDGHYY 
VQIKPDGHYY 
VQIKPDGHYY 
VQIKPDGHYY 



msa442834 . 2 { 248_090 
msa442834.2(248 1169NT 
msa442834 .2{248__18RS21 
msa442834. 2(248 2603 
msa442834 . 2 { 248_A909 
msa442834 . 2 { 248_CJB110 
tnsa442834.2{248_H36B 
msa442834 . 2 { 248_JM9130013 
msa442834.2{248_COHl 
msa442834.2(248_M781 
msa442834 . 2 {248_M732 
Consensus 



501 

CVSVSDNGQG 
CVSVSDNGQG 
CVSVSDNGQG 
CVSVSDNGQG 
CVSVSDNGQG 
CVSVSDNGQG 
CVSVSDNGQG 
CVSVSDNGQG 
CVSVSDNGQG 
CVSVSDNGQG 
CVSVSDNGQG 



ISDTIIDKLG 
ISDTI IDKLG 
ISDTIIDKLG 
ISDTIIDKLG 
ISDTIIDKLG 
ISDTIIDKLG 
ISDTIIDKLG 
ISDTIIDKLG 
ISDTIIDKLG 
ISDTIIDKLG 
ISDTIIDKLG 



QETVAESKGT 
QETVABSKGT 
QETVAESKGT 
QETVAESKGT 
QETVAESKGT 
QETVAESKGT 
QETVAESKGT 
QETVAESKGT 
QETVAESKGT 
QETVAESKGT 
QETVABSKGT 



GTALVNLNNR 
GTALVNLNNR 
GTALVNLNNR 
GTALVNLNNR 
GTALVNLNNR 
GTALVNLNNR 
GTALVNLNNR 
GTALVNLNNR 
GTALVNLNNR 
GTALVNLNNR 
GTALVNLNNR 



550 

LNLLYGSVSC 
LNLLYGSVSC 
LNLLYGSVSC 
LNLLYGSVSC 
LNLLYGSVSC 
LNLLYGSVSC 
LNLLYGSVSC 
LNLLYGSVSC 
LNLLYGSVSC 
LNLLYGSVSC 
LNLLYGSVSC 



msa442834.2{248_090 
msa442834 . 2 ( 248_1169NT 
msa442834.2{248_18RS21 
msa442834.2f248_2603 
msa442834 - 2 { 248_A909 
msa442834 . 2 { 248_CJB110 
msa442834 .2{248_H36B 
IIisa442834 . 2 { 248_JM913 0013 
msa442834 . 2 f 248_COHl 
msa442834.2{24B_M781 
raaa442834.2{248 - M732 
Consensus 



551 

LHFSSDKNGT 
LHFSSDKNGT 
LHFSSDKNGT 
LHFSSDKNGT 
LHFSSDKNGT 
LHFSSDKNGT 
LHFSSDKNGT 
LHFSSDKNGT 
LHFSSDKNGT 
LHFSSDKNGT 
LHFSSDKNGT 



KVWYRIPNRI 
KVWYRIPNRI 
KVWYRIPNRI 
KVWYRIPNRI 
KVWYRIPNRI 
KVWYRIPNRI 
KVWYRIPNRI 
KVWYRIPNRI 
KVWYRIPNRI 
KVWYRIPNRI 
KVWYRIPNRI 



580 

REDEHENFNS 



REDEHENFNS 
REDEHENFNS 
REDEHENFNS 
REDEHENFNS 
REDEHENFNS 
REDEHENFNS 
REDEHENFNS 
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WO 2004/018646 



Table 59: Comparative Sequences relating to SAG2147 



SEQ ID NO. 5901 
STRAIN 26.03 

ATGAATAAAAGAAGAAAATTATCAAAA 

GCTATCACTTTAGTAGCCCTTTTTTCATGTATTTT^ 

TCACAAGTTACTACTGAATCTTTGTCAAAAGCAGATAAAGTT^ 

AAAATGACTAAGGCX3ACATCTAAATCAAAAGTAGAAGATGTAAAACAGGCT 

TCTCAGGCATCTAATGAAGCCCCAAAATCMGTTCTCAA 

CAACAAGTT ACTG CGAGTGAAGAGG CAGCTGTAGAACAAGCAGTTGTAACAGAAAACA 
CTCTGCTACCAGTCAGGCACAACAAGCTTATGC^ 

CAACACC^GACGAGTGGCCAAGTATTGAGTAATGGAAATACTGCAGGGGOT 
GCAGCTGCAGGACAAATGGCTGCTGCAAcAGGAGT CCCTCAGTCrACTTGGGAAcATATT 
ATTGCCCGTGAAT CAAATGGTAATCCTAATGTTGCT AATG CCTCAGGAG CTTCAGGACTT 

ATTAAAGCTTATCGTGCrCAAGGTTTATCAGCTTGGGGTTACTAG 

SEQ ID NO. 5902 
STRAIN JM9130013 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAA 

AGCAGATAAAGTTCGCGTAGCCAAAAAATCAAAAATGAATAAGGCAACAT 

CTAAATCAAAAGTAGAAGGTGTAAAACAGGCTCCAAAACCAAGTTCTCAA 

TCTACAGAAGCTAATT CTCAGCAACAAGTTACTGCGAGTGAAGAGG CAGC 

TGTAGAACAAG CAGTTGTAACAGAAAATACCCCTG CTACCAGTCAAGCAC 

AACAAGCTTATGCTGTTACTGAGACAACTTATAGACCTGCTCIAACACGAG 

CXXIAGTGGCCAAGTATTGAGCAATGGAAATACrGCAGG 

AGCAGCAG CAGCACAAATGGCTG CTGCAACGGGAGTTCCTCAGTCTACTT 

GGGAACATATTATTGCCCGTGAATCAAATGGTAATCCTAACGTTC CTAAT 

GCCTC^GGAGCTTCAGGACTTTTCCAAACGATGCCAGGTT^ 

AGCTACAGTTCAGGATCAAGTTAAT t CAGCT ATTAAAG CTTATCGTG CTC 

AAGGTTTATCAGCTTGGGGTTAC 

SEQ XD NO. 5903 

STRAIN 1 169NT reverse complement 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAA^ 

AAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAGAAG^ 

CCAAAACXnTCTCAGGCATCTAATGAAGTCCCAAAATCAAGTTCTCAA 

AATTCTCAGCAACAAGTTACTG CGAGTGAAGAGGCGGCTGTAGAACAAGCAGTTGTAACA 

GAAAATACCCCTGCTACCAGTCAGGCACAACAAACTTATGCIGTTACT 

AAACCTGCTCAACACCAGACAAGTGGCCAAGTATTGAGCAAT^ 

GTCXSGATCTGCHiXSCTCCAGCAC^ 

GAACATATTATTGCCGGTGAATCAAATGGTAATCCT 

AATTCAGCTATTAAAGCTTATCX3TGCTCAAGGT^ 

SEQ ZD NO. 5904 

STRAIN 18RS21 reverse complement 

AAAAGTTCACAAGTTACrACTGAATCTTTGTCAAAAGCAGAT 
GCGTAG CKZAAAAAATCAAAAATGACT AAGGCGACATCTAAATC!AA 

AACAGG CTCCAAAACCTTCT CAGG CATCTAATGAAGCCCCAAAATCAAGTTCTCAATCTA 

CAGAAGCTAATTCTCAGCAACAAGTTACTGCGAGT^ 

TTGTAACAGAAAACACCCCTGCTACCAGTCAGGC!ACAACAAGCT^ 

CAACTTATAGACCTG CTCAACACCAGACGAGTGGCCAAGTATTGAGfTAATGGAAATAC 

CAGGGGCTATTGGCTCAGCT^CTGCAGCACAAATGG 

CTACTTGGGAACATATTATTGCCCGTGAATCAAATGGIAA^ 




SEQ ID NO. 5905 

STRAIN 090 reverse complement 

TAG CCAAAAAATCAAAAATGATTAAGGCGACATCTAAATCAAAAGTAGAAGA 

AGGCTCCAAAACCTTCTCAGGCATCTAATGAAGCCCCAAAATCA^ 

AAGCTAATTCrCAGCAACAAGTTACTGCGAGTGAAGAGGCA^ 

TAACAGAAAACACCCCTGCTACCAGTCAGGCACAACAAG C7ITATGCTGTTACTGAGACAA 

CTTATAGACCTGCTCAACACCAGACX3AGTGGCCAAGT^ 

GGGCTATTGGCTCAGCAGCTGCAGCACAAATGGCTGCTGCAAC 

CTTGGGAACATATTATTGCCCX3TGAATCAAATGGTAATCCT 

GAGCTTCAGGACTTTTCCAAACGATGCCAGGTTG 

SEQ ID NO. 5906 

STRAIN A909 reverse complement 

AAGGCGACATCTAAATCAAAAGTAGAAGATGTAAAAC 

TCTAATGAAGCXX^CAAAATCAAGTTXrrCAATCTACAGAAG 

ACTGOGAGTGAAGAGGCAGCTGTA GAAC AAGCAGTTCT 

AGTCAGGCACAACAAGCTTATGCTGTIACTGAGA^ 

ACAAGTGGCCAAGTATTGAGTAATGGAAATACTGCAGGGGCT^ CA 
GCACAAATGGCTGCTGCAACAGGAGTCCCrCAGTCTAC^ 
GAATCAAATGGTAATCCTAATGTTGCT AATG CCTCAGGAG 
ATGCCAGGTTOGGGTTCAACAGCTACAGT^ 

tatogtgctcaagotttatca 

SEQ XD NO. 5907 

STRAIN CJB1 10 reverse complement 

AATCTTTGTCAAAAGCAGATAAAGTTCGOn'AGCCAAAAA^ 
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Table 59: Comparative Sequences relating to SAG2147 



CATCT AAATCAAAAGTAGAAGATGTAAAACAGGCTCCAAAACCTTCTCAGG CATCTAATG 
AAG CCCCAAAATCAAGTTCTCAATCTACAGAAG CT AATTCTCAGCAACAAGTTACTGCGA 
GTGAAGAGGCAGCTGTAGAACAAGCAGTTGTAACAGAAAAC^ 
CACAACAAGCCTATGCTGTTACTGAGAGAAC^ 

G CCAAGTATTGAGTAATGGAAATACTGCAGGGG CTATTGG CTCAG CAGCTGCAGGACAAA 

TGGCTGCTGCAACAGGAGTCCCTCAGTCTACTTGGGAA 

ATGGTAATCCTAATGTTGCTAATGCCTCAGGAGCTTCAGGACT^^ 

GTTGGGGTTCAACAGCTACAGTTCAGGATCAAGTTAATTC^ 

CTCAAGGTTTATCAGCTTGGGGTIAC 

SEQ ZD HO. 5908 

STRAIN COH1 reverse complement 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAA^ 

AGTTCG CGTAGCXZAAAAAATCAAAAATGACTAAGG CGACATCT AAATCAAAAGTAGAAGA 

TGTAAAACAGGCTCCAAAACCTTCTCAGGCATCTAATGAA.GC 

ATCTACAGAAGCTAATTCTCAGCAACAA^ 

AG CAGTTGTAACaGAAAATACCCCTGCTACCAGTCAGG CAGAACAAACTT ATGCTGTTAC 
TGAGACAACTTACAAACCTGCTCAACACC^ 

TACTGCAGGGGCGGT(XK*ATCTGCTGCTG CAGCACAAATGGCTGCTGCAACAGGAGTCCC 

TCAGTCTACTTGGGAACATATTATTGCCXX3TGAATCAAATGOT 

TGCCTCAGGAGCTTCAGGACTTTTC^ 

TCAGGATCAAGTTAATT(^\GCrATTAAAGCrrTATCGTGCT 

TTAC 

SEQ ZD NO. 5909 

STRAIN H36B reverse complement 

AAAAGTTCACAAGTTACTACTGAATCTTTGTCAAAAGC 

AGATAAAGTTCGCCTAGCCAAAAAATCAAAAATGACTAA^ 

AGAAGATGTAAAACAGGCTCCAAAACCTTCT^^ 

TTCTCAATCTACAGAAGCTAATTCTCAGCAACAAGTTACT 

AGAACAAGCAGTTGTAACAGAAAACZACCCCTGCrACC^ 

TGTTACTGAGACAACTTATAGACCTGCTCAAC^ 

TGGAAATACTOCAGGGGCTATTGGCrrCAGCAG 

AGTCCCTCAGTCTAC1TOGGAACATATTATTGCCCGTGAAT 

TGCTAATGCCTCAGGAGCTTCAGGACTTTT^ 

TACAGTTCAGGATCAAGTTAATTCAGCrATTAAAGCriT 

SEQ ZD NO. 5910 

STRAIN M732 reverse complement 

AAAAGTTGACAAGTTACTACTGAATC^ 

CAAAAAATCAAAAATGACTAAGGCGACATCTAAATCAAAAGTAG 
TCCAAAACCTTCTCAGGCATCTAATGAAGCCCX^ 
TAATTCTCAGCAACZAAGTTACTGCX5AG?IX3A^ 
AGAAAATACCCCTGCTACCAGTCAGGCACAACAAAC 

CAAACCTGCTCAACACCAGACAAGTGGCCAACT CAGGGGC 

GGTCXSGATCTGCTGCTGCAGGACAAAT^^ 

GGAACATATTATTGCCCGTGAATCAAATGGTAATC 

TTCAGG ACITTTCCAAACGATG CCAGGTTGGGGTTCAACAGCTACAGTTCAGGATCAAGT 
TAAirCAGClATTAAAGClTATCXnXSCrCAAGGTTTATCAG CTTGGGGTTA 

SEQ ZD NO. 5911 

STRAIN M781 reverse complement 

TCTTTGTCAAAAGCAGATAAAGTTCX3CGTAGC^ 

TCTAAATCAAAAGTAGAAGATGTAAAACAGGCTCCAAAAC 

GCCCCAAAATCAAGTTCTCAATCTACAGAAGCTA^ 

GAAGAGGCGGCTGTAGAACAAGGAGTTGTAACAGAAAATAC^ 

CAACAAACOTATGCTGTTACTGAGACAACTTACW 

CAACTATTGAGCAATGGAAATACTGCAGGGGCGG 

GCTGCTGCAACAGGAGTCCCTCAGTCTACrTGGG 

GGTAATCCTAATGTTGCTAATGCXrrCAGGAG 

TGGGGTTCAACAGCTACAGTTCAGGATCAAGTrAATTC^ 

CAAGGTTTATCAG CTTGGGGTTAC 

PRETTY of: /biotrnp/msa519780 . 2 { *} March 10, 2003 06s25 .. 



msa519780 . 2 ( 25_COHl 
msa519 78 0 . 2 { 2 5_M7 8 1 
msa51978 0 . 2 { 25_M732 
msa519780.2(25_1169NT 
msa519780.2{25_18RS21 
msa519780 . 2 {25_A909 
rasa519780.2{25 090 
msa519780.2{25_CJB110 
msa519780. 2(2603 
msa519780 . 2 {2S_H36B 
msa5197B0.2{25_JM9130013 | 
Consensus 



msa519780 . 2 (25_COHl) 
msa519780 . 2 (25_M781 J 
msa519780.2{25_M732) 



50 



atgaataaaa gaagaaaatt atcaaaattg aatgtaaaaa aacatcattt 



51 100 



919 



WO 2004/018646 



PCT/US2003/026827 



Table 59: C mparative Sequences relating to SAG2147 



msa519780.2(25_JL169NT 
msaS19780.2{25_18RS21 
msa519780.2{25_A909 
msa519780.2{25_090 
msaS 1 97 8 0 . 2 { 2 5_CJB110 
msa5197B0.2{2603 
msa519780 . 2 {25_H36B 
msa519780 . 2{25_JM9130013 , 
Consensus 



msa519780.2(25_COHl 
msa519780.2(25_M781 
msa519780 . 2 {25_M732 
msa519780 . 2 ( 25_1169NT 
msa519780.2{25_18RS21 
msa51978 0 . 2 {25_A909 
msa519780.2{25_090 
msa519780.2{25_CJB110 
msa519780.2{2603 
msa519780.2{25_H36B 
msa519780 . 2 {25_jJM9130013 
Consensus 



msa51978 0 . 2 f 25_C0H1 ] 
msa5197S0.2(25_M781 | 
msa5197B0 . 2 (25_M732 , 
msaS19780.2f25 1169NT 
msa519780.2{25~18RS21 
msa5197 80.2 {2 5_A909 
rasaS19780.2{25_090 
msa519780 . 2 { 25_CJB110 
msa519780.2{2603 
msa 5 1 9 7 8 0 . 2 { 2 5_H3 6B 
msaS19780 . 2{25_JM9130013 . 

Consensus 



agcttatgga gctatcactt tagtagccct tttttcatgt attttggctg 



101 



150 

-aaaagt tcacaagtta ctactgaatc tttgtcaaaa 

tc tttgtcaaaa 

-aaaagt tcacaagtta ctactgaatc tttgtcaaaa 
-aaaagt tcacaagtta ctactgaatc tttgtcaaaa 
-aaaagt tcacaagtta ctactgaatc tttgtcaaaa 



- aatc tttgtcaaaa 

taatggtcat ctttaaaagt tcacaagtta ctactgaatc tttgtcaaaa 

aaaagt tcacaagtta ctactgaatc tttgtcaaaa 

aaaagt tcacaagtta ctactgaatc tttgtcaaaa 

********** **** 

151 200 
gcagataaag ttcgcgtagc caaaaaatca aaaatgactA AGGCgACATC 
gcagataaag ttcgcgtagc caaaaaatca aaaatgactA AGGCgACATC 
gcagataaag ttcgcgtagc caaaaaatca aaaatgactA AGGCgACATC 
gcagataaag ttcgcgtagc caaaaaatca aaaatgactA AGGCgACATC 
gcagataaag ttcgcgtagc caaaaaatca aaaatgactA AGGCgACATC 

A AGGCgACATC 

tagc caaaaaatca aaaatgattA AGGCgACATC 

gcagataaag ttcgcgtagc caaaaaatca aaaatgactA AGGCgACATC 
gcagataaag ttcgcgtagc caaaaaatca aaaatgactA AGGCgACATC 
gcagataaag ttcgcgtagc caaaaaatca aaaatgactA AGGCgACATC 
gcagataaag ttcgcgtagc caaaaaatca aaaatgaatA AGGCaACATC 
3 3 _______ * ****-***** 



201- 

msa5197 80.2 (25_C0H1 J TAAATCAAAA 

msa51 97 80.2(2 5_M78 1 > TAAATCAAAA 

msa519780.2{25_M732 TAAATCAAAA 

msa519780.2(25_1169NT> TAAATCAAAA 

msa519780.2(25_18RS21 TAAATCAAAA 

msa519780.2{25_A909 TAAATCAAAA 

msa519780.2{25_090} TAAATCAAAA 

msa519780.2{25_CJB110 f TAAATCAAAA 

msa519780.2{2603 TAAATCAAAA 

msa519780.2{25_H36B > TAAATCAAAA 

msa519780.2{25_JM9130013} TAAATCAAAA 

Consensus ********** 



GTAGAAGaTG 
GTAGAAGaTG 
GTAGAAGaTG 
GTAGAAGaTG 
GTAGAAGaTG 
GTAGAAGaTG 
GTAGAAGaTG 
GTAGAAGaTG 
GTAGAAGaTG 
GTAGAAGaTG 
GTAGAAGgTG 



TAAAACAGGC 
TAAAACAGGC 
TAAAACAGGC 
TAAAACAGGC 
TAAAACAGGC 
TAAAACAGGC 
TAAAACAGGC 
TAAAACAGGC 
TAAAACAGGC 
TAAAACAGGC 
TAAAACAGGC 



TCCAAAACct 
TCCAAAACct 
TCCAAAACct 
TCCAAAACct 
TCCAAAACct 
TCCAAAACct 
TCCAAAACct 
TCCAAAACct 
TCCAAAACct 
TCCAAAACct 
TCCAAAAC. . 



250 

tctcaggcat 
tctcaggcat 
tctcaggcat 
tctcaggcat 
tctcaggcat 
tctcaggcat 
tctcaggcat 
tctcaggcat 
tctcaggcat 
tctcaggcat 



msa51978 0 . 2 ( 25_COHl 
msa5197B0.2(25_M781 
msa519780 .2(2 5 JM732 
rasa519780 . 2 { 25_1169NT 
msa5 197 8 0 . 2 { 2 5_18RS2 1 
msa519780.2{25 A909 
msa5 19780 ,2{25__090 
rasa51 97 8 0 . 2 { 2 5_CJB11 0 
msa519780.2{2603 
msaS 1 97 8 0 . 2 { 2 5__H3 6B 
msaS19780.2{25_JM9130013 
Consensus 



msa519780 . 2 {25_COHl 
.msa519780 . 2 \ 25_M781 
msa519780 . 2 { 25_M732 
msa519780.2{25_1169NT 
msa519780.2{25__18RS21 
msa519780 . 2 { 25_A909 
msa519780.2{25_090 
msa519780 . 2{25_CJB110 
msa519780. 2(2603 
msa51978 0 . 2 { 25_H36B 
msa519780 . 2 {25_JM9130013 
Consensus 



rosa519780.2(25_OOHl} 
msa519780 . 2 {25J4781) 



251 

ctaatgaagc 
ctaatgaagc 
ctaatgaagc 
ctaatgaagt 
ctaatgaagc 
ctaatgaagc 
ctaatgaagc 
ctaatgaagc 
ctaatgaagc 
ctaatgaagc 



cccaaaatCA 
cccaaaatCA 
cccaaaatCA 
cccaaaatCA 
cccaaaatCA 
cccaaaatCA 
cccaaaatCA 
cccaaaatCA 
cccaaaatCA 
cccaaaatCA 
CA 



AGTTCTCAAT 
AGTTCTCAAT 
AGTTCTCAAT 
AGTTCTCAAT 
AGTTCTCAAT 
AGTTCTCAAT 
AGTTCTCAAT 
AGTTCTCAAT 
AGTTCTCAAT 
AGTTCTCAAT 
AGTTCTCAAT 



CTACAGAAGC 
CTACAGAAGC 
CTACAGAAGC 
CTACAGAAGC 
CTACAGAAGC 
CTACAGAAGC 
CTACAGAAGC 
CTACAGAAGC 
CTACAGAAGC 
CTACAGAAGC 
CTACAGAAGC 



300 

TAATTCTCAG 
TAATTCTCAG 
TAATTCTCAG 
TAATTCTCAG 
TAATTCTCAG 
TAATTCTCAG 
TAATTCTCAG 
TAATTCTCAG 
TAATTCTCAG 
TAATTCTCAG 
TAATTCTCAG 



301 

CAACAAGTTA 
CAACAAGTTA 
CAACAAGTTA 
CAACAAGTTA 
CAACAAGTTA 
CAACAAGTTA 
CAACAAGTTA 
CAACAAGTTA 
CAACAAGTTA 
CAACAAGTTA 
CAACAAGTTA 



CTGCGAGTGA 
CTGCGAGTGA 
CTGCGAGTGA 
CTGCGAGTGA 
CTGCGAGTGA 
CTGCGAGTGA 
CTGCGAGTGA 
CTGCGAGTGA 
CTGCGAGTGA 
CTGCGAGTGA 
CTGCGAGTGA 



AGAGGCgGCT 
AGAGGCgGCT 
AGAGGCgGCT 
AGAGGCgGCT 
AGAGGCaGCT 
AGAGGCaGCT 
AGAGGCaGCT 
AGAGGCaGCT 
AGAGGCaGCT 
AGAGGCaGCT 
AGAGGCaGCT 



GTAGAACAAG 
GTAGAACAAG 
GTAGAACAAG 
GTAGAACAAG 
GTAGAACAAG 
GTAGAACAAG 
GTAGAACAAG 
GTAGAACAAG 
GTAGAACAAG 
GTAGAACAAG 
GTAGAACAAG 



350 

CAGTTGTAAC 
CAGTTGTAAC 
CAGTTGTAAC 
CAGTTGTAAC 
CAGTTGTAAC 
CAGTTGTAAC 
CA GTTG TAAC 
CAGTTGTAAC 
CAGTTGTAAC 
CAGTTGTAAC 
CAGTTGTAAC 



351 400 

AGAAAAtACC CCTGCTACCA GTCAgGCACA ACAAaCTTAT GCTOTTACTQ 
AGAAAAtACC CCTGCTACCA GTCAgGCACA ACAAaCTTAT GCTGTTACTG 



920 



WO 2004/018646 



PCTYUS2003/026827 



Table 59: Comparative Sequences relating to SAG2147 



rasa519780.2{25 M732J AGAAAAtACC 

msa519780.2(25_1169NT AGAAAAtACC 

msa519780.2{25_18RS2lj AGAAAAcACC 

msa519780.2{25_A909 AGAAAAcACC 

msa519780.2{25_090 AGAAAAcACC 

msa519780.2{25_CJB110 AGAAAAcACC 

msa519780.2{2603 AGAAAAcACC 

msa519780.2{25_H36B AGAAAAcACC 

msa519780 . 2 { 25_JM9 130013 } AGAAAAtACC 

Consensus ******-*** 



CCTGCTACCA 
CCTGCTACCA 
CCTGCTACCA 
CCTGCTACCA 
CCTGCTACCA 
CCTGCTACCA 
CCTGCTACCA 
CCTGCTACCA 
CCTGCTACCA 



GTCAgGCACA 
GTCAgGCACA 
GTCAgGCACA 
GTCAgGCACA 
GTCAgGCACA 
GTCAgGCACA 
GTCAgGCACA 
GTCAgGCACA 
GTCAaGCACA 



ACAAaCTTAT 
ACAAaCTTAT 
ACAAgCTTAT 
ACAAgCTTAT 
ACAAgCTTAT 
ACAAgCTTAT 
ACAAgCTTAT 
ACAAgCTTAT 
ACAAgCTTAT 



GCTGTTACTG 
GCTGTTACTG 
GCTGTTACTG 
GCTGTTACTG 
GCTGTTACTG 
GCTGTTACTG 
GCTGTTACTG 
GCTGTTACTG 
GCTGTTACTG 



msa5197 8 0 . 2 f 2 5_COHl ; 
msa519780.2(25_M781 1 
tnsa519780 . 2 { 25JM732 
msa519780 . 2( 25_1169NT 
msa519780.2{25_18RS21 
msa519780 . 2{25_A909 
msa519780 . 2 { 25_090 
msa519780 . 2 { 25_CJB110 
msa519780. 2(2603 
msa519780.2{25_H36B 
msa519780.2{25_JM9130013 
Consensus 



msa519780 . 2 ( 25_COHl 
msa519780.2{25_M781 
msaS19780 . 2 { 25_M732 
msa519780 . 2 {25JL169NT 
msaS1978 0 . 2 { 25_18*S21 1 
msaSl 97 8 0 . 2 { 2 5_A909 
msa519780.2{25_090 
msa519780 .2{25_CJB110 
msa519780.2{2603 
msa51978 0 . 2 { 2 5_H36B 
msa519780.2{25_JM9130013, 
Consensus 



msa519780.2(25_COHi; 
msa519780.2{25 M781 
msaS19780.2{25_M732 
msa519780 . 2 { 25_1169NT 
msa519780 . 2 { 25 JL8RS21 
msa519780.2{25_A909 
msa519780.2{25_090 
msa519780.2{25_CJB110 
tnsa519780.2{2603 
msa519780.2{25_H36B 
msa519780 . 2 {25_JM9130013 
Consensus 



401 

AGACAACTTA 
AGACAACTTA 
AGACAACTTA 
AGACAACTTA 
AGACAACTTA 
AGACAACTTA 
AGACAACTTA 
AGACAACTTA 
AGACAACTTA 
AGACAACTTA 
AGACAACTTA 



cAaACCTGCT 
cAaACCTGCT 
cAaACCTGCT 
cAaACCTGCT 
tAgACCTGCT 
tAgACCTGCT 
tAgACCTGCT 
tAgACCTGCT 
tAgACCTGCT 
tAgACCTGCT 
tAgACCTGCT 



CAACACCAGa 
CAACACCAGa 
CAACACCAGa 
CAACACCAGa 
CAACACCAGa 
CAACACCAGa 
CAACACCAGa 
CAACACCAGa 
CAACACCAGa 
CAACACCAGa 
CAACACCAGc 



CaAGTGGCCA 
CaAGTGGCCA 
CaAGTGGCCA 
CaAGTGGCCA 
CgAGTGGCCA 
CaAGTGGCCA 
CgAGTGGCCA 
CgAGTGGCCA 
CgAGTGGCCA 
CaAGTGGCCA 
CgAGTGGCCA 



' 450 
AGTATTGAGc 
AGTATTGAGC 
AGTATTGAGc 
AGTATTGAGc 
AGT ATTG AGt 
AGTATTGAGt 
AGTATTGAGt 
AGTATTGAGt 
AGTATTGAGt 
AGTATTGAGt 
AGTATTGAGC 



451 

AATGGAAATA 
AATGGAAATA 
AATGGAAATA 
AATGGAAATA 
AATGGAAATA 
AATGGAAATA 
AATGGAAATA 
AATGGAAATA 
AATGGAAATA 
AATGGAAATA 
AATGGAAATA 
********** 

501 

TGCTGCAACa 
TGCTGCAACa 
TGCTGCAACa 
TGCTGCAACa 
TGCTGCAACa 
■ TGCTGCAACa 
TGCTGCAACa 
TGCTGCAACa 
TGCTGCAACa 
TGCTGCAACa 
TGCTGCAACg 



CTGCAGGGGc 
CTGCAGGGGc 
CTGCAGGGGc 
CTGCAGGGGc 
CTGCAGGGGC 
CTGCAGGGGc 
CTGCAGGGGC 
CTGCAGGGGC 
CTGCAGGGGC 
CTGCAGGGGc 
CTGCAGGGGt 
*********_ 



ggTcGGaTCt 
ggTcGGaTCt 
ggTcGGaTCt 
ggTcGGaTCt 
taTtGGcTCa 
taTtGGcTCa 
taTtGGcTCa 
taTtGGcTCa 
taTtGGcTCa 
taTtGGcTCa 
taTtGGcTCa 



GCtGCtGCAG 
GCtGCtGCAG 
GCtGCtGCAG 
GCtGCtGCAG 
GCaGCtGCAG 
GCaGCtGCAG 
GCaGCtGCAG 
GCaGCtGCAG 
GCaGCtGCAG 
GCaGCtGCAG 
GCaGCaGCAG 



500 

CACAAATGGC 
CACAAATGGC 
CACAAATGGC 
CACAAATGGC 
CACAAATGGC 
CACAAATGGC 
CACAAATGGC 
CACAAATGGC 
CACAAATGGC 
CACAAATGGC 
CACAAATGGC 



GGAGTcCCTC 
GGAGTcCCTC 
GGAGTcCCTC 
GGAGTcCCTC 
GGAGTcCCTC 
GGAGTcCCTC 
GGAGTcCCTC 
GGAGTcCCTC 
GGAGTcCCTC 
GGAGTcCCTC 
GGAGTtCCTC 



AGTCTACTTG 
AGTCTACTTG 
AGTCTACTTG 
AGTCTACTTG 
AGTCTACTTG 
AGTCTACTTG 
AGTCTACTTG 
AGTCTACTTG 
AGTCTACTTG 
AGTCTACTTG 
AGTCTACTTG 



GGAACATATT 
GGAACATATT 
GGAACATATT 
GGAACATATT 
GGAACATATT 
GGAACATATT 
GGAACATATT 
GGAACATATT 
GGAACATATT 
GGAACATATT 
GGAACATATT 



550 

ATTGCCCGTG 
ATTGCCCGTG 
ATTGCCCGTG 
ATTGCCCGTG 
ATTGCCCGTG 
ATTGCCCGTG 
ATTGCCCGTG 
ATTGCCCGTG 
ATTGCCCGTG 
ATTGCCCGTG 
ATTGCCCGTG 



msa519760.2(25_COHl 
raaa519780.2{25_M781 
rasa519780 . 2 { 25JM732 
msa5197 80 . 2 ( 25_1169NT 
msa519780.2{25_18RS21 
msa519780.2{25 A909 
rasa519780 . 2 {25_09.0 
msa5197 80 . 2 { 25_CJB110 
msaS19780.2{2603 
msa519780 . 2 { 25_H36B 
msa519780 . 2 { 25_JM9130013 
~ Consensus 



551 

AATCAAATGG 
AATCAAATGG 
AATCAAATGG 
AATCAAATGG 
AATCAAATGG 
AATCAAATGG 
AATCAAATGG 
AATCAAATGG 
AATCAAATGG 
AATCAAATGG 
AATCAAATGG 



TAATCCTAAt 
TAATCCTAAt 
TAATCCTAAt 
TAATCCTAAt 
TAATCCTAAt 
TAATCCTAAt 
TAATCCTAAt 
TAATCCTAAt 
TAATCCTAAt 
TAATCCTAAt 
TAATCCTAAc 



GTTGCTAATG 
GTTGCTAATG 
GTTGCTAATG 
GTTGCTAATG 
GTTGCTAATG 
GTTGCTAATG 
GTTGCTAATG 
GTTGCTAATG 
GTTGCTAATG 
GTTGCTAATG 
GTTGCTAATG 



CCTCAGGAGC 
CCTCAGGAGC 
CCTCAGGAGC 
CCTCAGGAGC 
CCTCAGGAGC 
CCTCAGGAGC 
CCTCAGGAGC 
CCTCAGGAGC 
CCTCAGGAGC 
CCTCAGGAGC 
CCTCAGGAGC 



600 

TTCAGGACTT 
TTCAGGACTT 
TTCAGGACTT 
TTCAGGACTT 
TTCAGGA CTT 
TTCAGGACTT 
TTCAGGACTT 
TTCAGGACTT 
TTCAGGA CTT 
TTCAGGACTT 
TTCAGGACTT 



rasa519780.2(25_COHi; 
msaS19780 . 2 (2 5_M781 
rasa519780 . 2 {25_M732 
msa519780.2(25 1169NT 
msa519780 . 2 { 25_18RS21 
msa519780 . 2 {25_A909 
msa5 1 97 80 . 2 { 2 5_09 0 
msa519780.2{25_CJB110 
msa519780.2{2603 
msa519780.2{25 H36B 
rasa519780 . 2 {25_JM9130013 
Consensus 



601 

TTCCAAACGA 
TTCCAAACGA 
TTCCAAACGA 
TTCCAAACGA 
TTCCAAACGA 
TTCCAAACGA 
TTCCAAACGA 
TTCCAAACGA 
TTCCAAACGA 
TTCCAAACGA 
TTCCAAACGA 



TGCCAG GTTG 
TGCCAGGTTG 
TGCCAGGTTG 
TGCCAGGTTG 
TGCCAGGTTG 
TGCCAGGTTG 
TGCCAGGTTG 
.TGCCAGGTTG 
TGCCAGGTTG 
TGCCAGGTTG 
TGCCAGGTTG 



GGGTTCAACA 
GGGTTCAACA 
GGGTTCAACA 
GGGTTCAACA 
GGGTTCAACA 
GGGTTCAACA 
GGGTTCAACA 
GGGTTCAACA 
GGGTTCAACA 
GGGTTCAACA 
GGGTTCAACA 



GCTACAGTTC 
GCTACAGTTC 
GCTACAGTTC 
GCTACA GTTC 
GCTACAGTTC 
GCTACAGTTC 
GCTACAGTTC 
GCTACAGTTC 
GCTACAGTTC 
GCTACAGTTC 
GCTACAGTTC 



650 

AGgAtcaagt 
AGgAtcaagt 
AGgAtcaagt 
AGgAtcaagt 
AGgAtcaagt 
AGaAtcaagt 

AGgA 

AGgAtcaagt 
AGgAtcaagt 
AGgAtcaagt 
AGgAtcaagt 



651 700 
msa519780.2{25_COHl} taattcagct attaaagctt atcgtgctca aggtttatca gcttggggtt 



921 



WO 2004/018646 



PCT/US2003/026827 



Table 59: C mparative Sequences relating to SAG2147 



msa519780.2(25_M781 
msaS19780.2{25_M732 
msa519780.2{25_1169NT 
msa519780.2(25 18RS21 
msa519780.2{25_A909 
msa519780.2{25_090 
msa519780 . 2{25_CJB110 
msa519780.2{2603 
msa519780.2{25_H36B 
msa519780.2{25_JM9130013, 
Consensus 



taattcagct attaaagctt atcgtgctca aggtttatca gcttggggtt 
taattcagct attaaagctt atcgtgctca agg.tttatca gcttggggtt 
taattcagct attaaagctt atcgtgctca aggtttatca gcttggggtt 
taattcagct attaaagctt atcgtgctca aggtttatca gcttggggtt 
taattcagct attaaagctt atcgtgctca aggtttatca 

taattcagct attaaagctt atcgtgctca aggtttatca gcttggggtt 
taattcagct attaaagctt atcgtgctca aggtttatca gcttggggtt 

taattcagct attaaagctt 

taattcagct attaaagctt atcgtgctca aggtttatca gcttggggtt 



msa519 7 80.2(2 5_C0H1 1 
msa519780.2{25_M781 
msa519780.2{25 M732 
msa519780 . 2{25_1169NT 
msa519780.2{25JL8RS21 
msa519780.2{25 A909 
msaS19780 . 2 { 25_J>90 
msa519780.2{25 CJB110 
msa519780.2{2603 
msa519780 . 2 {25_H36B 
msa519780 - 2 { 25_JM9130013 
Consensus 



701 

ac 

ac 

a - 

ac 

ac 



ac 

actag 

ac 



SEQ ID HO. 5912 
STRAIN 2603 frame: 1 

MNKRRKLSKLNVKKHHLAYGAITLVAIiFSC I LAVMVI FKSSQVTTESIjSKADKVRVAKKS 

kmtkatskskvedvkqapkpsqasneapksssqsteansqg^ 
patsqaqx2ayavtettyrpaqhqtsgqvlsngntagai gsaaaaqmaaatgvpqstwehi 
i aresngnpnvanasgasglfqtmpgwgstatvqdqvnsai kayraqglsawgy 

SEQ ID NO. 5913 
STRAIN 1169NT frame: I 

KSSQVTTBSIiS KADKVRVAKKSKMTKATS KSKVBDVKQAPKPSQ^ 

SQQQVTASEEAAVEQAWTENTPAT S QACX^TYAVTETTYKPAQHQTSGQVLSNGJTrAGAV 
GSAAAAQMAAATGVPQSTWEHI IARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVN 
SAI KAYRAQGLSAWGY 

SEQ ID NO* 5914 
STRAIN 18RS21 frame: 1 

KSSQVTTESLSKADKVRVAKKSKMTKATSKSKVEDVKQAPK^ 

SQQQVTAS EEAAVEQAVVTENTPATSQAQQAYAWETTYRPAQHQTSGQVI^GNTAGAI 
GSAAAAQMAAATGVPQSTWEHI IARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVN 
SAI KAYRAQGLSAWGY 

SEQ ID NO. 5915 
STRAIN 2603 frame: 1 

KSSQVTTESIjSKADKVRVAKKSKMTKATSKS 

SQQQVTAS EEAAVEQAVVTEOTT ATSQAQQAYAWETTYRPAQHQT SG QVLSNGNTAGAI 
GSAAAAQMAAATGVPQSTWEHI I ARE Stf GNPNVANASGASGLFGTMPG WG STATVQDQ VN 
SAI KAYRAQGLSAWGY 

SEQ ID NO. 5916 
STRAIN 090 frame: 3 

AKKSKM I KATS KSKVEDVKQAPKPS QASNEAPKS SSQSTEANSQQQVTASEEAAVEQAW 

TENTPATSQAOX2AYAVTETTYRPAQHOTSGQVLSNGOTAGAIGSAA 

WEHI IARESNGNPWANASGASGIiFQTMPGWGSTATVQ 

SEQ ID NO. 5917 
STRAIN A909 frame: 1 

KATSKSKVEDVKQAPKPSQASNEAPKSSSQSTEANSQQQVTASEEAAVE 

S QAQQAYAVTBTTYRP AQHQTSGQVLSNGNTAGA I GSAAAAQMAAATGVPQSTWEH 1 1 AR 

ESNGNPNVANASGASGLFQTMPGWGSTATVQNQVNSAI KAYRAQGLS 

SEQ ID NO. 5918 
STRAIN CJB1 JO frame: 3 

SLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQA^ 
EEAAVEQAVVTENTPATSQAQX^YAVTETTYRPAQHQT 

AAATGVPQSTWEHI IARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVNSAI KAYRA 
QGLSAWGY 

SEQ ID NO. 5919 
STRAIN COH1 frame: 1 

KSSQVTTBSLSKADKVRVAKKSKMTKATSKSKVEDVKQAPK^ 

S QQQVTAS EEAAVEQAVVTFiOTPATSQAQQTYAVrbrrr ¥TCPAQHQTSGQVLSNGNTAGAV 
GSAAAAQMAAATGVPQSTWEHI IARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVN 
SAI KAYRAQGLSAWGY 

SEQ ID NO. 5920 
STRAIN H36B frame: 1 
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KSSQVTTESLSKADKVRVAKKSKMTKATSKSKVEDVKQA^ 

SQQQVTASEEAAVEQAVVTENTPATSQAQQAYAVTETTYRPAQHQTSGQVLSNGNTAGAI 
GSAAAAQMAAATGVPQSTWEH I I ARE SNGNPNVANASGASGLFQTMPGWG STATVQDQVN 
SAIKA 

SEQ ID NO. 5921 
STRAIN M732 frame: 1 , 

KS SQVTTES L S KADKVRVAKKS KMTKAT S KS KVED VKQAPKPS QASNEAP KS S SQSTEAN 
SQQQVTAS EEAAVEQAVVTENTPATSQJ\QQT YAWETTYKPAQHQT SGQVLSNGNTAGAV 
GSAAAAQMAAATGVPQSTWEH 1 1 ARE SNGNPNVANASGASGLFQTM PG WG STATVQDQVN 
SAI KAYRAQGLSAWG 

SEQ ID NO. 5922 
STRAIN M781 frame: 4 

SLSKADKVRVAKKSKMTKATSKSKVEDVKQAPKPSQ 

EEAAVEQA WTENTP AT S QAQQTYAVTETT YKPAQHQTSGQ VL SNGNTAGAVG SAAAAQM 
AAATGVPQSTWEHI I ARESNGNPNVANASGASGLFQTMPGWGSTATVQDQVNSAI KAYRA 
QGLSAWGY 

SEQ ID NO. 5923 
STRAIN JM9 130013 frame: 1 

KSSQVTTESLSKADKVRVAKKSKMNKATSKSKVEGVKQAPKPSSQS^ 
AAVEGJWVTENTPATSQAQQAYAVTETTYRPAQHQPSGQVDSNGNTAGVIGSAAA^ 
ATGVPQSTWEHI I ARESNGNPNVANASGAS GLFQTMPGWG STATVQDQVN SA I KAYRAQG 
LSAWGY 
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KS SQVTTES LSK 
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SSQSTEANSQ 
SSQSTEANSQ 



SSQSTEANSQ 
SSQSTEANSQ 
SSQSTEANSQ 



SSQSTEANSQ 
SSQSTEANSQ 
SSQSTEANSQ 
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QQVTASEEAA 
QQVTASEEAA 
QQVTASEEAA 
QQVTASEEAA 
QQVTASEEAA 
QQVTASEEAA 
QQVTASEEAA 
QQVTASEEAA 
QQVTASEEAA 
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AVTETTYrPA 
AVTETTYrPA 
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QHQtSGQVLS 
QHQtSGQVLS 
QHQtSGQVLS 
QHQtSGQVLS 
QHQtSGQVLS 
QHQtSGQVLS 
QHQtSGQVLS 
QHQtSGQVLS 
QHQtSGQVLS 
QHQtSGQVLS 
QHQtSGQVLS 
QHQpSGQVLS 



msa519418.2{25_090 
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msa519418 . 2 { 25_M781 
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tnsa519418.2{25~CJB110 
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NGNTAGaiGS 
NGNTAGaiGS 
NGNTAGavGS 
NGNTAGavGS 
NGNTAGavGS 
NGNTAGavGS 
NGNTAGaiGS 
NGNTAGaiGS 



AAAAQMAAAT 
AAAAQMAAAT 
AAAAQMAAAT 
AAAAQMAAAT 
AAAAQMAAAT 
AAAAQMAAAT 
AAAAQMAAAT 
AAAAQMAAAT 



GVPQSTWEHI 
GVPQSTWEHI 
GVPQSTWEHI 
GVPQSTWEHI 
GVPQSTWEHI 
GVPQSTWEHI 
GVPQSTWEHI 
GVPQSTWEHI 



IARESNGNPN 
IARBSNGNPN 
IARESNGNPN 
IARBSNGNPN 
IARESNGNPN 
IARBSNGNPN 
IARBSNGNPN 
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VANASGASGL 
VANASGASGL 
VANASGASGL 
VANASGASGL 
VANASGASGL 
VANASGASGL 
VANASGASGL 
VANASGASGL 
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msa519418.2{25 2603) 
msa519418.2T2603) 
msa519418.2{25 A909J 
rasa519418 .2{25_JM9130013} 
Consensus 



NGNTAGaiGS AAAAQMAAAT GVPQSTWEHI IARESNGNPN VANASGASGL 

NGNTAGaiGS AAAAQMAAAT GVPQSTWEHI IARESNGNPN VANASGASGL 

NGNTAGaiGS AAAAQMAAAT GVPQSTWEHI IARESNGNPN VANASGASGL 

NGNTAGviGS AAAAQMAAAT GVPQSTWEHI IARESNGNPN VANASGASGL 
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FQTMPGWGST 
PQTMPGWGST 
FQTMPGWGST 
PQTMPGWGST 
FQTMPGWGST 
FQTMPGWGST 
FQTMPGWGST 
FQTMPGWGST 
FQTMPGWGST 
FQTMPGWGST 
FQTMPGWGST 
FQTMPGWGST 
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ATVQ 

ATVQDQVNSA 
ATVQDQVNSA 
ATVQDQVNSA 
ATVQDQVNSA 
ATVQDQVNSA 
ATVQDQVNSA 
ATVQDQVNSA 
ATVQDQVNSA 
ATVQDQVNSA 
ATVQnQVNSA 
ATVQDQVNSA 



IKA 

IKAYRAQGLS 
IKAYRAQGLS 
IKAYRAQGLS 
IKAYRAQGLS 
IKAYRAQGLS 
IKAYRAQGLS 
IKAYRAQGLS 
IKAYRAQGLS 
IKAYRAQGLS 
IKAYRAQGLS 



AWGY 
AWGY 
AWGY 
AWG- 
AWGY 
AWGY 
AWGY 
AWGY 

AWGY 
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SSQ XD NO. 6001 

STRAIN 2603 

ATGAAAGAAAAACAGTCGAAAAGGCTTATTTATATACT 

ATAAGTGTTTTTACATACAGTATTAGCCIAGCCT^ 

GTTATTCTAAGTCCAAATAGTCAAGCCATTT^^ 

AAATACXjGTATAAAAGTTAAGCTTATTCAAGGTG 

AGTAAGGAGGGTAAGCAGTTGAAGGCGGATAmrrCTT^ 

GAAAGTC^TAAGGCATTGTTTGAGTCXTACX^ATCAAA 

GACTATATCCATCXyVAGTGATACGGCGACACCTTATACrATAAAT^ 

GTAAATAACGAATTAGCTAAGGGACTTACCATCAAGAGTTA^ 

TCCTTAAAAGGTAAAATTGCCTTTGCAGATCCX3AATA 

CTCACTAATATACTCTTGGCCAAGGGTGGTTACACCA 

AAAAAGCTACAACATAATATTAATGCTATCAAAT CTTCT AGCTCTTCAGAAGTTT ATCAA 

TCAGTTGCAGAAGGAAAAATGATTGTGGGGCTGACTTAC^ 

(^AAAAGTGGTGCCAATGTTTCTATTGTATATCCGACAGAA 



TTTATGCITTCTTTAGATGTTCAAAATGCCT^ 
CGTAAAGATGCCCAAACGAGTAATGGCATGAAAGCTT^ 
GAAGATXATCGCTATGTCACTAAGCATAAGGGCCAAATCCT 
CGTAGAAATG CTGAT 

SSQ ID NO. 6002 
STRAIN 090 

CAGCCTTCTAAACTACrTCCACCAAAAGAATTAGTTATTCT 
" CCAAATAGTCAAGCCATTTTAACAGGAACGATTCC^ 
ATACGGTATAAAAGTTAAGCTTATTaUlGGTGGGAC^ 
ATAGATTAAGTAAGGAGGGTAAGC^GTTGAAGGCGGAT^ 
GGAAATTATACGCAATTTGAAAGTCATAAGGCATT^ . 
ATCAAAGAATGTTCATACTGTTATTCCAGACTATATC 
CXSGCGACACCrTATACTATAAATGGGAGTGTCTTGAT 
TI7VSCTAAGGGACTTACCATCAAGAGTTATGAAG 

CTTAAAAGGTAAAATTG CCTTTGOVGATCCGAATACTTCCTCTAGTG CTT 
TCIX^CAACTCACTAATATACTCTTG^ 

AAAGCGTGGAACTATGTTAAAAAGCrrACAACATAATATTAA^ 

ATCTTCTAGCTCrTCAGAAGTTTATCAATCAG 

TTGTGGGGCTGACTTACX3AAGACOZTAGTOT 

GCCAATGTTTCTATTGTATATCCXSAOUSA^ 

TTCGGTTGCAATTATAAAGAATGCTCCTTCTA 

TTATTAATTTTATGCTT t CTTTAgATGTTCAAAATGCCTTTGGGCAGTCA 

ACGAGTAACCGACCTATTCOTAAAGATGCa^^ 

AGCTTTAAAGGATATTGCTACTCrTAAAGAA^ 

AGCATAAGGGCCAAATCCTTAAAACCTATAA 

GAT 

SBQ ZD MO. 6003 
STRAIN A909 

CAGCCITCTAAACTACTTCCACGAAAAGAATTAG 

TTATTCTAAGTCCAAATAGTCAAGCCATITTAACAGGA 

TTTGAGGAAAAATACGGTATAAAAGTTAAGCTTATTCAA^ 

TCAACTAATAGATAGATTAAGTAAGGAGGGTAAGC^^ 

TTTTCTTTGGAGGAAATTATACGCAA 

GAGTCTTACGTATCAAAGAATATTCATACTGTTATTCCAGA 

TCCGAGTGATACGGCX^CACXTTATACTATAAATGGGAGTG 

TAAATAACGAATTAGCTAAGGGACTTACCAT^ 

TTACAGCXTTCCTTAAAAGGTAAAATTGCCTTTC 

CTCTAGTGCTTTCTCACAACTCACTAAT^ 

ACACCAATCCAAAAGCGTGGAACTATGTTAAAAAGCT^ 

AATGCTATCAAATCTrCTAGCTCTTCAG 

AGGAAAAATGATTGTGGGGTTGACTTACXiAAGACCCT 

AAAAAAGTXKSTGCCAATGTTTCTAITGTATATCC^ 

TTTGTCCCATCTTCGGTTGCAATTATAAAGAATGC^ 

AGCAAAGTTATTTATTAATTTTATGCTT/rCT^ 

TTGGGCAGTCAACGAGTAACCGACCTATTCGTAA^ 

AATGGCATGAAAGCTTTAAAGGATATTGCTACTCTTAA^ 

CTATGTCACTAAGCATAAGGGCCAAATCCrTAAAACCTATA 

GT AGAAATG CTGAT 

SBQ ZD KO. 6004 

STRAIN H36B 

TAAACTACTTCCACCAAAAGAATTAGTTATTCTAAGTCC^ 

CCATTTTAACAGGAACGATTCCAGCTITTGAGGAA 

GTTAAGCTTATTCAAGGTGGGACAGGTCAACTAATAGA^ 

GGAGGGTAAG CAGTTGAAGGCGGATATTTTCTTTGGAGGAAATTATACGC 

AATTTOAAAGTXMAAGGCATTGTTTGAGTC 

CATACTGTTATTCCAGATTATATCCATCO^ 

TACTATAAATGGGAGTGTCTITX^TTGTAAATAAcGAATTAGTTAAGGGAC 
TTACCATCAAGAGTTATGAAGATTTATTACA^ 
ATTGCCTTTGCAGATC<X3AATACITCCTcTAGTC 
TAATATACTCTI\3GCCAAGGGTGGTTA<^^ 

ATGTTAAAAAGCTACAACATAATATTAATGCTATCAAATCTTCTAG 

TCAGAAGTTTATCAATCAGTTGCAGAAGGAAAAATG^ 

TTACt3AAGACCCTAGTGTCAATTTGC3VAAA 
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ATAAAGAATG CTCCTTCTATGAAAGAAGCAAAGTTATTTATT AATTTTAT 
GCTTTCTTTAGATGTTCAAAATGCCTTTGGGCA^ 

CTATTCGTAAAGATG CCCAAACX^GTAATGGCATGAAAGCTTTAAAGGAT 
ATTGCTACTCTTAAAGAAGATTATCGCTATGTCACTAAGC^TAAGGGCCA 
AATCCTTAAAACCTAT AATCOTATTCGTAGAAATG CTGAT 

SEQ ID NO. 6005 
STRAIN 18RS21 

CAGCCITCTAAACTACTTCCACCAAAAGAATTAGTTATTCTAAGTCCAAA 
TAGTCAAGCCATTTTAACAGGAACGATTCCAG CTTTTGAGGAAAAATACG 
GTATAAAAGTTAAG CTTATTCAAGGTGGGACAGGG CAACTAATAGATAGA 
rTAAGTAAGGAGGGTAAGCAGTTGiUVGGCGgATArriTCril'GGAGGAAA 
TTATACGCAATTTGAAACTCATAAGGCATTGTTraAGT 
AGAATGTTCATACIXyiTATTCCAGAOT 

ACACCTTATACTATAAATGGGAGTGTCTTGATTGTAAATAACGAATTAGC 

TAAGGGACTTACCATCAAGAGTTATGAAGATTTATTA^ 

AAGGTAAAATTGCCITTGCAGATCCGAATACTTC^ 

CAACTCACTAATATACTCTTGGCCAAGGGTGGTTACACCAATC^^ C 

GTGGAACTATGTTAAAAAGCTACZAACATAATATTAATGCT 

CTAGCTCTTCAGAAGTITAT CAATCAGTTGCAGAAGGAAAAATGATTGTG 

G GGCT GACTTAGGAAGACCCrAGTG 

TGTTTCTATTGTATATCOGACAGAAGXSGACAGTTT^ 

TTGCAATTATAAAGAATGCTCCU'1'CIATGAAAGAAGCAAAGTTATTTATT 

AAT\L"l J r ATG CriTCri'l'AGATGTTCAAAATG C CTTTGGG CAG TCAACGAG 

TAACCGACCTATTCGTAAAGATGCCCAAACGAGTAATGG CATGAAAGCTT 

TAAAGGATATTGCTACTCTTAAAGAAGATTATCGCTATGTCACTAAGCAT 

AAGGGCO^TCCTTAAAACCTATAATCGTATTCGTAGAAATGCTGAT 

SBQ XD NO. 6006 
STRAIN M732 

CAGCCTTCTAAACTACTTCCACCAAAAGAATTAGT 

TATrCTAAGTCCAAATAGTCAAGCCAl"lU"rAACAGGAACGATTCCAGC^ 

TTGAGGAAAAATACGGTATAAAAGOTAAGCTTATTCAAGGTGGGACAGGG 

CAACTAATAGATAG ATT AAGTAAGGAGGGTAAG CAGTTGAAGG CG GATAT 

TTTCTTTGGAGGAAATTATACGCAATTTGAAAGTCATAAGGC^ 

AGTCTTACGPTATCAAAGAATGTTCATACTGT^ 

CXX^GTGATACGGCGACACCTTATACTATAAATGG 

AAATAACX3AATTAGCTAAGGGACTTACCATCAAGAGTTATGAAGATTTAT 

TACAGCCTTOTTAAAAGOTAAAATTGOrn^ 

TCTAGTGCTTTCTCACAACTCACTAATATACTCTT^ 

CACCAATCCAAAAGC<3TGGAACrrATGTTAAAAAGCTACAACATAATATTA 

ATGCTATCAAATC^CTAGCTCTTCAGAAGTTTATCAATCAGTTG CAGAA 

GGAAAAATGATTGTGGGGTTGACTTACGAAGACCCTAGTGT^ 

AAAAAGTGGTGCCAATGTTTCTATTGTATA<X!CGAC^ 

TTGTCCCATCTrCXym XSaVAT TA TAA 

GCAAACTTATTTATTAATTTTATGCTTTCTra 

TGGGCAGTCAACGAGTAACamCCTATTCGTAAAGATGCCCAAACAAGTA 
ATGGCATGAAAGCTTTAAAGGATATOKrrACTCTTAAAGAA 
TATOTCACTAAGCATAAGAGCCAAATCtTTTAAAACCTA 
TAGAAATGCTGAT 

SBQ ZD KO. 6007 
STRAIN COH1 

CAGCCTTCTAAACTACITCCACCAAAAGAATTAGTT 

ATTCTAAGTCCAAATAG^TCAAGCCATTTTA^ 

TCAGGAAAAATACGGTATAAAAGTTAAGCTTATTCAAG^ 

AACTAATAGJVTAGATrAAGTAAGGAGGGTAA^ 

TTCTTTGGAGGAAATTATAC<3CAATTTGAAAGTC^ 

GTCTTACGTATC^\AAGAATGTTCATACTG^ 

CGAGTGATACGGCXBACACCrTATACrrATAAATGGGAGTGTCTT^ 

AATAACGAATTAGCTAAGGGACTTACCATCAAGAGTTATGAAGATTTA^ 

ACAGCCTTCCTTAAAAGGTAAAATTGCCnTTG 

CTAGTGU"i"l"rCTCACAACTCACTAATATA^lvrit3GCCAAGGGTGGTTAC 

ACCAATCCAAAAGCtJKXlAACTATGTTAAAAAGCTACAACATAATATTAA 

TGCTATCAAATCITCTAGCTCrrTCAGAAGTTTArCA 

GAAAAATGATTGTGG GGTTC ACTTACX^ 

AAAAGTGGTGCCAATG7TTTCTATTCTATACCCGA 

CAAAGTTATTTATTAATTTTATGCTTTC^ 

GGGCAGTCAACGAGTAACCGACCTATTCGTAAAGATGCCCAAACAAGTAA 
TGGCATGAAAGCTTTAAAGQATATCG^rmCrCTO 

ATGTCACTAAGCATAAGAGCCAAATCCTTAAAACCTATAATCGCATTCGT 
AGAAATGCTGAT 

SBQ XD NO. 6008 
STRAIN M78 1 

CAG CCTTCTAAACT ACTTCCACCAAAAGAA'ITAGTTATT 

CTAAGTCCAAATAGTCAAGCCATTTTAACAGGAACGATTCCAG C 

GGAAAAATACGGTAT AAAAGTTAAG CTTATTCAAGGTGGGACAGGGCAAC 

TAATAGATAGATTAAGTAAGGAGGGTAAGCAiji-i\iAAGGCGGATATTTTC 

TTTGGAGGAAATTATACG CAATTTGAAAGTCATAAGGCATTGTTTGAGTC 

TTACOTATCAAAGAATGTTCATACTGTTA^^ 

GTGATAC^C&ACACCTTATACIATAAATGGGAGT 
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AACGAATTAGCTAAGGGACTTACC^TCAAGAGTTATGAAGATTTATTACA 

GCXTTCCTTAAAAGGTAAAATTGCCTTTGCAGATCCGAATACTTCCTCTA 

GTGCTTTCTCACAACTCACTAATATACTCTTGGCCAAGGGTGGTTA 

AATCCAAAAGCGTGGAACTATGTTAAAAAGCTACAACATAATATTAATGC 

TATCAAATCTTCTAGCTC7ITCAGAAGTTTATCAATCAGTTC 

AAATGATTGTGGGGTTGACTTACGAAGACCCTAGTCT 

AGTGGTCCCAATGTTTCTATTGTATACCCGACAGAAGGG^ 

CCCATCTTCGGTTGCAATTATAAAGAATGCTCCTTCTA 

AGTTATTTATTAATTTTATGCTTTCTTTAGATC 

CAGT C7\ACGAGTAACCGACCTATTCGT AAAGATGCCX^UUVCAAGTAA 

CATGAAAGCTTTAAAGGATATCGCTACTCTTAAAGAAGATTATCGCT 

TCACTAAGCATAAGAGCCAAATCXOTAAAACCTATAATCGCATTCGTAGA 

AATGCTGAT 

SEQ ZD HO. 6009 
STRAIN CJB1 10 

CAGCCTTTTAAACTACTTCCACCAAAAGAATTACTTATTCT 

AAGTCCAAATAGTCAAGCCATTTTAACAGGAACGACT 

AAAAATACGGTATAAAAGTTAAGCTTATTCAAGGTGGGACAGGGCAACTA 

ATAGATAGATTAAGTAAGGAGGGTAAGCAGTTGAAGGCGGATAl'inTCTT 

TGGAGGAAATTATACGCAATTTGAAAGTCATAAGGCATTGTTTG^ CTT 

ACGTATCAAAGAATGTTCATACTGTTATTCCAGACTATATCCATCCAA^ 

GATACGGCGACACCTTATACTATAAATGGGAGTCTCTTGATTGTAA^ 

CGAATTAGCTAAGGGACTTACCATCAAGAGTTATGAAGATITATTA C 

CTTCCrTAAAAGGTAAAATTGCCTTTGCAGATCCGAATA 

GCTTTCTCACAACTCACTAATATACTCTrGG CCAAGGGTGGTTACACCAA 

TCCAAAAGCXSTGGAACTATGTTAAAAAGCTAC^CATAATATTAATGCTA 

TCAAATCTTCTAGCTCTTCAGAAGTTTATCAATC^^ 

ATGATTGTGGGGCTGACTTACGAAGACCCTAGTGTCAATT ^^ 

TGGTGCCAATGTTTCTATTGTATATCCGACAGAAGGGACAGTT^ 

CATCTTCGGTTGCAATTATAAAGAATGCTCCTTCTATGAAAGAAG 

TTATTTATTAATTTTATGCrTTCTTTAGAT^ 

GTCAACGAGTAACOaACCTATTCXSTAAAGATG CCCAAACGAGTAA 

TGAAAGCTTTAAAGX3ATATTGCTACTCTTAAAGAAGA 

ACTAAGCATAAGGGCCAAATCXOTAAAACCTATAATCXn'ATTCGTAGAAA 

TGCTGAT 

SEQ ZD NO. 6010 
STRAIN 1169NT 

ATAGTCAAG CCATTTTAACAGGAACGATTCCAGCTTTTGAGGAA^ 

GGTATAAAAGTTAAGCTTATTCAAGGTGGGACAGGGC^CrAATAGATAG 

ATTAAGTAAGGAGGGTAAGCATITGAAGGCGGATATTTTCTtTGGAGGAA 

ATTATACGCAATITGAAAGTCATAAGGCATTGTTTGAGTCT 

AAGAATGTTC^TACTGTTATTCCAGACTATATCCATCCAAGTGATACGGC 

GACACCTTATACTATAAATGGGAGTGTCTTGATTGTAAATAACGAA 

CTAAGGGACTTACCATCAAGAGTTATGAAGATTTATTAC^ 

AAAGGTAAAATTGCCTTTGCAGATCCGAATACCTCCTCTAGTGCTTTCTC 

ACAACX<!ACCAATATACTCTTGGCAAAGGGTGGTTACACCAATCCAAAAG 

CGTGGAACTATGTTAAAAAG CTIACAACATAATATTAATGCTATCAAATCT 

TCTAGCTCTTCAGAAGTITATCAATCAGTTG 

GGGGTTGACTTACGAAGACCCTAGTGTCAATT t^CAAAAAAGTGGTGCCA 

ATGTTTCTATTGTATATCCGACAGAAGGGACA^ 

GTTGCAATTATAAAGAATGCTCCTTCTATGAAAGAAG 

TAATTTTATG CrrrLTl'ITAGATGTTCAAAATG CXri"l"rGGGCAGTCAACGA 

GTAACCGACCTATTCGTAAAGATGCCCAAACGAGTAATG^ 

TTAAAGGATATTGCTACrcTTAAAGAAGATTATCGCT 

TAAGGGC CAAATCCTTAAAACCTATAATCGTATTCGTAGAAATGCTG AT 

SEQ ZD NO. 6011 
STRAIN JM9 1 1 300 13 

CAGCCTTCTAAACTACTTCXIACCAAAAGAATTAGT 

TATTCTAAGTCCAAATAGTCAAGCCATTTTAACAGGAACGA 

TTGAGGAAAAATACGGTATAAAAGTTAAGCTTATTCAAGGTGGGACAGGG 

CAAXTTAATAGATAGATTAAGTAAGGAGGGTAAGCAGTTXSAAGGCG 

TTTCTTTGGAGGAAATTATACGCAATTTGAAAGT 

AGTCTTACGTATGAAAGAATGTTCATACTGTTATTCCAGACT^ 

CXX3AGTGATACGGCGACACCTTATACTATAAATGG 

AAATAACGAATTAGCTAAGGGACTTACCATCAAGAGTTATGAAG^ 

TACAGCCTTCCTTAAAAGGTAAAATTGCCTTTGCAGAT^ 

TCTAGTGCTTTCTCACAACTCACCAATATACr^^ 

CACCAATCCAAAAGCGTGGAACTATGTTAAAAAGCTACAA 

ATGCTATCAAATCTTCTAGCTCTTCAGAA^ 

GGCAAAATGATTGTGGGGCTGACTTA£X3AAGACXXrrAGTG^ 

AAAAAGTGGTXSCCAATGTTTCTATTGTGTATCCGACA^ 

TTGTCCCATCTTOGGTItK^ATTATAAAGAA 

GCAAAGTTATTTATTAATTTTATGCTTTCTTTAGA 

TGGGCAGTCAACGAGTAACCGACXTATTCGTAAAGATC 

ATGGCATGAAAGCITTAAAGGATATTGCTACTCTTA 

TATGTC^CTAAGCATAAGGGCCAAATCCTTAAAAC^ 

TAGAAATGCTGAT 

PRETTY of: /biotmp/msa523010 .2{ *} April 28, 2003 08:55 .. 
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Table 60: Comparative Sequences relating to SAG1945 



ms a52 3 0 10 . 2 f 2 63_COHl 
msa523010.2| 263__M732 
msa523010 . 2 j' 263_M781 
msa523010.2i 263_A909' 
msa523010. 2(263 H36B 
msa523010.2{263_090 
msaS23010.2{263JL8RS21 
msaS23010.2{263 2603 
msa523010.2{263_CJB110 
msa52301.0.2(263_1169NT 
msa523010 . 2{263_JM91130013 
Consensus 



msa523010.2(263_COHl 
msa523010 . 2 < 263_M732 
msa523010.2 263_M781 
msa523010. 2(263 A909 
msa523010 . 2 ( 263~H36B 
msaS23010. 2(263 090 
msa523010.2(263_18RS21 
msa523010.2{263_2603 
msaS23010.2{263 CJB110 
msa523010. 2(263 1169NT 
msa523010.2{263_JM91130013 
Consensus 



1 50 

atgaaagaaa aacagtcgaa aaggcttatt tatatactac tggttgtttc 

********** ********** ********** ********** ********** 

51 100 

~ cag ccttctaaac 

— . . cag ccttctaaac 

~- cag ccttctaaac 

r . cag ccttctaaac 

taaac 

, cag ccttctaaac 

cag ccttctaaac 

cattattttt ataagtgttt ttacatacag tattagccag ccttctaaac 
— , cag ccttttaaac 

cag ccttctaaac 



msa523010.2< 263_C0H1 
msa523010.2 263_M732 ( 
msa523010 .2 263_M781 
msa523010.2 263_A909 
msa523010 . 2 { 263_H36B 
msa523010 . 2 {263_090 
msa523010.2{263 18RS21 
msa52 3 0 1 0 . 2 { 2 63_2 6 03 
msa523010.2{263_CJB110 
rasa523010.2{263_1169NT' 
msa523010 . 2 { 263_JM91130013 
Consensus 



101 

tacttccacc 
tacttccacc 
tacttccacc 
tacttccacc 
tacttccacc 
tacttccacc 
tacttccacc 
tacttccacc 
tacttccacc 



aaaagaatta 
aaaagaatta 
aaaagaatta 
aaaagaatta 
aaaagaatta 
aaaagaatta 
aaaagaatta 
aaaagaatta 
aaaagaatta 



gttattctaa 
gttattctaa 
gttattctaa 
gttattctaa 
gttattctaa 
gttattctaa 
gttattctaa 
gttattctaa 
gttattctaa 



tacttccacc aaaagaatta gttattctaa 



gtccaaATAG 
gtccaaATAG 
gtccaaATAG 
gtccaaATAG 
gtccaaATAG 
gtccaaATAG 
gtccaaATAG 
gtccaaATAG 
gtccaaATAG 

ATAG 

gtccaaATAG 



150 

TCAAGCCATT 
TCAAGCCATT 
TCAAGCCATT 
TCAAGCCATT 
TCAAGCCATT 
TCAAGCCATT 
TCAAGCCATT 
TCAAGCCATT 
TCAAGCCATT 
TCAAGCCATT 
TCAAGCCATT 



msa523.010.2(263 COH1 
msa523010.2l 263~M732 t 
msa523010 .2 263JM781 
msa523010 .2 263_A909 
msa523010 .2{263_H36B 
tnsaS23010.2{263_090 
msa523010.2{263_18RS21 
msa523010 .2{263_2603 
msa523010 . 2 f 263_CJB110 
rasa523010.2{263_1169NT 
msa523010 .2{263_JM91130013 
Consensus 



151 

TTAACAGGAA 
TTAACAGGAA 
TTAACAGGAA 
TTAACAGGAA 
TTAACAGGAA 
TTAACAGGAA 
TTAACAGGAA 
TTAACAGGAA 
TTAACAGGAA 
TTAACAGGAA 
TTAACAGGAA 



CGATTCCAGC 
CGATTCCAGC 
CGATTCCAGC 
CGATTCCAGC 
CGATTCCAGC 
CGATTCCAGC 
CGATTCCAGC 
CGATTCCAGC 
CGATTCCAGC 
CGATTCCAGC 
CGATTCCAGC 



TTTTGAGGAA 
TTTTGAGGAA 
TTTTGAGGAA 
TTTTGAGGAA 
TTTTGAGGAA 
TTTTGAGGAA 
TTTTGAGGAA 
TTTTGAGGAA 
TTTTGAGGAA 
TTTTGAGGAA 
TTTTGAGGAA 



AAATACGGTA 
AAATACGGTA 
AAATACGGTA 
AAATACGGTA 
AAATACGGTA 
AAATACGGTA 
AAATACGGTA 
AAATACGGTA 
AAATACGGTA 
AAATACGGTA 
AAATACGGTA 



200 

TAAAAGTTAA 
TAAAAGTTAA 
TAAAAGTTAA 
TAAAAGTTAA 
TAAAAGTTAA 
TAAAAGTTAA 
TAAAAGTTAA 
TAAAAGTTAA 
TAAAAGTTAA 
TAAAAGTTAA 
TAAAAGTTAA 



msa523010.2| 263_COHl ( 
msa523010.2l 263_M732 ( 
msa523010.2 263_M781 ( 
msa523010 . 2 < 263_A909 
msa523010 . 2 {263_H36B 
rasaS 2 30 10 . 2 { 263_090 
msa523010 . 2 {263_18RS21 
msa523010. 2(263 2603 
msa523010.2{263 CJB110 
msa523010. 2(263 1169NT 
msa523010 . 2 { 263_JM91130013 
Consensus 



201 

GCTTATTCAA 
GCTTATTCAA 
GCTTATTCAA 
GCTTATTCAA 
GCTTATTCAA 
GCTTATTCAA 
GCTTATTCAA 
GCTTATTCAA 
" GCTTATTCAA 
GCTTATTCAA 
GCTTATTCAA 



GGTGGGACAG 
GGTGGGACAG 
GGTGGGACAG 
GGTGGGACAG 
GGTGGGACAG 
GGTGGGACAG 
GGTGGGACAG 
GGTGGGACAG 
GGTGGGACAG 
GGTGGGACAG 
GGTGGGACAG 



GgCAACTAAT 
GgCAACTAAT 
GgCAACTAAT 
GtCAACTAAT 
GtCAACTAAT 
GgCAACTAAT 
GgCAACTAAT 
GgCAACTAAT 
GgCAACTAAT 
GgCAACTAAT 
GgCAACTAAT 



AGATAGATTA 
AGATAGATTA 
AGATAGATTA 
AGATAGATTA 
AGATAGATTA 
AGATAGATTA 
AGATAGATTA 
AGATAGATTA 
AGATAGATTA 
AGATAGATTA 
AGATAGATTA 



250 

AGTAAGGAGG 
AGTAAGGAGG 
AGTAAGGAGG 
AGTAAGGAGG 
AGTAAGGAGG 
AGTAAGGAGG 
AGTAAGGAGG 
AGTAAGGAGG 
AGTAAGGAGG 
AGTAAGGAGG 
AGTAAGGAGG 



msaS23010.2i263 COH1 
msa523010.2 263~M732 
msa523010.2 263_M781 
msa523010.2 263_A909 
msa523010.2(263_H36B 
msa523010.2{263_090 
msa523010 .2(2 63_18RS2 1 
rasa523010 . 2 (263_2603 
msa52 3 0 1 0 . 2 ( 2 63_CJB1 10 
msa523010 . 2 (263_1169NT; 
msa523010.2{263_JM91130013 
Consensus 



251 

GTAAGCAgTT 
GTAAGCAgTT 
GTAAGCAgTT 
GTAAGCAgTT 
GTAAGCAgTT 
GTAAGCAgTT 
GTAAGCAgTT 
GTAAGCAgTT 
GTAAGCAgTT 
GTAAGCAtTT 
GTAAGCAgTT 



GAAGGCGGAT 
GAAGGCGGAT 
GAAGGCGGAT 
GAAGGCGGAT 
GAAGGCGGAT 
GAAGGCGGAT 
GAAGGCGGAT 
GAAGGCGGAT 
GAAGGCGGAT 
GAAGGCGGAT 
GAAGGCGGAT 



aTTTTCTTTG 
aTTTTCTTTG 
aTTTTCTTTG 
aTTTTCTTTG 
aTTTTCTTTG 
aTTTTCTTTG 
aTTTTCTTTG 
aTTTTCTTTG 
aTTTTCTTTG 
aTTTTCTTTG 
gTTTTCTTTG 



GAGGAAATTA 
GAGGAAATTA 
GAGGAAATTA 
GAGGAAATTA 
GAGGAAATTA 
GAGGAAATTA 
GAGGAAATTA 
GAGGAAATTA 
GAGGAAATTA 
GAGGAAATTA 
GAGGAAATTA 



300 

TACGCAATTT 
TACGCAATTT 
TACGCAATTT 
TACGCAATTT 
TACGCAATTT 
TACGCAATTT 
TACGCAATTT 
TACGCAATTT 
TACGCAATTT 
TACGCAATTT 
TACGCAATTT 
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Table 60: Comparative Sequences relating to SAG1945 



msa523 010.2(2 63_C0H1 
msa523010 . 2 ( 263_M732* 
msa523010.2 '263_M78l' 
msa523010.2< 263 A909* 
msa523 010 . 2 { 263~H36B' 
rasa523010.2{263_09o' 
msa523 010. 2(263 1BRS21 
msa523010.2{263_2603' 
msa52 3 0 10 . 2 f 2 63_CJB1 1 0 
msa523010.2(263_1169NT 
msa523010.2{263_JM91130013' 
Consensus 



301 

GAAAGTCATA 
GAAAGTCATA 
GAAAGTCATA 
GAAAGTCATA 
GAAAGTCATA 
GAAAGTCATA 
GAAAGTCATA 
GAAAGTCATA 
GAAAGTCATA 
GAAAGTCATA 
GAAAGTCATA 



AGGCATTGTT 
AGGCATTGTT 
AGGCATTGTT 
AGGCATTGTT 
AGGCATTGTT 
AGGCATTGTT 
AGGCATTGTT 
AGGCATTGTT 
AGGCATTGTT 
AGGCATTGTT 
AGGCATTGTT 



TGAGTCTTAC 
TGAGTCTTAC 
TGAGTCTTAC 
TGAGTCTTAC 
TGAGTCTTAC 
TGAGTCTTAC 
TGAGTCTTAC 
TGAGTCTTAC 
TGAGTCTTAC 
TGAGTCTTAC 
TGAGTCTTAC 



GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 



350 

ATgTTCATAC 
ATgTTCATAC 
ATgTTCATAC 
ATaTTCATAC 
ATaTTCATAC 
ATgTTCATAC 
ATgTTCATAC 
ATgTTCATAC 
ATgTTCATAC 
ATgTTCATAC 
ATgTTCATAC 



msa523010.2(263_COHl 
msa523010.2(263_M732 
msa523010.2 263 M781 
msa523010.2 263~A909 
mBa523010 . 2 { 263_H36B 
msa523010.2{263_090 
msa523010.2{263 18RS21 
msa523010.2{263_2603 
msa523010.2[263 CJB110 
msa523010 . 2 { 263lll69NT 
msa523010.2{263_JM91130013 
Consensus 



351 

TGTTATTCCA 
TGTTATTCCA 
TGTTATTCCA 
T GTTA TTCCA 
TGTTATTCCA 
TGTTATTCCA 
TGTTATTCCA 
T GTTA TTCCA 
TGTTATTCCA 
T GTTA TTCCA 
TGTTATTCCA 



GAcTATATCC 
GACTATATCC 
GAcTATATCC 
GAtTATATCC 
GAtTATATCC 
GAcTATATCC 
GACTATATCC 
GAcTATATCC 
GACTATATCC 
GAcTATATCC 
GAcTATATCC 



ATCCgAGTGA 
ATCCgAGTGA 
ATCCgAGTGA 
ATCCgAGTGA 
ATCCgAGTGA 
ATCCaAGTGA 
ATCCaAGTGA 
ATCCaAGTGA 
ATCCaAGTGA 
ATCCaAGTGA 
ATCCgAGTGA 



TACGGCGACA 
TACGGCGACA 
TACGGCGACA 
TACGGCGACA 
TACGGCGACA 
TACGGCGACA 
TACGGCGACA 
TACGGCGACA 
TACGGCGACA 
TACGGCGACA 
TACGGCGACA 



400 

CCTTATACTA 
CCTTATACTA 
CCTTATACTA 
CCTTATACTA 
CCTTATACTA 
CCTTATACTA 
CCTTATACTA 
CCTTATACTA 
CCTTATACTA 
CCTTATACTA 
CCTTATACTA 



msa523010. 2(263 COHlJ 
msa523010 . 2 1 2 63_M732 } 
msa523010. 2(263 M781J 
msa523010.2(263_A909} 
msa523 0 1 0 . 2 { 2 63_H3 6B } 
rasa523010 . 2 { 263_090] 
msa523010 . 2 {263_18RS21 
msa523010. 2 {263^2603 
tnsa523010.2(263 CJBllo] 
msa523010 . 2 {263~1169NT] 
msa523010 .2{263_JM91130013] 
Consensus 



401 

TAAATGGGAG 
TAAATGGGAG 
TAAATGGGAG 
TAAATGGGAG 
TAAATGGGAG 
TAAATGGGAG 
TAAATGGGAG 
TAAATGGGAG 
TAAATGGGAG 
TAAATGGGAG 
TAAATGGGAG 



TGTCTTGATT 
TGTCTTGATT 
TGTCTTGATT 
TGTCTTGATT 
TGTCTTGATT 
TGTCTTGATT 
TGTCTTGATT 
TGTCTTGATT 
TGTCTTGATT 
TGTCTTGATT 
TGTCTTGATT 



GTAAATAACG 
GTAAATAACG 
GTAAATAACG 
GTAAATAACG 
GTAAATAACG 
GTAAATAACG 
GTAAATAACG 
GTAAATAACG 
GTAAATAACG 
GTAAATAACG 
GTAAATAACG 



AATTAGcTAA 
AATTAGcTAA 
AATTAGcTAA 
AATTAGCTAA 
AATTAGtTAA 
AATTAGcTAA 
AATTAGcTAA 
AATTAGCTAA 
AATTAGcTAA 
AATTAGcTAA 
AATTAGcTAA 



450 

GGGACTTACC 
GGGACTTACC 
GGGACTTACC 
GGGACTTACC 
GGGACTTACC 
GGGACTTACC 
GGGACTTACC 
GGGACTTACC 
GGGACTTACC 
GGGACTTACC 
GGGACTTACC 



tnsa523010.2i 263_COHl 
msa523010.2(263_M732 
msa523010.2(263_M781 
msa523010.2 263_A909 
msa523010.2{263_H36B 
tnsa523010.2{263_090 
msa523010.2(263_18RS21 
msa523010.2{263_2603 
msa523010.2(263_CJB110 
msa523010 . 2 (263_1169NT 
msa523010 .2{263_JM91130013 
Consensus 



451 

ATCAAGAGTT 
ATCAAGAGTT 
ATCAAGAGTT 
ATCAAGAGTT 
ATCAAGAGTT 
ATCAAGAGTT 
ATCAAGAGTT 
ATCAAGAGTT 
ATCAAGAGTT 
ATCAAGAGTT 
ATCAAGAGTT 
********** 



ATGAAGATTT 
ATGAAGATTT 
ATGAAGATTT 
ATGAAGATTT 
ATGAAGATTT 
ATGAAGATTT 
ATGAAGATTT 
ATGAAGATTT 
ATGAAGATTT 
ATGAAGATTT 
ATGAAGATTT 
********** 



ATTACAGCCT 
ATTACAGCCT 
ATTACAGCCT 
ATTACAGCCT 
ATTACAGCCT 
ATTACAGCCT 
ATTACAGCCT 
ATTACAGCCT 
ATTACAGCCT 
ATTACAGCCT 
ATTACAGCCT 
********** 



TCCTTAAAAG 
TCCTTAAAAG 
TCCTTAAAAG 
TCCTTAAAAG 
TCCTTAAAAG 
TCCTTAAAAG 
TCCTTAAAAG 
TCCTTAAAAG 
TCCTTAAAAG 
TCCTTAAAAG 
TCCTTAAAAG 
********** 



500 

GTAAAATTGC 
GTAAAATTGC 
GTAAAATTGC 
GTAAAATTGC 
GTAAAATTGC 
GTAAAATTGC 
GTAAAATTGC 
GTAAAATTGC 
GTAAAATTGC 
GTAAAATTGC 
GTAAAATTGC 
********** 



msa523010.2< 263_COHl 
msa523010.2 263_M732 
ntsa523010.2 263_M78l' 
msa523010.2< 263J\909 
msa523010.2{263 H36B 
msa523010. 2(263 090 
msa523010.2(263 18RS21 
msa523010.2{2?3 2603 
msa523010. 2(263 CJB110 
msa523010 . 2 (263~1169NT 
msa523010 . 2 (263_JM91130013 
Consensus 



501 

CTTTGCAGAT 
CTTTGCAGAT 
CTTTGCAGAT 
CTTTGCAGAT 
CTTTGCAGAT 
CTTTGCAGAT 
CTTTGCAGAT 
CTTTGCAGAT 
CTTTGCAGAT 
CTTTGCAGAT 
CTTTGCAGAT 



CCGAATACTT 
CCGAATACTT 
CCGAATACTT 
CCGAATACTT 
CCGAATACTT 
CCGAATACTT 
CCGAATACTT 
CCGAATACTT 
CCGAATACTT 
CCGAATACTT 
CCGAATACTT 



CCTCTAGTGC 
CCTCTAGTGC 
CCTCTAGTGC 
CCTCTAGTGC 
CCTCTAGTGC 
CCTCTAGTGC 
CCTCTAGTGC 
CCTCTAGTGC 
CCTCTAGTGC 
CCTCTAGTGC 
CCTCTAGTGC 



TTTCTCACAA 
TTTCTCACAA 
TTTCTCACAA 
TTTCTCACAA 
TTTCTCACAA 
TTTCTCACAA 
TTTCTCACAA 
TTTCTCACAA 
TTTCTCACAA 
TTTCTCACAA 
TTTCTCACAA 



550 

CTCACtAATA 
CTCACtAATA 
CTCACtAATA 
CTCACtAATA 
CTCACtAATA 
CTCACtAATA 
CTCACtAATA 
CTCACtAATA 
CTCACtAATA 
CTCACcAATA 
CTCACcAATA 



msaS23010 . 2 ( 263_C0H1 j 
msa523010.2(263_M732 
msa523010.2 263_M78l' 
msa523010 .2 263_A909 
msa523010.2{263_H36B' 
msa5230l0.2{263_090 
msa523010. 2(263 18RS2l' 
msa523010 ,2{263_2603 
msa523010. 2(263 OJB110 
msa523010 . 2 { 263_1169NT 
msa523010 . 2 { 263_JM91130013 



551 

TACTCTTGGC 
TACTCTTGGC 
TACTCTTGGC 
TACTCTTGGC 
TACTCTTGGC 
TACTCTTGGC 
TACTCTTGGC 
TACTCTTGGC 
TACTCTTGGC 
TACTCTTGGC 
TACTCTTGGC 



cAAGGGTGGT 
cAAGGGTGGT 
cAAGGGTGGT 
CAAGGGTGGT 
CAAGGGTGGT 
cAAGGGTGGT 
CAAGGGTGGT 
CAAGGGTGGT 
cAAGGGTGGT 
aAAGGGTGGT 
aAAGGGTGGT 



TACACCAATC 
TACACCAATC 
TACACCAATC 
TACACCAATC 
TACACPAATC 
TACACCAATC 
TACACCAATC 
TACACCAATC 
TACACCAATC 
TACACCAATC 
TACACCAATC 



CAAAAGCGTG 
CAAAAGCGTG 
CAAAAGCGTG 
CAAAAGCGTG 
CAAAAGCGTG 
CAAAAGCGTG 
CAAAAGCGTG 
CAAAAGCGTG 
CAAAAGCGTG 
CAAAAG CGTG 
CAAAAGCGTG 



600 

GAACTA TGTT 
GAACTATGTT 
GAACTATGTT 
GAACTATGTT 
GAACTATGTT 
GAACTATGTT 
GAACTATGTT 
GAACTATGTT 
GAACTATGTT 
GAACTATGTT 
GAACTATGTT 
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Table 60: C mparative Sequences relating to SAG1945 



Consensus 



msaS23010.2(263_COHl 
msa523010.2(263_M732' 
msa523010.2 263_M781 
msa523010.2| 263_A909 
msaS23010.2{263_H36B 
rosa523010.2{263 090* 
msa523010.2{263_18RS2l' 
msa523010.2{263_2603 
msa523010.2(263_CJB110 
msa523010 . 2 (263_1169NT 
msa523010.2{263_JM91130013 
Consensus 



601 

AAAAAGCTAC 
AAAAAGCTAC 
AAAAAGCTAC 
AAAAAGCTAC 
AAAAAGCTAC 
AAAAAGCTAC 
AAAAAGCTAC 
AAAAAGCTAC 
AAAAAGCTAC 
AAAAAGCTAC 
AAAAAGCTAC 



AACATAATAT 
AACATAATAT 
AACATAATAT 
AACATAATAT 
AACATAATAT 
AACATAATAT 
AACATAATAT 
AACATAATAT 
AACATAATAT 
AACATAATAT 
AACATAATAT 



TAATGCTATC 
TAATGCTATC 
TAATGCTATC 
TAATGCTATC 
TAATGCTATC 
TAATGCTATC 
TAATGCTATC 
TAATGCTATC 
TAATGCTATC 
TAATGCTATC 
TAATGCTATC 



AAATCTTCTA 
AAATCTTCTA 
AAATCTTCTA 
AAATCTTCTA 
AAATCTTCTA 
AAATCTTCTA 
AAATCTTCTA 
AAATCTTCTA 
AAATCTTCTA 
AAATCTTCTA 
AAATCTTCTA 



650 

GCTCTTCAGA 
GCTCTTCAGA 
GCTCTTCAGA 
GCTCTTCAGA 
GCTCTTCAGA 
GCTCTTCAGA 
GCTCTTCAGA 
GCTCTTCAGA 
GCTCTTCAGA 
GCTCTTCAGA 
GCTCTTCAGA 



msa523010.2{263_COHl 
msa523010.2{263_M732 
cnsa523010.2 263 M781 
msa523010 . 2 ! 263JV909 
msa523010. 2(263 H36B 
msa523010.2{263 090 
msa523010.2{263_18RS21 
raea523010.2{263_2603 
maa523010 . 2 (263_CJB110 
rasa523010.2{263 1169NT 
msa523 010 . 2 { 263_JM91130013 
Consensus 



651 

AGTTTATCAA 
AGTTTATCAA 
AGTTTATCAA 
AGTTTATCAA 
AGTTTATCAA 
AGTTTATCAA 
AGTTTATCAA 
AGTTTATCAA 
AGTTTATCAA 
AGTTTATCAA 
AGTTTATCAA 



TCAGTTGCAG 
TCAGTTGCAG 
TCAGTTGCAG 
TCAGTTGCAG 
TCAGTTGCAG 
TCAGTTGCAG 
TCAGTTGCAG 
TCAGTTGCAG 
TCAGTTGCAG 
TCAGTTGCAG 
TCAGTTGCAG 



AAGGaAAAAT 
AAGGaAAAAT 
AAGGaAAAAT 
AAGGaAAAAT 
AAGGaAAAAT 
AAGGaAAAAT 
AAGGaAAAAT 
AAGGaAAAAT 
AAGGaAAAAT 
AAGGaAAAAT 
AAGGaAAAAT 



GATTGTGGGG 
GATTGTGGGG 
GATTGTGGGG 
GATTGTGGGG 
GATTGTGGGG 
GATTGTGGGG 
GATTGTGGGG 
GATTGTGGGG 
GATTGTGGGG 
GATTGTGGGG 
GATTGTGGGG 



700 

tTGACTTACG 
tTGACTTACG 
tTGACTTACG 
tTGACTTACG 
tTGACTTACG 
CTGACTTACG 
CTGACTTACG 
CTGACTTACG 
CTGACTTACG 
tTGACTTACG 
CTGACTTACG 



msa523010,2{263_COHl 
msa523010.2 263J4732 
msaS23010.2l263_M781 
msa523010 . 2 (263_A909 
msa523 0 10 . 2 { 2 6 3_H3 6B 
msaS23010 . 2 {263_090 
msa52 3 0 1 0 . 2 { 2 63_18RS2 1 
msa523010 . 2 { 263_2603 
tnsa523010 . 2 ( 263J3JB110 
msa523010.2{263_1169NT 
msa523010.2{263_JM91130013 
Consensus 



701 

AAGACCCTAG 
AAGACCCTAG 
AAGACCCTAG 
AAGACCCTAG 
AAGACCCTAG 
AAGACCCTAG 
AAGACCCTAG 
AAGACCCTAG 
AAGACCCTAG 
AAGACCCTAG 
AAGACCCTAG 



TGTCAATTTG 
TGTCAATTTG 
TGTCAATTTG 
TGTCAATTTG 
TGTCAATTTG 
TGTCAATTTG 
TGTCAATTTG 
TGTCAATTTG 
TGTCAATTTG 
TGTCAATTTG 
TGTCAATTTG 



CAAAAAAGTG 
CAAAAAAGTG 
CAAAAAAGTG 
CAAAAAAGTG 
CAAAAAAGTG 
CAAAAAAGTG 
CAAAAAAGTG 
CAAAAAAGTG 
CAAAAAAGTG 
CAAAAAAGTG 
CAAAAAAGTG 



GTGCCAATGT 
GTGCCAATGT 
GTGCCAATGT 
GTGCCAATGT 
GTGCCAATGT 
GTGCCAATGT 
GTGCCAATGT 
GTGCCAATGT 
GTGCCAATGT 
GTGCCAATGT 
GTGCCAATGT 



750 

TTCTATTGTa 
TTCTATTGTa 
TTCTATTGTa 
TTCTATTGTa 
TTCTATTGTa 
TTCTATTGTa 
TTCTATTGTa 
TTCTATTGTa 
TTCTATTGTa 
TTCTATTGTa 
TTCTATTGTg 



tnsa523010.2 263_COHl 
msa523010 . 2 263J4732 
msa523010.2{263_M781 
msa523010.2(263_A909 
rasa523010 .2{263_H36B 
msaS23010.2{263_090 < 
msa523010 . 2 { 263_18RS21 
msa523010.2{263_2603 
msa523010 . 2 (263_CJB110 
msa523010.2{263_1169NT 
msa523 010 . 2 { 263 JJM91130013 
Consensus 



751 

TAcCCGACAG 
TAcCCGACAG 
TACCCGACAG 
TAtCCGACAG 
TAtCCGACAG 
TAtCCGACAG 
TAtCCGACAG 
TAtCCGACAG 
TAtCCGACAG 
TAtCCGACAG 
TAtCCGACAG 



AAGGGACAGT 
AAGGGACAGT 
AAGGGACAGT 
AAGGGACAGT 
AAGGGACAGT 
AAGGGACAGT 
AAGGGACAGT 
AAGGGACAGT 
AAGGGACAGT 
AAGGGACAGT 
AAGGGACAGT 



TTTTGTCCCA 
TTTTGTCCCA 
TTTTG TCCCA 
TTTTGTCCCA'' 
TTTTGTCCCA 
TTTTGTCCCA 
TTTTGTCCCA 
TTTTGTCCCA 
TTTTGTCCCA 
TTTTGTCCCA 
TTTTGTCCCA 



TCTTCGGTTG 



TCTTCGGTTG 
TCTTCGGTTG 



TCTTCGGTTG 
TCTTCGGTTG 
TCTTCGGTTG 



TCTTCGGTTG 



800 

CAATTATAAA 
CAATTATAAA 
CAATTATAAA 
CAATTATAAA 
CAATTATAAA 
CAATTATAAA 
CAATTATAAA 
CAATTATAAA 
CAATTATAAA 
CAATTATAAA 
CAATTATAAA 



rasa523 010.21 263_COHl 
nisa523010.2l 263_M732 
msa523010.2 263_M781 
msa523010.2 263 A909 
m&a523010.2{263~H36B 
msa523010.2{263_090 
msa523010 . 2 {263_18RS21 
msa523010 .2{263_2603 
msa523010. 2(263 CJB110 
msa523010 . 2 { 263^1169NT 
msa523 010 . 2 { 263_JM9113 0013 
Consensus 



801 

GAATGCTCCT 
GAATGCTCCT 
GAATGCTCCT 
GAATGCTCCT 
GAATGCTCCT 
GAATGCTCCT 
GAATGCTCCT 
GAATGCTCCT 
GAATGCTCCT 
GAATGCTCCT 
GAATGCTCCT 



TCTATGAAAG 
TCTATGAAAG 
TCTATGAAAG 
TCTATGAAAG 
TCTATGAAAG 
TCTATGAAAG 
TCTATGAAAG 
TCTATGAAAG 
TCTATGAAAG 
TCTATGAAAG 
TCTATGAAAG 



AAGCAAAGTT 
AAGCAAAGTT 
AAGCAAAGTT 
AAGCAAAGTT 
AAGCAAAGTT 
AAGCAAAGTT 
AAGCAAAGTT 
AAGCAAAGTT 
AAGCAAAGTT 
AAGCAAAGTT 
AAGCAAAGTT 



ATTTATTAAT 
ATTTATTAAT 
ATTTATTAAT 
ATTTATTAAT 
ATTTATTAAT 
ATTTATTAAT 
ATTTATTAAT 
ATTTATTAAT 
ATTTATTAAT 
ATTTATTAAT 
ATTTATTAAT 



850 

TTTATGCTTT 
TTTATGCTTT 
TTTATGCTTT 
TTTATGCTTT 
TTTATGCTTT 
TTTATGCTTT 
TTTATGCTTT 
TTTATGCTTT 
TTTATGCTTT 
TTTATGCTTT 
TTTATGCTTT 



msa523010.2| 263 COH1 
msa523010.2i 263*~M732 
maa523010.2 263~M781 
msa523010 . 2 263_A909 
msa523010.2{263_H36B 
msa523 010 . 2 { 263_0 90 
msa523010 . 2 {263_18RS21 
msa523010 . 2 {263_2603 
msa523010 . 2 (263_CJB110 
msa523010.2{263 1169NT 



851 

CTTTAGATGT 
CTTTAGATGT 
CTTTAGATGT 
CTTTAGATGT 
CTTTAGATGT 
CTTTAGATGT 
CTTTAGATGT 
CTTTAGATGT 
CTTTAGATGT 
CTTTAGATGT 



TCAAAATGCC 
TCAAAATGCC 
TCAAAATGCC 
TCAAAATGCC 
TCAAAATGCC 
TCAAAATGCC 
TCAAAATGCC 
TCAAAATGCC 
TCAAAATGCC 
TCAAAATGCC 



TTTGGGCAGT 
TTTGGGCAGT 
TTTGGGCAGT 
TTTGGGCAGT 
TTTGGGCAGT 
TTTGGGCAGT 
TTTGGGCAGT 
TTTGGGCAGT 
TTTGGGCAGT 
TTTGGGCAGT 



CAACGAGTAA 
CAACGAGTAA 
CAACGAGTAA 
CAACGAGTAA 
CAACGAGTAA 
CAACGAGTAA 
CAACGAGTAA 
CAACGAGTAA 
CAACGAGTAA 
CAACGAGTAA 



900 

CCGACCTATT 
CCGACCTATT 
CCGACCTATT 
CCGACCTATT 
CCGACCTATT 
CCGACCTATT 
CCGACCTATT 
CCGACCTATT 
CCGACCTATT 
CCGACCTATT 



930 



WO 2004/018646 



PCT/US2003/026827 



Table 60: Comparative Sequences relating t SAG1945 



msa523010. 2(263 JM91130013} CTTTAGATGT TCAAAATGCC TTTGGGCAGT CAACGAGTAA CCGACCTATT 
"~ Consensus ********** ********** ********** ********** ********** 



msa523010.2i 263_C0H1 
msa523010.2 |263_M732 
msa523010 . 2 (263_M781 
msa523010.2| 263_A909 
msa523 0 10 . 2 J 2 6 3_H3 SB 
msa523010.2{263_090 
msa523010.2{263_18RS21 
msa523010.2{263_2603 
msa523010.2(263_CJB110 
msa523010 . 2 {263_1169NT 
msa523010.2{263_JM91130013 
Consensus 



msaS23 010.21 263_COHl 
msa523010-2^ 263_M732 t 
msaS23 0 1 0 . 2 f 2 63_M7 8 1 ' 
msaS23010 . 2 f 263_A909' 
msa523 0 10 . 2 { 2 6 3_H3 6B 
insa523010.2{263_090 
rasa523010 . 2 {263_18RS21 
rosaS23010.2{263_2603 
rasa523010 . 2 { 263_CJB110 
msa523010 . 2 { 263JL169NT 
tnsa523010 .2{263_JM91130013 
Consensus 



901 

CGTAAAGATG 
CGTAAAGATG 
CGTAAAGATG 
CGTAAAGATG 
CGTAAAGATG 
CGTAAAGATG 
CGTAAAGATG 
CGTAAAGATG 
CGTAAAGATG 
CGTAAAGATG 
CGTAAAGATG 



CCCAAACaAG 
CCCAAACaAG 
CCCAAACaAG 
CCCAAACgAG 
CCCAAACgAG 
CCCAAACgAG 
CCCAAACgAG 
CCCAAACgAG 
CCCAAACgAG 
CCCAAACgAG 
CCCAAACgAG 



TAATGGCATG 
TAATGGCATG 
TAATGGCATG 
TAATGGCATG 
TAATGGCATG 
TAATGGCATG 
TAATGGCATG 
TAATGGCATG 
TAATGGCATG 
TAATGGCATG 
TAATGGCATG 



AAAG CTTTA A 
AAAGCTTTAA 
AAAG CTTTA A 
AAAGCTTTAA 
AAAG CTTTA A 
AAAGCTTTAA 
AAAGCTTTAA 
AAAGCTTTAA 
AAAG CTTTA A 
AAAGCTTTAA 
AAAGCTTTAA 



950 

AGGATATcGC 
AGGATATcGC 
AGGATATcGC 
AGGATATtGC 
AGGATAT tGC 
AGGATATtGC 
AGGATATtGC 
AGGATATtGC 
AGGATATtGC 
AGGATATtGC 
AGGATATtGC 



951 

TACTCTTAAA 
TACTCTTAAA 
TACTCTTAAA 
TACTCTTAAA 
TACTCTTAAA 
TACTCTTAAA 
TACTCTTAAA 
TACTCTTAAA 
TACTCTTAAA 
TACTCTTAAA 
TACTCTTAAA 



GAAGATTATC 
GAAGATTATC 
GAAGATTATC 
GAAGATTATC 
GAAGATTATC 
GAAGATTATC 
GAAGATTATC 
GAAGATTATC 
GAAGATTATC 
GAAGATTATC 
GAAGATTATC 



GCTATGTCAC 
GCTATGTCAC 
GCTATGTCAC 
GCTATGTCAC 
GCTATGTCAC 
GCTATGTCAC 
GCTATGTCAC 
GCTATGTCAC 
GCTATGTCAC 
GCTATGTCAC 
GCTATGTCAC 



TAAGCATAAG 
TAAGCATAAG 
TAAGCATAAG 
TAAGCATAAG 
TAAGCATAAG 
TAAGCATAAG 
TAAGCATAAG 
TAAGCATAAG 
TAAGCATAAG 
TAAGCATAAG 
TAAGCATAAG 



1000 
aGCCAAATCC 
aGCCAAATCC 
aGCCAAATCC 
gGCCAAATCC 
gGCCAAATCC 
gGCCAAATCC 
gGCCAAATCC 
gGCCAAATCC 
gGCCAAATCC 
gGCCAAATCC 
gGCCAAATCC 



1001 1035 

msa523010.2{263_COHll TTAAAACCTA TAATCGcATT OGTAGAAATG CTGAT 

msa523010.2 263_M732> TTAAAACCTA TAATCGcATT CGTAGAAATG CTGAT 

msa523010.2 263_M78l) TTAAAACCTA TAATCGcATT OGTAGAAATG CTGAT 

msa523010 .2 263_A909) TTAAAACCTA TAATCGtATT CGTAGAAATG CTGAT 

msa523010.2(263_H36Bj TTAAAACCTA TAATCGtATT CGTAGAAATG CTGAT 

msa523010 .2{263_090j TTAAAACCTA TAATCGtATT CGTAGAAATG CTGAT 

msa523010 .2{263_18RS2lJ TTAAAACCTA TAATCGtATT CGTAGAAATG CTGAT 

tnsa523010.2{263_2603} TTAAAACCTA TAATCGtATT CGTAGAAATG CTGAT 

msa523010.2{263_CJB110} TTAAAACCTA TAATCGtATT CGTAGAAATG CTGAT 

msa523010.2{263_1169NT} TTAAAACCTA TAATCGtATT CGTAGAAATG CTGAT 

msa523010.2{263 JM91130013} TTAAAACCTA TAATCGtATT CGTAGAAATG CTGAT 

Consensus ********** ******-*** ********** ***** 



SSQ ZD NO. 6012 
STRAIN 2603 frame: 1 

MKEKQSKRLIYI LLWSI I PI SVFTYS I SQPSKLLPPKELVILSPNSQAI LTGTI PAFEE 
KYGI KVKLIQGGTGQLI DRLSKBGKQLKADI FFGGNrTOFESHKALFESYVSKNVHTVT P 
DY I HPSDTATP YT I NGSVL I VNNELAKGLT I KS YEDLLQ PSLKGKI AFADPNTS S SAF S Q 
LTNI LLAKGGYTNPKAWNYVKKLQHNI NAI KSSSS SEVYQSVAEGKMI VGLTYEDPSVNL 
QKSGANVSI VYPTEGTVFVPSSVAI I KNAPSMKEAKLFINFMLSLDVQNAFGQSTSNRPI 
RKDAQTSNGMKALKD IATLKED YRYVT KHKGQ I LKTYNRI RRNAD 

SBQ ID NO. 6013 
STRAIN 090 frame: I 

QPSKLLPPKBLVILSPNSQAILTGTI PAFBEKYGI KVKLIQGGTGQLIDRLSKBGKQIiKA 
DI FFGGNYTQFESHKALFBSYVSKNVHTVI PDYI HPSDTATPYT I NGSVLI VNNBLAKGL 
TI KSYEDLLQPSLKGKI AFADPNTS SSAFSQLTN I LLAKGGYTNPKAWNYVKKLQHNINA 
IKSSSSSBVYQSWAEGKMIVGLTYEDPSVNIjQKSGANVSIVYP 

PSMKBAKLFINPMLSIJ3VQNAPGQSTSNRPI RKDAOTSNGMKAIiKDIATIjKEDYRYVTKH 
KGQILKTYNRI RRNAD 

SBQ ZD NO. 6014 
STRAIN A909 frame: 1 

QPSKLLPPKELVI LS PNSQAI LTGT I PAFEEKYG I KVKL I QGGTGQL I DRLS KEGKQLKA 
DI FFGGNYTQPESHKALPESYVSKNIHTVI PDY I HPSDTATPYT I NGSVL I VNNELAKGL 
TIKSYBDLU)PSIiKGKIAFADPNTSSSAPSQLTOTIiIiAKGGYTNPK^ 
IKSSSSSBVYQSVAEGKMIVGLTYEDPSVNLQKSGANVSIVYPTEGTVFVPSSV^ I KNA 
PSMKEAKLF I NFMLS LDVQNAFGQSTSNRP I RKDAQTSNGMKALKD I ATLKEDYRYVTKH 
KGQILKTYNRI RRNAD 

SBQ ZD NO. 6015 
STRAIN H36B frame: 2 

KLI^PKELV I I*S PNSQAI LTCT I PAFEEKYG I KVKL I QGGTC F 
FGGNYTQFESHKALFESYVSKNIHTVI PDY IHPSDTATPYTINGSVLIVNNELVKGLTI K 
SYEDLLQPS LKGKI AFADPNTS SSAFS QLTNI LLAKGGYTNP KAWNYVKKLQHN I NAI KS 
SSSSEVYQS VAEGKM I VGLTYEDPSVNIiQKSGANVS I VYPTEGTVFVPS SVAI I KNAPSM 
KEAKLFINFMLSliDVQNAFGQSTSNPJ>IRKDAGTSNG 
I LKTYNRI RRNAD 

SBQ ZD NO. 6016 



931 



WO 2004/018646 



PCT7US2003/026827 



Table 60: Comparative Sequences relating to SAG1945 



STRAIN 18RS21 frame: 1 

QPSKLLPPKELVILSPNSQAILTGTI PAFEEKYGI KVKL I QGGTGQL I DRLSKEGKQLKA 
DI FFGGNYTQFESHKALFES YVSKNVHTV I PDY I HP SDTATPYT I NGSVL rVNNELAKGL 
T I KS YEDLLQ PS LKG KI AFADPNTS S SAFSQLTN I LLAKGGYTN P KAWNYVKKLQHN I NA 
I KS S S S S EVYQS VAEGKM I VGLTYEDP SVNLQKSGANVS I VYPTEGTVFVPSSVAI I KNA 
PSMKEAKLF I NFMLSLDVQNAFGQSTSNRP I RKDAQTSNGMKALKD I ATLKED YRYVTKH 
KGQ I LKTYNRI RRNAD 

SEQ ZD MO. 6017 
STRAIN M732 frame: 1 

QPSKLLPPKELVI LSPNSQAILTGT I PAFEEKYGI KVKL I QGGTGQLIDRLSKEGKQIiKA 
DIFFGGNYTQFBSHKALFBSYVSKNVHTVI PDYI HPSDTATPYTI NGSVLIVNNELAKGL 
TI KS YEDLLQPSLKGKI AFADPNTSSSAFSQLTNI LLAKGGYTNPK^ INA 
IKSSSSSEVYQSVAEGKMIVGLTYEDPSVNLQKSGANVSIVYPTEGTVFVPSSVAIIKNA 
PSMKEAKLF I NFMLSLDVQNAFGQSTSNRP I RKDAQTSNGMKALKD IATLKEDYRYVTKH 
KSQI LKTYNRI RRNAD 

SEQ ZD NO. 6018 

STRAIN COH I frame: 1 

QPSKLLPPKELVI LSPNSQAILTGT I PAFEEKYGI KVKL I QGGTGQL I DRLSKEGKQLKA 
DI FFGGNYTQFESHKALFESYVSKNVHTVI PDYI HPSDTATPYTINGSVLI VNNELAKGL 
TI KSYEDLLQPSLKGKI AFADPNTSSSAFSQLTNI LLAKGG YTNPKAWNYVKKLQHNI NA 
I KSSSSSEVYQSVAEGKMI VGLTYEDP SVNLQKSGANVS I VYPTEGTVFVPSSVAI I KNA 
PSMKEAKLF I NFML S LDVQNAFGQST SNRP I RKDAQTSNGMKALKD IATLKEDYRYVTKH 
KSQI LKTYNRI RRNAD 

SEQ ZD NO. 6019 
STRAIN M78 1 frame: 1 

QPSKLLP PKELVI LSPNSQAILTGT I PAFEEKYG I KVKL I QGGTGQL I DRLSKEGKQLKA 
DI FFGGNYTQFESHKALFESYVSKNVHTVI PDY I HPSDTATPYTINGSVLI VNNELAKGL 
TIKSYEDIjLQPSLKGKI AFADPNTSSSAFSQLTNI LLAKGG 

IKSSSSSEVYQSVAEGKMI VGLTYEDPSVNLQKSGANVSIVYPTEGTVFVPSSVAI I KNA 
PSMKEAKLF I NFMLSLDVQNAFGQSTSNRP I RKDAQTSNGMKALKD I ATLKED YRYVTKH 
KSQI LKTYNRI RRNAD 

SEQ ZD NO. 6020 

STRAIN CJB110 frames 1 

QPFKLLPPKELVI LS PNSQAI LTGTI PAFEEKYG I KVKL I QGGTGQL I DRLSKEGKQLKA 
DI FFGGNYTQFESHKALFESYVSKNVHTVI PDYI HPSDTATPYTI NGSVL I VNNELAKGL 
TI KSYBDLLQPSLKGKIAFADPNTSS SAFSQLTN I LLAKGGYTNPKAWNYVKKLQHNINA 
IKSSSSSEVYQSVAEGKMIVGLTYEDPSVNLQKSGANVS I VYPTEGTVFVPSSVAI I KNA 
PSMKEAKLF INFMLSLDVQNAFGQSTSNRP I RKDAQTSNGMKALKDIATLKED YRYVTKH 
KGQI LKTYNRI RRNAD 

SEQ ZD NO. 6021 
STRAIN 1 169NT Game: 3 

SQAI LTGTI PAFEEKYG I KVKL I QGGTGQL IDRLS KEGKHLKAD I FFGGNYTQFESHKAL 
FESYVSKNVHTVIPDYIHPSDTATPYTINGSVLI VNNELAKGL^ 

AFADPNTSSSAFSQLTNI LLAKGGYTNPKAWNYVIOCLQHNINAI KSSSSSEVYQSVAEGK 
MIVGLTYEDPSVNLQKSGANVS IVYPTEGTVFVPSSVAI IKNAPSMKEAKLFINFMLSLD 
VQNAFGQSTSNRPIRKDAQTSNGMKALKDIATLKEDYRYV^ 

SEQ ZD NO. 6022 
STRAIN JM91 130013 frame: 1 

QPSKLLPPKELVI LS PNSQAI LTGTI PAFEEKYG I KVKLIQGGTGQLIDRLSKEGKQLKA 
DVFFGGNYTQFESHKALFESYVSKNVHTVI PDYI HPSDTAT PYT I NGSVL I VNNELAKGL 
TI KSYEDLIiQPSLKGKIAFADPNTSSSAFSQLTNILLAKG 

IKSSSSSEVYQSVABGKMIVGLTYEDPSVNIiQKSGANVSIVYPTEGTVFVPSSVM 
PSMKEAKLF I NFMLSLDVQNAFGQSTSNRP I RKDAQTSNGMKALKDIATLKED YRYVTKH 
KGQI LKTYNRI RRNAD 

PRETTY of: /biotmp/msa523117.2{*} April 28. 2003 08?56 



maa523117. 2(263 C30H1] 
msa523117 . 2 ( 263~M732 
msa523117.2{263_M781 
msa523117.2{263_1169NT 
msa523117 . 2 (263 JCJB110 
msa523117.2{263_090 
msa523117.2{263_18RS21 
msa523117.2(263_2603 
mBa523117.2{263_A909 
TOSaS23117 . 2 {263_JM91130013 
msa523117 . 2 { 263_H36B 
Consensus 

insa523 117 . 2 { 263_COHl 
msaS23117. 2(263 M732 
msa523117. 2(263 M781 
msa523117. 2(263 1169NT 



1 50 

q pskllppkel vilspnSQAI 

q pskllppkel vilspnSQAI 

_^ q pskllppkel vilspnSQAI 

SQAI 

q pf kllppkel vilspnSQAI 

q pskllppkel vilspnSQAI 

q pskllppkel vilspnSQAI 

mkekqskrli yillwsiif isvftysisq pskllppkel vilspnSQAI 

Zl q pskllppkel vilspnSQAI 

q pskllppkel vilspnSQAI 

kllppkel vilspnSQAI 

********** ********** *♦**♦*<***- * ** * 

51 100 
LTGTI PAFEE KYGIKVKLIQ GGTGQLIDRL SKEGKqLKAD iFFGGNYTQF 
LTGTI PAFEE KYGIKVKLIQ GGTGQLIDRL SKEGKqLKAD iFFGGNYTQF 
LTGTI PAFEE KYGIKVKLIQ GGTGQLIDRL SKEGKqLKAD iFFGGNYTQF 
LTGTI PAFEE KYGIKVKLIQ GGTGQLIDRL SKEGKhLKAD iFFGGNYTQF 



932 
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msa523117.2{263_CJB110} LTGTIPAFEE 

msa523117.2{263_090 LTGTIPAFEE 

msa523117.2{263 - 18RS21 LTGTIPAFEE 

rasa523117.2{263_2603 LTGTIPAFEE 

msa523117.2(263_A909 LTGTIPAFEE 

msa523117.2{263_JM9X130013 > LTGTIPAFEE 

msa523117.2{263_H36B> LTGTIPAFEE 

Consensus ********** 



KYGIKVKLIQ 
KYGIKVKLIQ 
KYGIKVKLIQ 
KYGIKVKLIQ 
KYGIKVKLIQ 
KYGIKVKLIQ 
KYGIKVKLIQ 



GGTGQLIDRL 
GGTGQLIDRL 
GGTGQLIDRL 
GGTGQLIDRL 
GGTGQLIDRL 
GGTGQLIDRL 
GGTGQLIDRL 



SKEGKqLKAD 
SKEGKqLKAD 
SKEGKqLKAD 
SKEGKqLKAD 
SKEGKqLKAD 
SKEGKqLKAD 
SKEGKqLKAD 



iFFGGNYTQF 
iFFGGNYTQF 
iFFGGNYTQF 
iFFGGNYTQF 
iFFGGNYTQF 
vFFGGNYTQF 
iFFGGNYTQF 



101 

msa523117 .2f 263_COHl) ESHKALFESY 

msa523117.2{263_M732 ESHKALFESY 

msa52 3 117.2(2 63J47 8 1 J ESHKALFESY 

msa523117.2(263_1169NT ESHKALFESY 

msa523117 . 2 (263_CJB110 ESHKALFESY 

Tnsa523117 . 2 {263_090} ESHKALFESY 

msa523117.2{263_18RS21 ESHKALFESY 

msaS23117.2{263_2603 ESHKALFESY 

msa523117.2(263_A909 ESHKALFESY 

msa523117 . 2 {263_JM91130013 ESHKALFESY 

rasa523117.2{263_H36B) ESHKALFESY 

Consensus ********** 



VSKNvHTVIP 
VSKNvHTVIP 
VSKNvHTVIP 
VSKNvHTVIP 
VSKNvHTVIP 
VSKNvHTVIP 
VSKNvHTVIP 
VSKNvHTVIP 
VSKNiHTVIP 
VSKNvHTVIP 
VSKNiHTVIP 



DYIHPSDTAT 
DY I HPSDTAT 
DYIHPSDTAT 
DYIHPSDTAT 
DYIHPSDTAT 
DYIHPSDTAT 
DYIHPSDTAT 
DYIHPSDTAT 
DYIHPSDTAT 
DYIHPSDTAT 
DYIHPSDTAT 



PYTINGSVLI 
PYTINGSVLI 
PYTINGSVLI 
PYTINGSVLI 
PYTINGSVLI 
PYTINGSVLI 
PYTINGSVLI 
PYTINGSVLI 
PYTINGSVLI 
PYTINGSVLI 
PYTINGSVLI 



150 

VNNELaKGLT 
VNNELaKGLT 
VNNELaKGLT 
VNNELaKGLT 
VNNELaKGLT 
VNNELaKGLT 
VNNELaKGLT 
VNNELaKGLT 
VNNELaKGLT 
VNNELaKGLT 
VNNELvKGLT 



151 

msa523117 .2{263_COHl) IKSYEDLLQP 

msa523117.2(263_M732 IKSYEDLLQP 

msa523117.2i263_M7Bl IKSYEDLLQP 

msa523117.2{263_1169NT IKSYEDLLQP 

msa523117.2(263_CJB110 IKSYEDLLQP 

msa523117.2{263_090 IKSYEDLLQP 

msa523117.2{263_18RS21 IKSYEDLLQP 

msa523117.2{263_2603 IKSYEDLLQP 

tnsa523117.2(263_A909 IKSYEDLLQP 

msa523117.2{263_JM91130013 IKSYEDLLQP 

msa523117 .2{263_H36B) IKSYEDLLQP 

Consensus ********** 



SLKGKIAFAD 
SLKGKIAFAD 
SLKGKIAFAD 
SLKGKIAFAD 
SLKGKIAFAD 
SLKGKIAFAD 
SLKGKIAFAD 
SLKGKIAFAD 
SLKGKIAFAD 
SLKGKIAFAD 
SLKGKIAFAD 



PNTSSSAFSQ 
PNTSSSAFSQ 
PNTSSSAFSQ 
PNTSSSAFSQ 
PNTSSSAFSQ 
PNTSSSAFSQ 
PNTSSSAFSQ 
PNTSSSAFSQ 



PNTSSSAFSQ 
PNTSSSAFSQ 



LTNILLAKGG 
LTNILLAKGG 
LTNILLAKGG 
LTNILLAKGG 
LTNILLAKGG 
LTNILLAKGG 
LTNILLAKGG 
LTNILLAKGG 
LTNILLAKGG 
LTNILLAKGG 
LTNILLAKGG 



200 

YTNPKAWNYV 
YTNPKAWNYV 
YTNPKAWNYV 
YTNPKAWNYV 
YTNPKAWNYV 
YTNPKAWNYV 
YTNPKAWNYV 
YTNPKAWNYV 
YTNPKAWNYV 
YTNPKAWNYV 
YTNPKAWNYV 



msa52 3 117 . 2 ( 2 63_COHl ] 
msa523117.2(263_M732 ( 
msa523117 .2(263 JM781 
rasa523117 . 2 { 263_1169NT 
msa523 117 .2(2 63_CJB110 
msa523 117 . 2 { 263JD 90 
msa523117.2{263_18RS21 
msa523117 . 2 { 263_2603 
msa523117.2{263_A909 
msa523117.2{263_JM91130013 
msa523117.2{263_H36B 
Consensus 



msa523117.2(263_COHi; 
msa523117 . 2 { 263_M732 
msa523117 . 2 (263_M7B1 
msa523117.2(263 1169NT 
msa523117.2{263~CJB110 
tnsa523117 . 2 { 263_090 
msa523117.2{263_18RS21 
msa523117.2{263 2603 
msa52 3 117 . 2 { 2 63]]A9 0 9 
msa523117.2{263 JM91130013 
msa523117.2{263__H36B 
Consensus 



msa523 117 . 2 { 2 63_C0H1 
msa523117 . 2 I 263_M732 
msa523117.2{263JM781 
insaS23117 . 2 { 263_1169NT 
rasa52 3117.2(2 63_CJB110 
insa523117 . 2 { 263_090 
msa523117 . 2 ( 263JL8RS21 
msa523117. 2(263 2603 
msa523117 ,2(263_A909 
rasa523117.2{263_JM91130013 
msa523U7 , 2 { 263_H36B| 
Consensus 



201 

KKLQHNINAI 
KKLQHNINAI 
KKLQHNINAI 
KKLQHNINAI 
KKLQHNINAI 
KKLQHNINAI 
KKLQHNINAI 
KKLQHNINAI 
KKLQHNINAI 
KKLQHNINAI 
KKLQHNINAI 



KSSSSSEVYQ 
KSSSSSEVYQ 
KSSSSSEVYQ 
KSSSSSEVYQ 
KSSSSSEVYQ 
KSSSSSEVYQ 
KSSSSSEVYQ 
KSSSSSEVYQ 
KSSSSSEVYQ 
KSSSSSEVYQ 
KSSSSSEVYQ 



SVAEGKMIVG 
SVAEGKMIVG 
SVAEGKMIVG 
SVAEGKMIVG 
SVAEGKMIVG 
SVAEGKMIVG 
SVAEGKMIVG 
SVAEGKMIVG 
SVAEGKMIVG 
SVAEGKMIVG 
SVAEGKMIVG 



LTYEDPSVNL 
LTYEDPSVNL 
LTYEDPSVNL 
LTYEDPSVNL 
LTYEDPSVNL 
LTYEDPSVNL 
LTYEDPSVNL 
LTYEDPSVNL 
LTYEDPSVNL 
LTYEDPSVNL 
LTYEDPSVNL 



250 

QKSGANVSIV 
QKSGANVSIV 
QKSGANVSIV 
QKSGANVSIV 
QKSGANVSIV 
QKSGANVSIV 
QKSGANVSIV 
QKSGANVSIV 
QKSGANVSIV 
QKSGANVSIV 
QKSGANVSIV 



251 

YPTEGTVFVP 
YPTEGTVFVP 
YPTEGTVFVP 
YPTEGTVFVP 
YPTEGTVFVP 
YPTEGTVFVP 
YPTEGTVFVP 
YPTEGTVFVP 
YPTEGTVFVP 
YPTEGTVFVP 
YPTEGTVFVP 



SSVAIIKNAP 
SSVAIIKNAP 
SSVAIIKNAP 
SSVAIIKNAP 
SSVAIIKNAP 
SSVAIIKNAP 
SSVAIIKNAP 
SSVAIIKNAP 
SSVAIIKNAP 
SSVAIIKNAP 
SSVAIIKNAP 



SMKBAKLFIN 
SMKEAKLFIN 
SMKBAKLFIN 
SMKEAKLFIN 
SMKEAKLFIN 
SMKBAKLFIN 
SMKBAKLFIN 
SMKEAKLFIN 
SMKEAKLFIN 
SMKEAKLFIN 
SMKEAKLFIN 



FMLSLDVQNA 
FMLSLDVQNA 
FMLSLDVQNA 
FMLSLDVQNA 
FMLSLDVQNA 
FMLSLDVQNA 
FMLSLDVQNA 
FMLSLDVQNA 
FMLSLDVQNA 
FMLSLDVQNA 
FMLSLDVQNA 



300 

FGQSTSNRPI 
FGQSTSNRPI 
FGQSTSNRPI 
FGQSTSNRPI 
FGQSTSNRPI 
FGQSTSNRPI 
FGQSTSNRPI 
FGQSTSNRPI 
FGQSTSNRPI 
FGQSTSNRPI 
FGQSTSNRPI 



301 

RKDAQTSNGM 
RKDAQTSNGM 
RKDAQTSNGM 
RKDAQTSNGM 
RKDAQTSNGM 
RKDAQTSNGM 
RKDAQTSNGM 
RKDAQTSNGM 
RKDAQTSNGM 
RKDAQTSNGM 
RKDAQTSNGM 



KALKDIATLK 
KALKDIATLK 
KALKDIATLK 
KALKDIATLK 
KALKDIATLK 
KALKDIATLK 
KALKDIATLK 
KALKDIATLK 
KALKDIATLK 
KALKDIATLK 
KALKDIATLK 



EDYRYVTKHK 
BDYRYVTKHK 
EDYRYVTKHK 
EDYRYVTKHK 
BDYRYVTKHK 
EDYRYVTKHK 
BDYRYVTKHK 
BDYRYVTKHK 
EDYRYVTKHK 
BDYRYVTKHK 
EDYRYVTKHK 



SQILKTYNRI 
SQILKTYNRI 
SQILKTYNRI 
gQILKTYNRI 
gQILKTYNRI 
gQILKTYNRI 
gQILKTYNRI 
gQILKTYNRI 
gQILKTYNRI 
gQILKTYNRI 
gQILKTYNRI 



345 
RRNAD 
RRNAD 
RRNAD 
RRNAD 
RRNAD 
RRNAD 
RRNAD 
RRNAD 
RRNAD 
RRNAD 
RRNAD 
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Table 61: Comparative Sequences relating to SAG1030 



SEQ ZD NO. 6101 
STRAIN 2603 

ATGGTAAAAGTTAGTGTAAGTTCnOTAGGAACra^ 

TTTA(jrCGTGTATCX^CTrrAAATGATG CAATAACAAAACT ATCATCTTTTG CAGAGGCT 
GCAACTCTTCAAGGGACTG CTT ATTCAAATGCAAAAAGCTATGCTACTGGAA.CX3TTAACT 
CCGATGCTTCAAGGAATGATTCTTTTCTCTGAAAC^ 
CAAACCTTATATGTCTC^TTTGTGGTGATGAGG^ 

AAATTAGCAAGTGATAGGGCATCATTAAAGATTGCTGAAG CACTTTTAGAGCATCTTAAC 

GATGATCCAGAACCTTCCAAATCTGCCATAAGTTCT 

AAAAAACXTTATAAAATCTAATCAAAAGAAATTAGACAACC^ 

TCAGCAACAGTATTTGCGGACATTTCTAATGCAC^ 

GCTGTTTCAAC^GGATTTTCTGGATATAATAGTAAAACCGKaAG 

TCCGGACAG ATGGAATG GACAAAGACAGTTAAGAAGAATTGGAAAGAG CG AGAAGACG CC 
AAAGCTGAAGAACrGAAAAGTAAAAAGGCTGAAGAAAGTAAGAAAGCT^ 
AATACTACTAAAAAAAGTAATGTTTCAGTTOATAAAAAGAA 
GAAG CCTATAAATTAGGAGAAATTAAAAAAGATACCTATGA 

AGTAATGCATCGGCTGCCTTACTTAAAGAGGTAG CTAAATCAAAATTGACTGACACAGCT 
CGGCTATTGATG 

SEQ ZD NO. 6102 

STRAIN 090 

TTAAATGATGCAATAACAAAACTATCATCTTTTGCAGAGGCT 

GCAACTCTTCAAGGGACTGCTTATTCAAATGCAAAA 

AACGTTAACTCCGATGCTTCAAGGAATGATTCT^ 

GTGAGAAATGTACAGAATTACAAACCTTATATGTCT 

GAGGATTTAGACTCTGTCGTTTTAGAATCA 

ATCATTAAAGATTG CTGAAGCACTTTTAGAGCATCTTAAaSATGATCCAG 
AACCTTCCAAATCTGCCATAAGTTGTACAAAAAGTAATATTAAAAAAT^ 
AAAAAACGTATAAAATCTAATCAAAAGAAATTAGACAACCTTAATGAATT 
TAACGCX^CATTCAGCAACAGTATTTGCGGAC^ 

AGTAAAACCGGAGCTTTTGGAAAACCAACATCCGG^ 

AAAGACAGTTAAGAAGAATTGGAAAGAGCGAGAAGAOX: CAAAGCT^ 

AACTGAAAAOTAAAAAGGCTGAAGAAAGTAAGAAAGCTTCAAAAATTGAA 

AATACTACrAAAAAAAGTAATGTTTCAGTTGATAAAAAGAAATTAATAAA 

AGCGGCTAATGAAGCGTATAAATTAGGAGAAATTAAAAAAGATACCTATG 

AATCAATTATCAGTGGTTTAAGTAATG CATCGGCTGCCTTACTTAAAGAG 

GTAGCTAAATCAAAATTGACTCACACAGCTCGGCTA 

SEQ ZD NO. 6103 
STRAIN 18RS21 

TTAAATGATGCAATAACAAAACrATCATCTTTTG CAGAGGC 

TGCAACTCTTCAAGGGACTGCTTATTCAAATGCAA^ 

GAACGTTAACTCCGATGCTTCAAGGAATGATTCTTT^ 

AGTGAGAAATGTACAGAATTACAAACCTTATATGTCTC^^ 

TGAGGATTTAGACTCTGlXJG'l'rrrAGAATCAAAATTAG CAAGTGATAGGG 

CATCATTAAAGATTGCTGAAGCACITTTAGAGCATCT^ 

GAACCTTCCAAATCTGCCATAAGTTCTACAAAAAGTAATATTAAA 

AAAAAAAOGTATAAAATCTAATCAAAAGAAATTAGACAACCTTAA 

TTAACGCCCATTCAGCAACAGTATTTGCGGACATTTCT 

ACTGTTAACCAAGCACTAGCGGCTGTTTCAACAGGAri^ 

TAGTAAAACXTGGAGCITTTGGAAAACCAACATCCGG^ 

CAAAGAC^VGTTAAGAAGAATTGGAAAGAGCGAGAAGAC^ 

GAACTGAAAAGTAAAAAGGCTGAAGAAAGTAAGAAAGCTTCAAA 

AAATACTACTAAAAAAAGTAATGTTTCAGTTGATAAAAAGAAATTAATAA 

AAGCGGCTAATGAAGCGTATAAATTAGGAGAAATTA^ 

GAATCAATTATCAGTGGTTTAAGTAATGCATCGG CTGCCTTACTTAAAGA 

GGTAGCTAAATCAAAATTGACTGACACAGCTCGGC^ 

PRETTY of t /biotmp/msal85066.2{*) May 13, 2003 07i01 

1 50 . 

msal85066.2{270_090) 

msal85066.2{270_18RS21) 

msal85066.2{270_2603} atggtaaaag ttagtgtaag ttctgtagga actcaagcat caacagtagc 
Consensus ********** ********** ********** ********** ********** 

51 100 

msal85066.2{270 090} TT AAATGATGCA ATAACAAAAC 

msal85066.2{270_18RS2l) TT AAATGATGCA ATAACAAAAC 

rasal85066.2{270_2603} tatttctatg tttagtcgtg tatcggctTT AAATGATGCA ATAACAAAAC 
Consensus ********** ********** ********** ********** ********** 

101 150 
ntsal85066.2{270_090} TATCATCTTT TGCAGAGGCT GCAACTCTTC AAGGGACTGC TTATTCAAAT 
msal85066.2{270_18RS2l) TATCATCTTT TGCAGAGGCT GCAACTCTTC AAGGGACTGC TTATTCAAAT 
rasal85066.2{270_2603) TATCATCTTT TGCAGAGGCT GCAACTCTTC AAGGGACTGC TTATTCAAAT 
Consensus ********** ********** ********** ********** ********** 

151 200 
msal85066.2{270 090) GCAAAAAGCT ATGCTACTGG AACGTTAACT CCGATGCTTC AAGGAATGAT 
ma al8 5066. 2 {270 18RS21J GCAAAAAGCT ATGCTACTGG AACGTTAACT CCGATGCTTC AAGGAATGAT 
msal85066.2{270 2603} GCAAAAAGCT ATGCTACTGG AACGTTAACT CCGATGCTTC AAGGAATGAT 
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Consensus ********** ********** ********** 

201 250 
msal85066. 2(270 090} TCTTTTCTCT GAAACATTGA GTGAGAAATG TACAGAATTA CAAACCTTAT 
msal85066.2{270 18RS21) TCTTTTCTCT GAAACATTGA GTGAGAAATG TACAGAATTA CAAACCTTAT 
tnsal85066.2{270_2603> TCTTTTCTCT GAAACATTGA GTGAGAAATG TACAGAATTA CAAACCTTAT 
Consensus ********** ********** ********** ********** ********** 



msal85066.2{270J)90} 
msal85066.2{27 0 - .18RS21> 
msal85066.2{270_2603} 
Consensus 



msal85066 . 2 { 270_090 J 
msa!85066 . 2 { 270_18RS2l) 
msal85066 . 2{270_2603 } 
Consensus 



msal85066.2{270_090) 
msal85066.2{270_18RS21> 
insal85066.2{270_2603} 
Consensus 



msal85066.2{270_090) 
msalB5066 . 2 {270JL8RS21 J 
msal85066 . 2 { 270_2603 } 
Consensus 



msal85066 . 2 { 270_090 } 
msal85066.2{270_18RS21> . 
msal85066.2{270_2603} 
Consensus 

msal85066. 2 { 270^090 } 
msai850 66 . 2 { 270_18RS21 J 
msal85066 . 2 {270J2603 } 
Consensus 

rasal85066 . 2 { 270_090 } 
msal85066 . 2 { 270_18RS21 } 
msal85066.2{270_2603) 
Consensus 



251 



300 



ATGTCTCAAT TTGTGGTGAT GAGGATTTAG ACTCTGTCGT TTTAGAATCA 
ATGTCTCAAT TTGTGGTGAT GAGGATTTAG ACTCTGTCGT TTTA GAATCA 
ATGTCTCAAT TTGTGGTGAT GAGGATTTAG ACTCTGTCGT TTTAGAATCA 

301 350 

AAATTAGCAA GTGATAGGGC ATCATTAAAG ATTGCTGAAG CA CTTTTA GA 
AAATTAGCAA GTGATAGGGC ATCATTAAAG ATTGCTGAAG CACTTTTAGA 
AAATTAGCAA GTGATAGGGC ATCATTAAAG ATTGCTGAAG CACTTTTAGA 



351 400 
GCATCTTAAC GATGATCCAG AACCTTCCAA ATCTGCCATA AGTTCTACAA 
GCATCTTAAC GATGATCCAG AACCTTCCAA ATCTGCCATA AGTTCTACAA 
GCATCTTAAC GATGATCCAG AACCTTCCAA ATCTGCCATA AGTTCTACAA 



401 450 
AAAGTAATAT TAAAAAATTA AAAAAACGTA TAAAATCTAA TCAAAAGAAA 
AAAGTAATAT TAAAAAATTA AAAAAACGTA TAAAATCTAA TCAAAAGAAA 
AAAGTAATAT TAAAAAATTA AAAAAACGTA TAAAATCTAA TCAAAAGAAA 



451 5°° 

TTAGACAACC TTAATGAATT TAACGCCCAT TCAGCAACAG TATTTGCGGA 
TTAGACAACC TTAATGAATT TAACGCCCAT TCAGCAACAG T ATTTG CGGA 
TTAGACAACC TTAATGAATT TAACGCCCAT TCAGCAACAG TATTTGCGGA 

501 550 
CATTTCTAAT GCACAGTCAA CTGTTAACCA AGCACTAGCG GCT GTTTC AA 
CATTTCTAAT GCACAGTCAA CTGTTAACCA AGCACTAGCG GCTGTTTCAA 
CATTTCTAAT GCACAGTCAA CTGTTAACCA AGCACTAGCG GCTGTTTCAA 

551 600 

CAGGATTTTC TGGATATAAT AGTAAAACCG GAG CTTTTG G AAAACCAACA 
CAGGATTTTC TGGATATAAT AGTAAAACCG GAG CTTTTG G AAAACCAACA 
CAGGATTTTC TGGATATAAT AGTAAAACCG GAGCTTTTGG AAAACCAACA 



601 650 
TCCGGACAGA TGGAATGGAC AAAGACAGTT AAGAAGAATT GGAAAGAGCG 
TCCGGACAGA TGGAATGGAC AAAGACAGTT AAGAAGAATT GGAAAGAGCG 
msali 5066 '2{270_2 603} TCCGGACAGA TGGAATGGAC AAAGACAGTT AAGAAGAATT GGAAAGAGCG 
Consensus ********** ********** ********** ********** ********** 



msa!85066 . 2 { 270_090 ) 
msal85066.2{270_18RS21J 



msal85066 ,2 {270_090) 
rasal85066.2{270_18RS21> 
msal85066.2{270_2603) 
Consensus 



nisalS 5 0 66. 2 { 27 0_090 J 
msal85066.2{270_18RS21J 
mBal85066.2{270_2603} 
Consensus 



msal85066.2{270_090> 
msa!85066.2{270 18RS21V 
msal85066 . 2 { 270_2603 } 
Consensus 



msal85066.2{270_090j 
mBal85066.2{270_18RS21> 
rasal85066 . 2 { 270_2603 } 
Consensus 



651 700 
AGAAGACGCC AAAGCTGAAG AACTGAAAAG TAAAAAGGCT GAAGAAAGTA 
AGAAGACGCC AAAGCTGAAG AACTGAAAAG TAAAAAGGCT GAAGAAAGTA 
AGAAGACGCC AAAGCTGAAG AACTGAAAAG TAAAAAGGCT GAAGAAAGTA 



701 750 
AGAAAGCTTC AAAAATTGAA AATACTACTA AAAAAAGTAA T GTTTC AGTT 
AGAAAGCTTC AAAAATTGAA AATACTACTA AAAAAAGTAA TGTTTCAGTT 
AGAAAGCTTC AAAAATTGAA AATACTACTA AAAAAAGTAA TGTTTCAGTT 



751 6°° 
GATAAAAAGA AATTAATAAA AGCGGCTAAT GAAGCGTATA AATTAGGAGA 
GATAAAAAGA AATTAATAAA AGCGGCTAAT GAAGCGTATA AATTAGGAGA 
GATAAAAAGA AATTAATAAA AGCGGCTAAT GAAGCGTATA AATTAGGAGA 

801 850 
AATTAAAAAA GATACCTATG AATCAATTAT CAGTGGTTTA AGTAATGCAT 
AATTAAAAAA GATACCTATG AATCAATTAT CAGTGGTTTA AGTAATGCAT 
AATTAAAAAA GATACCTATG AATCAATTAT CAGTGGTTTA AGTAATGCAT 



msal85066. 2 {270_090} 
msa!85066 . 2 { 270_18RS21 } 



851 900 
CGGCTGCCTT ACTTAAAGAG GTAGCTAAAT CAAAATTGAC TGACACAGCT 
CGGCTGCCTT ACTTAAAGAG GTAGCTAAAT CAAAATTGAC TGACACAGCT 
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msal85066 . 2 {270_2603 } 
Consensus 



CGGCTGCCTT ACTTAAAGAG GTAGCTAAAT CAAAATTGAC TGACACAGCT 



maal85066.2{270_090) 
msal8S066 . 2 {270_18RS21 J 
msal85066 . 2 { 270_2603 } 
Consensus 



901 912 
CGGCTATTGA TG 
CGGCTATTGA TG 
CGGCTATTGA TG 



SEQ ID NO. 6104 
STRAIN 2603 frame: 1 

MVKVSVS SVGTQASTVA I SMFS RVSALNDAIT KLS S FAEAATLQGTAYSNAKS YATGTLT 
PMLQGMILFSETLSEKCTELQTLYVSICGDEDI^SVVLESKIiASDRASIiKIAE 
DDPEPSKSAI SSTKSNI KKLKKRI KSNQKKLDNLNEFNAHSATVFADI SNAQSTVNQAIA 
AVSTGFSGYNSKTGAFGKPTSGQMEWTKTVKKNWKEREDAKAEELKSKKA 



RLLM 

SEQ IB NO. 6105 
STRAIN 090 frame: 1 

LNDAITKLSS FAEAATLQGTAYSNAKS YATGTLT PMLQGM I L FSETLSEKCTELQTLYVS 
ICGDEDXJ3SWLESKX»ASDRASLKIAEALLEHLNDDPEPSKSAISSTK^ 
NQKKLDNLNEFNAHSATVFADI SNAQSTVNQALAAVSTGFSGYNS KTGAFGKPTSGQME W 
TKTVKKNWKEREDAKAEELKSKKAEESKKASKI ENTTKKSNVS VDKKKL I KAANEAYKLG 
EIKKDTYESI ISGLSNASAALLKBVAKSKLTDTARLLM 

SEQ ID NO. 6106 
STRAIN 18RS21 frame: 1 

LNDAI TKLSS FAEAATLQGTAYSNAKS YATGTLTPMLQGM I LFS K 

I CGDEDLDS WLES KLASDRASLKI AEALLEHLNDDPEPSKS AI S STKSN I KKLKKR I KS 
NQKKLDNLNEFNAHSATVFADI SNAQSTVNQALAAVSTGFSGYNS KTGAFGKPTSGQME W 
TKTVKKNWKBREDAKABELKSKKAEBSKKASKIENTTK^ KAANEAYKLG 
EI KKDT YESI ISGLSNASAALLKBVAKSKLTDTARLLM 
PRETTY of : /biotmp/msal8518i.2{*} May 13, 2003 07:03 

1 50 

msal85181.2{270_090} LNDA ITKLSSFAEA ATLQGTAYSN 

msal85181.2{270_18RS2lJ LNDA ITKLSSFAEA ATLQGTAYSN 

msaie 5181. 2 { 270_2603} mvkvsvssvg tqastvaism fsrvsaLNDA ITKLSSFAEA ATLQGTAYSN 
Consensus ********** ********** ********** ********** ********** 



msal85181.2{270_090} 
msal85181.2{270_18RS21J 
msal8 518 1 . 2 { 270_2603 } 
Consensus 



51 100 
AKSYATGTLT PMLQGMILFS ETLSEKCTEL QTLYVSICGD EDLDSWLES 
AKSYATGTLT PMLQGMILFS ETLSEKCTEL QTLYVSICGD EDLDSWLES 
AKSYATGTLT PMLQGMILFS ETLSEKCTEL QTLYVSICGD EDLDSWLES 



msal85 18 1.2 {270^090} 
msal 8 51 8 1 . 2 { 2 7 0JL 8RS2 1 J 
msal85181.2{270_2603} 
Consensus 



101 150 
KLASDRASLK IAEALLEHLN DDPEPSKSAI SSTKSNI KKL KKRIKSNQKK 
KLASDRASLK IAEALLEHLN DDPEPSKSAI SSTKSNI KKL KKRIKSNQKK 
KLASDRASLK IAEALLEHLN DDPEPSKSAI SSTKSNI KKL KKRIKSNQKK 



msal85181 . 2 {270_090 } 
msal85181.2{270 18RS21J 
msaie 518 1 . 2 { 270_2 603 } 
Consensus 



151 200 
LDNLNEFNAH SATVFADISN AQSTVNQALA AVSTGFSGYN SKTGAFGKPT 
LDNLNEFNAH SATVFADISN AQSTVNQALA AVSTGFSGYN SKTGAFGKPT 
LDNLNEFNAH SATVFADISN AQSTVNQALA AVSTGFSGYN SKTGAFGKPT 



msal85181.2{270_090) 
msal85181.2{270_18RS21J 
msal85181.2{270_2603} 
Consensus 



msal85181.2{270 090} 
msal85181.2{270_18RS21) 
msal85181 . 2 { 270_2603 } 
Consensus 



201 250 
SGQMEWTKTV KKNWKEREDA KAEELKSKKA EESKKASKIE NTTKKSNVSV 
SGQMEWTKTV KKNWKEREDA KAEELKSKKA EESKKASKIE NTTKKSNVSV 
SGQMEWTKTV KKNWKEREDA KAEELKSKKA EESKKASKIE NTTKKSNVSV 

251 300 
DKKKLIKAAN EAYKLGEIKK DTYBSIISGL SNASAALLKE VAKSKLTDTA 
DKKKLIKAAN EAYKLGEIKK DTYBSIISGL SNASAALLKE VAKSKLTDTA 
DKKKLIKAAN EAYKLGEIKK DTYBSIISGL SNASAALLKE VAKSKLTDTA 



msal 8 5 18 1 . 2 { 27 0_0 90 ) 
msal85181.2.{270_18RS21J 
msal85181.2{270_2603} 
Consensus 



301 
RLLM 
RLLM 
RLLM 
♦ *** 
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Table 62: Comparative Sequences relating to SAG0690 



SEQ ZD NO. 6201 
STRAIN 2603 

ATGATTTTAAAAATTTGTCGTG CAG CATAT AGTTTA CAATGGGG AGGTGTTTAC CAATT A 
GCTTTCCTGGATTATCCTCGAATTAAGGCGTTTGAA^ 

GCTTACGAGAAACAATATAAAAGAAAAACTGAGATACAATGTGACGATAAACATC^ 
GCAAAAATTGTTCATTTTTTAAAATACAATAGTTTO 

AGAGAAG CGG CAGCTACTTTTAATGAGGATGGTATrAGTTTAACTTCTG^ 

CATACATGTACGATTGAAACTGCAAAACT AATTTTTAAAGAA CTTATCAGCA 

GTTAAAGCCTTTAATAAGCCTGCTGAAGTACTGGTAAAAGATAAGAGGAATC 

GACCCTAAAGATTACiU"It3ACTATGTGATGTTGAACTGG 

CGTTTAGTAATGGAAAGATTGTTAGGCAAAGCACCATCTGAACAGG^ 

TTTAAGCCAGGGOTCAGTTTTCATTTTACCT^ 

ATTTTTGATGGTTATCATCCTGCTAAAATTAAA 

GTTGCATGTGTTATCCCAAAACATTATCAAGAAGATTATCAA^ 

TTGAAACACAGGGTTTATTATTTAGATTACT 

AAAGTTTATGATTTTCTTTGTCATTTGGAAAATAAA 

SEQ XD NO. 6202 
STRAIN 090 

TGGATTATCCTCTAATTAAGGCGTTTGAATTGGA CTTTC 
TAAACATCTCCTCACAAAAATTGTTCATTTTT^ 

CTTTTCCCTATATTCCCAAATATAGAGAAG CGGCAG CTACTTTTAATGAG 
GATGGTATTAGTTTAACTTCIt3ATTTTTTAAGCC^ 

AACTGCAAAACTAATTTTTAAAGAAGGTAAAATCTTATCAG CAGTTAAAG 
CCTTTAATAAGCCTG CTGAAGT ACTGGTAAATGATAAGAGGAATG CTGCT 
GGAGACCCTAAAGATTAC1T1X1ACTATG7 

CAAl"rClt3GTTATCui"l"rAGTAATGGAAAGATTGTTAGG CAAAGCACCAT 

CTOAACAGGAGTTAACAGTAGCTrrTAAGCCAGGGCT 

AATTaTCAAGATATCATCAATCATCCTGATTCTATTTTTG^ 

TCCTGCTAAAATTAAAAATCAACTTTCTTTAGCAG 

GTGTTATCCCAAAACATTATCAAGAAGATTATCAAAGariTO 

GACTTGAAACACAGAGTTTATTATTTAGATTACTGT 

TGAGTGGAATCAAAAAGTTTATGATTTTCTT^ 



SEQ XD NO. 6203 
STRAIN A909 

TTGCTGGATTATCCTCGAATTAAGGCGTT^ 

GGAGCTTTCATAGCTTACGAGAAACAATATAAAAGAAAAATTGAGATACA 
ATGTGACGATAAACATCrCCTCACAAAAATTGTT CATTTTTTAAAATACA 
ATAGTTTTACTTTTCCCTATATTCCHrAAATATA 
TTTAATGAGGATGGTATTAGTTTAACTTCTG 

TACGATTGAAACrcC!AAAACTAA T i"riU"JL T AAAGAAGGTAAAATCTTATCAG 
CAGTTAAAGCCTTTAATAAGCCTGCTGAAGTACrc 
AATGCTGCTGGAGACCCTAAAGATTACTTTtaCTATC 
GTCAAATACCAATTCTGGTTATCGTT^ 

AAGCACCATCTGAACAGGAGTTAACAGTAG CTTTTAAG CCAGGGGTCAGC 

TTTCATTTTAATTATCAAGATATCATGAATCATC 

TGGTTATCATCCTGCTAAAATTAAAAATCAACIT^ 

TAG?ITGCATGTGTTATCCCAAAACATTATCAAGAA^ 

GTGCCTAATGACTTGAAACACAGAGTTTATTATTTAGAT^ 

AACACTTTATGAGTGGAATCAAAAAGTTTATGATTTTCrTTGT 

AAAATAAA 



SEQ XD NO. 6204 
STRAIN H36B 

TTAAGGGGTTTGAATTGGAAAGGATAGGAGCTTTCA 

CAATATAAAAGAAAAATTGAGATACAATGTGACG^ 

AAAAATTGTTO^TTTTTTAAAATACAATAGTTTTACT 

CCAAATATAGAGAAGCGGCAGCTAU"ri"i w iAATGAGGATGGTATTAG , l > 'rrA 

ACTTCTGATTTTTT AAG CCATACATGTACGATTGAAACTGCAAAACTAAT 

TTTTAAAGAAGGTAAAATCTTATCAGCAGTTAAAGCCTTTAATAAGCCTG 

CTGAAGTACTGGTAAATGATAAGAGGAATGCTGCT^^ 

TACTTTGACnTVTGTGATGTTGAACTGGTCAAA 

TTTAGT AATGGA AAGATTGTTAGGC AAAG C ACCAT CTGAACAGGAGTTA^ 

CAGTAGCTTTTAAGOIAGGGGTCAGCITTC^ 

ATCAATCATCCTCATTCTATTTTTGATGg 

AAATCAACTTTCTTTAGCAGAAC^TTrAGTTGCATG^ 

ATTATCAAGAAQATTATCAAAGCCITGTGCCTAATGACTTGAAA 

GTTTATTATTTAGATTACTGTAACGAAACACTTTATCA 



SEQ ID NO. 6205 
STRAIN 18RS21 

TTGCTGGATTATCCTCGAATTAAGGCGTT 

TGAATTGGAAAGGATAGGAGCTTTCATAGCTTACGAGAAACAATA 

GAAAAACTGAGATACAATGTGACXIATAAACATCTCCT^ 

CAUU'IUTIAAAATACAATAGIU'IU'ACITITCCCTATATTCCCAAATATAG 

AGAAGGGGCAGCTACTTTTAATGAGGATG^ 

TTTrAAGCCATACATCTACGATTGAAACTCCAAAACT 

GGTAAAATCTTATCAGCAGTTAAAGCCTITAATAAG^ 

GGTAAAAGATAAGAGGAATGCTGCTCGAGACCCT^ 

ATGTGATGTTGAACTGGTCAAATACCAATTCTGGTTATCG 



937 



WO 2004/018646 



PCT7US2003/026827 



Table 62: Comparative Sequences relating to SAG0690 



GAAAGATTGTTAGGCAAAGCACC^T 

TAAGCCAGGGGTCAGTTTTCATTTTACTTATCAAGATATCA 

CTGATTCTATTTTTGATGGTTATCATCCTGCTAAAATTAAAA^ 

TCTTTAGCAGAACATTTAGTTGCATGTGITA^ 

AGATTATCAAAGCCITGTGCCCAATGACnTC 

TAGATTACTGTAACGAAACACTTTATGAGTGGAAT^ 

TTTCTTTGTCATTTG GAAAATAAA 

SEQ ID NO. 6206 
STRAIN M732 

TTGCTGGATTATCCTCGAATTAAGG CGTT 

TGAATTGGAAAGGATAGGAGCTTTCATAGCrTA^ 

GAAAAACTGAGATACAATGTGACXIATAAACATCT 

CATTTTTTAAAATACAATAGTTTTACIT^ 

AGAAGCGGCAGCTACTTTTAATGAGGATGGTATTAGTTTAACTT 

TTTTAAGCCATACATGTACGATTGAAA 

GGTAAAATCrTATCAGCAGTTAAAGCCTTTAATAAGCCTGCTGAAGTACT 

GGTAAAAGATAAGAGGAATGCTGCTGGAGACCCTAA^ 

ATGTGATGTTGAACTGGTCAAATACCAATTCTGGTT 

GAAAGATTGTTAGGCAAAGCACCATCTGAACAGGAG1TAACAGTAG 

TAAGCCAGGGGTCAGTTTTCATTTTACTTATCAAGATATCAT 

ctgattctatttttgatggttatca^ 
tctttagcagaacat*itagttgcatgtgttatccc^ 

AGATTATCAAAGCCTTGTGCCCAATGACTTGAAACACAGG^ 

TAGATTACTGTAACGAAACACITTATGAGTGGA^ 

TTTCTTTGnCATTTGGAAAATAAA 

SEQ ID NO. 6207 
STRAIN COH1 
TTGCTGGAT 

TATCCTCGAATTAAGGCGTTTGAATTGGAA 

TTACXIRGAAACAATATAAAAGAAAAACIGAGAT^ 

ATCTCCTCGCAAAAATTGTTCATTTTTTAAAAT 

CCCTATATTCCCAAATATAGAGAAGCGGCAGCTACTTTTAATGAGG^ 

TATTAGTTTAACTTCTGATTTTTTAAGC 

CAAAACTAATTTTTAAAGAAGGTAAAATCTTATCAGCAGT^ 

AATAAGCOT3CTGAAGTACTGGTAAAAGATAAGAGGAATG CTGCTGGAGA 

CCCTAAAGATTACTTTGACTATGTGATGTTGAA 

CTGGTTATCGTTTAGTAATGGAAAGATTGTTAGGCAAAGCACC^ 

CAGGAGTTAACAGTAGGTTTTAAGCCAGGGGTCAGTTTrC^ 

TGAAGATATCATCAATCATCCTGATTCTATTTTTG^ 

CTAAAATTAAAAATCAGCTTTCTTTAGCAGAACATTTAGTTC 

ATCCCAAAACATTATCRAGAAGATTATCAAAG CCTTGTGCCCAATGACTT 

GAAACACAGGGTTTATTATTTAGATT^ 

GGAATCAAAAAGTTTATGATTTTCTTTGGCATT^ 

SEQ ID MO. 6208 
STRAIN M781 
TTGCTGGA 

TTATCCTCGAATTAAGGCX3TTTGAATTGGAAAGGATAGGAG 

CH^CQAGAAAC^TATAAAAGAAAAACTGAGATACAATGTGACGATAAA 

CATCTCCTCXjCAAAAATTGTTCATTTTT^ 

TCCCTATATTCCCAAATATAGAGAAGCGGCAGCTACITT^ 

GTATTAGTTTAACTTCTGATTTTTTAAGCCATACATC 

GCAAAACTAATTTTTAAAGAAGOTAAAATCITATCAGCAGTTAAAG 

TAATAAGCCTGCTGAAGTACTGGTAAAAGATAAGAGGAATGCrc 

ACOCTAAAXSATTACTTTGACTATGTGATGTrGAA 

TCTGGTTATCX^rTTAGTAATGGAAAGATTGTTAGG 

ACAGGAGTTAACAGTAGGTTTTAAGCCAGGGGTCAGTTTTC^ 

ATCAAGATATCATCAATCATCCTGATTCTA 

GCTAAAATTAAAAATCAGCTTTCTTTAGCAGAA^ 

TATCCCAAAACATTATCAAGAAGATTATCAAAGCCTTGTO 

TGAAACACAGGGTTTATTATTTAGATTACTGTAACGAAACA 

TGGAATCAAAAAGTTTATGATTTTCTTTGT 

SEQ ID MO. 6209 
STRAIN CJB110 

TTGCTGGATTATCCrOGAATTAAGGC 

GTTTGAATTGGAAAGGATAGGAGCTTTCATAGCT^ 

AAAGAAAAATTGAGATACAATGTGACX1ATA 

CTTCATTTTTTAAAATACAATAGTTTTACrriTC 

TAGAGAAGCGGCAGCTACTTTTAATGAGGATGGTATTAGTl^ 

ATTTTTTAAGCCATACATGTACGATTGAAACTGCAA 

GAAGGTAAAATCTTATCAGCAGTTAAAGCCTTTAATAAG CCTGCTGAAGT 

ACTGGTAAATGATAAGAGGAATGCTGCrGGAGACCCTA 

ACTATGTGATGTTGAACTGGTCAAATACCAATTCT^ 

ATGGAAAGATTGTTAGGCAAAGaVCCATCTGAACA^ 

TTTTAAGCCAGGGGTCAGCTTTCATTTT^ 

ATCCTGATTCTATTTTTGATGGTTATCATCC^ 

CTTTCITTAGCAGAACATTTAGTTG CATGTGTTATCCCAAAAC ATTAT CA 
AGAAGATTATCAAAGCXnTGTGCCTAATGACTTO 
ATTTAGATTAjCTGTAACGAAACACTTTATGAGTGGAATCAA 
GATTTTCTTTGTCATTTGGAAAATAAA 
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Table 62: Comparative Sequences relating to SAG0690 



SEQ ID HO. 6210 
STRAIN 1169NT 

AATTAAGGCGTTTGAATTGGAAAGGATAGG AGCTTTCATA^ 
AACAATATAAAAGAAAAACTGAGATACAAT^^ 

GCAAAAATrcTTCA^rl-rrrAAAATACyyVTAG'ri'iU'ALrrrri'CCCTATAT 
TCCCAAATATAGAGAAGCGGCAGCTACTITrAATGAGGATGGTATTAG^ 
TAACTT CTG ATTTTTTAAG CCATACATCT 

ATTTTTAAAGAAGGTAAAATCTTATCAGCAGTTAAAGCCITTAATAAGCC 
TGCTGAAGTACTGGTAAATGATAAGAGGAATGCTGCTGGAGACCCTAAAG 
ATTACTTTGACT74TGTGATGTTGAACTGGT^ 

CGTTTAGTAATGGAAAGATTGTTAGGCAAAGCACCAT CTGAACAGGAGTT 
AACAGTAGGTTITAAGCCAGGGGTGAGCITTCATTTrA 
TCATCAATCATC CTGATTCTATTTTTGATGGTTATCATCCTG CTAAAATT 
AAAAATCAGCTTTCTTTAGCMAACATTTAGTTG 

ACATTAT CAAGAAGATT ATCAAAAT CTTGTGCCCAATGACTTGAAACACA 

GAGTTTATTATTTAGATTACTGTAACGAAACAC^^ 

AAAGTTTATGATTTTCTTTGTC^TTTGGAAAATAAA 

SEQ XD NO. 6211 
STRAIN JM9130013 

ATAGGAGCITTCATAGCTTACGAGAAACAATATAAAAGAAAAATTGAGAT 

ACAATGTGACGATAAACAT CTCCT CACAAAAATTGTTCTVTTTTTT AAAAT 

AOUlTAGl'l^'ACTri'l'CCCTATATTCCCAAATATAG^GAAGCGGCAGCT 

ACTTTTAATGAGGATGGTATTAGTTTAACTTCTGAT^ 

ATGTACX1ATTGAAACTGCAAAACTAATTTTTAAAG 

CAGCAGTTAAAGCCTTTAATAAGCCTGCTGAAGTACTGGTAAATG^ 

AGGAATGCTGCTGGAGACCCTAAAGATTACTTTGACT 

eTGGTCAAATACCAATTCTGGTTATCGTTTAGTAATGGAA 

GCAAAGCACCATCTGaACAGGAGTTAACAGTAGCITTTAAG 

AGCITTCATTTTAftTTATCAAGATA 

TGATGGTTATCATCCTGCTAAAATTAAAAATCAACTTT^ 

ATlTAGTTOCATGTXnTATCCCAAAACATT^ 

CTTGTGCCTAATGACTTGAAACACAGAGTTTATTATT^ 

CGAAACACHTTATGAGTGGAATCAAAAAGTTTATGATTC 

TGGAAAATAAA 

PRETTY Of « /biotmp/msal85284.2{*} May 13 , 2003 07:08 



msal85284 ,2{271_090 
msal8S284.2{271 H36B 
rasal85284 .2{271_JM9130013 
msal85284.2{271 A909 
msal85284 . 2 {271_CJB110 
msal85284 . 2 {271_18RS21 
msalB 5284 .2/27 1_2603 
msal85284.2l 271 M732 
msal85284.2(271~M781 
msal85284 . 2 { 27 1_C0H1 
msal85284.2{271_U69NT 
Consensus 



50 



atgattttaa aaatttgt eg tgcagcatat agtttacaat ggggaggtgt 



msal85284 . 2 {271_090 
msal85284 .2 {271 H36B 
msal85284 .2{271_JM9130013 
msal85284.2{271 A909 
msalB5284 . 2 f 271_CJB110 
msal852 84 . 2 ( 271_18RS21 
msal85284 .2(271 2603 
msal85284.2 271~M732 
msal85284.2 271~M781 
msal85284 . 2 { 27l"~COHl 
msal 852 84 . 2 { 27 1_116 9NT 
Consensus 



51 



100 

-tgg attatcctct aattaaggcg tttgaattgg 
ttaaggcg tttgaattgg 



TTGCtgg attatcctcg aattaaggcg tttgaattgg 

TTGCtgg attatcctcg aattaaggcg tttgaattgg 

TTGCtgg attatcctcg aattaaggcg tttgaattgg 

ttaccaatta gctTTGCtgg attatcctcg aattaaggcg tttgaattgg 

TTGCtgg attatcctcg aattaaggcg tttgaattgg 

TTGCtgg attatcctcg aattaaggcg tttgaattgg 

TTGCtgg attatcctcg aattaaggcg tttgaattgg 

~~ aattaaggcg tttgaattgg 



msal85284 . 2 { 271_090 
msal85284.2{271 H36B 
msal85284.2{271 JM9130013 
msal85284 .2{271_A909 
rasal85284.2(271 CJB110 
msal85284.2{2708RS21 
msal85284.2{271 2603 
msal85284 .2(271~M732 
msal85284 .2(271*li781 
t msal85284.2{27l"*COHl 
msal85284.2{271_1169NT 
Consensus 



101 

aaaggATAGG 
aaaggATAGG 

ATAGG 

aaaggATAGG 
aaaggATAGG 
aaaggATAGG 
aaaggATAGG 
aaaggATAGG 
aaaggATAGG 
aaaggATAGG 
aaaggATAGG 



AGCTTTCATA 
AGCTTTCATA 
AGCTTTCATA 
AGCTTTCATA 
AGCTTTCATA 
AGCTTTCATA 
AG CTTT CATA 
AGCTTTCATA 
AGCTTTCATA 
AGCTTTCATA 
AGCTTTCATA 



GCTTACGAGA 
GCTTACGAGA 
GCTTACGAGA 
GCTTACGAGA 
GCTTACGAGA 
G CTTA CGAGA 
GCTTACGAGA 
GCTTACGAGA 
GCTTACGAGA 
GCTTACGAGA 
GCTTACGAGA 



AACAATATAA 
AACAATATAA 
AACAATATAA 
AACAATATAA 
AACAATATAA 
AACAATATAA 
AACAATATAA 
AACAATATAA 
AACAATATAA 
AACAATATAA 
AACAATATAA 



150 

AAGAAAAAtT 
AAGAAAAAtT 
AAGAAAAAtT 
AAGAAAAAtT 
AAGAAAAAtT 
AAGAAAAAcT 
AAGAAAAAcT 
AAGAAAAAcT 
AAGAAAAAcT 
AAGAAAAAcT 
AAGAAAAAcT 



rosal85284. 2 {271J390} 



151 200 
GAGATACAAT GTGACGATAA ACATCTCCTC aCAAAAATTG TTCATTTTTT 
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Table 62: Comparative Sequences relating to SAG0690 



msal85284 .2(271 H36BJ GAGATACAAT 

msal 85284.2(27 1_JM9130 013 GAGATACAAT 

msal8 52 8 4 . 2 { 27 1_A9 0 9 \ GAGATACAAT 

meal 85284.2(27 1_C JB1 10 J GAGATACAAT 

msal85284.2{271_18RS21 > GAGATACAAT 

TOSal85284.2(271_2603 GAGATACAAT 

msal85284.2(271_M732} GAGATACAAT 

m8al85284.2{271_M781> GAGATACAAT 

msalB5284 . 2 ( 271_COHl > GAGATACAAT 

msal85284.2{271_1169NT> GAGATACAAT 

Consensus ********** 



GTGACGATAA 
GTGACGATAA 
GTGACGATAA 
GTGACGATAA 
GTGACGATAA 
GTGACGATAA 
GTGACGATAA 
GTGACGATAA 
GTGACGATAA 
GTGACGATAA 



ACATCTCCTC 
ACATCTCCTC 
ACATCTCCTC 
ACATCTCCTC 
ACATCTCCTC 
ACATCTCCTC 
ACATCTCCTC 
ACATCTCCTC 
ACATCTCCTC 
ACATCTCCTC 



aCAAAAATTG 
aCAAAAATTG 
aCAAAAATTG 
aCAAAAATTG 
gCAAAAATTG 
gCAAAAATTG 
gCAAAAATTG 
gCAAAAATTG 
gCAAAAATTG 
gCAAAAATTG 



TTCATTTTTT 
TTCATTTTTT 
TTCATTTTTT 
TTCATTTTTT 
TTCATTTTTT 



TTCATTTTTT 
TTCATTTTTT 
TTCATTTTTT 
TTCATTTTTT 



201 

msal85284.2{271_090} AAAATACAAT 

msal85284.2(271_H36B) AAAATACAAT 

msal85284.2{271_JM9130013 AAAATACAAT 

msal85284.2(271_A909 AAAATACAAT 

msal85284.2(271_CJB110} AAAATACAAT 

msal85284.2(271_18RS2lJ AAAATACAAT 

msal85284.2{271_2603J AAAATACAAT 

ma al8 52 84 . 2 { 27 1_M73 2 J AAAATACAAT 

msal85284.2{271 M781J AAAATACAAT 

msal 8 52 84. 2(27 l~COHl ' \ AAAATACAAT 

msalB5284.2{271_1169NT} AAAATACAAT 

Consensus ********** 



AGTTTTACTT 
AGTTTTACTT 
AGTTTTACTT 
AGTTTTACTT 
AGTTTTACTT 
AGTTTTACTT 
AGTTTTACTT 
AGTTTTACTT 
AGTTTTACTT 
AGTTTTACTT 
AGTTTTACTT 



TTCCCTATAT 
TTCCCTATAT 
TTCCCTATAT 
TTCCCTATAT 
TTCCCTATAT 
TTCCCTATAT 
TTCCCTATAT 
TTCCCTATAT 
TTCCCTATAT 
TTCCCTATAT 
TTCCCTATAT 



TCCCAAATAT 
TCCCAAATAT 
TCCCAAATAT 
TCCCAAATAT 
TCCCAAATAT 
TCCCAAATAT 
TCCCAAATAT 
TCCCAAATAT 
TCCCAAATAT 
TCCCAAATAT 
TCCCAAATAT 



250 

AGAGAAGCGG 
AGAGAAGCGG 
AGAGAAGCGG 
AGAGAAGCGG 
AGAGAAGCGG 
AGAGAAGCGG 
AGAGAAGCGG 
AGAGAAGCGG 
AGAGAAGCGG 
AGAGAAGCGG 
AGAGAAGCGG 



251 

msal85284.2{271_090) CAGCTA CTTT 

msal85284.2{271_H36B! CAGCTA CTTT 

msal85284. 2(271 JM9130013 - CAGCTA CTTT 

msal85284 ,2{271_A909) CAGCTA CTTT 

msal 85284. 2{ 27 1_CJB110 > CAGCTA CTTT 

msal85284.2(271_18RS21 CAGCTA CTTT 

msal 8 52 84. 2 { 27 1_2 603 > CAGCTACTTT 

msal85284.2i271_M732} CAGCTA CTTT 

msal85284.2 271J4781J CAGCTACTTT 

msal85284.2(271_COHl \ CAGCTA CTTT 

msal85284.2{271_1169NT) CAGCTACTTT 
Consensus 

301 

msal85284.2(27X_090) CATACATGTA 

tnsal85284.2{ 27 1_H3 6B \ CATACATGTA 

msal85284.2(271_JM9130013 CATACATGTA 

msal85284.2{27 1_A9 0 9 > CATACATGTA 

tnsal85284.2{271_CJBllO CATACATGTA 

msal85284.2(271_18RS21 CATACATGTA 

msal85284.2{271 2603 CATACATGTA 

msal85284.2f27l3l732 CATACATGTA 

msal85284.2(271_M781 CATACATGTA 

msal85284 . 2 (271_COHl J CATACATGTA 

msal85284 .2 (271_1169NT) CATACATGTA 

Consensus ********** 



TAATGAGGAT 
TAATGAGGAT 
TAATGAGGAT 
TAATGAGGAT 
TAATGAGGAT 
TAATGAGGAT 
TAATGAGGAT 
TAATGAGGAT 
TAATGAGGAT 
TAATGAGGAT 
TAATGAGGAT 



GGTATTAGTT 
GGTATTAGTT 
GGTATTAGTT 
GGTATTAGTT 
GGTATTAGTT 
GGTATTAGTT 
GGTATTAGTT 
GGTATTAGTT 
GGTATTAGTT 
GGTATTAGTT 
GGTATTAGTT 



********** ********** ********** 



TAACTTCTGA 
TAACTTCTGA 
TAACTTCTGA 
TAACTTCTGA 
TAACTTCTGA 
TAACTTCTGA 
TAACTTCTGA 
TAACTTCTGA 
TAACTTCTGA 
TAACTTCTGA 
TAACTTCTGA 
********** 



CGATTGAAAC 
CGATTGAAAC 
CGATTGAAAC 
CGATTGAAAC 
CGATTGAAAC 
CGATTGAAAC 
CGATTGAAAC 
CGATTGAAAC 
CGATTGAAAC 
CGATTGAAAC 
CGATTGAAAC 



TGCAAAACTA 
TGCAAAACTA 
TGCAAAACTA 
TGCAAAACTA 
TGCAAAACTA 
TGCAAAACTA 
TGCAAAACTA 
TGCAAAACTA 
TGCAAAACTA 
TGCAAAACTA 
TGCAAAACTA 



ATTTTTAAAG 
ATTTTTAAAG 
ATTTTTAAAG 
ATTTTTAAAG 
ATTTTTAAAG 
ATTTTTAAAG 
ATTTTTAAAG 
ATTTTTAAAG 
ATTTTTAAAG 
ATTTTTAAAG 
ATTTTTAAAG 



300 

TTTTTTAAGC 
TTTTTT AAGC 
TTTTTTA AGC 
TTTTTTAAGC 
TTTTTTAAGC 
TTTTTTAAGC 
TTTTTTAAGC 
TTTTTTAAGC 
TTTTTTAAGC 
TTTTTTAAGC 
TTTTTTAAGC 
********** 

350 

AAGGTAAAAT 
AAGGTAAAAT 
AAGGTAAAAT 
AAGGTAAAAT 
AAGGTAAAAT 
AAGGTAAAAT 
AAGGTAAAAT 
AAGGTAAAAT 
AAGGTAAAAT 
AAGGTAAAAT 
AAGGTAAAAT 



msal85284.2{271_090; 
msal85284. 2(271^368, 
msalB5284 . 2(271_JM9130013 
msal85284 . 2 (271_A909 
msal85284 .2( 271JCJB110 
msal85284.2{271 18RS21 
msal85284.2(271_2603 
msalS 52 84 .2(27 1JM732 
msal85284.2{271JM781 
msal85284 .2(271 COH1 
msal852 84 . 2 { 27 1_1169NT . 

Consensus 



msal85284 . 2 { 27 1_090 ] 
msalS 5284 .2(27 1_H36B 
msal85284. 2(271 JM9130013 
msal85284.2(271_A909 
msal 8 52 8 4 . 2 ( 27 1_CJB1 10 
msal85284 .2{271 - 18RS21 
msal 8 52 84 .2(27 1_2 603 
msal 8 52 8 4. 2 271_M732 
msal85284.2 271^781 
rasal852B4 .2{271_C0H1 
msal85284.2(271_1169NT 
Consensus 



351 

CTTATCAGCA 
CTTATCAGCA 
CTTATCAGCA 
CTTATCAGCA 
CTTATCAGCA 
CTTATCAGCA 
CTTATCAGCA 
CTTATCAGCA 
CTTATCAGCA 
CTTATCAGCA 
CTTATCAGCA 



GTTAAAGCCT 
GTTAAAGCCT 
GTTAAAGCCT 
GTTAAAGCCT 
GTTAAAGCCT 
GTTAAAGCCT 
GTTAAAGCCT 
GTTAAAGCCT 
GTTAAAGCCT 
GTTAAAGCCT 
GTTAAAGCCT 



TTAATAAGCC 
TTAATAAGCC 
TTAATAAGCC 
TTAATAAGCC 
TTAATAAGCC 
TTAATAAGCC 
TTAATAAGCC 
TTAATAAGCC 
TTAATAAGCC 
TTAATAAGCC 
TTAATAAGCC 



TGCTGAAGTA 
TGCTGAAGTA 
TGCTGAAGTA 
TGCTGAAGTA 
TGCTGAAGTA 
TGCTGAAGTA 
TGCTGAAGTA 
TGCTGAAGTA 
TGCTGAAGTA 
TGCTGAAGTA 
TGCTGAAGTA 



400 

CTGGTAAAtG 
CTGGTAAAtG 
CTGGTAAAtG 
CTGGTAAAtG 
CTGGTAAAtG 
CTGGTAAAaG 
CTGGTAAAaG 
CTGGTAAAaG 
CTGGTAAAaG 
CTGGTAAAaG 
CTGGTAAAtG 
********.* 



401 

ATAAGAGGAA 
ATAAGAGGAA 
ATAAGAGGAA 
ATAAGAGGAA 
ATAAGAGGAA 
ATAAGAGGAA 
ATAAGAGGAA 
ATAAGAGGAA 
ATAAGAGGAA 
ATAAGAGGAA 
ATAAGAGGAA 



TGCTGCTGGA 
TGCTGCTGGA 
TGCTGCTGGA 
TGCTGCTGGA 
TGCTGCTGGA 
TGCTGCTGGA 
TGCTGCTGGA 
TGCTGCTGGA 
TGCTGCTGGA 
TGCTGCTGGA 
TGCTGCTGGA 



GACCCTAAAG 
GACCCTAAAG 
GACCCTAAAG 
GACCCTAAAG 
GACCCTAAAG 
GACCCTAAAG 
GACCCTAAAG 
GACCCTAAAG 
GACCCTAAAG 
GACCCTAAAG 
GACCCTAAAG 



ATTACTTTGA 
ATTA CTTTG A 
ATTA CTTTG A 
ATTA CTTTG A 
ATTACTTTGA 
ATTACTTTGA 
ATTACTTTGA 
ATTACTTTGA 
ATTA CTTTG A 
ATTACTTTGA 
ATTACTTTGA 



450 

CTATGTGATG 
CTATGTGATG 
CTATGTGATG 
CTATGTGATG 
CTATGTGATG 
CTATGTGATG 
CTATGTGATG 
CTATGTGATG 
CTATGTGATG 
CTATGTGATG 
CTATGTGATG 



451 



500 



940 



WO 2004/018646 



PCT/US2003/026827 



Table 62: Comparative Sequences relating to SAG0690 



msal85284 . 2 { 271_090 
msal8 5284 . 2 { 27 1_H3 6B 
msal85284.2{271_JM9130013 
msal85284.2{271_A909 
msal85284. 2(271 CJB110 
msal85284.2{271 18RS21 
msal85284 .2{271_2603 
msal85284 . 2 { 271_M732 
msal85284.2(271_M781 
msal85284.2{271_COHl 
msal85284 . 2 {271_1169NT 
Consensus 



TTGAACTGGT 
TTGAACTGGT 
TTGAACTGGT 
TTGAACTGGT 
TTGAACTGGT 
TTGAACTGGT 
TTGAACTGGT 
TTGAACTGGT 
TTGAACTGGT 
TTGAACTGGT 
TTGAACTGGT 



CAAATACCAA 
CAAATACCAA 
CAAATACCAA 
CAAATACCAA 
CAAATACCAA 
CAAATACCAA 
CAAATACCAA 
CAAATACCAA 
CAAATACCAA 
CAAATACCAA 
CAAATACCAA 



TTCTGGTTAT 
TTCTGGTTAT 
TTCTGGTTAT 
TTCTGGTTAT 
TTCTGGTTAT 
TTCTGGTTAT 
TTCTGGTTAT 
TTCTGGTTAT 
TTCTGGTTAT 
TTCTGGTTAT 
TTCTGGTTAT 



CGTTTAGTAA 
CGTTTAGTAA 
CGTTTAGTAA 
CGTTTAGTAA 
CGTTTAGTAA 
CGTTTAGTAA 
CGTTTAGTAA 
CGTTTAGTAA 
CGTTTAGTAA 
CGTTTAGTAA 
CGTTTAGTAA 



TGGAAAGATT 
TGGAAAGATT 
TGGAAAGATT 
TGGAAAGATT 
TGGAAAGATT 
TGGAAAGATT 
TGGAAAGATT 
TGGAAAGATT 
TGGAAAGATT 
TGGAAAGATT 
TGGAAAGATT 



msal85284.2{271 090] 
msal85284.2{271_H36B 
msal85284 .2 {271_JM9130013 
msal85284 . 2 {271_A909 
msal85284 . 2 (271_CJB110 
msal85284 . 2 {271_18RS2 1 
msal85284.2(271_2603 
msal85284.2 271_M732 
msal85284.2 271_M781 
ms al8 52 84 . 2 { 2 7 l_COHl 
msal85284 .2 {271JL169NT 
Consensus 



501 

GTTAGGCAAA 
GTTAGGCAAA 
GTTAGGCAAA 
GTTAGGCAAA 
GTTAGGCAAA 
GTTAGGCAAA 
GTTAGGCAAA 
GTTAGGCAAA 
GTTAGGCAAA 
GTTAGGCAAA 
GTTAGGCAAA 



GCACCATCTG 
GCACCATCTG 
GCACCATCTG 
GCACCATCTG 
GCACCATCTG 
GCACCATCTG 
GCACCATCTG 
GCACCATCTG 
GCACCATCTG 
GCACCATCTG 
GCACCATCTG 



AACAGGAGTT 
AACAGGAGTT 
AACAGGAGTT 
AACAGGAGTT 
AACAGGAGTT 
AACAGGAGTT 
AACAGGAGTT 
AACAGGAGTT 
AACAGGAGTT 
AACAGGAGTT 
AACAGGAGTT 



AACAGTAGcT 
AACAGTAGcT 
AACAGTAGCT 
AACAGTAGcT 
AACAGTAGcT 
AACAGTAGgT 
AACAGTAGgT 
AACAGTAGgT 
AACAGTAGgT 
AACAGTAGgT 
AACAGTAGgT 



550 

TTTAAGCCAG 
TTTAAGCCAG 
TTTAAGCCAG 
TTTAAGCCAG 
TTTAAGCCAG 
TTTAAGCCAG 
TTTAAGCCAG 
TTTAAGCCAG 
TTTAAGCCAG 
TTTAAGCCAG 
TTTAAGCCAG 



msal85284.2{271_090 
tnsal85284.2{271_H36B 
msal85284.2{271_JM9130013 
msal85284.2{271_A909 
msal85284.2(271_CJB110 
msal85284 . 2 { 27 1JL8RS2 1 
msal85284.2(271_2603 
msal85284.2 271_M732 
msal852B4.2(271_M781 
msal852B4 . 2 (271_COHl 
msal85284.2{271_1169NT 
Consensus 



551 

GGGTCAGcTT 
GGGTCAGcTT 
GGGTCAGcTT 
GGGTCAGcTT 
GGGTCAGcTT 
GGGTCAGtTT 
GGGTCAGtTT 
GGGTCAGtTT 
GGGTCAGtTT 
GGGTCAGtTT 
GGGTCAGcTT 



TCATTTTAaT 
TCATTTTAaT 
TCATTTTAaT 
TCATTTTAaT 
TCATTTTAaT 
TCATTTTAcT 
TCATTTTAcT 
TCATTTTAcT 
TCATTTTAcT 
TCATTTTAcT 
TCATTTTAcT 



TATCAAGATA 
TATCAAGATA 
TATCAAGATA 
TATCAAGATA 
TATCAAGATA 
TATCAAGATA 
TATCAAGATA 
TATCAAGATA 
TATCAAGATA 
TATCAAGATA 
TATCAAGATA 



TCATCAATCA 
TCATCAATCA 
TCATCAATCA 
TCATCAATCA 
TCATCAATCA 
TCATCAATCA 
TCATCAATCA 
TCATCAATCA 
TCATCAATCA 
TCATCAATCA 
TCATCAATCA 



600 

TCCTGATTCT 
TCCTGATTCT 
TCCTGATTCT 
TCCTGATTCT 
TCCTGATTCT 
TCCTGATTCT 
TCCTGATTCT 
TCCTGATTCT 
TCCTGATTCT 
TCCTGATTCT 
TCCTGATTCT 



msal85284.2{271_090; 
msal85284.2{271_H36B 
msal8 52 84 . 2 { 27 1_JM9 13 0 0 13 
msal85284.2{271_A909 
msal85284. 2(271 CJB110 
msal85284.2{271 18RS21 
msal85284. 2(271 2603 
msal85284. 2(271 M732 
msal85284.2(271_M781 
msal85284 .2{271_COHl 
msal85284 .2{271_1169NT 
Consensus 



601 

ATTTTTGATG 
ATTTTTGATG 
ATTTTTGATG 
ATTTTTGATG 
ATTTTTGATG 
ATTTTTG ATG 
ATTTTTGATG 
ATTTTTGATG 
ATTTTTGATG 
ATTTTTGATG 
ATTTTTGATG 



GTTATCATCC 
GTTATCATCC 
GTTATCATCC 
GTTATCATCC 
GTTATCATCC 
GTTATCATCC 
GTTATCATCC 
GTTATCATCC 
GTTATCATCC 
GTTATCATCC 
GTTATCATCC 



TGCTAAAATT 
TGCTAAAATT 
TGCTAAAATT 
TGCTAAAATT 
TGCTAAAATT 
TGCTAAAATT 
TGCTAAAATT 
TGCTAAAATT 
TGCTAAAATT 
TGCTAAAATT 
TGCTAAAATT 



AAAAATCAaC 
AAAAATCAaC 
AAAAATCAaC 
AAAAATCAaC 
AAAAATCAaC 
AAAAATCAgC 
AAAAATCAgC 
AAAAATCAgC 
AAAAATCAgC 
AAAAATCAgC 
AAAAATCAgC 



650 

TTTCTTTAGC 
TTTCTTTAGC 
TTTCTTTAGC 
TTTCTTTAGC 
TTTCTTTAGC 
TTTCTTTAGC 
TTTCTTTAGC 
TTTCTTTAGC 
TTTCTTTAGC 
TTTCTTTAGC 
TTTCTTTAGC 



msal85284.2{271 090 
^3185284.2(271^368, 
maaia 52 84 . 2 { 27 1_JM9 13 0 0 13 
msal852B4.2{271_A909 
msal85284 . 2 (271_CJB110 
msal85284 . 2 { 27 1_18RS2 1 
msal85284 . 2 (271_2603 
msal852B4 .2' 271_M732 
msal85284 . 2 271_M781 
rasal85284 . 2 ( 271_COHl 
rasal85284 . 2 { 271__1169NT 
Consensus 



651 

AGAAC ATTTA 
AGAACATTTA 
AGAACATTTA 
AGAACATTTA 
AGAACATTTA 
AGAACATTTA 
AGAACATTTA 
AGAACATTTA 
AGAACATTTA 
AGAACA TTTA 
AGAACATTTA 



GTTGCaTGTG 
GTTGCaTGTG 
GTTGCaTGTG- 
GTTGCaTGTG 
GTTGCaTGTG 
GTTGCaTGTG 
GTTGCaTGTG 
GTTGCaTGTG 
GTTGCaTGTG 
GTTGCaTGTG 
GTTGCgTGTG 



TTATCCCAAA 
TTATCCCAAA 
TTATCCCAAA 
TTATCCCAAA 
TTATCCCAAA 
TTATCCCAAA 
TTATCCCAAA 
TTATCCCAAA 
TTATCCCAAA 
TTATCCCAAA 
TTATCCCAAA 



ACATTATCAA 
ACATTATCAA 
ACATTATCAA 
ACATTATCAA 
ACATTATCAA 
ACATTATCAA 
ACATTATCAA 
ACATTATCAA 
ACATTATCAA 
ACATTATCAA 
ACATTATCAA 



700 

GAAGATTATC 
GAAGATTATC 
GAAGATTATC 
GAAGATTATC 
GAAGATTATC 
GAAGATTATC 
GAAGATTATC 
GAAGATTATC 
GAAGATTATC 
GAAGATTATC 
GAAGATTATC 



msal85284.2{271_p90; 
msal85284 .2{271_H36B 
mBal85284.2{271_JM9130013 
tnsal85284 . 2 { 271_A909 
meal 852 84 . 2 (271_CJB110 
msal8S284.2{271_18RS21 
tnsal85284.2(271_2603 
msal85284.2 271_M732 
msal85284.2 271_M781 
msal85284 . 2 { 271_C0H1 
msal85284.2{271_1169NT 
Consensus 



701 

AAAgcCTTGT 
AAAgcCTTGT 
AAAgcCTTGT 
AAAgcCTTGT 
AAAgc CTTGT 
AAAgc CTTGT 
AAAgcCTTGT 
AAAgc CTTGT 
AAAgc CTTGT 
AAAgc CTTGT 
AAAatCTTGT 



GCCtAATGAC 
GCCtAATGAC 
GCCtAATGAC 
GCCtAATGAC 
GCCtAATGAC 
GCCcAATGAC 
GCCCAATGAC 
GCCCAATGAC 
GCCcAATGAC 
GCCCAATGAC 
GCCCAATGAC 



TTGAAACACA 
TTGAAACACA 
TTGAAACACA 
TTGAAACACA 
TTGAAACACA 
TTGAAACACA 
TTGAAACACA 
TTGAAACACA 
TTGAAACACA 
TTGAAACACA 
TTGAAACACA 



GaGTTTATTA 
GaGTTTATTA 
GaGTTTATTA 
GaGTTTATTA 
GaGTTTATTA 
GgGTTTATTA 
GgGTTTATTA 
GgGTTTATTA 
GgGTTTATTA 
GgGTTTATTA 
GaGTTTATTA 



750 

TTTAGATTAC 
TTTAGATTAC 
TTTAGATTAC 
TTTAGATTAC 
TTTAGATTAC 
TTTAGATTAC 
TTTAGATTAC 
TTTAGATTAC 
TTTAGATTAC 
TTTAGATTAC 
TTTAGATTAC 
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msal85284.2{271_090; 
msal85284.2{27l_H36B j 
msal85284.2{271_JM9130O13 
niBal85284 . 2 { 271_A909 , 
maal85284.2f271_CJB110 
msal85284.2{271_18RS21 
msal85284.2(271_2603 
msal85284.2(271_M732 
msal85284 .2(27 1J478 1 
msa!85284 . 2 { 271_C0H1 
msal85284.2{271_1169NT 
Consensus 



msalB5284 .2{271_090; 
msal85284.2{271_H36B 
msal85284 . 2 { 271_JM9130 013 
msal8 5284.2(27 1_A909 
rasal85284.2(271_CJB110 
msa!85284 . 2 { 27 1_18RS2 1 
msal85284 . 2 [ 271_2603 
msal85284 .2 271_M732 
msal85284.2< 271J4781 
msal85284 . 2 (271_COHl 
msal85284.2{271_1169NT 
Consensus 



751 

TGTAACGAAA 
TGTAACGAAA 
TGTAACGAAA 
TGTAACGAAA 
TGTAACGAAA 
TGTAACGAAA 
TGTAACGAAA 
TGTAACGAAA 
TGTAACGAAA 
TGTAACGAAA 
TGTAACGAAA 



GACTTTATGA 
CACTTTATGA 
CACTTTATGA 
CACTTTATGA 
CACTTTATGA 
CACTTTATGA 
CACTTTATGA 
CACTTTATGA 
CACTTTATGA 
CACTTTATGA 
CACTTTATGA 



GTGGAATCAA 
GTGGAATCAA 
GTGGAATCAA 
GTGGAATCAA 
GTGGAATCAA 
GTGGAATCAA 
GTGGAATCAA 
GTGGAATCAA 
GTGGAATCAA 
GTGGAATCAA 
GTGGAATCAA 



AAA GTTTA TG 
AAAGTTTATG 
AAAGTTTATG 
AAAGTTTATG 
AAA GTTTA TG 
AAAGTTTATG 
AAAGTTTATG 
AAAGTTTATG 
AAAGTTTATG 
AAAGTTTATG 
AAAGTTTATG 



800 

ATTTTCTTTG 
ATTTTCTTTG 
ATTTTCTTTG 
ATTTTCTTTG 
ATTTTCTTTG 
ATTTTCTTTG 
ATTTTCTTTG 
ATTTTCTTTG 
ATTTTCTTTG 
ATTTTCTTTG 
ATTTTCTTTG 



801 

tCATTTGGAA 
tCATTTGGAA 
tCATTTGGAA 
tCATTTGGAA 
tCATTTGGAA 
tCATTTGGAA 
tCATTTGGAA 
nCATTTGGAA 
tCATTTGGAA 
gCATTTGGAA 
tCATTTGGAA 



816 
AATAAA 
AATAAA 
AATAAA 
AATAAA 
AATAAA 
AATAAA 
AATAAA 
AATAAA 
AATAAA 
AATAAA 
AATAAA 



SEQ ZD HO. 6212 
STRAIN 2603 frame: 1 

MI LKI CRAAYSLQWGGVYQLALLDYPRI KAFELERI GAPIAYEKQYKRKTE I QCDDKHLL 
AKI VHFLKYNSFTFPYI PKYRBAAATFNEDGI SLTSDFLSHTCTI ETAKLI FKEGKILSA 
VKAFNKPAEVLVKDKRNAAGDPKDYTTOYVMLNWSNT^ 

FKPGVSPHFTYQDI INHPDS I FDGYHPAKI KNQLSLAEHLVACV I PKHYQEDYQSLVPND 
LKHRVYYIiDYCNETLYBWNQKVYDFLCHLENK 

SSQ ZD NO. 6213 

STRAIN A909 frame: 1 

LLDYPRI KAFELERIGAFIAYEKQYKRKIEIQCDDKHLLTKIV^ 

EAAATFNEDG I S LTSD FLSHTCT I ETAKL I FKEG KI LSAVKAFNKPAEVLVNDKRNAAGD 
PKDYFDYVMLNWSOTTOSGYRLVMERL1X5KAPSEQ I INHPDSI 

FDGYHPAKI KNQLSLAEHLVACVI PKHYQEDYQSIiVPNDIiKHRVYYLDYCNETLYEWNQK 
VYDFLCHLENK 

SEQ ZD NO. 6214 

STRAIN H36Bframe:3 

KAFELBRIGAFIAYEKQYKRKIBIQCDDKHIiTK^VHFliKYNSFTFPYI PKYREAAATFN 
EDGI SLTSD FLSHTCT I ETAKL I FKEGKI LSAVKAFNKPAEVLVNDKRNAAGDPKDYFDY 
VMUJWSNTNSGYRLVMERLLGKAPSEQELTVAFKPC^ I INHPDS I FDGYHPA 

KI KNQLSLAEHLVACVI PKHYQEDYQSLVPNDLKHRVYYLDYCINETLYEWNQKVYDFIjCH 
LENK 

SEQ ZD NO. 6215 
STRAIN 18RS21 frame: 1 

LLDYPRI KAFELERIGAFI AYEKQYKRKTE I QCDDKHLLAKI VHFLKYNS FTFPY I PKYR 
EAAATFNEDG I SLTSDFLSHTCTI ETAKL I FKEGKI LSAVKAFNKPAEVLVKDKRNAAGD 
PKDYFDYVMLNWSNTNSGYRLVMERLI^KAPSEQELTVGFKPGVS FHFTYQD I INHPDSI 
FDGYHPAKI KNQLSLAEHLVACVI PKHYQEDYQSLVPNDLKHRVYYLDYCNETLYEWNQK 
VYDFLCHLENK 

SEQ ZD NO. 6216 
STRAIN M732 frame: 1 

LLDYPRI KAFELERIGAF I AYEKQYKRKTEIQCTDIOlLIiAKI VHFLKYNS FTFPY I PKYR 
EAAATFNEDGI SLTSDFLSHTCTI ETAKLI FKEGia LSAVKAFNKPAEVLVKDKRNAAGD 
PKDYFDYVMLNWSNTNSGYRLVMERLLGKAPSEQELTVGFKPGVSFHFTYQ^ INHPDSI 
FDGYHPAKI KNQLSLAEHLVACVI PKHYQFJ5YQSLVPNDLKHRVYYLDYCNETLYEWNQK 
VYDFLXHLENK 

SEQ ZD NO. 6217 

STRAIN COH1 frame: 1 

LLDYPRI KAFELERIGAFIAYE KQYKRKTB IQCDDKHLLAKI VHFLKYNS FTFPY I PKYR 
EAAATFNEDG I SLTSDFLSHTCTI ETAKL I FKEGKI LSAVKAFNKPAEVLVKDKRNAAGD 
PKDYFDYVMLNWSNTNSGYRLVMERLLGKAPSEQELTVGFK^ I 
FDGYHPAKI KNQLSLAEHLVACVI PKHYQEDYQSLVPNDLKHRVYYLDYCNETLYEWNQK 
VYDFLWHLENK 

SEQ ZD NO. 6218 

STRAIN M781 frame: 1 
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LLDY PRI KAFELER I GAF I AYEKQ YKRKTE I QCDD KHLLAKI VHFLKYNS FTFPY I PKYR 
EAAATFNEDG I SLTSDFLSHTCTI ETAKLI FKEGKI LSAVKAFNKPAEVLVKDKRNAAGD 
PKDYFDYVMLNWSNTNSGYRIiVMERIiLGKAPSEQELTVG FKPGVS FHFTY QD I I NHPDS I 
FDGYHPAKI KNQLS LAEHLVACVI PKHYQ EDYQS LVPNDLKHRVYYLDYCNETLY EWNQK 
VYDFLCHLENK 

SEQ ID NO. 6219 

STRAIN CJB1 10 frame: 1 

I^YPRI KAFELERI GAFI AYEKQY KRKIEIQCDDKHIiTKIVHFLKYNS FTFPY I PKYR 
EAAATFNEDG I SLTSDFLSHTCTI ETAKLI FKEGKILSAVKAFNKPAEVLVNDKRNAAGD 
PKDYFDYVMLNWSNTNSGYRIiVMERLLGKAPSEQELTVAFKPGVSFHFNYQDI INHPDS I 
FDGYHPAKI KNQLS LAEHLVACVI PKHYQEDYQSLVPNDLKHRVYYLDYCNETLYEWNQK 
VYDFLCHLENK 

SEQ ZD NO. 6220 

STRAIN 1169NT frame: 2 

I KAFELERI GAFI AYBKQYKRKTE I QCDDKHLLAKI VHFLKYNSFTFPY I PKYREAAATF 
NEDGI SLTSDFLSHTCTI ETAKLI FKEGKI LSAVKAFNKPAEVLVNDKRNAAGDPKD YFD 
YV^ILNWSNTNSGYRLVMERIJIJGKAPSEQELTVGFKPGVSFHFTYQDI INHPDS I FDGYHP 
AKI KNQLSLAEHLVACVI PKHYQEDYQNL VPNDLKHRVYYLDYCNETLYE WNQKVYD FLC 
HLENK 

SEQ ZD NO. 6221 

STRAIN JM9130013 frame: 1 

I GAF I AYBKQYKRKI E I QCS5DKHLLTKI VHFLKYNSFTFP YI PKYREAAATFNEDG I SLT 
SDFLSHTCTI ETAKL I FKEGKI LSAVKAFNKP AEVLVND KRNAAGDPKD Y FD YVMLNWSN 
TNSGYRLVMERLLGKAPSEQELTVAFKPGV3 FHFNYQD I INHPDS I FDGYHPAKI KNQLS 
LAEHLVACVI PKHYQEDYQSLVPNDLKHRVYYLDYCNETLYEWNQKVYDFL<ZHLENK 

SSQ ZD NO. 6222 
STRAIN 090 frame: 3 

DYPLIKAFELERIGAFIAYEKQYKRKIEIQCDDKHLLTKIVHFLKYNSFTFPYIPKYR 
AATFNEDGI SLTSDFLSHTCTI ETAKLI FKEGKI LSAVKAFNKPAEVLVNDKRNAAGDPK 
DYFDYVMLNWSNTNSGYRLVMERIJ^KAPSEQELTVAFKPGVS FHFNYQD I INHPDS I FD 
GYHPAKI KNQLSLAEHLVACVI PKHYQEDYQSLVPNDLKHRVYYLDYCNETLYEWNQKVY 
DFLCHLENK 



PRETTY ofx /biOtmp/msal85358.2{*} May 13, 2003 07:11 



msal85358.2{271_090; 
msal85358.2{271 JM9130013 1 
rasal85358 .2{2711H36B ( 
msal8 53 58 . 2 { 2 7 1_A9 0 9 
msal85358 . 2 { 27 1_CJB110 
tnsal 8 5 3 58 . 2 { 27 1_1 16 9NT 
tnsal85358 . 2 {271_18RS21 
msal85358 . 2{ 271_2603 
msal85358. 2(271 M732 
msal85358 .2f27l2M781 
msal85358 .2{271jCOHl 
Consensus 



1 50 

dyplika felerlGAFI AYEKQYKRKi 

I GAFI AYEKQYKRKi 

ka felerlGAFI AYEKQYKRKi 

LLdyprika felerlGAFI AYEKQYKRKi 

LLdyprika felerlGAFI AYEKQYKRKi 

ika felerlGAFI AYBKQYKRKt 

LLdyprika felerlGAFI AYEKQYKRKt 

milkicraay slqwggvyql aLLdyprika felerlGAFI AYBKQYKRKt 

LLdyprika felerlGAFI AYEKQYKRKt 

-LLdyprika felerlGAFI AYEKQYKRKt 
-LLdyprika felerlGAFI AYEKQYKRKt 



********** ********** ***_ 



msal85358 
msal8S35B.2{271 
tnsal85358. 
msal8S358 
msal85358.2 
msal85358.2 
rDsal85358.2 
msal85358.2 
msal85358.2 
msal85358.2 
msalB5358.2 



.2{271_090 
_JM9130013 
2(271_H36B 
2{271_A909 
271_CJB110 
271 1169NT 
271~1BRS21 



271_2603 

271_M732 

271J4781 

271_COHl} 

Consensus 



51 

EIQCDDKHLL 
EIQCDDKHLL 
EIQCDDKHLL 
EIQCDDKHLL 
EIQCDDKHLL 
EIQCDDKHLL 
EIQCDDKHLL 
EIQCDDKHLL 
EIQCDDKHLL 
EIQCDDKHLL 
EIQCDDKHLL 



tKIVHFLKYN 
tKIVHFLKYN 
tKIVHFLKYN 
tKIVHFLKYN 
tKIVHFLKYN 
aKIVHFLKYN 
aKIVHFLKYN 
aKIVHFLKYN 
aKIVHFLKYN 
aKIVHFLKYN 
aKIVHFLKYN 



SFTFPYIPKY 
SFTFPYIPKY 
SFTFPYIPKY 
SFTFPYIPKY 
SFTFPYIPKY 
SFTFPYIPKY 
SFTFPYIPKY 
SFTFPYIPKY 
SFTFPYIPKY 
SFTFPYIPKY 
SFTFPYIPKY 



RBAAATFNED 
REAAATFNED 
RBAAATFNED 
RBAAATFNED 
RBAAATFNED 
REAAATFNED 
REAAATFNED 
RBAAATFNED 
REAAATFNED 
RBAAATFNED 
REAAATFNED 



100 

GISLTSDFLS 
GISLTSDFLS 
GISLTSDFLS 
GISLTSDFLS 
GISLTSDFLS 
GISLTSDFLS 
GISLTSDFLS 
GISLTSDFLS 
GISLTSDFLS 
GISLTSDFLS 
GISLTSDFLS 



msal85358.2{271_090 
msal85358.2{271_JM9130013 
msal85358.2{271_H36B 
rasal85358.2{271_A909 
msalB5358 .2f271_CJB110 
msal85358 .2{271_1169NT 
tnsal85358 .2{271_18RS21 
msal85358.2{271_2603 
rasal85358.2(271_M732 
tnsal 8 5358 .2(271_M781 
msa!85358 .2{271_COHl 



101 

HTCTIETAKL' 
HTCTIETAKL 
HTCTIETAKL 
HTCTIETAKL 
HTCTIETAKL 
HTCTIETAKL 
HTCTIETAKL 
HTCTIBTAKL 
HTCTIETAKL 
HTCTIBTAKL 
HTCTIETAKL 



I FKEGKI LSA 
I FKEGKI LSA 
I FKEGKI LSA 
I FKEGKI LSA 
I FKEGKI LSA 
I FKEGKI LSA 
I FKEGKI LSA 
I FKEGKI LSA 
I FKEGKI LSA 
I FKEGKI LSA 
I FKEGKI LSA 



VKAFNKPAEV 
VKAFNKPAEV 
VKAFNKPAEV 
VKAFNKPAEV 
VKAFNKPAEV 
VKAFNKPAEV 
VKAFNKPAEV 
VKAFNKPAEV 
VKAFNKPAEV 
VKAFNKPAEV 
VKAFNKPAEV 



LVnDKRNAAG 
LVnDKRNAAG 
LVnDKRNAAG 
LVnDKRNAAG 
LVnDKRNAAG 
LVnDKRNAAG 
LVkDKRNAAG 
LVkDKRNAAG 
LVkDKRNAAG 
LVkDKRNAAG 
LVkDKRNAAG 



150 

DPKDYFDYVM 
DPKDYFDYVM 
DPKDYFDYVM 
DPKDYFDYVM 
DPKDYFDYVM 
DPKDYFDYVM 
DPKDYFDYVM 
DPKDYFDYVM 
DPKDYFDYVM 
DPKDYFDYVM 
DPKDYFDYVM 
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Consensus 



msal8535B 
msal85358 .2(271 
msal85358 
msal85358 . 
msal85358 .2 
msal65358.2 
msal85358.2 
msal85358 .2 
msal85358.2 
msal85358.2 
maal85358 .2 



.2{271_090 
_JM9130013 
2{271_H36B 
2{271_A909 
271_CJB110 
271 1169NT 
271~18RS21 



271_2603 
271J4732 
271_M7B1 
271_COHl 
Consensus 



151 

LNWSNTNSGY 
LNWSNTNSGY 
LNWSNTNSGY 
LNWSNTNSGY 
LNWSNTNSGY 
LNWSNTNSGY 
LNWSNTNSGY 
LNWSNTNSGY 
LNWSNTNSGY 
LNWSNTNSGY 
LNWSNTNSGY 



msal85358 
msal85358.2{271 
msal85358 . 
msal85358 
msal85358 
msal85358 
msal85358 
msa!85358 
msal85358 
msal85358 
msal85358 



2{271_090; 
L_JM9130013 
2{271_H36B 
5B.2{271__A909 
,2{271_CJB110 
.2I271_1169NT 
.2{271_18RS21 
2l271_2603 
2{271_M732 
2(271_M781 
2{271_C0H1 
Consensus 



RLVMERLLGK 
RLVMERLLGK 
RLVMERLLGK 
RLVMERLLGK 
RLVMERLLGK 
RLVMERLLGK 
RLVMERLLGK 
RLVMERLLGK 
RLVMERLLGK 
RLVMERLLGK 
RLVMERLLGK 



APSEQELTVa 
APSEQELTVa 
APSEQELTVa 
APSEQELTVa 
APSEQELTVa 
APSEQBLTVg 
APSEQELTVg 
APSEQBLTVg 
APSEQELTVg 
APSEQELTVg 
APSEQELTVg 



FKPGVSFHFn 
FKPGVSFHFn 
FKPGVSFHFn 
FKPGVSFHFn 
FKPGVSFHFn 
FKPGVSFHFt 
FKPGVSFHFt 
FKPGVSFHFt 
FKPGVSFHFt 
FKPGVSFHFt 
FKPGVSFHFt 



200 

YQD1INHPDS 
YQDIINHPDS 
YQDI INHPDS 
YQDIINHPDS 
YQDIINHPDS 
YQDIINHPDS 
YQDIINHPDS 
YQDIINHPDS 
YQDIINHPDS 
YQDIINHPDS 
YQDIINHPDS 



201 

IFDGYHPAKI 
IFDGYHPAKI 
IFDGYHPAKI 
IFDGYHPAKI 
IFDGYHPAKI 
IFDGYHPAKI 
IFDGYHPAKI 
IFDGYHPAKI 
IFDGYHPAKI 
IFDGYHPAKI 
IFDGYHPAKI 



KNQLSLAEHL 
KNQLSLAEHL 
KNQLSLAEHL 
KNQLSLAEHL 
KNQLSLAEHL 
KNQLSLAEHL 
KNQLSLAEHL 
KNQLSLAEHL 
KNQLSLAEHL 
KNQLSLAEHL 
KNQLSLAEHL 



VACVIPKHYQ 
VACVIPKHYQ 
VACVIPKHYQ 
VACVIPKHYQ 
VACVIPKHYQ 
VACVIPKHYQ 
VACVIPKHYQ 
VACVIPKHYQ 
VACVIPKHYQ 
VACVIPKHYQ 
VACVIPKHYQ 



EDYQsLVPND 
EDYQsLVPND 
EDYQsLVPND 
EDYQsLVPND 
EDYQsLVPND 
EDYQnLVPND 
EDYQsLVPND 
EDYQsLVPND 
EDYQSLVPND 
EDYQsLVPND 
EDYQsLVPND 



250 

LKHRVYYLDY 
LKHRVYYLDY 
LKHRVYYLDY 
LKHRVYYLDY 
LKHRVYYLDY 
LKHRVYYLDY 
LKHRVYYLDY 
LKHRVYYLDY 
LKHRVYYLDY 
LKHRVYYLDY 
LKHRVYYLDY 



msal85358.2{271_090 f 
msal85358.2{271_JM9130013 ) 
msal85358.2(271_H36B 
msal85358 .2(271_A909 
msal85358.2(271_CJB110 > 
' msal85358.2{271_1169NT> 
msal85358.2{271_18RS21j 
msal85358.2{271_2603 
msal85358.2< 271_M732 
msal853 58.2(27 1_M7 81 
niaal85358.2{271_COHl \ 
Consensus 



251 272 
CNETLYEWNQ KVYDFLcHLE NK 
CNETLYEWNQ KVYDFLcHLE NK 
CNETLYEWNQ KVYDFLcHLE NK 
CNETLYEWNQ KVYDFLcHLE NK 
CNETLYEWNQ KVYDFLcHLE NK 
CNETLYEWNQ KVYDFLcHLE NK 
CNETLYEWNQ KVYDFLcHLE NK 
CNETLYEWNQ KVYDFLcHLE NK 
CNETLYEWNQ KVYDFLxHLE NK 
CNETLYEWNQ KVYDFLcHLE NK 
CNETLYEWNQ KVYDFLwHLE NK 
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SBQ ZD NO. 6301 

STRAIN 2603 

ATGAAAAGTOSAAAAAAAGATAAATTGGTATTGAGGTO 

GGTTTGGGTGGGGTTTGGTTTTATAATTATAAAAA 

AGTGCATCXSGATCAAACGACGACTTTTATTCAAACGATT^ 

TCTAAGACCTATGATTTGTATGCGTCAGTCTTATTAGCACA AG 

AGTGGACAATCAGATTTGTCTAAGGCTCCTAATTATAACCTCTT^ 

TATAAAGGTAAATCTGTCCAAATGCCTACTTTAGAAGATGATGGGAAA 

OVAATCXyVAGCTCCTTTTCGCGCCrATC^ 

GAGTTAGTATCTAGTCAAAAGTATG CATCTGTTTGGAAATCAAATACCTCTTCTTATAAG 
GATGCTACTGCAG CTCTAACAGGTCITTATG CGAGAGATACTX3CTITATGCrAGTAAATTA 
AACCAAATTATTGAAACCTACAGTCTAGATGCTTATGATAAA 

3EQ ID NO. 6302 

STRAIN 090 

GGGGTTTGGTTTTATAATTATAA • 

AAATGATAATGTCGAACCX3ACAGTCACTAGTG CATOGGATCAAACGACGA 

CITTTATTCAAACX3ATTTCTCCAACAGCTATTGAA 

GATTTGTATGCGTCAGTCTTATTAGCACAA^ 

TGGACAATCAGATTTGTCTAAGGCTCC^AATrATAA CCTC l-lUtX3 CATCA 

AAGGAGAATATAAAGGTAAATCTGTCCAAATGCCTACTTTA 

GGGAAAGGCAATATGACTCAAATCCAAGCTCCTTTTCGC^ 

TTATTCTGCTTCACT ATATG ATTATG CTGAGTTAGTATCTAGTCAAAAGT 

ATGCATCTGTTTGGAAATCAAATACCTCITCTTAT^ 

G CTCTAACAGGTCTTTATGCGACAGATACTGCTTATG CTAGTAAATTAAA 

CCAAATTATTGAAACCTACAGTCrAGATG CTTATGATAAA 

SBQ ID NO. 6303 
STRAIN A909 

GGGGTTTGGTTTTATAATTATAA 

AAATGAT AATGTCGAACCGACAGTCACTAGTG CATC GGAT CAAACGACGA 

CTTTTATTCAAACXSATTTCTCCAACA^ 

GATTTGTATGCGTCAGTCTTATTAGCACAAGCT 

TGGACAATCAGATTTGTCTAAGGCTCCTAATTATAA CCT^ 

AAGGAGAATATAAAGGTAAATCTGTCCT^AATGCCTACl'lTAGAAGATGAT 

GGGAAAGGCAATATGACTCAAATCCAAGCTCXrrTTT^ 

TTATTCTGCTTCACTATATGATTATGCTGAff 

ATGCATCTGCTTGGAAATCAAATACTTCTKOT 

GCTCTAACAGGTCTTTATGCXiACAGATACrGCT^ 

CCAAATTATTGAAACCTACAGTCrAGATGCTTATGATAAA 

SBQ ID NO. 6304 
STRAIN H36B 

GGGGTTTGGTTTTATAATTATAAAAATGATA 

ATGTCGAACCGACAGTCACTAGTGCATCGGATCAAACX^ 

CAAAC^TTTCrCCAACAGCrATTOAAAT^ 

TGCGTCAGTCTTATTAGCACAAGCTATTTT^ 

CAGATTTGTCTAAGGCTCCTAATTATAACCr^^ 

TATAAAGGTAAATCTGTCCAAATGCCTACTTTAGAAGATGATGGGAA 

CAATATGACTCAAATCCAAGCKXriTTTCGCG 

GCTTGGAAATCAAATACTTCTTCTTATAAGGATGCTACTGCAGCT 

AGGTCTTTATGCXjACAGATACTGCTTATGCT^ 

TTGAAACCTACAGTCTAGATGCTTATGATAAA 

SBQ ZD NO. 6305 
STRAIN 18RS21 

GGGGTTTGGTTTTATAATTATAAAAATGATAATG 

TCGAACCGACAGTCACTAGTGCATCGGATCAAAC^ 

acgatttctccaacagctattgaaatttctaagacctat^ 

gtcagtcttattagcacaagctattttggaatca^ 

atttgtctaaggctcctaattataacct^ 

aaaggtaaatctgtccmatgcctacot 

tatgactcaaatca\agctccttttcgcx3cctatccaaat^ 

cactatatgattatgctgagttagtatctagtcaaaact 

tggaaatcaaatacctcrrcttataaggatgctactgcagctct 

tcittatgcgacagatactgcttatgctagtaa^ 

aaacctacagtctagatgcttatgataaa 

SBQ ZD NO. 6306 
STRAIN M732 

GGX5 G T 1T G GTTT TATAATTATAA 

AAATGATAATGTCGAACCGACAGTCJICTAGTGCATOGGATCA^ 
CTTTTATTCAAACX3ATTTCTCCAACAGCTAT 

GATTTGT ATGCGTCAGTCTT ATTAG CACAAG CTATTTTGGAATCATCCAG 
TGGACAATCAGATTTGTCTAAGGCTCCTAATTATAACCTCT 
AAGGAGAATATAAAGGTAAATCTGTCCAAATGCCTACTr^ 
OGGAAAGGCAATATGACTCAAATCCAAGCrCCrTT^ 
TTATTCTX3CTTCACTATATGATTATGCTGAGTTAOT 
. ATGCATCTGTTTGGAAATCAAATACTTCTTCrTATAAGGATC 
GCTCTAACAGGTCrTTATGCGACAGATACTO 
CCAAATT ATTGAAACCTACAGTCTAGATG CTTATGATAAA 
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SEQ ZD HO. 6307 
STRAIN COH1 

GGGGTTTGGTTTTATAATTATAA 

AAATGATAATGTCGAACC^CAGTCACTAGTGGATCGGATCAAACGACXSA 
CTTTTATTCAAACGATTTCTCCAACAGCT^^ 
GAlTTGTATGCXaTCAGTCrTATTAGCACAAGCTATTTT^ 
TGGACAATCAGATTTGTCTAAGGCTCCrrAA 

AAGGAGAATATAARGGTAAftTCrGTCCAAATG CCTA CTTTAGAA^ 

GGGAAAGGC^TATGACTCAAATCCAAGCTCCTTTT^ 

TTATTCTGCTTCACTATATGATTATGCTGAGTTA 

ATGCATCTCTTTGGAAATCAAATACTrCrTCTr 

GCTCTAACAGGTCTTTATGCGACAGATACTGCTTATGCTAGTAAA 

CCAAATTATTGAAACCTACAGTCTAOATGCTTATGATAAA 

SEQ ID NO. 6308 
STRAIN M781 

GGGGTTTGGTTTTATAATTATAAAAATGA 

TAATGTCGAACCGACAGTCACTAGTGCAT CGG AT CAAACGACGACTTTTA 

TTCAAACGATTTCTCCAACMCTATTGAAATTTCT 

TATGOSTCAGTCTTATTAGCACAAGCTATTTrGGAATCATCCA 

ATCAGATTTGTCTAAGGCTCCTAATTATAACCT^ 

AATAT AAAGGTAAATCTGT CCAAATGCCTACTTTAGAAGATGATG 

GGCAATATGACTCAAATCCAAGCTCCTTTTOG 

TGCTTCACTATATGATTATGCTGAGTTAGTATCTAGTCAAAAGTA 

CTGTTTGGAAATCAAATACTTCITCTTATA 

ACAGGTCTTTATGCGACAGATACnXSCT^ 

TATTGAAACCTACAGTCTAGATGCTTATGATAAA 

SEQ ID NO. 6309 
STRAIN CJB 110 

GGGGTTTGGTTTTATAATTATAAAAATGATAATGT 

CGAACCGACAGTCACTAGTGCATOK^TCAAACG^ 

QQATTTCTCCAACAGCTATTGAAATTTCTAAG^ 

TCAGTCTTATTAGCACAAGCTATTTTGGAATC^ 

TTTGTCTAAGGCTCCTAATTATAACCrCTTTGGC^ 

AAGGTAAATCTGTCCAAATCCCTACTTTAGAAGATGATGGGAAAG^ 

ATGACTCAAATCCAAGCTCCTTTTCGCGCCTATC 

ACTrATATGATTATGCTGAGTTAGTATCTAGT 

GGAAATCAAATACCTCITCrrrATAAGGATGCTACTG^ 

CTTTATGCGACAGATACTGCTTATGCTAGTAAAT^ 

AACCTACAGTCTAGATGCTTATGATAAA 

SEQ ID NO. 6310 
STRAIN 1169NT 

GGGGTTTGGTTTTATAATTATAAAAATGATAATGT 

CGAACAGACAGTCACTAGTGCAltXK^TCAA^ 

CGATTTCCCCAACAG<TrATT<3AA 

TCAGTCTTATTAGCACAAGCTATTT^ 

TTTGTCTAAGGCrcCTAATTATAACCTCrT^ 

AAGGTAAATCTGTCCAAATGCXrTACTTTAGJVA.GA 

ATQACTCAAATCCAAGCTCCTTTTCGCGCCrr 

ACTATATGATTATGCTGAGTTAGTATCTAGTCAAAAGTAT^ 

GGAAATCAAATACTTCTTCTTATAAGGATG CTACTGCAGCTCTAACAGGT 

CTTTATGCGACAGATACTGCTTATGCTAGTAAA 

AACCTACAGTCTAGATGCTTATGATAAA 

SEQ ID NO. 6311 

• STRAIN JM9 13001 3 
TTTGGTTTTATAATTATAAAAATGATAATGTC 
GCATCXaGATCAAACGACGACTTTTATTCAAA^^ 
TGAAATTTCTAAGACCTATGATTTGTATGCGTCAGTCT^ 
CTATTTTGGAATCATCCAGTGGACAATCAGATTTGTCT 
TATAACCTCTTTGG (^TCAAAGGAGAATATAAAGGTAAATCTGTTCAAAT 
GCCIACTTTAGAAGATGATGGGAAAGGTAATATG^ 

CTTTTCS3CG CCTATCCAAATTATTCTG CTTCACT ATA 

• TTAGTATCTAGTCAAAAGTATGCATCTGTTTCGA^ 
TTATAAGGATGCTACTGCAGCICTAACAGGTCTTTATGC^ 
CTTATGCTAGTAAATTAAACCAAATTATTGAAAA CT 
TATGATAAA 

PRETTY oft /biotrap/msa243324.2{*} February 11, 2003 05sll 

SO 



msa243324 . 2 (27 5_A909 
maa243324.2(275_H36B 
msa243324.2{275 090 

msa243324.2{275_18RS21 
msa243324 .2(275 2603 

mea243324.2{275 CJB110 
tnaa243324 .2(275^C0H1 
msa243324 . 2 (275_M732 



atgaaaagtc gaaaaaaaga taaattggta ttgaggttaa caacaacact 
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msa243324.2{275_M78l} — 



maa243324 . 2 { 275JU69NT) 
msa243324 . 2 { 275_JM9130013 } 
Consensus 



msa243324 . 2 (275_A909 
msa243324.2{275_H36B 
msa243324. 2 {275_090 ) 
msa243324 . 2 { 275JL8RS2 1 
msa243324.2{275_2603 
msa243324.2{275_CJB110 
msa2 4 3 3 2 4 . 2 ( 2 7 5_COHl 
msa243324 . 2 275_M732 
rasa243324.2{275_M781 
msa243324.2{275_1169NT 
maa243324 . 2 {275_JM9130013 . 

Consensus 



51 100 

-~ g gggTTTGGTT TTATAATTAT AAAAATGATA 

g gggTTTGGTT TTATAATTAT AAAAATGATA 

' _g gggTTTGGTT TTATAATTAT AAAAATGATA 

„ g gggTTTGGTT TTATAATTAT AAAAATGATA 

attggttttt ggtttgggtg gggTTTGGTT TTATAATTAT AAAAATGATA 

. -g gggTTTGGTT TTATAATTAT AAAAATGATA 

. g gggTTTGGTT TTATAATTAT AAAAATGATA 

g gggTTTGGTT TTATAATTAT AAAAATGATA 

g gggTTTGGTT TTATAATTAT AAAAATGATA 

g gggTTTGGTT TTATAATTAT AAAAATGATA 

. TTTGGTT TTATAATTAT AAAAATGATA 



101 

msa243324.2{275_A909) ATGTCGAACc 

msa243324.2{275_H36B ATGTCGAACC 

msa243324.2{275_090 ATGTCGAACC 

msa243324.2{275_18RS21 ATGTCGAACc 

n»sa243324.2{275_2603 ATGTCGAACC 

msa243324.2{275_CJB110} ATGTCGAACc 

msa243324.2(275 COH1 ATGTCGAACC 

tnsa243324.2(2753l732 ATGTCGAACC 

msa243324.2(275_M781 ATGTCGAACC 

msa243324.2{275_1169NT ATGTCGAACa 

msa243324.2{275_JM9130013} ATGTCGAACC 

Consensus *********- 



GACAGTCACT 
GACAGTCACT 
GACAGTCACT 
GACAGTCACT 
GACAGTCACT 
GACAGTCACT 
GACAGTCACT 
GACAGTCACT 
GACAGTCACT 
GACAGTCACT 
GACAGTCACT 



AGTGCATCGG 
AGTGCATCGG 
AGTGCATCGG 
AGTGCATCGG 
AGTGCATCGG 
AGTGCATCGG 
AGTGCATCGG 
AGTGCATCGG 
AGTGCATCGG 
AGTGCATCGG 
AGTGCATCGG 



ATCAAAOGAC. 
ATCAAACGAC 
ATCAAACGAC 
ATCAAACGAC 
ATCAAACGAC 
ATCAAACGAC 
ATCAAACGAC 
ATCAAACGAC 
ATCAAACGAC 
ATCAAACGAC 
ATCAAACGAC 



150 

GACTTTTATT 
GACTTTTATT 
GACTTTTATT 
GACTTTTATT 
GACTTTTATT 
GACTTTTATT 
GACTTTTATT 
GACTTTTATT 
GACTTTTATT 
GACTTTTATT 
GACTTTTATT 



msa24 3 3 24 . 2 ( 27 5_A9 0 9 ] 
msa243324 . 2 { 275_H36B 
msa243324 . 2 {275__090 
msa243324 .2{275_18RS21 
msa243324.2{275_2603 
msa243324 . 2 {275_CJB110 
msa2 43 3 24.2(27 5 JCOH1 
msa243324.2{275_M732 
msa243324 ,2{275_M781 
msa243324 . 2{275_1169NT 
msa243324 . 2 { 275_JM9130013 
Consensus 



msa243324 . 2 ( 275_A909 
rosa243324 . 2{275_H36B 
msa243324.2{275_090 
msa243324 . 2 {275_18RS21 
msa243324 . 2{275_2603 
insa243324.2{275_CJB110 
msa243324.2(275 - COHl 
msa243324.2{275_M732 
msa243324.2{275_M781 
msa243324 . 2 {275_1169NT 
msa243324.2{275_JM9130013 
Consensus 



msa243324.2(275_A909; 
msa243324 . 2 { 275_H36B 
tnsa243324 . 2 {27S_090 
msa243324.2{275_18RS21 
msa243324 . 2 { 275_2603 
msa243324 , 2 { 275JCJB110 
rosa243324.2{275 - _COHl 
msa243324 . 2 I 275_M732 
msa243324.2{275_M781 
msa243324 . 2 {275_1169NT 
msa243324.2{275 JM9130013) 
" consensus 



msa243324.2{275_A909 

msa243324.2{275_H36B 
msa243324.2{275_090 
msa243324 . 2 { 275_18RS2 1 

msa243324 . 2 {275_2603 
msa243324 .2{275_CJB110 

msa243324 . 2 { 275 JC0H1 



151 

CAAACGATTT 
CAAACGATTT 
CAAACGATTT 
CAAACGATTT 
CAAACGATTT 
CAAACGATTT 
CAAACGATTT 
CAAACGATTT 
CAAACGATTT 
CAAACGATTT 
CAAACGATTT 



CtCCAACAGC 
CtCCAACAGC 
CtCCAACAGC 
CtCCAACAGC 
CtCCAACAGC 
CtCCAACAGC 
CtCCAACAGC 
CtCCAACAGC 
CtCCAACAGC 
CcCCAACAGC 
CcCCAACAGC 



TATTGAAATT 
TATTGAAATT 
TATTGAAATT 
TATTGAAATT 
TATTGAAATT 
TATTGAAATT 
TATTGAAATT 
TATTGAAATT 
TATTGAAATT 
TATTGAAATT 
TATTGAAATT 



TCTAAGACCT 
TCTAAGACCT 
TCTAAGACCT 
TCTAAGACCT 
TCTAAGACCT 
TCTAAGACCT 
TCTAAGACCT 
TCTAAGACCT 
TCTAAGACCT 
TCTAAGACCT 
TCTAAGACCT 



200 

ATGATTTGTA 
ATGATTTGTA 
ATGATTTGTA 
ATGATTTGTA 
ATGATTTGTA 
ATGATTTGTA 
ATGATTTGTA 
ATGATTTGTA 
ATGATTTGTA 
ATGATTTGTA 
ATGATTTGTA 



201 

TGCGTCAGTC 
TGCGTCAGTC 
TGCGTCAGTC 
TGCGTCAGTC 
TGCGTCAGTC 
TGCGTCAGTC 
TGCGTCAGTC 
TGCGTCAGTC 
TGCGTCAGTC 
TGCGTCAGTC 
TGCGTCAGTC 



TTATTAGCAC 
TTATTAGCAC 
TTATTAGCAC 
TTATTAGCAC 
TTATTAGCAC 
TTATTAGCAC 
TTATTAGCAC 
TTATTAGCAC 
TTATTAGCAC 
TTATTAGCAC 
TTATTAGCAC 



AAGCTATTTT 
AAGCTATTTT 
AAGCTATTTT 
AAGCTATTTT 
AAGCTATTTT 
AAGCTATTTT 
AAGCTATTTT 
AAGCTATTTT 
AAGCTATTTT 
AAGCTATTTT 
AAGCTATTTT 



GGAATCATCC 
GGAATCATCC 
GGAATCATCC 
GGAATCATCC 
GGAATCATCC 
GGAATCATCC 
GGAATCATCC 
GGAATCATCC 
GGAATCATCC 
GGAATCATCC 
GGAATCATCC 



250 

AGTGGACAAT 
AGTGGACAAT 
AGTGGACAAT 
AGTGGACAAT 
AGTGGACAAT 
AGTGGACAAT 
AGTGGACAAT 
AGTGGACAAT 
AGTGGACAAT 
AGTGGACAAT 
AGTGGACAAT 



251 

CAGATTTGTC 
CAGATTTGTC 
CAGATTTGTC 
CAGATTTGTC 
CAGA TTTGT C 
CAG ATTTGTC 
CAG ATTTGTC 
CAGATTTGTC 
CAGATTTGTC 
CAGATTTGTC 
CAGATTTGTC 



TAAGGCTCCT 
TAAGGCTCCT 
TAAGGCTCCT 
TAAGGCTCCT 
TAAGGCTCCT 
TAAGGCTCCT 
TAAGGCTCCT 
TAAGGCTCCT 
TAAGGCTCCT 
TAAGGCTCCT 
TAAGGCTCCT 



AATTATAACC 
AATTATAACC 
AATTATAACC 
AATTATAACC 
AATTATAACC 
AATTATAACC 
AATTATAACC 
AATTATAACC 
AATTATAACC 
AATTATAACC 
AATTATAACC 



TCTTTGGCAT 
TCTTTGGCAT 
TCTTTGGCAT 
TCTTTGGCAT 
TCTTTGGCAT 
TCTTTGGCAT 
TCTTTGGCAT 
TCTTTGGCAT 
TCTTTGGCAT 
TCTTTGGCAT 
TCTTTGGCAT 



300 

CAAAGGAGAA 
CAAAGGAGAA 
CAAAGGAGAA 
CAAAGGAGAA 
CAAAGGAGAA 
CAAAGGAGAA 
CAAAGGAGAA 
CAAAGGAGAA 
CAAAGGAGAA 
CAAAGGAGAA 
CAAAGGAGAA 



301 

TATAAAGGTA 
TATAAAGGTA 
TATAAAGGTA 
TATAAAGGTA 
TATAAAGGTA 
TATAAAGGTA 
TATAAAGGTA 



AATCTGTcCA 
AATCTGTCCA 
AATCTGTcCA 
AATCTGTCCA 
AATCTGTcCA 
AATCTGTcCA 
AATCTGTcCA 



AATGCCTACT 
AATGCCTACT 
AATGCCTACT 
AATGCCTACT 
AATGCCTACT 
AATGCCTACT 
AATGCCTACT 



TTAGAAGATG 
TTAGAAGATG 
TTAGAAGATG 
TTAGAAGATG 
TTAGAAGATG 
TTAGAAGATG 
TTAGAAGATG 



350 

ATGGGAAAGG 
ATGGGAAAGG 
ATGGGAAAGG 
ATGGGAAAGG 
ATGGGAAAGG 
ATGGGAAAGG 
ATGGGAAAGG 
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msa243324.2(275_M732 
msa243324.2{275_M781 
msa243324.2{275_1169NT 
msa243324.2{275_JM9130013 
Consensus 



msa243324 . 2 ( 275_A909 
msa243324.2{275_H36B 
rasa243324 . 2 {275 J)90 
msa243324 .2{275JL8RS21 
maa243324.2t275_2603 
msa243324.2{275_CJB110 

~'275_COHl 

275J4732 
275 M781 



TATAAAGGTA AATCTGTcCA AATGCCTACT TTAGAAGATG ATGGGAAftGG 
TATAAAGGTA AATCTGTcCA AATGCCTACT TTAGAAGATG ATGGGAAAGG 
TATAAAGGTA AATCTGTcCA AATGCCTACT TTAGAAGATG ATGGGAAAGG 
TATAAAGGTA AATCTGTtCA AATGCCTACT TTAGAAGATG ATGGGAAAGG 



msa243324.2 
msa243324.2 
11183243324.2,- . 
maa243324 . 2 {275_1169NT 
msa243324 .2{275_JM9130013 
Consensus 



msa243324 . 2 f 275_A909 
msa243324 .2{275_H36B 
msa243324 . 2 {275_090 
msa243324 . 2 { 275JL8RS21 
msa243324 . 2{275_2603 
msa243324 . 2 { 275_CJB110 
msa243324.2{275_COHl 
msa243324.2(27S_M732 
msa243324. 2 {275_M781 
msa243324 .2{275_1169NT 
msa243324.2{275_JM9130013_ 
Consensus 



tnsa243324 . 2 f 275_A909 
msa243324.2{275_H36B 
msa243324.2{275_090 
msa243324 . 2 { 275_18RS21 
msa243324 . 2 {275_2603 
msa243324 . 2 { 27 5_CJB110 
msa243324 . 2 ( 275_C0H1 
msa243324 . 2 ( 275_M732 
msa243324.2{275_M781 
msa243324 .2{275_1169NT 
msa243324.2{275_JM9130013 
Consensus 



msa243324 . 2 { 275_A909 ' 
msa243324.2{27S_H36B ( 
msa243324 . 2 { 275_090 ( 
msa243324 . 2 { 275_18RS21 
msa243324.2{275_2603 
msa243324 . 2 { 275_CJB110 
msa243324 . 2{ 275_C0H1 
maa243324.2(275_M732 
msa243324 . 2 { 275_M781 
msa243324 . 2 { 275_1169NT 
msa243324 . 2{275_JM9130013 
Consensus 



351 

cAATATGACt 
cAATATGACt 
CAATATGACt 
CAATATGACt 
CAATATGACt 
CAATATGACt 
CAATATGACt 
CAATATGACt 
CAATATGACt 
cAATATGACt 
tAATATGACc 



CAAATCCAAG 
CAAATCCAAG 
CAAATCCAAG 
CAAATCCAAG 
CAAATCCAAG 
CAAATCCAAG 
CAAATCCAAG 
CAAATCCAAG 
CAAATCCAAG 
CAAATCCAAG 
CAAATCCAAG 



CTCCTTTTCG 
CTCCTTTTCG 
CTCCTTTTCG 
CTCCTTTTCG 
CTC CTTTTC G 
CTCCTTTTCG 
CTCCTTTTCG 
CTCCTTTTCG 
CTCCTTTTCG 
CTCCTTTTCG 
CTCCTTTTCG 



CGCCTATCCA 
CGCCTATCCA 
CGCCTATCCA 
CGCCTATCCA 
CGCCTATCCA 
CGCCTATCCA 
CGCCTATCCA 
CGCCTATCCA 
CGCCTATCCA 
CGCCTATCCA 
CGCCTATCCA 



400 

AATTATTCTG 
AATTATTCTG 
AATTATTCTG 
AATTATTCTG 
AATTATTCTG 
AATTATTCTG 
AATTATTCTG 
AATTATTCTG 
AATTATTCTG 
AATTATTCTG 
AATTATTCTG 



401 

CTTCACTATA 
CTTCACTATA 
CTTCACTATA 
CTTCACTATA 
CTTCACTATA 
CTTCACTATA 
CTTCACTATA 
CTTCACTATA 
CTTCACTATA 
CTTCACTATA 
CTTCACTATA 



TGATTATGCT 
TGATTATGCT 
TGATTATGCT 
TGATTATGCT 
TGATTATGCT 
TGATTATGCT 
TGATTATGCT 
TGATTATGCT 
TGATTATGCT 
TGATTATGCT 
TGATTATGCT 



GAGTTAGTAT 
GAGTTAGTAT 
GAGTTAGTAT 
GAGTTAGTAT 
GAGTTAGTAT 
GAGTTAGTAT 
GAGTTAGTAT 
GAGTTAGTAT 
GAGTTAGTAT 
GAGTTAGTAT 
GAGTTAGTAT 



CTAGTCAAAA 
CTAGTCAAAA 
CTAGTCAAAA 
CTAGTCAAAA 
CTAGTCAAAA 
CTAGTCAAAA 
CTAGTCAAAA 
CTAGTCAAAA 
CTAGTCAAAA 
CTAGTCAAAA 
CTAGTCAAAA 



450 

GTATGCATCT 
GTATGCATCT 
GTATGCATCT 
GTATGCATCT 
GTATGCATCT 
GTATGCATCT 
GTATGCATCT 
GTATGCATCT 
GTATGCATCT 
GTATGCATCT 
GTATGCATCT 



451 

GcTTGGAAAT 
GcTTGGAAAT 
GtTTGGAAAT 
GtTTGGAAAT 
GtTTGGAAAT 
GtTTGGAAAT 
GtTTGGAAAT 
GtTTGGAAAT 
GtTTGGAAAT 
GtTTGGAAAT 
GtTTGGAAAT 



CAAATACtTC 
CAAATACtTC 
CAAATACcTC 
CAAATACcTC 
CAAATACcTC 
CAAATACcTC 
CAAATACtTC 
CAAATACtTC 
CAAATACtTC 
CAAATACtTC 
CAAATACcTC 



TTCTTATAAG 
TTCTTATAAG 
TTCTTATAAG 
TTCTTATAAG 
TTCTTATAAG 
TTCTTATAAG 
TTCTTATAAG 
TTCTTATAAG 
TTCTTATAAG 
TTCTTATAAG 
TTCTTATAAG 



GATGCTACTG 
GATGCTACTG 
GATGCTACTG 
GATGCTACTG 
GATGCTACTG 
GATGCTACTG 
GATGCTACTG 
GATGCTACTG 
GATGCTACTG 
GATGCTACTG 
GATGCTACTG 



500 

CAGCTCTAAC 
CAGCTCTAAC 
CAGCTCTAAC 
CAGCTCTAAC 
CAGCTCTAAC 
CAGCTCTAAC 
CAGCTCTAAC 
CAGCTCTAAC 
CAGCTCTAAC 
CAGCTCTAAC 
CAGCTCTAAC 



501 

AGGTCTTTAT 
AGGTCTTTAT 
AGGTCTTTAT 
AGGTCTTTAT 
AGGTCTTTAT 
AGGTCTTTAT 
AGGTCTTTAT 
AGGTCTTTAT 
AGGTCTTTAT 
AGGTCTTTAT 
AGGTCTTTAT 



GCGACAGATA 
GCGACAGATA 
GCGACAGATA 
GCGACAGATA 
GCGACAGATA 
GCGACAGATA 
GCGACAGATA 
GCGACAGATA 
GCGACAGATA 
GCGACAGATA 
GCGACAGATA 



CTGCTTATGC 
CTGCTTATGC 
CTGCTTATGC 
CTGCTTATGC 
CTGCTTATGC 
CTGCTTATGC 
CTGCTTATGC 
CTGCTTATGC 
CTGCTTATGC 
CTGCTTATGC 
CTGCTTATGC 



TAGTAAATTA 
TAGTAAATTA 
TAGTAAATTA 
TAGTAAATTA 
TAGTAAATTA 
TAGTAAATTA 
TAGTAAATTA 
TAGTAAATTA 
TAGTAAATTA 
TAGTAAATTA 
TAGTAAATTA 



550 

AACCAAATTA 
AACCAAATTA 
AACCAAATTA 
AACCAAATTA 
AACCAAATTA 
AACCAAATTA 
AACCAAATTA 
AACCAAATTA 
AACCAAATTA 
AACCAAATTA 
AACCAAATTA 



msa243324.2{275_A909; 
msa243324.2{275_H36B 
msa243324.2{275_090 
msa243324.2{275 - 18RS21 
tnsa243324.2{275__2603 
rasa243324 . 2 { 275_CJB110 
msa243324 .2(275_C0H1 
msa243324.2i275_M732 
msa2 4 33 2 4 . 2 { 27 5_M7 8 1 
msa243324.2{275_1169NT 
msa243324 .2{275_JM9130013 
Consensus 



551 

TTGAAAcCTA 
TTGAAAcCTA 
TTGAAACCTA 
TTGAAACCTA 
TTGAAAcCTA 
TTGAAAcCTA 
TTGAAAcCTA 
TTGAAAcCTA 
TTGAAAcCTA 
TTGAAACCTA 
TTGAAAaCTA 



CAGTCTAGAT 
CAGTCTAGAT 
CAGTCTAGAT 
CAGTCTAGAT 
CAGTCTAGAT 
CAGTCTAGAT 
CAGTCTAGAT 
CAGTCTAGAT 
CAGTCTAGAT 
CAGTCTAGAT 
CAGTCTAGAT 



582 

GCTTATGATA AA 
GCTTATGATA AA 
GCTTATGATA AA 
GCTTATGATA AA 
GCTTATGATA AA 
GCTTATGATA AA 
GCTTATGATA AA 
GCTTATGATA AA 
GCTTATGATA AA 
GCTTATGATA AA 
GCTTATGATA AA 



SEQ ID NO. 6312 

STRAIN 2603 frame: 1 

MKSRKKDKLVLRLTTT1AVFGLGGVWFYN 
SKTYDLYASVIJJVQAILESSSGQSDLSKAPNYNLFGIKGEYra 

QI GAP FRAYPNYSAS L YD YAEL VS SQKYAS VV7KSNTS S YKDATAALTGL YATDTAYAS KL 
NQIIBTYSLDAYDK 



948 



WO 2004/018646 



PCT/US2003/026827 



Table 63: Comparative Sequences relating to SAG1912 



SBQ ID MO. 6313 
STRAIN 090 frame: 1 . 

GVW P YNYKNDNVE PTVTSASDQTTT F I QTT S PTA I E I S KTYDL YAS VLLAQA I LE S S SGQ 
SDLS KAPNYNLFG I KGE YKGKS VQMPTLEDDGKGNMTQ I QAP FRAYPNYSAS LYDYAELV 
SSQKYASVWKSNTSS YKDATAALTGLYATDTAYASKLNQ I IETYSLDAYDK 

SEQ XD MO. 6314 
STRAIN A909 frame: 1 

GVWFYNYKNDNVEPTVTSASDG/rTTFIQTISPTAIEI SKTYDLYASVLLAQAI LESS SGQ 

SDLSKAPNYNLFGIKGEYKGKSVQMPTLEDIX3KGNMTQIQAPFRAYPNYSASL 

S SQKYASAWKSm'SSYKDATAALTGLYATDTAYASKLNQI IETYSLDAYDK 

SEQ ZD MO. 6315 
STRAIN H36B frame: 1 

GVWFYNYKNDNVEPTVTSASDQTTTFIQTI S PTA IE I SKTYDLYASVLLAQAI LESS SGQ 
SDLS KAPNYNLFG I KGEYKGKSVQMPTLEDDGKGNMTQI QAP FRAY PNY SAS LYDYAELV 
SS QKYAS AWKSNTS S YKDATAALTGL YATDTAYAS KLNQ 1 1 ETYSLDAYDK 

SSQ ZD MO. 6316 
STRAIN 18RS21 frame: 1 

GVWFYNYKNDNVEPTVTSASDQTTTFIQTISPTAIEISKTYDLY^ 

SDLS KAPNYNLFG I KGEYKGKSVQMPTLEDDGKGNMTQI QAP FRAYPNYSAS LYDYAELV 
S SQKYASVWKSNTS S YKDATAALTGLYATDTAYAS KLNQ I IETYSLDAYDK 

SEQ ZD MO. 6317 
STRAIN M732 frame: I 

GVWFYNYKNDNVEPTVTSASDQTTTFIQTI SPTAIEI SKTYDLYASVLLAQAI LESS SGQ 
SDLSKAPNYNLFGI KGEYKGKSVQMPTLEDDGKGN>1TQIQ 
SSQKYASWKSNTSSYKDATAALTGLYATDTAYASKLNQI I ETYSLDAYDK 

SEQ ZD MO. 631ft 

STRAIN M781 frame: 1 

GVWFYNYKNDNVEPTVTSASDQTTTFI QTI SPTAIEI SKTYDLYASVLIAQAILESSSGQ 
SDLSKAPNYNLFGI KGEYKGKSVQMPTLEDDGKGNMTQ I QAP FRAYPNYSAS LYDYAELV 
SSQKYASWKSNTSSYKDATAALTGLYATDTAYASKLNQI IETYSLDAYDK 

SEQ ZD MO. 6319 
STRAIN CJB1 10 frame: 1 

GWFYNYKNDNVEPTVTSASDQTTTFIQTISPTAIEI SKTYDLYASVLLAQAI LESS SGQ 
SDLS KAPNYNLFGI KGEYKGKSVQMPTLEDDGKGNMTQ I QAPFRAYPNYSASLYD YAELV 
SSQKYASVWKSNTSSYKDATAALTGLYATDTAYASKLNQI IETYSLDAYDK 

SBQ ZD MO. 6320 
STRAIN 1 169NT frame: 1 

GVWFYNYKNDNVEQTVTSASDQTTTFIGT I SPTAIEI SKTYDLYASVLLAQAILESSSGQ 
SDLSKAPNYNLFGI KGEYKGKSVQMPTLEDDGKGNMTQ I QAPFRAYPNYSASLYDYAELV 
S SQKYASVWKSNTS SYKDATAALTGLYATDTAYAS KLNQ I IETYSLDAYDK 



SBQ ZD MO. 6321 
STRAIN JM9 130013 frame: 3 

WFYNYKNDNVEPTVTSASDQTTTF IQTIS PTAIE I SKTYDLYASVLLAQAI LESSSGQSD 
LSKAPNYNLFGIKGEYKGKSVQMPTLEDDGKGNMTQIQAPFRAYPNYSASLYDY 
QKYASVVnCSNTS SYKDATAALTGLYATDTAYAS KLNQ 1 1 ENYSLDAYDK 

PRETTY of j /biotnip/msa243476.2{*} February 11, 2003 05«17 



msa243476.2{275_090! 
msa243476.2{275_18RS21 j 
msa243476 . 2 { 275_2603 
msa243476 . 2 {275_CJB110 
msa243476 . 2 ( 275_M732 
msa243476 .2 275_M781 
msa243476 . 2 27S_A909 
msa243476.2{275_H36B 
rasa243476.2{275 JM9130013 
msa243476 .2{275_1169NT 
Consensus 



1 50 

-gvWFYNY KNDNVEpTVT SASDQTTTFI 

gvWFYNY KNDNVEpTVT SASDQ TTT FI 

mkerkkdklv lrltttllvf glggvWFYNY KNDNVEpTVT SASDQTTTFI 

gvWFYNY KNDNVEpTVT SASDQTTTFI 

gvWFYNY KNDNVEpTVT SASDQTTTFI 

gvWFYNY KNDNVEpTVT SASDQTTTFI 

gvWFYNY KNDNVEpTVT SASDQTTTFI 

gvWFYNY KNDNVEpTVT SASDQTTTFI 

WFYNY KNDNVEpTVT SASDQTTTFI 

gvWFYNY KNDNVEqTVT SASDQTTTFI 



msa243476 . 2 {275_090 
msa243476 . 2 {275_18RS21 
msa243476.2{275_2603 
msa243476.2{275 CJBllO 
msa243476 . 2 ( 275_M732 
maa243476.2< 275_M781 
tnsa243476 . 2 275JV909 
mBa243476.2{275~H36B 
msa243476 .2{275_JM9130013 
rasa243476.2{275_H69NT; 

Consensus 



51 

tfTI SPTAIEI 
QT I SPTAIEI 
QTISPTAIEI 
QTI SPTAIEI 
QT I SPTAIEI 
QTISPTAIEI 
QTISPTAIEI 
QTISPTAIEI 
QTISPTAIEI 
QTISPTAIBI 



SKTYDLYASV 
SKTYDLYASV 
SKTYDLYASV 
SKTYDLYASV 
SKTYDLYASV 
SKTYDLYASV 
SKTYDLYASV 
SKTYDLYASV 
SKTYDLYASV 
SKTYDLYASV 



LLAQAILESS 
LLAQAILESS 
LLAQAILESS 
LLAQAILESS 
LLAQAILESS 
LLAQAILESS 
LLAQAILESS 
LLAQAILESS 
LLAQAILESS 
LLAQAILESS 



SGQSDLSKAP 
SGQSDLSKAP 
SGQSDLSKAP 



SGQSDLSKAP 
SGQSDLSKAP 
SGQSDLSKAP 
SGQSDLSKAP 
SGQSDLSKAP 
SGQSDLSKAP 



100 

NYNLFGIKGE 
NYNLFGIKGE 
NYNLFGIKGE 
NYNLFGIKGE 
NYNLFGIKGE 
NYNLFGIKGE 
NYNLFGIKGE 
NYNLFGIKGE 
NYNLFGIKGE 
NYNLFGIKGE 



949 



WO 2004/018646 



PCT/US2003/026827 



Table 63: Comparative Sequences relating to SAG1912 



msa243476.2{275_090 
msa24347 6 . 2 { 275_18RS21 
msa243476.2{275_2603 
msa243476 . 2{275_CJB110 1 
msa243476,2(275JM732 
msa243476 . 2{275_M781 
msa243476.2{275_A909 
maa243476.2{275_H36B 
msa243476 . 2 { 275_JM9130013 
msa243476 . 2 { 27S_1169NT 
Consensus 



101 

YKGKSVQMPT 
YKGKSVQMPT 
YKGKSVQMPT 
YKGKSVQMPT 
YKGKSVQMPT 
YKGKSVQMPT 
YKGKSVQMPT 
YKGKSVQMPT 
YKGKSVQMPT 
YKGKSVQMPT 



LEDDGKGNMT 
LBDDGKGNMT 
LEDDGKGNMT 
LEDDGKGNMT 
LEDDGKGNMT 
LEDDGKGNMT 
LEDDGKGNMT 
LEDDGKGNMT 
LEDDGKGNMT 
LEDDGKGNMT 



QIQAPFRAYP 
QIQAPPRAYP 
QIQAPFRAYP 
QIQAPFRAYP 
QIQAPFRAYP 
QIQAPFRAYP 
QIQAPFRAYP 
QIQAPFRAYP 
QIQAPFRAYP 
QIQAPFRAYP 



NYSASLYDYA 
NYSASLYDYA 
NYSASLYDYA 
NYSASLYDYA 
NYSASLYDYA 
NYSASLYDYA 
NYSASLYDYA 
NYSASLYDYA 
NYSASLYDYA 
NYSASLYDYA 



150 

ELVSSQKYAS 
ELVSSQKYAS 
ELVSSQKYAS 
ELVSSQKYAS 
ELVSSQKYAS 
ELVSSQKYAS 
ELVSSQKYAS 
ELVSSQKYAS 
ELVSSQKYAS 
ELVSSQKYAS 



msa243476.2{275_090 
msa243476.2{275_18RS2l| 
msa243476 . 2{275_2603 
msa243476 . 2 { 275_CJB110 
msa243476.2{275_M732 
msa243476.2{275_M781 
rasa243476 . 2 (275_A909 
msa243476 . 2{275_H36B 
msa243476.2{275_JM9130013 
msa243476 . 2 { 275_1169NT 
Consensus 



151 

vWKSNTSSYK 
vWKSNTSSYK 
vWKSNTSSYK 
vWKSNTSSYK 
vWKSNTSSYK 
vWKSNTSSYK 
aWKSNTSSYK 
aWKSNTSSYK 
vWKSNTSSYK 
vWKSNTSSYK 



DATAALTGLY 
DATAALTGLY 
DATAALTGLY 
DATAALTGLY 
DATAALTGLY 
DATAALTGLY 
DATAALTGLY 
DATAALTGLY 
DATAALTGLY 
DATAALTGLY 



ATDTAYASKL 
ATDTAYASKL 
ATDTAYASKL 
ATDTAYASKL 
ATDTAYASKL 
ATDTAYASKL 
ATDTAYASKL 
ATDTAYASKL 
ATDTAYASKL 
ATDTAYASKL 



NQIIEtYSLD 
NQIIEtYSLD 
NQIIEtYSLD 
NQIIEtYSLD 
NQIIEtYSLD 
NQIIEtYSLD 
NQIIEtYSLD 
NQIIEtYSLD 
NQI IEnYSLD 
NQI IEtYSLD 



194 
AYDK 
AYDK 
AYDK 
AYDK 
AYDK 
AYDK 
AYDK 
AYDK 
AYDK 
AYDK 



950 



WO 2004/018646 



PCT/US2003/026827 



Table 64: Comparative Sequences relating to SAG 0827 



SEQ ZD NO. 6401 
STRAIN 2603 

ATGAACAAGTTCTAAGAAAATCGAAAATTATGAATTA 
TTCTCAGATGAAACAAATGCTCTTGCCAACTTATCAAAT 
ATGCTTCCAAATTCTGTATTTACAGGCTTTrATT^ 
GGCCCTTTCCAGGGTGGTGTATCATGTGTGCATATTA 

GAATCTGCACAAACTGCTAAGAOG CTGATCGTTGATGATGTTACAAAGKIATGCTAACTAT 

ATCTCCTGTGATTCAAAAGCTATGAGTGAAAT03TAGTACCTATGTTTAA 

CTTCTAGGAGTTCTAGATTTAGAITITI'^ 

GAATACTTAGAAAAATTTCTAGCTATTCT 

TTTGGAGTTGAAAAG 

SEQ ID NO. 6402 
STRAIN 090 

CTCTATTCrCAGATGAAACAAATGCTCTTGCCAACTTA 

TCAAATGCTTCAGCrATGCTAAATGCTATGCTTCCAA^ 

AGGCTTTTATTTATTTGATG<3AAAGGAGTTAAT^ 

GTGGTGTATO\TGTGTGCATATTACTTTAGGA 

TCTGCACAAACTGCTAAGACGCTQAITGTTGATGATGTTA 

TAACTATATCTCCTGTGATTCAAAAGCTATGAGTGAAATCCT 

TGTTTAAAAATGGCAAACTTCTAGGAGTrCTAGATTTAGA 

GTAGCAGATTATGATGAGATTGATCAAX3AATACITAGAA 

TATTCTAGTAGAACATACGATTTGK5AATTTGGATA 

SEQ ID NO. 6403 
STRAIN A509 

CrCTATTCTCAGATGAAACAAATGCTCTTGCCAA 

CTTATCAAATGCTTCAGCTATGCTAAATGC1ATGCT 

TTACAGGCTTTTATTTATTTGATGGAGAAGAGTTAAT 

CAGGGlXjGTGTATCATGTGTGCATATTAC'ri'i'AGGAAAAGGTu 

TGAATCTGCACAAACTG CTAAGACXXHXIATCXjTTGATGATGTTACAAAGC 

ATGCTAACTATATCTOTOrGATra^AAAGCT^ 

CCTATGTTTAT^AAATGGCAAACTTCTAGGAGTTCT 

TTTAGTAGCAGATTATGATGAGATTGATCAAGAA 

TAGGTATTCTAGTAGAACATACGATTTGGAATTTGG^ 

GAAAAG 

SEQ ID NO. - 6404 
STRAIN H36B 

CTCTATTCTCAGATGAAACAAATGCTCTTGC 

CAACTTATCAAATGCTTCAGCTATGCTAAaTGCT 

TAlTTACAGGCrrrTATTrATTTGATGG 

TTCCAGGGTGGTGTATCATGTGTGCATATTACTTTAG 

TGGTGAATCTGCACAAACTG CTAAGACXSCTGATCGT^ 

AGCATGCTAACTATATCTCCTGTGATTCAAAAGCT 

GTACCTATGTTTAAAAATGGCAAACTTCTAGGAGTTC^ 

TTCTTTAGTAGCAGATTATGATGAGATTGATCA 

TTGTAGGTATTCTAGTAGAACATACXaATTTGGAATTTGGAT^ 

GTTGAAAAG 

SEQ ID NO. 6405 
STRAIN 18RS21 

CTCTATTCTCAGATGAAACAAATGCTCTTG 

ATCAAATGCTTCAGCTATG CT AAATGCTATGCTTCCAAATTCTGTATTTA 

CAGGCTTTTATTTATTTGATGGAGAAGAGTTAAT^ 

GGTGGTGTATCATGTGTGCATATTACTTTAGGAAAAG 

ATCTGCACAAACTGCTAAGACGCTGATCGTTGATC 

CTAACTATATCTCCTGTGATTCAAAAGCTATGAG^ 

ATGTTTAAAAATGGCAAACTrCrAGGAGTTCTAGATT^ 

AGTAGCAGATTATGATGAGATTGATCAAGAATACTTAGAAAAA^ 

GTATTCTAGTAGAACATACGATTTGGAATTTGGATA 

AAG 

SEQ ID NO. 6406 
STRAIN M732 

CTXn*ATTCTCAGATGAAACAAATGCTCTTC 

ATCAAATGCTTCAGCTATGCTAAATGCTATGC^ 

CAGGCTTITATTTATTTGATGGAGAGGAGTTAATTCTTG^ 

GGTGGTGTATCATGTGTGCATATTACTTTAGGAAA 

ATCTCCACAAACTGCTAAGACGCTGATTGTT^ 

CTAACTATATCTCCTQTQATTCAAAAGCTATGAGTGA 

ATGTTTAAAAATGG CAAACTTCTAGGAGTTCTAGATITAGATTCTTCTTT 

AGTAGCAGATTATGATGAGATTGATCAAGAATACTTA GA 

GTATTCTAGTAGAACATACGATTTGGAATTTGGA^ 

AAG 

SEQ ID NO. 6407 
STRAIN COH1 

CTCTATTCTCAGATGAAACAAATG CTCTTGCCAAC 
TTATCAAATGCTTCAGCTATGCTAAATGCTATGCTTCCAAA 
TACAGGCTTTTATTTATTTGATGGAGAGGAGTTAATTC^ 
' AGGGTGGTGTATCATGTGTGCATATTACTTTAGGAAA 



951 



WO 2004/018646 



PCT/US2003/026827 



Table 64: Comparative Sequences relating to SAG 0827 



GAATCTCC^CAAACTGCTAAGACGCTGATT 

TGCTAACrATATCTCCTGTGATTCAAAAG CTATGAGTGAAATCX3TAGTAC 

CCATGTTTAAAAATGGCAAACTTCTAGGAGTTCTAGATTTA^ 

TTAGTAGCAGATTATGATGAGATTQATCAAGAATACTTAGAAAAATTTGT 

AGGTATTCTAGTAGAACATACGATTTGGAATTTGGATATGTTTGC^ 

AAAAG 

SEQ ID HO. 6408 
STRAIN M781 

CTCTATTCTTCAGATGAAACAAATG CTCTTGCCAACTT 

ATCAAATG CTTCAGCTATG CTAAATGCrATGCTTCCAAATTCTGTATTTA 

C^GGCITTTATTTATTTGATGGAGAGGAGTTAATT CTTGG CCCTTTTCAG 

GGTGGTGTATCATGTGTGCATATTACTC 

ATCTTGCACAAACrGCTAAGACXSCIXlATTGT^ 

CTAACTATATCTCCTGTGATTCAAAAGCTATGAGTGAAATCGTACT ACCC 
ATGTTTAAAAATGGCAAACTTCTAGGAGTTCTAGAT 

AGTAG CAGATTATGATGAGATTGATCAAGAATACTTAGAAAAATTTGTAG 

GTATTCTAGTAGAACATACGATTTGGAATTTGGATATGTTTGG^ 

AAG 



SEQ ID NO. 6409 
STRAIN CJB 110 

CTCTATTCTCAGATGAAACAAATG CTCTTG CCAACTTA 

TCAAATG CTTCAGCTATGCTAAATG CTATGCTTCCAAATTCTGTATTTAC 

AGGCTTTTATTTATTTGATGGAAAGGAGTTAA 

GTGGTGTATCATGTGTG CIATATTACTTTAGGAAAAGGTGTTTGTGGTGAA 

TCTGCACAAACTGCTAAGACX3CTGATTGTTGATGA CATGC 

TAACTATATCTCCTGTGATTCAAAAGCTATGAGTGAAATCGTAGTACCT 

TGTTTAAAAATGGCAAACTTCTAGGAGTTCTAGATTTAGAT^ . 

GTAG<3«5ATTATGATGAGATTOATCAAGAA^ 

TATTCTAGTAGAACATACGATTTGGAATTTGGATAT^ 

AG 



SEQ ZD NO. 6410 
STRAIN 1169NT 

CTCTATTCTCAGATGAAACAAATGCTCTTG(X!AAC1TA 

TCAAATGCTTCAGCTATGCTAAATGCTATGCTTCCAA^ 

AGGCTTTTATTTATTTGATGGAGAAGAGTTAATTCTTC 

GTGGTGTATCATGTGTGCATATTACITTAG 

TCTGCACAAACTCCTAAGACGCTX3ATTGTTGATGATG 

TAACTATATCTCCTGTGATTCAAAAGCTATGAGTGAAATCGTA 

TGTTTAAAAATGGCAAACTTCTAGGALi^ 

GTAGCAGATTATGATGAGATTGATCAAGAATACTTAGAA 

TATTCTAGTAGAACATACX1ATTTGGAATTTC 

AG 



SEQ ZD NO. 6411 
STRAIN JM9 1300 13 

CTCIATTCrCAGATGAAACAAATGCTCTTGCCAACTTA 
TCAAATG CTTCAGCTATG CTAAATGCTTATGCIT 

AGGCTTIT!ATTTATTTGATGGAGAAGAGTTAAT^ CCCTTTCCAGG 
GTGGTGTATCATGTGTGCATATTACTTTAGG^ 

TCrcCACAAACTGCTAAGACG CTGATCGTTGATGATGTTACAAAG CATGC 

TAACTATATCTCCKSTGATTCAAAAGCT 

TGTTTAAAAATGGCAAACTTCTAGGAGTTCT 

GTAGCAGATTATGATGAGATTGATCAAGAATACTT^ 

TATTCTAGTAGAACATAOTATTTGGAATTTC 

AG 

PRETTY ofi /biotmp/msa236796.2{*} February 11, 2003 02:42 
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msa2 3 67 9 6 . 2 { 2 82_C0H1 ' 
msa236796 . 2 { 282J4732 
msa236796 . 2{282_M781 
msa236796.2{282_090 
msa236796.2(282_CJB110 
msa236796.2{282_18RS21 
msa236796.2{282_2603 
msa236796.2(282_A909 
msa236796 . 2 { 282_H36B 
mea236796. 2(282 JM9130013 
msa236796.2{282_1169NT 
Consensus 



atgaacaagt ctaagaaaat cgaaaattat caattattat tactacaagc 



msa236796 . 2(282_COHl 
mfla236796.2f282_M732 
msa236796.2{282_M781 
msa236796.2{282_090 
msa236796 . 2 (282J2JB110 
msa236796 . 2 { 282_18RS21 
msa236796 . 2 {282_2603 



51 100 

CTCTA TTCTCAGATG AAACAAATGC TCTTGCCAAC TTATCAAATG 

CTCTA TTCTCAGATG AAACAAATGC TCTTGCCAAC TTATCAAATG 

CTCTA TTCTCAGATG AAACAAATGC TCTTGCCAAC TTATCAAATG 

CTCTA TTCTCAGATG AAACAAATGC TCTTGCCAAC TTATCAAATG 

CTCTA TTCTCAGATG AAACAAATGC TCTTGCCAAC TTATCAAATG 

CTCTA TTCTCAGATG AAACAAATGC TCTTGCCAAC TTATCAAATG 

gcaagCTCTA TTCTCAGATG AAACAAATGC TCTTGCCAAC TTATCAAATG 



952 



WO 2004/018646 



PCT/US2003/026827 



Table 64: Comparative Sequences relating to SAG 0827 



maa236796 .2{282_A909) CTCTA TTCTCAGATG AAACAAATGC TCTTGCCAAC TTATCAAATG 

tnsa23 6796 .2(28 2__H36B) CTCTA TTCTCAGATG AAACAAATGC TCTTGCCAAC TTATCAAATG 

msa236796.2{2B2_JM9130013> CTCTA TTCTCAGATG AAACAAATGC TCTTGCCAAC TTATCAAATG 

msa236796.2{282_1169NT} CTCTA TTCTCAGATG AAACAAATGC TCTTGCCAAC TTATCAAATG 

Consensus ********** ********** ********** ********** ********** 



msa23 6796.2(28 2_C0H1 
msa236796 .2{262_M732' 
msa236796.2(282_M781 
msa236796.2{282 090 
msa236796 . 2 (282_CJB110 
msa236796.2{2B2_18RS21 
rasa23 6796 . 2 f 28 2_2 603 
.msa236796.2(282_A909 
msa236796 . 2 { 28 2_H36B 
msa236796.2{282_jJM9130013 
msa236796 . 2 { 2B2_1169NT 
Consensus 



101 

CTTCAGCTAT 
CTTCAGCTAT 
CTTCAGCTAT 
CTTCAGCTAT 
CTTCAGCTAT 
CTTCAGCTAT 
CTTCAGCTAT 
CTTCAGCTAT 
CTTCAGCTAT 
CTTCAGCTAT 
CTTCAGCTAT 



GCTAAATGCT 
GCTAAATGCT 
GCTAAATGCT 
GCTAAATGCT 
GCTAAATGCT 
GCTAAATGCT 
GCTAAATGCT 
GCTAAATGCT 
GCTAAATGCT 
GCTAAATGCT 
GCTAAATGCT 



ATGCTTCCAA 
ATGCTTCCAA 
ATGCTTCCAA 
ATGCTTCCAA 
ATGCTTCCAA 
ATGCTTCCAA 
ATGCTTCCAA 
ATGCTTCCAA 
ATGCTTCCAA 
ATGCTTCCAA 
ATGCTTCCAA 



ATTCTGTATT 
ATTCTGTATT 
ATTCTGTATT 
ATTCTGTATT 
ATTCTGTATT 
ATTCTGTATT 
ATTCTGTATT 
ATTCTGTATT 
ATTCTGTATT 
ATTCTGTATT 
ATTCTGTATT 



150 

TACAGGCTTT 
TACAGG CTTT 
TACAGGCTTT 
TACAGGCTTT 
TACAGGCTTT 
TACAGGCTTT 
TACAGGCTTT 
TACAGGCTTT 
TACAGGCTTT 
TACAGGCTTT 
TACAGGCTTT 



msa236796 . 2 { 282_COHl j 
msa2 3 67 96 . 2 ( 2 8 2_M73 2 
msa236796 . 2 { 282JM781 , 
msa236796 . 2 { 282_090 
msa236796 . 2 {282_CJB110 ' 
msa236796.2{282_18RS21 
msa236796.2{282_2603 
msa236796.2(282_A909 
ms a2 3 67 96 . 2 { 2 8 2_H3 SB 
msa236796.2{282_JM9130013 
msa236796 . 2 { 282_1169NT 
Consensus 



151 

TATTTATTTG 
TATTTATTTG 
TATTTATTTG 
TATTTATTTG 
TATTTATTTG 
TATTTATTTG 
TATTTATTTG 
TATTTATTTG 
TATTTATTTG 
TATTTATTTG 
TATTTATTTG 



ATGGAgAgGA 
ATGGAgAgGA 
ATGGAgAgGA 
ATGGAaAgGA 
ATGGAaAgGA 
ATGGAgAaGA 
ATGGAgAaGA 
ATGGAgAaGA 
ATGGAgAaGA 
ATGGAgAaGA 
ATGGAgAaGA 



GTTAATTCTT 
GTTAATTCTT 
GTTAATTCTT 
GTTAATTCTT 
GTTAATTCTT 
GTTAATTCTT 
GTTAATTCTT 
GTTAATTCTT 
GTTAATTCTT 
GTTAATTCTT 
GTTAATTCTT 



GGCCCTTTtC 
GGCCCTTTtC 
GGCCCTTTtC 
GGCCCTTTcC 
GGCCCTTTcC 
GGCCCTTTcC 
GGCCCTTTcC 
GGCCCTTTcC 
GGCCCTTTcC 
GGCCCTTTcC 
GGCCCTTTcC 



200 

AGGGTGGTGT 
AGGGTGGTGT 
AGGGTGGTGT 
AGGGTGGTGT 
AGGGTGGTGT 
AGGGTGGTGT 
AGGGTGGTGT 
AGGGTGGTGT 
AGGGTGGTGT 
AGGGTGGTGT 
AGGGTGGTGT 



ms a2 3 67 9 6 . 2 { 2 8 2_CGH1 
msa236796.2{282_M732 
msa236796.2{282_M781 
msa236796 . 2 { 282_090 
msa236796 . 2 ( 282_CJB110 
msa236796.2{282_18RS21 
msa236796.2{282_2603 
msa236796.2(282_A909 
rasa236796.2{282_H36B 
msa236796. 2 {282_JM9 130013. 
msa236796.2{282_1169NT) 
Consensus 



201 

ATCATGTGTG 
ATCATGTGTG 
ATCATGTGTG 
ATCATGTGTG 
ATCATGTGTG 
ATCATGTGTG 
ATCATGTGTG 
ATCATGTGTG 
ATCATGTGTG 
ATCATGTGTG 
ATCATGTGTG 



CATATTACTT 
CATATTACTT 
CATATTACTT 
CATATTA CTT 
CATATTACTT 
CATATTACTT 
CATATTACTT 
CATATTACTT 
CATATTACTT 
CATATTACTT 
CATATTACTT 



TAGGAAAAGG 
TAGGAAAAGG 
TAGGAAAAGG 
TAGGAAAAGG 
TAGGAAAAGG 
TAGGAAAAGG 
TAGGAAAAGG 
TAGGAAAAGG 
TAGGAAAAGG 
TAGGAAAAGG 
TAGGAAAAGG 



TGTTTGTGGT 
TGTTTGTGGT 
TGTTTGTGGT 
TGTTTGTGGT 
TGTTTGTGGT 
TGTTTGTGGT 
TGTTTGTGGT 
TGTTTGTGGT 
TGTTTGTGGT 
TGTTTGTGGT 
TGTTTGTGGT 



250 

GAATCTGCAC 
GAATCTGCAC 
GAATCTGCAC 
GAATCTGCAC 
GAATCTGCAC 
GAATCTGCAC 
GAATCTGCAC 
GAATCTGCAC 
GAATCTGCAC 
GAATCTGCAC 
GAATCTGCAC 



tnsa236796 . 2 [ 282_COHl 
msa236796.2(282_M732 
msa236796.2{282JM781 
msa236796 . 2 {282_090 
msa236796.2{282_CJB110 
msa236796 .2 (282_18RS21 
msa236796.2(282_2603 
msa236796 . 2 { 282_A909 
ntsa236796 . 2 (282_H36B 
tnsa236796.2{282 JM9130013 
mBa236796.2{282 - 1169NT 
Consensus 



251 

AAACTGCTAA 
AAACTGCTAA 
AAACTGCTAA 
AAACTGCTAA 
AAACTGCTAA 
AAACTGCTAA 
AAACTGCTAA 
AAACTGCTAA 
AAACTGCTAA 
AAACTGCTAA 
AAACTGCTAA 



GACGCTGATt 
GACGCTGATt 
GACGCTGATt 
GACGCTGATt 
GACGCTGATt 
GACGCTGATc 
GACGCTGATC 
GACGCTGATc 
GACGCTGATc 
GACGCTGATc 
GACGCTGATt 



GTTGATGATG 
GTTGATGATG 
GTTGATGATG 
GTTGATGATG 
GTTGATGATG 
GTTGATGATG 
GTTGATGATG 
GTTGATGATG 
GTTGATGATG 
GTTG ATGATG 
GTTGATGATG 



TTACAAAGCA 
TTACAAAGCA 
TTACAAAGCA 
TTACAAAGCA 
TTACAAAGCA 
TTACAAAGCA 
TTACAAAGCA 
TTACAAAGCA 
TTACAAAGCA 
TTACAAAGCA 
TTACAAAGCA 



300 

TGCTAACTAT 
TGCTAACTAT 
TGCTAACTAT 
TGCTAACTAT 
TGCTAACTAT 
TGCTAACTAT 
TGCTAACTAT 
TGCTAACTAT 
TGCTAACTAT 
TGCTAACTAT 
TGCTAACTAT 



msa236796.2(282_COHl' 
mBa236796.2{282_M732 1 
msa236796.2{282_M781 
msa236796 .2 {282_090 
msa236796.2(282 CJBllo' 
msa236796.2{282_18RS21 
tnsa236796.2(282_2603 
msa236796.2(282_A909 
msa236796.2{282_H36B 
msa236796.2{282 JM9130013 
msa236796 . 2 (282_1169NT 
Consensus 



301 

ATCTCCTGTG 
ATCTCCTGTG 
ATCTCCTGTG 
ATCTCCTGTG 
ATCTCCTGTG 
ATCTCCTGTG 
ATCTCCTGTG 
ATCTCCTGTG 
ATCTCCTGTG 
ATCTCCTGTG 
ATCTCCTGTG 



ATTCAAAAGC 
ATTCAAAAGC 
ATTCAAAAGC 
ATTCAAAAGC 
ATTCAAAAGC 
ATTCAAAAGC 
ATTCAAAAGC 
ATTCAAAAGC 
ATTCAAAAGC 
ATTCAAAAGC 
ATTCAAAAGC 



TATGAGTGAA 
TATGAGTGAA 
TATGAGTGAA 
TATGAGTGAA 
TATGAGTGAA 
TATGAGTGAA 
TATGAGTGAA 
TATGAGTGAA 
TATGAGTGAA 
TATGAGTGAA 
TATGAGTGAA 



ATCGTAGTAC 
ATCGTAGTAC 
ATCGTAGTAC 
ATCGTAGTAC 
ATCGTAGTAC 
ATCGTAGTAC 
ATCGTAGTAC 
ATCGTAGTAC 
ATCGTAGTAC 
ATCGTAGTAC 
ATCGTAGTAC 



350 

CcATGTTTAA 
CcATGTTTAA 
CcATGTTTAA 
CtATGTTTAA 
CtATGTTTAA 
CtATGTTTAA 
CtATGTTTAA 
CtATGTTTAA 
CtATGTTTAA 
CtATGTTTAA 
CcATGTTTAA 



msa236796 . 2 {282_COHl 
msa236796.2(282 M732 
msa236796.2{282""M781 
msa236796.2{282 090 
tnsa236796.2{282 CJBUO 
msa236796,2{282 18RS21 



351 

AAATGGCAAA 
AAATGGCAAA 
AAATGGCAAA 
AAATGGCAAA 
AAATGGCAAA 
AAATGGCAAA 



CTTCTAGGAG 
CTTCTAGGAG 
CTTCTAGGAG 
CTTCTAGGAG 
CTTCTAGGAG 
CTTCTAGGAG 



TTCTAGATTT 
TTCTAGATTT 
TTCTAGATTT 
TTCTAGATTT 
TTCTAGATTT 
TTCTAGATTT 



AGATTCTTCT 
AGATTCTTCT 
AGATT CTT CT 
AGATTCTTCT 
AGATTCTTCT 
AGATTCTTCT 



400 

TTAGTAGCAG 
TTAGTAGCAG 
TTAGTAGCAG 
TTAGTAGCAG 
TTAGTAGCAG 
TTAGTAGCAG 



953 



WO 2004/018646 



PCT/US2003/026827 



Table 64: Comparative Sequences relating to SAG 0827 



msa236796.2(282_2603 
msa23 67 96 . 2 ( 28 2_A90 9 
tnsa23 67 96 . 3 { 28 2_H36B 
msa236796.2{282_JM9130013 
msa236796 .2 {282_1169NT 
Consensus 



AAATGGCAAA CTTCTAGGAG TTCTAGATTT AGATTCTTCT TTAGTAGCAG 
AAATGGCAAA CTTCTAGGAG TTCTAGATTT AGATTCTTCT TTAGTAGCAG 
AAATGGCAAA CTTCTAGGAG TTCTAGATTT AGATTCTTCT TTAGTAGCAG 
AAATGGCAAA CTTCTAGGAG TTCTAGATTT AGATTCTTCT TTAGTAGCAG 
AAATGGCAAA CTTCTAGGAG TTCTAGATTT AGATTCTTCT TTAGTAGCAG 



msa23 67 96 . 2 f 28 2_COHl 
msa236796 .21 282_M732 
msa23 6796.2(28 2_M78 1 
msa236796 . 2 {282_090 
maa236796 . 2 f 282_CJB110 
maa236796 . 2 { 282_18RS21 
msa236796 . 2 { 282_2603 
msa236796.2[282_A909 
msa23 67 96 . 2 { 28 2JH3 6B 
msa236796 . 2 {282_JM9 130013 
msa236796 . 2 { 282_1169NT 
Consensus 



401 

ATTATGATGA 
ATTATGATGA 
ATTATGATGA 
ATTATGATGA 
ATTATGATGA 
ATTATGATGA 
ATTATGATGA 
ATTATGATGA 
ATTATGATGA 
ATTATGATGA 
ATTATGATGA 



GATTGATCAA 
GATTGATCAA 
GATTGATCAA 
GATTGATCAA 
GATTGATCAA 
GATTGATCAA 
GATTGATCAA 
GATTGATCAA 
GATTGATCAA 
GATTGATCAA 
GATTGATCAA 



GAATACTTAG 
GAATACTTAG 
GAATACTTAG 
GAATACTTAG 
GAATACTTAG 
GAATACTTAG 
GAATACTTAG 
GAATACTTAG 
GAATACTTAG 
GAATACTTAG 
GAATACTTAG 



AAAAATTTGT 
AAAAATTTGT 
AAAAATTTGT 
AAAAATTTGT 
AAAAATTTGT 
AAAAATTTGT 
AAAAATTTGT 
AAAAATTTGT 
AAAAATTTGT 
AAAAATTTGT 
AAAAATTTGT 



450 

AGGTATTCTA 
AGGTATTCTA 
AGGTATTCTA 
AGGTATTCTA 
AGGTATTCTA 
AGGTATTCTA 
AGGTATTCTA 
AGGTATTCTA 
AGGTATTCTA 
AGGTATTCTA 
AGGTATTCTA 



msa2 3 67 96 .2(28 2_COHl 
maa236796.2{282_M732 
msa23 6796 .2(28 2_M781 
msa2 36796 . 2 {282J590 
msa236796 . 2 { 282_CJB110 
msa236796.2{282_18RS21 
msa23 67 96 . 2 { 28 2_2603 
rasa236796.2(282_A909 
msa236796.2(282_H36B 
msa236796 . 2 { 282_JM9130013 
msa236796.2{282__1169NT 
Consensus 



451 

GTAGAACATA 
GTAGAACATA 
GTAGAACATA 
GTAGAACATA 
GTAGAACATA 
GTAGAACATA 
GTAGAACATA 
GTAGAACATA 
GTAGAACATA 
GTAGAACATA 
GTAGAACATA 



CGATTTGGAA 
CGATTTGGAA 
CGATTTGGAA 
CGATTTGGAA 
CGATTTGGAA 
CGATTTGGAA 
CGATTTGGAA 
CGATTTGGAA 
CGATTTGGAA 
CGATTTGGAA 
CGATTTGGAA 



TTTGGATAtg 
TTTGGATAtg 
TTTGGATAtg 
TTTGGATA — 
TTTGGATAtg 
TTTGGATAtg 
TTTGGATAtg 
TTTGGATAtg 
TTTGGATAtg 
TTTGGATAtg 
TTTGGATAtg 



495 

tttggagttg aaaag 
tttggagttg aaaag 
tttggagttg aaaag 



tttggagttg 
tttggagttg 
tttggagttg 
tttggagttg 
tttggagttg 
tttggagttg 
tttggagttg 



aaaag 
aaaag 
aaaag 
aaaag 
aaaag 
aaaag 
aaaag 



SKQ ZD HO. 6412 
STRAIN 2603 frame:! 

MNKSKKIENYQLIiLLQAQALFSDBTNALANLSNASAM L 
GPPQGGVSCVHITLGKGVCGESAQTAKTLI VDDVTKHANYI SCDSKAMSBI WPMFKNGK 
LLGVLDLDSSLVADYDE IDQEYLBKFVG I LVEHT I WNLDMFGVEK 

SEQ ZD HO. 64X3 

STRAIN 090 frame: 3 

LFSDBTNALANLSNASAMLNAMLPNSVFTGFYLFDGKEL I LGPFQGG VS CVH ITLGKGVC 
GBSAQTAKTLI VDDVTKHANYI SCDSKAMSBI VVPMFKNGKLLGVLDLDSSLVADYDEID 
QBYLEKFVGILVBHTIWNIiD 

SBQ ZD HO. 6414 

STRAIN A909 frame: 3 

LFSDBTNALANLSNASAMLNAMLPNSVFTGFYLFDGBGL I LGPFQGGVSCVHITIiGKGVC 
GESAQTAKTL I VDDVTKHANYI SCDSKAMSBI VVPMFKNGKUX3VLDLDSSLVADYDEID 
QBYLEKFVG I LVEHT I WNLDMFGVEK 

SEQ ZD HO. 6415 
STRAIN H36B frame: 3 

LFSDETNAIiANLSNASAMLNAMLPNSVFTGFYLFDGEELI LGPF0^3GVSCVHITLGKGVC 
GE SAQTAKTL I VDDVTKHANYI SCDSKAMS E I WPMFKNGKLLGVLDLD S SLVAD YDE I D 
QEYLEKFVGI LVEHT I WNLDMFGVEK 

SBQ ZD HO. 6416 
STRAIN 18RS21 frame: 3 

LFSDETNAIANLSNASAMLNAMLPNSVFTGFYLFDGEEL I LGPFQGGVSCVHITLGKGVC 
GE SAQTAKTL I VDD VTKHANY I S CDSKAMS E I WPMFKNG KLLGVLDLD S SLVAD YDE I D 
QEYLEKFVGI LVEHT I WNLDMFGVEK 

SBQ ZD HO. 6417 
STRAIN M732 frame: 3 

LFSDETNALANLSNASAMLNAMLPNSVFTGFYLFDGEELI LGPFQGGVSCVHITLGKGVC 
GESAQTAKTL I VDDVTKHANY I SCDSKAMS B I VVPMFKNGKLLGVLDLDSSLVADYDEI D 
QBYLEKFVG I LVEHT I WNLDMFGVEK 

SBQ ZD HO. 6418 

STRAIN COHl frame: 3 

LFSDETNALANLSNASAMLNAMLPNSVFTG 

GBSAOTAKTL I VDDVTKHANYI SCDSKAMSE I VVPMFKNGKLLGVLDLDSSLVADYDE I D 
QBYLEKFVG I LVEHT I WNLDMFGVEK 

SBQ ZD HO. 6419 
STRAIN M781 frame: 3 

LFSDETNALANLSNASAMLNAMLPNSVFTGFYLFDGEE1LI LC CVH I TLGKGVC 

GESAQTAKTL IVDDVTKHANYI SCDSKAMSBI VTOMFKNGKLI^^ 



954 
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Table 64: Comparative Sequences relating t SAG 0827 



QEYLEKFVGI LVEHTIWNLDMPGVBK 

SEQ ZD NO- 6420 
STRAIN M781 frame: 3 

LFSDETNALANLSNASAMLNAMLPNSVFTGFYLFDGEEL I LG PFQQGVSCVH ITLGKGVC 
GESAQTAKTL I VDD VTKHANYI SCDS KAMSE I WPMFKNGKLLGVLrDLDSSLVADYDE I D 
QE YLBKFVG ILVEHTI WNLDMFGVEK 

SEQ ZD NO. 6421 
STRAIN CJB1 10 frame: 3 

LFSDBTNALANLSHASAMLNAMLPNSVFTGFYLF I LGPFQGGVS CVH ITLGKGVC 

GESAQTAKTL I VDDVTKHANYI S CD SKAMS EI VVPMFKNG KIJjGVIiDLDSSLVADYDE I D 
QE YLBKFVG I LVEHTI WNLDMFGVEK 

SEQ ZD NO. 6422 
STRAIN 1 169NT frame: 3 

LFSDETNALANLSNASAMIiNAMLPNSVFTGFYLFDG^ 
GESAQTAKTLI VDDVTKHANYI SCDSKAMSEIWPMFKNGKLIXJVIj^ 
QEYLEKFVG I LVEHTI WNLDMFGVEK 

SEQ ZD NO. 6423 
STRAIN JM9130013 frame: 3 

LFSDETNALANLSNASAMLNAMLPNSVFTGFYLFDGEELILGPFQ^ ITLGKGVC 
GESAQTAKTLI VDDVTKHANYI SCDSKAMSE I WPMFKNGKLLGVLDIiDSSLVADYDEID 
QEYLEKFVGI LVEHTI WNLDMFGVEK 

PRETTY of i /biotmp/mea237960.2{*} February 11, 2003 02t46 



msa237960.2{282_1169NT 
msa237960.2{282_18RS21 
msa237960 .2(282 2603 
msa237960 .2(282_A909 
rasa237960 . 2 (2823COH1 
msa237960 . 2 (282_H36B 
msa237960.2{282_JM9130013 
o»sa237960 . 2 (282_M732 
msa237960.2{282_M781 
msa237960.2{282_090 
msa237960 .2 {282_CJB110^ 
Consensus 



l 50 

L FSDETNALAN LSNASAMLNA MLPNSVFTGF 

Xj FSDETNALAN LSNASAMLNA MLPNSVFTGF 

ranks kkieny qllllqaqaL FSDETNALAN LSNASAMLNA MLPNSVFTGF 

L FSDETNALAN LSNASAMLNA MLPNSVFTGF 

L FSDETNALAN LSNASAMLNA MLPNSVFTGF 

Xj FSDETNALAN LSNASAMLNA MLPNSVFTGF 

X, FSDETNALAN LSNASAMLNA MLPNSVFTGF 

X, FSDETNALAN LSNASAMLNA MLPNSVFTGF 

Xj FSDETNALAN LSNASAMLNA MLPNSVFTGF 

L FSDETNALAN LSNASAMLNA MLPNSVFTGF 

X, FSDETNALAN LSNASAMLNA MLPNSVFTGF 



msa237960 . 2 { 282_1169NT 
msa237960 . 2 { 282_18RS21 
msa237960. 2(282 2603 
msa237960 . 2 { 282*"*A909 
maa237960 . 2 { 282~COHl 
msa237960 . 2 { 282_H36B 
msa237960.2{282_JM9130013 
msa237960 .2{282_M732 
msa237960 . 2 {282_M781 
msa237960 . 2 { 282_090 
msa237960.2{282_CJB110 
Consensus 



51 

YLFDGeELIL 
YLFDGeELIL 
YLFDGeELIL 
YLFDGeELIL 
YLFDGeELIL 
YLFDGeELIL 
YLFDGeELIL 
YLFDGeELIL 
YLFDGeELIL 
YLFDGkELIL 
YLFDGkELIL 



GPFQGGVSCV 
GPFQGGVSCV 
GPFQGGVSCV 
GPFQGGVSCV 
GPFQGGVSCV 
GPFQGGVSCV 
GPFQGGVSCV 
GPFQGGVSCV 
GPFQGGVSCV 
GPFQGGVSCV 
GPFQGGVSCV 



HITLGKGVCG 
HITLGKGVCG 
HITLGKGVCG 
HITLGKGVCG 
HITLGKGVCG 
HITLGKGVCG 
HITLGKGVCG 
HITLGKGVCG 
HITLGKGVCG 
HITLGKGVCG 
HITLGKGVCG 



ESAQTAKTLI 
ESAQTAKTLI 
ESAQTAKTLI 
ESAQTAKTLI 
ESAQTAKTLI 
ESAQTAKTLI 
ESAQTAKTLI 
ESAQTAKTLI 
ESAQTAKTLI 
ESAQTAKTLI 
ESAQTAKTLI 



100 

VDDVTKHANY 
VDDVTKHANY 
VDDVTKHANY 
VDDVTKHANY 
VDDVTKHANY 
VDDVTKHANY 
VDDVTKHANY 
VDDVTKHANY 
VDDVTKHANY 
VDDVTKHANY 
VDDVTKHANY 



msa2 37960 . 2 { 282_1169NT 
rasa237960.2{282_18RS21 
msa237960. 2(282 2603 
msa237960 . 2 ( 282_A909 
msa23 7 960.21 2 8 2__COHl 
msa237960 . 2 { 282_H36B 
rasa237960.2{282_JM9130013 
msa2 3 7 960 . 2 ( 28 2_M73 2 
maa237960.2{282J4781 
msa237960 . 2 {282_090 
msa237960 . 2 { 282_CJB110 
Consensus 



101 

I SCDSKAMSE 
I SCDSKAMSE 
I SCDSKAMSE 
I SCDSKAMSE 
I SCDSKAMSE 
I SCDSKAMSE 
I SCDSKAMSE 
I SCDSKAMSE 
I SCDSKAMSE 
I SCDSKAMSE 
I SCDSKAMSE 



IWPMFKNGK 
I WPMFKNGK 
IWPMFKNGK 
IWPMFKNGK 
IWPMFKNGK 
IWPMFKNGK 
IWPMFKNGK 
IWPMFKNGK 
IWPMFKNGK 
IWPMFKNGK 
IWPMFKNGK 



LLGVLDLDSS 
LLGVLDLDSS 
LLGVLDLDSS 
LLGVLDLDSS 
LLGVLDLDSS 
LLGVLDLDSS 
LLGVLDLDSS 
LLGVLDLDSS 
LLGVLDLDSS 
LLGVLDLDSS 
LLGVLDLDSS 



LVADYDEIDQ 
LVADYDEIDQ 
LVADYDEIDQ 
LVADYDEIDQ 
LVADYDEIDQ 
LVADYDEIDQ 
LVADYDEIDQ 
LVADYDEIDQ 
LVADYDEIDQ 
LVADYDEIDQ 
LVADYDEIDQ 



150 

EYLEKFVGIL 
EYLEKFVGIL 
EYLEKFVGIL 
EYLEKFVGIL 
EYLEKFVGIL 
EYLEKFVGIL 
EYLEKFVGIL 
EYLEKFVGIL 
EYLEKFVGIL 
EYLEKFVGIL 
EYLEKFVGIL 



rasa237960 . 2 ( 282_1169NT 
rasa237960.2{282_18RS21 
msa237960.2(282_2603 
msa2 3 7960 . 2 ( 28 2_A90 9 
msa237960 . 2 ( 2B2_COHl 
msa237960 . 2 { 282JK36B 
msa237960.2{282_JM9130013 
msa237960.2(282 M732 
msa237960.2{282~M781 
msa237960.2{282 090 
msa237960 . 2 { 28 2_CJB110 
Consensus 



151 

VEHTIWNLDm 
VBHTIWNLDm 
VEHTIWNLDm 
VEHTIWNLDm 
VEHTIWNLDm 
VEHTIWNLDm 
VEHTIWNLDm 
VBHTIWNLDm 
VEHTIWNLDm 
VBHTIWNLD- 
VEHTIWNLDm 



165 
fgvek 
fgveJc 
fgvek 
fgvek 
fgvek 
fgvek 
fgvek 
fgvek 
fgvek 

fgvek 
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SEQ ID HO. 6501 
STRAIN 2603 

ATGAAAAAGAGTACCCAAATAATACTACTAATAGTTGCA 
TTATTt^TACTTGTTTTTAQCGGAGGATTTTATATGAAAGAA 

CTAAAACXX3 AATCX3AGAATATGAAGTTAGTCTAGTCAAAG CATTGAAAAATrCCTATGAG 

AATATAGAAGAAATAAAAATCACACATCCIXJITTCAACTGAA 

TGTACIX3TAAAGATTTCATTTAATGATAAAAAATCTA 

TTGGAATCGAAAAAAAATTATAGCGGAAAATTTAATGAAAAAA^ 

TCAAGAATTGGTAAAACAAAAAAAACTATAAAAATTATTT^ 

ATACAA 

SEQ ID HO. 6502 
STRAIN 090 

GGAGGATTTTATATGAAAGAACA 

ACAAAGAAAAGAAGAACTAAAACGGAATCGAGAATATGAAGTTAGTCTAG 
TCAAAGCATTGAAAAATTCCTATGAGAATATAGAAGAAATAAAAATCACA 
CATCCTGTTTCAACTGAAATTCCTGGAGATTGGC^ 
TTGATTTAATGATAAAAAATCTATTGTTT 

AATCGAAAAAAAATTATAGCGGAAATTTTAATGAAAAAAATATGAATTT^ 
■rA"l\iATTCAAGAATTGGTAAAACAAAAAAAACrATAAAAAlTAlU"l'riTC 
AGAt GG t CAGGAGAAGATa CAA 

SEQ ID HO. 6503 
STRAIN A909 

GGAGGATTTTATATGAAAGAACAACAA 

AGAAAAGAAGAACTAAAACGGAATCGAGAATATGAAGTTAGTCTAGTCAA 
AGCATTGAAAAATTCCTATGAGAATATAGAAGAAATAAAAATCACACATC 
CTGTTTCAACTGAAATTCCTGGAGATTGGC^ 
TTTAATGATAAAAAATCTATTGTTTATAATAT^ 

GAAAAAAAATTATAG(XGAAAA1TTAATGAAAAAAATATGAATTT^TTTG 
ATTCAAGAATTGGTAAAACAAAAAAAACTATAAAAATTA TrrX'rr CAGAT 
GGtCAGGAGAAGATACAA 

SEQ ID HO. 6504 
STRAIN H36B 

GGAGGATTTTATATGAAAGAACA 

ACAAAGAAAAGAAGAACTAAAACGGAATCGAGAATATGAAGTTAGTCTAG 

TCAAAGCATTGAAAAATTCCTATGAGAATATAGAAGAAATAAAAATCACA 

CATCCTGTTTCAACTGAAATTCCTGGAGAT^ 

TTCATTTAATGATAAAAAATCTATTGTTTATAATATTACAC^ 

AATCGAAAAAAAATTAT AG CGGAAAATTTAATGAAAAAAATATGAATTTT 

TTTGATTCAAGAATTGGTAAAACAAAAAAAACTATAAAA^ 

AGATGG t CAGGAGAAGATaCAA 

SEQ ID HO. 6505 
STRAIN 18RS21 

GGAGGATTTTATATGAAAGAACAAC 

AAAGAAAAGAAGAACTAAAACGGAATCGAGAATATGAAGTTAGTCTAGTC 

AAAGCATTGAAAAATTCCTATGAGAATATAGAAGAAATAAAAATCACA 

TCCTGTTTCAACTGAAATTCCTGGAGATTGGCA 

CATTTAATGATAAAAAATCTATTGTTTATAAT^ 

TCGAAAAAAAATTATAGOGGAAAATTTAATGAAAAAAAT^ 

TGATTCAAGAATTGGTAAAACAAAAAAAACTATAAAA^ 

ATGGt CAGGAGAAGATaCAA 

SEQ ZD HO. 6506 
STRAIN M781 

GGAGGATTTTATATGAAAGAACAACAAAGAAAA 

GAAGAACTAAAACX3GAATCGAGAATATGAAGTTAGTCT 

GAAAAATTCCTATGAGAATATAGAAGAAATAAAAATCACAC^TC Cl X j' l 'lT ' 

CAACTGAAATTCCTX3GAGATTGGCATTGTA 

GATAAAAAATCTATTGTTTATAATATTACACATAATTTGGAAT 

AAATTATAGCGGAAAATTTAATGAAAAAAATATGAATTT^ 

GAATTGGTAAAACAAAAAAAACTATAAAAATTAlUUU w l w rCAGATGGTCAG 

GAGAAGATACAA 

SEQ ID NO. 6507 
STRAIN CJB1 10 

GOAGGATTTTATATGAAAGAACAACAAAGAAAAGAAGAA 

CTAAAACGGAATCGAGAATATGAAGTTAGTCTAGTCAAAGCATTGA 

TTCCTATGAGAATATAGAAGAAATAAAAATCACACATCC 

AAATTCCTCOAGATTGGCATTGTACTGTA^ 

AAATCTATT GTTTA TAATATTACACATAATTTGGAATCX3AA 

TAGCGGAAATTTTAATGAAAAAAATATGAATTTTTTTGATT 

GTAAAAC^AAAAAAACTATAAAAATTA1U1"1"11XZAGATGGTCAGGAGAAG 

ATACAA 

SEQ ID HO. 6508 
STRAIN 1169NT 

GGAGGATTTTATATGAAAGAACAACAAAG 

AAAAGAAGAA CT AAAACGGAAT CX1A.GAATATGAAGTT AGTCTAGT CAAAG 
CATTGAAAAATTCCTATGAGAATATAGAAGAAATAAAA^ 
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GTTTCAACTGAAATTCrCTGGAGATTGGCATTGTA 

TAATGATAAAAAATCTATrGlTOATAATATTACACATAATTTGGAATCXSA 
AAAAAAATTATAGTGGAAAATTTAATGAAAAAAATATGAAri'l'lTLTTTGAT 
TCAAQAATTGGTAAAACAAAAAAAACTATAAAAATTATTTTITO 
TCAGGAGAAGATACAA 



SBQ ZD NO. 6509 
STRAIN JM9130013 
GQAGGATTTTATATGAAAGAACAAC 

AAAGAAAAQAAGAACTAAAACGGAATOGAGAATATGAAGTTAGTCTAGTC 

AAAGCATTGAAAAAl^CCTATGAGAATATAGAAGAAATAAAAATCACRX^ 

TCCTGTTTCAACTGAAATTCCTGGAGATTGGCATTC^ 

CATTTAATGATAAAAAATCTATTGTTTATAATATTACAC^ 

TCGAAAAAAAATTATAGCGGAAAATTTAATGAAAAAAATATGAAx-j-i-i-i-r 

TGATTCAAGAATTGGTAAAACAAAAAAAACTATAAAAAT^ 

AtGGt CAGGAGAAG ATACAA 

PRETTY of x /biotmp/mea75400.2{*} March 10, 2003 09:56 



msa75400.2{286_090; 
msa75400.2(286 CJB110 
msa75400.2{286 18RS21 
msa7S400.2(286_2603 ] 
msa75400.2f286_A909 
msa75400 . 2 (286_H36B 
msa75400 . 2 {286_JM9130013 
mfla75400.2{286_M781 
msa75400.2{286_1169NT 
Consensus 



50 



atgaaaaaga gtacccaaat aat act acta atagttgcat tattcatact 



msa75400.2{286_090 
msa7540 0 . 2 { 2 86_CJB110 
msa75400 . 2 { 286_18RS21 
rosa75400 . 2{286_2603 
rasa75400 . 2 i 286_A909 
msa75400 . 2 {286_H36B 
msa75400.2{286_JM9130013 
msa75400 . 2 { 286_M781 
msa7 540 0 . 2 { 2 8 6_1169NT 
Consensus 



51 100 

GGAGGATTTT ATATGAAAGA ACAACAAAGA AAAGAAGAAC 

GGAGGATTTT ATATGAAAGA ACAACAAAGA AAAGAAGAAC 

GGAGGATTTT ATATGAAAGA ACAACAAAGA AAAGAAGAAC 

tgtttttagc GGAGGATTTT ATATGAAAGA ACAACAAAGA AAAGAAGAAC 

GGAGGATTTT ATATGAAAGA ACAACAAAGA AAAGAAGAAC 

GGAGGATTTT ATATGAAAGA ACAACAAAGA AAAGAAGAAC 

GGAGGATTTT ATATGAAAGA ACAACAAAGA AAAGAAGAAC 

GGAGGATTTT ATATGAAAGA ACAACAAAGA AAAGAAGAAC 

— GGAGGATTTT ATATGAAAGA ACAACAAAGA AAAGAAGAAC 



msa75400 . 2 { 286_090] 
msa7 54 0 0 . 2 { 2 86_CJB1 10 j 
msa7 54 0 0 . 2 { 2 8 6_18RS2 1 ( 
msa75400.2(286_2603 i 
msa75400.2{286_A909 
msa7 540 0 . 2 { 2 86_H3 SB 
tnsa75400 . 2 {286_JM9130013 
ms a75400 . 2 { 2 8 6_M7 8 1 
msa75400.2{286_1169NT 
Consensus 



101 

TAAAACGGAA 
TAAAACGGAA 
TAAAACGGAA 
TAAAACGGAA 
TAAAACGGAA 
TAAAACGGAA 
TAAAACGGAA 
TAAAACGGAA 
TAAAACGGAA 



TCGAGAATAT 
TCGAGAATAT 
TCGAGAATAT 
TCGAGAATAT 
TCGAGAATAT 
TCGAGAATAT 
TCGAGAATAT 
TCGAGAATAT 
TCGAGAATAT 



GAAGTTAGTC 
GAAGTTAGTC 
GAAGTTAGTC 
GAAGTTAGTC 
GAAGTTAGTC 
GAAGTTAGTC 
GAAGTTAGTC 
GAA GTTA GTC 
GAAGTTAGTC 



TAGTCAAAGC 
TAGTCAAAGC 
TAGTCAAAGC 
TAGTCAAAGC 
TAGTCAAAGC 
TAGTCAAAGC 
TAGTCAAAGC 
TAGTCAAAGC 
TAGTCAAAGC 



150 

ATTGAAAAAT 
ATTGAAAAAT 
ATTGAAAAAT 
ATTGAAAAAT 
ATTGAAAAAT 
ATTGAAAAAT 
ATTGAAAAAT 
ATTGAAAAAT 
ATTGAAAAAT 



msa75400.2{286_090] 
msa75400.2{286_CJB110 i 
tnsa75400 . 2 { 286_18RS21 
msa75400 . 2 { 286_2603 
msa75400 . 2 (286_A909 
msa7 540 0 . 2 { 2 8 6_H3 6B 
msa7 54 0 0 . 2 { 2 8 6_JM913 0 0 13 
msa75400.2{286_M781 
msa75400.2{286_1169NT 
Consensus 



151 

TCCTATGAGA 
TCCTATGAGA 
TCCTATGAGA 
TCCTATGAGA 
TCCTATGAGA 
TCCTATGAGA 
TCCTATGAGA 
TCCTATGAGA 
TCCTATGAGA 



ATATAGAAGA 
ATATAGAAGA 
ATATAGAAGA 
ATATAGAAGA 
ATATAGAAGA 
ATATAGAAGA 
ATATAGAAGA 
ATATAGAAGA 
ATATAGAAGA 



AATAAAAATC 
AATAAAAATC 
AATAAAAATC 
AATAAAAATC 
AATAAAAATC 
AATAAAAATC 
AATAAAAATC 
AATAAAAATC 
AATAAAAATC 



ACACATCCTG 
ACACATCCTG 
ACACATCCTG 
ACACATCCTG 
ACACATCCTG 
ACACATCCTG 
ACACATCCTG 
ACACATCCTG 
ACACATCCTG 



200 

TTTCAACTGA 
TTTCAACTGA 
TTTCAACTGA 
TTTCAACTGA 
TTTCAACTGA 
TTTCAACTGA 
TTTCAACTGA 
TTTCAACTGA 
TTTCAACTGA 



rasa75400.2{286_090] 
msa75400. 2(286 CJB110 
msa75400. 2(286 18RS21 
tnsa75400 . 2 (286_2603 
msa75400.2l286_A909 
msa75400.2{286_H36B 
msa75400.2{286_JM9130013 
msa75400.2{286_M781 
tnsa75400 . 2 { 286JU69NT 
Consensus 



201 

AATTCCTGGA 
AATTCCTGGA 
AATTCCTGGA 
AATTCCTGGA 
AATTCCTGGA 
AATTCCTGGA 
AATTCCTGGA 
AATTCCTGGA 
AATTCCTGGA 



GATTGGCATT 
GATTGGCATT 
GATTGGCATT 
GATTGGCATT 
GATTGGCATT 
GATTGGCATT 
GATTGGCATT 
GATTGGCATT 
GATTGGCATT 



GTACTGTAAA 
GTACTGTAAA 
GTACTGTAAA 
GTACTGTAAA 
GTACTGTAAA 
GTACTGTAAA 
GTACTGTAAA 
GTACTGTAAA 
GTACTGTAAA 



GATTTCATTT 
GATTTCATTT 
GATTTCATTT 
GATTTCATTT 
GATTTCATTT 
GATTTCATTT 
GATTTCATTT 
GATTTCATTT 
GATTTCATTT 



250 

AATGATAAAA 
AATGATAAAA 
AATGATAAAA 
AATGATAAAA 
AATGATAAAA 
AATGATAAAA 
AATGATAAAA 
AATGATAAAA 
AATGATAAAA 



msa75400.2{286_090> 
msa7 54 00 . 2 I 2 8 6_CJB1 10 } 
msa75400 . 2 {286_18RS2l} 



251 300 
AATCTATTGT TTATAATATT ACACATAATT TGGAATCGAA AAAAAATTAT 
AATCTATTGT TTATAATATT ACACATAATT TGGAATCGAA AAAAAATTAT 
AATCTATTGT TTATAATATT ACACATAATT TGGAATCGAA AAAAAATTAT 
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msa7S400.2{286_2603 1 
msa75400.2(286_A909' 
msa7 54 0 0 . 2 { 2 8 6_H3 6B 
msa75400.2{286_JM9130013 
msa7540O.2{286_M781 
rasa75400.2{286_1169NT 
Consensus 



msa75400 . 2 { 28 6__090 ' 
msa7 54 0 0 . 2 ( 2 8 6_CJB1 10 1 
msa7S400 . 2 (286_18RS21 
maa75400 .2f 286_2603 
msa75400.2{286_A909 
msa75400 . 2 {286_H36B 
msa75400.2{286_JM9130013 
msa75400.2{286_M781 
msa75400 . 2 {286_1169NT 
Consensus 



msa75400 .2(286^090 
msa7 54 0 0 . 2 ( 2 8 6_CJB1 10 
msa75400 . 2 { 286JL8RS21 
rasa75400. 2(286 2603 
msa75400.2(286_A909 
msa75400.2{.286_H36B 
msa75400.2{286 JM9130013 
msa75400.2{286_M781 
msa7 54 0 0 . 2 { 2 8 6_11 69NT \ 
Consensus 



AATCTATTGT 
AATCTATTGT 
AATCTATTGT 
AATCTATTGT 
AATCTATTGT 
AATCTATTGT 



TTATAATATT 
TTATAATATT 
TTATAATATT 
TTATAATATT 
TTATAATATT 
TTATAATATT 



ACACATAATT 
ACACATAATT 
ACACATAATT 
ACACATAATT 
ACACATAATT 
ACACATAATT 



TGGAATCGAA 
TGGAATCGAA 
TGGAATCGAA 
TGGAATCGAA 
TGGAATCGAA 
TGGAATCGAA 



AAAAAATTAT 
AAAAAATTAT 
AAAAAATTAT 
AAAAAATTAT 
AAAAAATTAT 
AAAAAATTAT 



301 

AGcGGAAAtT 
AGcGGAAAtT 
AGcGGAAAaT 
AGcGGAAAaT 
AGcGGAAAaT 
AGcGGAAAaT 
AGcGGAAAaT 
AGcGGAAAaT 
AGtGGAAAaT 



TTAATGAAAA 
TTAATGAAAA 
TTAATGAAAA 
TTAATGAAAA 
TTAATGAAAA 
TTAATGAAAA 
TTAATGAAAA 
TTAATGAAAA 
TTAATGAAAA 



AAATATGAAT 
AAATATGAAT 
AAATATGAAT 
AAATATGAAT 
AAATATGAAT 
AAATATGAAT 
AAATATGAAT 
AAATATGAAT 
AAATATGAAT 



TTTTTTG ATT 
TTTTTTGATT 
TTTT TTGATT 
TTTTTTGATT 
TTTTTTGATT 
TTTTTTGATT 
TTTTTTGATT 
TTTTTTGATT 
TTTTTTGATT 



350 

CAAGAATTGG 
CAAGAATTGG 
CAAGAATTGG 
CAAGAATTGG 
CAAGAATTGG 
CAAGAATTGG 
CAAGAATTGG 
CAAGAATTGG 
CAAGAATTGG 



351 

TAAAACAAAA 
TAAAACAAAA 
TAAAACAAAA 
TAAAACAAAA 
TAAAACAAAA 
TAAAACAAAA 
TAAAACAAAA 
TAAAACAAAA 
TAAAACAAAA 



AAAACTATAA 
AAAACTATAA 
AAAACTATAA 
AAAACTATAA 
AAAACTATAA 
AAAACTATAA 
AAAACTATAA 
AAAACTATAA 
AAAACTATAA 



AAATTATTTT 
AAATTATTTT 
AAATTATTTT 
AAATTATTTT 
AAATTATTTT 
AAATTATTTT 
AAATTATTTT 
AAATTATTTT 
AAATTATTTT 



TTCAGATGGT 
TTCAGATGGT 
TTCAGATGGT 
TTCAGATGGT 
TTCAGATGGT 
TTCAGATGGT 
TTCAGATGGT 
TTCAGATGGT 
TTCAGATGGT 



400 

CAGGAGAAGA 
CAGGAGAAGA 
CAGGAGAAGA 
CAGGAGAAGA 
CAGGAGAAGA 
CAGGAGAAGA 
CAGGAGAAGA 
CAGGAGAAGA 
CAGGAGAAGA 



msa75400 .2{286_090j 
msa7 54 0 0 . 2 [ 2 8 6_CJB1 10 
msa75400.2(286_18RS21 
msa75400 . 2 f 286_2603 
msa75400 . 2 { 286_A909 
msa75400.2{286_H36B 
msa75400 .2 {286_JM9130013 
msa75400 .2{286_M781 
nisa75400.2{286_1169NT 
Consensus 



401 

TACAA 

TACAA 

TACAA 

TACAA 

TACAA 

TACAA 

TACAA 

TACAA 

TACAA 

***** 



SEQ ID MO. 6510 
STRAIN 2603 frame: 1 

MKKSTQI IIjLI VALF I LVFSGGFYMKEQQRKEELKRNRE YEVSLVKALKNSYEN IEB I KI 

THPVSTEIPGDWHCTVKISFNDKKSIVYNITH^ 

KTIKI XFSDGQEKXQ 

SEQ ZD MO. 6511 
STRAIN 090 

GGFYMKECK2RKEELKRNREYEVSLVKALKNSYENIEEIKITHPVSTBIPGD 

WHCTVKI SFNDKKS I VYNITHNLESKKNYSGNFNBKNMNPFDSRIGKTKKTIK^ I FSDGQ 

EKIQ 

SEQ ZD MO* 6512 
STRAIN A909 

GGFYMKBQQRKEEIiKRNRE YBVSLVKALKNS YEN I EE I KITHPV3TB I PGDWH 

CTVKI SFNDKKS I VYNITHNLES KKNYSGKFNEKNMNFFDSRI GKTKKT I KI I FSDGQEK 

IQ 

SEQ ZD HO. 6513 
STRAIN H36B 

GGFYMKEC£RKEEIiKRNREYEVSLVKALKNSYENI EE I KI TH PVSTE I PGD 

WHCTVKI SFNDKKS I VYNITHNLESKKNYSGKFNEKNMNFFDSRIGKTKKTI KI I FSDGQ 

EKIQ 

SEQ ZD MO. 6514 
STRAIN 18RS21 

GGFYMKEQQRKEELKRNREYEVSLVKALKNS YEN I EE I KITH PVSTE I PGDW 

HCTVKI SFNDKKS IVYNITHNLESKKNYSGKFNEKNMNFFDSRIGKTKKTIKI I FSDGQE 

KIQ 

SEQ ZD MO. 6515 
STRAIN CJB110 

GG FYMKEC<3RKEELKR1JREYEVSL VKALKNSYEN I EE I K I THPVSTE I PGDWHCTVK 
ISFNDKKSIVYNITHNLESKKNYSGNFNEKNMNFFDSRIGKTKKTIKI I FSDGQE KIQ 

SEQ ZD MO. 6516 
STRAIN JM9130013 

GGFYMKEQQRKEELKRNREYEVSLVKALKNSYBNI EE I KI THPVSTE I PGDW 
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HCTVKI SFNDKKS I VYNITHNLBSKKNYSGKFNEKNMNFFDSRIGKTKKT I KI I PSDGQB 
KIQ 

SEQ ZD NO. $517 
STRAIN 1 169NT frame: 1 

GG FYMKEQQRKEELKRNREYEVSLVKALKNS YEN I EE I KITHPVSTE I PGD WHCTVKI S P 
NDKKSIVYNITHNLESKKNYSGKFNEKNMNFFDSRIGKTKCT^ 

SEQ ZD NO. 6518 
STRAIN M78 1 frame: 1 

G<3FYMKEQQRXEELKRNRBYEVSLVKAIiKNSYENIEEI KITHPVSTE I PGDWHCTVKISP 
NDKKSIVYNITHNLESKKNYSGKFNBKNMNFraSRIGKTKKTIKII 

PRETTY of: /biotmp/msa75376 . 2 { *} March 10, 2003 10*01 . . 

1 50 

msa7S376. 2 { 286_090} GGFYMKEQQR KEELKRNREY EVSLVKALKN 

msa75376.2(286_1169NT> GGFYMKEQQR KEELKRNREY EVSLVKALKN 

msa75376.2(286_18RS2l} GGFYMKEQQR KEELKRNREY EVSLVKALKN 

msa75376.2{286_2603} mkkstqiill ivalfilvfs GGFYMKEQQR KEELKRNREY EVSLVKALKN 

msa75376.2{286_A909> GGFYMKEQQR KEELKRNREY EVSLVKALKN 

msa75376.2{286_CJB110j GGFYMKEQQR KEELKRNREY EVSLVKALKN 

raaa75376.2{286_H36B> GGFYMKEQQR KEELKRNREY EVSLVKALKN 

msa75376.2{286 JM9130013) GGFYMKEQQR KEELKRNREY EVSLVKALKN 

msa75376.2{286_M78l) GGFYMKEQQR KEELKRNREY EVSLVKALKN 

Consensus ********** ********** ********** ********** ********** 



msa75376.2{286_090 
msa75376.2{286_1169NT 
msa75376 . 2 { 286_18RS21 
msa?5376.2f286__2603 
msa75376.2{286_A909 
ms a7 5 3 7 6 . 2 { 2 8 6_C JB1 1 0 
msa75376 . 2 {286_H36B 
msa75376 . 2 {286_JM9130013 
rasa75376.2{286_M781 
Consensus 



51 

SYENIEEIKI 
SYENIEEIKI 
SYENIEEIKI 
SYENIEEIKI 
SYENIEEIKI 
SYENIEEIKI 
SYENIEEIKI 
SYENIEEIKI 
SYENIEEIKI 



THPVSTEIPG 
THPVSTEIPG 
THPVSTEIPG 
THPVSTEIPG 
THPVSTEIPG 
THPVSTEIPG 
THPVSTEIPG 
THPVSTEIPG 
THPVSTEIPG 



DWHCTVKISF 
D WHCTVKI SF 
DWHCTVKISF 
DWHCTVKISF 
DWHCTVKISF 
DWHCTVKISF 
DWHCTVKISF 
DWHCTVKISF 
DWHCTVKISF 



NDKKSIVYNI 
NDKKSIVYNI 
NDKKSIVYNI 
NDKKSIVYNI 
NDKKSIVYNI 
NDKKSIVYNI 
NDKKSIVYNI 
NDKKSIVYNI 
NDKKSIVYNI 



100 

THNLESKKNY 
THNLBSKKNY 
THNLESKKNY 
THNLESKKNY 



THNLESKKNY 
THNLESKKNY 
THNLESKKNY 
THNLESKKNY 



msa7537€ . 2 { 286_090 
msa75376 . 2 (286_1169Nt' 
msa75376 . 2 {286_18RS21 
msa75376 . 2 ( 286' 2603 
msa75376 . 2 {286_A909 
msa7 53 7 6 . 2 { 2 8 6_CJB110 
msa7 5376.2(28 6_H3 6B 
msa75376.2{286_JM9130013 
msa75376 .2 {286_M781 
Consensus 



101 

SGnFNEKNMN 
SGkFNEKNMN 
SGkFNEKNMN 
SGkFNEKNMN 
SGkFNEKNMN 
SGnFNEKNMN 
SGkFNEKNMN 
SGkFNEKNMN 
SGkFNEKNMN 



FFDSRIGKTK 
FFDSRIGKTK 
FFDSRIGKTK 
FFDSRIGKTK 
FFDSRIGKTK 
FFDSRIGKTK 
FFDSRIGKTK 
FFDSRIGKTK 
FFDSRIGKTK 



KTIKIIFSDG 
KTIKIIFSDG 
KTIKIIFSDG 
KTIKIIFSDG 
KTIKIIFSDG 
KTIKIIFSDG 
KTIKIIFSDG 
KTIKIIFSDG 
KTIKIIFSDG 



135 
QEKIQ 
QEKIQ 
QEKIQ 
QEKIQ 
QEKIQ 
QEKIQ 
QEKIQ 
QEKIQ 
QEKIQ 
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SEQ ID MO. 6601 
STRAIN 2603 

TTGACAAGG CATATAAAAATTTCTATACTAAATTTACAAAA 
GAAATACTGATTGCAGGTGGTAGTGGTTTTTTAGGAAAGC^ 
ACAAAAGGGC^TAAAGTGGCITACriTATCAAGACATGA^ 
GATCCTAGATTAACCTACATTAGGGGAGATATTACAGAAGCT 

GACAGAACTTTTGATATATTAATTGACTGTATTGGAG CGATTAAG CCCAATCAACTAGAT 
GAGCTTAACGTTAAAGCAACXTCAAAAAGCAGTAG CACTCTGTCACAAAAATCAAATACCA 
AAGTTAGTTTATATTTCAGCCAACAGCGGCTATTCAGCriT 
GCIACAGCAGATAAT CAAAGCAAGCX3GTCT 

TATGGTGAAGAGCGACCTCTCTCGATTTTC CAAGCCAAGTGTATAAAGTTATTTAGTCAT 
TrGCCTTTCTTAGGTATTGTTGTACAAAAGGTCTTTCCAACT 
GAAGCAATCGTTACTACGCTTAGGAAAAAACGAACCCAAAAAATCCITITC^ 
TTAAATAATAAA 



SEQ ID NO. 6602 
STRAIN 090 

ACAAGGCATATAAAAATTTCTATACTAAATTTACAAAAT 

GAAGGAGAGGGAACTATGGAAATACTGATTGCAGGTGGTAGTGGl-i-i-i 

AGGAAAGCAGATAATAAAAG CAGCGCTTACAAAAGGGCATAAAGTGGCTT 

ACTTATCAAGACATGAAGGTAAAGGTGATATATTTAAGGATCCTAGATTA 

ACCTACATTAGGGQAGATATTACAGAAGCTGATAAGATTCATTTAGAAGA 

OU1AACTTTTGATATATTAATTGACTGTATTGGAG CGATT AAGCC CAAT C 

AACTAGATGAGCT^AACGTTAAAGCAACGCAAAAAGCMTAGCACTCTG^ , 

CACAAAAATCAAATACCAAAGTTAGTTTATATT^ 

TTCAG CTT ACATTAAAAGT AAAAGG AAGG CAGAG CAGATAAT CAAAG CAA 
GCGGT CTGGATTATC"1U"1T1'GTAAGACCAGGTTTGATGTATGGTGAAGAG 
CX3ACC7TCTCTCGATTTTCCIAAGCCAAGTGTATAAAGTTATTTA 
GCCTTTCTTAGGTATTGTTGTACAAAAGGTCTT^ 

TAGTGGCAGAAG CAATCGTTACTACGCTTAGGAAAAAACCZAACXICAAAAA 
ATCCTTTCTATTGAAGAATTAAATAATAAA 

SEQ ID NO. 6603 
STRAIN A909 

ACAAGGCATATAAAAATTTCTATACTAAATTTACAAAATG 
AAGGAGAGGGAACTATGGAAATACTGATTGCAGGTGGTAGTGG'l"i"l"ri'rA 
GGAAAGCAGATAATAAAAGCAGCXSCriTACAAAAGGGCATAAAGTGGCTTA 
CTTATCAA3ACATGAAGGTAAAGGTGATATATTTAAGGATCCTAGATTAA 
CCTACATTAGGGGAGATATTACAGAAGCTGATAAGATTCATTTAGAAGAC 
AGAACTTTTGATATATTAATTGACTGTATTGGAG CGATTAAGCCCAATCA 
ACTAGATGAGCTTAACGTTAAAGCAACCCAAAAAGCAGTAG CACTCTGTC 
ACAAAAATCAAATAC GAAAGTT AGTTT ATATTT CAGC CAACAG CGGCT AT 
T CAG CTTACATTAAAAGTAAAAGGAAGG CAGAG CAGATAATCAAAGCAAG 
CGGTCTGGATTATCTTTTTGTAAGACC1AGGTTTG 
GACCTCTTCTCGATTTTCCAAGCCAA 
CCTTTCTTAGGTATTGTTGTACAAAAGGTCTT^ 

AGTGGCAGAAGCAATCGTTACTACGCrTAGGAAAAAACCAACCCAAAAAA 
TCCTTTCTATTGAAGAATTAAATAATAAA 



SEQ ID NO. 6604 
STRAIN H36B 

TATAAAAATTTCTATACTAAATTTACAAAATGAAGGAGAGGGAACTATGG 

AAATACI^TTGCAGGTGGTAGTGGTTTTTTAGGAAAGCAGATAATAAAA 

GCAGCGCTTACAAAAGGGCATAAAGTGGCTTACTTATCAAGACATG^ 

TAAAGGTGATATATTTAAGGATCCTAGATTAACCTACATTAGGGGAGATA 

TTACAGAAGCTGATAAGATTCATTTAGAAGAC^ 

ATTGACTGTATTGGAGCGATTAAGC CCAATCAACTAGATGAGCTTAACGT 

TAAAGCAACCCAAAAAGCAGTAGCACTCTGTCACAAAAATC^ 

AGTTAGTTTATATTTCAGCCAACAG CGGCTATTCAGCTT ACATTAAAAGT 

AAAAGGAAGG CAGAG CAGATAATCAAAGCAAG CGGTCTGGATTATCTTTT 

TGTAAGACGAGGTTTGATGTATGGTGAAGAGCGACCT 

AAGCCAAGTGTATAAAGTTATTTAGTCAT^ 

GTACAAAAGGTCTTTCGAACTAAGGTT^ 

TACTACGCTTAGGAAAAAACCAACCCAAAAAATCU"ri"lVlATTGAAGAAT 
TAAATAATAAA 



SEQ ID NO. 6605 
STRAIN 18RS21 

ACAAGGCATATAAAAATTTCTATACTAAATTTACAAAAT 

GAAGGAGAGGGAACTATGGAAATACTGATTGCAGGT^ 

AGGAAAGCAGATAATAAAAGCAGCX5CTTACAAAAGGGCATAAAGTGGCTT 

ACTTATCAAGACATGAAGGTAAAGGTGATATATTTA^ 

ACCTACATTAGGGGAGATATTACAGAAG CTGATAAGATTCATTTAGAAGA 

CAGAACTTTTGATATATTAATTGACTGTAT^ 

AACTAGATGAGCTTAACXTITAAAGCAACCCAAAAAGC^ 

CACAAAAATCAAATACCAAAGTTAGTTTATATTTC^ 

TTCAG CTTACATTAAAAOT AAAAGGAAGG CAGAG CAGATAATCAAAG CAA 

GCGGTCTGGATTATCTTTTTGTAAGACCA^ 

CX5ACCTCICTCX?ATTTTCCAA^ 

GCCTTICTTAGGTATTGTTOTACIAAAAGGTCTT^ 

TAGTGGCAGAAGCAATCGTTACTACGCTTAGGA^ 

ATCCTTTCTATTGAAGAATTAAATaATAAA 
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Table 66: Comparative Sequences relating to SAG 0754 



SEQ ID NO. 6606 
STRAIN M732 

CAAAATGAAGGAGAgGG AACTATGg AAAT ACTGATTG CAGGTGGTAGTGG 
TTTTCTAGGGAAGCAGATAATAAAAGCAG CG CTTACAAAAGGGCATAAGG 
TGGCITACTTATC^GGCATGAAGGTAAAGGTGATATATTTAAGGATCcT 
AGATTAACCTACATTAAGGGAGATATTACAGAAGCTGATAA 
AGaACATAGAAATTTTGATATATTAATTGACTGTATTGGAGCGATTAAGC 
CCAATCAACTAGATGAGCTTAACGTTAAAGCAACCCAAAAAGCAGTAG CA 
CTCTGTCACAAAAATCAAATACCAAAGTTAGTTTACATTTCAGC^ 
CGGCTATTCAGCTTACATTAAAAGT AAAAGGAAGG CAGAG CAGAT AATCA 
AAGCAAGOXnCTGGATTATCTTTTTGT^ 

GAAGAGCGACCTCTCTCGATTTTC CAAGCCAAGTGTATAAAATTATTTAG 
TCATTTGCCTTTCTTAGGTATTGTTGTACA^ 

TTGTGATAGTGGCAGAAGCAAT03TTACTTC^CTTAGGAAAAAACCAACT 
CAAAAAATCCTTTCTATTGAAGAATTAAATAATAAA 

SEQ ID NO. 6607 
STRAIN COH1 

ACAAGGCATATAAAAATTTCTATACTAAATTTAC 

AAAATGAAGGAGAGGGAACTATGGAAATACTGATTGCAGGTGGTAGTGGT 

TTTCT AGGGAAG CAGAT AATAAAAGCAGCGCTTACAAAAGGGCATAAGGT 

GGCTTACTTATCAAGGCATGAAGGTAAAGGTGATATATTTAAGGATCCTA 

GATTAACCTACATTAAGGGAGATATTACAGAAGCTGATAAGATTC^TTTA 

GAACATAGAAATTTTGATATATTAATTGACI^^ 

CAATCAACTAGATGAGCTTAAC^ 

TCTGTCACAAAAATCAAATACCAAAGTTAGTT^ 

GGCTATTCAG CTTACATTAAAAGTAAAAGGAAGGCAGAGCAGATAATCAA 

AGCAAGGGGTCTGGATTATCTTTTTGTAA 

AAGAGCQACCTCTCTCGATTTTCCAAGCCAAGTGTATAAAAT^ 

TGTGATAGTGGCAGAAGCAATCGTTACTTCGCTTAGGAAAAAACX^ 
AAAAAATCCTTTCTATTGAAGAATTAAATAATAAA 

SEQ ID NO. 6608 
STRAIN M781 

ACAAGGCATATAAAAATTTcTATACTAAATTTaCA 

AAATGAAGGAGAGGGAACTATGGAAATACTGATTGCAGGTGGTAGTGGTT 
TTCTAGGGAAGCAGATAATAAAAGCAGCGCrTACAAAAGGGCATAAGGTG 
GCTTACTTATCAAGGCATGAAGGTAAAGGTGATATATTTAAGGATCCTAG 
ATTAACCTACATTAAGGGAGATATTACAGAAG CTGATAAGATTCATTTAG 
AACMAGAAATTTTGATATATTAATTC 

AATCAACTAGATGAGCTTAACGTTAAAGCAACCCAAAAAGCAGTAGCACT 
ClliTCAGAAAAATCAAATACCAAAGTTAGTTTAC^ 

GCTATTCAGCTTACATTAAAAGTAAAAGGAAGGCAGAGCAGATAATCAAA 
GCAAGCGGTCTGGATTATCTTTTTGTAAGACCAGGTTTGATC 
AGAGCXSACCTCTCTCGATTTTCCAAGCCAAG^ 
ATTTGCCTTTCTTAGGTATTGTTGTACAAAA^ 

AAAAATGCTTTCTAtTGAAGAATTAAATAATAAA 

SEQ ZD NO. 6609 
STRAIN 1169NT 

ACAAGGCATATAAAAATTTCTATACTAAATTTACAAA 
ATGJUVGGAGAGGGAACTATGGAAATACTGATTGCAGGTGGTAGTC 
TTAGGAAAG CAGATAATAAAAG CAGCG CTT ACAAAAGGG CAT AAGTTGGC 
TTACTTATCAAGACATGAAGGTAAAGGTXIATA 

TAACCTACATTAAGGGAGATATTACAGAAGCTGATAAGATTCATTTAGAA 
GACAGi^CTTTTGATATATTAATTGACTGTATTGGAG CGATTAAGCCCAA 
TCAACTAGATGAGCTTAACGTTAAAGC1AACXXIAAAAAGCAGT 
GTCACAAAAATCAAATACJCAAAGTTAGTTT^ 

TATTCAGC1TACATTAGAAGTAAAAGGAAGGCAGAGCAGATAATCAAAGC 
AAGCX^TCTGGATTATCTTTTTCT 
AGCGACXnCTCTOGATTTTCCAAGCCAAG 
TTGCCTTTCTTAGGTATTGTTGTACAAAA 

GATAGTGGCAGAAG CAATCGTT ACTAGGCTTAGGACAAAACCAACTCAAA 
AAATCCTTTCTATTGAAGAATTAAATAATAAA 

SEQ ZD NO. 6610 
STRAIN CJB110 

ACAAGGCATATAAAAATTTCTATACTAAATTTACAAA 

ATXjAAGGAGAGGGAACTATGGAAATACTGATTGCAGGTGG'i^ 

TT AGGAAAGCAGATAATAAAAGCAG CG CTTACAAAAGGGCAT AAAGTGG C 

TTACiUATCAAGACATGAAGGTAAAGGTGATATATTTAAGGATC 

TAACCTACATTAGGGGAGATATTACAGAAG CIX2ATAAGATTCATTTAGAA 

GACAGAAC!TTTTGATATATTAATTGACTGTATTG^ CCCAA 

TCAACTAGATGAGCTTAACGTTAAAGCAACCCAA 

GrCACAAAAATCAAATACCAAAGTTAGT^ 

TATTCAG CTTACATTAAAAGTAAAAGGAAGGCAGAGCAGATAATCAAAGC 

AAGCXKH'CTGGATTATCITTTTGT^ 

AGC<^CCTCTCrOGATTTTCOVAGCCAAGTCT 

TTGCCTXTCTTAGGTATTGTTGTACA^ 

GATAGTGGCAGAAGCAATCGTTACTACGCTTAGGAAAAA^ 

AAATCCTTT CTATTGAAGAATT AAATAATAAA 



961 



WO 2004/018646 



PCT/US2003/026827 



Table 66: C mparative Sequences relating to SAG 0754 



SEQ ID NO. 6611 
STRAIN JM9130013 

ACAAGGCATATAAAAATTTCTATACTAAATTTACAAAATG 

AAGGAGAGGGAACTATGGAAATACT^TTGCAGGTGGTAGTGGlVrriTA 

GGAAAGCAGATAATAAAAGCAGCGCTTACAAAAGGGCATAAAGTGGCTTA 

CTTATCAAGACATGAAGGTAAAGGTGATATATTTAAGGATCCTAGATTAA 

CcTACATTAGGGGAGATATTACAGAAGCTGATAAGATTCATTTAGAAGA^ 

AGAACTTTTGATATATTAATTGACTGTATT^ 

ACTAGATGAGCTTAACGTTAAAGCAACCCAAAAAGCAGTAGCACTCTGTC 
ACAAAAATCAAATACCAAAGTTAGTTT ATATTTCAGCCAACAGCGG CTAT 
TGAGCTTAGATTAAAAOTAAAAGGAAGGCAGAG^ 
CGGTCTGGATTATCTTTTTGTAAGACCAGGTTTGATGTAT^ 
GACCTCT CTCGATTTTC GAAGCCAAGTGTATAAAGTTATTTAGTCATTTG 
CC tTTCTTAgGTATTGTTGTACAAAAGGTCTT^ 

'^^^HH^^?^ 0 CGTT ACT ACG OI^J\GGA7VAAAACXIAACCCAAAAAA 
TCCTTTCTATTGAAGAATTAAATAATAAA 

PRETTY of i /biotmp/tnsal37119.2{*} April 10, 2003 03«30 



rasal37119.2{303_COHl 
msal37119.2{303_M732' 
msal37119.2{303_m78l' 
msal37119 . 2 {303_090 ' 
maal37119.2{303_18RS21 
msal37119 . 2 f 303_2603 
msal37119.2{303_A909 
rasal37119 . 2 { 303_CJB110 
msal37119 . 2 { 303JH36B 
msal37119.2{303_JM9130013 
msal37119.2{303_1169OT 
Consensus 



acaaggc atataaaaat ttctatacta 



acaaggc 

acaaggc 

acaaggc 

ttgacaaggc 

acaaggc 

acaaggc 

acaaggc 

-—acaaggc 
*** 



atataaaaat 
atataaaaat 
atataaaaat 
atataaaaat 
atataaaaat 
atataaaaat 
atataaaaat 
atataaaaat 
atataaaaat 



ttctatacta 
ttctatacta 
ttctatacta 
ttctatacta 
ttctatacta 
ttctatacta 
ttctatacta 
ttctatacta 
ttctatacta 



aatttaCAAA 

CAAA 

aatttaCAAA 
aatttaCAAA 
aatttaCAAA 
aatttaCAAA 
aatttaCAAA 
aatttaCAAA 
aatttaCAAA 
aatttaCAAA 
aatttaCAAA 



50 

ATGAAGGAGA 
ATGAAGGAGA 
ATGAAGGAGA 
ATGAAGGAGA 
ATGAAGGAGA 
ATGAAGGAGA 
ATGAAGGAGA 
ATGAAGGAGA 
ATGAAGGAGA 
ATGAAGGAGA 
ATGAAGGAGA 



msal37119 . 2 { 303_COH1 
msal37119 . 2 { 303_M732 ' 
msal37119 . 2 { 303 jm781 
msal37119 . 2 {303_090 
msal37119 . 2 { 303_18RS21 
rasal37119 . 2 { 303 J2603 ( 
11183137119 . 2 { 303_A909 
msal37119.2{303_CJB110 
msal37119 . 2 { 303_H36B 
msal37119.2{303_JM9130013 
msal37119.2{303_1169NT 
Consensus 



51 

GGGAACTATG 
GGGAACTATG 
GGGAACTATG 
GGGAACTATG 
GGGAACTATG 
GGGAACTATG 
GGGAACTATG 
GGGAACTATG 
GGGAACTATG 
GGGAACTATG 
GGGAACTATG 



GAAATACTGA 
GAAATACTGA 
GAAATACTGA 
GAAATACTGA 
GAAATACTGA 
GAAATACTGA 
GAAATACTGA 
GAAATACTGA 
GAAATACTGA 
GAAATACTGA 
GAAATACTGA 



TTGCAGGTGG 
TTGCAGGTGG 
TTGCAGGTGG 
TTGCAGGTGG 
TTGCAGGTGG 
TTGCAGGTGG 
TTGCAGGTGG 
TTGCAGGTGG 
TTGCAGGTGG 
TTGCAGGTGG 
TTGCAGGTGG 



TAGTGGTTTT 
TAGTGGTTTT 
TAGTGGTTTT 
TAGTGGTTTT 
TAGTGGTTTT 
TAGTGGTTTT 
TAGTGGTTTT 
TAGTGGTTTT 
TAGTGGTTTT 
TAGTGGTTTT 
TAGTGGTTTT 



100 

cTAGGgAAGC 
cTAGGgAAGC 
cTAGGgAAGC 
tTAGGaAAGC 
tTAGG aAAGC 
tTAGGaAAGC 
tTAGGaAAGC 
tTAGGaAAGC 
tTAGGaAAGC 
tTAGGaAAGC 
tTAGGaAAGC 



rasal3 7119 . 2 ( 303_COH1 
maal37119 . 2 f 303_M732 ' 
msal37119.2{303_m78l' 
msal37119 . 2 { 303_090 
msal37119.2{303_18RS21 
msal37119 . 2 f 303_2603 
msal37119.2{303_A909 
msal37119.2{303_CJB110 
msal37119 . 2 { 303_H36B 
msal37119 . 2{303_JM9130013 
msal37119 . 2 { 303_1169NT 
Consensus 



101 

AGATAATAAA 
. AGATAATAAA 
AGATAATAAA 
AGATAATAAA 
AGATAATAAA 
AGATAATAAA 
AGATAATAAA 
AGATAATAAA 
AGATAATAAA 
AGATAATAAA 
AGATAATAAA 



AGCAGCGCTT 
AGCAGCGCTT 
AGCAGCGCTT 
AGCAGCGCTT 
AGCAGCGCTT 
AGCAGCGCTT 
AGCAGCGCTT 
AGCAGCGCTT 
AGCAGCGCTT 
AGCAGCGCTT 
AGCAGCGCTT 



ACAAAAGGGC 
ACAAAAGGGC 
ACAAAAGGGC 
ACAAAAGGGC 
ACAAAAGGGC 
ACAAAAGGGC 
ACAAAAGGGC 
ACAAAAGGGC 
ACAAAAGGGC 
ACAAAAGGGC 
ACAAAAGGGC 



ATAAggTGGC 
ATAAggTGGC 
ATAAggTGGC 
ATAAagTGGC 
ATAAagTGGC 
ATAAagTGGC 
ATAAagTGGC 
ATAAagTGGC 
ATAAagTGGC 
ATAAagTGGC 
ATAAgtTGGC 



150 

TTACTTATCA 
TTACTTATCA 
TTACTTATCA 
TTACTTATCA 
TTACTTATCA 
TTACTTATCA 
TTACTTATCA 
TTACTTATCA 
TTACTTATCA 
TTACTTATCA 
TTACTTATCA 



msal37119 . 2 { 303_COH1 ' 
msal37119 . 2 f 303_M732 
msal37119 . 2 { 303~m781 
msal37119.2{303_090 
msal37119.2{303 18RS21 
msal37119.2(303 2603 
msal37119 . 2 { 303_A909 
msal37119.2{303 CJB110 
msal37119.2{303 H36B 
rnsal37119.2{303_JM9130013 
msal37119 . 2 { 303_1169NT 
Consensus 



151 

AGgCATGAAG 
AGgCATGAAG 
AGgCATGAAG 
AGaCATGAAG 
AGaCATGAAG 
AGaCATGAAG 
AGaCATGAAG 
AGaCATGAAG 
AGaCATGAAG 
AGaCATGAAG 
AGaCATGAAG 



GTAAAGGTGA 
GTAAAGGTGA 
GTAAAGGTGA 
GTAAAGGTGA 
GTAAAGGTGA 
GTAAAGGTGA 
GTAAAGGTGA 
GTAAAGGTGA 
GTAAAGGTGA 
GTAAAGGTGA 
GTAAAGGTGA 



TATATTTAAG 
TATATTTAAG 
TATATTTAAG 
TATATTTAAG 
TATATTTAAG 
TATATTTAAG 
TATATTTAAG 
TATATTTAAG 
TATATTTAAG 
TATATTTAAG 
TATATTTAAG 



GATCCTAGAT 
GATCCTAGAT 
GATCCTAGAT 
GATCCTAGAT 
GATCCTAGAT 
GATCCTAGAT 
GATCCTAGAT 
GATCCTAGAT 
GATCCTAGAT 
GATCCTAGAT 
GATCCTAGAT 



200 

TAACCTACAT 
TAACCTACAT 
TAACCTACAT 
TAACCTACAT 
TAACCTACAT 
TAACCTACAT 
TAACCTACAT 
TAACCTACAT 
TAACCTACAT 
TAACCTACAT 
TAACCTACAT 



msal37119 . 2 { 303_COH1 
tnsal37119 . 2 { 303_M732 
msal37119 . 2 { 303_ra781 
moal37 119.2 { 303_090 
msal37119 . 2 { 303_18RS21 
msal37119.2{303 2603 



201 

TAaGGGAGAT 
TAaGGGAGAT 
TAaGGGAGAT 
TAgGGGAGAT 
TAgGGGAGAT 
TAgGGGAGAT 



ATTACAGAAG 
ATTACAGAAG 
ATTACAGAAG 
ATTACAGAAG 
ATTACAGAAG 
ATTACAGAAG 



CTGATAAGAT 
CTGATAAGAT 
CTGATAAGAT 
CTGATAAGAT 
CTGATAAGAT 
CTGATAAGAT 



TC ATTTA GAA 
TCATTTAGAA 
TCATTTAGAA 
TCATTTAGAA 
TCATTTAGAA 
TCATTTAGAA 



250 

cAtAGAAaTT 
cAtAGAAaTT 
CAtAGAAaTT 
gAcAGAAcTT 
gAcAGAAcTT 
gAcAGAAcTT 
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Table 66: Comparative Sequences relating to SAG 0754 



msal37119 . 2 { 303_A909 
moal37119 . 2 { 303_CJB110 
ntsal37119.2{303_H36B 
maal37119.2{303_JM9130013 
msal37119 . 2 {303_1169NT 
Consensus 



TAgGGGAGAT ATTACAGAAG 
TAgGGGAGAT ATTACAGAAG 
TAgGGGAGAT ATTACAGAAG 
TAgGGGAGAT ATTACAGAAG 
TAaGGGAGAT ATTACAGAAG 



CTGATAAGAT TC ATTTA GAA gAcAGAAcTT 
CTGATAAGAT TCATTTAGAA gAcAGAAcTT 
CTGATAAGAT TCATTTAGAA gAcAGAAcTT 
CTGATAAGAT TCATTTAGAA gAcAGAAcTT 
CTGATAAGAT TCATTTAGAA gAcAGAAcTT 



msal37119 .2(303_COH1' 
rasal37119.2(303_M732 ( 
msal37119.2{303_ra781 
msal37119.2{303_090' 
rosal37119 . 2 {303_18RS21 ( 
msal37119.2(303_2603 ( 
msal37119 ,2{303_A909 
msal37119 . 2 { 303_CJB110 , 
• msa!37119.2{303_H36B 
msal37119 . 2 { 303_JM9130013 
msal37119 . 2 {303JL169NT 
Consensus 



msal3 7 1 1 9 . 2 ( 3 0 3_COHl ] 
msal37119. 2(303_M732 
msal37119 . 2 { 303_m781 
msal37 119 . 2 { 3 03_090 
msal37119 . 2 { 303_18RS2 1 
rasal37119 . 2 ( 303_2603 
msal37119.2{303JV9O9 
msal37119.2{303_CJB110 
msal37119 . 2 { 303_H36B 
msal37119 . 2 {303_JM9130013 
rasal37119 . 2 { 303JL169NT 
Consensus 



251 

TTGATATATT 
TTGATATATT 
TTGATATATT 
TTGATATATT 
TTGATATATT 
TTGATATATT 
TTGATATATT 
TTGATATATT 
TTGATATATT 
TTGATATATT 
TTGATATATT 



AATTGACTGT 
AATTGACTGT 
AATTGACTGT 
AATTGACTGT 
AATTGACTGT 
AATTGACTGT 
AATTGACTGT 
AATTGACTGT 
AATTGACTGT 
AATTGACTGT 
AATTGACTGT 



ATTGGAGCGA 
ATTGGAGCGA 
ATTGGAGCGA 
ATTGGAGCGA 
ATTGGAGCGA 
ATTGGAGCGA 
ATTGGAGCGA 
ATTGGAGCGA 
ATTGGAGCGA 
ATTGGAGCGA 
ATTGGAGCGA 



TTAAGCCCAA 
TTAAGCCCAA 
TTAAGCCCAA 
TTAAGCCCAA 
TTAAGCCCAA 
TTAAGCCCAA 
TTAAGCCCAA 
TTAAGCCCAA 
TTAAGCCCAA 
TTAAGCCCAA 
TTAAGCCCAA 



300 

TCAACTAGAT 
TCAACTAGAT 
TCAACTAGAT 
TCAACTAGAT 
TCAACTAGAT 
TCAACTAGAT 
TCAACTAGAT 
TCAACTAGAT 
TCAACTAGAT 
TCAACTAGAT 
TCAACTAGAT 



301 

GAGCTTAACG 
GAGCTTAACG 
GAGCTTAACG 
GAGCTTAACG 
GAGCTTAACG 
GAGCTTAACG 
GAGCTTAACG 
GAGCTTAACG 
GAGCTTAACG 
GAGCTTAACG 
GAGCTTAACG 



TTAAAGCAAC 
TTAAAGCAAC 
TTAAAGCAAC 
TTAAAGCAAC 
TTAAAGCAAC 
TTAAAGCAAC 
TTAAAGCAAC 
TTAAAGCAAC 
TTAAAGCAAC 
TTAAAGCAAC 
TTAAAGCAAC 



CCAAAAAGCA 
CCAAAAAGCA 
CCAAAAAGCA 
CCAAAAAGCA 
CCAAAAAGCA 
CCAAAAAGCA 
CCAAAAAGCA 
CCAAAAAGCA 
CCAAAAAGCA 
CCAAAAAGCA 
CCAAAAAGCA 



GTAGCACTCT 
GTAGCACTCT 
GTAGCACTCT 
GTAGCACTCT 
GTAGCACTCT 
GTAGCACTCT 
GTAGCACTCT 
GTAGCACTCT 
GTAGCACTCT 
GTAGCACTCT 
GTAGCACTCT 



350 

GTCACAAAAA 
GTCACAAAAA 
GTCACAAAAA 
GTCACAAAAA 
GTCACAAAAA 
GTCACAAAAA 
GTCACAAAAA 
GTCACAAAAA 
GTCACAAAAA 
GTCACAAAAA 
GTCACAAAAA 



msal37119.2(303_COIU/ 
msal37119.2(303_M732 ) 
msal37119.2{303_m781 
msal37119 . 2 {303_090 
msal37119 . 2 {303_18RS21 
msal37119 . 2 {303_2603 
tnsal37119. 2(303 A909 
msal37119.2{303_CJB110 
msal37119.2{303 H36B 
msal37119 . 2 { 303_JM9130013 
rasal37119.2{303_1169NT 
Consensus 



351 

TCAAATACCA 
TCAAATACCA 
TCAAATACCA 
TCAAATACCA 
TCAAATACCA 
TCAAATACCA 
TCAAATACCA 
TCAAATACCA 
TCAAATACCA 
TCAAATACCA 
TCAAATACCA 



AAGTTAGTTT 
AAGTTAGTTT 
AAGTTAGTTT 
AAGTTAGTTT 
AAGTTAGTTT 
AAGTTAGTTT 
AAGTTAGTTT 
AAGTTAGTTT 
AAGTTAGTTT 
AAGTTAGTTT 
AAGTTAGTTT 



AcATTTCAGC 
AcATTTCAGC 
AcATTTCAGC 
AtATTTCAGC 
AtATTTCAGC 
AtATTTCAGC 
AtATTTCAGC 
AtATTTCAGC 
AtATTTCAGC 
AtATTTCAGC 
AcATTTCAGC 



CAAtAGCGGC 
CAAtAGCGGC 
CAAtAGCGGC 
CAAcAGCGGC 
CAAcAGCGGC 
CAAcAGCGGC 
CAAcAGCGGC 
CAACAGCGGC 
CAAcAGCGGC 
CAAcAGCGGC 
CAACAGCGGC 



400 

TATTCAGCTT 
TATTCAGCTT 
TATTCAG CTT 
TATTCAGCTT 
TATTCAGCTT 
TATTCAGCTT 
TATTCAGCTT 
TATTCAGCTT 
TATTCAGCTT 
TATTCAGCTT 
TATTCAGCTT 



msal37119.2{303_COHi; 
insal37119 . 2(303_N732 ( 
msal37119.2{303_ra781 
rasal37119.2{303_090 
msal37119 . 2 { 303_18RS21 
msal37119 . 2 f 303_2603 
msal37119 . 2 { 303_A909 
msal37119 . 2 { 303_CJB110 
msal37119.2{303_H36B 
msal3 7119 . 2 { 3 03_JM9 13 0 0 13 
msal37119 . 2 { 303JL169NT 
Consensus 



401 

ACATTAaAAG 
ACATTAaAAG 
ACATTAaAAG 
ACATTAaAAG 
ACATTAaAAG 
ACATTAaAAG 
ACATTAaAAG 
ACATTAaAAG 
ACATTAaAAG 
ACATTAaAAG 
ACATTAgAAG 



TAAAAGGAAG 
TAAAAGGAAG 
TAAAAGGAAG 
TAAAAGGAAG 
TAAAAGGAAG 
TAAAAGGAAG 
TAAAAGGAAG 
TAAAAGGAAG 
TAAAAGGAAG 
TAAAAGGAAG 
TAAAAGGAAG 



GCAGAGCAGA 
GCAGAGCAGA 
GCAGAGCAGA 
GCAGAGCAGA 
GCAGAGCAGA 
GCAGAGCAGA 
GCAGAGCAGA 
GCAGAGCAGA 
GCAGAGCAGA 
GCAGAGCAGA 
GCAGAGCAGA 



TAATCAAAGC 
TAATCAAAGC 
TAATCAAAGC 
TAATCAAAGC 
TAATCAAAGC 
TAATCAAAGC 
TAATCAAAGC 
TAATCAAAGC 
TAATCAAAGC 
TAATCAAAGC 
TAATCAAAGC 



450 

AAGCGGTCTG 
AAGCGGTCTG 
AAGCGGTCTG 
AAGCGGTCTG 
AAGCGGTCTG 
AAGCGGTCTG 
AAGCGGTCTG 
AAGCGGTCTG 
AAGCGGTCTG 
AAGCGGTCTG 
AAGCGGTCTG 



msal37119. 2(303 COH1 
msal37119.2(303_M732 
tnsal37119.2{303jEn781 
msal37119.2{303 090 
msal37119.2(303_18RS21 
msal37119. 2(303 2603 
msal37119. 2(303 A909 
msal37119.2{303_CJB110 
nsal37119. 2(303 H36B 
cnsal37119.2{303 JM9130013 
msal37119 . 2 (303_1169NT 
Consensus 



451 

GATTATCTTT 
GATTATCTTT 
GATTATCTTT . 
GATTATCTTT 
GATTATCTTT 
GATTATCTTT 
GATTATCTTT 
GATTATCTTT 
GATTATCTTT 
GATTATCTTT 
GATTATCTTT 



TTGTAAGACC 
TTGTAAGACC 
TTGTAAGACC 
TTGTAAGACC 
TTGTAAGACC 
TTGTAAGACC 
TTGTAAGACC 
TTGTAAGACC 
TTGTAAGACC 
TTGTAAGACC 
TTGTAAGACC 



AGGTTTGATG 
AGGTTTGATG 
AGGTTTGATG 
AGGTTTGATG 
AGGTTTGATG 
AGGTTTGATG 
AGGTTTGATG 
AGGTTTGATG 
AGGTTTGATG 
AGGTTTGATG 
AGGTTTGATG 



TATGGTGAAG 
TATGGTGAAG 
TATGGTGAAG 
TATGGTGAAG 
TATGGTGAAG 
TATGGTGAAG 
TATGGTGAAG 
TATGGTGAAG 
TATGGTGAAG 
TATGGTGAAG 
TATGGTGAAG 



500 

AGCGACCTCT 
AGCGACCTCT 
AGCGACCTCT 
AGCGACCTCT 
AGCGACCTCT 
AGCGACCTCT 
AGCGACCTCT 
AGCGACCTCT 
AGCGACCTCT 
AGCGACCTCT 
AGCGACCTCT 



msal37119 . 2( 303_COH1 
insal37119.2(303_M732 
ms al3 7 11 9 . 2 { 3 03_m7 8 1 
msal37119.2{303_090 
msal37119 . 2 { 303_18RS21 



501 

CTCGATTTTC 
CTOGATTTTC 
CTCGATTTTC 
CTCGATTTTC 
CTCGATTTTC 



CAAGCCAAGT GTATAAAaTT ATTTAGTCAT 
CAAGCCAAGT GTATAAAaTT ATTTAGTCAT 
CAAGCCAAGT GTATAAAaTT ATTTAGTCAT 
CAAGCCAAGT GTATAAAgTT ATTTA GTCAT 
CAAGCCAAGT GTATAAAgTT ATTTAGTCAT 



550 

TTGCCTTTCr 
TTGCCTTTCr 
TTGCLTITCT 
TTGCCTTTCT 
TTCCCTTTCT 
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msal37119. 2 (303^2603 
maal37119.2{303_A909 
msal37119 . 2 { 303_CJB110 
tnsal37119.2{303_H36B 
msal37119.2{303_JM9130013 
msal37 119 . 2 { 303_1169NT 
Consensus 



CTCGATTTTC 
CTCGATTTTC 
CTCGATTTTC 
CTCGATTTTC 
CTCGATTTTC 
CTCGATTTTC 



CAAGCCAAGT 
CAAGCCAAGT 
CAAGCCAAGT 
CAAGCCAAGT 
CAAGCCAAGT 
CAAGCCAAGT 



GTATAAAgTT 
GTATAAAgTT 
GTATAAAgTT 
GTATAAAgTT 
GTATAAAgTT 
GTATAAAaTT 



ATTTAGTCAT 
ATTTAGTCAT 
ATTTAGTCAT 
ATTTAGTCAT 
ATTTAGTCAT 
ATTTAGTCAT 



TTGCCTTTCT 
TTGCCTTTCT 
TTGCCTTTCT 
TTGCCTTTCT 
TTGCCTTTCT 
TTGCCTTTCT 



msal37119 . 2 { 303_COH1 ' 
msal37H9.2{303_M732 1 
maal37119.2{303_m781 , 
msal37119 .2 {303_090 ' 
msal37119 . 2{303_JL8RS2l' 
msal37119.2{303_2603 
msal37119 . 2 (303_A909 
msal37119 . 2 { 303_CJB110 
msal37119 . 2 { 303_H36B 
msal37119 . 2 {303_JM9130013 
msal37119.2{303_1169NT' 
Consensus 



551 

TAGGTATTGT 
TAGGTATTGT 
TAGGTATTGT 
TAGGTATTGT 
TAGGTATTGT 
TAGGTATTGT 
TAGGTATTGT 
TAGGTATTGT 
TAGGTATTGT 
TAGGTATTGT 
TAGGTATTGT 



TGTACAAAAa 
TGTACAAAAa 
TGTACAAAAa 
TGTACAAAAg 
TGTACAAAAg 
TGTACAAAAg 
TGTACAAAAg 
TGTACAAAAg 
TGTACAAAAg 
TGTACAAAAg 
TGTACAAAAg 



GTCTTTCCAA 
GTCTTTCCAA 
GTCTTTCCAA 
GTCTTTCCAA 
GTCTTTCCAA 
GTCTTTCCAA 
GTCTTTCCAA 
GTCTTTCCAA 
GTCTTTCCAA 
GT CTTTC CAA 
GTCTTTCCAA 



CTAAGGTTGT 
CTAAGGTTGT 
CTAAGGTTGT 
CTAAGGTTGT 
CTAAGGTTGT 
CTAAGGTTGT 
CTAAGGTTGT 
CTAAGGTTGT 
CTAAGGTTGT 
CTAAGGTTGT 
CTAAGGTTGT 



600 

GATAGTGGCA 
GATAGTGGCA 
GATAGTGGCA 
GATAGTGGCA 
GATAGTGGCA 
GATAGTGGCA 
GATAGTGGCA 
GATAGTGGCA 
GATAGTGGCA 
GATAGTGGCA 
GATAGTGGCA 



msal37119 . 2 { 303_COH1 
msal37119 . 2 { 303_M732 
msal37119.2{303_ra7Bl' 
msal37119 .2 {303_090 
msal37119 . 2 { 303_18RS2 1 
insal37119.2(303 2603 
msal37119.2{303~A909 
msal37119 . 2 {303_CJB110 
msal37119 . 2 { 303_H36B 
msal37119.2{303_JM9130013 
msal37119.2{303_1169NT 
Consensus 



601 

GAAGCAATCG 
GAAGCAATCG 
GAAGCAATCG 
GAAGCAATCG 
GAAGCAATCG 
GAAGCAATCG 
GAAGCAATCG 
GAAGCAATCG 
GAAGCAATCG 
GAAGCAATCG 
GAAGCAATCG 



TTACTtCGCT 
TTACrtCGCT 
TTACTtCGCT 
TTACTaOGCT 
TTACTaCGCT 
TTACTaGGCT 
TTACTaCGCT 
TTACTaCGCT 
TTACTaCGCT 
TTACTaCGCT 
TTACTaCGCT 



TAGGAaAAAA 
TAGGAaAAAA 
TAGGAaAAAA 
TAGGAaAAAA 
TAGGAaAAAA 
TAGGAaAAAA 
TAGGAaAAAA 
TAGGAaAAAA 
TAGGAaAAAA 
TAGGAaAAAA 
TAGGAcAAAA 



CCAACtCAAA 
CCAACtCAAA 
CCAACtCAAA 
CCAACcCAAA 
CCAACcCAAA 
CCAACcCAAA 
CCAACcCAAA 
CCAACcCAAA 
CCAACcCAAA 
CCAACcCAAA 
CCAACtCAAA 



65 0 

AAATCCTTTC 
AAATCCTTTC 
AAATCCTTTC 
AAATCCTTTC 
AAATCCTTTC 
AAATCCTTTC 
AAATCCTTTC 
AAATC CTTTC 
AAATCCTTTC 
AAATCCTTTC 
AAATCCTTTC 



msal 3 7 11 9 . 2 { 3 03_COH1 
tnsal37119.2{303_M732 
TOsal37119.2{303_m781 
msal37119.2{303_090 
msal37119.2{303_18RS21 
msal37119. 2 (303^2603 
msal37119.2{303_A909 
msal37119.2{303_CJB110 
msal37119 . 2 { 303_H36B 
oisal37119 . 2 {303_JM9130013 
msal37119.2{303_1169NT 
Consensus 



651 

TATTGAAGAA 
TATTGAAGAA 
TATTGAAGAA 
TATTGAAGAA 
TATTGAAGAA 
TATTGAAGAA 
TATTGAAGAA 
TATTGAAGAA 
TATTGAAGAA 
TATTGAAGAA 
TATTGAAGAA 
********** 



672 

TTAAATAATA AA 
TTAAATAATA AA 
TTAAATAATA AA 
TTAAATAATA AA 
TTAAATAATA AA 
TTAAATAATA AA 
TTAAATAATA AA 
TTAAATAATA AA 
TTAAATAATA AA 
TTAAATAATA AA 
TTAAATAATA AA 
********** ** 



SKQ ID NO. 6612 

STRAIN 2603 frame: 1 

TRHI KX S I LNLQNEGEGTME I L I AGGSGFLGKQ I 1 KAALTKGHKVAYLSRHEGKGDI FKD 
PRLTYIRGDITEADKI HLEDRTFD I LI DCIGAI KPNQLDELNVKATQKAVALCHKNQ I PK 
LVYI SANSGYSAYIKSKRKAEQI I KASGLDYLFVRPGLMYGEERPLS I FQAKCI KLFSHL 
PFLG I WQKVFPTKWI VAEAI VTTLRKKPTQKI LS I EELNNK 

SEQ ID NO. 6613 

STRAIN 090 frame: 1 

TRHI KI S I LNLQNEGEGTME I L I AGGSGFLGKQI I KAALTKGHKVAYLSRHEGKGDI FKD 
PRLTY I RGD I TEADKI HLEDRTFD I LI DC I GAI KPNQLDELNVKATQKAVALCHKNQ I PK 
LVYI SANSGYSAYIKSKRKAEQI I KASGLDYLFVRPGLMYGEERPLS I FQAKCI KLFSHL 
P FLG I WQKVFPTKWI VAEAI VTTLRKKPTQKI LSI EBLNNK 

SEQ ID NO. 6614 
STRAIN A909 frame: 1 

TRHI KI SI LNLQNEGEGTME ILI AGGSGFLGKQI I KAALTKGHKVAYLSRHEGKGDI FKD 
PRLTYI RGD I TEADKI HLEDRT FD I LI DC IGAI KPNQIjDELNVKATQKAVALCHKNQ I P K 
LVYI SANSGYSAYIKSKRKAEQI I KASGLDYLFVRPGLMYGEERPLS I FQAKCI KLFSHL 
PFLG I WQKVFPTKWI VAEAI VTTLRKKPTQKI LS I EBLNNK 

SEQ ID NO. 6615 

STRAIN H36B frame: 2 

I KI SI LNLQNEGEGTME I LI AGGSGFLGKQI I KAALTKGHKVAYLSRHEGKGDI FKDPRL 
TYI RGDITEADKI HLEDRTFD I LI DCI GAI KPNQLDELNVKATQKAVALCHKNQ I PKLVY 
I SANSGYSAYIKSKRKAEQI I KASGLDYLFVRPGLMYGBERPLS I FQAKCI KLFSHL PFL 
GIWQKVFPTKVVIVAEAIVTTIJIKKPTQKILSIBELNNK 



SBQ ID NO. 6616 



964 
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Table 66: Comparative Sequences relating to SAG 0754 



STRAIN 18RS21 frame: 1 

TRHIKIS I LNLQNEGEGTME I L IAGGS GFLGKQ 1 1 KAALT KGHKVAYLSRHEGKGD I FKD 
PRLTY IRGD X TEADK I HLEDRT FD I L I DC IGAI KPNQLDELNVKATQKAVALCHKNQI PK 
LVY I SANSGYSAY I KSKRKAEQI I KASGLD YL FVRPGLMYGEER PLS I FQAKC I KLFSHL 
PFLG I WQKVFPTKWI VABAI VTTLRKKPTQKI LS I EE LNNK 

SEQ XD NO. 6617 

STRAIN M732 frame: 1 

QNEGEGTME I LIAGGSG FLGKQ 1 1 KAALTKGHKVAYLSRHEG KGD I FKD PRLTY I KGD I T 
EADKI HLEHRNFD I LI DC I GAI KPNQLDELNVKATQKAVALCHKNQI PKLVYISANSGYS 
AYI KSKRKAEQI I KASGLDYLFVRPGLMYGEERPLS I FQAKC I KLFSHLPFLGI WQKVF 
PTKWI VAEAI VTSLRKKPTQKI LS I EELNNK 

SEQ XD NO. 66X8 

STRAIN COH1 frame: 1 

TRHIKI S I LNLQNEGEGTME IL IAGGSGFLGKQI I KAALT KGHKVAYLSRHEGKGD I FKD 
PRLTY I KGD I TEADKI HLEHRNFDI LI DC IGAI KPNQLDELNVKATQKAVALC^ PK 
LVY I SANSGYSAY I KSKRKAEQI I KASGLDYLFVRPGLMYGEERPLS I FQAKC I KLFSHL 
PFLG I WQKVFPTKVVI VAEAI VTSLRKKPTQKI LS I EELNNK 

SEQ ID NO. 6619. 

STRAIN M781 frame: 1 

TRHI KI S I LNLQNEGEGTME IL IAGGSGFLGKQI I KAALT KGHKVAYLSRHEGKGD I FKD 
PRLTY I KGD ITEADKI HLEHRNFD I LI DC IGAI KPNQLDELNVKATQKAVALCHKNQI PK 
LVYI SANSGYSAY I KSKRKAEQI I KASGLDYLFVRPGLMYGEERPLS I FQAKC I KLFSHL 
PFLGI WQKVFPTKWI VAEAI VTSLRKKPTQKI LSI EELNNK 

SEQ XD NO. 6620 
STRAIN 1 169NT frame: 1 

TRHI KI S I LNLQNEGEGTME I L IAGGSGFLGKQI I KAALT KGHKLAYLS RHEGKGD I FKD 
PRLTY I KGD ITEADKI HLEDRTFD I L I DC I GAI KPNQLDELNVKATQKAVALCHKNQI PK 
LVYI SANSGYSAYI RSKRKAEQI I KASGLDYLFVRPGLMYGEERPLS I FQAKC I KLFSHL 
PFLGIWQKVFPTKWIVAEAIVTTLRTKPTQKI LSI EELNNK 

SEQ XD NO. 6621 
STRAIN CJB110 frame: 1 

TRHI KI S I LNLQNEGEGTME I L IAGGS GFLGKQ 1 1 KAALTKGHKVAYLS RHEGKGD I FKD 
PRLTY I RGD ITEADKI HLEDRTFD I L I DC IGAI KPNQLDELNVKATQKAVALCHKNQI PK 
LVYI SANSGYSAYI KSKRKAEQI I KASGLDYLFVRPGLMYGEERPLS I FQAKC I KLFSHL 
PFLGI WQKVFPTKWI VAEAI VTTIiRKKPTQKI LSI EELNNK 

SEQ XD NO. 6622 

STRAIN JM9130013 frame: 1 

TRHI KI S I LNLQNEGEGTME I L I AGGS GFLGKQ 1 1 KAALTKGHKVAYLS RHEGKGD I FKD 
PRLTYI RGD ITEADKI HLEDRTFD I LI DC IGA I KPNQLDELNVKATQKAVALCHKNQI PK 
LVYI SANSGYSAYI KSKRKAEQI I KASGLDYLFVRPGLMYGEERPLS I FQAKC I KLFSHL 
PFTjGIWQKVFPTKWIVAEAIVTTLRKKPTQKILSIEELNNK 

PRETTY Of: /biotmp/msal37299 . 2{* } April 10, 2003 03:37 



msal37299. 2(303 COH1 
msal37299 . 2 (303_M732 
msal37299. 2(303 M781 
msal37299.2{303_090 
msal37299.2{303_18RS21 
msal37299 . 2 { 303J2603 ' 
msal37299 . 2 { 303_A909 
msal37299 .2(3 03_CJB110 
msal37299 . 2 { 303_JM9130013 
msal37299.2{303_H36B 
msal37299 . 2 { 303_1169NT 
Cons ensue 



trhlkisiln 

trhikisiln 
trhlkisiln 
trhikisiln 
trhikisiln 
trhikisiln 
trhikisiln 
trhikisiln 

ikisiln 

trhikisiln 



1 QNEGEGTME 
-QNEGEGTME 
1 QNEGEGTME 
1 QNEGEGTME 
1 QNEGEGTME 
1 QNEGEGTME 
1 QNEGEGTME 
1 QNEGEGTME 
1 QNEGEGTME 
1 QNEGEGTME 



ILIAGGSGFL 
ILIAGGSGFL 
ILIAGGSGFL 
ILIAGGSGFL 
ILIAGGSGFL 
ILIAGGSGFL 
ILIAGGSGFL 
ILIAGGSGFL 
ILIAGGSGFL 
ILIAGGSGFL 
ILIAGGSGFL 



GKQIIKAALT 
GKQIIKAALT 
GKQIIKAALT 
GKQIIKAALT 
GKQIIKAALT 
GKQIIKAALT 
GKQIIKAALT 
GKQIIKAALT 
GKQIIKAALT 
GKQIIKAALT 
GKQIIKAALT 



50 

KGHKvAYLSR 
KGHKvAYLSR 
KGHKvAYLSR 
KGHKvAYLSR 
KGHKvAYLSR 
KGHKvAYLSR 
KGHKvAYLSR 
KGHKvAYLSR 
KGHKvAYLSR 
KGHKvAYLSR 
KGHKlAYLSR 



msal37299.2(303 COHl' 
msal37299.2(303~M732 
msal37299 . 2 { 303J4781 
msal37299.2{303_090 
msal37299.2{303 18RS21 
msal37299.2(303 2603 
msal37299 . 2 { 303~A909 
msal37299.2{303 CJB110 
msal37299 . 2 { 303_JM9130013 
msal37299 . 2 { 303_H36B 
maal37299 . 2 { 303_1169NT 
Consensus 



51 

HEGKGDIFKD 
HEGKGDIFKD 
HEGKGDIFKD 
HEGKGDIFKD 
HEGKGDIFKD 
HEGKGDIFKD 
HEGKGDIFKD 
HEGKGDIFKD 
HEGKGDIFKD 
HEGKGDIFKD 
HEGKGDIFKD 



PRLTYIkGDI 
PRLTYI kGDI 
PRLTYIkGDI 
PRLTYI rGD I 
PRLTYI rGD I 
PRLTY I rGD I 
PRLTY I rGD I 
PRLTY I rGD I 
PRLTY I rGD I 
PRLTYI rGD I 
PRLTYIkGDI 



TBADKIHLEh 
TEADKIHLEh 
TEADKIHLEh 
TEADKIHLEd 
TEADKIHLEd 
TEADKIHLEd 
TEADKIHLEd 
TEADKIHLEd 
TEADKIHLEd 
TEADKIHLEd 
TEADKIHLEd 



RnFDILIDCI 
RnFDILIDCI 
RnFDILIDCI 
RtFDILIDCI 
RtFDILIDCI 
RtFDILIDCI 
RtFDILIDCI 
RtFDILIDCI 
RtFDILIDCI 
RtFDILIDCI 
RtFDILIDCI 



100 

GAI KPNQLDE 
GAI KPNQLDE 
GAI KPNQLDE 
GAI KPNQLDE 
GAI KPNQLDE 
GAI KPNQLDE 
GAI KPNQLDE 
GAI KPNQLDE 
GAI KPNQLDE 
GAI KPNQLDE 
GAI KPNQLDE 
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ms al3 72 9 9 . 2 ( 3 0 3_COHl 
TOsal37299.2(303_M732' 
msal37299 . 2 { 303_M78 1 
msal37299.2{303_090 
msal37299 . 2 {303_18RS21 
msal37299.2{303_2603 
msal37299 . 2 {303_A909 
msal37299 . 2 { 303_CJB110 
msal37299.2{303 JM9130013 
rasal37299 .2{303_H36B 
msal37299 . 2 {303 JL169NT 
Consensus 



101 

LNVKATQKAV 
LNVKATQKAV 
LNVKATQKAV 
LNVKATQKAV 
LNVKATQKAV 
LNVKATQKAV 
LNVKATQKAV 
LNVKATQKAV 
LNVKATQKAV 
LNVKATQKAV 
LNVKATQKAV 



ALCHKNQIPK 
ALCHKNQIPK 
ALCHKNQIPK 
ALCHKNQIPK 
ALCHKNQIPK 
ALCHKNQIPK 
ALCHKNQIPK 
ALCHKNQIPK 
ALCHKNQIPK 
ALCHKNQIPK 
ALCHKNQIPK 



LVYISANSGY 
LVYISANSGY 
LVYISANSGY 
LVYISANSGY 
LVYISANSGY 
LVYISANSGY 
LVYISANSGY 
LVYISANSGY 
LVYISANSGY 
LVYISANSGY 
LVYISANSGY 



********** ********** ********** 



SAYIkSKRKA 
SAYIkSKRKA 
SAYIkSKRKA 
SAYIkSKRKA 
SAYIkSKRKA 
SAYIkSKRKA 
SAYIkSKRKA 
SAYIkSKRKA 
SAYIkSKRKA 
SAYIkSKRKA 
SAYIrSKRKA 
****_***** 



ISO 

EQI IKASGLD 
EQIIKASGLD 
EQI IKASGLD 
EQIIKASGLD 
EQIIKASGLD 
EQIIKASGLD 
EQIIKASGLD 
EQIIKASGLD 
EQIIKASGLD 
EQIIKASGLD 
EQIIKASGLD 
********** 



msal37299.2{303_C0Hl 
tnsal37299 . 2 (303 _M732 
maal37299.2(303_M781 
msal37299 .2{303_090 
msal37299 . 2 {303_18RS21 
rasal37299.2(303_2603 
tnsal37299.2{303_A909 
msal37299 . 2 { 303_CJB110 
msal37299.2{303_JM9130013 
msal37299 . 2 { 303_H36B 
msal37299 . 2 { 303_1169NT 
Consensus 



151 

YLFVRPGLMY 
YLFVRPGLMY 
YLFVRPGLMY 
YLFVRPGLMY 
YLFVRPGLMY 
YLFVRPGLMY 
YLFVRPGLMY 
YLFVRPGLMY 
YLFVRPGLMY 
YLFVRPGLMY 
YLFVRPGLMY 



GEERPLSIFQ 
GEBRPLSIFQ 
GEERPLSIFQ 
GEERPLSIFQ 
GEERPLSIFQ 
GEERPLSIFQ 
GEERPLSIFQ 
GEERPLSIFQ 
GEERPLSIFQ 
GEERPLSIFQ 
GEERPLSIFQ 



AKCIKLFSHL 
AKCIKLFSHL 
AKCIKLFSHL 
AKCIKLFSHL 
AKCIKLFSHL 
AKCIKLFSHL 
AKCIKLFSHL 
AKCIKLFSHL 
AKCIKLFSHL 
AKCIKLFSHL 
AKCIKLFSHL 



PFLGIWQKV 
PFLGIWQKV 
PFLGIWQKV 
PFLGIWQKV 
PFLGIWQKV 
PFLGIWQKV 
PFLGIWQKV 
PFLGIWQKV 
PFLGIWQKV 
PFLGIWQKV 
PFLGIWQKV 



200 

FPTKWIVAE 
FPTKWIVAE 
FPTKWIVAE 
FPTKWIVAE 
FPTKWIVAE 
FPTKWIVAE 
FPTKWIVAE 
FPTKWIVAE 
FPTKWIVAE 
FPTKWIVAE 
FPTKWIVAE 



201 223 

msal37299.2{303jCOHl} AIVTsLRkKP TQKILSIEEL NNK 

msal37299.2(303_M732j AIVTsLRkKP TQKILSIEEL NNK 

msal37299.2{303_M781J AIVTsLRkKP TQKILSIEEL NNK 

msal37299.2{303_090> AIVTtLRkKP TQKILSIEEL NNK 

rasal37299.2{303_18RS21J AIVTtLRkKP TQKILSIEEL NNK 

msal37299.2{303_2603J AIVTtLRkKP TQKILSIEEL NNK 

msal37299 .2{303_A909} AIVTtLRkKP TQKILSIEEL NNK 

msal37299.2{303_CJB110} AIVTtLRkKP TQKILSIEEL NNK 

msal37299.2{303_JM9130013) AIVTtLRkKP TQKILSIEEL NNK 

msal37299.2{303_H36B) AIVTtLRkKP TQKILSIEEL NNK 

msal37299.2{303_1169NT} AIVTtLRtKP TQKILSIEEL NNK 

Consensus *♦**-**-«* ********** *** 
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SBQ XD NO. 6701 
STRAIN 090 

CAATAACAACATTTGAAAATAAAAAAGTTTTAGT 

TCTGGAGAAGCCXSCTGCACGTTTGTTAGCrAAGT^ 

AGTTAATGATGGCAAACCATTTGATGAAAATCCAACAGCAra^ 

TGGAAGAGGGTATTAAAGrTGGTTTGTGGTAGTCA^ 

GATGAGGATTTTTGTTACATGA1TAAAAATCCAGGAA 

TCCTATGGTCAAAAAAGCATTAGAAAAACAAATCCCTGTTTI^ 

TGGAATTAGCATACITAGTTTCAGAATCTC^ 

TCTAACGGGAAAACGACAACGACAACGATGATTGCAGAA^ 

TGGAGGTCAGAGAGGTITCTTAGCTGGGAATATCGGCT^ 

AAGTTGTTCAGGCTGCXX^TGATAAAGATATTCTAGTTATG 

AGTTTTCAGCTAATGGGAGTTAAGX3AATTTCGT 

TACTAATTTAATGCCAACTCATTTAGATTATCATGGGTCT^ 

ATGTTGCTGGAAAATGGAATATCCAAAATCAAAT^ 

TrGGTACTTAATTTTAATCAAGGTATTTCTAAAGAGTTAGc^AAAACTAC 

TAAAGGAACAATCGTTCCTTTCrCTACrACGGAAAAA 

ACX3TACAAGACAAGCAACTTTTCTATAAAGGGGAGAATATTATGT^ 

GATGACATTGGTGTCCCAGGAAG CCATAACGTAGAGAATGCT 

TATTGC^GTTGCTAAACTAGCTGGTATOVGTAA 

CTTTAAGCAATTTTGGAGGTGTTAAACAC 

GTTCATGGTATTAGTTTCIATAACGACA^ 

AACTCAAAAAGCATTATCTGGCTITGATAATACrAAAGTTATCCTAATTG 

CAGGAGGTCTTGATCGCGGTAATGAGTTIX1ATGA 

ACTGGACTTAAACATATGGTTQTTTTAGGGGAATCGGCM 

ACXTTGCTGCACAAAAAGCAGGAGTAACTTATAGCGATGCT^ 

GAGATGCGGTACATAAAGCTTATGAGGTGGCACAACAGGG CGATGTTATC 

TTGCTAAOTCCTOCAAATGCATCATGGGACATCT 

CCGTGGTGATGAATTC^TTGATACtTTaSAAAGTCrTAGAGG 



SBQ TO NO. 6702 
STRAIN A909 

CAATAACAACATTTGAAAATAAAAAAGTTTTAGTCCT^ 

TCTGGAOAAGCTGCTGCACGTTTGTTAGCTAAGT^ 

AGTTAATGATGGCAAACCATTTGATGAAAATCCAACAGCACACT 

TGGAAGAGGGTATTAAAGTGGTTTGTGGTAGTCATCCTT^ 

GATGAGGAriUTlXjri'ACATGATTAAAAATCCAGGAATACCT^ 

TCCTATGGTCAAAAAAGCATTAGAAAAACAAATCCCTGT^ 

TGGAATTAGCATACTTAGTTTCAGAATCTCAG CTAAT AGGTATTACAGG C 

TCTAACGGGAAAACGACAACGACAACGATGATTGCAGAAGTC^ 

TGGAGGTCAGAGAGGTTTGTTAGCTCGGAATATCGGCTr^^ CTAGTG 

AAGTTGTTCAGG CTGCGAATGATAAAGATACrCTAGTTATGGAATTATCA 

AGTT7TTCAGCTAATGGGAGTTAAGGAATTTCX3T 

TACTAATTTAATGCCAACTCATTTAGATT^ 

ATGTTGCTGCAAAATGGAATATaaVAAATCAAATGT 

TTGGTACTTAATTTTAATCAAGGTATTTCTAAA^ 

TAAAGCaACAATCGTTCCTTTCTCTACTACGGAAAA^ 

ACGTACAAGAaUVGCAACTTTTCTATAAAGGGGA 

GATGACATTGGTGTCCCAGGAAGCCATAACGTAllAGAATGCT 

TATTGCGGTTGCTAAACTGGCTGGTATCAGTAATCAACOT 

CTTTAAGCAATTTTGGAGG tGTTAAACAC^XXrrTGCAATCACTCGGTAAG 

GTirCATGGTATTAGTTTCTATAACGAQVGCA C 

AACTGAAAAAGCACTATCTGGCTTTGATAA 

CAGGAGGTCTTGATCGCGGTAATGAGTTTGATCAAT^ 

ACTGGACTTAAACATATGGTTGTTTTAGGGGAATCGGCATCT 

ACGTGCTGCACAAAAAGCAGGAGTAACTTAT^ 

GAGATGCGGTACATAAAGCTTATGAGGTGGCACMCAG^ 

TTGCTAAGTCCTGCAAATGCATCATGGGACATC 

CCXnX3GTGATGAATTCATTGATACTTTCGAAAGTCT^ 

SBQ XD NO* 6703 
STRAIN H36B 

GGACGAGTAATGAAAACAATAACAACATTTGAAAAT 

AAAAAACnTTTAGTCCTTGGTTTAGCACGATC 

TTTGTTAGCTAAGrTAGGaGCAATAGTGACAGTT 

TTGATGAAAATCCAACAGCACAGT C7ITTGTTGGAAGAGGGTATTAAAGTG 

GTTTGTGGTAGTCATCCTTTAGAATTCTTA^ 

GATTAAAAATCXIAGGAATACCTTATAACAATCXrrATG 

TAGAAAAACAAATCCCTGTTTTGACTGAAGTGGA^ 

TOVGAATCTCAGCTAATAGGTATTACAGGCTCT 

GACAACX^TGATTGCAJGAAGTCTTAAATGCTGG 



GATAAAGATACTCTAGTTATGGAATTATCAAGTT^ 

TAAGGAATTTOGTCCTCATA1TGCAGTAATTACTAATTT 

ATTTAGA1TATCATGGGTCTTTTGAAGATTATGTTC 

ATCCAAAATCAAATGTCTrCATCrGATT^ 

AGGTATTTCTAAAGAGTTAGCTAAAACTACTAAA^ 

TCTCTAClACGGAAAAAGTTGATGGTGCTTACGrrA 

TTCTATAAAGGGGAGAATATTATGTCAGTAGATGACATTG 

AAGCCATAAOGTAGAGAATG CTCTAGCAAC TATTG CXSGTT GCTA AACTGQ 

CTGGTATCAGTAATCAAGTTATTAGAGAAACTTrAAG CAATTTTGGAGGT 

GTTAAACACOGCTTGCAATCACTCGGTAAGGTTCATGGTAT^ 

TAACGACAGCAAG 
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SEQ ZD MO. 6704 
STRAIN 18RS21 

GGACGAGTAATGAAAACAATAACAACATTTG 

AAAATAAAAAAGTTTTAGT CCTTGGTTTAG CACGATCTGGAGAAGCTGCT 

GCACGTTTGTTAGCTAAGTTAGGAGCAATAGTGACAGTT^ 

ACCATTTGATGAAAATCCAACAGCACAGTCTTTC 

AAGTGGTTTGTGGTAGTCATCCTTTAGAATTGTTAGATGAG 

TACATGATTAAAAATCCAGGAATACCTTATAACAATCCTATGGTCAAAAA 

AG CATT AGAAAAACAAATC C CTGTTTrGACTGAAGTGGAATTAG CATACT 

TAGTTTCAGAATCTCAGCTAAT AGGTATTACAGG CTCTAACGGG AAAACG 

ACAACGACAACGATGATTGCAGAAGTCTTAAATGCT 

TTTGTTAGCTGGGAATATCGGerrrCCTGCTAGTGAAGTTGTTCAGGCTG 

CGAATGATAAAGATACTCTAGTTATGGAATTATCAAGTTT^ 

GGAGTTAAGGAATTTCX3TCCTCATATTGCAGTAAT^ 

AACTCATTTAGATTATCATGGGTCTTTTCAAGA^ 

GKIAATATCCAAAATCAAATGTCTTCATCTGA^ 

AATCAAGGTATTTCTAAAGAGTTAGCTAAAACrACTAAAGC^ 

TCCTTTCTCrACTACXXSAAAAAGTTGATGGTGC^ 

AACrTTTCTATAAAGGGGAGAATATTATGTCA^ 

CCAGGAAGCCATAACGTAGAGAATGCTCTAGCAACTATTGCGGTT^ 

ACTCGCTGGTATCAGTAATCAAGTTATTAGAGAA^ 

GAGGTGTTAAACACCGCTTGCAATCACTCX3GTAAGGTTC 

TTCTATAACGACAGCAAGTC^CTAATATATTGGCAACTCAAAAAGCATT 

ATCTGGCTTTGATAATACTAAAGTTATCCTAATTG CAGGAGGTCTTGATC 

GCGGTAATGAGTTTGATGAATTGATACCAGATATCACTGGACTTA 

ATGGTTGTTTTAGGGGAATCGGCATCTCGA^yTAAAAC^ 

AGCAGGAGTAACTrATAGCGATGCTTTAGATGTTAGAGATGCGGTACATA 

AAGCTTATGAGGTGG CACAACAGGGCGATGTTATCTTGCTAAGTCCTG CA 

AATGCATCATGGGAC^TGTATAAGAATITCGAAGTCCGTGGTGAT^ 

CATTGATACTITCGAAAGTCTTAGAGGAGAG 

SEQ ZD NO. 6705 
STRAIN M732 

GGACGAGTAATGAAAACAATAACAACATTTGAAA 
ATAAAAAAGTTTTAGTCCTTGGTTTAGCACGATCTGGAGAAGCCGC^ 
CGTTTGTTAGCrrAAGTTAGGAGCAATAGTGACAGTTAA 
AT TTGAT GAAAATCGAACAGCACAGTCTTTGTTC 

TGGTTTGTGGTAGTCAT CCTTTAGAATTGTTAGATGAGGATTTTTGTTAC 

ATGATTAAAAATCCAGGAATACCTTATAACAATCCTATGGTCAAAAAAG 

ATTAGAAAAACAAATCCCTGTTTTGACTGAAGTGGAATTAGCATACTTAG 

TTTCAGAATCTCAGCTAATAGGTATTACAGGCTCTAACGGGAAAACG^ 

ACGACAACGATGATTGCAGAAGTCTTAAATGCTG 

GTTAGCTGGGAATATOGGCTTTCCTGCTAGTG^ 

aTGATAAAGATATTCTAGTTATGGAATTATCAAGTTTTCAGCTA 

GTTAAGGAATTTCGTCCTCATATTG CAGTAATTACTAATTTAATGCCAAC 

TCAtTTAGATTATCATGGGTCITTTGA 

ATATCCAAAATCAAATGTCTTCATCTGATTTTTTGGTA 

CAAGGTATCTCTAAAGAGTTAGCTAAAACTACTAAAGCA 

TTTCTCTACTACGGAAAAAGTTGATGSGTGCTTACX3TACAA 

TTTTCIATAAAGGGGAGAATATTATGTCAGTAGATG^ 

GGAAGCCATAACGTAGAGAATGCTCTAGCAACTATTGCGGTTG CTAAACT 

AGCTGGTATCAGTAATCAAGTTATTAGAGAAACTTTA^ 

GTGTTAAACACCG CTTG CAATCACT CGGTAAGGTTCATGGTATT AGTTTC 

TATAACGACAGCAAGTCAACTAATATATTGGCAACTCAAAAAG 

TGGCTTTGATAATACTAAAGTTATCCTAATTGCA 

GTAATGAGTTTGATGAATTGATACCAGATATCACTGGACTTAA 

GTTGTTTTAGGGGAATCGGCATCTCGAGTAAAACGTGCI^ 

AGGAGTAACTTATAGCGATGCITTAGATGTTAGA 

CTTATGAGGTGGCACAACAGGG CGATGTTATCTTG CTAAGTCCTG CAAAT 

GCATC ATGGG ACATGTATAAGAATrTCGAAGTC 

TGATACTTTCGAAAGTCTTAGAGGAGAQ 

SEQ ZD NO. 6706 
STRAIN OOH1 

GGACGAGTAATGAAAACAATAACAACATTTGA 

AAATAAAAAAGTTTTAGTCCTTGGTTTAGCAa^TCTGGAGAA^ 

CAOGTTTGTTAGCTAAGTTAGGAGCAATAGTGACAGTT^ 

CCATTTGATGAAAATCK2AACAGCACAGTCTTTC 

AGTGGTTTGTGGTAGTCATCCTTTAGAATTGTTAGATGAGGA 

ACATGATTAAAAATCCAGGAATACCTTATAACAATCCTATGGTC 

GCATTAGAAAAACAAAT CCCTGTTTTGACTGAAGTGGAATTAGCATACTT 

AGTTTCAGAATCTCAGCTAATAGGTATTACAGG 

CAACGACAACGATGATTGCAGAAGTCTTAAATGCTGGAGG^ 

TTGTTAGCTGGGAATATCGGCTTTCCTXK^ 

GG aTGATAAAGATA'l'rcrAGTTATGGAATTATCAAGvri'rCAGCTAATGG 
GAGTTAAGGAATTTCGTCCTCATATTG CAGTAATTACTAATTTAATG CCA 
ACTCATTTAGATTATCATGGGTCTTTTGAAGA 
GAATATCCIAAAATCAAATGTCTTCATCTCAT^ 

ATCAAGGTATTTCTAAAGAGTT AG CTAAAACTACTAAAGCAa CAATCGTT 
CXTITTCTCTACTACGGAAAAAGTTGATGGTGCTrACGT^ 
ACTITTCrATAAAGGGGAGAATATTATGTCAGTAG^ 
CAGGAAGCCATAACGTAGAGAATGCTCTAGCAACTATTGCGGTTG 
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CTAG CTGGTATCAGTAATCAAGTTATTAGAGAAACTTTAAGC^ 

AGGTGTTAAAGACCGCTTGCAATCACTCGGTAAGGTTCATGGTA 

TCTATAACXSACAGCAAGTCAACTAATATATTGGCAACTCAAAAAGCATrA 

TCTGGCTTTGATAATACTAAAGTTATCCTAAT^ 

CGGTAATGAGTTTGATGAATTGATACCAG^ 

TGGTTGTTTTAGGGGAATCGGCATCTCGAGTAAAACGTG CTC 

GCAGGAGTAACTTATAGCGATGCTTTAGATGTTAGAGATGOSGTACATAA 

AGCTTATGAGGTGGCACAACAGGGCGATGTTATCTrGCT 

ATG CATCATGGGACATGTATAAGAATTTCGAAGTCCGTGGTGATGAATTC 

ATTGATACTTTCGAAA 

SEQ ID MO. 6707 
STRAIN M781 

GGACGAGTAATGAAAACAATAACAACATT 
TGAAAATAAAAAAGTTTTAGTCCTTGGTTTAGC^ 

CTGCACGTTTGTTAGCT AAGTTAGGAG CAATAGTGACAGTTAATGATGGC 
AAACCATTTGATGAAAATCCAACAGCACAGTCTTTGTTGGAAGAGGGTAT 
TAAAGTCGTTTGTGGTAGTCATCCTTTAGAATTGT^ 

GTTACATGATTAAAAATCC^GGAATACCTTATAACAATCCTATGGTCAAA 

AAAGCATTAGAAAAACAAATCCCTGTTTTGACT 

CTTAGTTTCAGAATCTCAGCTAATAGGTATTACAGGCTCT 

CGACAACGACAACGATGATTGCFVGAAGTCT 

GGTTTGTTAGCTGGGAATATCGGCTTTCCTGCTAGTGA^ 

TG CXX3ATGATAAAGATATTCTAGTTATGGAATTATCAAG'l"iU"rCy^CTAA 

TGGGAGTTAAGGAATTTCGTCCTCATATTGCAGTAATTACTAATT^ 

CXIAA.CTCATTTAGATTATCATGGGTCTTTTGA 

ATGGAATATCCAAAATCAAATGTCTTCATCT^ 

TTAATCAAGGTATTTCTAAAGAGTTAGCTAAAACTAC^ 

GTTCCTTTCTCTACTACXjK»AAAAAGTTGATGGT^ 

GCAACITITCTATAAAGGGGAGAATATTATGTCAGTAGATG 

TCCCAGGAAGCCATAACGTAGAGAATGCTCTAGCAACT 

AAACTAGCTGGTATCAGTAATCAAGTrATTAGAGAAACTT^ 

TGGAGGTGTTAAACACCGCTTGCAATCACTCGGTAAGGT^ 

GTTTCTATAACGACAGCAAGTCAACrAATATATTGGCAACTCAAAAAGCA 

TTATCTGGCriU^TAATACTAAAGITATCCTAATTGCAGGAGG'rCl'lXiA 

TOSCGGTAATGAGTTTGATGAATTGATACCAGATATCAC^ 

ATATGGTTGTTITAgGGGAATCGGC ATCr CGAGTAAAACGTG 

AAAGCAGGAGTaACTTATAG CGATG CTTTAGATGTTAGAGATGCGGTACA 

TAAAGCTTATGAGGTGGCACAACAGGGCGATGT^ 

CAAATGCATCATGGGACATGTATAAGAATTTCGA^ 

TTCATTGATACITTCGAAAGTCTTAGAGGAGAG 

SEQ ID HO. 6708 
STRAIN CJB110 

GGACGAGTAATGAAAACAATAACAACATTTGA 

AAATAAAAAAGTITTAGTCCTTGGTTTAGCACGATCItSG 

CACGTTTGTTAG CTAAGTTAGGAG CAATAGTGACAGTTAATGATGGCAAA 

CCATTTGATGAAAATCCAACAGCACAGTCTTTG 

AGTGGTTTGTGGTAGTCATCCTTTAGAATTGTTAGATG^ 

ACATGATTAAAAATCCAGGAATACCTTATAACAATC^ 

AGTTTCAGAATCTCAGCrAATAGGTATTACAGGCTCT 

CAACGACAACGATGATTG CAGAAGTCTTAAATGCTGGAGGTCAGAGAGGT 

TTGTTAGCTGGGAATATCGGCTTTCCTGCTAGTGAAG^ 

GGATGATAAAGATATTCTAGTTATGGAATTATCAAGTTTTCAGCTAA 

GAGTTAAGGAATTTCGTCCTCATATTG CAGTAATTACTAATTEAATGCCA 

ACTCATTTAGATTATCATGGGTC"ri"i"l'GAAGAATATGTTG CTGCAAAATG 

GAATATCCAAAATCAAATGTCTTCATCTGATTTTT^ 

ATCAAGGTATTTCTAAAGAGTTAGCTAAAACTACTAAAtSCAACAAT^ 

CCTTTCTCTACTACGGAAAAAGTTGATGGTG CTTACGTACAAGACAAGCA 

ACITTTCTATAAAGGGGAGAATATTATGTTAOT 

CAGGAAGCCATAACGTAGAGAATGCTCTAGCAACTATTGCG 

CTAGCTGGTATCAGTAATCAAGTTATTAGAGAAA 

AGGTGTTAAACACCGCTTGCAATCACTOGGTAAGGTTCAT^ 

TCTATAATGACAGCAAGTCAACTAATATATTGGCAACTCAAAAAG 

TCTGGCTTTGATAATACTAAAGTTATCCrAATTC 

OGGTAATGAGTTTGATGAATTGATACCAGATATCACTGGACTTAAACATA 

TGGTTGTTTTAGGGGAATCGGCATCTCGAGTAAA^ 

GCAGGAGTAACTTATAGGGATGCTTTAGATGTTA^ 

AGCTTATGAGGTGGCACAACAGGGCGATGTTATCTro 

ATGCATCATGGGACATGTATAAGAATTTCGAAGTC 

ATTGATACTTTCGAAAGTCTTAGAGGAGAG 

SEQ ID MO. 6709 
STRAIN 1169NT 

CAATAACAACATTTGAAAATAAAAAAGTTTTAGTC 

TCTGGAGAAGCCX3CTGCACGTrTGTTAGCTAAGT^ 

AGTTAATGATGGCAAACCATTrGATGAAAATCCAACAGCACAGTC^ 

TCGAAGAGGGTATTAAAGTGGTTTGTGGTAGTCATCCT^ 

GATGAGGA'i _ rrriGTTACATGATTAAAAATCCAGGAATACCTTATAACAA 

TCCT ATGGTCAAAAAAG CATTAGAAAAACAAATCCCTGTTTTGACTGAAG 

TGGAATTAGCATACTTAGTTTCAaAATCrCA^ 

TCTAACXKSGAAAACGACAACGACAACXIATGATTGCAGAAG^ C 
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TGGAGGTCAGAGAGu-rriX3TTAGCTGGGAATATCGGc-l-J.-rCCIX5 CTAGTG 

AAGTTGTTCAGGCTOCGGATGATAAAGATACTCTAGTTATGGAAT^ 

AGTTTTCftGCTAATGGGAGTTAAGG AATTTCGTCCT CAGTAAT 

TACTAATTTAATGCCAACTCATTrAGATTATCATGGGTCTTTTGA 

ATG t TGCTG CAAAATGGAATATCCAAAATCAAATGTCTTC^ 

TTGGTACTTAATTTTAATCAAGGTATTTCT^ 

TAAAGCAACAATCGTTCCTTTCTCTACTAOSGAAAAAGTTGAT^ 

ACGTACAAGACAAGCAACTTTTCTATAAAGGGGAGAATATTATGTCAGTA 

GACGACAirGGTGTCCCAGGAAGCCATAACGTAGAGAATGCTCTAGCAAC 

TATTGCGGTTGCTAAACTAG CTGGTATCAGTAATCAAGTrATTAGAGAAA 

CTTTAAGCAATTTTGGAGOTGTTAAACACCX3CTTC 

GflTCATGGTATTAGTTTCTATAACGACAGTA 

AACTCAAAAAGCATTATCTCGCTTTGATAATACTAAA 

CAGGAGGTCTTGATCX3CX3GTAATGAGITn^ 

ACTGGACTTAAGCATATGGTTGTTTTAGGGGAATC^ 

ACGTG CTGCACAAAAAG CAG GAGT AACTTATAGCAATGCTTTAg ATGTT A 

GAgATGCgGTACATAAAGCTTATGAGGTGGCACAACAGGGCGATGTTATC 

TTGTTmAGTcCTGCGAATG CATCATGGGACATGTATAAGAATTTCGAAGT 

CCGTGGTGATGAATTCATTGATACTTTCG 

SEQ ZD NO. 6710 

STRAIN JM9130013 

GGACGAGTAATGAAAACAATAACAACA 

TTTGAAAATAAAAAAGTTTTAGTCCTTGGTTTAG CACX3ATCTGGAGAAGC 
TGCTGCAa3TTTGTTAGCTAAGriTAGGAGCAATA 
GCAAACCATTTGATGAAAATCCAACAGCACAGTCT 
ATTAAAGTGGTTTGTGGTAGTCATCCTTTAGAA^ 

TTGTTACATGATTaAAAATCCAGGAATAC CTTATAACAATCCTATGGTCA 
AAAAAGCATTAGAAAAACAAATCCCTGTTTTGACT^ 
TACTTAGTITCAGAATCTCAGCTAATAGGTATTACAGGCTCT 
AACGACAACX1ACAACX1ATGATTXKIAGAAGTCTTA 

GAGGTTTGTTAG CTGGGAATATCGGCTTTCCTrGCTAGTGAAGTTGTTCAG 
GCTGCGAATGATAAAGATACTCTAGTTATGGAAT^ 

TGCCAACTCATTTAGATTATCATGGGTC^^ 
AAATGGAATATCCAAAATOVAATGTCITCATCl^ 

TTTTAATCAAGGTATTT CTAAAGAGTTAG CTAAAACT ACTAAAGCaACAA 

TCGTTCXrrTTCTCTACTACGGAAAAAGTTGATGGTC 

AAGCAACTTTTCTATAAAGGGGAGAATATTATGTG^ 

TGTCCCAGGAAGCCATAACGTAGAGAATG CTCTAGCAAC TATT GCGGTTG 

CTAAACTGG CTGGTATCAGTAATCAAGTTATTAGAGAAACTTTAAG CAAT 

TTTGGAGGTGTTAAACACCGCrTGCAATCACr<XICT 

TAGtTTCTATAACX^CAGCAAGTCAACrAATATATTGGCAACTC^AA 

CATTATCTGGCTTTGATAATACTAAAGTTATCCTAATTG^ 

GATCXKIAGTAATGAGTTTQATGAATTGATACCAGATATCA 

ACATATGGTTGTTTTAGGGGAATCGGCATCTCGAGT^ 

AAAAAGCAGGAGTAACTTATAGCGATGCTTTAGATGTTAGAGA^ 

CATAAAGCTTATGAGGTGGCACAACAGGGCGATGTTATCr^ 

TGC3U\ATGCATCATGGGACATGTATAAGAATTTC^ 

AATTCATTGATACtTTCGAAAGTCTTAGAGGAGAG 

SEQ ID NO. 6710 
STRAIN 2603 

ggacgagtaatgaaaacaataacaacatttgaaaataaaaaagttttagt 
ccttggtttagcacgatctggagaagctgctgcacgtttgttagctaagt 
taggagcaatagtgacagttaatgatggcaaaccatttgatgaaaatcca 
acagcacagtctttgttggaagagggtattaaagtggtttgtggtagtca 
tcctttagaattgttagatgaggatttttgttacatgattaaaaatccag 
gaataccttataacaatcctatggtcaaaaaagcattagaaaaacaaatc 
cctgttttgactgaagtggaattagcatacttagtttcagaatctcagct 
aataggtattacaggctctaacgggaaaacgacaacgacaacgatgattg 
cagaagtcttaaatgctggaggtcagagaggtttgttagctgggaatatc 
ggctttcctgctagtgaagttgttcaggctgcgaatgataaagatactct 
agttatggaattatcaagttttcagctaatgggagttaaggaatttcgtc 
ctcatattgcagtaattactaatttaatgccaactcatttagattatcat 
gggt ct 1 1 tgaagat tatgt tgctgcaaaa tggaa tatccaaaatcaaat 
gtcttcatctgattttttggtacttaattttaatcaaggtatttctaaag 
agttagctaaaactactaaagcaacaatcgttcctttctctactacggaa 
aaag t tgatggt gc t tacgt acaagacaagcaac 1 1 1 1 c t at aaagggga 
gaatattatgtcagtagatgacattggtgtcccaggaagccataacgtag 
agaatgctctagcaactattgcggttgctaaactggctggtatcagtaat 
caagttattagagaaactttaagcaattttggaggtgttaaacaccgctt 
gcaatcactcggtaaggttcatggtattagtttctataacgacagcaagt 
caactaatatattggcaactcaaaaagcattatctggctttgataatact 
aaagttatcctaattgcaggaggtcttgatcgcggtaatgagtttgatga 
attgataccagatatcactggacttaaacatatggttgttttaggggaat 
cggcatctcgagtaaaacgtgctgcacaaaaagcaggagtaacttatagc 
gatgctttagatgttagagatgcggtacataaagcttatgaggtggcaca 
acagggcgatgttatcttgctaagtcctgcaaatgcatcatgggacatgt 
ataagaatttcgaagtccgtggtgatgaattcattgatactttcgaaagt 
cttagaggagag 



970 



WO 2004/018646 



PCT/US2003/026827 



Table 67: Comparative Sequences relating to SAG0475 



USA. Alignment Results: Pretty output 

PRETTY of* /biotmp/msa30176.2{*} April 29, 2002 02*09 



msa30176.2{305 18RS21 
ms a3 0 17 6 . 2 ( 3 0 5_2 6 0 3 
msa3 0 176 . 2 { 3 05_A9 0 9 1 
msa30176.2(305_H36B 
msa30176.2{305_JM9130013 
msa30176.2(305_COHl 
msa30176 . 2 { 305_M781 
msa30176.2{305e_M732 
msa30176.2{305_090 
msa30176.2f305 CJB110 
msa30176.2{305_1169NT 
Consensus 



ggacgagtaa 
ggacgagtaa 



ggacgagtaa 
ggacgagtaa 
ggacgagtaa 
ggacgagtaa 
ggacgagtaa 



ggacgagtaa 



tgaaaaCAAT 
tgaaaaCAAT 

CAAT 

tgaaaaCAAT 
tgaaaaCAAT 
tgaaaaCAAT 
tgaaaaCAAT 
tgaaaaCAAT 

CAAT 

tgaaaaCAAT 
CAAT 



AACAACATTT 
AACAACATTT 
AACAACATTT 
AACAACATTT 
AACAACATTT 
AACAACATTT 
AACAAC ATTT 
AACAACATTT 
AACAACATTT 
AACAACATTT 
AACAACATTT 



GAAAATAAAA 
GAAAATAAAA 
GAAAATAAAA 
GAAAATAAAA 
GAAAATAAAA 
GAAAATAAAA 
GAAAATAAAA 
GAAAATAAAA 
GAAAATAAAA 
GAAAATAAAA 
GAAAATAAAA 



50 

AAGTTTTAGT 
AAGTTTTAGT 
AAGTTTTAGT 
AAGTTTTAGT 
AAGTTTTAGT 
AAGTTTTAGT 
AAGTTTTAGT 
AAGTTTTAGT 
AAGTTTTAGT 
AAGTTTTAGT 
AAGTTTTAGT 



msa30176.2{305_18RS2i; 
msa30176.2{305_2603 
msa30176.2(305 A909 
msa30176 . 2 {305_K36Bj 
msa30176.2{305_JM9130013 
msa30176.2{305 COH1 
nusa3 0 17 6 . 2 { 3 0 5~M7 6 1 } 
msa30176 . 2 {305e_M732 } 
rasa30176.2{305_090} 
msa3 017 6 . 2 { 3 0 5_CJB1 10 } 
msa30176.2{305_1169NT} 
Consensus 



5i 

CCTTGGTTTA 
CCTTGGTTTA 
CCTTGGTTTA 
CCTTGGTTTA 
CCTTGGTTTA 
CCTTGGTTTA 
CCTTGGTTTA 
CCTTGGTTTA 
CCTTGGTTTA 
CCTTGGTTTA 
CCTTGGTTTA 



GCACGATCTG 
GCACGATCTG 
GCACGATCTG 
GCACGATCTG 
GCACGATCTG 
GCACGATCTG 
GCACGATCTG 
GCACGATCTG 
GCACGATCTG 
GCACGATCTG 
GCACGATCTG 



GAGAAGCtGC 
GAGAAGCtGC 
GAGAAGCtGC 
GAGAAGCtGC 
GAGAAGCtGC 
GAGAAGCCGC 
GAGAAGCcGC 
GAGAAGCcGC 
GAGAAGCcGC 
GAGAAGCcGC 
GAGAAGCcGC 



TGCACGTTTG 
TGCACGTTTG 
TGCACGTTTG 
TGCACGTTTG 
TGCACGTTTG 
TGCACGTTTG 
TGCACGTTTG 
TGCACGTTTG 
TGCACGTTTG 
TGCACGTTTG 
TGCACGTTTG 



100 

TTAGCTAAGT 
TTAGCTAAGT 
TTAGCTAAGT 
TTAGCTAAGT 
TTAGCTAAGT 
TTAGCTAAGT 
TTAGCTAAGT 
TTAGCTAAGT 
TTAGCTAAGT 
TTAGCTAAGT 
TTAGCTAAGT 



msa3 0176 . 2 { 305_18RS2 1 ] 
tnsa30176 . 2 (305_2603 
msa30176. 2(305 A909, 
msa30176 . 2 { 3 05~H3 6B 
msa30176.2{305_JM9130013 
msa30176 .2(3 05_COH1 
msa30176 . 2 {305_M781 
msa30176.2{305e_M732 
msa3 0176 . 2 { 305_090 
msa30176 . 2 { 305_CJB110 
msa30176.2{305_1169NT; 

Consensus 
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TAGGAGCAAT 
TAGGAGCAAT 
TAGGAGCAAT 
TAGGAGCAAT 
TAGGAGCAAT 
TAGGAGCAAT 
TAGGAGCAAT 
TAGGAGCAAT 
TAGGAGCAAT 
TAGGAGCAAT 
TAGGAGCAAT 



AGTGACAGTT 
AGTGACAGTT 
AGTGACAGTT 
AGTGACAGTT 
AGTGACAGTT 
AGTGACAGTT 
AGTGACAGTT 
AGTGACAGTT 
AGTGACAGTT 
AGTGACAGTT 
AGTGACAGTT 



AATGATGGCA 
AATGATGGCA 
AATGATGGCA 
AATGATGGCA 
AATGATGGCA 
AATGATGGCA 
AATGATGGCA 
AATGATGGCA 
AATGATGGCA 
AATGATGGCA 
AATGATGGCA 



AACCATTTGA 
AACCATTTGA 
AACCATTTGA 
AACC ATTTG A 
AACCATTTGA 
AACCATTTGA 
AACCATTTGA 
AACCATTTGA 
AACXATTTGA 
AACCATTTGA 
AACCATTTGA 



150 

TGAAAATCCA 
TGAAAATCCA 
TGAAAATCCA 
TGAAAATCCA 
TGAAAATCCA 
TGAAAATCCA 
TGAAAATCCA 
TGAAAATCCA 
TGAAAATCCA 
TGAAAATCCA 
TGAAAATCCA 



tnsa30176.2{305_lBRS21 
msa3 0 17 6 . 2 ( 3 0 5_2 603 
msa3 0 176 . 2 { 3 0 5_A909 
msa3 0 1 7 6 . 2 { 3 0 5_H3 6B 
msa30176.2{305_OM9130013 
msa30176 .2(3 05_COH1 
ntsa3 0 176 . 2 { 3 05_M7 8 1 
msa30176.2{305e M732 
msa30176.2{305 090 
msa30176 . 2 { 3 05JCJB110 
msa30176 . 2 {305_1169NT, 
Consensus 



151 

ACAGCACAGT 
ACAGCACAGT 
ACAGCACAGT 
ACAGCACAGT 
ACAGCACAGT 
ACAGCACAGT 
ACAGCACAGT 
ACAGCACAGT 
ACAGCACAGT 
ACAGCACAGT 
ACAGCACAGT 



CTTTGTTGGA 
CTTTGTTGGA 



CTTTGTTGGA 
CTTTGTTGGA 
CTTTGTTGGA 
CTTTGTTGGA 
CTTTGTTGGA 
CTTTGTTGGA 
CTTTGTTGG A 
CTTTGTTGGA 



AGAGGGTATT 
AGAGGGTATT 
AGAGGGTATT 
AGAGGGTATT 
AGAGGGTATT 
AGAGGGTATT 
AGAGGGTATT 
AGAGGGTATT 
AGAGGGTATT 
AGAGGGTATT 
AGAGGGTATT 



AAAGTGGTTT 
AAAGTGGTTT 
AAAGTGGTTT 
AAAGTGGTTT 
AAAGTGGTTT 
AAAGTGGTTT 
AAAGTGGTTT 
AAAGTGGTTT 
AAAGTGGTTT 
AAAGTGGTTT 
AAAGTGGTTT 



200 

GTGGTAGTCA 
GTGGTAGTCA 
GTGGTAGTCA 
GTGGTAGTCA 
GTGGTAGTCA 
GTGGTAGTCA 
GTGGTAGTCA 
GTGGTAGTCA 
GTGGTAGTCA 
GTGGTAGTCA 
GTGGTAGTCA 



msa30176 . 2 { 305_18RS21 
msa30176 .2(3 05_2603 
msa30176 . 2 (305_A909 
msa30176 . 2{305_H36B 
msa30176 . 2 {305_JM9130013 
maa3 0 176 . 2 { 305_COH1 
msa30176.2(30S M781 
msa30176 . 2 { 305eJM732 
msa30176 . 2{305_090 
msa30176. 2(305 CJB110 
rasa30176.2(3053ll69NT 
Consensus 



201 

TCCTTTAGAA 
TCCTTTAGAA 
TCCTTTAGAA 
TCCTTTAGAA 
TCCTTTAGAA 
TCCTTTAGAA 
TCCTTTAGAA 
TCCTTTAGAA 
T CCTTTA GAA 
TCCTTTAGAA 
TCCTTTAGAA 



TTGTTAGATG 
TTGTTAGATG 
TTGTTAGATG 
TTGTTAGATG 
TTGTTAGATG 
TTGTTAGATG 
TTGTTAGATG 
TTGTTAGATG 
TTGTTAGATG 
TTGTTAGATG 
TTGTTAGATG 



AGGATTTTTG 
AGGATTTTTG 
AGGATTTTTG 
AGGATTTTTG 
AGGATTTTTG 
AGGATTTTTG 
AGGATTTTTG 
AGGATTTTTG 
AGG ATTTTTG 
AGGATTTTTG 
AGGATTTTTG 



TTACATGATT 
TTACATGATT 
TTACATGATT 
TTACATGATT 
TTACATGATT 
TTACATGATT 
TTACATGATT 
TTACATGATT 
TTACATGATT 
TTACATGATT 
TTACATGATT 



250 

AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 



rasa30176.2{305 18RS21; 
rasa30176.2{305_2603 
msa30176 . 2I305_A909 
msa30176.2(305_H36B 
rasa30176 . 2 {305_JM9130013 
msa30176.2{30 5_COHl 
msa3 0 17 6 . 2 { 3 05_J47 8 1 
msa3 0 176 . 2 { 3 0 5e_M7 3 2 
cnsa30176.2{305 090 



251 

GAATACCTTA 
GAATACCTTA 
GAATACCTTA 
GAATACCTTA 
GAATACCTTA 
GAATACCTTA 
GAATACCTTA 
GAATACCTTA 
GAATACCTTA 



TAACAATCCT 
TAACAATCCT 
TAACAATCCT 
TAACAATCCT 
TAACAATCCT 
TAACAATCCT 
TAACAATCCT 
TAACAATCCT 
TAACAATCCT 



ATGGTCAAAA 
ATGGTCAAAA 
ATGGTCAAAA 
ATGGTCAAAA 
ATGGTCAAAA 
ATGGTCAAAA 
ATGGTCAAAA 
ATGGTCAAAA 
ATGGTCAAAA 



AAGCATTAGA 
AAGCATTAGA 
AAGCATTAGA 
AAGCATTAGA 
AAGCATTAGA 
AAGCATTAGA 
AAGCATTAGA 
AAGCATTAGA 
AAGCATTAGA 



300 

AAAACAAATC 
AAAACAAATC 
AAAACAAATC 
AAAACAAATC 
AAAACAAATC 
AAAACAAATC 
AAAACAAATC 
AAAACAAATC 
AAAACAAATC 



971 



WO 2004/018646 



PCT7US2003/026827 



Table 67: Comparative Sequences relating to SAG0475 

msa30176.2{305 CJBllO) GAATACCTTA TAACAATCCT ATGGTCAAAA AAGCATTAGA AAAACAAATC 
msa30176.2(305~1169NT} GAATACCTTA TAACAATCCT ATGGTCAAAA AAGCATTAGA AAAACAAATC 
Consensus ********** ********** ********** ********** ********** 



msa30176 . 2 {305_18RS2l| 
msa30176 . 2 ( 305_2603 
msa30176 . 2 (305_A909 
msa30176 . 2 (305_H36B 
msa30176.2(305_JM9130013 
msa3 0 17 6 . 2 ( 3 OS_COH1 
msa30176.2{305_M78l' 
msa30176.2{305e_M732 
msa30176.2{305_090 
mea30176. 2(305 CJBllO 
msa30176.2(305_1169NT 
Consensus 



301 

CCTGTTTTGA 
C CTGTTTT GA 
CCTGTTTTGA 
CCTGTTTTGA 
CCT GTTTT GA 
CCTGTTTTGA 
CCTGTTTTGA 
CCTOTTTTGA 
CCTGTTTTGA 
CCTGTTTTGA 
CCTGTTTTGA 



CTGAAGTGGA 
CTGAAGTGGA 
CTGAAGTGGA 
CTGAAGTGGA 
CTGAAGTGGA 
CTGAAGTGGA 
CTGAAGTGGA 
CTGAAGTGGA 
CTGAAGTGGA 
CTGAAGTGGA 
CTGAAGTGGA 



ATTAGCATAC 
ATTAGCATAC 
ATTAGCATAC 
ATTAGCATAC 
ATTAGCATAC 
ATTAGCATAC 
ATTAGCATAC 
ATTAGCATAC 
ATTAGCATAC 
ATTAGCATAC 
ATTAGCATAC 



TTAGTTTCAG 
TTAGTTTCAG 
TTAGTTTCAG 
TTAGTTTCAG 
TTAGTTTCAG 
TTAGTTTCAG 
TTAGTTTCAG 
TTAGTTTCAG 
TTAGTTTCAG 
TTAGTTTCAG 
TTAGTTTCAG 



350 

AATCTCAGCT 
AATCTCAGCT 
AATCTCAGCT 
AATCTCAGCT 
AATCTCAGCT 
AATCTCAGCT 
AATCTCAGCT 
AATCTCAGCT 
AATCTCAGCT 
AATCTCAGCT 
AATCTCAGCT 



msa30176 . 2 {305_18RS2i; 
msa30176.2(305_2603 
msa3 0 17 6 . 2 { 3 05_A9 0 9 ( 
msa30176 . 2 (305_H36B 

msa3oi76.2(305_JM9i3ooi3 ( 

msa3 017 6.2(3 05_COH1 \ 
msa3 0 17 6 . 2 ( 3 05_M7 8 1 ( 
msa30176.2(305e_M732 
msa30176 . 2{305_090 
msa30176.2(305_CJB110 
msa30176.2(305_1169NT 
Consensus 



351 

AATAGGTATT 
AATAGGTATT 
AATAGGTATT 
AATAGGTATT 
AATAGGTATT 
AATAGGTATT 
AATAGGTATT 
AATAGGTATT 
AATAGGTATT 
AATAGGTATT 
AATAGGTATT 



ACAGGCTCTA 
ACAGGCTCTA 
ACAGGCTCTA 
ACAGGCTCTA 
ACAGGCTCTA 
ACAGGCTCTA 
ACAGGCTCTA 
ACAGGCTCTA 
ACAGGCTCTA 
ACAGGCTCTA 
ACAGGCTCTA 



ACGGGAAAAC 
ACGGGAAAAC 
ACGGGAAAAC 
ACGGGAAAAC 
ACGGGAAAAC 
ACGGGAAAAC 
ACGGGAAAAC 
ACGGGAAAAC 
ACGGGAAAAC 
ACGGGAAAAC 
ACGGGAAAAC 



GACAACGACA 
GACAACGACA 
GACAACGACA 
GACAACGACA 
GACAACGACA 
GACAACGACA 
GACAACGACA 
GACAACGACA 
GACAACGACA 
GACAACGACA 
GACAACGACA 



400 

ACGATGATTG 
ACGATGATTG 
ACGATGATTG 
ACGATGATTG 
ACGATGATTG 
ACGATGATTG 
ACGATGATTG 
ACGATGATTG 
ACGATGATTG 
ACGATGATTG 
ACGATGATTG 



msa30176.2{305_18RS21 
msa3 0 17 6 . 2 { 3 05_26 03 
msa30176 . 2 ( 305_A909 
msa30176. 2(305 H36B 
msa30176 . 2 (305_JM9130013 
msa30 17 6 . 2 { 305_COHl 
msa30176 . 2 { 305_M781 
msa30176 . 2 { 305e_M732 
msa3O176.2{305_090 
msa30176.2{305_CJB110 
msa30176 . 2 (305_1169NT 
Consensus 



401 

CAGAAGTCTT 
CAGAAGTCTT 
CAGAAGTCTT 
CAGAAGTCTT 
CAGAAGTCTT 
CAGAAGTCTT 
CAGAAGTCTT. 
CAGAAGTCTT 
CAGAAGTCTT 
CAGAAGTCTT 
CAGAAGTCTT 



aAATGCTGGA 
aAATGCTGGA 
aAATGCTGGA 
aAATGCTGGA 
aAATGCTGGA 
aAATGCTGGA 
aAATGCTGGA 
aAATGCTGGA 
aAATGCTGGA 
aAATGCTGGA 
gAATGCTGGA 



GGTCAGAGAG 
GGTCAGAGAG 
GGTCAGAGAG 
GGTCAGAGAG 
GGTCAGAGAG 
GGTCAGAGAG 
GGTCAGAGAG 
GGTCAGAGAG 
GGTCAGAGAG 
GGTCAGAGAG 
GGTCAGAGAG 



GTTTGTTAGC 
GTTTGTTAGC 
GTTTGTTAGC 
GTTTGTTAGC 
GTTTGTTAGC 
GTTTGTTAGC 
GTTTGTTAGC 
GTTTGTTAGC 
GTTTGTTAGC 
GTTTGTTAGC 
GTTTGTTAGC 



450 

TGGGAATATC 
TGGGAATATC 
TGGGAATATC 
TGGGAATATC 
TGGGAATATC 
TGGGAATATC 
TGGGAATATC 
TGGGAATATC 
TGGGAATATC 
TGGGAATATC 
TGGGAATATC 



msa30176.2{305 18RS21 
msa3 0 176 . 2 ( 3 05_26 03 
msa30176 . 2 (305_A909 
msa30176 . 2 {305_H36B 
msa30176 . 2 (305_JM9130013 
msa3 0 17 6 . 2 { 3 05_C0H1 \ 
msa30176 . 2 (305_M781 } 
msa30176.2{305e_M732} 
msa30176. 2(305 090} 
msa30176. 2(305 CJB110} 
msa30176.2{305~1169NT} 
Consensus 



451 

GGCTTTCCTG 
GGCTTTCCTG 
GGCTTTCCTG 
GGCTTTCCTG 
GGCTTTCCTG 
GGCTTTCCTG 
GGCTTTCCTG 
GGCTTTCCTG 
GGCTTTCCTG 
GGCTTTCCTG 
GGCTTTCCTG 



CTAGTGAAGT 
CTAGTGAAGT 
CTAGTGAAGT 
CTAGTGAAGT 
CTAGTGAAGT 
CTAGTGAAGT 
CTAGTGAAGT 
CTAGTGAAGT 
CTAGTGAAGT 
CTAGTGAAGT 
CTAGTGAAGT 



TGTTCAGGCT 
TGTTCAGGCT 
TGTTCAGGCT 
TGTTCAGGCT 
TGTTCAGGCT 
TGTTCAGGCT 
TGTTCAGGCT 
TGTTCAGGCT 
TGTTCAGGCT 
TGTTCAGGCT 
TGTTCAGGCT 



GCGaATGATA 
GCGaATGATA 
GCGaATGATA 
GCGaATGATA 
GCGaATGATA 
GCGgATGATA 
GCGgATGATA 
GCGgATGATA 
GCGgATGATA 
GCGgATGATA 
GCGgATGATA 



500 

AAGATAcTCT 
AAGATAcTCT 
AAGATAcTCT 
AAGATAcTCT 
AAGATAcTCT 
AAGATAtTCT 
AAGATAtTCT 
AAGATAtTCT 
AAGATAtTCT 
AAGATAtTCT 
AAGATAcTCT 



msa30176.2(305_18RS21 
cnsa30176 . 2 ( 305_2603 
msa30176.2(305_A909 
msa30176.2{305_H36B 
ntsa30176 . 2 (305_JM913 0013 
msa3 0 17 6 . 2 ( 3 05_C0H1 
msa30176 . 2 (305_M781 
msa30176 . 2 { 305e_M732 
msa30176 . 2 (305_090 
msa30176 . 2 ( 305_CJB110 
tnsa30176 . 2 { 305_1169lir 
Consensus 



501 

AGTTATGGAA 
AGTTATGGAA 
AGTTATGGAA 
AGTTATGGAA 
AGTTATGGAA 
AGTTATGGAA 
AGTTATGGAA 
AGTTATGGAA 
AGTTATGGAA 
AGTTATGGAA 
AGTTATGGAA 



TTATCAAGTT 
TTATCAAGTT 
TTATCAAGTT 
TTATCAAGTT 
TTATCAAGTT 
TTATCAAGTT 
TTATCAAGTT 
TTATCAAGTT 
TTATCAAGTT 
TTATCAAGTT 
TTATCAAGTT 



TTCAGCTAAT 
TTCAGCTAAT 
TTCAGCTAAT 
TTCAGCTAAT 
TTCAGCTAAT 
TTCAGCTAAT 
TTCAGCTAAT 
TTCAGCTAAT 
TTCAGCTAAT 
TTCAGCTAAT 
TTCAGCTAAT 



GGGAGTTAAG 
GGGAGTTAAG 
GGGAGTTAAG 
GGGAGTTAAG 
GGGAGTTAAG 
GGGAGTTAAG 
GGGAGTTAAG 
GGGAGTTAAG 
GGGAGTTAAG 
GGGAGTTAAG 
GGGAGTTAAG 



550 

GAATTTCGTC 
GAATTTCGTC 
GAATTTCGTC 
GAATTTCGTC 
GAATTTCGTC 
GAATTTCGTC 
GAATTTCGTC 
GAATTTCGTC 
GAATTTCGTC 
GAATTTCGTC 
GAATTTCGTC 



msa30176. 2(305 18RS21 
ins a3 0176 . 2 ( 305_2603 
msa3 0 17 6 . 2 ( 3 0S_A9 09 
msa30176 . 2 ( 3 05_H3 6B 
msa3 0 17 6 . 2 { 3 0 5_JM913 0 0 13 
msa3 0176.21 3 05__COHl 
msa30176 . 2 { 305_M781 
msa30176 . 2 { 305e_M732 



551 

CTCATATTGC 
CTCATATTGC 
CTCATATTGC 
CTCATATTGC 
CTCATATTGC 
CTCATATTGC 
CTCATATTGC 
CTCATATTGC 



AGTAATTACT 
AGTAATTACT 
AGTAATTACT 
AGTAATTACT 
AGTAATTACT 
AGTAATTACT 
AGTAATTACT 
AGTAATTACT 



AATTTAATGC 
AATTTAATGC 
AATTTAATGC 
AATTTAATGC 
AATTTAATGC 
AATTTAATGC 
AATTTAATGC 
AATTTAATGC 



CAACTCATTT 
CAACTCATTT 
CAACTCATTT 
CAACTCATTT 
CAACTCATTT 
CAACTCATTT 
CAACTCATTT 
CAACTCATTT 



600 
AGATTATCAT ' 
AGATTATCAT 
AGATTATCAT 
AGATTATCAT 
AGATTATCAT 
AGATTATCAT 
AGATTATCAT 
AGATTATCAT 



972 



WO 2004/018646 



PCT/US2003/026827 



Table 67: Comparative Sequences relating to SAG047S 



msa30176.2{305_090j 
msa30176.2{305 CJB110) 



CTCATATTGC AGTAATTACT AATTTAATGC CAACTCATTT AGATTATCAT 
CTCATATTGC AGTAATTACT AATTTAATGC CAACTCATTT AGATTATCAT 
msa30176. 2{305^1169NT} CTCATATTGC AGTAATTACT AATTTAATGC CAACTCATTT AGATTATCAT 
Consensus ********** ********** ********** ********** ********** 



msa30176.2{305_18RS2i; 
msa30176 .2{305_2603 t 
msa30176 .2i305_A9O9; 
msa3 0176 . 2 { 3 05_H3 6B ' 
msa30176.2{305_JM9130013| 
ms a3 0 17 6 . 2 { 3 05_COH1 
msa30176.2{305_M781 
msa30176.2{305e_M732 
msa30176 . 2 {305_090 
msa30176.2f305jCJB110 
msa30176 . 2 {305_1169NT 
Consensus 



601 

GGGTCTTTTG 
GGGTCTTTTG 
GGGT CTTTTG 
GGGTCTTTTG 
GGGTCTTTTG 
GGGTCTTTTG 
GGGTCTTTTG 
GGGTCTTTTG 
GGGTCTTTTG 
GGGTCTTTTG 
GGGTCTTTTG 



AAGAtTATGT 
AAGAtTATGT 
AAGAtTATGT 
AAGAtTATGT 
AAGAtTATGT 
AAGAtTATGT 
AAGAtTATGT 
AAGAtTATGT 
AAGAtTATGT 
AAGAaTATGT 
AAGAtTATGT 



TGCTGCAAAA 
TGCTGCAAAA 
.TGCTGCAAAA 
TGCTGCAAAA 
TGCTGCAAAA 
TGCTGCAAAA 
TGCTGCAAAA 
TGCTGCAAAA 
TGCTGCAAAA 
TGCTGCAAAA 
TGCTGCAAAA 



TGGAATATCC 
TGGAATATCC 
TGGAATATCC 
TGGAATATCC 
TGGAATATCC 
TGGAATATCC 
TGGAATATCC 
TGGAATATCC 
TGGAATATCC 
TGGAATATCC 
TGGAATATCC 



650 

AAAATCAAAT 
AAAATCAAAT 
AAAATCAAAT 
AAAATCAAAT 
AAAATCAAAT 
AAAATCAAAT 
AAAATCAAAT 
AAAATCAAAT 
AAAATCAAAT 
AAAATCAAAT 
AAAATCAAAT 



msa30176 . 2 {305_18RS2l| 
msa30176.2f305_2603 
ms a3 0 1 7 6 . 2 { 3 0 5_A9 0 9 
msa30176 . 2 { 305_H36B 
msa30176.2{305_OM9130013 
msa30176.2{305_COHl 
msa30176.2(305_M781 
msa30176.2{305e_M732 
msa30176.2{305_090 
ms 330176 . 2{ 305_CJB110 
msa30176.2{305_1169NT 
Consensus 



651 

GTCTTCATCT 
GTCTTCATCT 
GTCTTCATCT 
GTCTTCATCT 
GTCTTCATCT 
GTCTTCATCT 
GTCTTCATCT 
GTCTTCATCT 
GTCTTCATCT 
GTCTTCATCT 
GTCTTCATCT 



GATTTTTTGG 
GATTTTTTGG 
GATTTTTTGG 
GATTTTTTGG 
GATTTTTTGG 
GATTTTTTGG 
GATTTTTTGG 
GATTTTTTGG 
GATTTTTTGG, 
GATTTTTTGG 
GATTTTTTGG 



TACTTAATTT 
TACTTAATTT 
TACTTAATTT 
TACTTAATTT 
TACTTAATTT 
TACTTAATTT 
TACTTAATTT 
TACTTAATTT 
TACTTAATTT 
TACTTAATTT 
TACTTAATTT 



TAATCAAGGT 
TAATCAAGGT 
TAATCAAGGT 
TAATCAAGGT 
TAATCAAGGT 
TAATCAAGGT 
TAATCAAGGT 
TAATCAAGGT 
TAATCAAGGT 
TAATCAAGGT 
TAATCAAGGT 



700 

ATTTCTAAAG 
ATTTCTAAAG 
ATTTCTAAAG 
ATTTCTAAAG 
ATTTCTAAAG 
ATTTCTAAAG 
ATTTCTAAAG 
ATTTCTAAAG 
ATTTCTAAAG 
ATTTCTAAAG 
ATTTCTAAAG 



msa30176.2{305 18RS21; 
msa30176.2f305_2603 ) 
msa30176.2{305 A909 ( 
msa30176.2{305~H36B 
msa30176 . 2 {305_OM9130013 
msa30176.2{305_COHl 
msa30176 .2 {305_M781 
ma a3 0176 . 2 { 305e_M732 
msa30176 . 2 { 305_090 
msa30176.2(305_CJB110 
msa30176 . 2 {305_1169NT 
Consensus 



701 

AGTTAGCTAA 
AGTTAGCTAA 
AGTTAGCTAA 
AGTTAGCTAA 
AGTTAGCTAA 
AGTTAGCTAA 
AGTTAGCTAA 
AGTTAGCTAA 
AGTTAGCTAA 
AGTTAGCTAA 
AGTTAGCTAA 



AACTACTAAA 
AACTACTAAA 
AACTACTAAA 
AACTACTAAA 
AACTACTAAA 
AACTACTAAA 
AACTACTAAA 
AACTACTAAA 
AACTACTAAA 
AACTACTAAA 
AACTACTAAA 



GCAACAATCG 
GCAACAATCG 
GCAACAATCG 
GCAACAATCG 
GCAACAATCG 
GCAACAATCG 
GCAACAATCG 
GCAACAATCG 
GCAACAATCG 
GCAACAATCG 
GCAACAATCG 



TTCCTTTCTC 
TTCCTTTCTC 




TTCCTTTCTC 
TTCCTTTCTC 
TTCCTTTCTC 



750 

TACTACGGAA 
TACTACGGAA 
TACTACGGAA 
TACTACGGAA 
TACTACGGAA 
TACTACGGAA 
TACTACGGAA 
TACTACGGAA 
TACTACGGAA 
TACTACGGAA 
TACTACGGAA 



msa30176.2{305_18RS21 
msa30176.2{305_2603 
msa30176.2{305_A909 
msa30176.2{305_H36B 
msa30176.2{305_OM9130013 
rasa30176 . 2 {305_COH1 
msa30176 . 2 {305_M781 
msa30176 . 2 { 305e_M732 
msa30176.2{305 090 
msa30176 . 2{ 305_CJB110 
msa30176 . 2 { 305_1169NT 
Consensus 



751 

AAAGTTGATG 
AAAGTTGATG 
AAA GTTGA TG 
AAAGTTGATG 
AAAGTTGATG 
AAAGTTGATG 
AAAGTTGATG 
AAAGTTGATG 
AAAGTTGATG 
AAAGTTGATG 
AAAGTTGATG 



GTGCTTACGT 
GTGCTTACGT 
GTGCTTACGT 
GTGCTTACGT 
GTGCTTACGT 
GTGCTTACGT 
GTGCTTACGT 
GTGCTTACGT 
GTG CTTA CGT 
GTGCTTACGT 
GTGCTTACGT 



ACAAGACAAG 
ACAAGACAAG 
ACAAGACAAG 
ACAAGACAAG 
ACAAGACAAG 
ACAAGACAAG 
ACAAGACAAG 
ACAAGACAAG 
ACAAGACAAG 
ACAAGACAAG 
ACAAGACAAG 



CAACTTTTCT 
CAACTTTTCT 
CAACTTTTCT 
CAACTTTTCT 
CAACTTTTCT 
CAA CTTTTC T 
CAACTTTTCT 
CAACTTTTCT 
CAACTTTTCT 
CAACTTTTCT 
CAACTTTTCT 



800 

ATAAAGGGGA 
ATAAAGGGGA 
ATAAAGGGGA 
ATAAAGGGGA 
ATAAAGGGGA 
ATAAAGGGGA 
ATAAAGGGGA 
ATAAAGGGGA 
ATAAAGGGGA 
ATAAAGGGGA 
ATAAAGGGGA 



msa30176 . 2 { 305_18RS21 
msa30176 . 2 { 3 05_2603 [ 
msa30176.2(305_A909 
msa30176.2{305_H36B 
rasa30176.2{305_JM9130013 
msa30176.2(305_COHl 
msa30176.2{305_M781 
msa30176.2{305e_M732 
msa30176.2{305_090 
msa30176.2{305_CJB110 
rasa30176 . 2 ( 305_1169NT; \ 
Consensus 



801 

GAATATTATG 
GAATATTATG 
GAATATTATG 
GAATATTATG 
GAATATTATG 
GAATATTATG 
GAATATTATG 
GAATATTATG 
GAATATTATG 
GAATATTATG 
GAATATTATG 



TcAGTAGAtG 
TcAGTAGAtG 
TcAGTAGAtG 
TcAGTAGAtG 
TcAGTAGAtG 
TcAGTAGAtG 
TcAGTAGAtG 
TcAGTAGAtG 
TtAGTAGAtG 
TtAGTAGAtG 
TcAGTAGAcG 



ACATTGGTGT 
ACATTGGTGT 
ACATTGGTGT 
ACATTGGTGT 
ACATTGGTGT 
ACATTGGTGT 
ACATTGGTGT 
ACATTGGTGT 
ACATTGGTGT 
ACATTGGTGT 
ACATTGGTGT 



CCCAGGAAGC 
CCCAGGAAGC 
CCCAGGAAGC 
CCCAGGAAGC 
CCCAGGAAGC 
CCCAGGAAGC 
CCCAGGAAGC 
CCCAGGAAGC 
CCCAGGAAGC 
CCCAGGAAGC 
CCCAGGAAGC 



850 

CATAACGTAg 
CATAACGTAg 
CATAACGTAn 
CATAACGTAg 
CATAACGTAg 
CATAACGTAg 
CATAACGTAg 
CATAACGTAg 
CATAACGTAg 
CATAACGTAg 
CATAACGTAg 



851 900 

msa30176.2{305 18RS21} AGAATGCTCT AGCAACTATT GCGGTTGCTA AACTgGCTGG TATCAGTAAT 

msa30176. 2(305.2603} AGAATGCTCT AGCAACTATT GCGGTTGCTA AACTgGCTGG TATCAGTAAT 

msa30176.2(305 A909J AGAATGCTCT AGCAACTATT GCGGTTGCTA AACTgGCTGG TATCAGTAAT 

maa30176.2{305~H36B} AGAATGCTCT AGCAACTATT GCGGTTGCTA AACTgGCTGG TATCAGTAAT 

msa30176. 2 {305_JM9 1300131 AGAATGCTCT AGCAACTATT GCGGTTGCTA AACTgGCTGG TATCAGTAAT 

msa30176.2{305 COH1} AGAATGCTCT AGCAACTATT GCGGTTGCTA AACTaGCTGG TATCAGTAAT 

msa30176.2{305*~M78l} AGAATGCTCT AGCAACTATT GCGGTTGCTA AACTaGCTGG TATCAGTAAT 
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Table 67: Comparative Sequences relating to SAG0475 



msa30176.2(305e_M732) 
msa30176.2{305 090} 
msa30176.2(305_CJB110} 
nu3a30176 . 2 {305_1169NT} 
Consensus 



AGAATGCTCT AGCAACTATT GOGGTTGCTA AACTaGCTGG TATCAGTAAT 
AGAATGCTCT AGCAACTATT GCGGTTGCTA AACTaGCTGG TATCAGTAAT 
AGAATGCTCT AGCAACTATT GCGGTTGCTA AACTaGCTGG TATCAGTAAT 
AGAATGCTCT AGCAACTATT GCGGTTGCTA AACTaGCTGG TATCAGTAAT 
********** ********** ********** ****_***** ********** 



901 

msa30176.2(305_18RS2l) CAAGTTATTA 

msa30176 . 2 { 305_2603 > CAAGTTATTA 

msa30176.2?305 A909 CAAGTTATTA 

msa30176.2(3053l36B CAAGTTATTA 

msa30176.2{305_JM9130013' CAAGTTATTA 

msa30176.2{305_COHl' CAAGTTATTA 

msa30176.2(305_M781 > CAAGTTATTA 

msa30176 . 2 { 305e_M732 ' CAAGTTATTA 

msa30176.2{305_090 f CAAGTTATTA 

msa30176.2{305_CJB110> CAAGTTATTA 

msa30176.2(305_1169NT) CAAGTTATTA 

Consensus ********** 



GAGAAACTTT. 
GAGAAACTTT 
GAGAAACTTT 
GAGAAACTTT 
GAGAAACTTT 
GAGAAACTTT 
GAGAAA CTTT 
GAGAAACTTT 
GAGAAACTTT 
GAGAAACTTT 
GAGAAACTTT 



AAGCAATTTT 
AAGCAATTTT 
AAGCAATTTT 
AAGCAATTTT 
AAGCAATTTT 
AAGCA ATTTT 
AAGCAATTTT 
AAGCAATTTT 
AAGCAATTTT 
AAGCA ATTTT 
AAGCAATTTT 



GGAGGTGTTA 
GGAGGTGTTA 
GGAGGTGTTA 
GGAGGTGTTA 
GGAGGTGTTA 
GGAGGTGTTA 
GGAGGTGTTA 
GGAGGTGTTA 
GGAGGTGTTA 
GGAGGTGTTA 
GGAGGTGTTA 



950 

AACACCGCTT 
AACACCGCTT 
AACACCGCTT 
AACACCGCTT 
AACACCGCTT 
AACACCGCTT 
AACACCGCTT 
AACACCGCTT 
AACACCGCTT 
AACACCGCTT 
AACACCGCTT 



951 

msa30176.2{305_X8RS2l} GCAATCACTC 

msa30176. 2 { 305^2603 ' GCAATCACTC 

msa30176.2{305_A909 GCAATCACTC 

mfla30176.2{305_H36B ► GCAATCACTC 

msa30176.2(305_JM9130013 GCAATCACTC 

msa30176.2{305_COHl GCAATCACTC 

msa30176.2(305 M781 > GCAATCACTC 

msa30176 . 2 { 305e3«732 GCAATCACTC 

msa30176.2{305_090J GCAATCACTC 

rasa3017 6 . 2 { 305 JZJB110 } GCAATCACTC 

rasa30176.2{305_1169NT} GCAATCACTC 

Consensus ********** 



GGTAAGGTTC 
GGTAAGGTTC 
GGTAAGGTTC 
GGTAAGGTTC 
GGTAAGGTTC 
GGTAAGGTTC 
GGTAAGGTTC 
GGTAAGGTTC 
GGTAAGGTTC 
GGTAAGGTTC 
GGTAAGGTTC 



ATGGTATTAG 
ATGGTATTAG 
ATGGTATTAG 
ATGGTATTAG 
ATGGTATTAG 
ATGGTATTAG 
ATGGTATTAG 
ATGGTATTAG 
ATGGTATTAG 
ATGGTATTAG 
ATGGTATTAG 



TTTCTATAAc 
TTTCTATAAc 
TTTCTATAAC 
TTTCTATAAC 
TTTCTATAAc 
TTTCTATAAC 
TTTCTATAAc 
TTTCTATAAc 
TTTCTATAAc 
TTTCTATAAt 
TTTCTATAAc 



1000 
GACAGcAAGt 
GACAGcAAGt 
GACAGcAAGt 
GACAGcAAG- 
GACAGcAAGt 
GACAGcAAGt 
GACAGcAAGt 
GACAGcAAGt 
GACAGcAAGt 
GACAGcAAGt 
GACAGtAAGt 



msa30176.2(305_18RS21 
msa3 0 17 6 . 2 { 3 05_2 603 
msa30176.2(305_A909 
. msa30176 . 2 (30S_H36B 
msa30176 . 2 {305_JM9130013 
msa30176 . 2 (305_COH1 
msa3 0176 . 2 { 3 05_M78 1 
msa30176.2{305e_M732 
msa30176 . 2 {305_090 
msa3 017*6 . 2 ( 305_CJB110 
msa30176.2{305_1169NT) 
Consensus 



msa30176.2{305_18RS2i; 
rasa30176 . 2 ( 305_2603 
rasa30176 . 2 { 305_A909 
msa30176.2{305_H36B 
msa30176 . 2 {305_JM9130013 
msa30176 . 2 (305_COH1 
msa30176.2{305_M781 
tnsa30 176 . 2 { 3 0 5e_M7 32 
msa30176.2{305_090 
Tnsa30176.2(305jCJB110 
msa30176.2(305_1169NT 
Consensus 



msa30176.2{305 18RS21 
msa30176. 2(305 2603 
msa30176.2(305 A909 
tnsa30176 . 2 ( 305~H36B 
msa30176. 2(305 JM9130013 
rasa30176.2{305 COH1 
msa30176. 2(305 M7B1 
msa3 0176.2(3 05e~M73 2 
msa30176.2{305_090 
rasa30176.2{305_CJB110 £ 
msa30176.2(305_1169NT J 
Consensus 



rasa30176.2{305_18RS2i; 
msa3 0 17 6 . 2 ( 3 0 5__2 6 0 3 
msa30176.2(305_A909 
msa30176.2{305 H36B 
msa30176.2(305_JM9130013 
msa30176 . 2 { 305_COH1 



1001 1050 
caactaatat attggcaact caaaaagcat tatctggctt tgataatact 
caactaatat attggcaact caaaaagcat tatctggctt tgataatact 
caactaatat attggcaact caaaaagcat tatctggctt tgataatact 



caactaatat 
caactaatat 
caactaatat 
caactaatat 
caactaatat 
caactaatat 
caactaatat 



attggcaact 
attggcaact 
attggcaact 
attggcaact 
attggcaact 
attggcaact 
attggcaact 



caaaaagcat 
caaaaagcat 
caaaaagcat 
caaaaagcat 
caaaaagcat 
caaaaagcat 
caaaaagcat 



tatctggctt 
tatctggctt 
tatctggctt 
tatctggctt 
tatctggctt 
tatctggctt 
tatctggctt 



tgataatact 
tgataatact 
tgataatact 
tgataatact 
tgataatact 
tgataatact 
tgataatact 



1051 1100 

aaagttatcc taattgcagg aggtcttgat cgcggtaatg agtttgatga 

aaagttatcc taattgcagg aggtcttgat cgcggtaatg agtttgatga 

aaagttatcc taattgcagg aggtcttgat cgcggtaatg agtttgatga 



aaagttatcc 
aaagttatcc 
aaagttatcc 
aaagttatcc 
aaagttatcc 
aaagttatcc 
aaagttatcc 



taattgcagg 
taattgcagg 
taattgcagg 
taattgcagg 
taattgcagg 
taattgcagg 
taattgcagg 



aggtcttgat 
aggtcttgat 
aggtcttgat 
aggtcttgat 
aggtcttgat 
aggtcttgat 
aggtcttgat 



cgcagtaatg 
cgcggtaatg 
cgcggtaatg 
cgcggtaatg 
cgcggtaatg 
cgcggtaatg 
cgcggtaatg 



agtttgatga 
agtttgatga 
agtttgatga 
agtttgatga 
agtttgatga 
agtttgatga 
agtttgatga 



1101 1150 
attgatacca gatatcactg gacttaaaca tatggttgtt ttaggggaat 
attgatacca gatatcactg gacttaaaca tatggttgtt ttaggggaat 
attgatacca gatatcactg gacttaaaca tatggttgtt ttaggggaat 



attgatacca 
attgatacca 
attgatacca 
attgatacca 
attgatacca 
attgatacca 
attgatacca 



gatatcactg 
gatatcactg 
gatatcactg 
gatatcactg 
gatatcactg 
gatatcactg 
gatatcactg 



gacttaaaca 
gacttaaaca 
gacttaaaca 
gacttaaaca 
gacttaaaca 
gacttaaaca 
gacttaagca 



tatggttgtt 
tatggttgtt 
tatggttgtt 
tatggttgtt 
tatggttgtt 
tatggttgtt 
tatggttgtt 



ttaggggaat 
ttaggggaat 
ttaggggaat 
ttaggggaat 
ttaggggaat 
ttaggggaat 
ttaggggaat 



1151 1200 
cggcatctcg agtaaaacgt gctgcacaaa aagcaggagt aacttatagc 
cggcatctcg agtaaaacgt gctgcacaaa aagcaggagt aacttatagc 
cggcatctcg agtaaaacgt gctgcacaaa aagcaggagt aacttatagc 

cggcatctcg agtaaaacgt gctgcacaaa aagcaggagt aacttatagc 
cggcatctcg agtaaaacgt gctgcacaaa aagcaggagt aacttatagc 
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msa30176.2{30S_M781 
msa30176 . 2 { 305e_M732 
msa3 0176 . 2 { 30 5_0 90 
msa3 017 6 . 2 ( 3 0S_CJB1 10 
rasa30176 . 2{305_1169NT 
Consensus 



cggcatctcg agtaaaacgt gctgcacaaa aagcaggagt aacttatagc 
cggcatctcg agtaaaacgt gctgcacaaa aagcaggagt aacttatagc 
cggcatctcg agtaaaacgt gctgcacaaa aagcaggagt aacttatagc 
cggcatctcg agtaaaacgt gctgcacaaa aagcaggagt aacttatagc 
cggcatctcg agtaaaacgt gctgcacaaa aagcaggagt aacttatagc 



msa30176.2{305_18RS21 
msa30176.2(305_2603 
msa3 0176 . 2 f 305_A909 
msa3 0 17 6 . 2 { 3 05_H3 6B 
msa30176.2{305_JM9130013) gatgctttag 
msa30176.2{305_COHl ) gatgctttag 
msa30176.2{305_M781 gatgctttag 
mBa30176 .2{305e_M732 i gatgctttag 
msa30176.2{305_090) gatgctttag 
msa30176.2{305_CJB110) gatgctttag 
msa30176.2{305_1169NT) aatgctttag 
Consensus 



1201 1250 
gatgctttag atgttagaga tgcggtacat aaagcttatg aggtggcaca 
gatgctttag atgttagaga tgcggtacat aaagcttatg aggtggcaca 
gatgctttag atgttagaga tgcggtacat aaagcttatg aggtggcaca 



atgttagaga 
atgttagaga 
atgttagaga 
atgttagaga 
atgttagaga 
atgttagaga 
atgttagaga 



tgcggtacat 
tgcggtacat 
tgcggtacat 
tgcggtacat 
tgcggtacat 
tgcggtacat 
tgcggtacat 



aaagcttatg 
aaagcttatg 
aaagcttatg 
aaagcttatg 
aaagcttatg 
aaagcttatg 
aaagcttatg 



aggtggcaca 
aggtggcaca 
aggtggcaca 
aggtggcaca 
aggtggcaca 
aggtggcaca 
aggtggcaca 



msa30176.2{305_18RS2i; 
msa30176 . 2 {305_2603 
msa30176 . 2 < 305_A909 
msa3 0 17 6 . 2 { 3 0 5_H3 6B 
msa30176.2{305 JM9130013 
msa30176 . 2 (305_COH1 
msa30176.2{305 M781 
msa30176.2{30Se_M732 
msa30176.2{305_090 
msa30176 . 2 f 305_CJB110 
rasa30176 . 2 { 305_1169NT 
Consensus 



msa30176.2{305_18RS2lJ 
msa30176.2{305 2603) 
msa30176. 2 (3053^909} 
msa30176.2{305_H36Bj 
msa30176 . 2 {305_JM9130013 ' 
msa30176.2f305_.COHl 
msa30176.2{305_M781 
msa30176 . 2 { 305e_M732 
maa30176.2{305_090 > 
msa3 0 17 6 . 2 { 3 05_GJB110 ' 
msa30176.2{305_1169NT] 
Consensus 



msa30176.2{305_18RS21 
msa30176.2(305 2603 
msa30176.2(305~A909 
msa30176.2{305_H36B 
msa30176 . 2 {305_JM9130013 
rasa3 0176 . 2 { 305_COH1 
msa30176 . 2 {305_M781 
msa30176.2{305e M732 
tnsa30176.2{305 090 
msa30176.2(305jCJB110 
msa30176.2{305_1169NT \ 
Consensus 



1251 1300 
acagggcgat gttatcttgc taagtcctgc aaatgcatca tgggacatgt 
acagggcgat gttatcttgc taagtcctgc aaatgcatca tgggacatgt 
acagggcgat gttatcttgc taagtcctgc aaatgcatca tgggacatgt 



acagggcgat 
acagggcgat 
acagggcgat 
acagggcgat 
acagggcgat 
acagggcgat 
acagggcgat 



gttatcttgc 
gttatcttgc 
gttatcttgc 
gttatcttgc 
gttatcttgc 
gttatcttgc 
gttatcttgt 



taagtcctgc 
taagtcctgc 
taagtcctgc 
taagtcctgc 
taagtcctgc 
taagtcctgc 
tmagtcctgc 



aaatgcatca 
aaatgcatca 
aaatgcatca 
aaatgcatca 
aaatgcatca 
aaatgcatca 
gaatgcatca 



tgggacatgt 
tgggacatgt 
tgggacatgt 
tgggacatgt 
tgggacatgt 
tgggacatgt 
tgggacatgt 



1301 1350 
ataagaattt cgaagtccgt ggtgatgaat tcattgatac tttcgaaagt 
ataagaattt cgaagtccgt ggtgatgaat tcattgatac tttcgaaagt 
ataagaattt cgaagtccgt ggtgatgaat tcattgatac tttcgaaagt 



ataagaattt 
ataagaattt 
ataagaattt 
ataagaattt 
ataagaattt 
ataagaattt 
ataagaattt 



cgaagtccgt 
cgaagtccgt 
cgaagtccgt 
cgaagtccgt 
cgaagtccgt 
cgaagtccgt 
cgaagtccgt 



ggtgatgaat 
ggtgatgaat 
ggtgatgaat 
ggtgatgaat 
ggtgatgaat 
ggtgatgaat 
ggtgatgaat 



tcattgatac 
tcattgatac 
tcattgatac 
tcattgatac 
tcattgatac 
tcattgatac 
tcattgatac 



tttcgaaagt 
tttcgaaa — 
tttcgaaagt 
tttcgaaagt 
tttcgaaagt 
tttcgaaagt 
tttcg 



1351 1362 
cttagaggag ag 
cttagaggag ag 
cttagaggag ag 

cttagaggag ag 

cttagaggag ag 
cttagaggag ag 
cttagaggag ag 
cttagaggag ag 



SEQ XD HO. 6711 
STRAIN 090 frame: 3 

ITTFENKKVLVLGIJU^GEAAARLIiAK^ I KWCGS 

HPLELLDBD FCYM I KNPG I PYNNPMVKKALEKQI P VLTEVELAYLVSBSQL I G I TG SNGK 
TTTTTM I AEVLNAGGQRGLLiAGN I G PPAS BWQAADDKD I LVMELSSFQLMGVKEFRPH I 
AVITNI24PTHIjDYHGSFEDYVAAKW^ 

STTEKVDGAYVQDKQLFYKGENI MLVDD I GVPGSHNVENALAT I AVAKLAG I SNQVI RET 
LSNFGGVKHRLQSLGKVHG I S FYNDSKSTNI LATQKAL.SGFDNTKVI L I AGGLDRGNBFD 
EL I PD ITGIjKHMVVIjGESASRVTCRAAQKAGVTYSDA^ 
ANASWDMYKNFBVRGDEFIDTFESLRGE 



SEQ ZD HO. 6712 

STRAIN A909 frame: 3 

ITTFENKKS^VI/3LARSGEAAARLLAKLG^ KWCGS 
HPLELLDED PCYMI KNPG I PYNNPMVKKALEKQI PVLTBVELAYLVSESQLIGITGSNGK 
TTTTTM I AEVLNAGGQRGLLAGN I G FPASEWQAANDKDTLVMELS S FQLMG VKE FRPH I 
AVITNU*PTHLDYHGSFEDYV7*AKWNIQNQMSSSDF^ 

STTEKVDGAYVQDKQLPYKGEN I MSVDD I GVPG SHNVXNALAT 1AVAKLAG I SNQVI RET 
LSNFGGVKHRLQSLGKVHGI SPYNDSKSTNI LATQKALSGFDNTKVX LIAGGLDRGNEFD 
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ELI PD ITGLKHMVVLGESASRVKRAAQKAG VT YSB^ P 
ANAS WDMYKNFEVRGDEF I DTFESLRGE 

SEQ ID NO. 6713 

STRAIN H36B frame: 1 
GRVMKTITTFENKKNHjVIiGliARSGEA 

KVVCGSHPLELLDEDFCYMI KNPGI PYNNPMVKKALEKQ I P VLTEVELAYLVSE S QL I G I 
TGSNGKTTTTTM I AEVLNAGGQRGLLAGN I GF PASEWQAANDKDTLVMELS SFQIiMGVK 
EFRPHIAVITNLMPTHIiDYHGSFEDYVAAKWNI QNQMSSSDFLVLNFNQGI SKELAKTTK 
AT I VP FSTTEKVDGAYVQDKQLFYKGENI MSVDD I GVPGSHNVENALAT I AVAKLAG I SN 
QVI RETLSNFGGVKHRLQSLGKVHG I S FYNDS K 

SEQ ID NO* 6714 

STRAIN 18RS21 frame: 1 

GRVMKTITTFENKKVIjVLGIaMISGEAAAR 

KVVCGSHPLELLDEDFCYMI KNPGI PYNNPMVKKALEKQ I PVLTEVELAYLVSESQLIG I 
TG SNGKTTTTTM I AEVLNAGGQRGLLAGN I gfpas ewqaandkdtl vmels s fqlmgvk 
EFRPH I AVI TNLMPTHIiDYHGS FED YVAAKWN I QNQMS S SDFLVLNFNQG I SKELAKTTK 
AT I VPFSTrEKVDGAYVQDKQLFYKGENIMSVDD IGVPGSHNVENALAT I AVAKLAG I SN 
QVI RETL SNFGG VKHRliQS LGKVHG I SFYNDSKSTNILATQKALSGFDNTKVILIAGGLD 
RGNEFDELI PDITGLKHMVVLGESASRVKRAAQKAGVTYSDALDVRDA 
VI LLSPANAS WDMYKNFEVRGDEF I DTFESLRGE 

SEQ ID NO. 6715 

STRAIN M732 frame: 1 

GRVMKTITTFF^KKVLVIXSIjARSGEAAARIjIAKI^ I 
KVVCGSHPLELLDEDFCYMi KNPGI PYNNPMVKKALEKQI PVLTEVELAYLVSBSQLIGI 
TGSNGKTTTTTM IAEVLNAGGQRGLLAGN I GFPASEVVQAADDKDIIjVMELSSFQLMGVK 
EFRPH I AVI TNLMPTHLDYHGS FED YVAAKWN I QNQMSSSDFLVLNFNQG I SKELAKTTK 
ATIVPFSTTEKVDGAYVQDKQLFYKGENIMSVDDIGVPGSH^^ 

O^IRETLSNFGGVKHRLQSLGKVHGI SFYNDSKSTNI LATQKALSGFDNTKVILIAGGLD 
RGNEFDELI PDITGLKHMVVLGESASRVKRAAQKAGVTYSDAIoDVRDAV^ 
VI LLSPANAS WDMYKNFEVRGDEF I DTFESLRGE 

SEQ ID NO. 6716 
STRAIN COH1 frame: 1 

GRVMKTITTFENKKVLVLGLARSGEAAARLLAKLGAIVT^ 

KWCGSHPLELLDEDFCYM I KNPG I PYNNPMVKKALEKQ I PVLTBVELAYLVSESQL IG I 

TGSNGKTTTTTMIAEVLNAGGQRGLIAGNIGFPASEWQAADDKDILV^ 

EFRPH I AVI TNLMPTHLD YHGS FED YVAAKWN I QNQMS S SDFLVLNFNQG I SKELAKTTK 

AT I VPFSTTE KVDGAYVQDKQLFYKGENI MSVDD I GVPGSHNVENALAT I AVAKLAG I SN 

QVIRETLSNFGGVKHRIiQSLGKVHGISFYNDSKSTNILATQ 

RGNEFDELI PDITGLKHMVVLGESASRVKRAAQKAGVTYSDALDVRDAVHK^^ 

V I LLS PANAS WDMYKNFEVRGDEF I DTFE 

SEQ ID NO. 6717 

STRAIN M781 frame: 1 

GRVMKTITTFENKKVLVIiGLARSGFAAARLLAKIX^ 

KWCGSHPLELLDEDFCYM I KNPGI PYNNPMVKKALEKQI PVLTEVELAYLVSE SQL I G I 
TG SNGKTTTTTM IAEVLNAGGQRGLLAGN IGF PAS EWQAADDKD I LVMELS S FQLMGVK 
EFRPH I AVT TNLMPTHLDYHGS FED YVAAKWN I QNQMSS SDFLVLNFNQG I SKELAKTTK 
ATIVPFSTTEKVDGAYVQDKQLFYKEF^IMSVDDIGVPGS SN 
QVI RETL SNFGGVKHRI»QSLGKVHGISFYNDSKSTNILATQKALSGFDOT 
RGNEFDELI PD I TGLKHMVVLGESASRVKRAAQKAGVTYSDALDVRDAVHKAYKVAQQGD 
VILLS PANASWDMYKNFEVRGDEF I DTFES LRGE 

SEQ XD NO. 6718 

STRAIN CJB1 10 frame: 1 

GRVMKTITTPF^KKVLVLGLARSGEAAARLLAKLGAI VTVNDGKPFDENPTAQS LLEEG I 
KWCGSHPLELLDEDFCYMI KNPGI PYNNPMVKKALEKQI PVLTEVELAYLVSESQLIGI 
TGSNGKTTTTTMIAEVLNAGGQRGIjIjA 

EFRPH IAVITNLMPTHLDYHGSFEEYVAAKWNI QNQMSSSDFLVLNFNQGI S KELAKTTK 
AT I VP PSTTEKVDGAYVQDKQL FYKGENIMLVDD I GVPG SHNVENALAT IAVAKLAG I SN 
Q^IRET1»SNFGGVKHRLQS1jGKVHG IS FYNDS KSTNILATQKALSGFDN^ 
RGNEFDELI PD I TGLKHMWLGESAS RVKRAAQKAGVTYSDALD VRDAVHKAYEVAQQGD 
VI LLS PANAS WDMYKNFEVRGDEF IDT FES LRGE 

SEQ ID NO. 6719 
STRAIN 1169NT frame: 3 

ITTFENKKVLVLGLARSGEAAARLIAKIX3AIVT^ KWCGS 
HPLELLDEDFCYMI KNPGI PYNNPMVKKALEKQ I PVLTEVELAYLVS ES QL I G I TGSNGK 
TTTTTM I AEVIjNAGGQRGLLAGNIGFPASBWOAADDKDTLVMBL S S FQLMGVKB FRPH I 
AVITNLMPTHLDYHGS FED YVAAKWNI QNQMS S SD FLVLNFNQG I SKELAKTTKATIVPF 
STTEKVDGAYVQDKQLFYKQBNIMSVDDIGVPGSHNVENALATIAVA^ RET 
LSNFGGVKHRLQSLGKVHG I SFYNDSKSTNI LATQKALSGFDNTKVI L IAGGLDRGNEFD 
EL I PD I TGLKHMVVLGESASRVKRAAQKAGVTYSNALDVRD LXS P 

ANAS WDMYKNFEVRGDEFI DTP 
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SEQ ID NO. 6720 

STRAIN JM9130013 frame: 1 

GRVMKTITTFENKKVLVLGLARSGEAAARLIJtfajGAI 

KWCGSHPLELLDBDFCYM I KNPG I P YNNPMVKKALEKQ I PVLTEVELAYLVSE SQL IG I 
TGSNGKTTTTTMI AEVLNAGGQRGLLAGNI GFPASEWQAANDKZ3TLVMBLSS PQLMGVK 
EFRPH I AVI TNLMPTHLDYHGSFEDYVAAKWNI QNQMSSSDFtrVIiNFNQG I SKELAKTTK 
AT I VP FSTTE KVDGA YVQDKQL FY KGEN I MS VDD I GVPGSHNVENALAT I AVAKLAG I SN 
QV I RETL SNFGG VKHRLQS LGKVHG I S FYNDS KSTN I LATQKAL S G FDNTKV I L I AGGLD 
RSNEFDELI PDITGLKHMVVLGESABRVKRAAQKAGVTYSDAIjDVRDAV^ 
VI LLS PANAS WDMYKNFEVRGDEF I DTFESLRGE 

SEQ ID NO. 6721 
STRAIN 2603 frame: 1 

GRVMKTITTFENKK\^VLGLARSGEAAARLLAK^ 

KWCGSHPLELLDBDFCYMI KNPGI PYNNPMVKKALEKQ I PVLTEVELAYLVSESQLIGI 
TGSNGKTTTTTMIAEVLNAGGQRGLLAGNI gfpasewqaandkdtlvmelssfqlmgvk 
EFRPHIAVITNLMPTHLDYHGSFEDYVAAKWN IQNQMSSSDFI»VLNFNQGI SKELAKTTK 
ATI WFSTTEKVDGAWQDKQLFYKGENIMSVDDIGVPGSHNVENALATI AVAKLAG I SN 
QVI RETLSNFGG VKHRLQS LGKVHG I SFYNDSKSTNILATQKALSGFDNTKVI LI AGGLD 
RGNEFDELI PD I TGLKHMVVLGES ASRVKRAAQKAGVTYSDAIJD VRDAVHXAY^ 
VI LLS PANAS WDMYKNFEVRGDEF I DTFESLRGE 



MSA Alignment Results « Pretty output 

PRETTY Of: /biotmp/msa25243 . 2 { * J April 29, 



2002 02s20 



msa25243 . 2 {305_18RS21 
msa25243 .2{305_2603 
msa2 52 4 3 . 2 { 3 0 5_JM9 13 0 013 
rasa2 524 3 . 2 f 3 0 5_COHl 
ma a2 5243 . 2 { 305_M732 
msa25243 .2{305_M7S1 
msa25243.2{305_1169NT 
msa2 5243 . 2 { 3 0 5_A9 0 9 
msa25243.2{305_CJB110 
msa25243 . 2 { 305_090 
msa25243 .2{305J336B 
Consensus 



grvmktlTTF 
grvmktlTTF 
grvmktlTTF 
grvmktlTTF 
grvmktlTTF 
grvmktlTTF 

ITTF 

ITTF 

grvmktlTTF 

ITTF 

grvmktlTTF 



ENKKVLVLGL 
ENKKVLVLGL 
ENKKVLVLGL 
ENKKVLVLGL 
ENKKVLVLGL 
ENKKVLVLGL 
ENKKVLVLGL 
ENKKVLVLGL 
ENKKVLVLGL 
ENKKVLVLGL 
ENKKVLVLGL 



ARSGEAAARL 
ARSGEAAARL 
ARSGEAAARL 
ARSGEAAARL 
ARSGEAAARL 
ARSGEAAARL 
ARSGEAAARL 
ARSGEAAARL 
ARSGEAAARL 
ARSGEAAARL 
ARSGEAAARL 



LAKLGAIVTV 
LAKLGAIVTV 
LAKLGAIVTV 
LAKLGAIVTV 
LAKLGAIVTV 
LAKLGAIVTV 
LAKLGAIVTV 
LAKLGAIVTV 
LAKLGAIVTV 
LAKLGAIVTV 
LAKLGAIVTV 



50 

NDGKPFDENP 



NDGKPFDENP 
NDGKPFDENP 
NDGKPFDENP 
NDGKPFDENP 
NDGKPFDENP 
NDGKPFDENP 
NDGKPFDENP 
NDGKPFDENP 



msa25243 . 2 {305_18RS21 
msa25243.2{305_2603 
msa25243 .2 {305_JM9130013 
msa25243.2{305_COHl 
msa25243.2f305_M732 
msa25243.2{305_M781 
msa25243 . 2 {305_1169NT 
msa25243.2{305_A909 
msa2S243.2{305_CJB110 
msa25243.2{305_090 
msa25243.2{305_H36B 
Consensus 



51 

TAQSLLEEGI 
TAQSLLEEGI 
TAQSLLEEGI 
TAQSLLEEGI 
TAQSLLEEGI 
TAQSLLEEGI 
TAQSLLEEGI 
TAQSLLEEGI 
TAQSLLEEGI 
TAQSLLEEGI 
TAQSLLEEGI 



KWCGSHPLE 
KWCGSHPLE 
KWCGSHPLE 
KWCGSHPLE 
KWCGSHPLE 
KWCGSHPLE 
KWCGSHPLE 
KWCGSHPLE 
KWCGSHPLE 
KWCGSHPLE 
KWCGSHPLE 



LLDEDFCYMI 
LLDEDFCYMI 
LLDEDFCYMI 
LLDEDFCYMI 
LLDEDFCYMI 
LLDEDFCYMI 
LLDEDFCYMI 
LLDEDFCYMI 
LLDEDFCYMI 
LLDEDFCYMI 
LLDEDFCYMI 



KNPGIPYNNP 
KNPGI PYNNP 
KNPGIPYNNP 
KNPGIPYNNP 
KNPGIPYNNP 
KNPGIPYNNP 
KNPGIPYNNP 
KNPGIPYNNP 
KNPGIPYNNP 
KNPGIPYNNP 
KNPGIPYNNP 



100 

MVKKALEKQI 
MVKKALEKQI 
MVKKALEKQI 
MVKKALEKQI 
MVKKALEKQI 
MVKKALEKQI 
MVKKALEKQI 
MVKKALEKQI 
MVKKALEKQI 
MVKKALEKQI 
MVKKALEKQI 



msa25243.2{305_18RS21 
msa25243.2{305_2603' 
msa25243 . 2 {305_JM9130013 
msa25243 .2f 305_COH1 
msa25243 . 2 f 305_M732 
msa25243.2{305J4781 

ins a2 52 43. 2 {'3 05 1169NT 

msa25243.2{305_ A9 °9 
msa25243.2{305 CJB110 
msa25243.2{305_090 
msa25243.2{305_H36B 
Consensus 



101 

PVLTEVELAY 
PVLTEVELAY 
PVLTEVELAY 
PVLTEVELAY 
PVLTEVELAY 
PVLTEVELAY 
PVLTEVELAY 
PVLTEVELAY 
PVLTEVELAY 
PVLTEVELAY 
PVLTEVELAY 



LVSESQLIGI 
LVSESQLIGI 
LVSESQLIGI 
LVSESQLIGI 
LVSESQLIGI 
LVSESQLIGI 
LVSESQLIGI 
LVSESQLIGI 
LVSESQLIGI 
LVSESQLIGI 
LVSESQLIGI 



TGSNGKTTTT 
TGSNGKTTTT 
TGSNGKTTTT 
TGSNGKTTTT 
TGSNGKTTTT 
TGSNGKTTTT 
TGSNGKTTTT 
TGSNGKTTTT 
TGSNGKTTTT 
TGSNGKTTTT 
TGSNGKTTTT 



TMIAEVLNAG 
TMIAEVLNAG 
TMIAEVLNAG 
TMIAEVLNAG 
TMIAEVLNAG 
TMIAEVLNAG 
TMIAEVLNAG 
TMIAEVLNAG 
TMIAEVLNAG 
TMIAEVLNAG 
TMIAEVLNAG 



ISO 

GQRGLLAGNI 
GQRGLLAGNI 
GQRGLLAGNI 
GQRGLLAGNI 
GQRGLLAGNI 
GQRGLLAGNI 
GQRGLLAGNI 
GQRGLLAGNI 
GQRGLLAGNI 
GQRGLLAGNI 
GQRGLLAGNI 



msa25243.2{305JL8RS2l" 
msa25243.2{305_2603 
msa25243.2{305 JM9130013 
rasa25243.2(305_COHl 
msa25243 .2(3 05J4732 
msa25243 . 2 { 3 05_M78 1 
msa25243.2{305_1169NT 
msa2 5243 .2(3 05_A90 9 
msa25243.2{305 CJB110 
msa25243.2{305 090 
msa25243.2{305_H36B 
Consensus 



151 

GFPASEWQA 
GFPASEWQA 
GFPASEWQA 
GFPASEWQA 
GFPASEWQA 
GFPASEWQA 
GFPASEWQA 
GFPASEWQA 
GFPASEWQA 
GFPASEWQA 
GFPASEWQA 



AnDKDtLVME 
AnDKDtLVME 
AnDKDtLVME 
AdDKDILVME 
AdDKDiLVME 
AdDKDILVME 
AdDKDtLVME 
AnDKDtLVME 
AdDKDILVME 
AdDKDiLVME 
AnDKDtLVME 



LSSFQLMGVK 
LSSFQLMGVK 
LSSFQLMGVK 
LSSFQLMGVK 
LSSFQLMGVK 
LSSFQLMGVK 
LSSFQLMGVK 
LSSFQLMGVK 
LSSFQLMGVK 
LSSFQLMGVK 
LSSFQLMGVK 



EFRPH I AVI T 
EFRPH IAVIT 
EFRPHIAVIT 
EFRPH IAVIT 
EFRPHIAVIT 
EFRPHIAVIT 
EFRPHIAVIT 
EFRPHIAVIT 
EFRPHIAVIT 
EFRPHIAVIT 
EFRPHIAVIT 



200 

NLMPTHLDYH 
NLMPTHLDYH 
NLMPTHLDYH 
NLMPTHLDYH 
NLMPTHLDYH 
NLMPTHLDYH 
NLMPTHLDYH 
NLMPTHLDYH 
NLMPTHLDYH 
NLMPTHLDYH 
NLMPTHLDYH 
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WO 2004/018646 



PCT/US2003/026827 



Table 67: Comparative Sequences relating t SAG0475 



msa25243 .2{305_18RS21] 
msa25243 .2{305_2603 
msa25243.2{305_JM9130013 
ma a25243. 2{305_COHl] 
maa25243 . 2 { 305 J4732 
msa25243 . 2 { 305J4781 
msa2 52 4 3 . 2 { 3 05_1 1 6 9NT 
msa2 5 2 43 . 2 { 3 0 5_A9 0 9 
tnsa2 5243 . 2 { 3 0 5_CJB1 10 
rosa25243.2{305_090 t 
msa2 5243 . 2 { 3 05_H3 6B ] 
Consensus 



201 

GSPEdYVAAK 
GSFEdYVAAK 
GSPEdYVAAK 
GSFEdYVAAK 
GSFEdYVAAK 
GSFEdYVAAK 
GSFEdYVAAK 
GSFEdYVAAK 
GSFEeYVAAK 
GSFEdYVAAK 
GSFEdYVAAK 



WNIQNQMSSS 
WNIQNQMSSS 
WNIQNQMSSS 
WNIQNQMSSS 
WNIQNQMSSS 
WNIQNQMSSS 
WNIQNQMSSS 
WNIQNQMSSS 
WNIQNQMSSS 
WNIQNQMSSS 
WNIQNQMSSS 



DFIiVLNFNQG 
DFLVLNFNQG 
DFLVLNFNQG 
DFLVLNFNQG 
DFLVLNFNQG 
DFLVLNFNQG 
DFLVLNFNQG 
DFLVLNFNQG 
DFLVLNFNQG 
DFLVLNFNQG 
DFLVLNFNQG 



ISKELAKTTK 
ISKELAKTTK 
ISKELAKTTK 
ISKELAKTTK 
ISKELAKTTK 
ISKELAKTTK 
ISKELAKTTK 
ISKELAKTTK 
ISKELAKTTK 
ISKELAKTTK 
ISKELAKTTK 



250 

ATIVPFSTTE 
ATIVPFSTTE 
ATIVPFSTTE 
ATIVPFSTTE 
ATIVPFSTTE 
ATIVPFSTTE 
ATIVPFSTTE 
ATIVPFSTTE 
ATIVPF STTE 
ATIVPFSTTE 
ATIVPFSTTE 



msa25243.2{305_18RS21 
msa25243.2{305_2603 
msa25243 . 2 { 305_JM913 0013 
msa25243.2f305_COHl 
msa25243.2{305 M732 
msa25243.2{305~M781 
msa25243.2{305_1169NT 
msa25243.2{305_A909 
msa2 5243 . 2 { 3 05_CJB110 
msa25243.2{305_090 
maa2 5 24 3 . 2 { 3 0 5_H3 6B 
Consensus 



251 

KVDGAYVQDK 
KVDGAYVQDK 
KVDGAYVQDK 
KVDGAYVQDK 
KVDGAYVQDK 
KVDGAYVQDK 
KVDGAYVQDK 
KVDGAYVQDK 
KVDGAYVQDK 
KVDGAYVQDK 
KVDGAYVQDK 



QLFYKGBNIM 
QLFYKGENIM 
QLFYKGBNIM 
QLFYKGENIM 
QLFYKGENIM 
QLFYKGENIM 
QLFYKGENIM 
QLFYKGENIM 
QLFYKGENIM 
QLFYKGENIM 
QLFYKGENIM 



SVDDIGVPGS 
sVDDIGVPGS 
SVDDIGVPGS 
SVDDIGVPGS 
sVDDIGVPGS 
SVDDIGVPGS 
SVDDIGVPGS 
SVDDIGVPGS 
1VDDIGVPGS 
1VDDIGVPGS 
sVDDIGVPGS 



HNVeNALATI 
HNVeNALATI 
HNVeNALATI 
HNVeNALATI 
HNVeNALATI 
HNVeNALATI 
HNVeNALATI 
HNVxNALATI 
HNVeNALATI 
HNVeNALATI 
HNVeNALATI 



300 

AVAKLAGISN 
AVAKLAGISN 
AVAKLAGISN 
AVAKLAGISN 
AVAKLAGISN 
AVAKLAGISN 
AVAKLAGISN 
AVAKLAGISN 
AVAKLAGISN 
AVAKLAGISN 
AVAKLAGISN 



msa25243.2{305_18RS21 
msa25243 . 2 { 305_2603 
msa25243 . 2 {305_JM91300X3 
moa25243.2(305_COHl 
msa25243 . 2 (305_M732 
msa25243 .2{305_M781 
msa25243.2{3 05_1169NT 
msa25243 . 2 { 305_A909 
msa25243 . 2 { 305_CJB110 
msa25243 . 2 { 305_090 
msa25243 . 2 { 3 05_H3 6B' 
Consensus 



301 

QVIRETLSNF 
QVIRETLSNF 
QVIRETLSNF 
QVIRETLSNF 
QVIRETLSNF 
QVIRETLSNF 
QVIRETLSNF 
QVIRETLSNF 
QVIRETLSNF 
QVIRETLSNF 
QVIRETLSNF 



GGVKHRLQSL 
GGVKHRLQSL 
GGVKHRLQSL 
GGVKHRLQSL 
GGVKHRLQSL 
GGVKHRLQSL 
GGVKHRLQSL 
GGVKHRLQSL 
GGVKHRLQSL 
GGVKHRLQSL 
GGVKHRLQSL 



GKVHGISFYN 
GKVHGISFYN 
GKVHGISFYN 
GKVHGISFYN 
GKVHGISFYN 
GKVHGISFYN 
GKVHGISFYN 
GKVHGISFYN 
GKVHGISFYN 
GKVHGISFYN 
GKVHGISFYN 



DSKstnilat 
DSKstnilat 
DSKstnilat 
DSKstnilat 
DSKstnilat 
DSKstnilat 
DSKstnilat 
DSKstnilat 
DSKstnilat 
DSKstnilat 
DSK 



350 

qkalsgfdnt 
qkalsgfdnt 
qkalsgfdnt 
qkalsgfdnt 
qkalsgfdnt 
qkalsgfdnt 
qkalsgfdnt 
qkalsgfdnt 
qkalsgfdnt 
qkalsgfdnt 



msa25243.2{305_18RS21 
msa25243 . 2 {305_2603 
msa25243.2{305_JM9130013 
msa25243 .2(305_COH1 
msa25243.2J305_M732 
msa25243.2{305_M781 
msa25243.2{305_1169NT 
rasa2 5243 . 2 { 3 0S_A909 
msa25243 . 2 {305_CJB110 
msa25243 .2{305_090 
msa25 243 . 2 { 3 0 5_H3 6B J 
Consensus 



351 

kviliaggld 
kviliaggld 
kviliaggld 
kviliaggld 
kviliaggld 
kviliaggld 
kviliaggld 
kviliaggld 
kviliaggld 
kviliaggld 



rgnefdelip 
rgnefdelip 
rsnefdelip 
rgnefdelip 
rgnefdelip 
rgnefdelip 
rgnefdelip 
rgnefdelip 
rgnefdelip 
rgnefdelip 



ditglkhmw 
ditglkhmw 
ditglkhmw 
ditglkhmw 
ditglkhmw 
ditglkhmw 
ditglkhmw 
ditglkhmw 
ditglkhmw 
ditglkhmw 



lgesasrvkr 
lgesasrvkr 
lgesasrvkr 
lgesasrvkr 
lgesasrvkr 
lgesasrvkr 
lgesasrvkr 
lgesasrvkr 
lgesasrvkr 
lgesasrvkr 



400 

aaqkagvtys 
aaqkagvtys 
aaqkagvtys 
aaqkagvtys 
aaqkagvtys 
aaqkagvtys 
aaqkagvtys 
aaqkagvtys 
aaqkagvtys 
aaqkagvtys 



msa25243.2{30S 18RS21' 
msa25243 . 2 { 305_2603 
msa25243 . 2 {305_JM9130013 
ms a2 524 3.2(30 5_COHl 
msa25243 .2< 305_M732 
msa25243.2{305_M78l' 
msa25243.2{305_1169NT' 
msa25243 .2{305_A909 
ms a2 5243 . 2 { 3 0 5_CJB1 1 0 
msa25243.2{305_090 
msa25243.2{305_H36B 
Consensus 



401 

daldvrdavh 
daldvrdavh 
daldvrdavh 
daldvrdavh 
daldvrdavh 
daldvrdavh 
naldvrdavh 
daldvrdavh 
daldvrdavh 
daldvrdavh 



kayevaqqgd 
kayevaqqgd 
kayevaqqgd 
kayevaqqgd 
kayevaqqgd 
kayevaqqgd 
kayevaqqgd 
kayevaqqgd 
kayevaqqgd 
kayevaqqgd 



villspanas 
vi 11 sp anas 
villspanas 
villspanas 
villspanas 
villspanas 
vilxspanas 
villspanas 
villspanas 
villspanas 



wdmyknfevr 
wdmyknfevr 
wdmyknfevr 
wdmyknfevr 
wdmyknfevr 
wdmyknfevr 
wdmyknfevr 
wdmyknfevr 
wdmyknfevr 
wdmyknfevr 



450 

gdef idtfes 
gdefidtfes 
gdef idtfes 
gdefidtfe- 
gdef idtfes 
gdefidtfes 
gdef id tf — 
gdefidtfes 
gdefidtfes 
gdefidtfes 



msa25243.2{305_18RS2i; 
msa25243 . 2 {305_2603 
tnsa25243.2{305_JM9130013 
msa25243 .2{305_COH1 
msa25243.2{305 - M732 
msa25243.2{305_M781 
msa25243 . 2 {305_1169NT 
msa25243.2{305_A909 
msa25243. 2(305 CJB110 
msa25243.2{305 090 
tnsa25243.2{30S_H36B 
Consensus 



451 
lrge 
lrge 
lrge 

lrge 
lrge 

lrge 
lrge 
lrge 



978 



WO 2004/018646 PCT/US2003/026827 
Table 68: Comparative Sequences relating to SAG 0499 



SEQ ID NO. 6801 
STRAIN. 2603 

ATGGCTAAAGAGAGGCTAGATGTTCTT 

CAAG CGAAACGTGGTCTTATGGCAGGAATGGTGATTAACGTTATCAAT^ 

GATAAACCAGGTGAAAAGGTTGCAGACGATACTGAATTAAAACTAAAAGGTGAAAAA 

AAATATGTTAGTAGAGGTGGATTGAAATTAGAAAAAGCTT^ 

GTTGCaGATAAGCTAAC TATA GATATTGGCGC CTCTACXX3GTGGTTTTACTGATGTTATG 

CTACAATCAGGAGCGCGTTTAGTTTACXKAGTAGATGTAG^ 

AAGTTACGTCAGGATCAT03TGTTCGTTCTATGG 

AAAGAAGATTTCAAGGAGGGJVCTGCCTGAATTTC 

CTTAATTTGATTTTACCAGCTCT^ 

TTAATTAAACCACAATTTGAAGCAGGTCGTGAGCAAATTGGTAA 
GACAAGTTGGTTCATGAAAAGGTTTTGACAA 

TATACGGTTAAACATC7TTGATTTTTCGCC CATTCAAGGTGGACATGGAAATATTGAGTTT 

TTAATGCATTTGCAAAAGTGTCAAGATCCACAAA^ 

GTTATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 



SEQ ID NO. 6802 
STRAIN 090 

GCTAAAGAGAGGGTAGATGTTCTTGCCT 

ATAAACAGGGACTTTTTGATACACGAGAG CAAGCGAAACGTGGTGTT ATG 

GCAGGAATGGTGA3TAACGTTATCAATGGAGAACGTTATGATAAACCAGG 

TGAAAAGGTT<XZAGACGATACTGAATTAAAACTAAAAGGT^ 

AATATGTTAGTAGAGGTGGATTGAAATTAGAAAAAGCrTTACAAGTITT^ 

GAAATTTCAGTTG CAGATAAG CTAACTATAGATATTGG CGCCTCTACGGG 

TGGTTTTACTGATCTTATGCTACAATCAG 

TAGATGTAGGAACAAATCAATTAGTTTGGAAGTTACGTCAGG^ 

GTTC<3TTCTATGGAACAATATAATTTTAGGTATGCCCAAAAAaAAGAT^ 

CAAGGAGGGACTGCCTOAATTTGCATCG^ 

TTAATTTGATTTTACCAGCTCTAAAAGAAATTTTACT 

GTAGTGGCATTAATTAAACCACAATTTGAAGCAGGTCGTG^ 

TAAAAATGGTATTGTCAAAGAJCAAGTTGGTTCATGAAAAGG 

CAGTG ACCAATTTCACXSAAAGATTATGGATATACGG 

ITTTaSCCCATTCAAGGTGGACATGGAAATATTGAGTT^ 

TTATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 

SEQ ID NO. 6803 
STRAIN A909 

GCTAAAGAGAGGGTAGATGTTCTTGCCTA 

TAAACAGGGACTTTTTGATACACGAGAGCAAG CGAAACGTGGTGTTATGG 

CAGGAATGGTGATTAACGTTATCAATGGAGAACXSTTAT^ 

GAAAAGGTTGCAGACGATACrrcAATTAAAACTAAAAG 

ATATGTTAGTAGAGGTGGATTGAAATTAGAAAAAGCTTTACAAGT^^ 

AAATTTCAGTTGCAQATAAGCTAACTATAGATATTGGCGCCT 

GGTITTACTGATGTTATGCTACAATCAGGAGCGC<3TTTAGTTTAC^ 

AGATGTAGGAACAAATCAATTAGTTTGGAAGTTACGTCAG 

TTCGTTCTATGGAACAATATAATTTTAGGTATGCCCAAAAAGAAGA^ 

AAGGAGGGACTGCCTGAATTTGCATCGATAGATGTCT 

TAATTTGATTTTACCAGCTCTAAAAGAAA^ 

TAGTGGCATTAATTAAA(X!ACAATTTGAAGC^ 

AAAAATGGTATTGTCAAAGACAAGTTGGTTCATGAAAAGGT^ 

AG^GACCAATTTCACGAAAGATTATGGATATAGGGTTAA^ 

TTTCGCCC^TTCAAGGTGGACATGGAAATATTG^ 

CAAAAGTGTCAAGATCCACAAAATCTTGTGCTTGAC 

TATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG ' 

SEQ ID NO. 6804 
STRAIN H36B 

GCTAAAGAGAGGGTAGATGTTCTTG CCTATAAACAGG 
GACITTTTGATACACXaAGAGCAAGCGAA^ 

GTGATTAACGTTATCAATGGAGAAC<nTATGATAAACCAGGTGAAAAGGT 

TGCAGACGATACTGAATTAAAACTAAAAGGTGAAAAACTAAAA^ 

GTAGAGGTGGATTGAAATTAGAAAAAGCTTTACAAGTTTTTGAAA 

GTTG CAGATAAG CTAACTATAGATATTGGCGCCTCTACGGGT^ 

TGATCTTATGCTACAATCAGGAGCGC^ 

GAACAAATCAATTAGTTTGGAAGTTACXn*C!^^ 

ATGGAACAATATAATTTTAGGTATGCCCAAAA 

ACnX3CCTGUUVITTGCATOGATAGATGTCTCATTO 

TTTTACCAGCTCTAAAAGAAATTTTAGTG 

TTAATTAAACCACAATTTGAAGCAGGTCXjTGAG CAAATTGGTAAAAATGG 

TATTGTCAAAGACAAGTTGGTrCATGAAAAGGTT^ 

ATTTCACXIAAAGATTATGGATATACGGTTAA^ 

ATTCAAGGTGGACATGGAAATATTGAGTTTT^ 

TCAAGATCCACAAAATCTTGTGCTTGACCAAA 

AAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 



SEQ ID HO. 6805 
STRAIN 18RS21 

TAAACAGGGACTTTTTGATACACGAGAGCAAGCGAA^ 
a\GGAATGGTGATTAACGTTATCAATGGAGA^ 
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WO 2004/018646 



PCT7US2003/026827 



Table 68: Comparative Sequences relating to SAG 0499 



GAAAAGGTTGCAGACX3ATACTGAATTAAAACTAAAAGGTGAAAAA 

ATATGTTAGTAGAGGTGGATTGA7VATTAGAAAAAG CTTTACAAGTTTTTG 

AAATTTCAGTTGCAGATAAGCTAACT 

GGTTTTACTGATGTTATGCTAGAATCAGGAGC^ 

AGATGTAGGAACAAATCAATTAGTTTGGAAGTTACGTCAGGAT^ 

TT03TTCrrATGGAACAATATAATTTTAGGTATC 

AAGGAGGGACTpCCTCAATTTGCATCGATAGATOT 

TAATTTGATTTTACCAGCTCrAAAAGAAATTTTAGTGGAT 

TAGTGGCATTAATTAAACCACAATTTGAAG C^GGTCGTG AGCAAATTGGT 

AAAAATGGTATTGTCAAAGACAAGTTGCTTCATGA 

AGTGACCAATTTCACGAAAGATTATGGATA 

TTTCGCCCATTCAAGGTGQACATGGAAATATTGAGTTTT^ 

CAAAAGTGTCAAGATCC^CAAAATCTT^ 

TATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 

SEQ ZD NO. 6806 
STRAIN M732 

GCTAAAGAGAGGGTAGATGTTCTTGCCTA 

TAAACAGGGACTTTTTGATACACGAGAGCAAGCGAAACG^ 

CAGGACTGGTGATTAACGTTATCAATGGAGAACGTTATGATAAA 

GAAAAGGTTGCAGACGATACTGAATTAAAACTAAAAGGTGAAAAACTA 

ATATGTTAGTAGAGGTGGATTGAAATTAQAAAAAGCTTTAC^ 

AAATTTCAGTTGCAGATAAGCTAACTATAGATATTGGCX3CCT 

GGTTTTACTGATGTTATGCTACAATCAGGAGC<3CGTTTAGT^ 

AGATGTAGGAACAAATCAATTACTTTGGAAGTTAC^ 

TTCGTTCTATGGAACAATATAATTTTAGGTATGCCCAAAAAGAAGATTTC 

AAGGAGGGACTGCCTGAATTTGC^TCX^TAGATGTCTCATTTATCT 

TAATTTGATTTTACCAG CTCIAAAAGAAATTTTAGTGGATGGTGGACAAG 

TAGTGGCATTAATTAAACCACAATTTGAAGCAGCTC^ 

AAAAATGGTATTGTCAAAGACAAGTTGGTTCATGAAAAGGT^ 

AGTGACCAATTTCACGAAAGATTATGGATATAaSGTTAAAC^ 

TTTCGCCCGTTCAAGGTGGACATGGAAATAT^ 

TATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 

SEQ ZD NO. 6807 
STRAIN COHI 

GCTAAAGAGAGGGTAGATGTTCTTGCCT 

ATAAACAGGGACITTTTGATACACGAGAGC^ ' 

GCAGGACTGGTGATTAACGTTATC^TGGAGAACXnTATGATAAACC^ 

CGAAAAGGTTGCAGACGATACTGAATTAAAACTAAAAGGTGA 

AATATGTTAGTAGAGGTGGATTGAAATTAGAAAAAGCTTT^ 

GA AATTT CAGTTGCAGATAAGCTAACrATAGATATTGGCG 

TGGTTTTACTGATGTTATGCTACAATCAGGAG CGCX3TTTAGTTTACGCAG 

TAGATGTAGGAACAAATCAATTAGTTTGGAAGTTACGTCAGGA^ 

GTTCGTTCTATGGAACAATATAATTTrAGGTATGCC^ 

C3VAGGAGGGACTGCCTGAATTTCC 

TTAATTTGATTTTACCAGCTCTAAAAGAAATTTTAGTGGATG^ * 

GTAGTGGCATTAATTAAACCAaVATTTGAAGOUSGT 

TAAAAATGGTATTGTCAAAGACMGTTGGTTCATGAAAA 

CAGTG ACCAATTTCACGAAAGATTATGGATA^ 

TTTTCGCa^TTCAAGGTGGACATGGAAATATTGAG"rri 

GCAAAAGTGTCAAGATCCACAAAATCITGTGCT 

TTATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 

SEQ ZD NO. 6808 
STRAIN M781 

GCTAAAGAGAGGGTAGATGTTCTTGCCT 

ATAAACAGGGACTTTTTGATACACGAGAG 

GCAGGACTGGTGATTAACX5TTATCAATGGAGAACX3 

OGAAAAGGTTCCAGACXIATACTGAATTAAAACTAAAAG 

AATATGTTAGTAGAGGTGGATTGAAATTAGAAAAAGCTT^ 

GAAATTTCAGTTGCAGATAAGCTAACTATAGAT^ 

TGGTTTTACTGATGTTATGCTACAATCAGGA CAG 
TAGATGTAGGAACAAATCAATTAGTTTG^ 

GTTCGTTCTATGGAACAATATAATTTTAGGTATG CCCAAAAAGAAGATTT 

CAAG GAGGGACTGC CTOAATTTGCATCGA 

TTAATTTGATTTTACCAGCTCTAAAAGAAATT^ 

GTAGTGGCATTAATTAAACCACAATTTGAAG^ 

TAAAAATGGTATTGTCAAAGACAAGTTGGTTCATGAAAAGC 

CAGTGACCAATTrCACGA 

TTTTCGCCCGTTCAAGGTGGACATGGAAATATTGA 
GCAAAAGTGTCAAGATCCACAAAATCTTGTGCT^ 
TTATAGAAAAAG CACATAAGGAATTTAAGAAAAATGAAGAAGAG 

SEQ ZD NO* 6809 

STRAIN CJBl 10 

GCTAAAGAGAGGGTAGATGTTCTTGCCTA 

TAAACAGGGACTTTTTGATACAC 

(ZAGGAATGGTGATTAACGTTATCAATGGAGAAC^ 

GAAAAGGTTGCAGACGATACTGAATTAAAACrAA 

AT ATCTT A GTAG AGOTGGATTO 

AAATTTCAGTTGCAGATAAGCTAACTATAGATATTGGCGCCT 
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GGTTTTACTGATGTTATGCTACAATCAGGAGC^ 
AGA TGTA GGAACAAATCAATTAGTTTGGAAGTTA 

TTCGTTCTATGGAAC^TATAATTTTAGGTATGCCCAAAAAGAAGATITC 

AAGGAGGQACTGCCTGAATTTG CATCX^TAGATGTCTC^TTTATCTCTCT 

TAATTTGATTTTACCAGCTCTAAAAGAAATTTTA^ 

TAGTGGCATTAATTAAACCACAATTTGAAGCAGCT 

AAAAATGGTATTGTCAAAGACAAGTTGGTTCATGAAAAGGTT^ 

AGT GACCAATTTCACGAAAGATTATGGATATACXffi 

TTTCG CC CATTCAAGGTGGACATGG AAAT ATTGAGTTTTTAATG CATTTG 
CAAAAGTGT CAAGATCCACAAAATCTTGTGCTTGACCAAATACAAGATGT 
TATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 

SEQ ID NO. 6810 
STRAIN 1 169NT 

GCTAAAGAGA GGGTAGA TGTTCTTGCCTA 

TAAACAGGGACTTTTTGATACACGAGAGCAAGCGAAACGTGGTG^ 

CAGGACTCGTGATTAACGTTATCAATGG C 

GAAAAGGTTGCAGACGATACTGAATTAAAACTAAAAGGTGAAAAACTAAA 

AT ATGTTAGTAG AGGTGGATTGAAATTAGAAAAAGC^ 

AAATTTCAGTTGCAGATAAGCTAACTATAGATATTGG CG CCTCTACGGGT 

GGTTTTACTQATGTTATGCTACAATCAGGAGCGCGTTTAGT^ 

AGATGTAGGAA'CAAATCAATTAGTTTGGAAGT^ 

TTCGTTCTATGGAAC^TATAATTTTAGGTATGCCCAAAA 

AAGGAGGGACTGCCTGAATTTG CATCGATAGATGTCTCATTTATCTCTCT 

TAATTTGATTTTGCCAGCTCTAAAAGAAATTTTAGTGGA 

TAGTGG CATTAATTAAACCACAATTTGAAG CAGGTCGTGAGCAAATTGGT 

AAAAATGGTATTGTCAAAGACAAGTTGGTTCATGAAAAGGTTTTGA 

AGTGAGCAATTTCAOGAAAGATTATGGATATACXaGTT^ 

TTTCGCCC^TTCAAGGTGGACATGGAAAT^^ 

CAAAAGTGTCAAGATCCACAAAATCTTGrTCCT^ 

TATAGAAAAAGCACATAAGGAAOTTAAGAAAAATGAAGAAGAG 

SEQ ID NO. 6811 
STRAIN JM9 130013 

GCTAAAGAGAGGGTAGATGTTCTTGCCTA 

TAAACAGGGACTTTTTGATACACGAGAGCAA 

CAGGAATGGTGATTAACGTTATCAATGGAGAACGT^^ 

GAAAAGGTTGCAGACGATACTGAATTAAAACTAAAAGGTGAAAAACT 

ATATGTTAGTAGAGGTGGATTGAAATTAQAAAAAGCTTTACAAG 

AAAT^TCAGTTXSCAGATAAGCTAACTATAGA 

GGTTTTACTGATGTTATGCTACAAT(^ 

AGATGTAGGAACAAATCAATTAGTTTGGAAG 

TTCGTTCTATGGAACAATATAATTTTAGGTATGC^ 

AAGGAGGG ACTG CCnX3AATTTGCIATCGATAGATGTCT 

TAATTTGATTTTACCAGCTCTAAAAGAAAT^ 

TAGTGGCATTAATTAAACCACAATTTGAAGCAG^ 

AAAAATGGTATTGTCAAAGACAAGTTGGTTCATGAAA 

AGTGACCAATTTCA(TGAAAGATTATGGAT^ 

TTTCGCCCATTCAAGGTGGACATGGAAATATTGAGTT^ 

CAAAAGTGTCAAGATCXIACAAAATCTTGTG 

TATAGAAAAAGCACATAAGGAATTTAAGAAAAATGAAGAAGAG 



PRETTY of: /biotrap/msa236683 . 2 { * } May 14, 2003 02:57 



msa236683 .2{310_090 
msa236683.2{310 18RS21 
msa2 3 6683 .2(310 2603 
msa236683.2{310JV909 
msa236683 . 2 { 310_CJB110 
msa2 3 66 8 3 . 2 { 3 10_H3 6B 
msa236683 .2{310_JM9130013 
msa2 36683 . 2 ( 3 10_COH1 
msa236683.2<310 M732 
rasa236683.2(310~M781 
maa236683 ,2{310_1169NT 
Consensus 



GCTAAAG 

GCTAAAG 

atgGCTAAAG 

GCTAAAG 

GCTAAAG 

GCTAAAG 

GCTAAAG 

GCTAAAG 

GCTAAAG 

GCTAAAG 

GCTAAAG 



AGAGGGTAGA 
AGAGGGTAGA 
AGAGGGTAGA 
AGAGGGTAGA 
AGAGGGTAGA 
AGAGGGTAGA 
AGAGGGTAGA 
AGAGGGTAGA 
AGAGGGTAGA 
AGAGGGTAGA 
AGAGGGTAGA 



TGTTCTTGCC 
TGTTCTTGCC 
TGTTCTTGCC 
TGTTCTTGCC 
TGTTCTTGCC 
TGTTCTTGCC 
TGTTCTTGCC 
TGTTCTTGCC 
TGTT CTT GCC 
TGTTCTTGCC 
TGTTCTTGCC 



TATAAACAGG 
TATAAACAGG 
TATAAACAGG 
TATAAACAGG 
TATAAACAGG 
TATAAACAGG 
TATAAACAGG 
TATAAACAGG 
TATAAACAGG 
TATAAACAGG 
TATAAACAGG 



50 

GACTTTTTGA 
GACTTTTTGA 
GACTTTTTGA 
GACTTTTTGA 
GACTTTTTGA 
GACTTTTTGA 
GACTTTTTGA 
GACTTTTTGA 
GACTTTTTGA 
GACTTTTTGA 
GACTTTTTGA 



msa2 3 66 8 3 . 2 { 3 10_0 9 0 
msa236683.2{310_18RS21 
msa2 36683 .2f 310_2 603 
rosa2 3 6 6 8 3 . 2 { 3 1 0_A9 0 9 
msa236683 .2 {310_CJB110 
msa236683.2{310 H36B 
msa236683.2{310 JM9130013 
msa236683.2(310_COHl 
msa236683.2<310_M732 
msa236683 .2{310_M781 
mea236683 . 2 { 310_1169NT 
Consensus 



51 

TACACGAGAG 
TACACGAGAG 
TACACGAGAG 
TACACGAGAG 
TACACGAGAG 
TACACGAGAG 
TACACGAGAG 
TACACGAGAG 
TACACGAGAG 
TACACGAGAG 
TACACGAGAG 



CAAGCGAAAC 
CAAGCGAAAC 
CAAGCGAAAC 
CAAGCGAAAC 
CAAGCGAAAC 
CAAGCGAAAC 
CAAGCGAAAC 
CAAGCGAAAC 
CAAGCGAAAC 
CAAGCGAAAC 
CAAGCGAAAC 



GTGGTGTTAT 
GTGGTGTTAT 
GTGGTGTTAT 
GTGGTGTTAT 
GTGGTGTTAT 
GTGGTGTTAT 
GTGGTGTTAT 
GTGGTGTTAT 
GTGGTGTTAT 
GTGGTGTTAT 
GTGGTGTTAT 



GGCAGGAaTG 
GGCAGGAaTG 
GGCAGGAaTG 
GGCAGGAaTG 
GGCAGGAaTG 
GGCAGGAaTG 
GGCAGGAaTG 
GGCAGGAcTG 
GGCAGGAcTG 
GGCAGGAcTG 
GGCAGGAcTG 



100 

GTGATTAACG 
GTGATTAACG 
GTGATTAACG 
GTGATTAACG 
GTGATTAACG 
GTGATTAACG 
GTGATTAACG 
GTGATTAACG 
GTGATTAACG 
GTGATTAACG 
GTGATTAACG 
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msa236683 .2{310_090 
msa236683.2{310_18RS21 • 
msa236683 .2{310_2603 
msa236683 .2{310_A909 
msa2 3 66 83 . 2 { 3 1 0_CJB1 1 0 ' 
maa236683 .2{310_H36B' 
msa236683.2{310_JM9130013 - 
tnsa236683 -2(310 COH1 
msa236683 .2<310~M732 
msa236683 .2{3103l781 > 
msa236683.2(310_1169NT} 
Consensus 



msa236683.2{310_090 
msa236683.2{310_18RS21 ) 
rasa236683.2{310_2603 \ 
msa236683 . 2 { 31O_A909> 
msa2 3 66 83. 2 (310__CJB1 10 > 
msa236683 . 2 {310_H36B> 
msa236683 .2(310 JM9130013> 
rasa236683.2{310_COHl 
tnsa236683.2(310_M732 
msa236683.2{310_M781 
msa236683.2{310_1169NT 
Consensus 



msa2 36683 . 2 { 310_090 [ 
msa236683 . 2 { 310_18RS21 
msa236683 . 2 ( 310_2603 
msa236683 .2(310 A909 
msa236683 . 2 { 3 10_CJB110 
ras a23 668 3 . 2 { 3 1 0_H3 6B 
tnsa236683.2{310_JM913O013 
msa236683.2{310 COH1 
msa236683 . 2 { 310_M732 
rasa236683.2(310_M781 ) 
msa236683.2{310_1169NTj 
Consensus 



msa236683 . 2 {310_090 
msa236683 . 2 { 310_18RS21 
msa236683.2{310_2603 
msa236683 . 2 { 310_A909 
msa236683 . 2 { 310_CJB110 
msa23 6683 . 2 { 3 10_H3 6B ' 
msa236683 . 2 { 310_JM9130013 
msa236683 . 2 { 310^COH1 
msa236683 .2{310_M732 
msa236683. 2(310 M781 
msa236683 . 2 { 310_1169NT^ 
Consensus 



msa236683.2{310_090 
msa236683.2{310_18RS21 
msa236683 .2(310 2603 
msa236683 ,2{310_A909 f 
msa236683 . 2 {310_CJB110 
msa236683 .2{310_H36B '> 
msa236683.2{310_JM9130013 > 
tnsa236683.2(310_COHl ) 
msa236683 .2(310_M732 
msa236683.2(310_M781 
msa236683 .2 ( 310_1169NT 
Consensus 



msa236683.2{310_090 
msa236683.2{310_16RS21 
msa236683 . 2 { 310_2603 
msa236683 .2(310_A909 
msa236683 . 2 { 310_CJB110 
msa236683.2{310 H36B f 
msa2 3 6683 . 2 { 3 1 0_JM9 13 0 01 3 ) 
msa236683.2(310_COHl 
msa236683.2{310_M732 
msa236683.2(310_M781 
msa236683 . 2 { 310_1169NT; 

Consensus 



101 150 
TTATCAATGG AGAACGTTAT GATAAACCAG GtGAAAAGGT TGCAGAC6AT 
TTATCAATGG AGAACGTTAT GATAAACCAG GtGAAAAGGT TGCAGACGAT 
TTATCAATGG AGAACGTTAT GATAAACCAG GtGAAAAGGT TGCAGACGAT 
TTATCAATGG AGAACGTTAT GATAAACCAG GtGAAAAGGT TGCAGACGAT 
TTATCAATGG AGAACGTTAT GATAAACCAG GtGAAAAGGT TGCAGACGAT 
TTATCAATGG AGAACGTTAT GATAAACCAG GtGAAAAGGT TGCAGACGAT 
TTATCAATGG AGAACGTTAT GATAAACCAG GtGAAAAGGT TGCAGACGAT 
TTATCAATGG AGAACGTTAT GATAAACCAG GcGAAAAGGT TGCAGACGAT 
TTATCAATGG AGAACGTTAT GATAAACCAG GcGAAAAGGT TGCAGACGAT 
TTATCAATGG AGAACGTTAT GATAAACCAG GcGAAAAGGT TGCAGACGAT 
TTATCAATGG AGAACGTTAT GATAAACCAG GcGAAAAGGT TGCAGACGAT 



151 200 
ACTGAATTAA AACTAAAAGG TGAAAAACTA AAATATGTTA GTAGAGGTGG 
ACTGAATTAA AACTAAAAGG TGAAAAACTA AAATATGTTA GTAGAGGTGG 
ACTGAATTAA AACTAAAAGG TGAAAAACTA AAATATGTTA GTAGAGGTGG 
ACTGAATTAA AACTAAAAGG TGAAAAACTA AAATATGTTA GTAGAGGTGG 
ACTGAATTAA AACTAAAAGG TGAAAAACTA AAATATGTTA GTAGAGGTGG 
ACTGAATTAA AACTAAAAGG TGAAAAACTA AAATATGTTA GTAGAGGTGG 
ACTGAATTAA AACTAAAAGG TGAAAAACTA AAATATGTTA GTAGAGGTGG 
ACTGAATTAA AACTAAAAGG TGAAAAACTA AAATATGTTA GTAGAGGTGG 
ACTGAATTAA AACTAAAAGG TGAAAAACTA AAATATGTTA GTAGAGGTGG 
ACTGAATTAA AACTAAAAGG TGAAAAACTA AAATATGTTA GTAGAGGTGG 
ACTGAATTAA AACTAAAAGG TGAAAAACTA AAATATGTTA GTAGAGGTGG 



201 250 
ATTGAAATTA GAAAAAGCTT TACAAGTTTT TGAAATTTCA GTTGCAGATA 
ATTGAAATTA GAAAAAGCTT TACAAGTTTT TGAAATTTCA GTTGCAGATA 
ATTGAAATTA GAAAAAGCTT TACAAGTTTT TGAAATTTCA GTTGCAGATA 
ATTGAAATTA GAAAAAGCTT TACAAGTTTT TGAAATTTCA GTTGCAGATA 
ATTGAAATTA GAAAAAGCTT TACAAGTTTT TGAAATTTCA GTTGCAGATA 
ATTGAAATTA GAAAAAGCTT TACAAGTTTT TGAAATTTCA GTTGCAGATA 
ATTGAAATTA GAAAAAGCTT TACAAGTTTT TGAAATTTCA GTTGCAGATA 
ATTGAAATTA GAAAAAGCTT TACAAGTTTT TGAAATTTCA GTTGCAGATA 
ATTGAAATTA GAAAAAGCTT TACAAGTTTT TGAAATTTCA GTTGCAGATA 
ATTGAAATTA GAAAAAGCTT TACAAGTTTT TGAAATTTCA GTTGCAGATA 
ATTGAAATTA GAAAAAGCTT TACAAGTTTT TGAAATTTCA GTTGCAGATA 



251 300 
AGCTAACTAT AGATATTGGC GCCTCTACGG GTGGTTTTAC TGATGTTATG 
AGCTAACTAT AGATATTGGC GCCTCTACGG GTGGTTTTAC TGATGTTATG 
AGCTAACTAT AGATATTGGC GCCTCTACGG GTGGTTTTAC TGATGTTATG 
AGCTAACTAT AGATATTGGC GCCTCTACGG GTGGTTTTAC TGATGTTATG 
AGCTAACTAT AGATATTGGC GCCTCTACGG GTGGTTTTAC TGATGTTATG 
AGCTAACTAT AGATATTGGC GCCTCTACGG GTGGTTTTAC TGATGTTATG 
AGCTAACTAT AGATATTGGC GCCTCTACGG GTGGTTTTAC TGATGTTATG 
AGCTAACTAT AGATATTGGC GCCTCTACGG GTGGTTTTAC TGATGTTATG 
AGCTAACTAT AGATATTGGC GCCTCTACGG GTGGTTTTAC TGATGTTATG 
AGCTAACTAT AGATATTGGC. GCCTCTACGG GTGGTTTTAC TGATGTTATG 
AGCTAACTAT AGATATTGGC GCCTCTACGG GTGGTTTTAC TGATGTTATG 



301 . 350 

CTACAATCAG GAGCGCGTTT AGTTTACGCA GTAGATGTAG GAACAAATCA 
CTACAATCAG GAGCGCGTTT AGTTTACGCA GTAGATGTAG GAACAAATCA 
CTACAATCAG GAGCGCGTTT AGTTTACGCA GTAGATGTAG GAACAAATCA 
CTACAATCAG GAGCGCGTTT AGTTTACGCA GTAGATGTAG GAACAAATCA 
CTACAATCAG GAGCGCGTTT AGTTTACGCA GTAGATGTAG GAACAAATCA 
CTACAATCAG GAGCGCGTTT AGTTTACGCA GTAGATGTAG GAACAAATCA 
CTACAATCAG GAGCGCGTTT AGTTTACGCA GTAGATGTAG GAACAAATCA 
CTACAATCAG GAGCGCGTTT AGTTTACGCA GTAGATGTAG GAACAAATCA 
CTACAATCAG GAGCGCGTTT AGTTTACGCA GTAGATGTAG GAACAAATCA 
CTACAATCAG GAGCGCGTTT AGTTTACGCA GTAGATGTAG GAACAAATCA 
CTACAATCAG GAGCGCGTTT AGTTTACGCA GTAGATGTAG GAACAAATCA 



351 400 
ATTAGTTTGG AAGTTACGTC AGGATCATCG TGTTCGTTCT ATGGAACAAT 
ATTAGTTTGG AAGTTACGTC AGGATCATCG TGTTCGTTCT ATGGAACAAT 
ATTAGTTTGG AAGTTACGTC AGGATCATCG TGTTCGTTCT ATGGAACAAT 
ATTAGTTTGG AAGTTACGTC AGGATCATCG T GTTCGTT CT ATGGAACAAT 
ATTAGTTTGG AAGTTACGTC AGGATCATCG TGTTCGTTCT ATGGAACAAT 
ATTAGTTTGG AAGTTACGTC AGGATCATCG TGTTCGTTCT ATGGAACAAT 
ATTAGTTTGG AAGTTACGTC AGGATCATCG TGTTCGTTCT ATGGAACAAT 
ATTA GTTTG G AAGTTACGTC AGGATCATCG TGTTCGTTCT ATGGAACAAT 
ATTAGTTTGG AAGTTACGTC AGGATCATCG TGTTCGTTCT ATGGAACAAT 
ATTAGTTTGG AAGTTACGTC AGGATCATCG TGTTCGTTCT ATGGAACAAT 
ATTAGTTTGG AAGTTACGTC AGGATCATCG TGTTCGTTCT ATGGAACAAT 
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WO 2004/018646 
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Table 68: Comparative Sequences relating to SAG 0499 



msa236683.2{310_090' 
msa236683 . 2{310_18RS21 
msa236683 . 2 ( 310_2603 ' 
maa236683.2{.310_A909' 
msa2 3 6 683 . 2 { 3 1 0_CJB 1 1 0 
msa23S683 .2{310_H36B 
msa236683.2(310_JM9130013 
msa236683 . 2 f 310_COH1 
msa236683 .2(310 M732 
msa236683.2(310~M781 
msa2366B3 .2{310_1169NT 
Consensus 



401 

ATAATTTTAG 
ATAATTTTAG 
ATAATTTTAG 
ATAATTTTAG 
ATAATTTTAG 
ATAATTTTAG 
ATAATTTTAG 
ATAATTTTAG 
ATAATTTTAG 
ATAATTTTAG 
ATAATTTTAG 



GTATGCCCAA 
GTATGCCCAA 
GTATGCCCAA 
GTATGCCCAA 
GTATGCCCAA 
GTATGCCCAA 
GTATGCCCAA 
GTATGCCCAA 
GTATGCCCAA 
GTATGCCCAA 
GTATGCCCAA 



AAAGAAGATT 
AAAGAAGATT 
AAAGAAGATT 
AAAGAAGATT 
AAAGAAGATT 
AAAGAAGATT 
AAAGAAGATT 
AAAGAAGATT 
AAAGAAGATT 
AAAGAAGATT 
AAAGAAGATT 



TCAAGGAGGG 
TCAAGGAGGG 
TCAAGGAGGG 
TCAAGGAGGG 
TCAAGGAGGG 
TCAAGGAGGG 
TCAAGGAGGG 
TCAAGGAGGG 
TCAAGGAGGG 
TCAAGGAGGG 
TCAAGGAGGG 



450 

ACTGCCTGAA 
ACTGCCTGAA 
ACTGCCTGAA 
ACTGCCTGAA 
ACTGCCTGAA 
ACTGCCTGAA 
ACTGCCTGAA 
ACTGCCTGAA 
ACTGCCTGAA 
ACTGCCTGAA 
ACTGCCTGAA 



msa236683.2{310_090 
msa236683 . 2 { 310_18RS21 
msa236683.2{310__2603 
msa236683.2{310_A909 
msa236683.2(310_CJB110 
msa236683 . 2 { 310_H36B 
msa236683 .2(310 JM9130013 
msa236683 .2(310 COH1 
msa236683.2(310~M732 
msa236683.2{310~M781 
msa236683.2{310_1169NT 
Consensus 



451 

TTTGCATCGA 
TTTGCATCGA 
TTTGCATCGA 
TTTGCATCGA 
TTTGCATCGA 
TTTGCATCGA 
TTTGCATCGA 
TTTGCATCGA 
TTTGCATCGA 
TTTGCATCGA 
TTTGCATCGA 



TAGATGTCTC 
TAGATGTCTC 
TAGATGTCTC 
TAGATGTCTC 
TAGATGTCTC 
TAGATGTCTC 
TAGATGTCTC 
TAGATGTCTC 
TAGATGTCTC 
TAGATGTCTC 
TAGATGTCTC 



ATTTATCTCT 
ATTTATCTCT 
ATTTATCTCT 
ATTTATCTCT 
ATTTATCTCT ' 
ATTTATCTCT 
ATTTATCTCT 
ATTTATCTCT 
ATTTATCTCT 
ATTTATCTCT 
ATTTATCTCT 



CTTAATTTGA 
CTTAATTTGA 
CTTAATTTGA 
CTTAATTTGA 
CTTAATTTGA 
CTTAATTTGA 
CTTAATTTGA 
CTTAATTTGA 
CTTAATTTGA 
CTTAATTTGA 
CTTAATTTGA 



500 

TTTTaCCAGC 
TTTTaCCAGC 
TTTTaCCAGC 
TTTTaCCAGC 
TTTTaCCAGC 
TTTTaCCAGC 
TTTTaCCAGC 
TTTTaCCAGC 
TTTTaCCAGC 
TTTTaCCAGC 
TTTTgCCAGC 



rasa236683.2{310_090; 
msa236683 . 2 { 3 10_18RS2 1 
msa236683.2{310_2603' 
insa23 6683 . 2 { 3 10_A9 0 9 f 
msa236683 . 2 { 310_CJB110 
msa23 6683 . 2 { 310_H36B 
msa236683.2(310_JM9130013 
msa236683.2(310_COHl 
msa236683.2<310_M732 
rasa236683 ,2{310_M781 
msa236683 . 2 { 310_1169NT 
Consensus 



501 

TCTAAAAGAA 
TCTAAAAGAA 
TCTAAAAGAA 
TCTAAAAGAA 
TCTAAAAGAA 
TCTAAAAGAA 
TCTAAAAGAA 
TCTAAAAGAA 
TCTAAAAGAA 
TCTAAAAGAA 
TCTAAAAGAA 



ATTTTAGTGG 
ATTTTAGTGG 
ATTTTAGTGG 
ATTTTAGTGG 
ATTTTAGTGG 
ATTTTAGTGG 
ATTTTAGTGG 
ATTTTAGTGG 
ATTTTAGTGG 
ATTTTAGTGG 
ATTTTAGTGG 



ATGGTGGACA 
ATGGTGGACA 
ATGGTGGACA 
ATGGTGGACA 
ATGGTGGACA 
ATGGTGGACA 
ATGGTGGACA 
ATGGTGGACA 
ATGGTGGACA 
ATGGTGGACA 
ATGGTGGACA 



AGTAGTGGCA 
AGTAGTGGCA 
AGTAGTGGCA 
AGTAGTGGCA 
AGTAGTGGCA 
AGTAGTGGCA 
AGTAGTGGCA 
AGTAGTGGCA 
AGTAGTGGCA 
AGTAGTGGCA 
AGTAGTGGCA 



550 

TTAATTAAAC 
TTAATTAAAC 
TTAATTAAAC 
TTAATTAAAC 
TTAATTAAAC 
TTAATTAAAC 
TTAATTAAAC 
TTAATTAAAC 
TTAATTAAAC 
TTAATTAAAC 
TTAATTAAAC 



msa236683 . 2 (310_090 
tnsa236683 .2{310_18RS21 
msa236683.2{310_2603 
ntBa236683 .2{310_A909 
msa236683 .2{310_CJB110 
msa236683.2{310_H36B 
msa236683.2{310_JM9130013 
msa236683 .2{310_COH1 
msa236683 . 2 <310_M732 
ma a2 3 668 3 . 2 { 3 10_M7 8 1 
msa236683 .2{310_1169NT 
Consensus 



551 

CACAATTTGA 
CACAATTTGA 
CACAATTTGA 
CACA ATTTG A 
CACAATTTGA 
CACAATTTGA 
CACAATTTGA 
CACA ATTTG A 
CACAATTTGA 
CACAATTTGA 
CACAATTTGA 



AGCAGGTCGT 
AGCAGGTCGT 
AGCAGGTCGT 
AGCAGGTCGT 
AGCAGGTCGT 
AGCAGGTCGT 
AGCAGGTCGT 
AGCAGGTCGT 
AGCAGGTCGT 
AGCAGGTCGT 
AGCAGGTCGT 



GAGCAAATTG 
GAGCAAATTG 
GAGCAAATTG 
GAGCAAATTG 
GAGCAAATTG 
GAGCAAATTG 
GAGCAAATTG 
GAGCAAATTG 
GAGCAAATTG 
GAGCAAATTG 
GAGCAAATTG 



GTAAAAATGG 
GTAAAAATGG 
GTAAAAATGG 
GTAAAAATGG 
GTAAAAATGG 
GTAAAAATGG 
GTAAAAATGG 
GTAAAAATGG 
GTAAAAATGG 
GTAAAAATGG 
GTAAAAATGG 



600 

TATTGTCAAA 
TATTGTCAAA 
TATTGTCAAA 
TATTGTCAAA 
TATTGTCAAA 
TATTGTCAAA 
TATTGTCAAA 
TATTGTCAAA 
TATTGTCAAA 
TATTGTCAAA 
TATTGTCAAA 



msa236683.2{3l0_090 1 
msa236683.2{310JL8RS2l' 
msa236683.2(310_2603' 
msa2 3 66 8 3 . 2 { 3 10_A90 9 
msa236683 .2{310_CJB110 
msa236683.2{310_H36B 
msa236683 . 2 { 310_JM9130013 
msa236683 . 2 f 310_COH1 
' msa236683.2<310_M732 
msa236683.2{310 M781 
msa236683 . 2 { 310_1169NT 
Consensus 



601 

GACAAGTTGG 
GACAAGTTGG 
GACAAGTTGG 
GACAAGTTGG 
GACAAGTTGG 
GACAAGTTGG 
GACAAGTTGG 
GACAAGTTGG 
GACAAGTTGG 
GACAAGTTGG 
GACAAGTTGG 



TTCATGAAAA- 
TTCATGAAAA 
TTCATGAAAA 
TTCATGAAAA 
TTCATGAAAA 
TTCATGAAAA 
TTCATGAAAA 
TTCATGAAAA 
TTCATGAAAA 
TTCATGAAAA 
TTCATGAAAA 



G GTTTTG ACA 
GGTTTTGACA 
GGTTTTGACA 
GGTTTTGACA 
GGTTTTGACA 
GGTTTTGACA 
GGTTTTGACA 
GGTTTTGACA 
GG TTTTG ACA 
GGTTTTGACA 
GGTTTTGACA 



ACAGTGACCA 
ACAGTGACCA 
ACAGTGACCA 
ACAGTGACCA 
ACAGTGACCA 
ACAGTGACCA 
ACAGTGACCA 
ACAGTGACCA 
ACAGTGACCA 
ACAGTGACCA 
ACAGTGACCA 



650 

ATTTCACGAA 
ATTTCACGAA 
ATTTCACGAA 
ATTTCACGAA 
ATTTCACGAA 
ATTTCACGAA 
ATTTCACGAA 
ATTTCACGAA 
ATTTCACGAA 
ATTTCACGAA 
ATTTCACGAA 



msa236683.2{310_090 
msa236683 . 2 { 3 10_18RS2 1 
rasa236683 . 2 ( 310_2603" 
rasa236683. 2(310 A909 
msa236683 .2(310 CJB110 
msa236683 . 2 ( 310_H36B 
msa236683 .2{310_JM9130013 
msa23 6683 . 2 { 310_COH1 
msa236683.2(310_M732 
msa236683.2(310_M781 
msa2366B3. 2(310 1169NT 



651 

AGATTATGGA 
AGATTATGGA 
AGATTATGGA 
AGATTATGGA 
AGATTATGGA 
AGATTATGGA 
AGATTATGGA 
AGATTATGGA 
AGATTATGGA 
AGATTATGGA 
AGATTATGGA 



TATACGGTTA 
TATACGGTTA 
TATACGGTTA 
TATACGGTTA 
TATACGGTTA 
TATACGGTTA 
TATACGGTTA 
TATACGGTTA 
TATACGGTTA 
TATACGGTTA 
TATACGGTTA 



AACATCTTGA 
AACATCTTGA 
AACATCTTGA 
AACATCTTGA 
AACATCTTGA 
AACATCTTGA 
AACATCTTGA 
AACATCTTGA 
AACATCTTGA 
AACATCTTGA 
AACATCTTGA 



TTTTTCGCCC 
TTTTTCGCCC 
TTTTTCGCCC 
TTTTTCGCCC 
TTTTTCGCCC 
TTTTTCGCCC 
TTTTTCGCCC 
TTTTTCGCCC 
TTTTTCGCCC 
TTTTTCGCCC 
TTTTTCGCCC 



700 

aTTCAAGGTG 
aTTCAAGGTG 
aTTCAAGGTG 
aTTCAAGGTG 
aTTCAAGGTG 
aTTCAAGGTG 
aTTCAAGGTG 
gTTCAAGGTG 
gTTCAAGGTG 
gTTCAAGGTG 
aTTCAAGGTG 
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Consensus 



msa236683.2{310_090 
msa236683.2{310_JL8RS21 
msa236683 . 2 f 310_2603 
ms a2 3 66 83 . 2 ( 3 1 0_A90 9 
msa236683.2{310_CJB110 
msa236683 .2{310__H36B 
msa236683.2{310_JM9130013 
msa236683.2{310 COH1 
msa236683.2(310~M732 
msa23 66 8 3 . 2 { 3 1 0J478 1 
msa236683 . 2 { 310_1169NT 
Consensus 



701 

GACATGGAAA 
GACATGGAAA 
GACATGGAAA 
GACATGGAAA 
GACATGGAAA 
GACATGGAAA 
GACATGGAAA 
GACATGGAAA 
GACATGGAAA 
GACATGGAAA 
GACATGGAAA 



TATTGAGTTT 
TATTGAGTTT 
TATTGAGTTT 
TATTGAGTTT 
TATTGAGTTT 
TATTGAGTrT 
TATTGAGTTT 
TATTGAGTTT 
TATTGAGTTT 
TATTGAGTTT 
TATTGAGTTT 



TTAATGCATT 
TTAATGCATT 
TTAATGCATT 
TTAATGCATT 
TTAATGCATT 
TTAATGCATT 
TTAATGCATT 
TTAATGCATT 
TTAATGCATT 
TTAATGCATT 
TTAATGCATT 



TGCAAAAGTG 
TGCAAAAGTG 
TGCAAAAGTG 
TGCAAAAGTG 
TGCAAAAGTG 
TGCAAAAGTG 
TGCAAAAGTG 
TGCAAAAGTG 
TGCAAAAGTG 
TGCAAAAGTG 
TGCAAAAGTG 



750 

TCAAGATCCA 
TCAAGATCCA 
TCAAGATCCA 
TCAAGATCCA 
TCAAGATCCA 
TCAAGATCCA 
TCAAGATCCA 
TCAAGATCCA 
TCAAGATCCA 
TCAAGATCCA 
TCAAGATCCA 



msa236683.2{310 090 
msa236683.2{310_18RS21 
msa236683.2{310_2603 
msa236683 .2{310__A909 
msa236683.2{310_CJB110 
msa23 6683 . 2 { 310_H36B 
msa236683.2{310 JM9130013 
msa236683 .2f 310_COH1 
msa236683.2{310_M732 
raaa236683. 2(310 M781 
msa236683 .2{310_1169NT 
Consensus 



751 

CAAAATCTTG 
CAAAATCTTG 
CAAAATCTTG 
CAAAATCTTG 
CAAAATCTTG 
CAAAATCTTG 
CAAAATCTTG 
CAAAATCTTG 
CAAAATCTTG 
CAAAATCTTG 
CAAAATCTTG 



TGCTTGACCA 
TGCTTGACCA 
TGCTTGACCA 
TGCTTGACCA 
TGCTTGACCA 
TGCTTGACCA 
TG CTTG ACCA 
TGCTTGACCA 
TGCTTGACCA 
TGCTTGACCA 
TGCTTGACCA 



AATACAAGAT 
AATACAAGAT 
AATACAAGAT 
AATACAAGAT 
AATACAAGAT 
AATACAAGAT 
AATACAAGAT 
AATACAAGAT 
AATACAAGAT 
AATACAAGAT 
AATACAAGAT 



GTTATAGAAA 
GTTATAGAAA 
GTTATAGAAA 
GTTATAGAAA 
GTTATAGAAA 
GTTATAGAAA 
GTTATAGAAA 
GTTATAGAAA 
GTTATAGAAA 
GTTATAGAAA 
GTTATAGAAA 



800 

AAGCACATAA 
AAGCACATAA 
AAGCACATAA 
AAGCACATAA 
AAGCACATAA 
AAGCACATAA 
AAGCACATAA 
AAGCACATAA 
AAGCACATAA 
AAGCACATAA 
AAGCACATAA 



msa236683 . 2 { 310_090 
msa236683.2{310_18RS21 
msa236683 . 2 f 310_2603 
msa236663.2{310_A909 
msa236683 . 2 {310_CJB110 
msa236683 .2{310_H36B 
msa236683 . 2 { 310_JM9130013 
msa23 6 6 8 3 . 2 f 3 1 0_COH1 
msa236683.2{310_M732 
msa236683 . 2 { 310_M781 
msa236683 -2 {310_1169NT 
Consensus 



601 

GGAATTTAAG 
GGAATTTAAG 
GGAATTTAAG 
GGAATTTAAG 
GGAATTTAAG 
GGAATTTAAG 
GGAATTTAAG 
GGAATTTAAG 
GGAATTTAAG 
GGAATTTAAG 
GGAATTTAAG 



AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 



825 
AAGAG 
AAGAG 
AAGAG 
AAGAG 
AAGAG 
AAGAG 
AAGAG 
AAGAG 
AAGAG 
AAGAG 
AAGAG 



SEQ ID NO. 6812 
STRAIN 2603 frame: 1 

MAKERVDVIAYKQGLFDTREQAKRGVMAGM^ 

YVSRGGLKLEKALQVFE I S VADKLT I D I GASTGG FTDVMLQSGARLVYAVDVGTNQL VWK 
LRQDHRVRSMEQYNFRYAQKED FKEGLPEFAS I D VS F I SLNLI LPALKE I LVDGGQWAL 
I KPQFEAGREQ I GKNG I VKDKLVHEKVLTTVTNFTKDYG YTVKKLDFS P I QGGHGN I EFL 
MHLQKCQDPQNLVLDQI QDVI EKAHKEFKKNEEB 

SEQ ZD HO. 6813 
STRAIN 090 frame: 1 

AKERVDVIAYKQGLFDTREQAKRGVMAGMVIN^ 

YVSRGGLKLBKALQVFBI SVADKLTID1GASTGGFTDVMLQSGARLVYAVDVGTNQLVWK 
LRQDHRVRSMEQYNFRYAQKED FKEGLPEFAS IDVSFI SLNLI LPALKE I LVDGGQWAL 
I KPQFEAGREQI GKNG I VKDKLVHEKVLTTVTNFTKDYG YTVKHLD FSP I QGGHGN I EFL 
MHLQKCQDPQNLVLDQI QDVI EKAHKEFKKNEEB 

SEQ ZD NO. 6814 
STRAIN A909 frame: I 

AKERVD VLA.Y KQGL FDT RE QAKRGVMAGMVI NVT NGERYDKPGEKVADDTELKLKGE KL K 
YVSRGGLKLEKALQVFE I S VADKLT I D I GASTGG FTD VMLQSGARLVYAVD VGTNQLVWK 
LRQDHRVRSMEQYNFRYAQKEDFKEGLPEFAS IDVSPI SLNL I LPALKE I LVDGGQWAL 
IKPQFEAGREQIGKNGIVKDKLVHEKVLTTVTNFTKDYGYTV^ 
MHLQKCQDPQNLVLDQ I QDVI EKAHKEFKKNEEE 

SEQ ZD NO. 6815 
STRAIN 18RS21 frame: 1 

AKERVDVLAYKQGL FDTREQAKRG VMAGMV I NV I NGE RYDKPGEKVADDTELKLKGEKLK 
YVSRGGLKLEKALQVFE I S VAD KLT I D I GASTGG FTDVMLQSGARLVYAVDVGTNQL VWK 
LRQDHRVRSMEQYNFRYAQKEDFKEGLPEFAS IDVSFI SLNLI LPALKE ILVDGGQWAL 
I KPQFEAGREQIGKNG I VKDKLVHE KVLTTVTNFTKDYGYTVKHLDFSPIQGGHGNT EFL 
MHLQKCQDPQNLVLDQI QDVI EKAHKEFKKNEEE 

SEQ ZD HO. 6816 
STRAIN M732 frame: 1 

AKERVD VLAYKQGLFDTREQAKRGVMAGLVINVI NGERYDKPGEKVADDTELKLKGEKLK 
YVSRGGLKLEKALQVFE I S VADKLT IDIGASTGGFTDVMLQSGARLVYAVDVGTNQLVWX 
LRQDHRVRSMEQYNFRYAQKEDFKEGLPEFAS IDVSF I SLNLI LPALKE I LVDGGQWAL 
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I KPQFEAGREQI GKNGI VKDKLVHEKVIjTTVTNFTKDYGYTVKHLDFSPVQGGHGNIEFL 
MHLQKCQDPQNIiVLDQI QDVI EKAHKEFKKNEEE 

SEQ ZD NO. 6817 
STRAIN COH1 frame: 1 

AKERVDVLAYKQGL FT/TREQAKRG VMAGLV I NVI NGERYDKPGE KVADDTEL KL KGE KLK 
YVSRGGLKLEKALQVFE I SVADKLT I D I GASTGG FTD VMI/QSGARLVYAVDVGTNQL VWK 
LRQDHRVRSMEQYNFRYAQKEDFKEGLPE FAS I DVSFI SLNL I LPALKE I LVDGGQWAL 
I KPQFEAGREQI GKNGI VKDKLVHEKVLTTVTNFTKDYGYTVKHLDFS PVQGGHGN I E FL 
MHLQKCQDPQNLVLDQI QDVI EKAHKEFKKNEEE 

SEQ ZD NO. 6818 
STRAIN M781 frame: 1 

AKERVDVLAYKQGLFDTRBQAiCRGVMAGLVI NVI NGERYD KPGEKVADDTELKLKGE KL K 
YVSRGGLKLEKALQVFE I SVADKLT ID I GASTGG FTDVMLQSGARLVYAVDVGTNQLVWK 
LRQDHRVRSMEQYNFRYAQKEDFKEGLPE FASIDVS F I SLNL I LPALKE I LVDGGQWAL 
I KPQFEAGREQI GKNGI VKDKLVHEKVLTTVTIJFTKDYGYTVKHLDFSPVO^SGHGNI EFL 
MHLQKCQDPQNLVLDQI QDVI EKAHKEFKKNEEE 

SEQ ZD NO. 6819 
STRAIN CJB1 10 frame: 1 

AKERVDVIAYKQGLFDTREQAKRGVMAGMVINVINGER 

YVSRGGLKLEKALQVFE I SVADKLT IDI GASTGGFTDVMLQSGARLVYAVDVGTNQLVWK 
LRQDHRVRSMEQYNFRYAQKEDFKEGLPE FAS I DVSFI SLNL ILPALKE I LVDG<^VVAL 
I KPQFEAGREQI GKNGI VKDKLVHEKVLTTVTNFTKDYGYTVKHLDFS P I QGGHGN I EFL 
MHLQKCQDPQNLVLDQI QDVI EKAHKEFKKNEEE 

SSQ ZD NO. 6820 
STRAIN U69NT frame: 1 

AKERVDVIAYKQGLFDTREQAKRGVMAGLVINVINGERYDK 

YVSRGGLKLEKALQVFE I SVADKLTIDIGASTGG FTDVMLQSGARLVYAVDVGTNQLVWK 
LRQDHRVRSMEQYNFRYAQKEDFKEGLPEFAS IDVS F I SLNL I LPALKE I LVDGGQWAL 
I KPQFEAGREQ I GKNG I VKDKLVHE KVLTTVTNFTKD YG YTVKHLDF S P I QGGHGN I EFL 
MHLQKCQDPQNLVLDQI QDVI EKAHKEFKKNEEE 

SEQ ZD NO. 6821 
STRAIN JM9 130013 frame: 1 

AKERVDVIAYKQGLFDTREQAKRGVMAGMVINVI NGERYD KPGEKVADDTELKLKGEKLK 
YVSRGGLKLEKALQVFE I SVADKLT ID I GASTGG FTDVMLQSGARLVYAVDVGTNQLVWK 
LRQDHRVRSMEQ YNFRYAQ KEDFKEGL PE FAS I DVS F I SLNL I LPALKE I LVDGGQWAL 
IKPQFEAGREQIGKNGIVKDKLVHEKVLTTVTNFTKDY 
MHLQKCQDPQNLVLDQI QDVI EKAHKEFKKNEEE 

SEQ ZD NO. 6822 
STRAIN H36B frame: I 

AKERVDVLAYKQGLFDTREQAKRGVMAGMVI NVI NGERYDKPGE KVADDTELKLKGEKLK 
YVSRGGLKLEKALQVFE I SVADKLT IDI GASTGG FTDVMLQSGARLVYAVDVGTNQLVWK 
LRQDHRVRSMEQYNFRYAQKEDFKEGLPE FAS IDVSF I S LNL I LPALKE I LVDGGQWAL 
I KPQFEAGREQ I GKNG I VKDKLVHEKVLTTVTNFTKDYGYTVK^ 
MHLQKCQDPQNLVLDQI QDVI EKAHKE FKKNEEE 

PRETTY of : /biotmp/msa236800.2{*} May 14, 2003 02:58 



msa236800.2{310_090 
msa236800.2{310_18RS21 
msa236800.2{310_2603 
rasa23 6 8 0 0 . 2 { 31 0_A9 0 9 
msa236800.2(310_CJB110 
msa2368 00 . 2 { 3 10_H3 6B 
msa236800.2{310_JM9130013 
msa236800. 2(310 COH1 
msa236800.2(310~M732 
msa236800.2{310_M781 
msa236800.2{310_1169NT 
Consensus 



msa236800.2{310_090 
msa236800 .2 {310_1BRS21 
ntsa236800 . 2 { 310_2603 
msa236800.2{310_A909 
msa236800 . 2 { 310_CJB110 
msa236800.2{310_H36B 
msa236800. 2(310 JM9130013 
rosa2 3 68 0 0 . 2 ( 3 1 0 JC0H1 
msa236800.2(310 M732 
tnsa236800.2{310~M781 
insa2368 00 . 2 ( 3 10_1169NT 
Consensus 



1 50 
-AKBRVDVLA YKQGLFDTRE QAKRGVMAGm VINVINGERY DKPGEKVADD 
-AKERVDVLA YKQGLFDTRE QAKRGVMAGm VINVINGERY DKPGEKVADD 
mAKERVDVLA YKQGLFDTRE QAKRGVMAGm VINVINGERY DKPGEKVADD 
-AKBRVDVLA YKQGLFDTRE QAKRGVMAGm VINVINGERY DKPGEKVADD 
-AKBRVDVLA YKQGLFDTRE QAKRGVMAGm VINVINGERY DKPGEKVADD 
-AKERVDVLA YKQGLFDTRE QAKRGVMAGm VINVINGERY DKPGEKVADD 
-AKERVDVLA YKQGLFDTRE QAKRGVMAGm VINVINGERY DKPGEKVADD 
-AKERVDVLA YKQGLFDTRE QAKRGVMAGl VINVINGERY DKPGEKVADD 
-AKERVDVLA YKQGLFDTRE QAKRGVMAGl VINVINGERY DKPGEKVADD 
-AKERVDVLA YKQGLFDTRE QAKRGVMAGl VINVINGERY DKPGEKVADD 
-AKBRVDVLA YKQGLFDTRE QAKRGVMAGl VINVINGERY DKPGEKVADD 



51 100 
TELKLKGEKL KYVSRGGLKL EKALQVFBIS VADKLTIDIG ASTGGFTDVM 
TELKLKGEKL KYVSRGGLKL EKALQVFBIS VADKLTIDIG ASTGGFTDVM 
TELKLKGEKL KYVSRGGLKL EKALQVFBIS VADKLTIDIG ASTGGFTDVM 
TELKLKGEKL KYVSRGGLKL EKALQVFBIS VADKLTIDIG ASTGGFTDVM 
TELKLKGEKL KYVSRGGLKL EKALQVFBIS VADKLTIDIG ASTGGFTDVM 
TELKLKGEKL KYVSRGGLKL EKALQVFBIS VADKLTIDIG ASTGGFTDVM 
TELKLKGEKL KYVSRGGLKL EKALQVFBIS VADKLTIDIG ASTGGFTDVM 
TELKLKGEKL KYVSRGGLKL EKALQVFBIS VADKLTIDIG ASTGGFTDVM 
TELKLKGEKL KYVSRGGLKL EKALQVFBIS VADKLTIDIG ASTGGFTDVM 
TELKLKGEKL KYVSRGGLKL EKALQVFBIS VADKLTIDIG ASTGGFTDVM 
TELKLKGEKL KYVSRGGLKL EKALQVFBIS VADKLTIDIG ASTGGFTDVM 



101 



150 
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msa23680O.2{310_090' 
maa236800.2{310 18RS2l| 
msa2368 00 . 2 { 3 10_2 603 ( 
rasa236800.2{310_A909' 
msa236800 .2 {310_CJB110 
msa23 68 0 0 . 2 { 3 1 0_H3 63 \ 
msa236800.2{310_JM9130013 
msa236800.2{310_COHl 
msa236800.2(310_M732 
msa236800.2{310_M781 
msa236800.2{310_1169NT 
Consensus 



LQSGARLVYA 
LQSGARLVYA 
LQSGARLVYA 
LQSGARLVYA 
LQSGARLVYA 
LQSGARLVYA 
LQSGARLVYA 
LQSGARLVYA 
LQSGARLVYA 
LQSGARLVYA 
LQSGARLVYA* 



VDVGTNQLVW 
VDVGTNQLVW 
VDVGTNQLVW 
VDVGTNQLVW 
VDVGTNQLVW 
VDVGTNQLVW 
VDVGTNQLVW 
VDVGTNQLVW 
VDVGTNQLVW 
VDVGTNQLVW 
VDVGTNQLVW 



KLRQDHRVRS 
KLRQDHRVRS 
KLRQDHRVRS 
KLRQDHRVRS 
KLRQDHRVRS 
KLRQDHRVRS 
KLRQDHRVRS 
KLRQDHRVRS 
KLRQDHRVRS 
KLRQDHRVRS 
KLRQDHRVRS 



MEQYNPRYAQ 
MEQYNFRYAQ 
MEQYNPRYAQ 
MEQYNFRYAQ 
MEQYNFRYAQ 
MEQYNFRYAQ 
MEQYNFRYAQ 
MEQYNFRYAQ 
MEQYNFRYAQ 
MEQYNFRYAQ 
MEQYNFRYAQ 



KEDFKEGLPE 
KEDFKEGLPE 
KEDFKEGLPE 
KEDFKEGLPE 
KEDFKEGLPE 
KEDFKEGLPE 
KEDFKEGLPE 
KEDFKEGLPE 
KEDFKEGLPE 
KEDFKEGLPE 



msa236800.2{310_090 
msa236800.2{310_18RS21 
msa236800. 2(310 2603 
msa236800 . 2 {310_A909 
msa236800 . 2 { 310_CJB110 
msa236800.2{310_H36B 
msa236800.2{310_JM9130013 
msa236800 . 2 (310_COH1 
msa236800 . 2 {310_M732 
msa236800 . 2 (310 J4781 
msa2 36800 . 2 { 310_1169NT 
Consensus 



1S1 

FASIDVSFIS 
FASIDVSFIS 
FASIDVSFIS 
FASIDVSFIS 
FASIDVSFIS 
FASIDVSFIS 
FASIDVSFIS 
FASIDVSFIS 
FASIDVSFIS 
FASIDVSFIS 
FASIDVSFIS 



LNLILPALKE 
LNLILPALKE 
LNLILPALKE 
LNLILPALKE 
LNLILPALKE 
LNLILPALKE 
LNLILPALKE 
LNLILPALKE 
LNLILPALKE 
LNLILPALKE 
LNLILPALKE 



ILVDGGQWA 
ILVDGGQWA 
ILVDGGQWA 
ILVDGGQWA 
ILVDGGQWA 
ILVDGGQWA 
ILVDGGQWA 
ILVDGGQWA 
ILVDGGQWA 
ILVDGGQWA 
ILVDGGQWA 



LIKPQFEAGR 
LIKPQFEAGR 
LIKPQFEAGR 
LIKPQFEAGR 
LIKPQFEAGR 
LIKPQFEAGR 
LIKPQFEAGR 
LIKPQFEAGR 
LIKPQFEAGR 
LIKPQFEAGR 
LIKPQFEAGR 



200 

EQIGKNGIVK 
EQIGKNGIVK 
EQIGKNGIVK 
EQIGKNGIVK 
EQIGKNGIVK 
EQIGKNGIVK 
EQIGKNGIVK 
EQIGKNGIVK 
EQIGKNGIVK 
EQIGKNGIVK 
EQIGKNGIVK 



msa236800.2{310_090] 
msa236800 . 2 {310_18RS21 
msa23 68 0 0 . 2 f 3 1 0_2 603 
msa236800 .2{310_A909' 
msa2 3 68 0 0 . 2 { 3 1 0_CJB110 
msa236800.2{310_H36B 
msa236800.2{310_JM9130013 
msa236800 . 2 f 310_COH1 
msa236800 . 2 { 310_M732 
msa236800.2{310_M781 
msa236800.2{310_1169NT 
Consensus 



201 

DKLVHEKVLT 
DKLVHEKVLT 
DKLVHEKVLT 
DKLVHEKVLT 
DKLVHEKVLT 
DKLVHEKVLT 
DKLVHEKVLT 
DKLVHEKVLT 
DKLVHEKVLT 
DKLVHEKVLT 
DKLVHEKVLT 



TVTNFTKDYG 
TVTNFTKDYG 
TVTNFTKDYG 
TVTNFTKDYG 
TVTNFTKDYG 
TVTNFTKDYG 
TVTNFTKDYG 
TVTNFTKDYG 
TVTNFTKDYG 
TVTNFTKDYG 
TVTNFTKDYG 



YTVKHU)FSP 
YTVKHLDFSP 
YTVKHLDFSP 
YTVKHLDFSP 
YTVKHLDFSP 
YTVKHLDFSP 
YTVKHLDFSP 
YTVKHLDFSP 
YTVKHLDFSP 
YTVKHLDFSP 
YTVKHLDFSP 



iQGGHGNIEF 
iQGGHGNIEF 
iQGGHGNIEF 
iQGGHGNIEF 
iQGGHGNIEF 
iQGGHGNIEF 
iQGGHGNIEF 
vQGGHGNIEF 
vQGGHGNIEF 
vQGGHGNIEF 
iQGGHGNIEF 



250 

IMHLQKCQDP 
LMHLQKCQDP 
LMHLQKCQDP 
LMHLQKCQDP 
LMHLQKCQDP 
LMHLQKCQDP 
LMHLQKCQDP 
LMHLQKCQDP 
LMHLQKCQDP 
LMHLQKCQDP 
LMHLQKCQDP 



msa236800.2{310_090 
msa236800 . 2 { 310_1BRS21 
maa236800.2{310__2603 
msa23680O.2{310_A909' 
msa2368 00 . 2 { 310_CJB110 ' 
msa236800.2{310Jt36B 
msa236800.2{310_JM9130013 
msa236800.2(310_COHl 
msa23 68 0 0 . 2 f 3 1 0_M732 
msa236800 .2{310_M781 
msa236800.2{310_1169NT! 

Consensus 



251 

QNLVLDQIQD 
QNLVLDQIQD 
QNLVLDQIQD 
QNLVLDQIQD 
QNLVLDQIQD 
QNLVLDQIQD 
QNLVLDQIQD 
QNLVLDQIQD 
QNLVLDQIQD 
QNLVLDQIQD 
QNLVLDQIQD 
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VIEKAHKEFK KNEES 
VIEKAHKBFK KNEEE 
VIEKAHKEFK KNEEE 
VIEKAHKEFK KNEEE 
VIEKAHKEFK KNEEE 
VIEKAHKEFK KNEEE 
VIEKAHKEFK KNEEE 
VIEKAHKEFK KNEEE 
VIEKAHKEFK KNEEE 
VIEKAHKEFK KNEEE 
VIEKAHKEFK KNEEE 
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SEQ ZD NO. €901 
STRAIN 2603 

ATGAATAAAAAGGTACTATTGACATCGACAATG^ 

GTTCAAGCACAAGAAACAGATACGACGTGGACAG CACGTACTGTTTCAGAGGTAAAGGCT 
GATTTGGTAAAGCAAGACAATAAATCATCATATACTGTGAA^ 

GTTATTTCAGAAGCAATGTCAATTGATATGAATGTCTTAGCAA CA 

GATATCAATCTTATTTATCCTGAGACAACACrGACAGTAACTTAC^ 

ACTGCCACTTCAATGAAAATAGAAACACCAGCAACAAATC 

ACTCTGGATTTGAAAACCAATCAAGTTTCTGTTG CAGACCAAAAAGTTTCTCTCAATACA 
ATTTCGXxAAGGTATGACACCAGAAGCAGCAACAACGA 

TCTTCTGCG CCAG CTTTGAAATCAAAAGAAGTATTAGCACAAGAG CAAGCTGTTAGT CAA 
GCAG CAGCTAATGAACAGGTAT CACCAGCTCCTGTGAAGTCGATTACTTCAGAAGTTCCA 
GCAGCTAAAGAGGAAGTTAAACCAACTCAGACGTCAGTCAGT^ 
CCAGCTTCTGTTGCCGCTrGAAACACCAGCTCCACTAGCT 

GT AGCAG CCCCTAGAGTGGCAAGTGTTAAAGT AGTCACTCCTAAAGTAGAAACTGGTGCA 

TCACCAGAGCATGTATCAGCTCCAG CAGTTCCTGTGACTACGACITCACCAGCTACAGAC 

AGTAAGTTACAAGCGACTGAAGTTAAGAGCGTTCCGGTAGCACA 

AC^CCGGTAGCACAACCAGCTTCAACAACAAATGCAGTAGCT 

GGGCTCCAACCTCATGTTCCAGCTTATAAAGA^ 

GAA1TCAGTACATACCGTGCGGGAGATCCAGGTGATCATGGTA 

TTTATTGTAGGTACTAATCAAGCACTTGGTAATAAAG 

ATGGCAGCAAATAACATTTCATATGTTATCTG 

AGTATTTATGGACCTGCTAATACTTGGAATGCAATGCCAGA 

AACCACTATGACCAroTTCACGTATCA TITAA CAAATAATATAAA 

GCTTCTTTTTTATATGCCTTGAATAGACTT^^ 

SEQ ID HO. 6902 
STRAIN 090 

TGAGACAACACTGACAGTAACTTAC^TCAGAAGAGTC^ 

ACTGTGGATTTGAAAACXZAATCAAGTTTCTGT^ 

TCTCAATACAATTTCGGAAGGTATGACACXAG 

TTTCGCCAATGAAGACATATTCTTCTGCGCCAGCTT^ 

GTATTAGCACAAGAGCAAGCTGTTAGTCAAGCAGCAGCTAATGAA 

ATCAACAGCTCCTGTGAAGTCXIATTACTTCAGAAGT^ 

AGGAAGTTAAA(XAACTCAGACGTCAGTCAGTC^ 

CCAGCTTCTGTTGCCGCTGAAACACCAGCTCCAGTAGCTAAA 

GGTAAGAACTGTAGCAGCCCCTAGAGTGGCAAGTGTTAAAGTAGTCACTC 

CTAAAGTAGAAACTGGTGCATCACC^GAGCATGTATCAGCTCCAG CAGTT 

CCTGTGACTACGACTTCAACAGCTACAGACAGTAAGTTA 

AGTTAAGAG CGTTCCX3GTAGCACAAAAAGCTCCAACAG CAACACCGGTAG 

CAGAACCAGCTTCAACAACAAATGCAGTAGCTGC^ 

GGGCTCCAACCTCATGTTGCAGCTT ATAAAGAAAAAGTAG CGTCAACTT A 

TGGAGTTAATGAATTCAGTACATACCGTGCAGGTGATCC^ 

GTAAAGGTTTAGCAGTCGACTTTATTGTAGGTAAA^ 

AATGAAGTTGCACAGTACTCTACACAAAATATGGCAGCAAATAAC^ 

ATATGTTATcTGGCAACAAAAGUTl'rACTCAAATACAAATAGTATTTATG 

GACCTGCTAATACTTGGAATGCAATGCCAGATCGTGGTGGCGTTAC 

AACCATTATGACCATGTTCACGTATCATTTAACAAATAATATAAAAAAGG 

AAGCTATTTGGCTTCTTTTTTATATGCCTTGAAT 

TATATAATTTTTATTA 

SEQ ZD MO. 6903 
STRAIN A909 

CTGATTTGGTAAAGCAAGACAATAAATCATCATATACTGTGAA 
ATATGGTGATACACTAAGCGTTATTTC^^ 

ATGTCTTAGCAAAAATTAATAACATIX3CAGATATCAATCITATTT 

GAGACAACACTGaCAGTAACTTACGATCAGAAGAGTCA^ 

AATGAAAATAGAAACACCAGCAACAAATGCroCTCOT 

CTGTCGATTTGAAAACCAATCAAGTTTCrGT^ 

CTCAATACAATTTCGGAAGGTATGACACCAGAAGCAGCAACA 

TTCGCCAATGAAGACATATTCTTcTGCGCCAGCT 

TATTAgCACAAGGGCaAGCTCTTAGTCAAGCAGCAGCTAATGA 

TCAcCAGCTcCTGTGAAGTCGATTACTTCA^ 

GGAAGTTAAACCAaCTCAgACGTCAgTCAGTCAGTCAACAACA^ 

CAgCTTCTGTTGCCGCIX3AAACACCAGCrrC 

GTAAGAACTGlAGCAGCCCCIAGAGTGGCAAGTGTTAAAGrACT 

TAAAGTAGAAACTGGTG CATCACCAGAGCATGTATCAGCTCCAGCAGTTC 

CTGTmCTACGACTTCAACAGCTACAGACAGTAAGTTACAAGC^ 

GTTAAGAGCGTTCCGGTAGCACAAAAAGCTCCAACAGCAAC^ 

ACAACCAGCITCAACAACAAATGCAGTAGCTGCAC^ 

GGCTCCAACCTCATGTTGCAGCTTATAAAGAAAAAGTAGCGTCAAC 

GQAGTTAATGAATTCAGTACATACCGTGCGGGAGATCCAGGTGA 

TAAAGGTTTAGCAGTTGACTTTATTGTAgGTAAAAACC^ 

ATGAAGTTCCACAGTACTCT ACACAAAATATGG CAGCaAATAACATTTCA 

TATGTTATCTGGCAACAAAAGTTTTACrCAAATaCAAAT^ 



ACCaCTATGAC^CACGlTCACGTATCATTTAACAAATaA 

AGCTTaTTTGGCITCTTTTTTATATGCCTTGC^ 

ATATAATTTTTATTA 



SEQ ZD HO. 6904 
STRAIN H36B 
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CTGATTTGGTAAAG O^AGACAATAAATCATCATATAc^IXnXlAAATA 

TGGTGATACAcTAAGCGTTATTTCAGAAGCAATGTCa^ 

TCTTAGCAAAAATTAATAACATTGCAGATATCAATCCT 

ACAACaCTGaCAGfTAaCrrACGATCAGAAGAGTrCATACTGCT 

GAA7VATAGAAACAC CAGCAACAAATGCTG CTGGTCAAACAACAGCTACTG 

TCGATTTGAAAACCAATCAAGTTTCTG^TO 

AATACAATTTCGGAAGGTATGACACCAGAAGCAGCAACA^ 

GCCAATGAAGACATATTCTTCTGCGCCAGCTTTG^ 

TAGCACAAGGGCAAG CTGTTAGTCAAGCAGCAG CTAATGAACAGGTATCA 
CCAGCTC CTroTGAAGTCGATTACTTCAGAAGTTCCAGCAGCTAAAGAGGA 
AGTTAAACCAACTCAGACGTCAGTCAGTCAGT^ 

CITcTGTTGCCG CTGAAACACCAGCTCCAGTAGcTAAAGTAG CACCGGTA 
AGAACTGTAG CAGCC C CT AGAGTGG CAAGTGTTAAAGTAGT CACT CcTAA 
AGTAGAAACTGGTGCATCACCAGAGCATGTATCAGCTCCAGCAGTTCCTG 
TGACHACGACTTCAACAGCTACAGACAGTAAGTT^ 

AAGAGCGTTCCGGTAGCACAAAAAGCTCCAACAGCAACACCGGTAGCACA 
ACCAGCTTCAACAACAAATGCACTAGCTGC^ 

TCCAACCTCATGTTGCAGCTTATAAAGAAAAAGTAGCGTCAACI^AT^ 
GTTAATGAATTCAGTACATACCGTGCGGGAGATCCAGGTGATCATGGTAA 
AGGTTTAGCAGTTGACTTTATTGTAGGTAAAAACCAAGCACTTGGTAATG 
AAGTTGCACAGTACTCT ACACA AAAt aTGG CAGCAAATAACATTTCATAT 
GTTATCTGGCaACAAAAGTTTTACTCAAATACAAATAGTATTTATGGACC 
TG CTAATACTTGGAATG CAATGCCAgATCGTGGTGGCGTITACTGCCAACC 
ACTATGACCA CGrTCAC GTATCATTTAACAAATAATATAAAAAAGGAAG C 
TATTTGGCn^CTTTTTT ATATG CCTTGCATAGAC t TTCAAGGTT CTTATA 
TAATTTTTATTA 

SEQ ZD HO. 6905 
STRAIN 18RS21 
CTGATTTGGTAAAGCAAGACAAT 

AAATCATCATATACTGTGAAATATGGTGATACAc^AAGcGTrATrTCAGA 
AGCAATGTCAATTGATATGAATGTCTTAGC^ 

ATATCAATCTTATTTATCcTGAGACAACaCrrGaCAGTAACriTACGATCAG 

AAGAGTCATACTGCCaCrrCAATGAAAATAGAAACACCAGCAaCAAATGC 

TGCTGGTCAaACAaCAGCTACTGTGGATTTGAAAA.CCAATC 

TTGCAGACCAAAAAGTTTCTCrrCAATACAATIT^ 

GAAGCAG CAACAACGATTGTTTCGCCAATGAAGA 

AGCTTTGAAaTCAAAAGAAGTATTAGCA^ 

CAGCAGCTAATGAACAGGTATCACCAGCTCCTGTGJ^ 

GAAGTTCCAGCAGCTAAAGAGGAAGTTAAACCAACTCAGACX3TCAGTCAG 

TCAGTCAACAACAGTATCACCAGCTTCTGTTGCC^ 

CAGTAGCTAAAGTAGCACCGGTAAGAACTGTAGCAGCCCCTAGAGTGGCA 

AGTGTTAAAGTAGTCACTCCTAAAGTAGAAACTGGTGCATCACCAGAGCA 

TGTATCAGCTCCAGCAGTTCCTGTGACTACGACTTC^ 

GTAAGTTACAAG CGACTGAAGTTAAGAGCGTTCCGGTAG CACAAAAAGCT 

CCAACAGCAACACCGGTAGCACAACCAGCTTCAACAACAAATGCAGTAGC 

TGCACATCXZTTGAAAATGCAGGGCTCCAACCTCAT^ 

AAAAAGTAGCGTCAACTTATGGAGTTAATGAATTCAGTACATACCGTGCG 
GGAGATCCAGGTGATCATGGTAAAGGTTTAGCAG 
TACTAATCAAGCACTITGGTAATAAAGTTGCACAGTACrcTACACA^ 
TGGCAGCAAATAACATTTCATATGTTATCTGGCAACAAAAG" 
AATACAAACAGTATTTATGGACCTGCrAATACrTGGAATG CAATGCCAGA 



AATAGACTTTCAAGGTTCTTATATAATTTTTATTA 

SEQ ID NO. 6906 
STRAIN COH1 
CTGATTT 

GGTAAAGCAAGACAATAAATCATCATATACTGTGAAATATGGTGATACAC 
TAAGCGTTATTTCAGAAGCAATGTCAATTGATATGAATGTCTI^AGC 
ATTAATAAC^TTGCAGATATCAATCTTATTTATCCTGAGACAACACrGAC 
AGTAACl^ACXSATCAGAAGAGTCATACrGCCACTTCAATGAAAATAGAAA 



ACCAATCAAGTTTTTGTTGCAGACCAAAAAGTTTcTCTC^ 

GGAAGGTATGACACCAGaaGCAGCAACAACGATTCTTTCGCCAATGAAGA 

CaTATTCTTCTGCGCCAGCTTTGAAATCAAAAGAA^ 

CAAGCTGTT AGTCAAGTAG CAGCTAATGAACAGGTATCACCAGCT 

GAAGTCJGATTACTTCAGAAGTTCCAGCAGCT^ 

CTCAGACGTCAGTCAGTCAGTTAACAACAGTATC^ CC 
GCTGAAACACCAG CTCCAGTAG CT AAAGTAGCAC CGGTAAGAACTGT AG C 
AGCX:CCTAGAGTGGCAAGTGcfrAAAGTAGTCACrCcTAAAGTAGAAACTC 
GTGCATCACCAGAGCATGTATCAGCTCCAGCAGT^ 
TCACCAGCFAGAGACAGTAAGTTACAAGCGACT 

GGTAGCACAAAAA6CTCCAACAGCAACACCGGTAGCACAACCAGCTTCAA 

CAACAAATGCAGTAGCTGCACATCCTGAAAATGCA^ 

GTTGCAGCTTATAAAGAAAAAGTAGCGTCAACTTATGGA^ 

CAGTACATACCGTGCGGGAGATCCAGGTGATCATGGTAAAGG^ 

TTGACTTTATTCTAGOTAAAAACCAAGCACTTGGTAATG 

TaCTCTACACAAAATATGGCAGCAAATAACATTTCATATGTTA 

ACAAAAGTTTTATTCAAATACAAATAGTATTTATGGA 

GGAATGCAATGCCAGATCGTGGTGGCGTTACTCCCA^ 

OTTCAC^ATCATTTAACAAATAATATAAAAAAGGAAGCrATTTGGCT^ 




1TGACCACGTTCACGTATCATTTA 
7TGGCTTCTTTTTTATATGCCTTG 
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UU"i"i"i"iATATGCCTTGAATAGAUi"i-i<^AAGGTTCTTATATAAi'i-i-i-rATT 
A 

SSQ XD NO. 6907 
STRAIN M732 

CTGATTTGGTAAAGCAAGACAATAAATCATCATATACTOTGAAATATGGT 

GATACAnTAAGCXaTTATTTCAGAAG CAATGTCAATTGATATGAATGTCTT 

AGCAAAAATTAATAACATTGCAGATATCAATC 

CACTGACAGTAACTTACGATCAGAAGAGTCAtJ\CTGCC^ 

ATAGAAACACCAGCAACAAATGCTGCTGGTCAAACAAC^ 

TTTGAAAACCAATCAAGTTTTTGTTGCAG^ 

CAATTTCGG AAGGT ATG ACAC CAGAAG CAG CAACAACGATTGTTT CG CCA 
ATGAAGACATATTCTTCTGCGCCAGCT^ 

ACAAGA6CAAGCTGTTAGTCAAGTAGCA6CTAATGAACAGGTATCACCAG 

CTCCTGTGAAGTCGATTACTTCAGAAGTrCCAGCAGJCT 

AAACCAACTCAGACGTCAGTCAGTCAGTTAACAACAGTATCACCAGCTTC 

TGTTGCCGCTGAAACACCAGCTCCAGTAGCTAAAG^AGCACCGGTAAGAA 

CTGTAGCAGCCCCTAGAGTGGCAAGTGCTAAAGTAGTCACTCCTAAAGTA 

GAAACTGGTGCATCACCAGAGCATGTATCAGC^ 

TACGACTTCACXZAGCTACAGACAGTAAGT^ 

GCGTTCCGGTAGCACAAAAAGCTCCAACAGCAaCACOGGT 

GCTTCAACAACAAATGGAGTAGCTGCAC^ 

ACCTCATGTTGCAGCTTATAAAGAAAAAGTAG CX3TCAACTTATGGAGTTA 

ATGAATTC^GTACATACCGTGCGGGAGATCCAGGTGATCATGGTA 

TT AG CAGTTGACTTTA ttgtaggtaaaaac cAAG CACTTGGTAATGAAGT 

TGCACAGTACTcTACACAAAATATGGCAG CAAATAACATTTCATATGTTA 

TCTGGCAACAAAAGTTTTATTCAAATACAA 

AATACTTGGAATGCAATGCCAGATCGTGGTGG CXnTrACTGCCAACCACTA 

TGACCACGTTCACGTATCATTTAACAAATAATATAAAAAAGGAAGCTATT 

TGGCTTCTTTTTTATATGCCTTGAATAGACTTTCAAGG^ 

TTTTATTA 

SKQ XD NO. 6908 

STRAIN M781 

CTGATTTGGTAAAG CAAGACAATAAATCATCATATACTGTGAAATATGGT 

AGaVAAAATTAATAACATTGCAGATATCAATCTTATTT 
CACTGACAGTAACITACX^TCAGAAGAGTCATACTGCCAC^ 
ATAGAAACACCAGCAACAAATG CTGCTGGT CAAACAACAGCTACTGTCGA 
TTTGAAAACCAATCAAGTTTTTGTTC 

caatttcx3gaaggtatgacaccagaag cagcaacaacgattgtttogcca 

atgaagacatattcttctgcgccagctttgaaatcaa 

acaagag caagctgttagt caagtag cag ct aatg aacaggtat cac cag 

ctcctgtgaagtcgattacitcagaagttccagcag 

aaaccaactcagacxstcagtcagtcagttaacaacagtatc^ 

tgttgcxgctgaaacaccag ctc^agtagctaaagtagcaccggtaagaa 

ctgtagcagccx:ctagagtggcaagtg ctaaagtagtcactcctaaagta 

GAAACTGGTGCATCACXIAGAGCATGTATC^ 

TAOGACTTCACGAGCTACAGACAGTaaGTTACAAGCGAC^ 

GCXnTCXX^jTAGCACAAAAAGCT^ CACAACCA 

GCTTGAACAACAAATGCAGTAGCTGCACATC^ 

ACCTCATGTTGCAGCTTATAAAGAAAAAGTAGCGTCAAC^ 

ATGAATTCAGTACATACCX3TGCGGGAGATCCAGGTGATCATC 

TTAGCAGTTGACTTTATTGTAGGTAAAAACCAAGCACTTGCT 

TGCACACTACTCTACACAAAATAT 

TCTGGCAACAAAAGTTTTATTCAAATACAAATA^ 

AATACTTGGAATGC^VATGCCAGATCGTGGTGGro 

TGACCACGTTCTVCGTATCATTTAACAAATAATATAAAAAAGGAA^ 

TGGCTTCTTTTTTATATGCCTTGAATAgACrTTC^ 

TTTTATTA 

SEQ XD NO. 6909 
STRAIN CJB 110 

CTGATTTGGTAAAGCAAGACAATAAATC^TCATATA^iTjlGAAA 

TATGGTGATACACTAAGCGTTATTTCAGAAGCAATG 

TGTCTTAGCAAAAATTAATAACATTGCAGATATCAATC^ 

AGACAACACTGACAGTAACITACX»TOVGAAG^ 

ATGAAAATAGAAACACCAGGAACAAATGCT 

TGTGGATTTGAAAACCAATCAAGTTTcTGT^ 

TCAATACAATTTCXKIAAGGTATOACACCAGAAGC^ 

TC<KX^AATGAAGACATATTCTTCTGCX5CCAG 

ATTAGCACAAGAGCAAGCIX5TTAGTCAAGCA^ 

CAACAGCTCCTGTGAAGTCGATTACTTC^^ CAGCTAAAGAG 

GAAGTTAAACCAACTCAGACGTC^GTCAGTCAGTCA^ 

AgCITCTGTTGCCGCTGAAACACCAGCrCCACT 

TAAgAACTGTAGCAGCCCCTAGAGTGXXIAAGTGTTA 

AAAGTAGAAACTGGTGCATCACCAGAGCATGTATCAGCT 

TGTGACTACGACTTCAACAGcTACAGACAGTaAGT^ 

TTAAGAG CGTTCCGGTAGCACAAAAAG CT CCAACAGCAACAC CGGTAGCA 
CAACCAG CTTCAACAACAAATGCAGTAGCTG CyU^TCXTrGAAAATGCAGG 
GCTCCAACCTCATGTTG CAG CTITATaAAGAAAAAGTAGCGTCAACTTATG 
GAGTTAATGAATTCAGTACATaCXXrrcCZAGG^ 
AAAGGTTTAGCAGTcGACrTTATTGTAgGTAAAAACCA^ 
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TCAAGTTGCACAGTACTCTACACAAAATATGGCAGC^ 
ATGTTATCTCGCAACAAAAGTT^ 

CCTGCTAATACTTGGAATGCAATGCCAGATCGTGGTGGCGTTAC^^ 
CCATTATGACCA TGTTCAC GTATCATTTAACAAATAATATAA 
GCTATTTGG LVrC^l"'riUU ATATG CCITGAATAGACt TTCAAGG'rrCrrA 
TATAATTTTTATTA 

SEQ ID NO. 6910 
STRAIN I169NT 
CTGATTTG 

GTAAAGCAAGACAATAAATC^TCATATACTGTGAAATATGGTGATACACT 
AAG CKjTTATTTCAGAAGCAATGTCAATTG^ 

TTAATAACATTGCAGATATCAATCTTATTTATCcTGAGACAAC^CTGACA 

GTAACTTACGATCAgAAGAGTCATACTGCCAClTCAATGAAAATAGAAAC 

ACCAGCAACAAATG CTGCTGGTCAAACAACAGCTACTGTGGATTTGAAAA 

CCAATCAAGTTTCTGTTGCAGACCAAAAAGTTTCTCTC^ 

GAAGGTATGACACCAGAAGCAgCAACAACGATTGTTTOGCCAATGAAGAC 

ATATTCTTCTGCGCCAGCITTgAAATCAAAAGAACT 

AAGCTGTTAGTCAAGCAG CAGCTAATGAAGAGGTATCACCAGCTCCTGTG 

AAGTCX^TTACITCAgAAGTTCCAgCAGCTAAAGAGGAAGTTAGAC^VaC 

TcAGACGTCAGTCAGTCAGTCAACAACAGTATCACCAgCITCTC 

CTGAAACACCAGCTCCAGTAGCTAAAGTAGCACCGGTAAGAACTGTAGC^ 

GCCCCAGCCCCTAGAGTGGCAAGTG CTAAAGTAGTCACTCCTAAAGTAGA 

AAcTGGTGCATCACCAGAGCATGTACCAGCTCCAGCAGTTcCT^ 

cGACTTCAACAGCTACaGACAaTcAGTTACAAGCGACTGT 

GtTCCGGTgGCACAAAAAGCTCCAACAGCAACACCG^ 

TT cAACAACAAATGCAGTAGcTGCACATCCT 

CTCATGTTGCAGCTTATAAAGAAAAAGTAG CGTCAACTTATGGAGTTAAT 
GAATTCAGTACATaCCGTGCGGGAGATCCAGGTGATCA^ 
AGCMTTGACTTTATIGTagGTAAAAACXMGCACTTGCT 
CACAGTACTCTACACAAAATATGG CAGCAAATAACATTTCATATGTTATC 
TGGCAAGAAAAGTTTTACTC^AATACAAATAGT^ 

TACTTGGAATGCAATGCCAGATCGTGGTGG CGTTACTGCCAACCACTATG 
ACCACGTTCACGTATCATITAACAAATAATATAAAAAAGGAAGCTATITG 
GCTTCT^TTTTTATATGCCTTGAATAGACTTT CAAGG t TCTTATATAATTT 
TTATTA 

SEQ ID NO. 6911 
STRAIN JM9 130013 

CTGATTTGGTAAAGCAAGACAATAAATCATCATATACT 
GTGAAATATGGTGATACACTAAGCGTTATTTC^ 

TATGAATGTCTTAGCAAAAATAAATAACATTG C^GATATCAATCTTATTT 

ATCcTGAGACAACACTGACAGTAACTTACGATCA 

ACTTCAATGAAAATAGAAACACCAGCAACAAATGCTC 

AGCTACTGTGGATTTGAAAACCAATCAAGTTTCrc 

TTTCTCTCAATACAATTTCGGAAGGTATGACAC^ 

ATTGTTTCGCCAATGAAGACATATTCT^CTGCGC CAG CTTTGAAATCAAA 

AGAAGTATTAGCACAAGAGGAAGCTGTTAG^ 

AGGTATCACCAGCTCCTGTGAAGTCGATTACTTC^ 

AAAGAGGAAGTTAAACCAACTCAGACGTCAGTCAGTCAGTCAA 

ATCACCAg^TTCTGTTGCCGCTGAAACACCAGCT 

CACCGGTAAGAACTGTAGCAGCCCCTAgAGTGGCAAGTGTTAAAGTAGTC 

ACTCCTAAAGTAGAAACTGGTGCATCACCAGAGCATOT 

AGTTCCTGTGACTACGACTTCIACCAGCTACAGaC^ 

C^IX3AAGTTAAGAGC<3TTCC!GGTAGCACAAAAAGCT 

GTAGCaCAACCAGCTTCAACAACAAATGCACT 

TGCAGGGCTCCAACCTCATGTTGCAGCTTATA 

CTTATGGAGTTAATGAATTCAGTACATACCGTGCGGGAGATC 

CATGGTAAAGGTTTAGCAGTTGACTTTATTGTAGGTACTAATC^ 

TGGTAATAAAGTTGCACAGTACTCTACACAAAATATGGCAGCAAATAACA 

TTTCATATGTTATCTGGCAACAAAAGTTTTACT 

TATGGACCn^CTAATACTTGGAATGCAATGCCAGATCGTG 

TGCCAACCACTATGACCACGTTCACGTATCATTTAACAA 

AAGGAAGCTATTTGGCTTCTTTTTTATATC 

TTCTTATATAATTTTTATTA 

PRETTY oft /biotmp/msal67919.2{*} March 11, 2003 08:55 .. 



raeal67919.2(322_COHl 
msal67919.2(322_M7Bl 
ihsal67919 . 2 { 322J4732 
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raeal67919 . 2 { 322_2603 
msal67919.2{322_JM9130013 
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msal67 919 . 2 { 322_CJB110 
msal67919 . 2 { 322_A909 
msal67919 . 2 { 322_H36B 
msal67919 . 2 { 322_1169NT 
Consensus 
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atgaataaaa aggtactatt gacatcgaca atggcagctt cgctattatc 



51 100 
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msal67919 . 2 ( 322_COHl 
msal67919 . 2 { 322_M781 
msal67919 . 2 { 322_M732 ' 
msal67919 . 2 {322_18RS21 
msal67919.2{322_2603' 
msal67919. 2(322 JM9130013' 
msal67919 . 2 { 322_090 
msal67919.2{322_CJB110 
msal67919 . 2 { 322_A909 
tnsal67 919 . 2 { 322_H3 6B 
rasal67919 . 2 { 322_1169NT 
Consensus 



msal67919 . 2 { 322_COHi; 
msal67919 . 2 { 322_M78 1 ' 
msal67919 . 2 { 322_M732 ( 
xneal67919.2{322 18RS2l' 
msal67919 . 2 { 322_2603 ' 
msal67919 . 2 { 322_JM9130013 
msal67919. 2 {322_090 
msal67919.2{322 CJB110 
msal67919 . 2 [ 322_A909 
msal67919 . 2 { 322_H36B 
msal67919.2{322_1169NT 
Consensus 



agtcgcaagt gttcaagcac aagaaacaga tacgacgtgg acagcacgta 

101 150 

. ct gatttggtaa agcaagacaa taaatcatca 

— . ct gatttggtaa agcaagacaa taaatcatca 

— ct gatttggtaa agcaagacaa taaatcatca 

ct gatttggtaa agcaagacaa taaatcatca 

ctgtttcaga ggtaaaggct gatttggtaa agcaagacaa taaatcatca 
_ — . ct gatttggtaa agcaagacaa taaatcatca 

ct gatttggtaa agcaagacaa taaatcatca 

ct gatttggtaa agcaagacaa taaatcatca 

ct gatttggtaa agcaagacaa taaatcatca 

ct gatttggtaa agcaagacaa taaatcatca 



msal67919 . 2 { 322_COHl 
msal67919 . 2 \ 322_M78 1 
msal67919.2{322 M732 
ltisal67919 . 2 {322_18RS21 
msal67919 . 2 { 322_2603 
msal67919.2{322_JM9130013 
rasal67919 . 2 {322_090 
rosal67919 . 2 {322_CJB110 
msal67919.2(322_A909 
msal67919 . 2 { 32 2_H36B 
rasal67919 . 2 {322_1169NT 
Consensus 



151 

tatactgtga 
tatactgtga 
tatactgtga 
tatactgtga 
tatactgtga 
tatactgtga 



aatatggtga 
aatatggtga 
aatatggtga 
aatatggtga 
aatatggtga 
aatatggtga 



tacactaagc 
tacactaagc 
tacantaagc 
tacactaagc 
tacactaagc 
tacactaagc 



gttatttcag 
gttatttcag 
gttatttcag 
gttatttcag 
gttatttcag 
gttatttcag 



200 

aagcaatgtc 
aagcaatgtc 
aagcaatgtc 
aagcaatgtc 
aagcaatgtc 
aagcaatgtc 



tatactgtga aatatggtga tacactaagc gttatttcag aagcaatgtc 
tatactgtga aatatggtga tacactaagc gttatttcag aagcaatgtc 
tatactgtga aatatggtga tacactaagc gttatttcag aagcaatgtc 
tatactgtga aatatggtga tacactaagc gttatttcag aagcaatgtc 



msal 67919 . 2 { 322_C0H1 
msal67919.2{322_M781 
msal67919.2{322_M732 
rasal67919.2{322_18RS21 
msal67919 . 2 { 322_2603 
msal67919 . 2 { 322_JM9130013 
rasal67919 . 2 {322_090 
msal67919.2{322_CJB110 
msal67919.2{3223909 
msal67919 . 2{322_H36B 
msal67919 . 2 { 322_1169NT 
Consensus 



201 

aattgatatg 
aattgatatg 
aattgatatg 
aattgatatg 
aattgatatg 
aattgatatg 



aatgtcttag 
aatgtcttag 
aatgtcttag 
aatgtcttag 
aatgtcttag 
aatgtcttag 



caaaaattaa 
caaaaattaa 
caaaaattaa 
caaaaataaa 
caaaaataaa 
caaaaataaa 



taacattgca 
taacattgca 
taacattgca 
taacattgca 
taacattgca 
taacattgca 



250 

gatatcaatc 
gatatcaatc 
gatatcaatc 
gatatcaatc 
gatatcaatc 
gatatcaatc 



aattgatatg aatgtcttag caaaaattaa taacattgca gatatcaatc 
aattgatatg aatgtcttag caaaaattaa taacattgca gatatcaatc 
aattgatatg aatgtcttag caaaaattaa taacattgca gatatcaatc 
aattgatatg aatgtcttag caaaaattaa taacattgca gatatcaatc 



msal67919.2{322_COHi; 
maal67919. 2(322 M781 
msal67 919 . 2 { 32 2_M73 2 
msal67919 . 2 { 322_18RS21 
msal67919 . 2{322_2603 
Hisal67919 ,2{322_JM9130013 
msal67919.2{322_090 
msal67919 . 2 { 322_CJB110 
msal67919 . 2 f 322_A909 
msal67919.2{322 H36B 
msal67919 . 2 { 322_1169NT 
Consensus 



251 

ttatttatcc 
ttatttatcc 
ttatttatcc 
ttatttatcc 
ttatttatcc 
ttatttatcc 

ttatttatcc 
ttatttatcc 
ttatttatcc 
ttatttatcc 



TGAGACAACA 
TGAGACAACA 
TGAGACAACA 
TGAGACAACA 
TGAGACAACA 
TGAGACAACA 
TGAGACAACA 
TGAGACAACA 
TGAGACAACA 
TGAGACAACA 
TGAGACAACA 



CTGACAGTAA 
CTGACAGTAA 
CTGACAGTAA 
CTGACAGTAA 
CTGACAGTAA 
CTGACAGTAA 
CTGACAGTAA 
CTGACAGTAA 
CTGACAGTAA 
CTGACAGTAA 
CTGACAGTAA 



CTTACGATCA 
CTTACGATCA 
CTTACGATCA 
CTTACGATCA 
CTTACGATCA 
CTTACGATCA 
CTTACGATCA 
CTTACGATCA 
CTTACGATCA 
CTTACGATCA 
CTTACGATCA 



300 

GAAGAGTCAT 
GAAGAGTCAT 
GAAGAGTCAT 
GAAGAGTCAT 
GAAGAGTCAT 
GAAGAGTCAT 
GAAGAGTCAT 
GAAGAGTCAT 
GAAGAGTCAT 
GAAGAGTCAT 
GAAGAGTCAT 



rasal67919.2(322_C0Hl 
rasal67919. 2(322 M781 j 
rasal67919 . 2{322"M732 ( 
msal67919 . 2 { 322_18RS21 
maal67919 . 2 { 322_2603 
msal67919.2{322 JM9130013 
msal67919T2{322_090 
rasal67919.2{322_CJB110 
msal67919.2(322_A909 
mBal67919 . 2{ 322_H36B 
rasal67919 . 2 {322_1169NT 
Consensus 



301 

ACTGCcACTT 
ACTGCcACTT 
ACTGCcACTT 
ACTGCcACTT 
ACTGCcACTT 
ACTGCcACTT 
ACTGCcA CTT 
ACTGCcA CTT 
ACTGCtACTT 
ACTGCtA CTT 
ACTGCcACTT 



CAATGAAAAT 
CAATGAAAAT 
CAATGAAAAT 
CAATGAAAAT 
CAATGAAAAT 
CAATGAAAAT 
CAATGAAAAT 
CAATGAAAAT 
CAATGAAAAT 
CAATGAAAAT 
CAATGAAAAT 



AGAAACACCA 
AGAAACACCA 
AGAAACACCA 
AGAAACACCA 
AGAAACACCA 
AGAAACACCA 
AGAAACACCA 
AGAAACACCA 
AGAAACACCA 
AGAAACACCA 
AGAAACACCA 



GCAACAAATG 
GCAACAAATG 
GCAACAAATG 
GCAACAAATG 
GCAACAAATG 
GCAACAAATG 
GCAACAAATG 
GCAACAAATG 
GCAACAAATG 
GCAACAAATG 
GCAACAAATG 



350 

CTGCTGGTCA 
CTGCTGGTCA 
CTGCTGGTCA 
CTGCTGGTCA 
CTGCTGGTCA 
CTGCTGGTCA 
CTGCTGGTCA 
CTGCTGGTCA 
CTGCTGGTCA 
CTGCTGGTCA 
CTGCTGGTCA 



991 



WO 2004/018646 



PCT/US2003/026827 



Table 69: Comparative Sequences relating to SAG0032 



maal67919 . 2 { 322_C0H1 
msal67919.2{322_M78l' 
msal67919 . 2 { 322_M732 ' 
msal67919 . 2 { 322_18RS21 
msal67919.2{322_2603 
tnsal67919.2{322_JM9130013 
msal67919.2{322_090 
msal67919 . 2 { 322_CJB110 
msal67919.2(322_A909 
msal67919.2{322_H36B 
msal67 919 . 2 {322_1169OT 
Consensus 



351 

AACAaCAGCT 
AACAaCAGCT 
AACAaCAGCT 
AACAaCAGCT 
AACAaCAGCT 
' AACAaCAGCT 
AACACCAGCT 
AACAcCAGCT 
AACAaCAGCT 
AACAaCAGCT 
AACAaCAGCT 



ACTGTcGATT 
ACTGTcGATT 
ACTGTcGATT 
ACTGTgGATT 
ACTGTgGATT 
ACTGTgGATT 
ACTGTgGATT 
ACTGTgGATT 
ACTGTcGATT 
ACTGTcGATT 
ACTGTgGATT 



TGAAAACCAA 
TGAAAACCAA 
TGAAAACCAA 
TGAAAACCAA 
TGAAAACCAA 
TGAAAACCAA 
TGAAAACCAA 
TGAAAACCAA 
TGAAAACCAA 
TGAAAACCAA 
TGAAAACCAA 



TCAAGTTTtT 
TCAAGTTTtT 
TCAAGTTTtT 
TCAAGTTTcT 
TCAAGTTTcT 
TCAAGTTTcT 
TCAAGTTTcT 
TCAAGTTTcT 
TCAAGTTTcT 
TCAAGTTTcT 
TCAAGTTTcT 



400 

GTTGCAGACC 
GTTGCAGACC 
GTTGCAGACC 
GTTGCAGACC 
GTTGCAGACC 
GTTGCAGACC 
GTTGCAGACC 
GTTGCAGACC 
GTTGCAGACC 
GTTGCAGACC 
GTTGCAGACC 



msal 67 9 19 . 2 { 32 2_C0H1 ] 
tnsal67919 . 2 { 322J4781 ' 
msal67919.2{322_M732 
msal67919 . 2 {322_18RS21 
msal 67919 . 2 { 32 2_2 603 ' 
tnsal67919.2{322_JM9130013 
msal67919 . 2 {322_090 
msal67919 . 2 {322_CJB110 
msal 67919. 2 {322_A909 
msal67919 . 2 { 32 2_H3 6B 
msal67919 . 2 { 322__1169NT 
Consensus 



401 

AAAAAGTTTC 
AAAAAGTTTC 
AAAAA GTTTC 
AAAAAGTTTC 
AAAAAGTTTC 
AAAAAGTTTC 
AAAAA GTTT C 
AAAAAGTTTC 
AAAAAGTTTC 
AAAAAGTTTC 
AAAAAGTTTC 



TCTCAATACA 
TCTCAATACA 
TCTCAATACA 
TCTCAATACA 
TCTCAATACA 
TCTCAATACA 
TCTCAATACA 
TCTCAATACA 
TCTCAATACA 
TCTCAATACA 
TCTCAATACA 



ATTTCGGAAG 
ATTTCGGAAG 
ATTTCGGAAG 
ATTTCGGAAG 
ATTTCGGAAG 
ATTTCGGAAG 
ATTTCGGAAG 
ATTTCGGAAG 
ATTTCGGAAG 
ATTTCGGAAG 
ATTTCGGAAG 



GTATGACACC 
GTATGACACC 
GTATGACACC 
GTATGACACC 
GTATGACACC 
GTATGACACC 
GTATGACACC 
GTATGACACC 
GTATGACACC 
GTATGACACC 
GTATGACACC 



450 

AGAAGCAGCA 
AGAAGCAGCA 
AGAAGCAGCA 
AGAAGCAGCA 
AGAAGCAGCA 
AGAAGCAGCA 
AGAAGCAGCA 
AGAAGCAGCA 
AGAAGCAGCA 
AGAAGCAGCA 
AGAAGCAGCA 



msal 679 19 . 2 {322_C0H1 ' 
msal67919.2{322_M78l' 
msal67919 . 2 { 322_M732 
msal67919.2{322 18RS21 
msal 6 7919 . 2 { 322_2603 
msal67919 . 2{ 322_JM9130013 
msal67919 .2 {322_090 
msal67919 . 2 {322_CJB110 
msal67919 . 2 { 322_A909 
msal67919.2{322_H36B 
msal67919 . 2 { 322_1169NT 
Consensus 



451 

ACAACGATTG 
ACAACGATTG 
ACAACGATTG 
ACAACGATTG 
ACAACGATTG 
ACAACGATTG 
ACAACGATTG 
ACAACGATTG 
ACAACGATTG 
ACAACGATTG 
ACAACGATTG 



TTTCGCCAAT 
TTTCGCCAAT 
TTTCGCCAAT 
TTTCGCCAAT 
TTTCGCCAAT 
TTTCGCCAAT 
TTTCGCCAAT 
TTTCGCCAAT 
TTTCGCCAAT 
TTTCGCCAAT 
TTTCGCCAAT 



GAAGACATAT 
GAAGACATAT 
GAAGACATAT 
GAAGACATAT 
GAAGACATAT 
GAAGACATAT 
GAAGACATAT 
GAAGACATAT 
GAAGACATAT 
GAAGACATAT 
GAAGACATAT 



TCTTCTGCGC 
TCTTCTGCGC 
TCTTCTGCGC 
TCTTCTGCGC 
TCTTCTGCGC 
T CTT CTGCGC 
TCTTCTGCGC 
TCTTCTGCGC 
TCTTCTGCGC 
TCTTCTGCGC 
TCTTCTGCGC 



500 

CAGCTTTGAA 
CAGCTTTGAA 
CAGCTTTGAA 
CAGCTTTGAA 
CAGCTTTGAA 
CAGCTTTGAA 
CAGCTTTGAA 
CAGCTTTGAA 
CAGCTTTGAA 
CAGCTTTGAA 
CAGCTTTGAA 



msal67919 . 2 [ 322_COHl} 
msal67919 . 2 f 322_M781 [ 
msal67919 . 2 { 322 JM732 
msal67919 . 2 {322_18RS21 
msal67919 . 2 {322_2603 , 
msal67 919 .2{322_JM9 130013 
msal67919 . 2 { 322_090 
msal67919.2{322 OJB110 
msal67919 . 2 { 322_A909 
msal67919.2{322_H36B 
msal67919.2{322_ll69NT] 
Consensus 



501 

ATCAAAAGAA 
ATCAAAAGAA 
ATCAAAAGAA 
ATCAAAAGAA 
ATCAAAAGAA 
ATCAAAAGAA 
ATCAAAAGAA 
ATCAAAAGAA 
ATCAAAAGAA 
ATCAAAAGAA 
ATCAAAAGAA 



GTATTAGCAC 
GTATTAGCAC 
GTATTAGCAC 
GTATTAGCAC 
GTATTAGCAC 
GTATTAGCAC 
GTATTAGCAC 
GTATTAGCAC 
GTATTAGCAC 
GTATTAGCAC 
GTATTAGCAC 



AAGaGCAAGC 
AAGaGCAAGC 
AAGaGCAAGC 
AAGaGCAAGC 
AAGaGCAAGC 
AAGaGCAAGC 
AAGaGCAAGC 
AAGaGCAAGC 
AAGgGCAAGC 
AAGgGCAAGC 
AAGaGCAAGC 



TGTTAGTCAA 
TGTTAGTCAA 
TGTTAGTCAA 
TGTTAGTCAA 
TGTTAGTCAA 
TGTTAGTCAA 
TGTTAGTCAA 
TGTTAGTCAA 
TGTTAGTCAA 
TGTTAGTCAA 
TGTTAGTCAA 



550 

GtAGCAGCTA 
GtAGCAGCTA 
GtAGCAGCTA 
GcAGCAGCTA 
GcAGCAGCTA 
GcAGCAGCTA 
GCAGCAGCTA 
GcAGCAGCTA 
GcAGCAGCTA 
GcAGCAGCTA 
GcAGCAGCTA 



msal67919 . 2 { 322_C0H1 
msal67919.2<322_M781 
msal67919 . 2 (322_M732 
msal67919.2{322_18RS21 
msal67919 . 2 { 322_2 603 
msal67919 .2{322_JM9130013 
msal67919.2{322_090 
msal67919.2{322_CJB110 
msal67919 . 2 (322_A909 
msal67919.2{322_H36B 
msal67919 . 2 {322_1169NT 
Consensus 



551 

ATGAACAGGT 
ATGAACAGGT 
ATGAACAGGT 
ATGAACAGGT 
ATGAACAGGT 
ATGAACAGGT 
ATGAACAGGT 
ATGAACAGGT 
ATGAACAGGT 
ATGAACAGGT 
ATGAACAGGT 



ATCAcCAGCT 
ATCAcCAGCT 
ATCAcCAGCT 
ATCAcCAGCT 
ATCACCAGCT 
ATCAcCAGCT 
ATCAaCAGCT 
ATCAaCAGCT 
ATCAcCAGCT 
ATCACCAGCT 
ATCAcCAGCT 



CCTGTGAAGT 
CCTGTGAAGT 
CCTGTGAAGT 
CCTGTGAAGT 
CCTGTGAAGT 
CCTGTGAAGT 
CCTGTGAAGT 
CCTGTGAAGT 
CCTGTGAAGT 
CCTGTGAAGT 
CCTGTGAAGT 



CGATTACTTC 
CGATTACTTC 
CGATTACTTC 
CGATTACTTC 
CGATTACTTC 
CGATTACTTC 
CGATTACTTC 
CGATTACTTC 
CGATTACTTC 
CGATTACTTC 
CGATTACTTC 



600 

AGAAGTTCCA 
AGAAGTTCCA 
AGAAGTTCCA 
AGAAGTTCCA 
AGAAGTTCCA 
AGAAGTTCCA 
AGAAGTTCCA 
AGAAGTTCCA 
AGAAGTTCCA 
AGAAGTTCCA 
AGAAGTTCCA 



msal67919 . 2 { 3 22_COHl 
msal 67919 . 2 I 322_M781 
msal67919 . 2 { 322_M732 
msal67 9 19 . 2 { 3 2 2_1 8RS2 1 
msal67919 . 2 {322_2603 
msal67919.2{322_JM9130013 
msal67919.2{322_090 
msal67919.2{322_CJB110 
msal67919 . 2 { 322_A909 
msal67919 . 2 { 322_H36B 
msal67919 . 2 { 322_1169NT 
Consensus 



601 

GCAGCTAAAG 
GCAGCTAAAG 
GCAGCTAAAG 
GCAGCTAAAG 
GCAGCTAAAG 
GCAGCTAAAG 
GCAGCTAAAG 
GCAGCTAAAG 
GCAGCTAAAG 
GCAGCTAAAG 
GCAGCTAAAG 



AGGAAGTTAa 
AGGAAGTTAa 
AGGAAGTTAa 
AGGAA GTTA a 
AGGAAGTTAa 
AGGAAGTTAa 
AGGAAGTTAa 
AGGAAGTTAa 
AGGAAGTTAa 
AGGAAGTTAa 
AGGAAGTTAg 



ACCAACTCAG 
ACCAACTCAG 
ACCAACTCAG 
ACCAACTCAG 
ACCAACTCAG 
ACCAACTCAG 
ACCAACTCAG 
ACCAACTCAG 
ACCAACTCAG 
ACCAACTCAG 
ACCAACTCAG 



ACGTCAGTCA 
ACGTCAGTCA 
ACGTCAGTCA 
ACGTCAGTCA 
ACGTCAGTCA 
ACGTCAGTCA 
ACGTCAGTCA 
ACGTCAGTCA 
ACGTCAGTCA 
ACGTCAGTCA 
ACGTCAGTCA 



650 

GTCAGTtAAC 
GTCAGTtAAC 
GTCAGTtAAC 
GTCAGTcAAC 
GTCAGTcAAC 
GTCAGTcAAC 
GTCAGTCAAC 
GTCAGTcAAC 
GTCAGTcAAC 
GTCAGTcAAC 
GTCAGTcAAC 



992 



WO 2004/018646 



PCT/US2003/026827 



Table 69: Comparative Sequences relating to SAG0032 



msal67919.2(322_COHl' 
msal67919.2{322_M781 
msal67919.2{322_M732 
msal67919 . 2 { 322_18RS21 ' 
msal67919 . 2 { 322J2 603 
msal67919 . 2 {322_JM9130013 
msal67919 . 2 {322_090 
msal67919 . 2 { 322_CJB110 
msal67919 . 2 f 322_A909 
maal67919 . 2 { 322_H36B 
msal67919 . 2 { 322JL169NT 
Consensus 



651 

AACAGTATCA 
AACAGTATCA 
AACAGTATCA 
AACAGTATCA 
AACAGTATCA 
AACAGTATCA 
AACAGTATCA 
AACAGTATCA 
AACAGTATCA 
AACAGTATCA 
AACAGTATCA 



CCAGCTTCTG 
CCAGCTTCTG 
CCAGCTTCTG 
CCAGCTTCTG 
CCAGCTTCTG 
CCAGCTTCTG 
CCAGCTTCTG 
CCAGCTTCTG 
CCAGCTTCTG 
CCAGCTTCTG 
CCAGCTTCTG 



TTGCCGCTGA 
TTGCCGCTGA 
TTGCCGCTGA 
TTGCCGCTGA 
TTGCCGCTGA 
TTGCCGCTGA 
TTGCCGCTGA 
TTGCCGCTGA 
TTGCCGCTGA 
TTGCCGCTGA 
TTGCCGCTGA 



AACACCAGCT 
AACACCAGCT 
AACACCAGCT 
AACACCAGCT 
AACACCAGCT 
AACACCAGCT 
AACACCAGCT 
AACACCAGCT 
AACACCAGCT 
AACACCAGCT 
AACACCAGCT 



700 

CCAGTAGCTA 
CCAGTAGCTA 
CCAGTAGCTA 
CCAGTAGCTA 
CCAGTAGCTA 
CCAGTAGCTA 
CCAGTAGCTA 
CCAGTAGCTA 
CCAGTAGCTA 
CCAGTAGCTA 
CCAGTAGCTA 



msal67919.2{322_COHl 
msal67919 . 2(322_M781 
nisal67919 . 2 (322_M732 
msal67919 . 2 { 322 JL8RS21 
msal67919 . 2 { 32 2J2603 
msal67919 . 2 { 322_JM9130013 
msal67919.2.{322_090 
mBal67919.2{322_CJB110 
msal67919 .2{322_A909 
n»sal67919 . 2 { 322_H36B 
msal67919.2{322_1169NT; 

Consensus 



701 

AAGTAGCACC 
AAGTAGCACC 
AAGTAGCACC 
AAGTAGCACC 
AAGTAGCACC 
AAGTAGCACC 
AAGTAGCACC 
AAGTAGCACC 
AAGTAGCACC 
AAGTAGCACC 
AAGTAGCACC 



GGTAAGAACT GTAG 

GGTAAGAACT GTAG 

GGTAAGAACT GTAG 

GGTAAGAACT GTAG 

GGTAAGAACT GTAG 

GGTAAGAACT GTAG 

GGTAAGAACT GTAG 

GGTAAGAACT GTAG 

GGTAAGAACT GTAG 

GGTAAGAACT GTAG 

GGTAAGAACT GTAGcagccc 



CAGCCCCTAG 
CAGCCCCTAG 
CAGCCCCTAG 
CAGCCCCTAG 
CAGCCCCTAG 
CAGCCCCTAG 
CAGCCCCTAG 
CAGCCCCTAG 
CAGCCCCTAG 
CAGCCCCTAG 
CAGCCCCTAG 



750 

AGTGGCAAGT 
AGTGGCAAGT 
AGTGGCAAGT 
AGTGGCAAGT 
AGTGGCAAGT 
AGTGGCAAGT 
AGTGGCAAGT 
AGTGGCAAGT 
AGTGGCAAGT 
AGTGGCAAGT 
AGTGGCAAGT 



msal67919 . 2 ( 322_COHi; 
msal67919 . 2 (322_M781 
msal67919.2{322_M732 
msal67919 . 2 { 322_18RS2 1 
msal67919.2{322__2603 
msal67919.2{322_JM9130013' 
msal67919.2{322_090 
msal67919 . 2 { 322_CJB110 ' 
rasal67919 . 2 f 322_A90 9 
msal67919.2(322_H36B 
msal67919 .2{322_1169NT 
Consensus 



751 

GcTAAAGTAG 
GcTAAAGTAG 
GcTAAAGTAG 
GtTAAAGTAG 
GtTAAAGTAG 
GtTAAAGTAG 
GtTAAAGTAG 
GtTAAAGTAG 
GtTAAAGTAG 
GtTAAAGTAG 
GcTAAAGTAG 



TCACTCCTAA 
TCACTCCTAA 
TCACTCCTAA 
TCACTCCTAA 
TCACTCCTAA 
TCACTCCTAA 
TCACTCCTAA 
TCACTCCTAA 
TCACTCCTAA 
TCACTCCTAA 
TCACTCCTAA 



AGTAGAAACT 
AGTAGAAACT 
AGTAGAAACT 
AGTAGAAACT 
AGTAGAAACT 
AGTAGAAACT 
AGTAGAAACT 
AGTAGAAACT 
AGTAGAAACT 
AGTAGAAACT 
AGTAGAAACT 



GGTGCATCAC 
GGTGCATCAC 
GGTGCATCAC 
GGTGCATCAC 
GGTGCATCAC 
GGTGCATCAC 
GGTGCATCAC 
GGTGCATCAC 
GGTGCATCAC 
GGTGCATCAC 
GGTGCATCAC 



800 

CAGAGCATGT 
CAGAGCATGT 
CAGAGCATGT 
CAGAGCATGT 
CAGAGCATGT 
CAGAGCATGT 
CAGAGCATGT 
CAGAGCATGT 
CAGAGCATGT 
CAGAGCATGT 
CAGAGCATGT 



msal67919 . 2{ 322_COHi; 
msal67919 . 2 (322_M781 
msal67919 . 2 { 322_M732 
msal67919 . 2 { 322_18RS2 1 
msal67919.2{322 2603 
msal67919.2{322_JM9130013 
msal67919.2{322_090 
msal67919 . 2 { 322_CJB110 
rasal67919 . 2 (322_A909 
rasal67919.2{322_H36B 
msal67919.2{322_1169NT 
Consensus 



801 

AtCAGCTCCA 
AtCAGCTCCA 
AtCAGCTCCA 
AtCAGCTCCA 
AtCAGCTCCA 
AtCAGCTCCA 
AtCAGCTCCA 
AtCAGCTCCA 
AtCAGCTCCA 
AtCAGCTCCA 
ACCAGCTCCA 



GCAGTTCCTG 
GCAGTTCCTG 
GCAGTTCCTG 
GCAGTTCCTG 
GCAGTTCCTG 
GCAGTTCCTG 
GCAGTTCCTG 
GCAGTTCCTG 
GCAGTTCCTG 
GCAGTTCCTG 
GCAGTTCCTG 



TGACTACGAC 
TGACTACGAC 
TGACTACGAC 
TGACTACGAC 
TGACTACGAC 
TGACTACGAC 
TGACTACGAC 
TGACTACGAC 
TGACTACGAC 
TGACTACGAC 
TGACTACGAC 



TTCAcCAGCT 
TTCAcCAGCT 
TTCAcCAGCT 
TTCAcCAGCT 
TTCAcCAGCT 
TTCAcCAGCT 
TTCAaCAGCT 
TTCAaCAGCT 
TTCAaCAGCT 
TTCAaCAGCT 
TTCAaCAGCT 



850 

ACAGACAgTA 
ACAGACAgTA 
ACAGACAgTA 
ACAGACAgTA 
ACAGACAgTA 
ACAGACAgTA 
ACAGACAgTA 
ACAGACAgTA 
ACAGACAgTA 
ACAGACAgTA 
ACAGACAaTA 



msal67919.2(322_COHl] 
msal67919 . 2(322_M781 
msal67919 . 2 { 322_M732 
msal67919 . 2 {322_18RS21 
msal67919 . 2 { 322__2603 
msal67919.2{322_JM9130013 
msa!67919 . 2 {322_090 
msal 67919 . 2 {322_CJB110 
msal67919 . 2 { 322_A909 
msal67919 . 2 { 322_H36B 
msal67919 . 2 { 322_1169NT 
Consensus 



851 

AGTTACAAGC 
AGTTACAAGC 
AGTTACAAGC 
AGTTACAAGC 
AGTTACAAGC 
AGTTACAAGC 
AGTTACAAGC 
AGTTACAAGC 
AGTTACAAGC 
AGTTACAAGC 
AGTTACAAGC 



GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 
GACTGAAGTT 



AAGAG CGTT C 
AAGAGCGTTC 
AAGAGCGTTC 
AAGAG CGTT C 
AAGAGCGTTC 
AAGAGCGTTC 
AAGAGCGTTC 
AAGAGCGTTC 
AAGAGCGTTC 
AAGAGCGTTC 
AAGAGCGTTC 



CGGTaGCACA 
CGGTaGCACA 
CGGTaGCACA 
CGGTaGCACA 
CGGTaGCACA 
CGGTaGCACA 
CGGTaGCACA 
CGGTaGCACA 
CGGTaGCACA 
CGGTaGCACA 
CGGTgGCACA 



900 
AAAAGCTCCA. 
AAAAGCTCCA 
AAAAGCTCCA 
AAAAGCTCCA 
AAAAGCTCCA 
AAAAGCTCCA 
AAAAGCTCCA 
AAAAGCTCCA 
AAAAGCTCCA 
AAAAGCTCCA 
AAAAGCTCCA 



msal67919 . 2 {322_C0Hl' 
msal67919 . 2 (322_M781 , 
msal67919.2{322_>!732 

msal67919 . 2 { 322_18RS21 
msal67919 . 2 { 322_2603 
msal67919.2{322_JM9130013 
msal67919.2{322_090 

msal 67 9 19 . 2 { 3 2 2_CJB1 1 0 
msal67919 . 2 {322_A909 
msal67919 . 2 (322_H36B 

mBal67919.2(322 1169NT 



901 

ACAGCAACAC 
ACAGCAACAC 
ACAGCAACAC 
ACAGCAACAC 
ACAGCAACAC 
ACAGCAACAC 
ACAGCAACAC 
ACAGCAACAC 
ACAGCAACAC 
ACAGCAACAC 
ACAGCAACAC 



CGGTAGCACA 
CGGTAGCACA 
CGGTAGCACA 
CGGTAGCACA 
CGGTAGCACA 
CGGTAGCACA 
CGGTAGCACA 
CGGTAGCACA 
CGGTAGCACA 
CGGTAGCACA 
CGGTAGCACA 



ACCAGCTTCA 
ACCAGCTTCA 
ACCAGCTTCA 
ACCAGCTTCA 
ACCAGCTTCA 
ACCAGCTTCA 
ACCAGCTTCA 
ACCAGCTTCA 
ACCAGCTTCA 
ACCAGCTTCA 
ACCAGCTTCA 



ACAACAAATG 
ACAACAAATG 
ACAACAAATG 
ACAACAAATG 
ACAACAAATG 
ACAACAAATG 
ACAACAAATG 
ACAACAAATG 
ACAACAAATG 
ACAACAAATG 
ACAACAAATG 



950 

CAGTAGCTGC 
CAGTAGCTGC 
CAGTAGCTGC 
CAGTAGCTGC 
CAGTAGCTGC 
CAGTAGCTGC 
CAGTAGCTGC 
CAGTAGCTGC 
CAGTAGCTGC 
CAGTAGCTGC 
CAGTAGCTGC 



993 



WO 2004/018646 



PCT/US2003/026827 



Table 69: C mparative Sequences relating to SAG0032 



Consensus 



msal67919.2(322_COHl 
msal67919. 2(322 M7B1 
msal67919 . 2 { 322J4732 
msal67919.2{322 18RS21 
msal67919.2{322 2603 
msal679X9.2{322_JM9130013 
msal67919 .2 {322_090 
msal67919 . 2 {322_CJB110 
msal67919.2f 322_A909 
msal67919 . 2 { 32 2_H36B 
msal67919.2{322_1169NT' 
Consensus 



msal67919 . 2 { 322_COHl 
msal67919.2f322_M781 
msal67919.2{322_M732 
msal67919 . 2 { 322_18RS21 
msal67919.2{322_2603 
msal67919 . 2 { 322_JM9 130013 
msal67919.2{322_090 
msal67919.2{322_CJB110 
msal67919 . 2 { 322_A909 
msal67919 . 2 {322_H36B 
msal67919.2{322_1169NT 
Consensus 



951 

ACATCCTGAA 
ACATCCTGAA 
ACATCCTGAA 
ACATCCTGAA 
ACATCCTGAA 
ACATCCTGAA 
ACATCCTGAA 
ACATCCTGAA 
ACATCCTGAA 
ACATCCTGAA 
ACATCCTGAA 



AATGCAgGgC 
AATGCAgGgC 
AATGCAgGgC 
AATGCAgGgC 
AATGCAgGgC 
AATGCAgGgC 
AATGCAgGgC 
AATGCAgGgC 
AATGCAaGgC 
AATGCAaGgC 
AATGCAgGaC 



********** ******_*-* 



TCCAACCTCA 
TCCAACCTCA. 
TCCAACCTCA 
TCCAACCTCA 
TCCAACCTCA 
TCCAACCTCA 
TCCAACCTCA 
TCCAACCTCA 
TCCAACCTCA 
TCCAACCTCA 
TCCAACCTCA 
********** 



TGTTGCAGCT 
TGTTGCAGCT 
TGTTGCAGCT 
TGTTGCAGCT 
TGTTGCAGCT 
TGTTGCAGCT 
TGTTGCAGCT 
TGTTGCAGCT 
TGTTGCAGCT 
TGTTGCAGCT 
TGTTGCAGCT 
********** 



1001 

AAGTAGCGTC 
AAGTAGCGTC 
AAGTAGCGTC 
AAGTAGCGTC 
AAGTAGCGTC 
AAGTAGCGTC 
AAGTAGCGTC 
AAGTAGCGTC 
AAGTAGCGTC 
AAGTAGCGTC 
AAGTAGCGTC 



AACTTATGGA 
AACTTATGGA 
AACTTATGGA 
AACTTATGGA 
AACTTATGGA 
AACTTATGGA 
AACTTATGGA 
AACTTATGGA 
AACTTATGGA 
AACTTATGGA 
AACTTATGGA 



GTTAATGAAT 
GTTAATGAAT 
GTTAATGAAT 
GTTAATGAAT 
GTTAATGAAT 
GTTAATGAAT 
GTTAATGAAT 
GTTAATGAAT 
GTTAATGAAT 
GTTAATGAAT 
GTTAATGAAT 



TCAGTACATA 
TCAGTACATA 
TCAGTACATA 
TCAGTACATA 
TCAGTACATA 
TCAGTACATA 
TCAGTACATA 
TCAGTACATA 
TCAGTACATA 
TCAGTACATA 
TCAGTACATA 



1000 
TATAAAGAAA 
TATAAAGAAA 
TATAAAGAAA 
TATAAAGAAA 
TATAAAGAAA 
TATAAAGAAA 
TATAAAGAAA 
TATAAAGAAA 
TATAAAGAAA 
TATAAAGAAA 
TATAAAGAAA 
********** 

1050 
CCGTGCgGGa 
CCGTGOgGGa 
CCGTGCgGGa 
CCGTGOgGGa 
CCGTGCgGGa 
CCGTGCgGGa 
CCGTGCaGGt 
CCGTGCaGGt 
CCGTGCgGGa 
CCGTGCgGGa 
CCGTGCgGGa 



msal67919 . 2 { 322 jCOHl \ 
msal67919 . 2 I 322_M781 
msa!67919 . 2 {322_M732 
msal67919 . 2 { 322_18RS21 
msal67919 . 2 { 322J2603 
rasal67919 . 2{322_JM9130013 
insal67919.2{322_090 
msal67919 . 2 { 322_CJB110 
rasal67919 . 2 {322_A909 
msal67919 . 2 { 322_H3 6B 
msal67919 . 2 { 322_1169NT 
Consensus 



1051 

GATCCAGGTG 
GATCCAGGTG 
GATCCAGGTG 
GATCCAGGTG 
GATCCAGGTG 
GATCCAGGTG 
GATCCAGGTG 
GATCCAGGTG 
GATCCAGGTG 
GATCCAGGTG 
GATCCAGGTG 



ATCATGGTAA 
ATCATGGTAA 
ATCATGGTAA 
ATCATGGTAA 
ATCATGGTAA 
ATCATGGTAA 
ATCATGGTAA 
ATCATGGTAA 
ATCATGGTAA 
ATCATGGTAA 
ATCATGGTAA 



AGGTTTAGCA 
AGGTTTAGCA 
AGGTTTAGCA 
AGGTTTAGCA 
AGGTTTAGCA 
AGGTTTAGCA 
AGGTTTAGCA 
AGGTTTAGCA 
AGGTTTAGCA 
AGGTTTAGCA 
AGGTTTAGCA 



GTtGACTTTA 
GTtGACTTTA 
GTtGACTTTA 
GTtGACTTTA 
GTtGACTTTA 
GTtGACTTTA 
GTcGACTTTA 
GTcGACTTTA 
GTtGACTTTA 
GTtGACTTTA 
GTtGACTTTA 



1100 
TTGTAGGTAa 
TTGTAGGTAa 
TTGTAGGTAa 
TTGTAGGTAc 
TTGTAGGTAc 
TTGTAGGTAc 
TTGTAGGTAa 
TTGTAGGTAa 
TTGTAGGTAa 
TTGTAGGTAa 
TTGTAGGTAa 



msal67919.2(322 COHi; 
msal67919 . 2 (322_M781 
msal67919.2{322_M732| 
msal67919.2{322_18RS21 
ntsal67919 ,2{322_2603 
msal67919 . 2 { 322_JM9130013 
msal67919.2{322_090 
rasal67 919 . 2 { 322_CJB110 
msal67919 . 2 {322_A909 
msa!67919 » 2 (322_H36B 
msal67919 . 2 { 322_1169NT 
Consensus 



1101 

aAAcCAAGCA 
aAAcCAAGCA 
aAAcCAAGCA 
tAAtCAAGCA 
tAAtCAAGCA 
tAAtCAAGCA 
aAAcCAAGCA 
aAAcCAAGCA 
aAAcCAAGCA 
aAAcCAAGCA 
aAAcCAAGCA 



CTTGGTAATg 
CTTGGTAATg 
CTTGGTAATg 
CTTGGTAATa 
CTTGGTAATa 
CTTGGTAATa 
CTTG GTAATg 
CTTGGTAATg 
CTTGGTAATg 
CTTG GTAATg 
CTTGGTAATg 



AAGTTGCACA 
AAGTTGCACA 
AAGTTGCACA 
AAGTTGCACA 
AAGTTGCACA 
AAGTTGCACA 
AAGTTGCACA 
AAGTTGCACA 
AAGTTGCACA 
AAGTTGCACA 
AAGTTGCACA 



GTACTCTACA 
GTACTCTACA 
GTACTCTACA 
GTACTCTACA 
GTACTCTACA 
GTACTCTACA 
GTACTCTACA 
GTACTCTACA 
GTACTCTACA 
GTACTCTACA 
GTACTCTACA 



1150 
CAAAATATGG 
CAAAATATGG 
CAAAATATGG 
CAAAATATGG 
CAAAATATGG 
CAAAATATGG 
CAAAATATGG 
CAAAATATGG 
CAAAATATGG 
CAAAATATGG 
CAAAATATGG 



msal67919.2{322 COHl] 
msal67919.2f3223l781 
msal67919.2{322_M732 
msal67919.2{322_18RS21 
msal67919 . 2 { 322_2603 
msal67919 .2{322_JM9130013 
msal67919 . 2 { 322_090 
msal67919 . 2 { 322_CJB110 
msal67919 . 2 [ 322_A90 9 
msal67919.2{322_H36B 
msal67919.2{322_1169NT 
Consensus 



1151 

CAGCAAATAA 
CAGCAAATAA 
CAGCAAATAA 
CAGCAAATAA 
CAGCAAATAA 
CAGCAAATAA 
CAGCAAATAA 
CAGCAAATAA 
CAGCAAATAA 
CAGCAAATAA 
CAGCAAATAA 



CATTTCATAT 
CATTTCATAT 
CATTTCATAT 
CATTTCATAT 
CATTTCATAT 
CATTTCATAT 
CATTTCATAT 
CATTTCATAT 
CATTTCATAT 
CATTTCATAT 
CATTTCATAT 



GTTATCTGGC 
GTTATCTGGC 
GTTATCTGGC 
GTTATCTGGC 
GTTATCTGGC 
GTTATCTGGC 
GTTATCTGGC 
GTTATCTGGC 
GTTATCTGGC 
GTTATCTGGC 
GTTATCTGGC 



AACAAAAGTT 
AACAAAAGTT 
AACAAAAGTT 
AACAAAAGTT 
AACAAAAGTT 
AACAAAAGTT 
AACAAAAGTT 
AACAAAAGTT 
AACAAAAGTT 
AACAAAAGTT 
AACAAAAGTT 



1200 
TTAtTCAAAT 
TTAtTCAAAT 
TTAtTCAAAT 
TTAcTCAAAT 
TTAcTCAAAT 
TTACTCAAAT 
TTAcTCAAAT 
TTAcTCAAAT 
TTAcTCAAAT 
TTAcTCAAAT 
TTAcTCAAAT 



msal67919 

msal67919. 

msal67919. 
tnsal67919.2{ 

msal67919. 
msal67919.2{322 
msal67919 
msal67919.2{ 

maal67919. 

msal67919. 



2{322_C0H1 
2(322_M781 
2{322_M732 
322_18RS21 
2{322_2603 
JM9130013 
T2{322_090 
322_CJB110 
2{322_A909 
2{322_H36B 



1201 

ACAAAtAGTA 
ACAAAtAGTA 
ACAAAtAGTA 
ACAAAcAGTA 
ACAAAcAGTA 
ACAAAcAGTA 
ACAAAtAGTA 
ACAAAtAGTA 
ACAAAtAGTA 
ACAAAtAGTA 



TTTATGGACC 
TTTATGGACC 
TTTATGGACC 
TTTATGGACC 
TTTATGGACC 
TTTATGGACC 
TTTATGGACC 
TTTATGGACC 
TTTA TGGACC 
TTTATGGACC 



TGCTAATACT 
TGCTAATACT 
TGCTAATACT 
TGCTAATACT 
TGCTAATACT 
TGCTAATACT 
TGCTAATACT 
TGCTAATACT 
TGCTAATACT 
TGCTAATACT 



TGGAATGCAA 
TGGAATGCAA 
TGGAATGCAA 
TGGAATGCAA 
TGGAATGCAA 
TGGAATGCAA 
TGGAATGCAA 
TGGAATGCAA 
TGGAATGCAA 
TGGAATGCAA 



1250 
TGCCAGATCG 
TGCCAGATCG 
TGCCAGATCG 
TGCCAGATCG 
TGCCAGATCG 
TGCCAGATCG 
TGCCAGATCG 
TGCCAGATCG 
TGCCAGATCG 
TGCCAGATCG 



994 



WO 2004/018646 



PCT/US2003/026827 



Table 69: Comparative Sequences relating to SAG0032 



msal67919 ■ 2 { 322_1169NT} ACAAAtAGTA TTTATGGACC TGCTAATACT TGGAATGCAA TGCCAGATCG 
Consensus *****-**** ********** ********** ********** ********** 



ma al67 9 1 9 . 2 ( 3 2 2_COH 1 
msal67919.2(322_M781 
msal67919 . 2 { 322_M73 2 
msal67919 . 2 { 322_18RS2 1 
msal67919.2{322_2603 
msal67919.2{322 JM9130013 
msal6791972 {322_090 
msal67919.2{322_CJB110 
msal67919. 2(322 A909 
msal67919.2{322~H36B 
msal67919 . 2 { 322_1169NT 
Consensus 



1251 

TGGTGGCGTT 
TGGTGGCGTT 
TGGTGGCGTT 
TGGTGGCGTT 
TGGTGGCGTT 
TGGTGGCGTT 
TGGTGGC GTT 
TGGTGGCGTT 
TGGTGGCGTT 
TGGTGGCGTT 
TGGTGGCGTT 
********** 



ACTGCCAACC 
ACTGCCAACC 
ACTGCCAACC 
ACTGCCAACC 
ACTGCCAACC 
ACTGCCAACC 
ACTGCCAACC 
ACTGCCAACC 
ACTGCCAACC 
ACTGCCAACC 
ACTGCCAACC 
********** 



AcTATGACCA 
AcTATGACCA 
AcTATGACCA 
AcTATGACCA 
AcTATGACCA 
AcTATGACCA 
AtTATGACCA 
AtTATGACCA 
ACTATGACCA 
AcTATGACCA 
ACTATGACCA 
*_******** 



C GTT CAOGTA 
cGTTCACGTA 
CGTTCAOGTA 
cGTTCACGTA 
CGTTCACGTA 
CGTTCACGTA 
tGTTCACGTA 
tGTTCACGTA 
CGTTCACGTA 
cGTTCACGTA 
cGTTCACGTA 
_********* 



1300 
TCATTTAACA 
TCATTTAACA 
TCATTTAACA 
TCATTTAACA 
TCATTTAACA 
TCATTTAACA 
TCATTTAACA 
TCATTTAACA 
TCATTTAACA 
TCATTTAACA 
TCATTTAACA 
********** 



msal67919 . 2 ( 322_C0H1 
msal67919.2(322_M781 
msal67919 . 2 (322_M732 
msal67919 . 2 { 322_18RS2 1 
msal6791'9.2{322_2603 
msal67919.2{322 JM9130013 
msal67919T2{322_090 
msal67919 . 2 {322_CJB110 
msal67919.2{322_A909 
msal67919 . 2 { 322_H36B 
msal67919 . 2 {322_1169NT 
Consensus 



1301 

AATAATATAA 
AATAATATAA 
AATAATATAA 
AATAATATAA 
AATAATATAA 
AATAATATAA 
AATAATATAA 
AATAATATAA 
AATAATATAA 
AATAATATAA 
AATAATATAA 



AAAAGGAAGC 
AAAAGGAAGC 
AAAAGGAAGC 
AAAAGGAAGC 
AAAAGGAAGC 
AAAAGGAAGC 
AAAAGGAAGC 
AAAAGGAAGC 
AAAAGGAAGC 
AAAAGGAAGC 
AAAAGGAAGC 



TATTTGGCTT 
TATTTGGCTT 
TATTTGGCTT 
TATTTGGCTT 
TATTTGGCTT 
TATTTGGCTT 
TATTTGGCTT 
TATTTGGCTT 
TATTTGGCTT 
TATTTGGCTT 
TATTTGGCTT 



CTTTTTTATA 
CTTTTTTATA 
CTTTTTTATA 
CTTTTTTATA 
CTTTTTTATA 
CTTTTTTATA 
CTTTTTTATA 
CTTTTTTATA 
CTTTTTTATA 
CTTTTTTATA 
CTTTTTTATA, 



1350 
TGCCTTGaAT 
TGCCTTGaAT 
TGCCTTGaAT 
TGCCTTGaAT 
TGCCTTGaAT 
TGCCTTGaAT 
TGCCTTGaAT 
TGCCTTGaAT 
TGCCTTGcAT 
TGCCTTGcAT 
TGCCTTGaAT 



msal67919 . 2 (322_C0H1 
msal67919.2{322_M781 
rasal67919.2{322 M732 
msal 67 919 . 2 { 3 22_18RS2 1 
msal67919 . 2 { 322_2603 
msal67919.2{322_JM9130013 
msal67919.2{322_090 
msal 67919. 2 {322_CJB110 
msal67919 . 2 (322_A909 
msal67919.2{322_H36B 
msal67919 . 2 {322_1169NT 
Consensus 



1351 

AGACTTTCAA 
AGACTTTCAA 
AGACTTTCAA 
AGACTTTCAA 
AGACTTTCAA 
AGACTTTCAA 
AGACTTTCAA 
AGA CTTT CAA 
AGACTTTCAA 
AGACTTTCAA 
AGACTTTCAA 



GGTTCTTATA 
GGTTCTTATA 
GGTTCTTATA 
GGTTCTTATA 
GGTTCTTATA 
GGTTCTTATA 
GGTTCTTATA 
GGTTCTTATA 
GGTTCTTATA 
GGTTCTTATA 
GGTTCTTATA 



1382 

TAATTTTTAT TA 
TAATTTTTAT TA 
TAATTTTTAT TA 
TAATTTTTAT TA 
TAATTTTTAT TA 
TAATTTTTAT TA 
TAATTTTTAT TA 
TAATTTTTAT TA 
TAATTTTTAT TA 
TAATTTTTAT TA 
TAATTTTTAT TA 



SEQ ZD HO. 6912 
STRAIN 2603 frame: 1 

MbnCKVLLTSTMAASLLSVASVQAQETDTTWTART^ 

VI SEAMS I DMNVLAK I NN I AD I NL I YP ETTLTVT YDQKSHTAT SMXI ETP ATNAAGQTT A 
TVDLKTNQVSVADQKVSLNTI SEGMTPEAATTI VSPMKTYSSAPALKSKBVLAQBQAVSQ 
AAAKEQVSPAPVKS ITSEVPAAKEBVKPTQTSVSQSTTVS PASVAAETPAPVAKVAPVRT 
VAAPRVASVKVVTPKVETGAS PEHVSAPAVPVTTT S PATDS KLQATEVKS VPVAQKAPTA 
TPVAQPASTTNAYAAHPENAGIiQPHVAAYKEKVASTYGVNEFOT 

FI VGTNQALGNKVAQ YSTQNMAANN I SYV I WQQKFYSNTNS I YGPANTWNAMPDRGGVTA 
NHYDHVHVSFNK. YKKGS YUVS FL YALNRLSRFLYNFY 

SEQ ZD NO. 6913 
STRAIN 090 frame: 2 

ETTLTVTYDQKSHTATSMKI ETPATNAAGQTPATVDLKTNQVSVADQKVSLNTI SEGMTP 
EAATT I VSPMKTYSSAPALKSKEVLAQEQAVSQAAANEQVSTAPVKS ITSEVPAAKEEVK 
PTQTS VSQSTTVS P ASVAAETPAP VAKVAP VRTVAAPRVASVKVWPKVETGAS PEHVSA 
PAVP VTTTSTATDS KLQATEVKSVPVAQKAPTATPVAQ PASTTNAVAAHPENAGLQPHVA 
AYKEKVASTYGVNBFSTYRAGDPGDHGKSLAVDFI VGKNQALGNEVAQ YSTQNMAANN I S 
YVI WQQKFYSNTNS I YGPANTWNAMPDRGGVTANHYDHVHVSFNK . YKKGS YLASFLYAL 
NRLSRFLYNFY 

SEQ XD NO. 6914 
STRAIN A909 frame: 3 

DLVKQDNKSS YTVKYGDTL S VI SEAMS IDMNVLAKINNIADINLIYPETTLTVTYDQKSH 
TATSMKI ETPATNAAGQTTATVDLKTNQVSVADQKVS LNT I SEGMTPEAATTI VS PMKTY 
SSAPALKSKEVLAQGQAVSQAAANEQVS PAPVKS I TSEVPAAKEEVKPTQTS VSQSTTVS 
PASVAAETPAPVAKVAPVRTVAAPRVASVKVVTPKVE^ 

S KLQATEVKSVPVAQKAPTATPVAQ PASTTNAVAAHPENARIjQPHVAAYKEKVASTYGVN 
EP^TYRAGDPGDHGKG1AVDFIVGKNQAI/3NEVAQYSTQNMAANNI SYVI wqqkfysntn 
S I YGPANTWNAMPDRGGVTANHYDHVHVSFNK . YKKGSYLAS FLYALHRIiSRFIjYNFY 

SEQ ZD NO. '6915 
STRAIN H36B frame: 3 

DLVKQDNKSS YTVKYGDTLS VT S EAMS I DMNVLAKINNI ADINL I YPETTLTVTYDQKSH 

TATSMKI BTPATNAAGQTTATVDUO^QVSVADQKVSIiNT I SEGMTP 

S SAP ALKS KEVLAQGQAVSQAAANEQVSPAPVKS I TSBVPAAKEEVKPTQTSVSQSTTVS 

PASVAAETPAPVAKVAP VRTVAAP R VASVKWTP KVBTGAS PEHVSAPAVPVTTTSTATD 

SKLQATEVKSVFVAQKAPTATPVAQPASTTNAVAAHPENAR 



995 



WO 2004/018646 



PCTAJS2003/026827 



Table 69: Comparative Sequences relating to SAG0032 



EFSTYRAGDPGDHGKGLAVDF I VGKNQALGNEVAQYSTQNMAANN I S YVI WQQKFYSNTN 
S I YGPANTWNAM PDRGGVTANHYDHVHVSFNK . YKKGSYLASFLYALHRLSRFLYNFY 

SEQ ID NO. 6916 
STRAIN 18RS21 frame: 3 

DLVKQDNKSSYTVKYGDTLSVI SEAMS IDMNVLAKINNIADINLI YPETTLTVTYDQKSH 
TATSMKI ET PATNAAGQTTATVDLKTNQVSVADQKVSLNT I SEGMTPEAATTIVSPMKTY 
S SAPALKSKEVLAQEQAVS QAAANEQVSPAPVKS ITSEVPAAKEEVKPTQTS VSQSTTVS 
PASVAAETPAPVAKVAP VRTVAAPRVASVKVVTPKVETGAS PEHVSAPAVPVTTTSPATO 
SKLQATEVKS VP VAQ KAPTAT P VAQ PASTTNAVAAHPENAGLQ PHVAAYKE KVASTYGVN 
EFSTYRAGD PGDHGKGLAVDFI VGTNQALGNKVAQYSTQNMAANNI S YVI WQQKFYSNTN 
S I YG PANTWNAMPDRGGVTANHYDHVHVS FNK . YKKGSYLASFLYALNRLSRFLYNFY 

SEQ ZD NO. 6917 
STRAIN M732 frame: 3 

DLVKQDNKSSYTVKYGDTXSVI SEAMS IDMNVLAKINNIADINLI YPETTLTVTYDQKSH 
TATSMKI ETPATNAAGQTTATVDL.KTNQVFVADQKVSLNT I S EGMTPEAATT I VS PMKTY 
SSAPALKSKBV1AQBQAVSQVAANEQVSPAPVKS ITSEVPAAKEEVKPTQTSVSQLTTVS 
PASVAAETPAPVAKVAP VRTVAAPRVASAi<VVTPKVETC 
SKLQ^TEVKSVPVAQKAPTASPVAQPASTTNAVAAHPENAGI^ 

BFSTYRAGD PGDHGKGLAVDFI VGKNQALGNEVAQYSTQNMAANNI SYVI WQQKFYSNTN 
S I YGPANTWNAMPD RGG VTANHYDHVHVS FNK . YKKGS YLAS FL YALNRLSRFL YNFY 

SEQ ZD NO. 6918 
STRAIN COH1 frame: 3 

DLVKQDNKSSYTVKYGDTLSVI SEAMS IDMNVIAKINNIADINLI YPETTLTVTYDQKSH 
TATSMKI BTPATNAAGQTTATVDLKTNQVFVADQKVSLNTI SEGMTPEAATTIVSPMKTY 
SSAPALKSKEVIAQEQAVSQVAANEQVSPAPVKS ITSEV 

PASVAAETPAPVAKVAP VRTVAAP RVASAKVVTPKVETGAS PEHVSAPAVP VTTTSPATD 

SKLQATEVKSVPVAQKAPTATPVAQPASTTNAVAAHPENAGLQPHTO 

EFSTYRAGD PGDHG KGLAVDF I VGKNQALGNEVAQYSTQNMAANN I SYVI WQQKFYSNTN 

S I YGPANTWNAMPDRGG VTANHYDHVHVS FNK . YKKGSYLASFLYALNRLSRFLYNFY 

SEQ ID NO. 6919 
STRAIN M781 frame: 3 

DLVKQDNKSSYTVKYGDTLSVI SEAMS IDMNVLAKINNIADINLI YPETTLTVTYDQKSH 
TATSMKI ETPATNAAGQTTATVDLKTNQVFVADQKVSLNTI SEGMTPEAATTIVSPMKTY 
SSAPALKSKEVLAQEQAVSQVAANEQVSPAPVKS ITSEVPAAKEEVKPTQTSVSQLTTVS 
PASVAAETPAPVAKVAP VRTVAAP RVASAKVVTPKVETGAS PEHVSAPAVPVTTT S PATD 
SKLQATEVKSVPVAQKAPTATPVAQPASTTNAVAAHPENAGI^ 

EFSTYRAGDPGDHGKGLAVDF I VGKNQALGNEVAQYSTQNMAANN I SYVI WQQKFYSNTN 
S I YGPANTWNAM PDRGGVTANHYDHVHVS FNK . YKKGSYLASFL YALNRLSRFL YNFY 

SEQ ZD NO. 6920 
STRAIN CJB 1 1 0 frame: 3 

DLVKQDNKSSYTVKYGDTLSVI SEAMS IDMNVIAKINNIADINLI YPETTLTVTYDQKSH 
TATSI^BTPATNAAGQTPATVDLKTNQVSVADQKVSLNTI SEGMTPEAATTIVSPMKTY 
SSAPALKSKEVLAQEQAVSQAAANEQVSTAPVKS I TSEVPAAKEEVKPTQTSVSQSTTVS 
PASVAAETPAPVAKVAPVRTVAAPRVASVKVVTPKVETGAS PEHVSAPAVP VTTTSTATD 
SKLQATEVKSVPVAQKAPTATPVAQPASTTNAVAAHPENAGLQPH^ 
BFSTYRAGDPGDHGKGLAVDFI VGKNQALGNEVAQYSTQNMAANNI SYVI WQQKFYSNTN 
SI YGPANTWNAMPDRGGVTANHYDHVHVSFNK . YKKGSYLASFLYALNRLSRFLYNFY 

SEQ ZD NO. 6921 
STRAIN 1 1 69NT frame: 3 

DLVKQDNKSSYTVKYGDTLSVI SEAMS IDMNVLAKINNIADINLI YPETTLTVTYDQKSH 
TATSMKI ETPATNAAGQTTATVDLKTNQVSVADQKVSLNTI S EGMTPEAATT I VS PMKTY 
SSAPALKSKBVLAQEQAVSQAAANEQVSPAPVKS ITSEVPAAKEEVRPTQTSV SQST TVS 
PASVAAETPAPVAKVAP VRTVAAP APRVASAKVVTPKVETGASPEHV^ 
TDNKLQATEVKSVPVAQKAPTATPVAQPASTTNAVAAHPBN^ 

VNEFSTYRAGDPGDHGKGLAVDF I VGKNQALGNEVAQYSTQNMAANN I SYVI WQQKFYSN 
TNSI YGPANTWNAMPDRGGVTANHYDHVHVSFNK . YKKGSYLASFLYALNRLSRFLYNFY 

SEQ ZD NO. 6922 
STRAIN JM9130013 frame: 3 

DLVKQDNKS SYTVKYGDTL SVI SEAMS IDMNVLAKINNIADINLI YPETTLTVTYDQKSH 
TATSMKI ET PATNAAGQTTATVDLKTNQVSVADQKVS LNT I SEGMTPEAATTIVSPMKTY 
SSAPALKSKBVIAQEQAVSQAAANEQVSPAPVKSITSEWAAKBBVKOTQTSV^ 
PASVAAETPAPVAKVAP VRTVAAPRVASVKVVTPKVETGA^ 

SKLQATEVKSVP VAQKAPTATPVAQ PASTTNAVAAHPENAGLQPHVAAYKEKVASTYGVN 
BFSTYRAGDPGDHGKX3LAVDFI VGTNQALGNKVAQYSTQNMAANN I SYVI WQQKFYSNTN 
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msa2 3 7 0 4 9 . 2 ( 3 2 2_C JB 1 1 0 ' 
msa237049.2{322_18RS21 
msa237049 .2{322_2603 
msa237049.2{322_JM9130013 
msa237049.2{322_1169NT 
Consensus 
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msa237049 . 2 {322_C0H1 
maa237049.2(322_M781 
msa237049.2{322_M732 
msa237049.2{322_A909 
msa237049.2{322_H36B 
msa237049.2{322_090 
msa2 3 7 04 9 . 2 f 3 2 2_CJB1 1 0 
msa237049 . 2 {322_18RS21 
msa237049.2{322_2603 
msa237049.2{322_JM9130013 
msa237049.2{322_1169NT 
Consensus 
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ytvkygdtls 
ytvkygdtls 
ytvkygdtxs 
ytvkygdtls 
ytvkygdtls 



viseamsidm nvlaklnnla 
viseamsidm nvlaklnnla 
viseamsidm nvlakinnia 
viseamsidm nvlakinnia 
viseamsidm nvlakinnia 



ytvkygdtls 
ytvkygdtls 
ytvkygdtls 
ytvkygdtls 
ytvkygdtls 



viseamsidm nvlakinnia 
viseamsidm nvlakinnia 
viseamsidm nvlakinnia 
viseamsidm nvlakinnia 
viseamsidm nvlakinnia 



dinliyp BTT 
dinliypETT 
dinliypETTT 
dinliypETT 
dinliypETT 

ETT 

dinliypETT 
dinliypETT 
dinliypETT 
dinliypETT 
dinliypETT 
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LTVTYDQKSH 
LTVTYDQKSH 
LTVTYDQKSH 
LTVTYDQKSH 
LTVTYDQKSH 
LTVTYDQKSH 
LTVTYDQKSH 
LTVTYDQKSH 
LTVTYDQKSH 
LTVTYDQKSH 
LTVTYDQKSH 
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msa237049 . 2 322_A909 
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msa237049.2{322_090 
msa237049.2{322 CJB110 
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msa237049.2{322_2603 
msa237049.2{322_JM9130013 
msa237049.2{322_1169NT 
Consensus 
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TATSMKIETP 
TATSMKIETP 
TATSMKIETP 
TATSMKIETP 
TATSMKIETP 
TATSMKIETP 
TATSMKIETP 
TATSMKIETP 
TATSMKIETP 
TATSMKIETP 
TATSMKIETP 



ATNAAGQTtA 
ATNAAGQTtA 
ATNAAGQTtA 
ATNAAGQTtA 
ATNAAGQTtA 
ATNAAGQTpA 
ATNAAGQTpA 
ATNAAGQTtA 
ATNAAGQTtA 
ATNAAGQTtA 
ATNAAGQTtA 



TVDLKTNQVf 
TVDLKTNQVf 
TVDLKTNQVf 
TVDLKTNQVs 
TVDLKTNQVs 
TVDLKTNQVs 
TVDLKTNQVs 
TVDLKTNQVs 
TVDLKTNQVs 
TVDLKTNQVs 
TVDLKTNQVs 



VADQKVSLNT 
VADQKVSLNT 
VADQKVSLNT 
VADQKVSLNT 
VADQKVSLNT 
VADQKVSLNT 
VADQKVSLNT 
VADQKVSLNT 
VADQKVSLNT 
VADQKVSLNT 
VADQKVSLNT 
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ISEGMTPEAA 
ISEGMTPEAA 
ISEGMTPEAA 
ISEGMTPEAA 
ISEGMTPEAA 
ISEGMTPEAA 
ISEGMTPEAA 
ISEGMTPEAA 
ISEGMTPEAA 
ISEGMTPEAA 
ISEGMTPEAA 



msa237049.2(322_COHl 
msa237049 . 2 { 322_M781 
msa237049.2{322_M732 
msa237049.2f322_A909 
msa237049.2{322_H36B 
msa237049.2{322_090 
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msa237049 . 2 (322_18RS21 
msa237049.2{322_2603 
msa237049 . 2 { 322_JM9130013 
msa237049.2{322_1169NT 
Consensus 
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TTIVSPMKTY 
TTIVSPMKTY 
TTIVSPMKTY 
TTIVSPMKTY 
TTIVSPMKTY 
TTIVSPMKTY 
TTIVSPMKTY 
TTIVSPMKTY 
TTIVSPMKTY 
TTIVSPMKTY 
TTIVSPMKTY 



SSAPALKSKE 
SSAPALKSKE 
SSAPALKSKE 
SSAPALKSKE 
SSAPALKSKE 
SSAPALKSKE 
SSAPALKSKE 
SSAPALKSKE 
SSAPALKSKE 
SSAPALKSKE 
SSAPALKSKE 



VLAQeQAVSQ 
VLAQeQAVSQ 
VLAQeQAVSQ 
VLAQgQAVSQ 
VLAQgQAVSQ 
VLAQeQAVSQ 
VLAQeQAVSQ 
VLAQeQAVSQ 
VLAQeQAVSQ 
VLAQeQAVSQ 
VLAQeQAVSQ 



vAANEQVSpA 
vAANEQVSpA 
vAANEQVSpA 
aAANEQVSpA 
aAANEQVSpA 
aAANEQVStA 
aAANEQVStA 
aAANEQVSpA 
aAANEQVSpA 
aAANEQVSpA 
aAANEQVSpA 
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PVKSITSEVP 
PVKSITSEVP 
PVKSITSEVP 
PVKSITSEVP 
PVKSITSEVP 
PVKSITSEVP 
PVKSITSEVP 
PVKSITSEVP 
PVKSITSEVP 
PVKSITSEVP 
PVKSITSEVP 



msa237049.2(322_COHl 
msa237049.2l 322_M781 
msa237049.2l 322_M732 
msa237049.2< 322_A909 
msa237049.2{322_H36B 
msa237049 . 2 {322_090 
msa237049.2{322_CJB110 
msa237049.2{322_18RS21 
msa237049 . 2{322_2603 
msa237049 . 2{322_JM9130013 
msa237049.2{322_1169NT 
Consensus 



msa237049.2^ 322_C0H1 
msa237049.2 322J4781 
msa237049.2 322_M732 
msa237049.2 322 A909 
msa237049 . 2 { 322~H36B 
msa237049.2{322 090 
msa237049 .2(322_CJB110 
msa237 049 . 2 { 322~18RS21 
msa237049.2{322_2603 
rasa237049.2{322_JM9130013 
msa237049.2{322_1169NT 
Consensus 
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AAKEEVkPTQ 
AAKEEVkPTQ 
AAKEEVkPTQ 
AAKEEVkPTQ 
AAKEEVkPTQ 
AAKEEVkPTQ 
AAKEEVkPTQ 
AAKEEVkPTQ 
AAKEEVkPTQ 
AAKEEVkPTQ 
AAKEEVrPTQ 



TSVSQ1TTVS 
TSVSQlTTVS 
TSVSQ1TTVS 
TSVSQsTTVS 
TSVSQsTTVS 
TSVSQsTTVS 
TSVSQsTTVS 
TSVSQsTTVS 
TSVSQsTTVS 
TSVSQsTTVS 
TSVSQsTTVS 



PASVAAETPA 
PASVAAETPA 
PASVAAETPA 
PASVAAETPA 
PASVAAETPA 
PASVAAETPA 
PASVAAETPA 
PASVAAETPA 
PASVAAETPA 
PASVAAETPA 
PASVAAETPA 



PVAKVAPVRT 
PVAKVAPVRT 
PVAKVAPVRT 
PVAKVAPVRT 
PVAKVAPVRT 
PVAKVAPVRT 
PVAKVAPVRT 
PVAKVAPVRT 
PVAKVAPVRT 
PVAKVAPVRT 
PVAKVAPVRT 
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VA. .APRVAS 
VA. .APRVAS 
VA. .APRVAS 
VA. .APRVAS 
VA. .APRVAS 
VA. .APRVAS 
VA. .APRVAS 
VA. .APRVAS 
VA. .APRVAS 
VA. .APRVAS 
VAapAPRVAS 
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aKWTPKVET 
aKWTPKVET 
aKWTPKVET 
vKWTPKVET 
vKWTPKVET 
vKWTPKVET 
VKWTPKVET 
vKWTPKVET 
vKWTPKVET 
vKWTPKVET 
aKWTPKVET 



GASPEHVsAP 
GASPEHVsAP 
GASPEHVsAP 
GASPEHVsAP 
GASPEHVsAP 
GASPEHVsAP 
GASPEHVsAP 
GASPEHVsAP 
GASPEHVsAP 
GASPEHVsAP 
GASPEHVpAP 



AVPVTTTSpA 
AVPVTTTSpA 
AVPVTTTSpA 
AVPVTTTStA 
AVPVTTTStA 
AVP VTTT StA 
AVPVTTTStA 
AVPVTTTSpA 
AVPVTTTSpA 
AVPVTTTSpA 
AVPVTTTStA 



TDsKLQATEV 
TDsKLQATEV 
TDsKLQATEV 
TDSKLQATEV 
TDsKLQATEV 
TDsKLQATEV 
TDsKLQATEV 
TDsKLQATEV 
TDsKLQATEV 
TDsKLQATEV 
TDnKLQATEV 
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KSVPVAQKAP 
KSVPVAQKAP 
KSVPVAQKAP 
KSVPVAQKAP 
KSVPVAQKAP 
KSVPVAQKAP 
KSVPVAQKAP 
KSVPVAQKAP 
KSVPVAQKAP 
KSVPVAQKAP 
KSVPVAQKAP 



msa237049.2 
msa237049.2 
msa237049.2 
msa237049.2 
msa237049.2 



322_C0H1 
322_M78l' 
322_M732 
322_A909 
322 H36B 
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TAtPVAQPAS TTNAVAAHPE NAgLQPHVAA YKEKVASTYG VNEPSTYRAG 
TAtPVAQPAS TTNAVAAHPE NAgLQPHVAA YKEKVASTYG VNEPSTYRAG 
TAsPVAQPAS TTNAVAAHPE NAgLQPHVAA YKEKVASTYG VNEPSTYRAG 
TAtPVAQPAS TTNAVAAHPE NArLQPHVAA YKEKVASTYG VNEPSTYRAG 
TAtPVAQPAS TTNAVAAHPE NArLQPHVAA YKEKVASTYG VNEPSTYRAG 
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msa237049.2{322_090 
msa237049 . 2 { 322_CJB110 
msa237049 . 2 { 322_18RS21 
msa237049.2{322_2603 
msa237049 . 2 { 322_JM9130013 
msa237049 . 2 {322_1169NT 
Consensus 



TAtPVAQPAS 
TAtPVAQPAS 
TAtPVAQPAS 
TAtPVAQPAS 
TAtPVAQPAS 
TAtPVAQPAS 



TTNAVAAHPB 
TTNAVAAHPB 
TTNAVAAHPB 
TTNAVAAHPB 
TTNAVAAHPB 
TTNAVAAHPB 



NAgLQPHVAA 
NAgljQPHVAA 
NAgLQPHVAA 
NAgLQPHVAA 
NAgLQPHVAA 
NAgLQPHVAA 



YKEKVASTYG 
YKEKVASTYG 
YKEKVASTYG 
YKEKVASTYG 
YKEKVASTYG 
YKEKVASTYG 



VNEPSTYRAG 
VNEPSTYRAG 
VNEPSTYRAG 
VNEPSTYRAG 
VNEPSTYRAG 
VNEPSTYRAG 



rasa237049.2(322_COHl 
msa237049.2f322_M781 
msa237049 . 2{322_M732 
msa237049 . 2 ' 322_A909 
rasa23 7049 . 2 { 322_H36B 
msa237049 .2(322 090 
msa2 37 0 49 . 2 { 3 2 2_CJB11 0 
msa237049 . 2 { 322_18RS21 
tnsa237049.2{322 2603 
tnsa237049 . 2 { 322_JM9130013 
msa237049 . 2 {322_1169NT 
Consensus 
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DPGDHGKGLA 
DPGDHGKGLA 
DPGDHGKGLA 
DPGDHGKGLA 
DPGDHGKGLA 
DPGDHGKGLA 
DPGDHGKGLA 
DPGDHGKGLA 
DPGDHGKGLA 
DPGDHGKGLA 
DPGDHGKGLA 



VDFIVGkNQA 
VDFIVGkNQA 
VDFIVGkNQA 
VDFIVGkNQA 
VDFIVGkNQA 
VDFIVGkNQA 
VDFIVGkNQA 
VDFIVGtNQA 
VDFIVGtNQA 
VDFIVGtNQA 
VDFIVGkNQA 



LGNeVAQYST 
LGNeVAQYST 
LGNeVAQYST 
LGNeVAQYST 
LGNeVAQYST 
LGNeVAQYST 
LGNeVAQYST 
LGNkVAQYST 
LGNkVAQYST 
LGNkVAQYST 
LGNeVAQYST 



QNMAANNISY 
QNMAANNISY 
QNMAANNISY 
QNMAANNISY 
QNMAANNISY 
QNMAANNISY 
QNMAANNISY 
QNMAANNISY 
QNMAANNISY 
QNMAANNISY 
QNMAANNISY 
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VIWQQKFYSN 
VIWQQKFYSN 
VIWQQKFYSN 
VIWQQKFYSN 
VIWQQKFYSN 
VIWQQKFYSN 
VIWQQKFYSN 
VIWQQKFYSN 
VIWQQKFYSN 
VIWQQKFYSN 
VIWQQKFYSN 



msa237049.2{322_COHl 
msa237049.2f322_M781 
msa237049.2(322_M732 
tnsa237049.2{322_A909 
insa237049 . 2 (322_H36B 
msa237049.2{322 090 
itea237049 . 2 { 322_CJB110 
msa237049 . 2 { 322_18RS21 
msa237049 . 2 { 322_2603 
msa237049 . 2 { 322_JM9130013 
msa237049.2{322_1169NT 
Consensus 
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TNSIYGPANT 
TNSIYGPANT 
TNSIYGPANT 
TNSIYGPANT 
TNSIYGPANT 
TNSIYGPANT 
TNSIYGPANT 
TNSIYGPANT 
TNSIYGPANT 
TNSIYGPANT 
TNSIYGPANT 



WNAMPDRGGV 
WNAMPDRGGV 
WNAMPDRGGV 
WNAMPDRGGV 
WNAMPDRGGV 
WNAMPDRGGV 
WNAMPDRGGV 
WNAMPDRGGV 
WNAMPDRGGV 
WNAMPDRGGV 
WNAMPDRGGV 



TANHYDHVHV 
TANHYDHVHV 
TANHYDHVHV 
TANHYDHVHV 
TANHYDHVHV 
TANHYDHVHV 
TANHYDHVHV 
TANHYDHVHV 
TANHYDHVHV 
TANHYDHVHV 
TANHYDHVHV 



SFNK.YKKGS 
SFNK.YKKGS 
SFNK.YKKGS 
SFNK.YKKGS 



SFNK.YKKGS 
SFNK.YKKGS 
SFNK.YKKGS 
SFNK.YKKGS 
SFNK.YKKGS 
SFNK.YKKGS 
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YLASFLYALn 
YLASFLYALn 
YLASFLYALn 
YLASFLYALn 
YLASFLYALh 
YLASFLYALn 
YLASFLYALn 
YLASFLYALn 
YLASFLYALn 
YLASFLYALn 
YLASFLYALn 



msa237049.2 322_COHl 
msa237049 . 2( 322_M7B1 
msa237049 . 2 { 322J4732 
tnsa237049 . 2 j322_A909 
msa237049.2{322_H3€B 
msa23704 9 . 2 { 322_090 
msa237049.2{322_CJB110 
msa237049 .2 {322_18RS21 
msa237049 . 2 { 322_2603 
msa237049 . 2 { 322_JM9130013 
msa237049.2{322_1169NT 
Consensus 



451 460 
RLSRFLYNFY 
RLSRFLYNFY 
RLSRFLYNFY 
RLSRFLYNFY 
RLSRFLYNFY 
RLSRFLYNFY 
RLSRFLYNFY 
RLSRFLYNFY 
RLSRFLYNFY 
RLSRFLYNFY 
RLSRFLYNFY 
********** 
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SEQ XD. NO. 7001 
STRAIN 2603 

ATGGGAGGGAAAATGA&TCAAGAA 

GTGATAGAGCCTTGCTTG&GGCATTTTTATAT^ 

GGGATAGTCTTATTCATCAGTTTATGACCAATAGGCAAGA 

TACTTCACTTTGAGACAGATGTTTCAG CTTTTC 

ATGATCTATTGACCTATACACAAGTTTTCGGCCAAA 

TATCGCCGTCTGAAAAAAACTTGGTGATAGAAGTC 

TTCAATTATTGGATTCCAATGGACACTACCAAACK^ 

AGAGTAGGGGAGCTAATTTGGTCAATGTGTATCXriCTGGCT 

TTAGT CX3AGATATTGAACAGTTTCTCTTAACTTACXSAGCCTGAG CTG 
ATGAAACTGTTCTAGAAAATGAAGAAACTGTTGATGAGCftCAAAA 

CAATATCTTTTCGAGAAGAGGG CTCTCTGGTTATTGCT , 

AACTAGATGTTCAAATAGGAAAAACCAGTCATCTGCCA^ 

GACXSTAAATT^TGAGATTCTAACATATTTTGACOVA^ 

CAAGTTTTAGACGAGGTGATTTTGACACAGAGATGGAA^ 

AGGAATTACTTACTTATCTCGAAGCrGATGGaw^ 

CTACAGTCX5AAGAAAAGGAATTAGAAAAAATTGGACAAGCC^ 

AAAAATTGACrcAGCTAGGGATTGATTTATCTC^ CAGACCGAGTCGGTATTT 
TATTGGATGCAGCAGGTCGTTTTCGTTTAAAAAATGC^ 

ATCCCAAAGCCTCGGTAACT CAACTAGCCCTTGCGACAGAACTACTCCAAATGGGACT 
GTCATGAAAA GGTTGA AIVITTCTTIIXjT AG C CAG CTTTCCATTGAAGAG CTGCGACAAG 
TTGCCTACX3CCTTTTTATACCAAGAACTCAGCA 

ATAAAGGTAATCAGCCAGATTTAACTCTCAGAGATTGGAAAAGCAAGCT 

AGGGAAAAGAAGTAGTTGATGAAGAATTCGCGGAAAATCCACTGG1T 

ACACTTATCCTCTGGGGTCATTGGTTTC^ 

TCAGCGATGCTCGATTGAACGGTTTGATTCXjG^ 

TGATTGAACAAAATCCAGTTCTTTATGTG 

ATCAGCCAAAGGCAGAACCACAAACAGAGTTAGAAGAA^ 

TCTCATTTCTOGAAGAGGAGCCAGTTCAGAGTATO 

AAAATGGTCATAACGATACTGATCTTGAAGAAACAGATA 

TC<7TCGAAACAATTCCAGAGATTCCAGTAACGGAC^ 

ACTTTTATCCTAAGACTGCTAGAGATAAGGTTGAGA 

TAAAAAATCTAGAAGTAGAG CACCGCAATG CITCACCAAGTGAACAAGAACTCCTTC 

AGTATGTAGGCTGGGGTGGACTAGCCAATGAATTTTTT^ 

CTAAGGAACGAGAAGAACK5AAGAGCCTAGTCACAGA 

TGGAAAGAGATGGCTTTACAGGTGGCAAAATC 

TCTTTGCGGCTATGCCAAAACACrTAAGAGAAAAGAGTGAGTTG 

ATACTATTACAGGAGCTATTGCCAAACACCTTCAT 

GATTTGAGACXXSTGGCTTTTAACGACAATAGTTT^ 

TTGCCAATATACGAATTGCGGATAATAGGTACGATAGGCCTTACATG^ 

TTGTCAAAAAGTCACTTGATTTGCTTCATGATGGTGGACA 

CAGGAACTATGGATAAGCGAACRGAAAACATCTT 

TTCTTGGTGGGGTTCGACTG CCItlACTCTG CCTTT AAGGCCATTGCAGGA^ 

CAACGGATATGTTATTCITCCAGAAAaVCTTAGACAAG 

CCTTTTCAGGTTCCATTCGCTATGACAAG 

ATGGAGAATACAATAG C CAGGTG CTAGGAACCTACGAGGT CAGGAATTTTAACGGAGGAA 
CACTTTCTGTTAAGGGGACTAGTGATGACrTGATTG 

ACGTTAAGG CCCCAAGAGAGATTGATAGAAATGAGGTCATCATTAACCCAGATGTC 
CCAAAC^GTCAATQATACCTCCATTCCAGCTGAAATGAGQ 

GTTTTGGTTATCAGGGGT CT ACAGTTTACT ATCGAGATAACAAAGG CATTCGAGT CGGAA 

CCAAGACGGAAGAAATCAGTTACTATGTCXaATGAAGAGG^ CATGGGACA 

CCAAACATTCTCAAAAGCAGATTGATCGCTTTAA^ 

CTCTGGATGTCTATGTGAC03ATGATG(^ 

AAAAGACAGTTirCTATGAAGCTXX^TTGTCTTATAAAGAA 

TGGTCGATATTCGCAATGCCrACX^AAGAAGTrATTG^ 

ATAAGGAGACCITTAACCACTTGTTAGGCAAACrCAA 

AACACTATGGGTATTTGAATAGTGCTGTGAACCGCAATCTT^ 

ATTCGCTTCTTGCTAGTTTGGAAGATGAAAGTCTGGATC^ 

ATACTAAATCCCTTGCCTTTGAGAAGGCTCI^ 

TGCATACTGCCCTTGATGCCTTAAATTCX3AG 

CTTATATGATGTCTATCTATCAGGTTGAATCGCAGAT^ 

ACCTCATTATGCCTGATCOTGAGAAGTATTTG 

AAGACTTTCTTTCAGGGGATGTCGTCACTAAGTTAGAAGTGG 

AAGACAATCAGGACTTTAACTGGTC^ 

CCCGTATTACITTGGCAGACATTGATTATC^ 

TTTATGGAAAATTTGCCCAAGAAACCTTTATGGGGAAAG CCTATGAACTGTCAGACCAAG 
AAGTAGCGACAGTCCTAGAAGTCAGTCXXZATTGACGG 
TTGCCTACACCTATTCCAACGCAACXSGATAGGAGTT^ 
ATAGTGGTCGAAAAATCTTTGAAAATCTCCTGAATTCCA^ 

AAGTTGTCGAAGGGGATAAGAAAAAGAATGTGACGOATGTAGAGAAAACAACGGTCCTGC 
GTGCCAAGGAAACACACCTACAAGAACTCTTTCAAGGTT^ 

TCCAACAAATGATTGAAGACACCTATAATAGG CTCTACAATCGTACGGTATCAAAGTCCT 
ATGATGGTAGTCATTTAACCATTGATGGACTTGCT CAGAATATCTCCTTACGTCCTCACC 
AAAAGAATGCCATTCAACGAATTGTCGAGGAAAAACGTGCT 
GTTCAGGTAAAAC^CTTACCAT^ 

TGAAATTTTTCCCTACCAAGAAAGTCTATGTGACT^ 

AAOGCAAGCAGTTTGTGTCCCGTATTATTACAGGGGACT^ 

ATTCACAAITTGAOAAGATACCGATGAGTanKSA^ 

AACTTGAGCAACTCCGAGAAATCAAGCrAGGAAGTGACAGTGATTACACGGT^ 
CXXaAACGTTCGATTAAGGGATTAGAACACCAGTTGGAAGA 
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ATACCTTTATTGAGfTTTGAAAACCTTGGA AT^ 

ACTTCAAGAATATCCGTCCAATCACTGGACTTGGGAATGTAG CTGGAATCACCAACACAA 
CTTCTAAAAAGAA05TGGATATGGAGATGAAGGTGA 

CCATGATGGATTACATTCAACCTQATGTCTTGGAACGATACC^ 
CCTGGGTTGGGGCTTTTGGGAATATCGAAAACTCCAT^ 
AGTACCAACCCAAGAAACGGTTCAAGAAATTTGTCAACCTTC 
AO^AGGAAACTGCCGATATTCAGACCTCAGACATGCTT^ 

AGATTATTGCGGTGGAAAG CGAGTTAACG CAAGCTCAGAAATACTATTTGGAAGAGCTGG 
TAAAGCGTTCAGACGCTATCAAGTCAGGTAGTGTTGATC 

CCTTATOSGATAATCAGAAAATCCrTCAAGTAGT 

ATGGAG CTCGAGACAAAGCCACTCAGATGATTTTCTCAGATA 

AGGAAGAAGGGTTTGATGTCTACAATGAACTTAAGG^ 

CAAAAGAAGAAATTGCCTTTGT CCATGATG CXIAATACTGATGAGAAGAAAAACTCTCTGT 

CACXSCAAGGTCAATAGTGGAGAAGTACXX^TTCTCATG^ 

CAGGATTAAACGTCCAATCTCGCATGAAAGCIXSTCCA^ 

CCTCAGACATTGTCCAGCGAAATGGACGACT^ 

TAGATATTTATCACTATATTACTAAAGGGAGCTTTGACAATT 

AGAATAAGCTAAAGTATATCACCCAGATAATGACCTCAAAAGAT^ 

AAGACATTGATGAACAAACCATGACCXSCCTCAGACT^ 

CTTATCTCAAACTCAAAATGGAGTTGGAAAATGAA 

GAGCCTTTAATCXSCTCCAAAGACGAGTATCGCCATACCATTTCC^ 

TCCCTATTATGGAAAAACGGTTGAGTCAATATGATA^ 

CCAAGTCGCAAGATTITGTCATGCGATTTGACA^ 

CTGG<3GACTATCTGCGAAAACrCATTACCT^ 

CACTTGCCAGCTTTAGAGGATTTGATTTAAAAATGACIA 

TACCAGAAACX2AT1U'C1U"1'AATGATTGTAGGTGATAACCAGTA 

TGAAATCAGACX3TGGGAACCATTC^CX3GATTAGTAATGCCATTGA 

ACCAAGAAAAGACG CAAGAGCTGGTAAAGGATTTAAAAGATAAG CTACGAGTAGCCAAAG 

TAGAAGTTGATAAAGTCTTTCCAAAGGAAGAGGACTATCAG 

ATGTTTTAGCTCCCTTGGTTGAAAAAGAAGCAGAGAT^ 

CCAAGTTTAGTGAAGAT ACAACACCCCAAAAGAAG CAACAAATAG CACTCGAGAT A 

SBQ XD. NO. 7002 
STRAJNH36B 

GGAGGGAAAATGAATCAAGAAGTCTTACTACAAATGAT 

GAGAGCCACTATTCCTCXTIXxATAGAGCCTTC 

ACCAAGO^GAGCATTTTGATGAGGAG?KX3GATAGTCT^ 

ATGACCAATAGG CAAGAAATAAATAAuu\J"I<JTTCAAGTACTTCALriUUX^ 

GACAGATGTTTCAGCTTTTGTCCAGGCTAGTC 

ATCTATTGACCTATACACAAGTTTTCGGCCAAAGTC 

GATAAACTATCXSCCGTCTCAAAAAAACITGGTGATAGA^ 

CAATCTGGCCACTCGTTTTCAATTATTGGATTra 

CCATATCGCCGGATTCACTCTTACAAAAGAGTAGGGGAG CTAATTTGGTC 

AATGTGTATCGTGTGGCTAATAATTTAGCGGATCGTATTAGTO 

TGAACAGTTTCTCTTAACTTACX^GCCTG^ 

AAACTGflTCTAGAAAATGAAGAAACTGTTGATGAGCACAA 

CATCAAGCAATATCTTTTCGAGAAGAGGGCTCT^ 

GGATOTAGATrfGTCTCAACTAGATGTTCAAATAGGAAAAACCAGTCATC 

TGCCAGCTTATGAAGAGTTATCCTTACGACGT 

TATTTTGACCAAATTCXSAAATGAACXSTTCCAAA^ 

AGGTGATTTTGACACAGAGATGGAAATGACACCA^ 

AATTACTTACTTATCTCX3AAGCTGATGG<^ 

ACGCTGACTACAGTCGAAGAAAAGGAATTAGAAAAAATTGGACAAGCCA^ 
TAGGATAGAAAATCAAGAAAAATTGACTCAGCTAs GkATTGrTTT^ 
AGTTTGACCCAGACCGAG TCGGTATT TTATTGkA TGCA 
CUTlUAwAwAATGCAGACL^LTGC'lTCACTAGGTGG^ 
GGTAACnXZAACTAG CCCTTOCGA^ 

CGACAAGTTG CCTACGCCTTTTTACACCAAGAACTCAGCAGAGAAGATG C 

GGAGCAATTTGAAAAAGATAAAGGTAATCAGCTCAGATTTAAC 

ATTGGAAAAG CAAGCT AGAGAAAGCTGAGGGAAAAGAAGTAGTTGATGAA 

GAATTCGCX5GAAAATCCACTCGTTCAGAGAGTATTGGACA 

GGGGTCATTGGTTTCCTATAAGGGACAGGACTT^ 

GCGATGCTCGAtTGAACGGTTTGATTCGGATTGA 

TCGGATATCATTGAACAAAATCCAG j rTCTTTATGTGAGGA 

AGTCAGTCAGGCACTTCATCAGCCAAAGGCAGAACCACA 

AAGAAGCGGACCAAGAATTAAACCTATTCTCATTTCTGGA 

GTTCAGAGTATTGGACTATTGGAACCAGATGATTCAGAAAATC 

CGATACTCATCTTGAAGAAACAGATAATCAAA^ 

TCGAAACAATTCCAGAGATTCCAGTAA03GAClUnTA 

TTGACGGACTTTTATCCTAAGACTCCTAGAGATAA 

TCTGGCCATTCGTITGGTAAAAAATCTAGAAGTA 

CACCAAGTGAACAAGAACTCCTTGCCAAGTATGTAGG CTGGGGTGGACTA 
GCCAATGAATTTTTTGATGACTATAATCCAAAATTT^ 
AGAACTCAAGAGCCTAGTCACAGATAAAGAGTATTCGGATATGAAA 
Ct7TCC<nXSACAGCCTATTACACAGAC<^ 

GATAAGTTGGAAAGAGATGG CTTTACAGGTGGCAAAATCCTAGATCCTTC 

CATGGGAACAGGGAATTTCTTTGCGGCTATGCCA^ 

AGAGTGAGTTGTATGGCCTAGAGTTAGATACTATTACAGGAGCT 

AAACACCTTCATCCCAAT!AGTCATAT^ 

GGCTITTAACGACAATAGTTTrGATTTGGTGA 
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CCAATATACGAATTGCGGATAATAGGT ACG ATAG G CCTTACATGATTCAT 

GACTACTTTGTCAAAAAGTCACTTGAT^TGCTTCATG 

AGCXSATTATCrTCTTCCACAGGAACTATG^ 

TACAAGATATTCGTGAGACAACTCAATTTCTTCXnX^^ 

GACTCTGCXITTTAAGGCCATTGCAGGAACGAGTGTC^ 

ATTCTTCCAGAAACACTTAGACAAGGGATATGTGG CAGACGATTTAG CCT 

TTTCAGGTTCCATTCGCTATGACAAGGATAGTCGCATITGGC^ 

TATTTTGATGGAGAATACAATAGCCAGGTG CTAGGAACCTACGAGGTCAG 

GAATTTTAACGGAGGAACACITTCTGTTAAG 

TTGCAAGTGTTGAAACAGCTCTAAATCACGTTAAGG CCCCAAGAGAGATT 

GATAGAAATGAGGTCATCATTAACtX^GATGTGTTGACCAAA 

TGATACCTC<^TTCCAGCTGAAATGAGGGAAAATCTAGGTCAGTACAG^ 

TTGGTTATCAGGGGTCTACAGTTTACTATCX3AGATAACAA 

GTCGGAACCAAGACGGAAGAAATCAGTTACTATGTCGATGAAGAG 

SEQ ZD* NO. 7003 
STRAIN 18RS21 

GriAGGGAAAATGAATCAAGAAGTCTTACTACAAATGATGAGA 
GCCACTATTCCTCGTGATAG AG CCTTGCTTGAGGGATTTTTATATTACCA 
AGCAGAGCATTTTGATGAGGAGTGGGATAGTCTTA 

CCAATAGGCAAGAAATAAATAAGTCTGTTCAAGTACTTCACITTGAGAC^ 

GATGTITCAGCTTITGTCCAGGCTACTCCT 

ATTGACCTATACACAAGTTTTCGGCCAAAGTGOTCTTC^ 

AACTATCGCCXJK7IX1AAAAAAACTTGGTGATAGAAGTG CTTGTTCAAT 

CTGGCCACTCGTTTTCAATTATTGGATTCCAATGG^ 

ATCGCCGGATTCACTCTTACaAAAGAGTAGGG<^GCTAATTTGGTCAATG 

TGTATCGTGTGGCTAATAATTTAGCGGATCGTATTAGT CGAGATATTGAA 

CAGTTTCTCTTAACTTACGAGCCTGAGCTTGAAACT 

TGTTCrAGAAAATGAAGAAACTGTTGATG^ 

GTAGATTTGTCTCAACTAGATC 
AGCTTATGAAGAGTTATO^TTACX^CGTAAATTK^ 
TTGACCAAATTCGAAATGAACGTTCCAAAGTCCCAAGTTTTO 
GATTTTGACACAGAGATGGAAATGACACCAGTC^^ 

ACITACTTATCTCX3AAGCTGATGGCAGTCCCTATGAG CTGAAACGAACX3C 
TGACTACAG t CGAAGAAAAGGAATTAGAAAAAATTGGACAAGCCATTAGG 
ATAGAAAATCAAGAAAAATTGACTCAGCTAGGGATTGAT^ 
TGACCC^GACCGAGTCGGTATTTTAITGGATGCAGCAGGTCGT^^ 
TAAAAAATGCAGACCTTGUU"1-1ACTAGGTGGTTATCX:CAAAG CCTCGGTA 
ACTCAACTAGCCCTTGCGAC^GAACTACTCCAAATG 
AAAGGTTGAATTTITCTTTGGTAGCCAGCTTTCC^ 
AAGTTGCCTACGCXrrrTTTACACCAAGAACTCAGCAGA 
CAATTTGAAAAAGAT AAAG GTAAT CAG C CAGATIT AACT CTCAG AGATTG 
GAAAAGCAAGCTAGAGAAAGCTGAGGGAAAAGAAGTAGTTGATGAAGAAT 
TCGC<K3AAAATCCACTGGTTCAGAGAGTATTGGACACTTATCCT 
• TCATTGGTTTCCTTATAAGGGAC1AG 
TG CTCGATTGAACGGTTTGATTCGGATTGAGTTAGTCAATGA^ 
ATATCATTGAACAAAATCCACTTC t TTAt GTGAGGACCTGGGAAGAAGTC 
AGTCAGGCACTTCATCAGCCAAAGG CAGAACCACAAACAGAGTTAGAAGA 
AGCGGACCAAGAATTAAACCTATTCTCATTTCTGGAAGAGGAGCCAGTTC 
AGAGTATTGGACTATTGGAACCAGaTX^TTCAGAAAATGGTCATAACGAT 
ACTGATCTTGAAGAAACAGATAATCAAATTCCT 
AACAATTCCAGAGATTCCAGTAACGGACTTTTATTTTC 
aSGACTTTTATCCTAAGACTGCTAGAGATA^ 

GCCATTCGTTTGGTAAAAAATCTAGAAGTAGAGCACCGCAA^ CTTCACC 

AAGTGAACAAGAACTCCTTG CCAAGTATGTAGGCTGGGGTGGACTAG CCA 

ATGAATTTTTTGATGACTATAATCX^VAA^ 

CIXSAAGAGCCTAGTCACAGATAAAGAGTATTC^ 

OZJTGACAGCCTATTACACAGACCCATC 

AGTTGGAAAGAGATGGCTTTACAGGTGGCAAAATCCrAG 

GGAACAGGGAATTTCTTTGCtMCTATGCCAAAACACTT 

TGAGTTGTATGG CX3TAGAGTTAGATACTATTACAGGAGCTATTGCCAAAC 

ACCTTCATCCCAATAGTCATATTGAAATT^ 

TTTAACGAX^AATAGTTTTGATTTGGTGATTTCA 

TATAa^TTGCGGATAATAGGTACGATAGGCCTTACA 

ACTTTGTOVAAAAGTCACITGATTTGCTTCA 

ATTATCTCTTCXIACAGGAACTATGGATAAGCG^ 

AQAT ATTCG TGAGACAACrQAA TTTCTTG GTG^ 

CTGCCTTTAATCCCATTGCAGGAACGAGTGTCA 

TTCCAGAAACACITAGACAAGGGATATGTGGCAGACXSA^ 

AJGGTTCCATTCXSCTATGACAAGGATAGTC^ 

TTGATGGAGAATACAATAGCCAGGT 

TTTAACGGAGGAACACTTTCnCTTAAGGGGAClAGTO 

AAGTGTTGAAACAGCTCTAAATCACGTTAA 

GAAATGAGGTCATCATTAACCCAGATGTGTTG^ 

ACCTCCATTCCAGCTX5AAATGAGGGAAAATCTAGCT 

TTATGVGGGGTCTACAGTTTACIATC^ 

GAACCAAGACGGAAGAAATCAGTTACTATGTCGATGAAGAG 
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msa31161 . 2 (327dNt_2603 ) 
Tnsa31161.2(327d_18RS21} 
tnsa3 1 16 X . 2 { 3 27dNT_H3 6B } 
Consensus 



msa31161.2{327dNt_2603) 
msa31161.2{327d_18RS21> 
ms 331161. 2 {327dNT_H36B> 
Consensus 



GgAGGGAAAA TGAATCAAGA AGTCTTACTA CAAATGATGA GAGCCACTAT 
GnAGGQAAAA TGAATCAAGA AGTCTTACTA CAAATGATGA GAGCCACTAT 
GgAGGGAAAA TGAATCAAGA AGTCTTACTA CAAATGATGA GAGCCACTAT 
*_******** ********** ********** ********** ********** 

51 1°0 
TCCTCGTGAT AGAGCCTTGC TTGAGGCATT TTTATATTAC CAAGCAGAGC 
TCCTCGTGAT AGAGCCTTGC TTGAGGCATT TTTATATTAC CAAGCAGAGC 
TCCTCGTGAT AGAGCCTTGC TTGAGGCATT TTTATATTAC CAAGCAGAGC 



101 150 
msa31161.2{327dNt_2603) ATTTTGATGA GGAGTGGGAT AGTCTTATTC ATCA GTTTA T GACCAATAGG 
msa31161-2(327d_18RS2l} ATTTTGATGA GGAGTGGGAT AGTCTTATTC ATCA GTTTA T GACCAATAGG 
msa31161.2{327dNT_H36B} ATTTTGATGA GGAGTGGGAT AGTCTTATTC ATCAGTTTAT GACCAATAGG 



Consensus 



msa3 116 1 . 2 { 327dNt_2 603 } 
msa31161 . 2 {327d_18RS21J 
msa31161.2{327dNT_H36B} 
Consensus 



msa31161 . 2 (327dNt_2603 ) 
msa3 1161 . 2 { 327d_18RS21 J 
msa31161 . 2 {327dNT_H36B} 
Consensus 



151 20 0 
CAAGAAATAA ATAAGTCTGT TCAAGTACTT CACTTTGAGA CAGATGTTTC 
CAAGAAATAA ATAAGTCTGT TCAAGTACTT CA CTTT GAGA CAGATGTTTC 
CAAGAAATAA ATAAGTCTGT TCAAGTACTT CACTTTGAGA CAGATGTTTC 



201 250 
AGCTTTTGTC CAGGCTAGTC CTTATGATAC TGCTCATGAT CTATTGACCT 
AGCTTTTGTC CAGGCTAGTC CTTATGATAC TGCTCATGAT CTATTGACCT 
AG CTTTT GTC CAGGCTAGTC CTTATGATAC TGCTCATGAT CTATTGACCT 



251 300 
ATACACAAGT TTTCGGCCAA AGTGGTCTTC AAAAACTAGA TAAACTATCG 
ATACACAAGT TTTCGGCCAA AGTGGTCTTC AAAAACTAGA TAAACTATCG 
msa31161.2(327dNT_H36B} ATACACAAGT TTTCGGCCAA AGTGGTCTTC AAAAACTAGA TAAACTATCG 
Consensus ********** ********** ********** ********** ********** 



rasa31161.2(327dNt 2603 J 
msa31161 . 2 (327d 18RS21} 



301 350 
CCGTCTGAAA AAAACTTGGT GATAGAAGTG GCCTTGTTCA ATCTGGCCAC 

__. __ CCGTCTGAAA AAAACTTGGT GATAGAAGTG GCCTTGTTCA ATCTGGCCAC 

insa31161.2(327dNT_H36B} CCGTCTGAAA AAAACTTGGT GATAGAAGTG GCCTTGTTCA ATCTGGCCAC 
Consensus ********** ********** ********** ********** ********** 



msa31161.2(327dNt_2603} 
msa31161 . 2 f 327dJL8RS21 \ 



msa31161 . 2 ( 327dNt_2603 J 
msa3 1161 - 2 { 327d_18RS2 1 j 



351 400 
TCGTTTTCAA TTATTGGATT CCAATGGACA CTACCAAACC ATATCGCCGG 
TCGTTTTCAA TTATTGGATT CCAATGGACA CTACCAAACC ATATCGCCGG 
msa3 1161^2 {327dNT_H36B) TCGTTTTCAA TTATTGGATT CCAATGGACA CTACCAAACC ATATCGCCGG 
Consensus ********** ********** ********** ********** ********** 

401 450 
ATTCACTCTT ACAAAAGAGT AGGGGAGCTA ATTTGGTCAA TGTGTATCGT 
ATTCACTCTT ACAAAAGAGT AGGGGAGCTA ATTTGGTCAA TGTGTATCGT 
ATTCACTCTT ACAAAAGAGT AGGGGAGCTA ATTTGGTCAA TGTGTATCGT 



msa3 1161 . 2 { 327dNt_2 6 03 > 
tnsa31161.2f327d__18RS2l} 
nisa3 116 1 . 2 { 327dNT_H3 6B } 
Consensus 



msa31161.2(327dNt 2603) 
msa31161 . 2 {327d_18RS21 > 
msa3 116 1 . 2 { 3 27dNT_H36B } 
Consensus 



rasa31161 . 2 { 327dNt_2603 } 
msa31161 . 2 f 327d_18RS2l) 
msa31161.2{327dNT_H36B} 
Consensus 



msa31161 .2 f 327dNt_2603 } 
msa31161.2(327d_18RS2l} 
msa31161 . 2 { 327dNT_H36B} 
Consensus 



tnsa31161.2(327dNt_2603> 
msa3ll61.2{327d_18RS21> 
msa31161.2{327dNT_H36B) 
Consensus 



tnsa3 1161 . 2 { 327dNt_2603 } 
mBa31161.2(327d_18RS2l} 
tr»a31161.2{327dNT_H36B> 
Consensus 



451 500 
GTGGCTAATA ATTTAGCGGA TCGTATTAGT CGAGATATTG AACA GTTTC T 
GTGGCTAATA ATTTAGCGGA TCGTATTAGT CGAGATATTG AACA GTTT CT 
GTGGCTAATA ATTTAGCGGA TCGTATTAGT CGAGATATTG AACAGTTTCT 



501 550 
CTTAACTTAC GAGCCTGAGC TTGAAACTAG AGCTGATGAA ACTGTTCTAG 
CTTAACTTAC GAGCCTGAGC TTGAAACTAG AGCTGATGAA ACTGTTCTAG 
CTTAACTTAC GAGCCTGAGC TTGAAACTAG AGCTGATGAA ACTGTTCTAG 

551 600 
AAAATGAAGA AACTGTTGAT GAGCACAAAA CAAGTGTTCA TCAAGCAATA 
AAAATGAAGA AACTGTTGAT GAGCACAAAA CAAGTGTTCA TCAAGCAATA 
AAAATGAAGA AACTGTTGAT GAGCACAAAA CAAGTGTTCA TCAAGCAATA 



601 650 
TCTTTTCQAQ AAGAGGGCTC TCTGGTTATT GCTAGTTTGQ ATGTAG ATTT 
TCTTTTCGAG AAGAGGGCTC TCTGGTTATT GCIAGTTTGG ATGTAG ATTT 
TCTTTTCGAG AAGAGGGCTC TCTGGTTATT GCEAGTTTGG ATGTAGATTT 

651 700 
GTCTCAACTA GATGTTCAAA TAGGAAAAAC CAGTCATCTG CCAGCTTATG 
GTCTCAACTA GATGTTCAAA TAGGAAAAAC CAGTCATCTG CCAGCTTATG 
GTCTCAACTA GATGTTCAAA TAGGAAAAAC CAGTCATCTG CCAGCTTATG 
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msa3X161 . 2 {327dNt_2603 ) 
msa31161.2 (327d 18RS21) 
msa3116X.2{327dOT_H36B} 
Consensus 



701 750 
AAGAGTTATC CTTAOGACGT AAATTTGAGA TTCTAACATA TTTTGACCAA 
AAGAGTTATC CTTACGACGT AA ATTTG AGA TTCTAACATA TTTTG ACCAA 
AAGAGTTATC CTTACGACGT AAATTTGAGA TTCTAACATA TTTTGACCAA 



msa3XX6X . 2 ( 327dNt_2603 } 
msa3XX6X.2(327d X8RS21) 
ms a3 X X6 X . 2 { 3 2 7dNT_H3 6B } 
Consensus 



75X 800 
ATTCGAAATG AACGTTCCAA AGTCCCAAGT TTTAGACGAG GTGATTTTGA 
ATTCGAAATG AACGTTCCAA AGTCCCAAGT TTTAGACGAG GTGATTTTGA 
ATTCGAAATG AACGTTCCAA AGTCCCAAGT TTTAGACGAG GTGATTTTGA 



801 850 
msa31161.2(327dNt_2603) CACAGAGATG GAAATGACAC CAGTCTTTGA TGGCGAGGAA TTACTTACTT 
msa31161. 2{327d_18RS2l) CACAGAGATG GAAATGACAC CAGTCTTTGA TGGCGAGGAA TTACTTACTT 
msa31161 - 2 {327dNT_H36B} CACAGAGATG GAAATGACAC CAGTCTTTGA TGGCGAGGAA TTACTTACTT 
Consensus ********** ********** ********** ********** ********** 



85X 900 
msa31161. 2{327dNt_2603) ATCTCGAAGC TGATGGCAGT CCCTATGAGC TGAAACGAAC GCTGACTACA 
msa3XX6X.2(327d_X8RS2X} ATCTCGAAGC TGATGGCAGT CCCTATGAGC TGAAACGAAC GCTGACTACA 
msa31161.2{327dNT_H36B} ATCTCGAAGC TGATGGCAGT CCCTATGAGC TGAAACGAAC GCTGACTACA 
Consensus ********** ********** ********** ********** ********** 



901 950 
msa31161.2(327dNt__2603} GTOGAAGAAA AGGAATTAGA AAAAATTGGA CAAGCCATTA GGATAGAAAA 
msa31161.2{327d_18RS21J GTOGAAGAAA AGGAATTAGA AAAAATTGGA CAAGCCATTA GGATAGAAAA 
rasa31161.2{327dNT_H3SB) GTOGAAGAAA AGGAATTAGA AAAAATTGGA CAAGCCATTA GGATAGAAAA 
Consensus ********** ********** ********** ********** ********** 



951 1000 
msa31161.2{327dNt_2603) TCAAGAAAAA TTGACTCAGC TAgGgATTGa TTTATCTCAG TTTGACCCAG 
msa31161.2f327d_X8RS2X} TCAAGAAAAA TTGACTCAGC TAgGgATTGa TTTATCTCAG TTTGACCCAG 
msa311ffl.2{327dNT_H36B} TCAAGAAAAA TTGACTCAGC TAsGkATTGr TTTATCTCAG TTTGACCCAG 
Consensus ********** ********** **_*_***♦_ ********** ********** 



msa31161 . 2 {327dNt_2603 J 
msa3XX6X . 2 ?327dJL8RS2X} 
msa3XX6X . 2 { 327dNT_H36B) 
Consensus 



100X X050 

ACCGAGTCGG TATTTTATTG gATGCAGCAG GTCGTttTCG TTTAaAaAAT 
ACCGAGTCGG TATTTTATTG gATGCAGCAG GTCGTttTCG TTTAaAaAAT 
ACCGAGTCGG TATTTTATTG kATGCAGCAG GTCGTyyTCG TTTAwAwAAT 
********** ********** _********* *«***..«** ★*#*_*_*** 



msa31161.2{327dNt 2603) 
msa3XX6X . 2 {327d_18RS21 } 
msa3XX6X . 2 {327dNT_H36B} 
Consensus 



X05X X100 
GCAGACCTTG CTTtACTAGG TGGTTATCCC AAAGCCTCGG TAACTCAACT 
GCAGACCTTG CTTtACTAGG TGGTTATCCC AAAGCCTCGG TAACTCAACT 
GCAGACCTTG CTTcACTAGG TGGTTATCCC AAAGCCTCGG TAACTCAACT 



X10X X150 
msa3XX6X.2{327dNt_2603) AGCCCTTGCG ACAGAACTAC TCCAAATGGG ACTAAGTCAT GAAAAGGTTG 
msa3X161.2{327d_18RS21) AGCCCTTGCG ACAGAACTAC TCCAAATGGG ACTAAGTCAT GAAAAGGTTG 
msa3X161.2{327dNT_H36B} AGCCCTTGCG ACAGAACTAC TCCAAATGGG ACTAAGTCAT GAAAAGGTTG 
Consensus ********** ********** ********** ********** ********** 



rasa3XX6X 
msa31X6X 
insa3XX6X 



327dNt_2603l 
327d__X8RS2XJ 
327dNT_H36B} 
Consensus 



XX5X 1200 
AATTTTTCTT TGGTAGCCAG CTTTCCATTG AAGAGCTGCG ACAAGTTGCC 
AATTTTTCTT TGGTAGCCAG CTTTCCATTG AAGAGCTGCG ACAAGTTGCC 
AATTTTTCTT TGGTAGCCAG CTTTCCATTG AAGAGCTGCG ACAAGTTGCC 



1201 1250 
TAOGCCTTTT TAtACCAAGA ACTCAGCAGA GAAGATGCGG AGCAATTTGA 
TAOGCCTTTT TAcACCAAGA ACTCAGCAGA GAAGATGCGG AGCAATTTGA 
msa31161.2{327dNT_H36B} TAOGC CTTTT TAcACCAAGA ACTCAGCAGA GAAGATGCGG AGCAATTTGA 
Consensus ********** **_******* ********** ********** ********** 



msa3XX6X . 2 f 327dNt_2603 } 
msa3XX61.2{327d_18RS21J 



1251 1300 
msa31161 . 2 { 327dNt_2603 j AAAAGATAAA GGTAATCAGC CAGATTTAAC TCTCAGAGAT TGGAAAAGCA 
msa31161. 2 (327d_18RS2l) AAAAGATAAA GGTAATCAGC CAGATTTAAC TCTCAGAGAT TGGAAAAGCA 
msa3XX6X.2{327dNT_H36B} AAAAGATAAA GGTAATCAGC CAGATTTAAC TCTCAGAGAT TGGAAAAGCA 
Consensus ********** ********** ********** ********** ********** 



X301 1350 
msa31161.2{327dNt_2603} AGCTAGAGAA AGCTGAGGGA AAAGAAGTAG TTGATGAAGA ATTCGCGGAA 
msa31161.2(327d_18RS2l} AGCTAGAGAA AGCTGAGGGA AAAGAAGTAG TTGATGAAGA ATTCGCGGAA 
msa31161.2{327dNT_H36B) AGCTAGAGAA AGCTGAGGGA AAAGAAGTAG TTGATGAAGA ATTCGCGGAA 
Consensus ********** ********** ********** ********** ********** 



1351 1400 
msa31161 . 2 (327dNt_2603 } AATCCACTGG TTCAGAGAGT ATTGGACACT TATCCTCTGG GGTCATTGGT 
msa31161.2{327d_18RS21} AATCCACTGG TTCAGAGAGT ATTGGACACT TATCCTCTGG GGTCATTGGT 
msa31161.2{327dNT_H36B) AATCCACTGG TTCAGAGAGT ATTGGACACT TATCCTCTGG GGTCATTGGT 
Consensus ********** ********** ********** ********** ********** 
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1401 1450 
msa31161.2{327dNt_2603 } TTCCTATAAG GGACAGGACT TTGAGGTCAT GTCGGTCAGC GATGCTCGAT 
msa3H61.2f 327d_18RS21) TTCCTATAAG GGACAGGACT TTGAGGTCAT GTCGGTCAGC GATGCTCGAT 
msa31161.2{327dNT_H36B) TTCCTATAAG GGACAGGACT TTGAGGTCAT GTCGGTCAGC GATGCTCGAT 
Consensus ********** ********** ********** ********** ********** 



msa31161.2f327dNt_2603) 
tnsa31161.2{327d_18RS21J 
rasa31161.2{327dNT_H36B} 
Consensus 



1451 1500 

TGAACGGTTT GATTCGGATT GAGTTAGTCA ATGACTTTTC GGATATCATT 
TGAACGGTTT GATTCGGATT GAGTTAGTCA ATGACTTTTC GGATATCATT 
TGAACGGTTT GATTCGGATT GAGTTAGTCA ATGACTTTTC GGATATCATT 



1JJ603) 
327d_18RS21J 
327dNT_H36B) 



0isa31161.2{327dNt 
msa31161 
msa31161 



Consensus 



1501 1550 
GAACAAAATC CAGTTCTTTA TGTGAGGACC TGGGAAGAAG TCAGTCAGGC 
GAACAAAATC CAGTTCTTTA TGTGAGGACC TGGGAAGAAG TCAGTCAGGC 
GAACAAAATC CAG TT C TTT A TGTGAGGACC TGGGAAGAAG TCAGTCAGGC 



1551 1600 
msa31161. 2 (327dNt_2603 } ACTTCATCAG CCAAAGGCAG AACCACAAAC AGAGTTAGAA GAAGCGGACC 
msa31161 . 2 ( 327d_18RS2l) ACTTCATCAG CCAAAGGCAG AACCACAAAC AGAGTTAGAA GAAGCGGACC 
msa31161.2{327dNT_H36B} ACTTCATCAG CCAAAGGCAG AACCACAAAC AGAGTTAGAA 
Consensus ********** ********** -********** ********** 



1601 1650 

!_ AAGAATTAAA CCTATTCTCA TTTCTGGAAG AGGAGCcAGT TCAGAGTATT 

327d_18RS21} AAGAATTAAA CCTATTCTCA TTTCTGGAAG AGGAGCcAGT TCAGAGTATT 
327dNT H36B} AAGAATTAAA CCTATTCTCA TTTCTGGAAG AGGAGCtAGT TCAGAGTATT 



msa31161 . 2 ( 327dNt_2603 } 



Consensus 



msa31161 
rasa31161 
msa31161 



.2 
2{ 



327dNt_2603} 
327d_18RS21) 
327dNT_H36B} 
Consensus 



1651 1700 
GGACTATTGG AACCAGATGA TTCAGAAAAT GGTCATAACG ATACTGATCT 
GGACTATTGG AACCAGATGA TTCAGAAAAT GGTCATAACG ATACTGATCT 
GGACTATTGG AACCAGATGA TTCAGAAAAT GGTCATAACG ATACTGATCT 



msa31161 .2 (327dNt_2603 } 
msa3 1161 . 2 { 327d_18RS21 J 
msa31161.2{327dNT_H36B} 
Consensus 



1701 1750 
TGAAGAAACA GATAATCAAA TTCCTGAAGA GGAAGTCGTC GAAACAATTC 
TGAAGAAACA GATAATCAAA TTCCTGAAGA GGAAGTCGTC GAAACAATTC 
TGAAGAAACA GATAATCAAA TTCCTGAAGA GGAAGTCGTC GAAACAATTC 



msa31161 . 2 ( 327dNt_2603 J 
ma a3 1161 . 2 (327d_18RS21 J 
msa31161.2{327dNT_H36B} 
Consensus 



1751 1B0O 
CAGAGATTCC AGTAACGGAC TTTTATTTTC CAGAAGATTT GACGGACTTT 
CAGAGATTCC AGTAACGGAC TTTTATTTTC CAGAAGATTT GACGGA CTTT 
CAGAGATTCC AGTAACGGAC TTTTATTTTC CAGAAGATTT GACGGACTTT 



msa31161.2{327dNt 2603 J 
msa31161 . 2 { 327d_18RS21 J 
msa31161 . 2 (327dNTJH36B} 
Consensus 



1801 1850 
TATCCTAAGA CTGCTAGAGA TAAGGTTGAG ACAAACATTG TGGCCATTCG 
TATCCTAAGA CTGCTAGAGA TAAGGTTGAG ACAAACATTG TGGCCATTCG 
TATCCTAAGA CTGCTAGAGA TAAGGTTGAG ACAAACATTG TGGCCATTCG 



msa31161 . 2 {327dNt_2603 ) 
msa3 1161 . 2 ( 3 27d_16RS21 } 
msa31161 . 2 {327dNT_H36B} 
Consensus 



1851 1900 
TTTGGTAAAA AATCTAGAAG TAGAGCACCG CAATGCTTCA CCAAGTGAAC 
TTTGGTAAAA AATCTAGAAG TAGAGCACCG CAATGCTTCA CCAAGTGAAC 
TTTGGTAAAA AATCTAGAAG TAGAGCACCG CAATGCTTCA CCAAGTGAAC 



msa3 1161 . 2 {327dNt_2603 ) 
moa3 1161 . 2 ( 327d_18RS21 ) 
ms a31161. 2{327dNT_H36B) 
Consensus 



1901 1950 
AAGAACTCCT TGCCAAGTAT GTAGGCTGGG GTGGACTAGC CAATGAATTT 
AAGAACTCCT TGCCAAGTAT GTAGGCTGGG GTGGACTAGC CAATGAATTT 
AAGAACTCCT TGCCAAGTAT GTAGGCTGGG GTGGACTAGC CAATGAATTT 



msa3 1161 . 2 { 3 27dNt_2 6 0 3 
msa31161.2(327d_18RS21 
msa31161 . 2 (327dNT_H36B 
Consensus 



1951 2000 
TTTGATGACT ATAATCCAAA ATTTTCTAAG GAACGAGAAG AACTGAAGAG 
TTTGATGACT ATAATCCAAA ATTTTCTAAG GAACGAGAAG AACTGAAGAG 
TTTGATGACT ATAATCCAAA ATTTTCTAAG GAACGAGAAG AACTGAAGAG 



rosa31161.2{327dNt_2603) 
msa31161.2{327d_18RS21J 
TOsa31161.2{327dNT_H36B} 
Consensus 



2001 2050 
CCTAGTCACA GATAAAGAGT ATTCGGATAT GAAACAGTCC TCCCTGACAG 
CCTAGTCACA GATAAAGAGT ATTCGGATAT GAAACAGTCC TCCCTGACAG 
CCTAGTCACA GATAAAGAGT ATTCGGATAT GAAACAGTCC TCCCTGACAG 



rasa3 1 16 1 . 2 ( 3 27dNt__2 603 ) 
msa31161.2{327d_18RS21J 
maa31161.2{327dNT_H36B} 



20S1 2100 
CCTATTACAC AGACCCATCC CTGATCCGTC AGATGTGGGA TAAGTTGGAA 
CCTATTACAC AGACCCATCC CTGATCCGTC AGATGTGGGA TAAGTTGGAA 
CCTATTACAC AGACCCATCC CTGATCCGTC AGATGTGGGA TAAGTTGGAA 



1004 



WO 2004/018646 
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Consensus 



insa31161.2(327dNt_2603 
msa3 1161.2(3 2 7d_l 8RS2 1 
msa3 1 16 1 . 2 { 3 2 7dNT_H3 6B 
Consensus 



2101 2150 

AGAGATGGCT TTACAGGTGG CAAAATCCTA GATCCTTCCA TGGGAACAGG 

AGAGATGGCT TTACAGGTGG CAAAATCCTA GATCCTTCCA TGGGAACAGG 

AGAGATGGCT TTACAGGTGG CAAAATCCTA GATCCTTCCA TGGGAACAGG 



rasa31161.2(327dNt_2603j 
msa31161.2{327d_18RS2l) 
msa31161.2{327dNT_H36B} 
Consensus 



2151 2200 
GAATTTCTTT GCGGCTATGC CAAAACACTT AAGAGAAAAG AGTGAGTTGT 
GAATTTCTTT GCGGCTATGC. CAAAACACTT AAGAGAAAAG AGTGAGTTGT 
GAATTTCTTT GCGGCTATGC CAAAACACTT AAGAGAAAAG AGTGAGTTGT 



msa31161.2(327dNt_2603} 
msa31161 . 2 (327d__18RS2lJ 
msa31161.2{327dNT_H36B) 
Consensus 



2201 2250 
ATGGCGTAGA GTTAGATACT ATTACAGGAG CTATTGCCAA ACACCTTCAT 
ATGGCGTAGA GTTAGATACT ATTACAGGAG CTATTGCCAA ACACCTTCAT 
ATGGCGTAGA GTTAGATACT ATTACAGGAG CTATTGCCAA ACACCTTCAT 



msa3 1161 . 2 {327dNt_2 603 } 
msa3 1161 . 2 f 327d_18RS21 ) 
msa31161 . 2 { 327dNT_H3 6B} 
Consensus 



2251 2300 
CCCAATAGTC ATATTGAAAT TAAGGGATTT GAGACGGTGG CTTTTAACGA 
CCCAATAGTC ATATTGAAAT TAAGGGATTT GAGACGGTGG CTTTTAACGA 
CCCAATAGTC ATATTGAAAT TAAGGGATTT GAGACGGTGG CTTTTAACGA 



msa31161 . 2 {327dNt_2603 
msa31161 . 2 f 327d_18RS21 
rasa3 1 16 1 . 2 { 3 27dNT_H3 6B [ 
Consensus 



2301 2350 
CAATAGTTTT GATTTGGTGA TTTCAAATGT GCCCTTTGCC AATATACGAA 
CAATA GTTTT G ATTTG GTGA TTTCAAATGT GCCCTTTGCC AATATACGAA 
CAATAGTTTT GATTTGGTGA TTTCAAATGT GCCCTTTGCC AATATACGAA 
********** ********** ********** ********** ********** 



msa31161 . 2 f 327dNt_2603 ) 
msa31161.2{327d_18RS21J 
nisa31161.2{327dNT_H36B} 
Consensus 



2351 2400 
TTGCGGATAA TAGGTACGAT AGGCCTTACA TGATTCATGA CTACTTTGTC 
TTGCGGATAA TAGGTACGAT AGGCCTTACA TGATTCATGA CTACTTTGTC 
TTGCGGATAA TAGGTACGAT AGGCCTTACA TGATTCATGA CTACTTTGTC 



msa31161.2{327dNt_2603> 
msa31161.2{327d_18RS21> 
msa3 116 1 . 2 { 3 27 dNT__H3 6B } 
Consensus 



2401 2450 
AAAAAGTCAC TTGATTTGCT TCATGATGGT GGACAAGTAG CGATTATCTC 
AAAAAGTCAC TTGATTTGCT TCATGATGGT GGACAAGTAG CGATTATCTC 
AAAAAGTCAC TTGATTTGCT TCATGATGGT GGACAAGTAG CGATTATCTC 



msa31161.2{327dNt_2603) 
msa3 1161 .2(3 27d_18RS21 } 
msa3 1 161 . 2 { 327dNT_H3 6B) 
Consensus 



2451 2500 
TTCCACAGGA ACTATGGATA AGCGAACAGA AAACATCTTA CAAGATATTC 
TTCCACAGGA ACTATGGATA AGCGAACAGA AAACATCTTA CAAGATATTC 
TTCCACAGGA ACTATGGATA AGCGAACAGA AAACATCTTA CAAGATATTC 



msa3 1 16 1 . 2 f 3 27dNt_2 603 } 
rasa31161.2{327d 18RS21J 
msa31161 . 2{327dNT_H3 6B} 
Consensus 



2501 2550 
GTGAGACAAC TGA ATTTCTT GGTGGGGTTC GACTGCCTGA CTCTGCCTTT 
GTGAGACAAC TGAATTTCTT GGTGGGGTTC GACTGCCTGA CTCTGCCTTT 
GTGAGACAAC TGAATTTCTT GGTGGGGTTC GACTGCCTGA CTCTGCCTTT 



rasa31161 . 2 (327dNt_2603 } 
msa3 1161 . 2 ( 327d_18RS2 1 > 
msa31161 . 2{327dNT_H36B> 
Consensus 



2551 2600 
AAGGCCATTG CAGGAACGAG TGTCACAACG GATATGTTAT TCTTCCAGAA 
AAGGCCATTG CAGGAACGAG TGTCACAACG GATATGTTAT TCTTCCAGAA 
AAGGCCATTG CAGGAACGAG TGTCACAACG GATATGTTAT TCTTCCAGAA 



msa31161.2(327dNt 2603} 
msa3 116 1 . 2 { 3 27d_18RS2 1 J 
msa31161.2(327dNT_H36B} 
Consensus 



2601 2650 
ACACTTAGAC AAGGGATATG TGGCAGACGA TTTAGC CTTT TCAGGTTCCA 
ACACTTAGAC AAGGGATATG TGGCAGACGA TTTAGCCTTT TCAGGTTCCA 
ACACTTAGAC AAGGGATATG TGGCAGACGA TTTAGCCTTT TCAGGTTCCA 
********** ********** ********** ********** ********** 



msa31161.2(327dNt_2603) 
msa31161.2(327d_18RS21} 
msa31161.2{327dNT_H36B} 
Consensus 



2651 2700 
TTCGCTATGA CAAGGATAGT CGCATTTGGC TCAATCCTTA TTTTGATGGA 
TTCGCTATGA CAAGGATAGT CGCATTTGGC TCAATCCTTA TTTTGATGGA 
TTCGCTATGA CAAGGATAGT CGCATTTGGC TCAATCCTTA TTTTGATGGA 



msa31161 . 2 ( 327dNt_2603 
msa31161 .2 {327d_18RS21 
msa31161.2(327dNT_H36B 
Consensus 



2701 2750 
GAATACAATA GCCAGGTGCT AGGAACCTAC GAGGTCAGGA ATTTTAACGG 
GAATACAATA GCCAGGTGCT AGGAACCTAC GAGGTCAGGA ATTTTAACGG 
GAATACAATA GCCAGGTGCT AGGAACCTAC GAGGTCAGGA ATTTTAACGG 



rasa31161 . 2 {327dNt_2603 } 
msa3ll61.2(327d_JL8RS21} 



2751 2800 
AGGAACACTT TCTGTTAAGG GGACTAGTGA TGACTTGATT GCAAGTGTTG 
AGGAACACTT TCTGTTAAGG GGACTAGTGA TGACTTGATT GCAAGTGTTG 



1005 
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msa31161.2{327dNT_H36B} 
Consensus 



AGGAACACTT TCTGTTAAGG GGACTAGTGA TGACTTGATT GCAAGTGTTG 



msa31161 . 2 { 327dNt_2603 } 
msa31161.2{327d_18RS21) 
msa31161 . 2 {327dNT_H36B} 
Consensus 



2801 2850 
AAACAGCTCT AAATCACGTT AAGGCCCCAA GAGAGATTGA TAGAAATGAG 
AAACAGCTCT AAATCACGTT AAGGCCCCAA GAGAGATTGA TAGAAATGAG 
AAACAGCTCT AAATCACGTT AAGGCCCCAA GAGAGATTGA TAGAAATGAG 



********** ********** ********** ********** 



********** 



msa31161 . 2 (327dNt_2603 ) 
msa31161 . 2 j 327d_18RS21 J 
msa3 1 16 1 . 2 { 3 2 7dNT_H3 6B } 
Consensus 



28S1 2900 
GTCATCATTA ACCCAGATGT GTTGACCAAA CAAGTCAATG ATACCTCCAT 
GTCATCATTA ACCCAGATGT GTTGACCAAA CAAGTCAATG ATACCTCCAT 
GTCATCATTA ACCCAGATGT GTTGACCAAA CAAGTCAATG ATACCTCCAT 



msa31161 . 2{327dNt_2603) 
msa31161.2(327d_18RS21> 
msa31X61.2{327dNT_H36B) 
Consensus 



2901 2950 
TCCAGCTGAA ATGAGGGAAA ATCTAGGTCA GTACAGTTTT GGTTATCAGG 
TCCAGCTGAA ATGAGGGAAA ATCTAGGTCA GTACAGTTTT GGTTATCAGG 
TCCAGCTGAA ATGAGGGAAA ATCTAGGTCA GTACAGTTTT GGTTATCAGG 



msa31161 . 2 {327dNt_2603 } 
msa3 1 1 6 1 . 2 ( 3 27d_l 8RS2 1 > 
msa31161 . 2 {327dNT_Jt36B} 
Consensus 



2951 3000 
GGTCTACAGT TTACTATCGA GATAACAAAG GCATTCGAGT CGGAACCAAG 
GGTCTACAGT TTACTATCGA GATAACAAAG GCATTCGAGT CGGAACCAAG 
GGTCTACAGT TTACTATCGA GATAACAAAG GCATTCGAGT CGGAACCAAG 



3001 3033 
msa31161.2f 327dNt_2603) ACGGAAGAAA TCAGTTACTA TGTCGATGAA GAG 
msa31161.2(327d_18RS2l} ACGGAAGAAA TCAGTTACTA TGTCGATGAA GAG 
msa31161.2(327dNT_H36B} ACGGAAGAAA TCAGTTACTA TGTCGATGAA GAG 
Consensus ********** ********** ********** *** 

SEQ ZD. NO. 7004 
STRAIN H36B frame: 1 

GGKMNQBVLLQMMRATI PRDRAIJoEAFLYYQAEHFDEEWDSL IHQFMTNRQE INKSVQVL 
HFETD VSAFVQAS PYDTAHDI^TYTGVFGQSGLQKLD KL S PS EKNLVI EVAL FNLATRFQ 
IjIiDSNGHYQTISPDSLLQKSRGANLVNVYRVANNI^ 

TVLENBETVD BHKTS WQAI SFREEGSLVI ASLDVDLSQLDVQI G PAYEELSLRR 
KFE I LTYFDQ I RNERS KVPS FRRGDFTJTEMEMTP VFDGEELIiTYLEADGS PYELKRTliTT 
VEEKELEKI GQAI RI ENQEKLTQLX IXLSQFDPDRVGI LIjXAAGRXRLXNADLAS LGG YP 
KASVTQLAIATBLLQMGLSHEKVEFFFGS 
GNQPDLTLRDWKSKLEKAEGKEVVDEBFAENPLVQRVLD^ 

DARLNGLIRIELVNDFSDI IEQNPVLYVRTWBEVSQALHQPKAEPQTEIiEBADQELNLFS 
FLEEBLVQS IGLLE PDDSENGHNDTDIiEETDNQI PEEEWET I PE I PVTDFY FPEDLTDP 
ypKTARDKVETN I VAI RLVKNLEVEHRNAS PSEQELLAICYVGWGGLANBFFDDYNPKFSK 
BREELKSLVTDKEYSDMKQS SLTAYYTDP SI, I RQMWDKLERDGFTGGKI LDPSMGTGNFF 
AAMPKHLREKSBLYGVELDT I TGAI AKHLHPNSHI E I KGFETVAFNDNS FDLVI SNVPFA 
NIRIADNRYDRPYMIHDYFVKKSLDIiLHDGGQYAI ISSTGTMDKRTENILQDIRETTEFL 
GGVRLPDSAFKAI AGTSVTTDMLFFQKHLDKGYVADDLAFSGS I RYDKDS RI WLNP YFDG 
EYNSQVLGTYBVRNFNGGTLSVKGTSDDL I ASVETALNHVKAPRE ZDRNEVI INPDVLTK 
QVNDTS I PAEMRENLGQYS FGYQGSTVYYRDNKG I RVGTKTEE I SYYVDEE 

SEQ ID. NO. 7005 
STRAIN 18RS21 frame: 1 

XGKMNQEVLLQMMRATI PRDRALLEAFLYYQAEHFDEEWDSL I HQFMTNRQE INKSVQVL 
HFETDVSAFVQAS P YDTAHDLLTYTQVFGQSGLQKLDKLS PS EKNLVI EVALFNLATRFQ 
LlLDSNGHYQT I S PDS LLQKS RGANLVNVYRVANNLADR I SRDIEQFLLTYEPELETRADE 
TVLENBETVDEHKTSVHQAI SFREEGSLVIASLDVDLSQLDVQIGKTSHLPAYBELSLRR 
KFEILTYFDQIRNERSKVPSFRRGDFDTEMEMTPVFDGEE 

VEEKELEKI GQAI RI ENQBKLTQLG IDLS QFD PDRVG I LLDAAGRFRLKNADLALLGGYP 
KASVTQLALATELL0MGLSHEKVEFFFGSQLSIEBLRQVAYAFLHQ3LSREDABQFEKDK 
GNQPDLTLRDWKSKLEKAEGKEVVDEEFAENPLVQRVLDTYP 

DARLNGL I R I EL VND FSD 1 1 EQNPVLYVRTWEEVS QALHQPKAE PQTELEEADQELNL FS 
FLEEE PVQS I GLLE PDD SENGHNDTDLEETDNQ I PEEEWET I PE I P VTD FY FP EDLTDF 
YP KTARDKVETN I VAI RLVKNLEVEHRNASPSEQELIAKYVGWGGLANEF FDDYNPKFSK 
EREELKSLVTDKEYSDMKQSSLTAYYTDPSLIRQMWDKLERDGFTGGKIIjD 
AAMP KHLRE KSEL YGVELDT I TGAI AKHLHPNSH I EI KGFETVAFNDNS FDLVI SNVPFA 
NI RI ADNRYDRP YM I HDYFVKKSLDLLHDGGQVAI ISSTGTMDKRTENILQDIRETTEFL 
GGVRLPDSAFKAIAGTSVTTDMLFFQKHLDKGYVADDIAFSGSI RYDKDSRI WLNP YFDG 
EYNS Q VliGTYEVRNFNGGTLSVKGTSDDL I AS VETALNHVKAPRE IDRNEVI INPDVLTK 
QVNDTS I PAEMRENLGQYS FGYQGSTVYYRDNKG I RVGTKTEE I SYYVDEE 

SEQ ID. NO. 7006 
STRAIN 2603 frame: 1 

GGKMNQEVLLQMMRAT I PRDRALLEAFLYYQAEH FDEEWD SL I HQFMTNRQE I NKSVQVL 
HFETDVSAFVQASPYDTAHDIiLTYTQVFGQSGIiQKLDKLSPSEKNLVI EVALFNLATRFQ 
LLDSNGHYQT I S PDSLLOKSRGANLVNVYRVANNLADRI SRDIEQFLLTYEPELETRADE 
TVLBNBBTVDEHKTSVHQAI SFRKEGSLV1ASIJ 

KFE I LTYFDQ I RNBRSKVPS FRRGD FDTEMFJ^PVFDGFoELLTYLEADGS PYEL KRTLTT 
VEEKELEKI GQAI RI ENQBKLTQLG I DLSQFD PDRVG I LLDAAGRFRLKNADLALLGGYP 
KASVTQLALATELLQ^LSBEKVEFFFGSQLS I EELRQVAYAFLYQBLSREDAEQFEKDK 
GNQPDLTLRDWKS KLEKAEGKEWD EE FAENPLVQRVLDTYPLGS LVSYKGQD FEVMSVS 



1006 
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DARLNGL I RI ELVNDFSDI I EQNPVLYWTWEEVSQALHQPKAEPC/TELEEADQELNLFS 
FLEEEPVQS I GLLE PDDSENGHNDTDLEETDNQI PEEEWET I PE I PVTD FYFPEDLTDF 
YPKTARDKVETNIVAIRLVKNLEVEHRNASPSEQBLLAKYTC^ 

EREELKSLVTDKEYSDMKQSSLTAYYTDPSLI RQMWDKLERDGFTGGKI LDPSMGTGNFF 
AAMPKHLREKSELYGVELDTITGAI AKHLHPNSHI EI KGFETVAFNDNS FDLVI SNVPFA 
NI RI ADNRYDRP YM I HDY FVKKSLDLLHDGGQVA 1 1 SSTGTMDKRTENI LQD I RETTEFL 
GGVRLPDSAFKAIAGTSVTTDMLFFQKHLDKGYVADDLAFSGSI RYDKDSRI WLNPYFDG 
EYNSQV1.GTYEVRNFNGGTLSVKGTSDDL IASVETALNHVKAPRE I DRNEVI INPDVLTK 
QVNDTS I PAEMRENLGQYS FGYQGSTVYYRDNKGI RVGTKTEE I SYYVDEE 

PRETTY of: /biotntp/msa23816 . 2 {*} June 20, 2002 11:04 



msa2 3 8 1 6 . 2 ( 3 27dKT_H3 6B J 
msa23816 - 2 (327dNt_2603 J 
rasa23816.2{327d_18RS21) 
Consensus 



1 50 
gGKMNQEVLL QMMRATIPRD RALLEAFLYY QAEHFDEEWD SLIHQFMTNR 
gGKMNQEVLL QMMRATIPRD RALLEAFLYY QAEHFDEEWD SLIHQFMTNR 
xGKMNQEVLL QMMRATIPRD RALLEAFLYY QAEHFDEEWD SLIHQFMTNR 



msa23816 . 2 {327dNT_H36B} 
msa23816.2{327dNt_2603} 
msa23816.2{327d_18RS2l} 
Consensus 



51 100 
QEINKSVQVL HFETDVSAFV QASPYDTAHD LLTYTQVFGQ SGLQKLDKLS 
QEINKSVQVL HFETDVSAFV QASPYDTAHD LLTYTQVFGQ SGLQKLDKLS 
QEINKSVQVL HFETDVSAFV QASPYDTAHD LLTYTQVFGQ SGLQKLDKLS 



msa23816 . 2 {327dNT_H36Bj 
tnsa23 816 . 2 f 327dNt_2603 J 
msa23816.2{327d_lBRS21) 
Consensus 



101 150 
PSEKNLVIEV ALFNLATRFQ LLDSNGHYQT 'ISPDSLLQKS RGANLVNVYR 
PSEKNLVIEV ALFNLATRFQ LLDSNGHYQT ISPDSLLQKS RGANLVNVYR 
PSEKNLVIEV ALFNLATRFQ LLDSNGHYQT ISPDSLLQKS RGANLVNVYR 



msa23B16.2{327dNT_H36B} 
msa23816.2<327dNt_2603) 
msa23 8 16 . 2 { 327d_18RS21 } 
Consensus 



151 200 

VANNLADRIS RDIEQFLLTY EPELETRADE TVLENEETVD EHKTSVHQAI 

VANNLADRIS RDIEQFLLTY EPELETRADE TVLENEETVD EHKTSVHQAI 

VANNLADRIS RDIEQFLLTY EPELETRADE TVLENEETVD EHKTSVHQAI 



msa23 8 16 . 2 { 3 27dNT_H3 6B } 
msa23B16.2{327dNt_2603} 
msa23816.2{327d_18RS2l} 
Consensus 



201 250 
SFREEGSLVI ASLDVDLSQL DVQIGKTSHL PAYEELSLRR KFBILTYFDQ 
SFREEGSLVI ASLDVDLSQL DVQIGKTSHL PAYEELSLRR KFBILTYFDQ 
SFREEGSLVI ASLDVDLSQL DVQIGKTSHL PAYEELSLRR KFBILTYFDQ 



msa23816.2{327dNT_H36B} 
msa23816.2(327dNt_2603) 
msa23816 . 2 { 327d_18RS2 1 } 
Consensus 



251 300 

IRNERSKVPS FRRGDFDTEM EMTPVFDGEE LLTYLEADGS PYELKRTLTT 

IRNERSKVPS FRRGDFDTEM EMTPVFDGEE LLTYLEADGS PYELKRTLTT 

IRNERSKVPS FRRGDFDTEM EMTPVFDGEE LLTYLEADGS PYELKRTLTT 



msa23816.2(327dNT H36B) 
msa23 816 . 2 <327dNt_2603 J 
msa23816.2{327d_18RS2l) 
Consensus 



301 350 
VEEKELEKIG QAIRIENQEK LTQLxIxLSQ FDPDRVGILL xAAGRxRLxN 
VEEKELEKIG QAIRIENQEK LTQLgldLSQ FDPDRVGILL dAAGRf RLkN 
VEEKELEKIG QAIRIENQEK LTQLgldLSQ FDPDRVGILL dAAGRf RLkN 



msa23816.2f327dNTJH36Bj 
msa23816 . 2 (327dNt_2603 J 
tnsa23816 . 2 (327d_18RS21 } 
Consensus 



351 400 
ADLAsLGGYP KASVTQLALA TELLQMGLSH EKVEFFFGSQ LSIEELRQVA 
ADLA1LGGYP KASVTQLALA TELLQMGLSH EKVEFFFGSQ LSIEELRQVA 
ADLA1LGGYP KASVTQLALA TELLQMGLSH EKVEFFFGSQ LSIEELRQVA 



msa23816.2f327dNT_H36B) 
msa23816 . 2 <327dNt_2603 ) 
msa23816 . 2 {327d_18RS2l} 
Consensus 



401 450 
YAFLhQELSR EDAEQFEKDK GNQPDLTLRD WKSKLEKAEG KEWDEEFAE 
YAFLyQELSR EDAEQFEKDK GNQPDLTLRD WKSKLEKAEG KEWDEEFAE 
YAFLhQELSR EDAEQFEKDK GNQPDLTLRD WKSKLEKAEG KEWDEEFAE 



msa23816.2(327dNT H36B} 
msa23816.2(327dNt 2603) 
msa23816.2{327d_18RS21} 
Consensus 



451 500 
NPLVQRVLDT YPLGSLVSYK GQDFBVMSVS DARLNGLIRI ELVNDFSDI I 
NPLVQRVLDT YPLGSLVSYK GQDFBVMSVS DARLNGLIRI ELVNDFSDI I 
NPLVQRVLDT YPLGSLVSYK GQDFBVMSVS DARLNGLIRI ELVNDFSDI I 



msa23816 . 2 f 327dNT_H36B} 
msa23 816.2 { 3 27dNt_2 603 > 
msa23B16.2{327d_18RS21} 
Consensus 



501 550 
EQNPVLYVRT WEEVSQALHQ PKAEPQTELE EADQELNLFS FLEEElVQSI 
EQNPVLYVRT WEEVSQALHQ PKAEPQTELE EADQELNLFS FLEEEpVQSI 
EQNPVLYVRT WEEVSQALHQ PKAEPQTELE EADQELNLFS FLEEEpVQSI 



msa23816.2(327dNT > H36B) 
rasa23816 . 2 { 327dNtJZ603 } 
maa23816.2{327d_18RS21} 
Consensus 



551 600 
GLLEPDDSEN GHNDTDLEET DNQIPBEEW ETIPEIPVTD FYFPEDLTDF 
GLLEPDDSEN GHNDTDLEET DNQIPEEEW ETIPEIPVTD FYFPEDLTDF 
GLLEPDDSEN GHNDTDLEET DNQIPBEEW ETIPEIPVTD FYFPEDLTDF 



1007 



WO 2004/018646 
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msa2 3 8 1 6 . 2 { 3 27dNT_H3 6B ) 
msa23816.2.(327dNt_2603} 
msa23816 . 2 {327d_lBRS21} 
Consensus 



601 650 

YPKTARDKVE TNIVAIRLVK NLEVEHRNAS PSEQELLAKY VGWGGLANEF 

YPKTARDKVE TNIVAIRLVK NLEVEHRNAS PSEQELLAKY VGWGGLANEP 

YPKTARDKVE TNIVAIRLVK NLEVEHRNAS PSEQELLAKY VGWGGLANEP 

********** ********** ********** ********** ********** 



msa23816 . 2 f 327dNT_H36Bl 
msa23816 . 2 (327dNt_2603} 
tnsa23816 . 2 {327d_18RS2l} 
Consensus 



651 700 

FDDYNPKFSK EREELKSLVT DKBYSDMKQS SLTAYYTDPS LIRQMWDKLE 

FDDYNPKFSK EREELKSLVT DKBYSDMKQS SLTAYYTDPS LIRQMWDKLE 

FDDYNPKFSK EREELKSLVT DKBYSDMKQS SLTAYYTDPS LIRQMWDKLE 



msa23816.2{327dNT H36B) 
msa23816 . 2 (327dNtl2603 } 
msa23816.2{327d_18RS21) 
Consensus 



701 750 
RDGFTGGKIL DPSMGTGNFF AAMPKHLREK SELYGVELDT ITGAIAKHLH 
RDGFTGGKIL DPSMGTGNFF AAMPKHLREK SELYGVELDT ITGAIAKHLH 
RDGFTGGKIL DPSMGTGNFF AAMPKHLREK SELYGVELDT ITGAIAKHLH 



tnsa23816 . 2 {327dNT_H36B} 
msa23816.2(327dNt_2603> 
msa23816.2{327d_18RS2l} 
Consensus 



751 800 
PNSHIEIKGF ETVAFNDNSF DLVISNVPFA NIRIADNRYD RPYMIHDYFV 
PNSHIEIKGF ETVAFNDNSF DLVISNVPFA NIRIADNRYD RPYMIHDYFV 
PNSHIEIKGF ETVAFNDNSF DLVISNVPFA NIRIADNRYD RPYMIHDYFV 



msa23816.2(327dNT_H36B} 
msa23816.2{327dNt 2603} 
msa23816 . 2 {327d_l?RS21 } 
Consensus 



801 850 
KKSLDLLHDG GQVAIISSTG TMDKRTENIL QDIRETTBFL GGVRLPDSAF 
KKSLDLLHDG GQVAIISSTG TMDKRTENIL QDIRETTEFL GGVRLPDSAF 
KKSLDLLHDG GQVAIISSTG TMDKRTENIL QDIRETTEFL GGVRLPDSAF 



msa238 16 . 2 { 327dNT_H36B) 
msa23816 . 2 [ 327dNt_2603 } 
rasa23816.2{327d_18RS2l) 
Consensus 



851 900 
KAIAGTSVTT DMLFFQKHLD KGYVADDLAF SGSIRYDKDS RIWLNPYFDG 
KAIAGTSVTT DMLFFQKHLD KGYVADDLAF SGSIRYDKDS RIWLNPYFDG 
KAIAGTSVTT DMLFFQKHLD KGYVADDLAF SGSIRYDKDS RIWLNPYFDG 



msa23816 . 2 (327dNT_H36B) 
msa23816 . 2 (327dNt_2603 J 
msa23816 . 2 {327d_18RS2l} 
Consensus 



901 950 
EYNSQVLGTY EVRNFNGGTL SVKGTSDDLI ASVETALNHV KAPREIDRNE 
EYNSQVLGTY EVRNFNGGTL SVKGTSDDLI ASVETALNHV KAPREIDRNE 
EYNSQVLGTY EVRNFNGGTL SVKGTSDDLI ASVETALNHV KAPREIDRNE 



msa23816.2 
msa23816.2 
msa23816.2 



327dNT_H36B} 
327dNt_2603J 
327d_18RS21) 
Consensus 



951 1000 
VIINPDVLTK QVNDTSIPAE MRENLGQYSF GYQGSTVYYR DNKGIRVGTK 
VIINPDVLTK QVNDTSIPAE MRENLGQYSF GYQGSTVYYR DNKGIRVGTK 
VIINPDVLTK QVNDTSIPAE MRENLGQYSF GYQGSTVYYR DNKGIRVGTK 



msa23816 . 2 {327dNT_H36B} 
msa23816 . 2 (327dNt_2603 V 
rasa23816.2{327d_18RS21) 
Consensus 



1001 1011 
TEBISYYVDB E 
TEEISYYVDE E 
TEEISYYVDE B 
********** * 
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Table 71: Comparative Sequences relating to SAG1333 



SEQ ID NO. 7101 
STRAIN 2603 

ATGAAAAAGAAAATTATTTTGAAAAGTAGTGTTCTTC 

ATGTTCTCAAGCGTGTrCGCGGACCAAGTCGGTGTCCJ^^ 

CATGGTGCACTTGACAATACTGGAACAGCAAATATGCCT 

GGTACTGCTGCTCAATTAGATGCTTATATGGATGACGCTCAAAAA 

AACCCTAATGGTGAAAGCATTAGGGTTCAAGCAGGCG^ 

AACTCIKXX3 CTTCTTCAAGATGAACCAACT^^ CAATGAATGTTGAG 
TATGGCACATTGGGT AACCATGAATTTGATGAAGGGTTGG CAGAATATAATCGTATCGTT 
ACTGGTAAAG CCCCTG CTCCAGATTCTAAT ATTAATAATATTACGAAATCATACCCACAT 
GAAGCTGCAAAACAAGAAATTGTAGTGGCAAATGTTATTGATAAAGTT^ 
CCTTACAATTGGAAGCCTTACGCTATTAAAAATAT^ 
GTTGGCITTATCGGGATTGTCACCAAAGACATCCa^ 

GAACAAT ATGAATTTTTAGATGAAG CTGAAACAATtXnTAAATACGCCAAAGTUVTTACAA 

GCTAAAAATGTCAAAGCTATTGTAGTTCTCGCACATGT^ 

ATTGCTGAAGGTGAAGCAGCAGAAATGATGAAAAAAGTCAATC^ 

AGCGTAGATATTGTCTTTGCTGGACACAATCA^^ 

ACTCGTATTGTACAAGCX3CTCTCTCAAGGAAAAGCCTATC 

GATACTGATACACAAGATTTCATTGAGACCCX^ CAGTTGCTCCT 

GGTAAAAAAACAGGTAGTGCCGATATTCAAGCCATTGTTGACCAAGCT 

AAACAAGTAACAGAAGCTAAAATTGGTACTGCCGAGGTAAGTGTCA^^ 

GTTGATCAAGATAATGTTAGTCCX3GTAGGCAG CCTCATCACAGAGGCTCAACTAG CAATT 

GCTCGAAAAAGCTGGCCaVGATATCGATTTTGC 

GACTTACTCATCAAACCAGATGGAACA/^CACCrGGGGAGCTGC 

TTTGGTAATATCTTACAAGTCGTCGAAA^ 

GAACAATACGACCAAAAACAAAATTTCTTCCTTCA 

ACAGATAATAAAGAGGGCGGGGAAGAAACACCATTTAAAGTTOT 

AATGGTGAGGAAATCAATCXTIK3ATGCAAAATACAAA 

GGTGGTGGTGATGGCITTGCAAGCTTCAGAAATGCC^^ CCATTAACCCC 

GATACAGAGGTATTTATGGCCTATATCACTC 

GTTCCAAATAATA^CCTAAAATCTATGTCACrATGAAGATG^ 

CAAAATGATGGTACACATAGCATTAITAAGAAACTTTATTTAG^ 

GTAGCACAAGAGATTGTATCMACACrTTAAACCAA^ 

AACCCTGTAACTACAATTCACAAAAAACAATTACAC^ 

AGAAATTATGX3CAAACCATCAAACrrCCACTACTX3 

AACTCTGAATATGGACAATCATTCCITATGTCTG^ 

GCTTTAAATACAAAGAAAAAACATATGAAA 

SEQ H> HO. 7102 
STRAIN 090 

AAGTOSGTGTCCMGTTATAGGCGTCAATGACTTTCATGG 

AATACTGGAACAGCAAATATGCCTGACGGAAAAGTT^ 

TGCTGCTCAATTAGA0X3CTTATATGGATGATGCTCAAAAAG^ 

AAACTAACCCTTAATGGTGAAAGC^TTAGAGTTCAAGC^ 

GGAGCAAGTCCAGCTAACTCAGGGCTTCTT^ 

AACATTTAATGCAATGAATGTTGAGTATGGCACATTAG^ 

TTGATGAAGGTTTGGCAGAATACAATCCT 

GCTCCAGATTCTAATATAAATAATATTAOIAAATCATACCCACAC^ 

TGCAAAACAAGAAATTGTAGTGGCAAATOTTATTGATAAAGTT 

AAATCCCTTACAATTGGAAACCITACXSCTATTAAAAATATTCC^ 

AACAAAA£mH"GAACGTTGGCTTTATCGGAAT 

AAACCTTGTCTTACGTAAAAATTATGAACAATATGAATTTT^ 

CTGAAACAATtXTTTAAATACGCCAAAGAATTACAAGCT 

GCTATTGTAGTCCTTGCrCATGTACCTGCAACAAGCAA^ 

TGAAGGTGAAGCAGCAGAAATGATGAAAAA7U5TCAATCAACT 

AAAATAGOGTAGATATTGTCTTTGCTGGACACAATCAT^ 

GGTCTTGTTGGTAAAACTCGCATTCTACAAG 

CTATGCTGACGTACGTGGTGTCCTAGATACTGAT^ 

AAACCCCTTCAGCTAAAGTAGTTGCAGTTGCTOCTGCT 

AOTGCCGATATTCAAGCCATTGTTGACCAAGCTAAT^ 

AGTAACAGAAGCTAAAATTGGTACTGCCGAGGTAAGTGGCATGAT^ 

GTTCTGTTGATCAAGATAATGTTAGTCX3U3TAG^ 

GCTCAACTAGCAATTGCTCGAAAAAGCTGGCCAG^ 

GACAAATAATGGTGGC^TTCGTGCTGACTTACTCAl^ 

CAATCACCIXjGGGAGCTGCACAAGCAG TTCAA CCITC 

CAAGTCGTCGAAATTACTGGTAGAGATCTTTAT^ 

J^ACGACCAAAAAO^AAATTTCTTCCTTCAAATAGCT 

CTTAC^CAGATAATAAAGAGGGCGGAGAAGAAACACCATTTAAAGTrGTA 

AAAG CITATAAATCAAATGGTGAAGAAATCAATCCTGATG 

ATTAGTTATCAATGACTTTTTATTCX^TGG 

TCAG3UVATCCCAAACTTCTAGGAGCCATTAA 

ATGGCCTATATCACTGATTTAGAAAAAG CTGGTAAAAAAGTGAGCGTTCC 

AAATAATAAACCTAAAATCTATGTCACTATGAAGATGGTTAATG^ 

TTACACAAAATGATGGTACACATAGCATTATTAAGAAACTTTATTTAG^ 

CX1ACAWK5AAATATTGTAGCACAAGAGATTCTAT 

AACAAAATCAAAATCTACAAAAATCAA(XCTGTAACT^ 

AACAATTACACCAATTTACAGCTATT^ 

CCATC^AACTCCACTACIOTAAAATCAAAACAA 

SEQ XD NO. 7103 
STRAIN A909 

GCGTCAATGACTTTCMt3GTGCaCTTGACAAT^^ 
CCTGACGGAAAAGTTACTAATGCTGGCACTGCTt3C 



1009 
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TATGGATGATGCTCAAAAACATTTCAAACAAACT 

GCATTAGAGTTCAAG CTGGTGATATGGTTGGAGCAAGTCX1AGCTAACTCA 
GGGCT/TCTrCAAGATGAACCAACCGTTAAA^ 

TGAGTATGGCACATTAGGTAACCATGAATTTGATGAAGGTTTGGC^ 

ACAATCGTATCGTTACTGGAAAGG CCCCTGCTCCaG aTTCTAATATAAAT 

AATATTACGAAATCATACCCACACGAAGCTGCAAAACAAGAAATTGTAGT 

GGCAAACGTTATTGATAAAGTTAACAAACAAATCCCTrACAATTGGAAAC 

CTTACACTATTAAAAATATTCCTGTAAATAACAAAAGTGTGAA^ 

TTTATCGGAATCXTTCACCAAAGACATC 

TTATGAACAATATGAAl'l'r 1UAGATGAAGCTGAAACAAT CGTTAAATACG 
CCAAAGAATTACAAG CTAAAAATGTCAAGG CTATTGTAGTCCTTG CT CAT 
GTACCTGCAACAAGCAAGGATGAT ATTGCTGAAGGTGAAG CAGCAGAAAT 
GATGAAAAAAGTCAATO^CTCTTCCCTGAAAATAGCGTAGATATTGTCT 
TTGCTGGAC^CAATCATtMTATACAAATGGTCTTGTTGGTA 
ATTGTACAAG CGCTCTCTCAAGGAAAAGCCTATGCTGATGTACX5TGGTGT 
CCTAGATACTGATACACAAGATTTCATTGAAACCCCTTCAGCT 
TTGCAGTTGCTCCTGGTAAAAAAACAGGTAGTGCCGATAT^^ 
GTTGACCAAGCTAATACTATCGTTAAACAAGTAACAGAAGCTAAAATTGG 

TTAGTCOOTAGGCAGCCTCATCACAGAGGCT^ 

AAAAGCTGGCCAGATATCGATTTTG CCATGACAAATAATGGTGGCATTCG 

TGCTGACTTACTCATCAAACCAGATGGAACAATC 

AAGCAGTTCAACCTTTTGGTAATATCTTACAAGTCCT 

AGAGATCTTTATAAAGCACTC^CXSAACAATACGACCAAAAACAAAATTT 

CTTCCTTCAAATAGCTGGTCTGCXIATACACTTACACAGATAATAA 

G CGGGGAAGAAACACCATTTAAAGTTGTAAAAGCTTATAAATCATU^TGGT 

GAGGAAATCAATCCTGATG CAAAATACAAATTAGTTATCAATGACTTTTT 

ATTCGGTGGTGGTGATGGCTTTGCAAGCTTCAGAAATGCCA^ 

GAGCCATTAATCCCGATACAGAGGTATTTATGG^ 

GAAAAAGCTGGTAAAAAAGTGAGCGTTCCAAATAATAAACCTAAAATCTA 

TGTCACTATGAAGATGGTTAATGAAACTATTACACAA^ 

AT AG CATTATTAAGAAACTTTATTTAG AT CGACAAGGAAATATTGTAGCA 

CAAGAGATTGTATCAGACACTTTAAACCAAACAAAATCAAAA^ 

AATCAACCCTGTAACTACAATTCACAAAAAACAATTACAC^ 

AAATCAAAACAA 

SEQ ZD HO. 7104 

STRAIN H36B 

CCAAGTCGGTGTCCAAGTTATAGGCGTCAATGACTTTCATGGTGC 
ACAATACTGGAACAGCAAATATGGCTGAa^GAAAAGTTACTAATGCTGGC 
ACTGCTGCTCAATTAGATG CTTATATGGATGATG CTCAAAAAGATTTCAA 
ACAAACTAACCCTAATGGTGAAAG CATTAGAGTTCAAGCTGGTGATATGG 
TTGGAGCAAGTCCAG CTAACTCAGGGi/rr ^-rrClAAGATGAACCAACCGTT 
AAAACATTTAATGCAATGAATGTTGAGTATG 
ATTTGATGAAGGTTTGGCAGAATACAATaTCATC^ 

CTGCTCCAGATTCTAATATAAATAATATTACGAAATCATACCCACACX3AA 

GCTGCAAAACAAGAAATTGTAGTGGCAAACff 

ACAAATCCCTTACAATTGGAAACCITACACTATTAA 

ATAACAAAAGTGTGAACGTTGGCTTTATCGGAATCGTTACC^AAGACATC 

CCAAACCTTGTCTTACGTAAAAATTATGAACAATATGAATT^ 

AGCTGAAACMTCGTTAAATACGCCAAAGAATTACAAGCTAAAAATGTCA 

AGGCTATTGTAGTCCITGCrCATGTACCTGCAACAA^ 

GCTGAAGGTGAAGCAGGAGAAATGATGAAAAAAGTCAATCAACT 

TGAAAATAGCGTAGATATTGTCrl'lXXrTGGACACAATCATCAATATACAA 

ATGGTCTTGTTGGTAAAACTCGTATTGTACAA 

TGAAACCCCTTCAGCTAAAGTAATTGCAGTT^ 

GTAGTGCCGLATATTCAAGCCAXi\i'rit^CGAAGCTAATACTATCGTTAAA 

CAAGTAACAGAAGCTAAAATTGGTACTGCCGAGGTAAGTG^ 

GCGTTCTGTTGATCAAGATAATGTTAGTCCIGGTAGGCAGCC^ 

AGGCTCAACTAG CAATTGCT CGAAAAAGCTGG CXIAGATATCGATTTTGCC 

ATGACAAATAATGGTGGCATTCGTGCTGACTTACTCAT^ 

AACAATCACCTCGGGAGCTCCACAAGCAGTTCAACCT^ 

TACAAGTCETCGAAATTACTGGTAGAGATCTTTATAAAGCACrrCAACGAA 

CAATACGACCAAAAACAAAATTTCTTCCITCAAATAGCTGGTCTC 

CACTTACACAGATAATAAAGAGGGCGGGGAAGAAACACCA^ 

TAAAAGCTTATAAATCAAATGGTGAGGAAATCAATCC^ 

AAATTAGTTATCAATGACITTTTATTCGGTGGTC 

CTTCAGAAATGCCAAACITCTAGGAGCCATTAA^ 

TTATGGCCTATATCACTGATTTAGAAAAAGCTGGTAAAAAAG^ 

CCAAATAATAAACCTAAAATCTATGTCACTATGAA^ 

TATTACACAAAATGATGGTACATATAGCATTATTAAGAAACTT^ 

ATCGACAAGGAAATATTGTAGCAI2AAGAGATTGTATCAGACA 

CAAACAAAATCAAAATCTACAAAAATCAACCCTCTAACTACAATTCAC 

AAAACAATTACACCAATTTACAGCTATTAACCCTATGAGAAATT 

AACCATCAAACTCCACTACTGTAAAATCAAA 

SEQ ZD KO. 7105 
STRAIN 18RS21 

GACCAAGTCGGTGTCCAAGTTATAGG CGTCAATGACTTTC 

ATGGTGCACTTGACAATACTGGAACAGCAAATATGCC^ 

AnTAATGCTGGCACTQCTGCTCAATTAGATGCTTATA 
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AAAAGATTTCAAACAAACTAACCCTAATGGTGAAAGCATTAGAGTTCAAG 

CTGGTGATATGGTTGGAGCAAGTCCAGCTAACTCAGGGCTTC^ 

GAACCAACCGTTAAAAC^TTTAATGCAATGAATGTTGA^ 

AGGTAACCATGAATTTGATGAAGGTTTGG CAG AATACAATCGTATCGTTA 

CTGGAAAGGCCCCTGCTCCAGATTCTAATATAAATAATATTACGAAATCA 

TACCGACACGAAGCTGCAAAACAAGAAATTGTAG^ 

TAAAGTTAACAAACAAATCC CITACAATTGGAAACCTTAC^CT 

ATATTCCTGTAAATAACAAAAGTGTGAACGTTGGCTTTATCGGA^ 

ACCA^GACATCCCAAACCTTGTCTTACXSTAAAAATTATGAACAATATGA 

ATTTTTAOATGAAGCTGAAACAATCGCT^ 

CTAAAAATGTCAAGGCTATTGTAGTCCTTGCTCATGT^ CAACAAGC 
AAGGATGATATTGCTGAAG<3TGAAGCAGCAGAAATG^ 
• TCAACTCITCCCTGAAAATAG CGTAGATATTGTCTTTGCTGGACACAAT C 
ATCAATATACAAATGGTCTTGTTGGTAAAACT CGTATTGTACAAG CG CT C 
TCTCAAGGAAAAGCCTATGCTGATGTAari^ 
ACAAGATTTCMTGAAACCCCTTCAGCTAAAGTAAT^ 
GTAAAAAAACAGGT AGTGC CGATATTCAAGCCATTGTTGACCAAG CTAAT 
ACTATCX3TTAAACAAGTAACAGAAGCTAAAATTGGTACTGCCGAGGTAAG 
TGGCATGATTACGCGTTCTG1TGATCAAGATAATGTT 
GCCTCATCACAGAGGCTCAACTAGCAATTC 
ATCGATTTrGCCATGACAAATAATGGTGGCATTCGTC 
CAAACCAGATGGAACAATCACCTGGGGAGCTG CACAAGCAG^CAACCTT 
TTGGTAATATCTTACAAGTCGTOGAAATTACTGGTAGAGATCTTT 
GCACTCAACX3AACAATACGACCAAAAACAAAATTTCTTC C 
TGGTCTGOGATACACTTACACAGATAATAAAGAGGGCGGGGAA^ 
CATTTAAAGTTGTAAAAGCTTATAAATCA AATGGT GAGGA 
GATGCAAAATACAAATTAGTTATCAATGACTTTT^ 
TGGCITTGCAAGCTTCAGAAATGCCAAACTTCTA 

ATACAGAGGTATTTATGGCCTATATCACTGATTTAGAAAAAGCTGGTAAA 

AAAGTGAGCGTTCCAAATAATAAACCTAAAATCTATGTCACTATGAAGAT 

GGTTAATGAAACTATTACACAAAATGATGGTACATATAGCATTATTAAGA 

AACTTTATTTAGATCCACAAGGAAATATTGTAGCACAAGAGAT^ 

GACACTTTAAACCAAACAAAATCAAAATCTACAAAAATCAAra 

TACAATTCACAAAAAACAATTACACCAATTTACAG CTATTAACCCTATGA 

GAAATTATGGCAAACCATCAAACTCCACTACTGTAAAATCAAAA 

SBQ ZD NO. 7106 
STRAIN M732 

ACCAAGTOTGTGTCCAAGTTATAGGCGT^ 

GACAATACTGGAACAGCAAATATGCCTGACGGAAAAGTTACTAAT GC^ 
C^CTGCTGCTCAATTAGATGCTTATATGGATG^ 

AACftAACTAACCCTAATGGTGAAAG CATTAGAGTTCAAGCTGGTGATATG 

GTTGGAGCAAGTCOVGCTAACTCAGGGCTTCT^ 

TAAAACMTTAATGCAATGAATGTTGAGTATGGCAC^^ 

AATTTGATGAAGGTTTGGC^GAATACAATCGTATCGTT^ 

CCTGCTCCAGATTCTAATATAAATAATATTAaSAAA^ 

AGCTGCAAAACAAGAAATTGTAGTGGCA^C^TTATTGATAAAGTrAACA 

AACAAATCCCTTACAATTGGAAACCTTACACrATTAAAAATATTC^ 

AATAACAAAAGTGTGAACGTTGGCTTTATCX3G7UVTCX3 

CCCAAACCTTGTCTTACGTAAAAATTATGAAC^ 

AAGCTGAAACAATCGTTAAATACGCCAAAGAATTACS^ 

AAGGCTATTGTAGTCCTTGCTCATGTACCT^^ 

TGCTGAAGGTGAAGCAGCAGAAATGATGAAAAAAGTCAATCAAC^^ 

CTGAAAATAGCGTAGATATTGTCTTTGCTGGACACAATC^ 

AATGGTCTTGTTGGTAAAACTCGTATlXj^^ 

AGCCTATGCTGATGTACX?It3GTGTCCTAGATACrGAT^ 

1TGAAACCCCTTCAGCTAAAGTAATTG CAGTTGCTCCTGGTAAAAAAACA 

GGTAGTGCCGATATTCAAGCCATT^ 

ACAAGTAACAGAAGCTAAAATTGGTACTGCCGAGGTAAGTGG 

CGCGTTCTGTTGATCARJGATAATGTTAGTCOG 

GAGGCTCAACTAGCAATTGCTCGAAAAAGCTG^ 

CATGACAAATAATGGTGGCATTCGTGCTGACTTACT 

GAACAATCACCTGGGGAGCTGCACAAGCAGTTCAACCrTTT^ 

TTACAAGTCGTCGAAATXACTGGTAGAGATCTTTATA CACTCAACGA 

ACACTTACACAGATAATAAAGAGGGCGGGGAAGAAACACCATT^ 

GTAAAAGCITATAAATCAAATGGTGAGGAAATCAATCCIX^ 

CAAATTAGTTATCAATGACITTTTATrCGGTGGTG 

GCTTCAGAAATGCXIAAACTTCTAGGAGCCATT^ 

TTTATGGCCTATATCACTGATTTAGAAAAAGCTGOTA 

TCCAAATAATAAACCTAAAATCTATGTCACTATGAAQATGGTTAATGAAA 

CTATTACACAAAATGATGGTACATATAGCATTATTAAG^ 

GATCGACAAGGAAATATTGTAGCACAAGAGATTGTATCAGACAu 

CCAAACAAAATCAAAATCTACAAAAATCAACXCTGTAAC^^ 

AAAAACAATTACACCAATTTACAGCIATTAACOCTATG^ 

AAACCATCAAACTCCACTAClXn'AAAATCAAAACAA 

SBQ ZD HO. 7107 
STRAIN COH1 

ACCAAGTCGGTGTCCAAGTTATAGGCGTCAATQALrrrrCAl 
GACAATACTGGAACAGCAAATATG CCTQACGQAAAAGTTACTAATGCTGG 
CACTGCTGCTCAATTAGATGCTTATATGGATGAT^ 
AACAAACTAACCCTAATGGTGAAAGCATTAGAGTTCAAGCTG^ 
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GTTGGAGCAAGTCCAGCTAACTCAGGGCTTCTTCAAGATG 

TAAAACATTTAATGCAATGAATGTTGA 

AATTTGATGAAGGTTTGGCAGAATACAATCGT^ 

CCTGCTCCAGATTCTAATATAAATAATATTACGAAATCATACCCACACGA 

AGCTGCAAAACAAGAAATTGTAGTGGCAAACGTTATTGATAAAGTTAA^ 

AACAAATCCCTTACAATTGGAAACCTTACACTATTAAAAATAT^ 

AATAACAAAAGTGTGAACX3TTGGCTTTATCGGAATCX5TrAC^ 

CCCAAACCTTGt CTTACGTAAAAATTATGAACAATATGAATTTTTAGATG 

AAGCTGAAACAATCGTTAAATACGCCAAAGAATTACAAGCTAAAAATGTC 

AAGGCTATTGTAGTCCITOCTCATGTACCTGCAACAAGC^^ 

TGCTGAAGGTGAAGCAGCAGAAATGATGAAAAAAGTCAATCAACTCTTC 

CTGAAAATAGCGTAGATATTGTC'lTlXiCTGGAC^CAATCATCAATA 

AATGGTCITGTTGGTAAAACTCGTATTGTA 

AGCCTATGCTGATGTACGTGGTGTCCTAGATACTGATACACAAGAT^ 
TTGAAACXXXTTTCAGCnAAAGTAATTG CAGTTG CTCCTGGTAAAAAAACA 
GGTAGTGCCGATATTCAAGCCATTG tTGACCAAG CTAATACTATCGTTAA 
ACaAGTAACAGAAGCTAAAATTGGTACTGCCXWX^AAGTGGCATG^ 

GAGGCTCAACTAGCAATTGCTCGAAAAAGCTGGCCAG 

CATGACAAATAATGGTGGCATTCGTGCTGACTTACTCATC^ 

GAACAATCACCrGGGGAGCTGCACAAGCAGTTCAA.Cu^ 

TTACAAGTCGTOjAAATTACTGGTAGAGATCTTTATAAAGCACTCAACGA 

ACAATACGACCAAAAACAAAATTTCTTCCTT^ 

ACACITACACAGATAATAAAGAGGGCGGGGAAGAAACACCATTTAAAGTT 
GTAAAAG CTT AT AAATCAAATGGTGAGGAAAT CAAT C CTG ATGCAAAAT A 
CAAATTAGTTATCAATGACTTTTTATTCGGTC 

GCTTCAGAAATGCCAAACTTCTAGGAGCCATTAATCCCGATACAGA^ 

TTTATGGCCTATATCACTGATITAGAAAAAa 

TCOVAATAATAAACCrAAAATCTATGTCACTATGAAGATGGTT 

GATCGACAAGGAAATATTGTAG CACAAGAGATTGT ATCAGACACTTT AAA 
CCAAACAAAATCAAAATCTACAAAAATCAACCCTGTAACTACAAT^ 
AAAAACAATT ACAC CAATTTACAG CTAITAACCCTATGAGAAATTATGG C 
AAACCATCAAACTCCACTACTGTAAAATCAAA 

SEQ ID NO« 7108 ' 
STRAIN M781 

CAAGTCGGTGTCCAAGTTATAGGCGTCAATGACTTTCATG^ 
CAATACTGGAACAGCAAATATGCCTGACGGAAAAGTTACTAATGCTGGCA 
CTGCTGCTCAATTAGATGCITATATGGATGATGCTCAAAAAGATTO 
CAAACTAACCCTAATGGTCAAAGOVTTAGAGTT^ 

TGGAGCAAGTCCAGCTAACTCAGGGCTTCTTCAAGATGAACCAACCGTTA 

AAACA3TTAATGCAATGAATGTIX3AGTATGGCACATTAGGTAACC^ 

TTTOATGAAGGTTTGGCAGAATACAATCGTATCGTTACTGGJ^ 

TGCTCCAGATTCTAATATAAATAATATTACGAAATCATACCCACACGAAG 

CTGCAAAACAAGAAATTGTAGTGG CAAACGTTATTGATAA?^GTTAACAAA 

CAAATCCCTTACAATTGGAAACCTTACACTATTAAAAATATTCCTCT 

TAACAAAAGTGTGAACGTTGGCTTTATQ3GAATCGTT 

CAAACXTTTGTCTTACGTAAAAATTATG^ 

GCTGAAACAATCGTTAAATACGCCAAAGAATTACAAGCTAAAAATGTCAA 
GGCTATTGTAQTCCTTGCTCATGTACCTGCAACAAG^AAGGATGATAT^ 
CTGAAGGTCAAGCAGCAGAAATGATGAAAAAAGTCAAt CAACTCTTCCCT 
GAAAATAGCGTAGATATTGTCTTTGCTGGACACAATCATCAA 
TGGTCTTGTTGGTAAAACTCGTATTGTACAAG CGCTCTCTCAAGGAAAAG 
CCTATGCTGATGTACGTGGTGTCCTAGATACTGATACACAAGA 

TAGTGCCGATATTCAAGCCATTGtTGACCAAGCTAATACT 
AAGTAACAGAAG CTAAAATTGGTACTG CCGAGGTAAGTGGCATGATTACG 
CGTTCTGTTGATCAAGATAATGTTAGTCCGGTAGGCAG^ 
GGCTCAACTAG CAATTG CTCGAAAAAGCTGGCCAGATATCGATTTTG CCA 
TGACAAATAATGOK^CATTCGTGCTGACTTA 
ACAAT(^CCTCGGGAGCTGCACAAGC3VGOT 

ACAAGTCGTCGAAATTACTGGTAGAGATCTTTATAAAGCACTCAACGAAC 

AATACGACCAAAAACAAAATTTCTTCCTTCAAATAG^ 

ACTTACACAGATAATAAAGAGGGCGGGGAAGAAACACCATTTAAAGTTCT 

AAAAGCTTATAAATCA AATGGT GAGGAAATCAATCCrGAT GC^ 

AATTAGTTATCAATGACTTTTTATTCXX^ 

TTCMAAATGCa^CTTCTAGGAGCCATTAATCC 

TATGGCXTATATCACTGATTTAGAAAAAGCTGOTAA 

CAAATAATAAACCTAAAAT CTATGTC7VCTATGAAGATGGTTAATGAAACT 

ATTACACAAAATGATGGTACAT ATAG CAT^ATTAAGAAACTTTATTTAGA 

TCGACAAGGAAAT ATTGTAG CACAAGAGATTGTATCAGACACTTTAAACC 

AAACAAAATCAAAATCTACAAAAATCAAC^CTGTAACTACAATTCACAAA 

AAACAATTACACCAATTTACAGCTATTAACCCT 

ACCATCAAACItXZACrACTGTAAAATCAAA 

SEQ ID NO. 7109 
STRAIN CJB1 10 

GACCAAGTCGGTGTCCAAGTTTVTAGGCGTCAATGAC^^ 

ACTTGACAATACTGGAACAGCAAATATGCCTG^ 

CTGGCACrcCTGCTCAATTAGATGCITA 

TTCAAACAAACTAACCCTAATGGTGAAAGCAT^ 

TATGGTTGGAGCAAGTCCAGCTAACTCAGGG^ 
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CCXn^TAAAACATTTAATGCAATGAA 

CATGAATITGATGAAGGTTTGGCAGAAT^CAATCGTATCCnTACTGQAAA 
GGCCCCTG CTCCAGATT AATATAAATAATATT ACGAAATCATACCCAC 
ACX3AAGCTG CAAAACAAGAAATTGTAGTGGCAAACGTTATTGATAA^ 
AACAAACAAATCCCTTACAATTGGAAACCTTACGCTATrAAAAATATTCC 
TGTAAATAACAAAAGT^TGAACGTTGGCTTTATCGGAATOGTTACCAAAG 
ACATCCC^y\ACC r r Gl V"lU A CGTAAAAATTATGAACAATATGAATTTTTA 
GATGAAGCTGAAACAATCX3TTAAATACGCCAAAGAATTACAAGCTAAAAA 
TGTCAAGGCT ATTGTAGTCCITGCrCATGTACCTGCAA CAAGGATG 
ATATTGCTGAAGGTGAAGCAGCAGAAATGATGAAAAAAGTCAAT 
TTCCCTGAAAAT AG CGTAGATATTGTCTTTGCTGGACACAATCATCAATA 
TACAAATGGTCTTGTTGGTAAAACTCGCATTGTACAAGCGCT 
GAAAAGCCTATGCTGACGTAaSTGGTGTCCTAGATACTGATACACAAGAT 
TTCATTGAAACCCCTTCAG CTAAAGTAGTTGCAGTTGCTCCTGGTAAAAA 
AACAGGTAGTGCCGATATTCAAGC CATTGTTGACCAAG CTAATACTATCG 

ttaaacaagtaacagaagctaaaattggtacixk:cgaggtaagtggcatg 

ATTACGCGTTCTGTTGATCAAGATAATGTTAGTCCAGTAGGCAGCCTCAT 
GAGAGAGGCTTCAACr AGCAATTGCTCX1AAAAAG CTGGCCAGATATCGATT 
' TTGCCATGACAAATAATGGTGGCATTCGTGCTGACTT^ 
GATGGAACAATCACCTGGGGAGCTGCACAAGGAGTTCAAC 
TATCTTACAAGTCGTOGAAATTACI^TAGAGATCTTTATAAAG<^CTCA 
ACGAACAATACGACCAAAAACAAAATTTCITCCrrrCAAATA^ 
CGATACACTTACACAGATAATAAAGAGGGCGGAGAAGAAACACCATTTAA 
AGTTGTAAAAGCTTATAAATCMATGGTGAAGAAATC 
AATACAAATTAGTTATCAATGACTTTITATTCGGTGGT^ 
GCAAGCTTCAGAAATGCCAAACTTCTAGGAGCCATTAATCCXX3AT 
GGTATTTATGGCCTATATCACTGATTTAGAAAAAGCTGGTAAAAAAGT^ 
G CGTTCCAAATAAT AAACCTAARATCTATGTCACTATGAAGATGGTTAAT 
GAAACTATTACACAAAATGATGGTACACATAG CATTA1TAAGAAACTTTA 
TTTAGATCGACAAGGAAATATTGTAGCACAAGAGATTGTATCAG^ 
TAAACCAAACAAAATCAAAATCTACAAAAATCAACCCIX3TAACTACAA^ 
CACAAAAAACAATTACACCAATTTACAGCTATTAACCCTATGAGAAATTA 
TGGCAAACCATCAAACTCCACTACTGTAAAATCA 

SEQ ID NO. 7110 
STRAIN 1169NT 

CAAGTCGGTGTCCAAGTTATAGGCGTCAATGACrTTCATGG 

CTGCTGCTCAATTAGATGCTTATATGGATGACGCrCAAAAAGAT^ 
CAAACTAAC CCTAATGGTG AAAG CATTAG GGTTCAAGCAGGCGATATGGT 
TGGAGCAAGTCCAG CCAACTCTOGGCITCTTCAAGATGAACCAACTGTCA 
AAAATTTTAATGCAATGAATGTTGAGTATGGCACA 

TTTGATGAAGGGTTGGCAGAATATAATCX3TATa?rTACrGGTAAAGC^ 

TGCrCCAGATTCTAATATTAATAATATTACGAAATCATACCCACATGAAG 

CTGCAAAAC^GAAATTGTAGTGGCAAATGITATTGATAAAGTTAACAAA 

CAAATTCCTTACAATTGGAAGCCTTACG CTATTAAAAATATTCCTGTAAA 

TAACAAAAGTGTGAACGTTGGCTTTATCGGGATTGTCACC^ 

CAAACCTTGTCTTACXnAAAAATTATGAACAA 

G CTGAAACAATCGTTAAATACX3CCAAAGAATTACAAGCTAAAAATGTCAA 

AGCTATTOTAG t TCTCGCACATGTACCTGCAACAAGTAAAAATGATATTG 

CTGAAGGTGAAGCAGCAGAAATGATGAAAAAAGTCAATC 

GAAAATAGCGTAGATATTGTCTTTGCTGGACACAATCATCAATATACAAA 

TGGTCTTGTTGGTAAAACTCGTATTGTACAAGCXi 

arTATGCTGATGTACGTGGTGTCTTW 

GAGACCCCTTCAGCTAAAGTAATTGCAGTTGCTCCTGGTAAAAAAACAGG 

TAGTGCCGATATTGAAGCCAi'iWi'i^^CCAAGCTAATACTAT OGTTAAAC 

AAGTAACAGAAG CTAAAAlTXXnACTXKXXiAGGTAAGTGTCATGATTACG 

CGTTCTGTTGATCAAGATAATGTTAGTCCX3GTAGGCAGCCT^ 

GGCTCAACTAGCAATTGCTCGAAAAAGCTGGCCAGATATCX^ 

TGACAAATAATGGTGGCATTCXJTGCrGACTTACrCATCAA^ 

ACAATCACXrTGGGGAGCTGCACAAGCAGTTCAACCi"l"l'lGGTAATATCTT 

ACAAGTCGTCGAAATTACTGGTAGAGATCTTTATAAAGCACTCAACGAAC 

AATACGACCAAAAACAAAATTTCTTCCTTCAAATAGCTGGTCTGCGATAC 

ACTTACACAGATAATAAAGAGGGCGGGGAAGAAAC^CCATTTAAAGTTGT 

AAAAGCTTATAAATC AAATGGTG AGGAAATCAATCCTGAT GCAAA ATACA 

AATTAGTTATCAATGACTTTTTATTOGGTGGTGGTGATGG C7TTTG CAAGC 

TTCAGAAATGCCAAACT TCTAG GAGCXZATTAACCCO^ 

TATGG CCTAT AT CACTGATTTAGAAAAAG CTGGT AAAAAAGTGAG CGTTC 

CAAATAATAAACCTAAAATCTATGTCACTATGAAGATGGTTAATGAAACT 

ATTACACAAAATGATGGTACACATAGCATTATTAAGAAACTTTATT^ 

TOGACAAGGAAATATTGTAG CACAAGAGATTGTATCAGACACTTTAAACC 

AAAGAAAATCAAAATCTACAAAAATCAACCCTGTAACTACAATTCACAAA 

AAACAATTACACCAATTTACAGCTATTAACCCTATGAGAAATTATGG CAA 

ACCATCAAACTCCACTACTGTAAAATCAAA 

SEQ XD NO. 7111 
STRAIN JM9130013 

OGGTGTCCAAGTTATAGGCGTCAATGACTTTCATGGTGC^ 

CTCGAACAGCAAATATGCCTGACGGAAAACnTACTAATGCTGGG^ 

GCTCAATTAGATGCTTATATGGATGATGCTCAAAAAGATTT^ 

TAACCCTAATGGTGAAAGCATTAGAGTTCAAGCIH3GTGATAT^ 

CZAAGTCCAGCTAACTCAGGGCTTCTTCAAGATGA^ 

TTTAATGCAATGAATGTrGACTATGGCACATTAGOTA 
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TGAAGGTTTGGCAGAATACMTCOTATCG^ 

CAGATTcTAATATAAATAATATTACGAAATCATACCCACACGAAGCTGCA 

AAACAAGAAATTGTAGTGGCAAACGTTATTGATAAAGTTAACAAACAAAT 

CCCTTACAATTGGAAACCTTACACTATTAAAAATA1TCCTGTAAATAACA 

AAAGTGTGAACGTTGGCTTTATCXKSAATCGTTACCAAAGAC^TCCCAAAC 

CTTGTCTTACGTAAAAATTATGAACAATATGAATTTTTAGATGAAGC^ 

AACAATCGTTAAATACXSCXIAAAGAATTACAAGCT 

TTGTAGTCCTTG CTCATGTACCTGCAACAAGCAAGGAl^^ CTGAA 
GGTGAAG CAGCAGAAATGATGAAAAAAGTCAATCAACTCTTX^CCTGA 
TAGCGTAGATATTGTCTTTG CTGGACACAATCATCAATATACAAATGGTC 
TTGTTGGTAAAACTCGTATTGTACAAGCGCTCTCT 
GCKlATGTACGTGGTGTCXTrAGATACTGATACACA 
CCCITCAGCTAAAGTAATTGCAGTTGCTCCTGGTAAAAAAACAGGTAGTC 
CCGATATTCAAG CCATTGTTGACCAAGCTAATACTATCGTTAAACAAGTA 
ACAGAAGCTAAAATTGGTACTGCCGAGGTAAGTGGCATGATTACGCGTTC 
TGTTGATCAAGATAATGTTAGTCCGGTAGG CAGCCTCATCACAGAGGCTC 
AACTAGCAATTG CTCGAAAAAGCTGG CCAGATATCGATTTTG CCATGACA 
AATAATGGTGG CATTCGTGCTGACTTACTCATCAAACCAGATGGAACAAT 
CACCTGGGGAGCTGCACAAG CAGTTCAACCTTTTGGTAATATCTTACAAG 
TCGTCGAAATTACTCGTAGAGATCrrTTATAAAG CACTCAACGAACAATAC 

CAC^GATAATAAAGAGGGCGGGGAAGAAAC^CCATTTAAAGTTGTAAAAG 
CTTATAAATCAAATGGTGAGGAAATCAATCCTGATG CAAAATACAAATT A 
GTTAT CAATGAC'l"l"l"luATTCGGTGGTGGTGATGGC w l'l"rGCAAGCTTCAG 
AAATGOZAAACTTCTAGGAGCCATTAATCCCGATA 

CCTATATCACTGATTTAGAAAAAGCTGGTAAAAAAGTGAG CGTTCCAAAT 

AATAAACCTAAAATCTATGTCACrATGAAGATGGTTAATGAAACTATTAC 

ACAAAATGATGGTACATATAGCATrATTGAGAAACriUAl"lTAGATCGAC 

AAGGAAATATTGTAGCACAAGAGATTGTATCAGAC^CTrTAAACCAAA^ 

AAATCAAAATCTACAAAAATCAACCCTGTAACTACAAT^ 

ATTACACCAATTTACAGCTATTAACCCTATGAGAAATTATG<3 

CAAACTCCACTACTGTAAAATCAAAA 

PRETTY Of! /biotntp/msa237456.2{*} May 14, 2003 03:20 



msa237456 . 2 { 328_1169NT 
msa237456.2{328_2603 
msa237456 . 2 { 32 8_18RS21 
maa237456 . 2 f 328_H3 6B 
msa2374 56.2? 328_C0H1 
msa237456 . 2 f 328_M732 
msa237456 . 2 { 328_M781 
msa237456. 2 {328_JM9 130013 
msa237456.2{328_A909 
msa237456 . 2 {328_090 
msa237456 . 2 { 328_CJB110 
Consensus 



50 



atgaaaaaga aaattatttt gaaaagtagt gttcttggtt tagtcgctgg 



********** ********** ********** ********** ********** 



msa237456 . 2 {328_1169NT 
msa237456.2{328_2603 
msa237456 . 2 { 328_18RS21 
msa2374S6 . 2 { 328_H36& 
msa237456 - 2 328_C0H1 
msa237456.2 328_M732 
msa2374 56. 2(328 M781 
msa23 74 56. . 2 { 3 2 8_JM913 0 0 13 
msa237456 . 2 {328_A909 
msa237456.2{328_090 
msa237456 . 2 {328_CJB110 
Consensus 



51 



gacttctatt 



100 

— . caagtc ggtgtccaag 

atgttctcaa gcgtgttcgc gGACcaagtc ggtgtccaag 

-GACcaagtc ggtgtccaag 

r — - Ccaagtc ggtgtccaag 

ACcaagtc ggtgtccaag 

ACcaagtc ggtgtccaag 

~ — caagtc ggtgtccaag 

- c ggtgtccaag 



aagtc ggtgtccaag 

-GACcaagtc ggtgtccaag 



msa237456 . 2 { 328_1169NT 
msa237456.2{328_2603 
msa237456 . 2 { 328_18RS21 
msa237456.2{328_H36B 
msa2 37456 . 2 { 328_C0H1 
msa237456.2(328_M732 
rasa237456 . 2{328_M781 
msa237456 . 2 { 328_JM9130013 
msa237456.2{328_A909 
msa237456.2{328_090 
msa237456.2{328_CJB110 > 
Consensus 



101 

ttatagGCGT 
ttatagGCGT 
ttatagGCGT 
ttatagGCGT 
ttatagGCGT 
ttatagGCGT 
ttatagGCGT 
ttatagGCGT 

GCGT 

ttatagGCGT 
ttatagGCGT 



CAATGACTTT 
CAATGACTTT 
CAATGACTTT 
CAATGACTTT 
CAATGACTTT 
CAATGACTTT 
CAATGACTTT 
CAATGACTTT 
CAATGACTTT 
CAATGACTTT 
CAATGACTTT 



CATGGTGCAC 
CATGGTGCAC 
CATGGTGCAC 
CATGGTGCAC 
CATGGTGCAC 
CATGGTGCAC 
CATGGTGCAC 
CATGGTGCAC 
CATGGTGCAC 
CATGGTGCAC 
CATGGTGCAC 



TTGACAATAC 
TTGACAATAC 
TTGACAATAC 
TTGACAATAC 
TTGACAATAC 
TTGACAATAC 
TTGACAATAC 
TTGACAATAC 
TTGACAATAC 
TTGACAATAC 
TTGACAATAC 



150 

TGGAACAGCA 
TGGAACAGCA 
TGGAACAGCA 
TGGAACAGCA 
TGGAACAGCA 
TGGAACAGCA 
TGGAACAGCA 
TGGAACAGCA 
TGGAACAGCA 
TGGAACAGCA 
TGGAACAGCA 



msa237456 . 2 {328_1169NT 
msa237456 . 2{ 328_2603 

msa237456 . 2 { 328_18RS21 
msa237456. 2(328 H36B 
msa237456.2{328 C0H1 



151 

AATATGCCTG 
AATATGCCTG 
AATATGCCTG 
AATATGCCTG 
AATATGCCTG 



AtGGAAAAGT TgcTAATGCT GGtACTGCTG 
AtGGAAAAGT TgcTAATGCT GGtACTGCTG 
AcGGAAAAGT TanTAATGCT GGcACTGCTG 
AcGGAAAAGT TacTAATGCT GGcACTG CTG 
AcGGAAAAGT TacTAATGCT GGcACTGCTG 



200 

CTCAATTAGA 
CTCAATTAGA 
CTCAATTAGA 
CTCAATTAGA 
CTCAATTAGA 



1014 



WO 2004/018646 



PCT/US2003/026827 



Table 71: Comparative Sequences relating to SAG1333 



insa237456 . 2 ( 328J4732 
msa237456 . 2 { 328_M78 1 
msa237456.2{328 JM9130013 
msa237456.2{328_A909 
msa2374S6 . 2 (328_090 
maa237456 . 2 { 328_CJB110 
Consensus 



AATATGCCTG 
AATATGCCTG 
AATATGCCTG 
AATATGCCTG 
AATATGCCTG 
AATATGCCTG 
********** 



AcGGAAAAGT 
AcGGAAAAGT 
AcGGAAAAGT 
AcGGAAAAGT 
AcGGAAAAGT 
AcGGAAAAGT 
*_******** 



TacTAATGCT 
TacTAATGCT 
TacTAATGCT 
TacTAATGCT 
TacTAATGCT 
TacTAATGCT 
*__******* 



GGcACTGCTG 
GGcACTGCTG 
GGCACTGCTG 
GGcACTGCTG 
GGcACTGCTG 
GGcACTGCTG 
**_******* 



CTCAATTAGA 
CTCAATTAGA 
CTCAATTAGA 
CTCAATTAGA 
CTCAATTAGA 
CTCAATTAGA 
********** 



msa237456.2{328_1169NT 
rasa2 3 74 S 6 . 2 { 32 8_2 60 3 
msa2374SS . 2 { 328_18RS21 
msa237456 . 2 { 328_H36B 
rasa237456 . 2(328_C0H1 
msa237456.2{328_M732 
maa237456.2{328_M781 
msa237456 . 2{328_JM9130013 
rasa237456.2{328_A909 
msa2374S6 . 2 { 328_090 
msa237456 . 2 {328_CJB110 
Consensus 



201 

TGCTTATATG 
TGCTTATATG 
TGCTTATATG 
TGCTTATATG 
TGCTTATATG 
TGCTTATATG 
TGCTTATATG 
TGCTTATATG 
TGCTTATATG 
TGCTTATATG 
TGCTTATATG 



GATGAcGCTC 
GATGAcGCTC 
GATGAtGCTC 
GATGAtGCTC 
GATGAtGCTC 
GATGAtGCTC 
GATGAtGCTC 
GATGAtGCTC 
GATGAtGCTC 
GATGAtGCTC 
GATGAtGCTC 



AAAAAGATTT 
AAAAAGATTT 
AAAAAGATTT 
AAAAAGATTT 
AAAAAGATTT 
AAAAAGATTT 
AAAAAGATTT 
AAAAAGATTT 
AAAAAGATTT 
AAAAAGATTT 
AAAAAGATTT 



CAAACAAACT 
CAAACAAACT 
CAAACAAACT 
CAAACAAACT 
CAAACAAACT 
CAAACAAACT 
CAAACAAACT 
CAAACAAACT 
CAAACAAACT 
CAAACAAACT 
CAAACAAACT 



250 

AACCCTAATG 
AACCCTAATG 
AACCCTAATG 
AACCCTAATG 
AACCCTAATG 
AACCCTAATG 
AACCCTAATG 
AACCCTAATG 
AACCCTAATG 
AACCCTAATG 
AACCCTAATG 



mea237456 . 2 { 328_1169NT 
msa237456 . 2 {328_2603 
rasa237456 . 2 { 328JL8RS21 
msa237456 . 2 { 328_H36B 
msa237456 . 2 <328_COHl 
msa237456 . 2 I 328_M732 
msa237456.2{328_M781 
msa237456.2{328_OM9130013 
msa237456 . 2 { 328_A909 
msa237456 . 2 {328J>90 
msa2374 56 . 2 { 328_CJB110 
Consensus 



251 

GTGAAAGCAT 
GTGAAAGCAT 
GTGAAAGCAT 
GTGAAAGCAT 
GTGAAAGCAT 
GTGAAAGCAT 
GTGAAAGCAT 
GTGAAAGCAT 
GTGAAAGCAT 
GTGAAAGCAT 
GTGAAAGCAT 



TAGgGTTCAA 
TAGgGTTCAA 
TAGaGTTCAA 
TAGaGTTCAA 
TAGaGTTCAA 
TAGaGTTCAA 
TAGaGTTCAA 
TAGaGTTCAA 
TAGaGTTCAA 
TAGaGTTCAA 
TAGaGTTCAA 



GCaGGcGATA 
GCaGGcGATA 
GCtGGtGATA 
GCtGGtGATA 
GCtGGtGATA 
GCtGGtGATA 
GCtGGtGATA 
GCtGGtGATA 
GCtGGtGATA 
GCtGGtGATA 
GCtGGtGATA 



TGGTTGGAGC 
TGGTTGGAGC 
TGGTTGGAGC 
TGGTTGGAGC 
TGGTTGGAGC 
TGGTTGGAGC 
TGGTTGGAGC 
TGGTTGGAGC 
TGGTTGGAGC 
TGGTTGGAGC 
TGGTTGGAGC 



300 

AAGTCCAGCC 
AAGTCCAGCc 
AAGTCCAGCt 
AAGTCCAGCt 
AAGTCCAGCt 
AAGTCCAGCt 
AAGTCCAGCt 
AAGTCCAGCt 
AAGTCCAGCt 
AAGTCCAGCt 
AAGTCCAGCt 



msa237456.2{328_1169NT 
msa237456 . 2 {328_2603 
TOsa237456 . 2 { 328_18RS21 
msa237456.2{328_H36B 
msa2 37456 . 2 < 328_C0H1 
msa237456.2<328_M732 
msa237456.2{328_M781 
msa237456.2{328 JM91300;i3 
msa237456.2{328_A909 
msa237456.2{328_090 
msa237456.2{328_CJB110 
Consensus 



301 

AACTCtGGGC 
AACTCtGGGC 
AACTCaGGGC 
AACTCaGGGC 
AACTCaGGGC 
AACTCaGGGC 
AACTCaGGGC 
AACTCaGGGC 
AACTCaGGGC 
AACTCaGGGC 
AACTCaGGGC 



TTCTTCAAGA 
TTCTTCAAGA 
TTCTTCAAGA 
TTCTTCAAGA 
TTCTTCAAGA 
TTCTTCAAGA 
TTCTTCAAGA 
TTCTTCAAGA 
TTCTTCAAGA 
TTCTTCAAGA 
TTCTTCAAGA 



TGAACCAACt 
TGAACCAACt 
TGAACCAACc 
TGAACCAACC 
TGAACCAACC 
TGAACCAACc 
TGAACCAACC 
TGAACCAACC 
TGAACCAACC 
TGAACCAACc 
TGAACCAACc 



GTcAAAAatT 
GTcAAAAatT 
GTtAAAAcaT 
GTtAAAAcaT 
GTtAAAAcaT 
GTtAAAAcaT 
GTtAAAAcaT 
GTtAAAAcaT 
GTtAAAAcaT 
GTtAAAAcaT 
GTtAAAAcaT 



350 

TTAATGCAAT 
TTAATGCAAT 
TTAATGCAAT 
TTAATGCAAT 
TTAATGCAAT 
TTAATGCAAT 
TTAATGCAAT 
TTAATGCAAT 
TTAATGCAAT 
TTAATGCAAT 
TTAATGCAAT 



msa237456 . 2 { 328_1169NT 
msa23 74 56 . 2 { 3 2 6_2 603 
msa237456 . 2 { 328_18RS21 
tnsa237456 . 2 { 328_H36B 
msa237456 . 2 { 328_C0H1 
msa237456 . 2 f 328_M732 
msa237456.2{328 H781 
ms a237456 .2(32 8_JM9 130013 
msa237456.2{328 A909 
msa2 3745 6 . 2 { 3 2 8_0 9 0 
msa237456 . 2 { 328_CJB110 
Consensus 



351 

GAATGTTGAG 
GAATGTTGAG 
GAATGTTGAG 
GAATGTTGAG 
GAATGTTGAG 
GAATGTTGAG 
GAATGTTGAG 
GAATGTTGAG 
GAATGTTGAG 
GAATGTTGAG 
GAATGTTGAG 



TATGGCACAT 
TATGGCACAT 
TATGGCACAT 
TATGGCACAT 
TATGGCACAT 
TATGGCACAT 
TATGGCACAT 
TATGGCACAT 
TATGGCACAT 
TATGGCACAT 
TATGGCACAT 



TgGGTAACCA 
TgGGTAACCA 
TaGGTAACCA 
TaGGTAACCA 
TaGGTAACCA 
TaGGTAACCA 
TaGGTAACCA 
TaGGTAACCA 
TaGGTAACCA 
TaGGTAACCA 
TaGGTAACCA 



TGAATTTGAT 
TGAATTTGAT 
TGAATTTGAT 
TGAATTTGAT 
TGAATTTGAT 
TGAATTTGAT 
TGAATTTGAT 
TGAATTTGAT 
TGA ATTT GAT 
TGAATTTGAT 
TGAATTTGAT 



400 

GAAGGgTTGG 
GAAGGgTTGG 
GAAGGtTTGG 
GAAGGtTTGG 
GAAGGtTTGG 
GAAGGtTTGG 
GAAGGtTTGG 
GAAGGtTTGG 
GAAGGtTTGG 
GAAGGtTTGG 
GAAGGtTTGG 



msa237456 . 2 { 328_1169NT 
msa237456.2{328 2603 
msa237456 . 2 { 328_18RS21 
rasa237456 . 2 { 328_H36B 
msa237456. 2(328 COH1 
msa237456.2{328""M732 
msa237456.2{3283l781 
msa237456.2{328_JM9130013 
msa237456 . 2 { 328_A909 
msa237456.2{328_090 
msa237456.2{32B_CJB110 
Consensus 



401 

CAGAATAtAA 
CAGAATAtAA 
CAGAATAcAA 
CAGAATAcAA 
CAGAATAcAA 
CAGAATACAA 
CAGAATAcAA 
CAGAATACAA 
CAGAATACAA 
CAGAATAcAA 
CAGAATACAA 



TCGTATCGTT 
TCGTATCGTT 
TCGTATCGTT 
TCGTATCGTT 
TCGTATCGTT 
TCGTATCGTT 
TCGTATCGTT 
TCGTATCGTT 
TCGTATCGTT 
TCGTATCGTT 
TCGTATCGTT 



ACTGGtAAaG 
ACTGGtAAaG 
ACTGGaAAgG 
ACTGGaAAgG 
ACTGGaAAgG 
ACTGGaAAgG 
ACTGGaAAgG 
ACTGGaAAgG 
ACTGGaAAgG 
ACTGGaAAgG 
ACTGGaAAgG 



CCCCTGCTCC 
CCCCTGCTCC 
CCCCTGCTCC 
CCCCTGCTCC 
CCCCTGCTCC 
CCCCTGCTCC 
CCCCTGCTCC 
CCCCTGCTCC 
CCCCTGCTCC 
CCCCTGCTCC 
CCCCTGCTCC 



450 

AGATTCTAAT 
AGATTCTAAT 
AGATTCTAAT 
AGATTCTAAT 
AGATTCTAAT 
AGATTCTAAT 
AGATTCTAAT 
AGATTCTAAT 
AGATTCTAAT 
AGATTCTAAT 
AGATTCTAAT 



msa2374S6.2{328_1169NT) 
msa237456 . 2 { 32 8_2603 } 

msa237456.2{328_18RS2l) 
msa237456.2{328_H36B> 



451 500 
ATtAATAATA TTACGAAATC ATACCCACAt GAAGCTGCAA AACAAGAAAT 
ATtAATAATA TTACGAAATC ATACCCACAt GAAGCTGCAA AACAAGAAAT 
ATaAATAATA TTACGAAATC ATACCCACAc GAAGCTGCAA AACAAGAAAT 
ATaAATAATA TTACGAAATC ATACCCACAc GAAGCTGCAA AACAAGAAAT 
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mfla237456.2(328_COHl 
msa237456.2(328_M732 
msa237456 . 2 {328_M781 
msa237456 . 2 {328_JM9130013 
tnsa237456 . 2 {328_A909 
msa237456.2{328_090 
msa237456 . 2 { 328_CJB110 
Consensus 



ATaAATAATA 
ATaAATAATA 
ATaAATAATA 
ATaAATAATA 
ATaAATAATA 
ATaAATAATA 
ATaAATAATA 



TTACGAAATC 
TTACGAAATC 
TTACGAAATC 
TTACGAAATC 
TTACGAAATC 
TTACGAAATC 
TTACGAAATC 



ATACCCACAc 
ATACCCACAc 
ATACCCACAc 
ATACCCACAc 
ATACCCACAc 
ATACCCACAc 
ATACCCACAc 



GAAGCTGCAA 
GAAGCTGCAA 
GAAGCTGCAA 
GAAGCTGCAA 
GAAGCTGCAA 
GAAGCTGCAA 
GAAGCTGCAA 



AACAAGAAAT 
AACAAGAAAT 
AACAAGAAAT 
AACAAGAAAT 
AACAAGAAAT 
AACAAGAAAT 
AACAAGAAAT 



msa237456.2{328_1169NT 
msa2374 56 . 2 { 328_2603 
msa2374S6 . 2 { 328_18RS21 
msa237456 . 2 { 3 28_H36B 
msa237456 . 2 ( 328_OOHl 
msa237456.2{328_M732 
msa237456.2{328_M781 
msa237456.2{328_JM9130013 
msa237456.2{328_A909 
nisa237456 . 2 {328 J)90 
msa237456 . 2 { 328_CJB110 
Consensus 



501 

TGTAGTGGCA 
TGTAGTGGCA 
TGTAGTGGCA 
TGTAGTGGCA 
TGTAGTGGCA 
TGTAGTGGCA 
TGTAGTGGCA 
TGTAGTGGCA 
TGTAGTGGCA 
TGTAGTGGCA 
TGTAGTGGCA 



AAtGTTATTG 
AAtGTTATTG 
AAcGTTATTG 
AAcGTTATTG 
AAcGTTATTG 
AAcGTTATTG 
AACGTTATTG 
AAcGTTATTG 
AAcGTTATTG 
AAC GTTA TTG 
AAcGTTATTG 



ATAAAGTTAA 
ATAAAGTTAA 
ATAAAGTTAA 
ATAAAGTTAA 
ATAAAGTTAA 
ATAAAGTTAA 
ATAAAGTTAA 
ATAAAGTTAA 
ATAAAGTTAA 
ATAAAGTTAA 
ATAAAGTTAA 



CAAACAAATt 
CAAACAAATt 
CAAACAAATC 
CAAACAAATC 
CAAACAAATC 
CAAACAAATC 
CAAACAAATC 
CAAACAAATC 
CAAACAAATC 
CAAACAAATC 
CAAACAAATC 



550 

CCTTACAATT 
CCTTACAATT 
CCTTACAATT 
CCTTACAATT 
CCTTACAATT 
CCTTACAATT 
CCTTACAATT 
CCTTACAATT 
CCTTACAATT 
CCTTACAATT 
CCTTACAATT 



msa237456 . 2 {328_1169NT 
msa2374S6 . 2 { 328 J2603 
msa237456.2{328_18RS21 
msa237456.2{328_H36B 
msa237456 . 2 f 328_COHl 
msa237456.2 328_M732 
msa237456.2{328_M781 
msa237456 . 2 { 328_JM9130013 
msa237456.2{328_A909 
msa237456 . 2 { 328_090 
msa237456.2{328_CJB110 
Consensus 



551 

GGAAgCCTTA 
GGAAgCCTTA 
GGAAaCCTTA 
GGAAaCCTTA 
GGAAaCCTTA 
GGAAaCCTTA 
GGAAaCCTTA 
GGAAaCCTTA 
GGAAaCCTTA 
GGAAaCCTTA 
GGAAaCCTTA 



CgCTATTAAA 
CgCTATTAAA 
CaCTATTAAA 
CGCTATTAAA 
CaCTATTAAA 
CaCTATTAAA 
CaCTATTAAA 
CaCTATTAAA 
CaCTATTAAA 
CgCTATTAAA 
CgCTATTAAA 



AATATTCCTG 
AATATTCCTG 
AATATTCCTG 
AATATTCCTG 
AATATTCCTG 
AATATTCCTG 
AATATTCCTG 
AATATTCCTG 
AATATTCCTG 
AATATTCCTG 
AATATTCCTG 



TAAATAACAA 
TAAATAACAA 
TAAATAACAA 
TAAATAACAA 
TAAATAACAA 
TAAATAACAA 
TAAATAACAA 
TAAATAACAA 
TAAATAACAA 
TAAATAACAA 
TAAATAACAA 



600 

AAGTGTGAAC 
AAGTGTGAAC 
AAGTGTGAAC 
AAGTGTGAAC 
AAGTGTGAAC 
AAGTGTGAAC 
AAGTGTGAAC 
AAGTGTGAAC 
AAGTGTGAAC 
AAGTGTGAAC 
AAGTGTGAAC 



msa237456.2{328_1169NT 
msa237456 . 2 { 328_2603 
msa237456 . 2 { 328_18RS21 
msa237456.2(328_H36B 
msa237456 . 2 { 328JXM1 
msa237456.2{328 M732 
msa2374S6.2{32BJ4781 
msa237456.2{328 - JM9130013 
xnsa237456.2{328 A909 
msa237456.2{32B 090 
msa237456 . 2 { 328_CJB110 
Consensus 



601 

GTTGG CTTTA 
GTTGGCTTTA 
GTTGGCTTTA 
GTTGGCTTTA 
GTTGGCTTTA 



C4TTGGCTTTA 
GTTGGCTTTA 
GTTGGCTTTA 



GTTGGCTTTA 
********** 



TCGGgATtGT 
TCGGgATtGT 
TCGGaATcGT 
TCGGaATcGT 
TCGGaATcGT 
TCGGaATcGT 
TCGGaATcGT 
TCGGaATcGT 
TCGGaATcGT 
TCGGaATcGT 
TCGGaATcGT 
****.**_** 



cACCAAAGAC 
cACCAAAGAC 
tACCAAAGAC 
tACCAAAGAC 
tACCAAAGAC 
tACCAAAGAC i 
tACCAAAGAC 
tACCAAAGAC 
tACCAAAGAC 
tACCAAAGAC 
tACCAAAGAC 
_********* 



ATCCCAAACC 
ATCCCAAACC 
ATCCCAAACC 
ATCCCAAACC 
ATCCCAAACC 
ATCCCAAACC 
ATCCCAAACC 
ATCCCAAACC 
ATCCCAAACC 
ATCCCAAACC 
ATCCCAAACC 
********** 



650 

TTGTCTTAOG 
TTGTCTTACG 
TTGTCTTACG 
TTGTCTTACG 
TTGTCTTAOG 
TTGTCTTACG 
TTGTCTTACG 
TTGTCTTAOG 
TTGTCTTACG 
TTGTCTTACG 
TTGTCTTAOG 
********** 



msa237456 . 2 {328_1169NT 
msa237456.2{328_2603 
msa237456.2{328_18RS21 
msa237456. 2(328 H36B 
msa237456.2(3283C0Hl 
tnsa237456.2(328_M732 
msa2 374 56 . 2 { 3 2 8_M78 1 
msa237456.2{328 OM9130013 
cnsa237456.2{328_A909 
msa237456.2{328_090 
msa237456 . 2 { 328_CJB110 
Consensus 



651 

TAAAAATTAT 
TAAAAATTAT 
TAAAAATTAT 
TAAAAATTAT 
TAAAAATTAT 
TAAAAATTAT 
TAAAAATTAT 
TAAAAATTAT 
TAAAAATTAT 
TAAAAATTAT 
TAAAAATTAT 



GAACAATATG 
GAACAATATG 
GAACAATATG 
GAACAATATG 
GAACAATATG 
GAACAATATG 
GAACAATATG 
GAACAATATG 
GAACAATATG 
GAACAATATG 
GAACAATATG 



AATTTTTAGA 
AATTTTTAGA 
AATTTTTAGA 
AATTTTTAGA 
AATTTTTAGA 
AATTTTTAGA 
AATTTTTAGA 
AATTTTTAGA 
AATTTTTAGA 
AATTTTTAGA 
AATTTTTAGA 



TGAAGCTGAA 
TGAAGCTGAA 
TGAAGCTGAA 
TGAAGCTGAA 
TGAAGCTGAA 
TGAAGCTGAA 
TGAAGCTGAA 
TGAAGCTGAA 
TGAAGCTGAA 
TGAAGCTGAA 
TGAAGCTGAA 



700 

ACAATCGTTA 
ACAATCGTTA 
ACAATCGTTA 
ACAATCGTTA 
ACAATCGTTA 
ACAATCGTTA 
ACAATCGTTA 
ACAATCGTTA 
ACAATCGTTA 
ACAATCGTTA 
ACAATCGTTA 



msa237456 . 2 { 328_1169NT 
msa237456.2{328_2603 
msa237456.2{328 18RS21 
msa237456 . 2 { 328_H36B 
msa237456 .2 328_C0H1 
msa237456.2 328_M732 
msa237456.2{328_M7ai 
msa2 3 74 5 6 . 2 { 3 2 8_JM9 13 0 0 1 3 
msa2374S6.2{328 A909 
msa237456.2{32?_090 
msa237456 . 2 { 328_CJB110 
Consensus 



701 

AATACGCCAA 
AATACGCCAA 
AATACGCCAA 
AATACGCCAA 
AATACGCCAA 
AATACGCCAA 
AATACGCCAA 
AATACGCCAA 
AATACGCCAA 
AATACGCCAA 
AATACGCCAA 



AGAATTACAA 
AGAATTACAA 
AGAATTACAA 
AGAATTACAA 
AGAATTACAA 
AGAATTACAA 
AGAATTACAA 
AGAATTACAA 
AGAATTACAA 
AGAATTACAA 
AGAATTACAA 



GCTAAAAATG 
GCTAAAAATG 
GCTAAAAATG 
GCTAAAAATG 
GCTAAAAATG 
GCTAAAAATG 
GCTAAAAATG 
GCTAAAAATG 
GCTAAAAATG 
GCTAAAAATG 
GCTAAAAATG 



TCAAaGCTAT 
TCAAaGCTAT 
TCAAgGCTAT 
TCAAgGCTAT 
TCAAgGCTAT 
TCAAgGCTAT 
TCAAgGCTAT 
TCAAgGCTAT 
TCAAgGCTAT 
TCAAgGCTAT 
TCAAgGCTAT 



750 

TGTAGTtCTc 
TGTAGTtCTc 
TGTAGTcCTt 
TGTAGTcCTt 
TGTAGTcCTt 
TGTAGTcCTt 
TGTAGTcCTt 
TGTAGTcCTt 
TGTAGTcCTt 
TGTAGTcCTt 
TGTAGTcCTt 



msa237456 . 2 {328__1169NT \ 
insa237456.2{328_2603J 
msa237456.2{328 18RS21) 



751 800 
GCaCATGTAC CTGCAACAAG tAAaaATGAT ATTGCTGAAG GTGAAGCAGC 
GCaCATGTAC CTGCAACAAG tAAaaATGAT ATTGCTGAAG GTGAAGCAGC 
GCtCATGTAC CTGCAACAAG cAAggATGAT ATTGCTGAAG GTGAAGCAGC 



1016 



WO 2004/018646 



PCT/US2003/026827 



Table 71: Comparative Sequences relating to SAG1333 



msa237456.2{328_H36B 
ma a2 3 74 56 . 2 { 3 2 8_COHl 
msa237456.2(328_M732 
msa237456.2{328~M781 
msa237456 . 2 { 328_JM9130013 
msa237456.2{328_A909 
msa2 37 4 56 . 2 { 3 2 8_09 0 
msa237456 . 2 {328_CJB110 
Consensus 



GCtCATGTAC 
GCtCATGTAC 
GCtCATGTAC 
GCtCATGTAC 
GCtCATGTAC 
GCtCATGTAC 
GCtCATGTAC 
GCtCATGTAC 



CTGCAACAAG 
CTGCAACAAG 
CTGCAACAAG 
CTGCAACAAG 
CTGCAACAAG 
CTGCAACAAG 
CTGCAACAAG 
CTGCAACAAG 



CAAggATGAT 
cAAggATGAT 
CAAggATGAT 
cAAggATGAT 
cAAggATGAT 
cAAggATGAT 
cAAggATGAT 
cAAggATGAT 



ATTGCTGAAG 
ATTGCTGAAG 
ATTGCTGAAG 
ATTGCTGAAG 
ATTGCTGAAG 
ATTGCTGAAG 
ATTGCTGAAG 
ATTGCTGAAG 



GTGAAGCAGC 
GTGAAGCAGC 
GTGAAGCAGC 
GTGAAGCAGC 
GTGAAGCAGC 
GTGAAGCAGC 
GTGAAGCAGC 
GTGAAGCAGC 



rosa237456.2{328_1169NT 
msa237456.2{328_2603 
ma a2 374 56 . 2 { 328_18RS2 1 
msa237456.2(328_H36B 
msa237456 . 2 32B_COHl 
msa237456.2 328_M732 
msa237456.2{328_M781 
msa237456 . 2 {328_JM9130013 
tnsa2 3 74 56 . 2 { 3 2 8_A9 0 9 
msa237456 . 2 {328_090 
msa237456.2{328_CJB110 
Consensus 



801 

AGAAATGATG 
AGAAATGATG 
AGAAATGATG 
AGAAATGATG 
AGAAATGATG 
AGAAATGATG 
AGAAATGATG 
AGAAATGATG 
AGAAATGATG 
AGAAATGATG 
AGAAATGATG 



AAAAAAGTCA 
AAAAAAGTCA 
AAAAAAGTCA 
AAAAAAGTCA 
AAAAAAGTCA 
AAAAAAGTCA 
AAAAAAGTCA 
AAAAAAGTCA 
AAAAAAGTCA 
AAAAAAGTCA 
AAAAAAGTCA 



ATCAACTCTT 
ATCAACTCTT 
ATCAACTCTT 
ATCAACTCTT 
ATCAACTCTT 
ATCAACTCTT 
ATCAACTCTT 
ATCAACTCTT 
ATCAACTCTT 
ATCAACTCTT 
ATCAACTCTT 



CCCTGAAAAT 
CCCTGAAAAT 
CCCTGAAAAT 
CCCTGAAAAT 
CCCTGAAAAT 
CCCTGAAAAT 
CCCTGAAAAT 
CCCTGAAAAT 
CCCTGAAAAT 
CCCTGAAAAT 
CCCTGAAAAT 



850 

AGCGTAGATA 
AGCGTAGATA 
AGCGTAGATA 
AGCGTAGATA 
AGCGTAGATA 
AGCGTAGATA 
AGCGTAGATA 
AGCGTAGATA 
AGCGTAGATA 
AGCGTAGATA 
AGCGTAGATA 



msa237456.2{328_1169NT 
msa237456.2{328_2603 
msa237456.2{328_18RS21 
msa237456.2(328_H36B 
msaJ237456 . 2 f 328_C0H1 
msa237456 . 2 { 328_M73 2r] 
msa237456 . 2 { 32B_M781 
tnsa237456.2{328_JM9130013 
msa237456 . 2 { 328_A909 
msa237456 .2 {328_090 
msa237456 . 2 { 328_CJB110 
Consensus 



851 

TTGTCTTTGC 
TTGTCTTTGC 
TTGTCTTTGC 
TTGTCTTTGC 
TTGTCTTTGC 

TTGTCTTTGC 
' TTGTCTTTGC 
TTGTCTTTGC 
TTGTCTTTGC 
TTGTCTTTGC 



TGGACACAAT 
TGGACACAAT 
TGGACACAAT 
TGGACACAAT 
TGGACACAAT 
TGGACACAAT 
TGGACACAAT 
TGGACACAAT 
TGGACACAAT 
TGGACACAAT 
TGGACACAAT 



CATCAATATA 
CATCAATATA 
CATCAATATA 
CATCAATATA 
CATCAATATA 
CATCAATATA 
CATCAATATA 
CATCAATATA 
CATCAATATA 
CATCAATATA 
CATCAATATA 



CAAATGGTCT 
CAAATGGTCT 
CAAATGGTCT 
CAAATGGTCT 
CAAATGGTCT 
CAAATGGTCT 
CAAATGGTCT 
CAAATGGTCT 
CAAATGGTCT 
CAAATGGTCT 
CAAATGGTCT 



900 

TGTTGGTAAA 
TGTTGGTAAA 
TGTTGGTAAA 
TGTTGGTAAA 
TGTTGGTAAA 
TGTTGGTAAA 
TGTTGGTAAA 
TGTTGGTAAA 
TGTTGGTAAA 
TGTTGGTAAA 
TGTTGGTAAA 



msa237456.2{328_1169NT 
Ctisa2 3 74 56 . 2 { 32 8_2 603 
msa237456 . 2 { 328_18RS21 
msa237456. 2(328 H36B 
msa237456.2(328_COHl 
msa237456.2{328 M732 
msa237456.2{328 M781 
msa237456.2{328_JM9130013 
msa237456.2{328 A909 
msa237456.2{328_090 
rasa2374S6 . 2 {328_CJB110 
Consensus 



901 

ACTCGtATTG 
ACTCGtATTG 
ACTCGtATTG 
ACTCGtATTG 
ACTCGtATTG 
ACTCGtATTG 
ACTCGtATTG 
ACTCGtATTG 
ACTCGtATTG 
ACTCGcATTG 
ACTCGcATTG 



TACAAGCGCT 
TACAAGCGCT 
TACAAGCGCT 
TACAAGCGCT 
TACAAGCGCT 
TACAAGCGCT 
TACAAGCGCT 
TACAAGCGCT 
TACAAGCGCT 
TACAAGCGCT 
TACAAGCGCT 



CTCTCAAGGA 
CTCTCAAGGA 
CTCTCAAGGA 
CTCTCAAGGA 
CTCTCAAGGA 
CTCTCAAGGA 
CTCTCAAGGA 
CTCTCAAGGA 
CTCTCAAGGA 
CTCTCAAGGA 
CTCTCAAGGA 



AAAGCCTATG 
AAAGCCTATG 
AAAGCCTATG 
AAAGCCTATG 
AAAGCCTATG 
AAAGCCTATG 
AAAGCCTATG 
AAAGCCTATG 
AAAGCCTATG 
AAAGCCTATG 
AAAGCCTATG 



950 

CTGAtGTACG 
CTGAtGTACG 
CTGAtGTACG 
CTGAtGTACG 
CTGAtGTACG 
CTGAtGTACG 
CTGAtGTACG 
CTGAtGTACG 
CTGAtGTACG 
CTGAcGTACG 
CTGAcGTACG 



msa237456.2{328 - 1169NT; 

rasa237456.2{328_2603 
msa237456 . 2 {328_18RS21 
msa237456.2{328_H36B 
msa237456, 2(328 COH1 
msa237456.2f328_M732 
msa237456.2{328_M781 
msa237456.2{328_OM9130013 
msa237456.2{328_A909 
msa237456 .2 {328_090 
msa237456 . 2 {328_CJB110 
Consensus 



951 

TGGTGTCtTA 
TGGTGTCtTA 
TGGTGTCcTA 
TGGTGTCcTA 
TGGTGTCCTA 
TGGTGTCcTA 
TGGTGTCCTA 
TGGTGTCcTA 
TGGTGTCcTA 
TGGTGTCcTA 
TGGTGTCcTA 



GATACTGATA 
GATACTGATA 
GATACTGATA 
GATACTGATA 
GATACTGATA 
GATACTGATA 
GATACTGATA 
GATACTGATA 
GATACTGATA 
GATACTGATA 
GATACTGATA 



CACAAGATTT 
CACAAGATTT 
CACAAGATTT 
CACAAGATTT 
CACAAGATTT 
CACAAGATTT 
CACAAGATTT 
CACAAGATTT 
CACAAGATTT 
CACAAGATTT 
CACAAGATTT 



CATTGAgACC 
CATTGAgACC 
CATTGAaACC 
CATTGAaACC 
CATTGAaACC 
CATTGAaACC 
CATTGAaACC 
CATTGAaACC 
CATTGAaACC 
CATTGAaACC 
CATTGAaACC 



1000 
CCTTCAGCTA 
CCTTCAGCTA 
CCTTCAGCTA 
CCTTCAGCTA 
CCTTCAGCTA 
CCTTCAGCTA 
CCTTCAGCTA 
CCTTCAGCTA 
CCTTCAGCTA 
CCTTCAGCTA 
CCTTCAGCTA 



msa237456.2{328_1169NT 
msa237456.2{328_2603 
msa237456.2{328_18RS21 
msa237456 . 2{328_H36B 
msa237456.2f328_COHl 
msa237456. 2(328 JT732 
msa237456 .2{328_M781 
msa237456.2{328_JM9130013 
msa237456 . 2 { 328_A909 
msa237456 .2 {328_090 
msa237456.2{328_CJB110 
Consensus 



1001 

AAGTAaTTGC 
AAGTAaTTGC 
AAGTAaTTGC 
AAGTAaTTGC 
AAGTAaTTGC 
AAGTAaTTGC 
AAGTAaTTGC 
AAGTAaTTGC 
AAGTAaTTGC 
AAGTAgTTGC 
AAGTAgTTGC 



AGTTGCTCCT 
AGTTGCTCCT 
AGTTGCTCCT 
AGTTGCTCCT 
AGTTGCTCCT 
AGTTGCTCCT 
AGTTGCTCCT 
AGTTGCTCCT 
AGTTGCTCCT 
AGTTGCTCCT 
AGTTGCTCCT 



GGTAAAAAAA 
GGTAAAAAAA 
GGTAAAAAAA 
GGTAAAAAAA 
GGTAAAAAAA 
GGTAAAAAAA 
GGTAAAAAAA 
GGTAAAAAAA 
GGTAAAAAAA 
GGTAAAAAAA 
GGTAAAAAAA 



CAGGTAGTGC 
CAGGTAGTGC 
CAGGTAGTGC 
CAGGTAGTGC 
CAGGTAGTGC 
CAGGTAGTGC 
CAGGTAGTGC 
CAGGTAGTGC 
CAGGTAGTGC 
CAGGTAGTGC 
CAGGTAGTGC 



1050 
CGATATTCAA 
CGATATTCAA 
CGATATTCAA 
CGATATTCAA 
CGATATTCAA 
CGATATTCAA 
CGATATTCAA 
CGATATTCAA 
CGATATTCAA 
CGATATTCAA 
CGATATTCAA 



msa2 374 56 . 2 { 32 8_1 169NT J 
msa237456.2{328_2603) 



1051 1100 
GCCATTGTTG ACCAAGCTAA TACTATCGTT AAACAAGTAA CAGAAGCTAA 
GCCATTGTTG ACCAAGCTAA TACTATCGTT AAACAAGTAA CAGAAGCTAA 



1017 



WO 2004/018646 



PCTYUS2003/026827 



Table 71: Comparative Sequences relating to SAG1333 



msa2374S6.2{328_18RS21 
rasa237456-2(328_H36B 
msa237456 . 2 ( 328_C0H1 
msa237456 . 2 ( 3 2B_M732 
msa237456 . 2{ 328_M781 
msa237456 . 2 { 328_JM9130013 
msa237456.2{328_A909 
msa237456 .2{328_090 
msa237456 . 2 { 328_CJB110 
Consensus 



GCCATTGTTG 
GCCATTGTTG 
GCCATTGTTG 
GCCATTGTTG 
GCCATTGTTG 
GCCATTGTTG 
GCCATTGTTG 
GCCATTGTTG 
GCCATTGTTG 



ACCAAGCTAA 
ACCAAGCTAA 
ACCAAGCTAA 
ACCAAGCTAA 
ACCAAGCTAA 
ACCAAGCTAA 
ACCAAGCTAA 
ACCAAGCTAA 
ACCAAGCTAA 



TACTATCGTT 
TACTATCGTT 
TACTATCGTT 
TACTATCGTT 
TACTATCGTT 
TACTATCGTT 
TACTATCGTT 
TACTATCGTT 
TACTATCGTT 



AAACAAGTAA 
AAACAAGTAA 
AAACAAGTAA 
AAACAAGTAA 
AAACAAGTAA 
AAACAAGTAA 
AAACAAGTAA 
AAACAAGTAA 
AAACAAGTAA 



CAGAAGCTAA 
CAGAAGCTAA 
CAGAAGCTAA 
CAGAAGCTAA 
CAGAAGCTAA 
CAGAAGCTAA 
CAGAAGCTAA 
CAGAAGCTAA 
CAGAAGCTAA 



msa237456 . 2 { 328_1169NT 
msa237456 . 2{328_2603 
msa237456 . 2 { 328_18RS21 
rasa237456.2{328_H36B 
msa237456.2 328_C0H1 
msa2374S6."2 328_M732 
msa237456.2{328_M781 
msa237456.2{328 JM9130013 
rasa237456 . 2{328_A909 
msa237456.2{328_090 
msa237456 . 2 { 328_CJB110 
Consensus 



1101 

AATTGGTACT 
AATTGGTACT 
AATTGGTACT 
AATTGGTACT 
AATTGGTACT 
AATTGGTACT 
AATTGGTACT 
AATTGGTACT 
AATTGGTACT 
AATTGGTACT 
AATTGGTACT 



GCCGAGGTAA 
GCCGAGGTAA 
GCCGAGGTAA 
GCCGAGGTAA 
GCCGAGGTAA 
GCCGAGGTAA 
GCCGAGGTAA 
GCCGAGGTAA 
GCCGAGGTAA 
GCCGAGGTAA 
GCCGAGGTAA 



GTGtCATGAT 
GTGtCATGAT 
GTGgCATGAT 
GTGgCATGAT 
GTGgCATGAT 
GTGgCATGAT 
GTGgCATGAT 
GTGgCATGAT 
GTGgCATGAT 
GTGgCATGAT 
GTGgCATGAT 



TACGCGTTCT 
TACGCGTTCT 
TACGCGTTCT 
TACGCGTTCT 
TACGCGTTCT 
TACGCGTTCT 
TACGCGTTCT 
TACGCGTTCT 
TACGCGTTCT 
TACGCGTTCT 
TACGCGTTCT 



1150 
GTTGATCAAG 
GTTGATCAAG 
GTTGATCAAG 
GTTGATCAAG 
GTTGATCAAG 
GTTGATCAAG 
GTTGATCAAG 
GTTGATCAAG 
GTTGATCAAG 
GTTGATCAAG 
GTTGATCAAG 



msa237456.2{328 1169NT 
msa237456.2{328_2603 
msa237456.2{328_18RS21 
msa237456 . 2 f 328_H36B 
msa237456 . 2 { 328_C0H1 
msa237456.2(328_M732 
msa237456.2{328 M781 
msa237456 . 2 { 328_JM9130013 
rasa237456.2{328_A909 
msa2 3 74 5 6 . 2 { 3 2 8_09 0 
msa237456.2{328_CJB110 
Consensus 



1151 

ATAATGTTAG 
ATAATGTTAG 
ATAATGTTAG 
ATAATGTTAG 
ATAATGTTAG 
ATAATGTTAG 
ATAATGTTAG 
ATAATGTTAG 
ATAATGTTAG 
ATAATGTTAG 
ATAATGTTAG 
********** 



TCCgGTAGGC 
TCCgGTAGGC 
TCCgGTAGGC 
TCCgGTAGGC 
TCCgGTAGGC 
TCCgGTAGGC 
TCCgGTAGGC 
TCCgGTAGGC 
TCCgGTAGGC 
TCCaGTAGGC 
TCCaGTAGGC 
***_****** 



AGCCTCATCA 
AGCCTCATCA 
AGCCTCATCA 
AGCCTCATCA 
AGCCTCATCA 
AGCCTCATCA 
AGCCTCATCA 
AGCCTCATCA 
AGCCTCATCA 
AGCCTCATCA 
AGCCTCATCA 
********** 



CAGAGGCTCA 
CAGAGGCTCA 
CAGAGGCTCA 
CAGAGGCTCA 
CAGAGGCTCA 
CAGAGGCTCA 
CAGAGGCTCA 
CAGAGGCTCA 
CAGAGGCTCA 
CAGAGGCTCA 
CAGAGGCTCA 
********** 



1200 
ACTAGCAATT 
ACTAGCAATT 
ACTAGCAATT 
ACTAGCAATT 
ACTAGCAATT 
ACTAGCAATT 
ACTAGCAATT 
ACTAGCAATT 
ACTAGCAATT 
ACTAGCAATT 
ACTAGCAATT 
********** 



msa237456 . 2 {328_1169NT 
msa237456 . 2 { 32 8_2603 
msa237456 .2(32 8_18RS2 1 
msa237456.2f 328_H36B 
msa2374 56 . 2 f 328_C0H1 
msa237456.2(328_M732 
msa237456.2{328_M781 
msa237456.2{328 JM9130013 
Tnsa237456.2{328_A909 
msa237456 . 2 {328_090 
msa237456 . 2 { 328_CJB110 
Consensus 



1201 

GCTCGAAAAA 
GCTCGAAAAA 
GCTCGAAAAA 
GCTCGAAAAA 
GCTCGAAAAA 
GCTCGAAAAA 
GCTCGAAAAA 
GCTCGAAAAA 
GCTCGAAAAA 
GCTCGAAAAA 
GCTCGAAAAA 



GCTGGCCAGA 
GCTGGCCAGA 
GCTGGCCAGA 
GCTGGCCAGA 
GCTGGCCAGA 
GCTGGCCAGA 
GCTGGCCAGA 
GCTGGCCAGA 
GCTGGCCAGA 
GCTGGCCAGA 
GCTGGCCAGA 



TATCGATTTT 
TATCGATTTT 
TATCGATTTT 
TATCGATTTT 
TATCGATTTT 
TATCGATTTT 
TATCGATTTT 
TATCGATTTT 
TATCGATTTT 
TATCGATTTT 
TATCGATTTT 



GCCATGACAA 
GCCATGACAA 
GCCATGACAA 
GCCATGACAA 
GCCATGACAA 
GCCATGACAA 
GCCATGACAA 
GCCATGACAA 
GCCATGACAA 
GCCATGACAA 
GCCATGACAA 



1250 
ATAATGGTGG 
ATAATGGTGG 
ATAATGGTGG 
ATAATGGTGG 
ATAATGGTGG 
ATAATGGTGG 
ATAATGGTGG 
ATAATGGTGG 
ATAATGGTGG 
ATAATGGTGG 
ATAATGGTGG 



msa237456.2{328_1169NT 
rosa237456.2{328 2603 
msa237456.2{328 18RS21 
msa237456 . 2 f 328_H36B 
msa237456.2(328_C0Hl 
msa237456.2{328_M732 
msa237456 . 2 { 328_M781 
msa2 3 74 5 6 . 2 { 32 8_JM9 13 0 0 13 
msa237456 . 2 { 328_A909 
msa237456.2{328_090 
msa2374S6.2{328_CJB110 
Consensus 



1251 

CATTCGTGCT 
CATTCGTGCT 
CATTCGTGCT 
CATTCGTGCT 
CATTCGTGCT 
CATTCGTGCT 
CATTCGTGCT 
CATTCGTGCT 
CATTCGTGCT 
CATTCGTGCT 
CATTCGTGCT 



GACTTACTCA 
GACTTACTCA 
GACTTACTCA 
GACTTACTCA 
GACTTACTCA 
GACTTACTCA 
GACTTACTCA 
GACTTACTCA 
GACTTACTCA 
GACTTACTCA 
GACTTACTCA 



TCAAACCAGA 
TCAAACCAGA 
TCAAACCAGA 
TCAAACCAGA 
TCAAACCAGA 
TCAAACCAGA 
TCAAACCAGA 
TCAAACCAGA 
TCAAACCAGA 
TCAAACCAGA 
TCAAACCAGA 



TGGAACAATC 
TGGAACAATC 
TGGAACAATC 
TGGAACAATC 
TGGAACAATC 
TGGAACAATC 
TGGAACAATC 
TGGAACAATC 
TGGAACAATC 
TGGAACAATC 
TGGAACAATC 



1300 
ACCTGGGGAG 
ACCTGGGGAG 
ACCTGGGGAG 
ACCTGGGGAG 
ACCTGGGGAG 
ACCTGGGGAG 
ACCTGGGGAG 
ACCTGGGGAG 
ACCTGGGGAG 
ACCTGGGGAG 
ACCTGGGGAG 



msa2 374 56. 2 { 3 2 8JL169NT 
msa2374 56 . 2 { 328J2603 
msa237456.2{328_18RS21 
rasa237456 . 2 ( 328_H36B 
rasa237456 . 2 ( 328__COHl 
msa237456.2f328_M732 
tnsa237456.2{328 M781 
msa237456 . 2 { 328_JM9130013 
msa2374 56 . 2 { 32 8_A909 
rosa237456.2{328 090 
msa237456.2(328 w CJB110 
Consensus 



1301 

CTGCACAAGC 
CTGCACAAGC 
CTGCACAAGC 
CTGCACAAGC 
CTGCACAAGC 
CTGCACAAGC 
CTGCACAAGC 
CTGCACAAGC 
CTGCACAAGC 
CTGCACAAGC 
CTGCACAAGC 



AGTTCAACCT 
AGTTCAACCT 
AGTTCAACCT 
AGTTCAACCT 
AGTTCAACCT 
AGTTCAACCT 
AGTTCAACCT 
AGTTCAACCT 
AGTTCAACCT 
AGTTCAACCT 
AGTTCAACCT 



TTTGGTAATA 
TTTGGTAATA 
TTTGGTAATA 
TTTGGTAATA 
TTTGGTAATA 
TTTGGTAATA 
TTTGGTAATA 
TTTGGTAATA 
TTTGGTAATA 
TTTGGTAATA 
TTTGGTAATA 



TCTTACAAGT 
TCTTACAAGT 
TCTTACAAGT 
TCTTACAAGT 
TCTTACAAGT 
TCTTACAAGT 
TCTTACAAGT 
T CTTA CAAGT 
TCTTACAAGT 
TCTTACAAGT 
TCTTACAAGT 



1350 
CGTCGAAATT 
CGTCGAAATT 
CGTCGAAATT 
CGTCGAAATT 
CGTCGAAATT 
CGTCGAAATT 
CGTCGAAATT 
CGTCGAAATT 
CGTCGAAATT 
CGTCGAAATT 
CGTCGAAATT 



msa237456.2{328_1169NT} 



1351 1400 
ACTGGTAGAG ATCTTTATAA AGCACTCAAC GAACAATACG ACCAAAAACA 



1018 



WO 2004/018646 



PCT/US2003/026827 



Table 71: Comparative Sequences relating to SAG1333 



msa237456.2{328_2603 
msa237456 . 2 { 328_18RS21 
msa237456 . 2 {328_H36B 
msa237456 . 2 (328_COHl 
msa237456.2?32B_M732 
msa237456 . 2 {328_M781 
maa237456.2{328_JM9130013 
msa237456.2{328_A909 
msa2374S6.2{328_090 
msa237456 . 2 { 328_CJB110 
Consensus 



ACTGGTAGAG 
ACTGGTAGA6 
ACTGGTAGAG 
ACTGGTAGAG 
ACTGGTAGAG 
ACTGGTAGAG 
ACTGGTAGAG 
ACTGGTAGAG 
ACTGGTAGAG 
ACTGGTAGAG 



ATCTTTATAA 
ATCTTTATAA 
ATCTTTATAA 
ATCTTTATAA 
ATCTTTATAA 
ATCTTTATAA 
ATCTTTATAA 
ATCTTTATAA 
ATCTTTATAA 
ATCTTTATAA 



AGCACTCAAC 
AGCACTCAAC 
AGCACTCAAC 
AGCACTCAAC 
AGCACTCAAC 
AGCACTCAAC 
AGCACTCAAC 
AGCACTCAAC 
AGCACTCAAC 
AGCACTCAAC 



GAACAATACG 
GAACAATACG 
GAACAATACG 
GAACAATACG 
GAACAATACG 
GAACAATACG 
GAACAATACG 
GAACAATACG 
GAACAATACG 
GAACAATACG 



ACCAAAAACA 
ACCAAAAACA 
ACCAAAAACA 
ACCAAAAACA 
ACCAAAAACA 
ACCAAAAACA 
ACCAAAAACA 
ACCAAAAACA 
ACCAAAAACA 
ACCAAAAACA 



msa237456.2{328_1169NT 
msa237456 . 2 { 328_2603 
mBa237456.2{32B_18RS21 
msa237456 . 2 f 328_H36B 
msa237456 - 2 {328_C0H1 
rasa237456.2f328_M732 
msa237456.2{328_M7Bl 
msa237456 . 2 {328_JM9130013 
msa2 3 74 56 . 2 { 32 8_A90 9 
msa237456 . 2 {328_090 
msa237456.2{328_CJB110 
Consensus 



1401 

AAATTTCTTC 
AAATTTCTTC 
AAATTTCTTC 
AAATTTCTTC 
AAATTTCTTC 
AAATTTCTTC 
AAATTTCTTC 
AAATTTCTTC 
AAATTTCTTC 
AAATTTCTTC 
AAATTTCTTC 
********** 



CTTCAAATAG 
CTTCAAATAG 
CTTCAAATAG 
CTTCAAATAG 
CTTCAAATAG 
CTTCAAATAG 
CTTCAAATAG 
CTTCAAATAG 
CTTCAAATAG 
CTTCAAATAG 
CTTCAAATAG 
********** 



CTGGTCTGCG 
CTGGTCTGCG 
CTGGTCTGCG 
CTGGTCTGCG 
CTGGTCTGCG 
CTGGTCTGCG 
CTGGTCTGCG 
CTGGTCTGCG 
CTGGTCTGCG 
CTGGTCTGCG 
CTGGTCTGCG 
********** 



ATACACTTAC 
ATACACTTAC 
ATACACTTAC 
ATACACTTAC 
ATACACTTAC 
ATACACTTAC 
ATACACTTAC 
ATACACTTAC 
ATACACTTAC 
ATACACTTAC 
ATACACTTAC 



1450 
ACAGATAATA 
ACAGATAATA 
ACAGATAATA 
ACAGATAATA 
ACAGATAATA 
ACAGATAATA 
ACAGATAATA 
ACAGATAATA 
ACAGATAATA 
ACAGATAATA 
ACAGATAATA 



********** ********** 



msa237456 . 2 { 326_1169NT 
msa237456 . 2 { 328_2603 
msa237456.2{328_18RS21 
msa237456 . 2 f 328_H36B 
msa237456 . 2 ( 328_C0H1 
msa2374 56 . 2 f 328_M732 
msa237456.2{328_M781 
msa237456.2{328^JM9130013 
mea23 7456 . 2 { 328_A909 
msa237456 . 2 {328_090 
msa237456 . 2 { 328_CJB110 
Consensus 



1451 

AAGAGGGCGG 
AAGAGGGCGG 
AAGAGGGCGG 
AAGAGGGCGG 
AAGAGGGCGG 
AAGAGGGCGG 
AAGAGGGCGG 
AAGAGGGCGG 
AAGAGGGCGG 
AAGAGGGCGG 
AAGAGGGCGG 



gGAAGAAACA 
gGAAGAAACA 
gGAAGAAACA 
gGAAGAAACA 
gGAAGAAACA 
gGAAGAAACA 
gGAAGAAACA 
gGAAGAAACA 
gGAAGAAACA 
aGAAGAAACA 
aGAAGAAACA 



CCATTTAAAG 
CCATTTAAAG 
CCATTTAAAG 
CCATTTAAAG 
CCATTTAAAG 
CCATTTAAAG 
CCATTTAAAG 
CCATTTAAAG 
CCATTTAAAG 
CCATTTAAAG 
CCATTTAAAG 



TTGTAAAAGC 
TTGTAAAAGC 
TTGTAAAAGC 
TTGTAAAAGC 
TTGTAAAAGC 
TTGTAAAAGC 
TTGTAAAAGC 
TTGTAAAAGC 
TTGTAAAAGC 
TTGTAAAAGC 
TTGTAAAAGC 



1500 
TTATAAATCA 
TTATAAATCA 
TTATAAATCA 
TTATAAATCA 
TTATAAATCA 
TTATAAATCA 
TTATAAATCA 
TTATAAATCA 
TTATAAATCA 
TTATAAATCA 
TTATAAATCA 



msa237456 . 2 {328_1169NT 
msa237456 . 2 { 328_2603 
msa237456.2{328_JL8RS21 
msa237456.2{328_H36B 
msa237456.2(328 COH1 
msa237456.2{328~M732 
msa237456. 2(328 M761 
msa2374 56 . 2 { 328_JM913 00 13 
msa237456.2{328_A909 
msa237456.2{328_090 
msa237456.2{328_CJB110 
Consensus 



1501 

AATGGTGAgG 
AATGGTGAgG 
AATGGTGAgG 
AATGGTGAgG 
AATGGTGAgG 
AATGGTGAgG 
AATGGTGAgG 
AATGGTGAgG 
AATGGTGAgG 
AATGGTGAaG 
AATGGTGAaG 



AAATCAATCC 
AAATCAATCC 
AAATCAATCC 
AAATCAATCC 
AAATCAATCC 
AAATCAATCC 
AAATCAATCC 
AAATCAATCC 
AAATCAATCC 
AAATCAATCC 
AAATCAATCC 



TGATGCAAAA 
TGATGCAAAA 
TGATGCAAAA 
TGATGCAAAA 
TGATGCAAAA 
TGATGCAAAA 
TGATGCAAAA 
TGATGCAAAA 
TGATGCAAAA 
TGATGCAAAA 
TGATGCAAAA 



TACAAATTAG 
TACAAATTAG 
TACAAATTAG 
TACAAATTAG 
TACAAATTAG 
TACAAATTAG 
TACAAATTAG 
TACAAATTAG 
TACAAATTAG 
TACAAATTAG 
TACAAATTAG 



1550 
TTATCAATGA 
TTATCAATGA 
TTATCAATGA 
TTATCAATGA 
TTATCAATGA 
TTATCAATGA 
TTATCAATGA 
TTATCAATGA 
TTATCAATGA 
TTATCAATGA 
TTATCAATGA 



msa237456 . 2 {32B_1169NT} 
maa237456.2{328_2603* 
msa2 3 7 4 56 , 2 { 32 8_1 8RS2 1 
msa237456 .2 {328_H36B) 
msa237456 . 2 { 328_COHl 
msa237456.2(328_M732 
msa237456.2{328_M78l] 
msa237456.2{32B_JM9130013 
msa237456 . 2 { 328_A909 
msa237456 . 2 (328_090 
msa237456»2{328_CJB110] 
Consensus 



1551 

CITTTTATTC 
CTTTTTATTC 
CITTTTATTC 
CTTTTTATTC 
CTTTTTATTC 
CTTTTTATTC 
CTTTTTATTC 
CTTTTTATTC 
CTTTTTATTC 
CTTTTTATTC 
CTTTTTATTC 



GGTGGTGGTG 
GGTGGTGGTG 
GGTGGTGGTG 
GGTGGTGGTG 
GGTGGTGGTG 
GGTGGTGGTG 
GGTGGTGGTG 
GGTGGTGGTG 
GGTGGTGGTG 
GGTGGTGGTG 
GGTGGTGGTG 



ATGGCTTTGC 
ATGGCTTTGC 
ATGGCTTTGC 
ATGGCTTTGC 
ATGGCTTTGC 
ATGGCTTTGC 
ATGGCTTTGC 
ATGGCTTTGC 
ATGGCTTTGC 
ATGGCTTTGC 
ATGGCTTTGC 



AAGCTTCAGA 
AAGCTTCAGA 
AAGCTTCAGA 
AAGCTTCAGA 
AAGCTTCAGA 
AAGCTTCAGA 
AAGCTTCAGA 
AAGCTTCAGA 
AAGCTTCAGA 
AAGCTTCAGA 
AAGCTTCAGA 



1600 
AATGCCAAAC 
AATGCCAAAC 
AATGCCAAAC 
AATGCCAAAC 
AATGCCAAAC 
AATGCCAAAC 
AATGCCAAAC 
AATGCCAAAC 
AATGCCAAAC 
AATGCCAAAC 
AATGCCAAAC 



msa237456 . 2 {328_1169NT 
msa237456.2{328_2603 
msa237456.2{328_18RS21 
msa2 3 74 56 . 2 ( 32 8_H3 6B 
msa237456 . 2 { 328_C0H1 
msa237456 . 2 { 328_M732 
maa237456.2(328_M781 
msa237456.2{328_JM9130013 
insa237456.2{328_A909 
msa237456.2{328 090 
nisa237456.2{328_CJB110 
Consensus 



1601 

TTCTAGGAGC 
TTCTAGGAGC 
TTCTAGGAGC 
TTCTAGGAGC 
TTCTAGGAGC 
TTCTAGGAGC 
TTCTAGGAGC 
TTCTAGGAGC 
TTCTAGGAGC 
TTCTAGGAGC 
TTCTAGGAGC 



CATTAAcCCC 
CATTAAcCCC 
CATTAAtCCC 
CATTAAtCCC 
CATTAAtCCC 
CATTAAtCCC 
CATTAAtCCC 
CATTAAtCCC 
CATTAAtCCC 
CATTAAtCCC 
CATTAAtCCC 



GATACAGAGG 
GATACAGAGG 
GATACAGAGG 
GATACAGAGG 
GATACAGAGG 
GATACAGAGG 
GATACAGAGG 
GATACAGAGG 
GATACAGAGG 
GATACAGAGG 
GATACAGAGG 



TATTTATGGC 
TATTTATGGC 
TATTTATGGC 
TATTTATGGC 
TATTTATGGC 
TATTTATGGC 
TATTTATGGC 
TATTTATGGC 
TATTTATGGC 
TATTTATGGC 
TATTTATGGC 



1650 
CTATATCACT 
CTATATCACT 
CTATATCACT 
CTATATCACT 
CTATATCACT 
CTATATCACT 
CTATATCACT 
CTATATCACT 
CTATATCACT 
CTATATCACT 
CTATATCACT 



1651 



1700 



1019 



WO 2004/018646 



PCT/US2003/026827 



Table 71: Comparative Sequences relating to SAG1333 



msa237456 . 2 { 328_1169NT 
msa237456 . 2 { 328_2603 
msa237456 . 2 { 328_18RS21 
msa237456.2(328_H36B 
msa237456 . 2 { 328_COHl 
msa2374S6.2{32B_M732 
maa237456.2(328_M781 
msa237456.2{328_JM9130013 
msa237456.2{328_A909 
msa237456 . 2 {328_090 
tnsa237456.2{328_CJB110 
Consensus 



GATTTAGAAA 
GATTTAGAAA 
G ATTTA GAAA 
GATTTAGAAA 
GATTTAGAAA 
GATTTAGAAA 
GATTTAGAAA 
GATTTAGAAA 
GATTTAGAAA 
GATTTAGAAA 
GATTTAGAAA 



AAGCTGGTAA 
AAGCTGGTAA 
AAGCTGGTAA 
AAGCTGGTAA 
AAGCTGGTAA 
AAGCTGGTAA 
AAGCTGGTAA 
AAGCTGGTAA 
AAGCTGGTAA 
AAGCTGGTAA 
AAGCTGGTAA 



AAAAGTGAGC 
AAAAGTGAGC 
AAAAGTGAGC 
AAAAGTGAGC 
AAAAGTGAGC 
AAAAGTGAGC 
AAAAGTGAGC 
AAAAGTGAGC 
AAAAGTGAGC 
AAAAGTGAGC 
AAAAGTGAGC 



gTTCCAAATA 
gTTCCAAATA 
gTTCCAAATA 
gTTCCAAATA 
aTTCCAAATA 
aTTCCAAATA 
aTTCCAAATA 
gTTCCAAATA 
gTTCCAAATA 
gTTCCAAATA 
gTTCCAAATA 



ATAAACCTAA 
ATAAACCTAA 
ATAAACCTAA 
ATAAACCTAA 
ATAAACCTAA 
ATAAACCTAA 
ATAAACCTAA 
ATAAACCTAA 
ATAAACCTAA 
ATAAACCTAA 
ATAAACCTAA 



rasa237456.2{328_1169NT 
msa2374S6 . 2 { 328_2603 
msa237456.2{328_18RS21 
msa237456 . 2 ( 328_H36B 
maa237456 . 2 32B_COHl 
msa237456 . 2 3 28_M732 
msa237456.2{32 8 M781 
msa237456.2{328 JM9130013 
msa237456 . 2{328_A909 
msa237456 . 2 {328.090 
msa237456.2{328_CJB110 
Consensus 



1701 

AATCTATGTC 
AATCTATGTC 
AATCTATGTC 
AATCTATGTC 
AATCTATGTC 
AATCTATGTC 
AATCTATGTC 
AATCTATGTC 
AATCTATGTC 
AATCTATGTC 
AATCTATGTC 



ACTATGAAGA 
ACTATGAAGA 
ACTATGAAGA 
ACTATGAAGA 
ACTATGAAGA 
ACTATGAAGA 
ACTATGAAGA 
ACTATGAAGA 
ACTATGAAGA 
ACTATGAAGA 
ACTATGAAGA 



TGGTTAATGA 
TGGTTAATGA 
TGGTTAATGA 
TGGTTAATGA 
TGGTTAATGA 
TGGTTAATGA 
TGGTTAATGA 
TGGTTAATGA 
TGGTTAATGA 
TGGTTAATGA 
TGGTTAATGA 



AACTATTACA 
AACTATTACA 
AACTATTACA 
AACTATTACA 
AACTATTACA 
AACTATTACA 
AACTATTACA 
AACTATTACA 
AACTATTACA 
AACTATTACA 
AACTATTACA 



1750 
CAAAATGATG 
CAAAATGATG 
CAAAATGATG 
CAAAATGATG 
CAAAATGATG 
CAAAATGATG 
CAAAATGATG 
CAAAATGATG 
CAAAATGATG 
CAAAATGATG 
CAAAATGATG 



msa237456.2{328_1169NT 
msa237456 . 2 {328J2603 
rosa237456.2{328 18RS21 
msa237456.2{328_H36B 
msa2374S6 . 2 32 8_COHl 
msa237456.2{328_M732 
msa237456.2{32B_M781 
msa237456 . 2 { 328_JM9130013 
msa23 74 56 . 2 { 32 8_A9 09 
msa237456.2{328_090 
msa237456.2{328_CJB110 
Consensus 



1751 

GTACAcATAG 
GTACAcATAG 
GTACAtATAG 
GTACAtATAG 
GTACAtATAG 
GTACAtATAG 
GTACAtATAG 
GTACAtATAG 
GTACAtATAG 
GTACAcATAG 
GTACACATAG 



CATTATTaAG 
CATTATTaAG 
CATTATTaAG 
CATTATTaAG 
CATTATTaAG 
CATTATTaAG 
CATTATTaAG 
CATTATTgAG 
CATTATTaAG 
CATTATTaAG 
CATTATTaAG 



AAACTTTATT 
AAACTTTATT 
AAACTTTATT 
AAACTTTATT 
AAACTTTATT 
AAACTTTATT 
AAACTTTATT 
AAACTTTATT 
AAACTTTATT 
AAACTTTATT 
AAACTTTATT 



TAGATCGACA 
TAGATCGACA 
TAGATCGACA 
TAGATCGACA 
TAGATCGACA 
TAGATCGACA 
TAGATCGACA 
TAGATCGACA 
TAGATCGACA 
TAGATCGACA 
TAGATCGACA 



1800 
AGGAAATATT 
AGGAAATATT 
AGGAAATATT 
AGGAAATATT 
AGGAAATATT 
AGGAAATATT 
AGGAAATATT 
AGGAAATATT 
AGGAAATATT 
AGGAAATATT 
AGGAAATATT 



msa237456 . 2 {328_1169NT 
msa237456.2{328_2603 
msa237456.2{328_18RS21 
msa237456 .2(32 8_H36B 
msa237456.2(328_COHl 
msa237456.2(328_M732 
msa237456.2{328_M781 
msa237456 . 2 { 328_JM9130013 
msa237456.2{328_A909 
msa23745 6 . 2 { 3 2 B_0 9 0 
msa237456 . 2 {328_CJB110 
Consensus 



1801 

GTAGCACAAG 
GTAGCACAAG 
GTAGCACAAG 
GTAGCACAAG 
GTAGCACAAG 
GTAGCACAAG 
GTAGCACAAG 
GTAGCACAAG 
GTAGCACAAG 
GTAGCACAAG 
GTAGCACAAG 



AGATTGTATC 
AGATTGTATC 
AGATTGTATC 
AGATTGTATC 
AGATTGTATC 
AGATTGTATC 
AGATTGTATC 
AGATTGTATC 
AGATTGTATC 
AGATTGTATC 
AGATTGTATC 



AGACACTTTA 
AGACACTTTA 
AGACA CTTTA 
AGACACTTTA 
AGACACTTTA 
AGACACTTTA 
AGACACTTTA 
AGACACTTTA 
AGACACTTTA 
AGACACTTTA 
AGACACTTTA 



AACCAAACAA 
AACCAAACAA 
AACCAAACAA 
AACCAAACAA 
AACCAAACAA 
AACCAAACAA 
AACCAAACAA 
AACCAAACAA 
AACCAAACAA 
AACCAAACAA 
AACCAAACAA 



1850 
AATCAAAATC 
AATCAAAATC 
AATCAAAATC 
AATCAAAATC 
AATCAAAATC 
AATCAAAATC 
AATCAAAATC 
AATCAAAATC 
AATCAAAATC 
AATCAAAATC 
AATCAAAATC 



msa237456.2{328__1169NT 
msa237456.2{328_2603 
msa237456.2{328_18RS21 
msa237456 . 2( 328_H36B 
insa237456 . 2 328 - COHl 
msa237456 .2 328_M732 
msa237456.2{328_M781 
ntsa237456.2{328_JM9130013 
msa237456.2{328 A909 
msa237456.2{328 090 
msa237456 . 2 { 328_CJB110 
Consensus 



1851 

TACAAAAATC 
TACAAAAATC 
TACAAAAATC 
TACAAAAATC 
TACAAAAATC 
TACAAAAATC 
TACAAAAATC 
TACAAAAATC 
TACAAAAATC 
TACAAAAATC 
TACAAAAATC 



AACCCTGTAA 
AACCCTGTAA 
AACCCTGTAA 
AACCCTGTAA 
AACCCTGTAA 
AACCCTGTAA 
AACCCTGTAA 
AACCCTGTAA 
AACCCTGTAA 
AACCCTGTAA 
AACCCTGTAA 



CTACAATTCA 
CTACAATTCA 
CTACAATTCA 
CTACAATTCA 
CTACAATTCA 
CTACAATTCA 
CTACAATTCA 
CTACAATTCA 
CTACAATTCA 
CTACAATTCA 
CTACAATTCA 



CAAAAAACAA 
CAAAAAACAA 
CAAAAAACAA 
CAAAAAACAA 
CAAAAAACAA 
CAAAAAACAA 
CAAAAAACAA 
CAAAAAACAA 
CAAAAAACAA 
CAAAAAACAA 
CAAAAAACAA 



1900 
TTACACCAAT 
TTACACCAAT 
TTACACCAAT 
TTACACCAAT 
TTACACCAAT 
TTACACCAAT 
TTACACCAAT 
TTACACCAAT 
TTACACCAAT 
TTACACCAAT 
TTACACCAAT 



msa2 374 5 6 . 2 { 32 8_ 1 16 9NT 
msa237456.2{328 2603 
msa237456.2{328 18RS21 
msa237456 . 2 { 328_H36B 
m8a237456.2{328_COHl 
msa237456 . 2 { 328_M732 
msa237456.2(328 M781 
msa2374S6 . 2 { 328_JM9 130013 
msa237456 .2{328_A909 
msa237456.2{328_090 
msa2 374 56 . 2 { 3 2 8__CJB11 0 
Consensus 



1901 

TTACAGCTAT 
TTACAGCTAT 
TTACAGCTAT 
TTACAGCTAT 
TTACAGCTAT 
TTACAGCTAT 
TTACAGCTAT 
TTACAGCTAT 
TTACAGCTAT 
TTACAGCTAT 
TTACAGCTAT 



TAACCCTATG 
TAACCCTATG 
TAACCCTATG 
TAACCCTATG 
TAACCCTATG 
TAACCCTATG 
TAACCCTATG 
TAACCCTATG 
TAACCCTATG 
TAACCCTATG 
TAACCCTATG 



AGAAATTATG 
AGAAATTATG 
AGAAATTATG 
AGAAATTATG 
AGAAATTATG 
AGAAATTATG 
AGAAATTATG 
AGAAATTATG 
AGAAATTATG 
AGAAATTATG 
AGAAATTATG 



GCAAACCATC 
GCAAACCATC 
GCAAACCATC 
GCAAACCATC 
GCAAACCATC 
GCAAACCATC 
GCAAACCATC 
GCAAACCATC 
GCAAACCATC 
GCAAACCATC 
GCAAACCATC 



1950 
AAACTCCACT 
AAACTCCACT 
AAACTCCACT 
AAACTCCACT 
AAACTCCACT 
AAACTCCACT 
AAACTCCACT 
AAACTCCACT 
AAACTCCACT 
AAACTCCACT 
AAACTCCACT 



1020 



WO 2004/018646 PCT/US2003/026827 
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mfla237456.2{328_1169NT ) 
tnsa237456.2{328_2603 1 
msa237456.2{328_18RS21 '\ 
msa237456. 2(328 H36B ) 
msa237456 .2(32 8 JX>H1 \ 
msa237456.2(328_M732 '> 
msa237456 . 2 { 328_M781 
msa237456 . 2 { 328_JM9130013 ' 
msa2 3 74 56 . 2 { 3 2 8_A90 9 
msa237456.2{328 090 
rosa237456.2{328_CJB110J 
Consensus 



msa237456 . 2 { 328_1169NT 
msa237456.2{328_2603' 
msa237456 . 2 { 32 8_18RS2 1 [ 
msa237456.2(328_H36B > 
msa237456.2(328_COHl '> 
tnsa237456.2(328_M732 'i 
msa237456.2{328 M781 'f 
msa237456 . 2 { 328_JM9130013 
msa237456.2{32B_A909 
msa237456.2{328_090 
msa237456.2{328_GJB110 ) 
Consensus 



msa237456 .2{328_1169NT 

msa237456. 2 { 328J2603/ 
msa237456.2{328 18RS21 
msa237456 .2 f 328_H3 6B 
msa237456.2(328_COHl • 
msa237456 . 2 1 328J4732 \ 
tnaa237456.2{328_M781^ 
msa237456 . 2 {328_jJM9130013 \ 
msa237456 . 2 {328_A909 
msa237456 . 2 { 328_090 
msa237456 . 2 { 328_CJB110 , 
Consensus 

SEQ ZD HO. 7112 
STRAIN 2603 frame: 1 
MKKKI I LKS S VLGLVAGTS I MFSSVFADQVQ VQV I GVND FHGALDNTGTANMPDGKVANA 
GTAAQLDAYMDDAQKDFKQTNPNGES I RVQAGDMVGASPANSGLLQDEPTVKNFNAMNVE 
YGTLGMKEFDBGLAEYNRI VTGKAPAPDSNIMNITKSYPHEAAKQBI WANVIDKVNKQI 
PYNWKPYAI KNI PVNNKSVNVGFIGI VTKD IPNLVLRKNYBQYEFLDBABTI VKYAKELQ 
AKNVKAIVVLAHVPATSKNDIAEGEAAEMMKKVNQLFPEKSVDIWA 
TRIVQALSQGKAYADWGVIiDTDTQDFIETPSAKVIAVAPGKKTGSADI QAIVDQANTIV 
KQVTBAKIGTAEVSVMI TRS VDQDNVS PVGSL ITEAQIAI ARKSWPD IDFAMTNNGGI RA 
DLL I KPDGT I TWGAAQAVQ PFGNI LQWE I TGRDL YKALNEQYDQKQNEFLQ IAGLRYTY 
TDNXEGGEETPFKVVKAYKSNGEEINPDAKYKLVINDFLFGGGDGFASFRN^ 
DTEVFMAY I TDLEKAGKKVSVPNNKPKI YVTMKMVNETI TQNDGTHS 1 1 KKLYLDRQGNI 
VAQB I VSDTLNQTKSKSTKINPVTT I HKKQLHQFTAI NPMRNYGKPSNSTTVKS KQLPKT 
NSEYGQSFLMSVFGVGLIGIALNTKKKHMK 

SEQ ZD NO. 7113 
STRAIN 090 frame: 3 

VGVQVIGVND FHGAl^NTGTANMPDGKVTNAGTAAQI^^ I RV 

QAGDMVGAS PAN SGLLQDE PTVKTFNAMNVEYGTLGNHE FDEGLAEYNR I VTGKAPAPD S 

NINNITKSYPHEAAKQEIWANVIDKVNKQI PYNWKPYAI KNIPVN^ 

DI PNLVLRKNYEQYEFIjDEAET I VKYAKELQAKNVKA I WIAHVP ATSKDD I AEGEAAEM 

MKKVNOiFPBNSVDIWAGHNHQYTNGLVGKTRIVQAL^ 

TPSAKVVAVAPGKKTGSAD I QAI VDQANT I VKQVTEAKIGTAEVSGM ITRSVDQDNVSPV 
GSLITEAQLAI ARKSWPD I DFAMTNNGG I RADLL I KPDGT I TWGAAQAVQ PFGN I LQWB 
ITGRDLYKAIiNEQYDQKQNFFLQI AGLRYTYTDNKEGGEETP FKWKAYKSNGEE INPDA 
KYKLVINDFL FGGGDGF AS FRNAKLLGA I N PDTEVFMAY I TDLEKAGKKVSVPNNKPKI Y 
VTMKMVNET I TQNDGTHS 1 1 KKL YLDRQGN I VAQE I VSDTLNQTKSKSTKI NPVTT I HKK 
QLHQFTAI NPMRNYGKPSNSTTVKS KQ 

SEQ ZD NO. 7114 
STRAIN A909 frame: 3 

VNDFHGALDNTGTANMPDGKVTNAGTAAQIJIAYMDDAO^ I RVQAGDMVG 

AS PANSGLLQDE PTVKTFNAMNVEYGTLGNHE FDEGLAEYNRI VTGKAPAPDSNI NNITK 

SYPHEAAKQE I WANVI DKVNKQI PYNWKPYTI KN I PVNNKSVNVGF IG I VTKD I PNLVL 

RKNYEQYEFLDEAET I VKYAKELQAKNVKAI WLAHVPATS KDD I AEGEAAEMMKKVNQL 

PPEMSVDIVFAGHNHQYTNGLWSKTRIVQALSQGKAYADVRGVI^ 

AVAPGKKTGSADIC^IVDQANTIVKQVTBAKIGTAEVSGMITRSVDQD 

QLAI ARKSWPD I DFAMTNNGG I RADLL I KPDGT I TWGAAQAVQ P FGN I LQWE I TG RDL Y 

KALNBQYDQKQNF FLQ I AGLRYTYTDNKEGGE ETP FKWKAYKSNGEE I NPDAKYKLVT N 

DFIiFGGGDGFASFRIBlKLLGAINPDTBVFMA 

ETITQNDGTYSI I KKLYLDRQGNI VAQE I VSDTLNQTKSKSTKINPVTT I HKKQLHQFTA 



1951 2000 

ACTGTAAAAT CAaa — „ — „ 

ACTGTAAAAT CAaaACAAtt accaaaaaca aactctgaat atggacaatc 

ACTGTAAAAT CAaaA 

ACTGTAAAAT CAaa 

ACTGTAAAAT CAaa 

ACTGTAAAAT CAaaACAA — 

ACTGTAAAAT CAaa -~ 

ACTGTAAAAT CAaaA 

ACTGTAAAAT CAaaACAA — • . 

ACTGTAAAAT CAaaACAA — : >~« 

ACTGTAAAAT CA 

********** **__****** ********** ********** ********** 

2001 2050 
attccttatg tctgtctttg gtgttggact tataggaatt gctttaaata 



********** ********** ********** ********** ********** 

2051 2070 
caaagaaaaa acatatgaaa 
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INFMRNYGKPSNSTTVKSKQ 

SEQ ZD NO. 7115 
STRAIN H36B frame: 2 

GVGVQVIGVNDFHGAIJ5NTGTANMPDGKVTNACT I R 

VQAGDMVGASPANSGLLQDEPTVKTFNAMNVEYGTLGNHEro 
SNINNITKSYPHEAAKQEIWANVI DKVNKQI PYNWKPYT I KNI PVN^ 
KDI PNLVLRKNYEQYEFLDEAET I VKYAKELQAKNVKA I WLAHVPATSKDD IAEGEAAE 
MMKKVNQLFP ENS VD I VFAGHNHQ YTNGLVGKTR I VQALSQGKAYAD VRGVLDTDTQDF I 
ETPSAKVI AVAPGKKTGSAD IQAI VDQANT I VKQVTEAKI GTAE VSGMITRS VDQDNVS P 
VGSLITEAQLAIARKSWPDIDFAMTNNGGIRADLLIKPDGTITWGAAQAVQPFGNILQW 
E I TGRDLYKALNEQYDQKQNF FLiQIAGIjRYTYTDNKEGGEETPFKWKAYKSNGEEINPD 
AKYKLVI NDFLFGGGDG FAS FRNAKLLGA I NPDTEVFMAY I TDLEKAGKKVS VPNNKP KI 
YVTMKMVNETITQNDGTYSI I KKL YLDRQGN I VAQE I VSDTLNQTKS KST KI NP VTT I HK 
KQLHQFTAI NPMRNYGKPSNSTTVKS 

SEQ ID NO. 7116 
STRAIN I8RS21 frame: 1 

DQVGVQVI G VND FHGALDNTGTANMPDG KVXNAGTAAQLDAYMDD AQ KD F KQTNPNGE S I 

RVQAGDMVGASPANSGLLQDEPTVKTFNAMm^GTLGNHEFDEGLAEY 

DSNINNITKS YPHEAAKQE I WANV I D KVNKQ I PYNWKPYT I KNI PVNNKSVNVGFIGI V 

TKD I PNLVLRKNYEQYE FLDEAET I VKYAKELQAKNVKA I WLAHVPATSKDD I AEGEAA 

EMMKKVNQIiFPENSVDI VFAGHNHQYTNGLVGKTRI VQALSQ^KAYADVRGVLDTDTQDF 

I ETPSAKVI AVAPGKKTGSAD I QAI VDQANT I VKQVTEAKI GTAEVSGM ITRSVDQDNVS 

P VG SL ITEAQLA I ARKS WPD I D FAMTNNGG I RADLL I KPDGT I TWGAAQAVQ PFGNI LQV 

VEITGRDLYTCALNEQYDQKQNFFLQIAGLRYTYTDNKEGGEETPFKVVKAYK^ 

DAKYKLVINDFLFGGGDGFASFRNAKLLGAINPDTEVFMAYITDLFjK^ 

I YVTMKMVNET I TQNDGTYS 1 1 KKLYLDRQGN I VAQE I VSDTLNQTKS KSTKINP VTT I H 

KKQLHQFTA I NPMRNYG KPSNSTTVKS K 

SEQ ZD HO. 7117 
STRAIN M732 frame: 3 

Q^fGVQVI GVNDFHGALDNTGTANMPDGKVTNAGTAAQL^ S I R 

VQAGDMVGAS PANSGLLQDE PTVKT FNAMNVE YGTLGNHE FDEGLAEYNR I VTGKAPAPD 
SNINN ITKS YPHEAAKQE I VVANVIDKVNKQI PYNWKPYT I KNI PVNNKSVNVGFIGIVT 
KD I PNLVLRKNYEQYE FLDEAET I VKYAKELQAKNVKAI WLAHVPATSKDD I AEGEAAE 
MM KKVNQLF PENSVD I VFAGHNHQ YTNGLVGKTR I VQALS QGKAYADVRGVLDTDTQDF I 
ETPSAKVIAVAPGKKTGSAD I QAI VDQANT I VKQVTEAKI GTAEVSGM ITRSVDQDNVS P 
VGSL I TEAQLAI ARKS WPD IDFAMTNNGG I RADLLI KPDGT I TWGAAQAVQP FGN I LQW 



AKY1CLVINDFLFGGGDGFASFRNAKLLGAINPDTEVFMAYITDLEKAGKKVSIPNNKPKI 

KQIiHQFTAINPMRNYGKPSNSTTVKSKQ 

SEQ ZD NO. 7118 
STRAIN COH1 frame: 3 

QVGVQVIGVNDFHGAIiDNTGTANMPDGKVTNAGTAAQIjDAY I R 

VQAGDMVGAS PANSGLLQDE PTVKT FNAMNVE YGTLGNHE FDEGLAEYNRI VTG KAPAPD 
SNINNITKSYPHEAAKQEIWANVIDKVNKQI PYNWKPYTI KNI PVNNKSVNVGFIGIVT 
KD I PNLVLRKNYEQYE FLDEAET I VKYAKELQAKNVKAI VVLAHVPATS KDD IAEGEAAE 
MMKKVNQLFPENSVD I VFAGHNHQ YTNGLVGKTR I VQALS QGKAYADVRGVLDTDTQDF I 
ETPSAKVIAVAPGKKTGSAD I QAI VDQANT I VKQVTEAKI GTAEVSGM I TRSVDQDNVS P 
VGSL I TEAQLAI ARKS WPD I DFAMTNNGG I RADLL I KPDGT I TWGAAQAVQP FGNI LQW 
E I TGRDLYKALNBQYDQBCQNFFLQ IAGLRYTYTO 

AKYKLVI NDFLFGGGDGFAS FRNAKLLGA I N PDTEVFMAY I TDLEKAGKKVS IPNNKPKI 
YVTMKMVNETITQNDGTYSI IKKLYUDRQXSNIVAQEIVSDTIiNQTKSKSTiaNPVTTIHK 
KQLHQFTAI NPMRNYGKPSNSTTVKS ' 

SEQ ZD NO. 7119 
STRAIN M781 frame: 1 

QVGVQVI GVNDFHGALDNTGTANM PDGKVTNAGTAAQLDAYMDDAQKD FKQTNPNGE SIR 
VQAGDMVGAS PANSGLLQDE PTVKT FNAMNVE YGTLGNHE FDEGLAEYNRI VTG KAPAPD 
SNINNITKS YPHBAAKQEIVVANVTDKVNKQI PYNWKPYTIKNI PVNNKSVNVGFIGIVT 
KD I PNLVliRKNYEQYE FLDEAETIVKYAKEL»QAKNVKAIVV^ KDD IAEGEAAE 

MMKKVNQLFPENSVD I VFAGHNHQYTNGLVGKTR I VQALSQGKAYADVRGVLDTDTQDFI 
ETPSAKVI AVAPGKKTGSADI QAI VDQANTI VKQVTEAKI GTAEVSGM ITRSVDQDNVS P 
VGSL I TEAQLAI ARKS WPD I DFAMTNNGG I RADLLI KPDGTITWGAAQAVQP FGN ILQW 
E I TGRDLYKALNEQYDQKQNFFLQ I AGLRYTYTDNKEGGEETPFKVV^ 
AKYKLVI ND FLFGGGDGFAS FRNAKLLGA I NPDTBVFMAY I TDLEKAGKKVS I PNNKPKI 
YVTMKMVNETITQNDGTYSI IKKLYLDRQGNI VAQEIVSDTLNO^TOKSTKINPVTTIHK 
KQLHQFTAINPMRNYGKPSNSTTVKS 

SEQ ZD NO. 7120 
STRAIN CJB1 10 frame: 1 

DQVGVQV I GVND FHGALDNTGTANM PDGKVTNAGTAAQLDAYMDDAQKD FKQTNPNGES I 
RVQAGDMVGASPANSGLLQDEPTVKTFNAMNVEYGTL^^ 

DSNINNITKSYPHEAAKQBIWANVIDKVNKQI PYNWKPYAI KNI PVNNKSVNVGFIGI V 
TKD I PNDVIiRKNYEQ YE FLDEAET I VKYAKELQAKNVKA I VVL^ 

EMMKKVNQLFPENSVD I VFAGHNHQ YTNGLVG KTR I VQAL SQGKAYADVRGVLDTDTQDF 
IETPSAKWAVAPGKKTGSADIQAI VDQANTI VKQVTEAKIGTABVSGMITRSVDQDNVS 
PVGSLITEAQLAIARKSWPDIDFAMTNNGGIRADLLI KPDGT ITWGAAQAVQPFGNI LQV 
VE ITGRDLYKAIjNEQYDQKQNFFLQ I AGLRYTYTDNKEGGEETPFK^ I NP 
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DAKYKLVINDFLFGGGDGFASFRNAKLLGAI NPDTEVFMAYI TDLEKAGKKVSVPNNKPK 
I YVTMKMVNET I TQNDGTHS 1 1 KKL YLDRQGN I VAQE I VS DTLNQTKS KSTK I NPVTT I H 
KKQLHQFTAI NPMRNYGKPSNSTTVKS 

SEQ ID NO. 7121 
STRAIN 1 1 69NT frame: ! 

QVGVQVI GVNDFHGALDNTGTANM P DGKVANAGTAAQLDA YMDDAQKD FKQTNPNGES I R 
VQAGDMVGAS PANS GliLQDEPTVKNFNAMNVE YGTI/3NHE FDEGLAEYNRIVTG KAPAPD 
SNI NNITKS YPHEAAKQE I WANV I DKVNKQI PYNWKPYAI KNI PVNNKSVNVGFIG IVT 
KDI PNLVLRKNYEQ YEFLDEAET I VKYAKELQAKNVKA I WLAHVPATSKND IAEGBAAE 
MMKKVNQLF PENS VD I VFAGHNHQ YTNGL.VGKTR I VQALS QG KAYAD VRGVLDTDTQD F I 
ET PSAKVI AVAPGKKTG SAD I QAI VDQANT I VKQVTEAKI GTAEVSVMI TRSVDQDNVSP 
VGSL I TEAQLAI ARKS WPD X DFAMTNNGG I RADLL I KPDGT I TWGAAQAVQP FGN I LQW 
EITGRDLYKALNEQYDQKQNFFTjQIAGLRYTYTO 

AKYKL VI ND FLFGGGDG FAS FRNAKLLGA I NPE>TE VFMAY I TDLEKAGKKVSVPNNKPKI 
YVTMKMVNET I TQNDGTHS 1 1 KKL YLDRQGNI VAQE I VS DTLNQTKS KSTKI NPVTT I HK 
KQLHQFT A I NPMRNYGKPSNSTTVKS 

SEQ ID NO. 7122 
STRAIN JM9130013 frame: 2 

GVQVI GVNDFHGALDNTGTANMPDGKVTNAGTAAQLDAYMDDA I RVQ 

AGDMVGASPANSGDLQDEPTVKTFNAMNVEYGTI/3NHE FDEGLAE Y 



I PNLVLRKNYEQYEFIJ3EAETI VKYAKELQAKNVKAI VVLAHVPATS KDD I AEGEAAEMM 
KKVNQLF PENS VD I VFAGHNHQYTNGL VG KTR I VQALSQGKAYAD VRGVLDTDTQDF I ET 
PSAKVIAVAPGKKTGSAD I QAI VDQANT I VKQVTEAKI GTAEVSGM I TRS VDQDNVS PVG 
SL I TEAQLAI ARKS WPD I DFAMTNNGG I RADLL I KPDGT I TWGAAQAVQPFGNI LQWE I 
TGRDLYKALNEQYDQKQNFFLQ I AGLRYTYTDNKEGGEET PFKWKAYKSNGEE I NPDAK 
YKLVINDFXFGGGIK^FASFRNAKLI^INPDTEVFMAYITDLEKAGKKVSVPNNKPKIYV 



LHQFTAINPMRNYGKPSNSTTVKSK 
PRETTY of: /biotmp/msa237615 . 2 { * } May 14, 2003 03; 22 



msa237615.2{328_1169NT 
msa237615 . 2 (328_2603 
msa237615.2f328_A909 
msa237615.2f328_M732 
msa237615.2(328_COHl 
msa237615.2j'32B_M7Bl 
msa237615 . 2 {328_H36B 
msa237615 . 2 { 328_JM9130013 
msa237615.2{32B_18RS21 
msa237615.2{328 090 
msa237615 .2 {328_CJB110 
Consensus 



1 50 

. — qv gvqvigVNDF HGALDNTGTA 

mkkkiilksB vlglvagtsi mfasvfaDqv gvqvigVNDF HGALDNTGTA 

VNDF HGALDNTGTA 

— — qy gvqvigVNDF HGALDNTGTA 

. — » qv gvqvigVNDF HGALDNTGTA 

qv gvqvigVNDF HGALDNTGTA 

qv gvqvigVNDF HGALDNTGTA 

gvqvigVNDF HGALDNTGTA 

Dqv gvqvigVNDF HGALDNTGTA 

v gvqvigVNDF HGALDNTGTA 

. Dqv gvqvigVNDF HGALDNTGTA 



msa23761S .2 {328_1169NT 
msa237615 . 2 (328_2603 
msa237615.2{328__A909 
tnsa237615.2< 328_M732 
msa237615.2{328_COHl 
msa237615.2{328_M781 
msa237615.2{328_H36B 
msa237615 . 2 { 328_JM9130013 
maa237615.2{328_18RS21 
msa237615 . 2 {328_090 
msa237615 . 2 { 328_CJB110 
Consensus 



51 

NMPDGKVaNA 
NMPDGKVaNA 
NMPDGKVtNA 
NMPDGKVtNA 
NMPDGKVtNA 
NMPDGKVtNA 
NMPDGKVtNA 
NMPDGKVtNA 
NMPDGKVxNA 
NMPDGKVtNA 
NMPDGKVtNA 



GTAAQLDAYM 
GTAAQLDAYM 
GTAAQLDAYM 
GTAAQLDAYM 
GTAAQLDAYM 
GTAAQLDAYM 
GTAAQLDAYM 
GTAAQLDAYM 
GTAAQLDAYM 
GTAAQLDAYM 
GTAAQLDAYM 



DDAQKDFKQT 
DDAQKDFKQT 
DDAQKDFKQT 
DDAQKDFKQT 
DDAQKDFKQT 
DDAQKDFKQT 
DDAQKDFKQT 
DDAQKDFKQT 
DDAQKDFKQT 
DDAQKDFKQT 
DDAQKDFKQT 



NPNGESIRVQ 
NPNGES I RVQ 
NPNGESIRVQ 
NPNGESIRVQ 
NPNGESIRVQ 
NPNGESIRVQ 
NPNGESIRVQ 
NPNGESIRVQ 
NPNGESIRVQ 
NPNGESIRVQ 
NPNGESIRVQ 



100 

AGDMVGAS PA 
AGDMVGAS PA 
AGDMVGAS PA 
AGDMVGAS PA 
AGDMVGAS PA 
AGDMVGAS PA 
AGDMVGAS PA 
AGDMVGAS PA 
AGDMVGAS PA 
AGDMVGAS PA 
AGDMVGAS PA 



msa237615.2{328_1169NT 
msa237615 . 2{ 328_2603 
msa237615 . 2 f 328_A909 
msa237615.2f32S_M732 
msa237615 .2 (328JCOH1 
msa237615.2{328_M781 
msa237615.2{328_H36B 
msa237615.2{328_JM9130013 
msa237615 . 2 (328_18RS21 
msa237615 . 2 { 328_090 
msa237615.2{328_CJB110 
Consensus 



101 

NSGLLQDEPT 
NSGLLQDEPT 
NSGLLQDEPT 
NSGLLQDEPT 
NSGLLQDEPT 
NSGLLQDEPT 
NSGLLQDEPT 
NSGLLQDEPT 
NSGLLQDEPT 
NSGLLQDEPT 
NSGLLQDEPT 



VKnFNAMNVE 
VKnFNAMNVE 
VKtFNAMNVE 
VKtFNAMNVE 
VKtFNAMNVE 
VKtFNAMNVE 
VKtFNAMNVE 
VKtFNAMNVE 
VKtFNAMNVE 
VKtFNAMNVE 
VKtFNAMNVE 



YGTLGNHEFD 
YGTLGNHEFD 
YGTLGNHEFD 
YGTLGNHEFD 
YGTLGNHEFD 
YGTLGNHEFD 
YGTLGNHEFD 
YGTLGNHEFD 
YGTLGNHEFD 
YGTLGNHEFD 
YGTLGNHEFD 



EGLAEYNRIV 
EGLAEYNRIV 
EGLAEYNRIV 
EGLAEYNRIV 
EGLAEYNRIV 
EGLAEYNRIV 
EGLAEYNRIV 
EGLAEYNRIV 
EGLAEYNRIV 
EGLAEYNRIV 
EGLAEYNRIV 



150 

TG KAPAPD SN 
TGKAPAPDSN 
TGKAPAPDSN 
TGKAPAPDSN 
TGKAPAPDSN 
TGKAPAPDSN 
TGKAPAPDSN 
TGKAPAPDSN 
TGKAPAPDSN 
TGKAPAPDSN 
TGKAPAPDSN 



msa237615.2{328_1169NT 



msa237615.2 
ma a237615. 2 
msa237615.2 
msa237615.2 



msa237615.2{32B_M781 



32BJ2603 
328 A909 
328J1732 
328 OOH1 



151 

INNITKSYPH 
INNITKSYPH 
INNITKSYPH 
INNITKSYPH 
INNITKSYPH 
INNITKSYPH 



EAAKQEIWA 
EAAKQBIWA 
EAAKQEIWA 
EAAKQEIWA 
EAAKQEIWA 
EAAKQEIWA 



NVIDKVNKQI 
NVIDKVNKQI 
NVIDKVNKQI 
NVIDKVNKQI 
NVIDKVNKQI 
NVIDKVNKQI 



PYNWKPYalK 
PYNWKPYalK 
PYNWKPYtIK 
PYNWKPYtIK 
PYNWKPYtIK 
PYNWKPYtIK 



200 

NIPVNNKSVN 
NIPVNNKSVN 
NIPVNNKSVN 
NIPVNNKSVN 
NIPVNNKSVN 
NIPVNNKSVN 
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msa237615 . 2 { 328_H36B 
msa237615.2{328_JM9130013 
msa237615 . 2 { 328_18RS21 
msa237615.2{328_090 
msa237615 . 2 {328_CJB110 
Consensus 



INNITKSYPH EAAKQEIWA NVIDKVNKQI 
INNITKSYPH EAAKQEIWA NVIDKVNKQI 
INNITKSYPH EAAKQEIWA NVIDKVNKQI 
INNITKSYPH EAAKQEIWA NVIDKVNKQI 
INNITKSYPH EAAKQEIWA NVIDKVNKQI 



PYNWKPYtIK NIPVNNKSVN 
PYNWKPYtIK NIPVNNKSVN 
PYNWKPYtIK NIPVNNKSVN 
PYNWKPYalK NIPVNNKSVN 
PYNWKPYalK NIPVNNKSVN 



msa237615 . 2 { 328_1169NT 
msa237615 . 2 { 328_2603 
msa237615.2 328_A909 
msa237615.2{328_M732 
msa237615.2 328_COHl 
msa237615.2<328_M781 
msa237615.2{328_H36B 
msa237615 . 2{ 328_JM9130013 
msa237615 . 2 { 328_18RS21 
msa237615 . 2 {328_090 
msa237615 . 2 {328_CJB110 
Consensus 



201 

VGPIGIVTKD 
VGPIGIVTKD 
VGPIGIVTKD 
VGPIGIVTKD 
VGPIGIVTKD 
VGPIGIVTKD 
VGPIGIVTKD 
VGPIGIVTKD 
VGPIGIVTKD 
VGPIGIVTKD 
VGPIGIVTKD 



IPNLVLRKNY 
IPNLVLRKNY 
IPNLVLRKNY 
IPNLVLRKNY 
IPNLVLRKNY 
IPNLVLRKNY 
IPNLVLRKNY 
IPNLVLRKNY 
IPNLVLRKNY 
IPNLVLRKNY 
IPNLVLRKNY 



EQYEFLDEAE 
EQYEFLDEAE 
EQYEFLDEAE 
EQYEFLDEAE 
EQYEFLDEAE 
EQYEFLDEAE 
EQYEFLDEAE 
EQYEFLDEAE 
EQYEFLDEAE 
EQYEFLDEAE 
EQYEFLDEAE 



TIVKYAKELQ 
TIVKYAKELQ 
TIVKYAKELQ 
TIVKYAKELQ 
TIVKYAKELQ 
TIVKYAKELQ 
TIVKYAKELQ 
TIVKYAKELQ 
TIVKYAKELQ 
TIVKYAKELQ 
TIVKYAKELQ 



250 

AKNVKAIWL 
AKNVKAIWL 
AKNVKAIWL 
AKNVKAIWL 
AKNVKAIWL 
AKNVKAIWL 
AKNVKAIWL 
AKNVKAIWL 
AKNVKAIWL 
AKNVKAIWL 
AKNVKAIWL 



msa23761S . 2 {328_1169NT; 
msa237615.2{328_2603 
msa237615 .2f328_A909' 
msa237615 .2 328_M732 
msa237615 .2{328__COHl 
msa237615.2 328_M781 
msa237615 . 2 {328_H36B 
msa237615.2{328_JM9130013 
msa237615 .2{328_18RS21 
msa237615.2{328_090 
msa237615.2{328_CJB110 
Consensus 



251 

AHVPATSKnD 
AHVPATSKnD 
AHVPATSKdD 
AHVPATSKdD 
AHVPATSKdD 
AHVPATSKdD 
AHVPATSKdD 
AHVPATSKdD 
AHVPATSKdD 
AHVPATSKdD 
AHVPATSKdD 
********_* 



lAEGEAAEMM 
IAEGEAAEMM 
LAEGEAAEMM 
IAEGEAAEMM 
lAEGEAAEMM 
IAEGEAAEMM 
IAEGEAAEMM 
IAEGEAAEMM 
IAEGEAAEMM 
lAEGEAAEMM 
IAEGEAAEMM 
********** 



KKVNQLFPEN 
KKVNQLPPBN 
KKVNQLFPEN 
KKVNQLFPEN 
KKVNQLPPBN 
KKVNQLFPEN 
KKVNQLFPEN 
KKVNQLFPEN 
KKVNQLFPEN 
KKVNQLFPEN 
KKVNQLFPEN 
********** 



SVDIVFAGHN 
SVDIVFAGHN 
SVDIVFAGHN 
SVDIVFAGHN 
SVDIVFAGHN 
SVDIVFAGHN 
SVDIVFAGHN 
SVDIVFAGHN 
SVDIVFAGHN 
SVDIVFAGHN 
SVDIVFAGHN 
********** 



300 

HQYTNGLVGK 
HQYTNGLVGK 
HQYTNGLVGK 
HQYTNGLVGK 
HQYTNGLVGK 
HQYTNGLVGK 
HQYTNGLVGK 
HQYTNGLVGK 
HQYTNGLVGK 
HQYTNGLVGK 
HQYTNGLVGK 
********** 



msa237615.2{328_1169NT 
msa237615.2{328_2603 
msa237615.2 
msa237615.2 
msa237615.2 
msa237615 .2 
msa237615.2 
msa237615 ,2{328_JM9130013 
msa237615.2{328_18RS21 
msa237615.2{328_090 
msa237615 . 2 { 328_CJB110 
Consensus 



328_2603 
328_A909 
328_M732 
328_C0H1 
328J4781 
328 H36B 



301 

TRIVQALSQG 
TRIVQALSQG 
TRIVQALSQG 
TRIVQALSQG 
TRIVQALSQG 
TRIVQALSQG 
TRIVQALSQG 
TRIVQALSQG 
TRIVQALSQG 
TRIVQALSQG 
TRIVQALSQG 



KAYADVRGVL 
KAYADVRGVL 
KAYADVRGVL 
KAYADVRGVL 
KAYADVRGVL 
KAYADVRGVL 
KAYADVRGVb 
KAYADVRGVL 
KAYADVRGVL 
KAYADVRGVL 
KAYADVRGVL 



DTDTQDFIET 
DTDTQDFIET 
DTDTQDFIET 
DTDTQDFIET 
DTDTQDFIET 
DTDTQDFIET 
DTDTQDFIET 
DTDTQDFIET 
DTDTQDFIET 
DTDTQDFIET 
DTDTQDFIET 



PSAKViAVAP 
PSAKViAVAP 
PSAKViAVAP 
PSAKViAVAP 
PSAKViAVAP 
PSAKViAVAP 
PSAKViAVAP 
PSAKViAVAP 
PSAKViAVAP 
PSAKWAVAP 
PSAKWAVAP 



350 

GKKTGSADIQ 
GKKTGSADIQ 
GKKTGSADIQ 
GKKTGSADIQ 
GKKTGSADIQ 
GKKTGSADIQ 
GKKTGSADIQ 
GKKTGSADIQ 
GKKTGSADIQ 
GKKTGSADIQ 
GKKTGSADIQ 



msa237615.2{328 1169NT 
msa237615.2(328 2603 
msa237615.2 328~A909 
msa237615.2 328J4732 
msa237615 .2 328_COHl 
msa237615 .2 328_M781 
msa237615 . 2 (328_H36B 
tnsa237615.2{328_JM9130013 
msa237615.2{328_18RS21 
msa237615.2{328_090 
msa237615 . 2 { 328_CJB110 
Consensus 



351 

AIVDQANTIV 
AIVDQANTIV 
AIVDQANTIV 
AIVDQANTIV 
AIVDQANTIV 
AIVDQANTIV 
AIVDQANTIV 
AIVDQANTIV 
AIVDQANTIV 
AIVDQANTIV 
AIVDQANTIV 



KQVTEAKIGT 
KQVTEAKIGT 
KQVTEAKIGT 
KQVTEAKIGT 
KQVTEAKIGT 
KQVTEAKIGT 
KQVTEAKIGT 
KQVTEAKIGT 
KQVTEAKIGT 
KQVTEAKIGT 
KQVTEAKIGT 



AEVSvMITRS 
AEVSvMITRS 
ABVSgMITRS 
AEVSgMITRS 
ABVSgMITRS 
ABVSgMITRS 
AEVSgMITRS 
AEVSgMITRS 
AEVSgMITRS 
AEVSgMITRS 
AEVSgMITRS 



VDQDNVSPVG 
VDQDNVSPVG 
VDQDNVSPVG 
VDQDNVSPVG 
VDQDNVSPVG 
VDQDNVSPVG 
VDQDNVSPVG 
VDQDNVSPVG 
VDQDNVSPVG 
VDQDNVSPVG 
VDQDNVSPVG 



400 

SLITEAQLAI 
SLITEAQLAI 
SLITEAQLAI 
SLITEAQLAI 
SLITEAQLAI 
SLITEAQLAI 
SLITEAQLAI 
SLITEAQLAI 
SLITEAQLAI 
SLITEAQLAI 
SLITEAQLAI 



rasa237615 . 2 { 328_1169NT 
msa237615.2{328_2603 
msa237615.2< 328_A909 
msa237615 . 2 328_M732 
msa237615.2 328_C0H1 
msa237615 . 2 328_M781 
maa23761S.2(32S_H36B 
msa237615.2{328 JM9130013 
msa237615 . 2 { 328_18RS2 1 
msa237615 . 2 { 328_090 
msa237615 . 2 {328_CJB110 
Consensus 



401 

ARKS WPD IDF 
ARKS WPD IDF 
ARKS WPD IDF 
ARKS WPD IDF 
ARKSWPDIDF 
ARKS WPD IDF 
ARKSWPDIDF 
ARKSWPDIDF 
ARKSWPDIDF 
ARKSWPDIDF 
ARKSWPDIDF 



AMTNNGGIRA 
AMTNNGGIRA 
AMTNNGGIRA 
AMTNNGGIRA 
AMTNNGGIRA 
AMTNNGGIRA 
AMTNNGGIRA 
AMTNNGGIRA 
AMTNNGGIRA 
AMTNNGGIRA 
AMTNNGGIRA 



DLLIKPDGTI 
DLLIKPDGTI 
DLLIKPDGTI 
DLLIKPDGTI 
DLLIKPDGTI 
DLLIKPDGTI 
DLLIKPDGTI 
DLLIKPDGTI 
DLLIKPDGTI 
DLLIKPDGTI 
DLLIKPDGTI 



TWGAAQAVQP 
TWGAAQAVQP 
TWGAAQAVQP 
TWGAAQAVQP 
TWGAAQAVQP 
TWGAAQAVQP 
TWGAAQAVQP 
TWGAAQAVQP 
TWGAAQAVQP 
TWGAAQAVQP 
TWGAAQAVQP 



450 

FGNILQWEI 
FGNILQWEI 
FGNILQWEI 
FGNILQWEI 
FGNILQWEI 
FGNILQWEI 
FGNILQWEI 
FGNILQWEI 
FGNILQWEI 
FGNILQWEI 
FGNILQWEI 



msa237615 . 2 { 328_1169NT 



msa237615.2 
maa237615.2 
msa237615.2 
msa237615.2 



328 2603 
328~A909 
328~M732 
328~C0H1 



451 500 
TGRDLYKALN EQYDQKQNFF LQIAGLRYTY TDNKEGGEET PFKWKAYKS 
TGRDLYKALN EQYDQKQNFF LQIAGLRYTY TDNKEGGEET PFKWKAYKS 
TGRDLYKALN EQYDQKQNFF LQIAGLRYTY TDNKEGGEET PFKWKAYKS 
TGRDLYKALN EQYDQKQNFF LQIAGLRYTY TDNKEGGEET PFKWKAYKS 
TGRDLYKALN EQYDQKQNFF LQIAGLRYTY TDNKEGGEET PFKWKAYKS 



1024 



WO 2004/018646 



PCT7TJS2003/026827 



Table 71: Comparative Sequences relating t SAG1333 



msa237615.2(328_M78l) 
msa237615.2{328 H36B) 
msa237615 . 2 { 328_JM9130013 J 
rasa237615 .2{328_18RS2lj 
msa237615 .2{328_090j 
msa237615 . 2 { 328_CJB110 } 
Consensus 



TGRDLYKALN 
TGRDLYKALN 
TGRDLYKALN 
TGRDLYKALN 
TGRDLYKALN 
TGRDLYKALN 



EQYDQKQNPF 
EQYDQKQNFF 
EQYDQKQNFP 
EQYDQKQNFF 
EQYDQKQNFF 
EQYDQKQNFF 



LQIAGLRYTY 
LQIAGLRYTY 
LQIAGLRYTY 
LQIAGLRYTY 
LQIAGLRYTY 
LQIAGLRYTY 



TDNKEGGEET 
TDNKEGGEET 
TDNKEGGEET 
TDNKEGGEET 
TDNKEGGEET 
TDNKEGGEET 



PFKWKAYKS 
PFKWKAYKS 
PFKWKAYKS 
PFKWKAYKS 
PFKWKAYKS 
PFKWKAYKS 



msa237615.2{328_1169NTj 
msa237615.2(328 2603} 
tnsa237615 . 2 { 328_A909 } 
msa237615.2{328_M732) 
msa237615.2 328jCOHl> 
msa237615.2 328JM781) 
msa237615.2{328_H36Bj 
msa237615.2{328_JM9130013) 
msa237615 . 2 { 328_18RS21 ) 
msa237615 . 2 { 328_090 > 
msa237615.2{328_CJB110} 
Consensus 



501 

NGEEINPDAK 
NGEEINPDAK 
NGEEINPDAK 
NGEEINPDAK 
NGEEINPDAK 
NGEEINPDAK 
NGEEINPDAK 
NGEEINPDAK 
NGEEINPDAK 
NGEEINPDAK 
NGEEINPDAK 



YKLVI NDFLF 
YKLVINDFLF 
YKLVINDFLF 
YKLVINDFLF 
YKLVINDFLF 
YKLVINDFLF 
YKLVINDFLF 
YKLVINDFLF 
YKLVINDFLF 
YKLVINDFLF 
YKLVINDFLF 



GGGDGFASFR 
GGGDGFASFR 
GGGDGFASFR 
GGGDGFASFR 
GGGDGFASFR 
GGGDGFASFR 
GGGDGFASFR 
GGGDGFASFR 
GGGDGFASFR 
GGGDGFASFR 
GGGDGFASFR 



NAKLLGAINP 
NAKLLGAINP 
NAKLLGAINP 
NAKLLGAINP 
NAKLLGAINP 
NAKLLGAINP 
NAKLLGAINP 
NAKLLGAINP 
NAKLLGAINP 
NAKLLGAINP 
NAKLLGAINP 



550 

DTEVFMAYIT 
DTEVFMAYIT 
DTEVFMAYIT 
DTEVFMAYIT 
DTEVFMAYIT 
DTEVFMAYIT 
DTEVFMAYIT 
DTEVFMAYIT 
DTEVFMAYIT 
DTEVFMAYIT 
DTEVFMAYIT 



msa237615.2{328_1169NT 
msa237615 . 2 { 328_2603 
msa237615.2 328_A909 
msa237615.2 32B_M732 
msa237615 . 2 < ' 328_C0H1 
tnsa237615 . 2 ( 328_M781 
msa237615 . 2 (328_H36B 
ms a237615. 2 {328_JM9130013 
msa237615 .2{328_18RS21 
msa237615.2{328__090 
msa237615 . 2 { 328__CJB110 
Consensus 



551 

DLEKAGKKVS 
DLEKAGKKVS 
DLEKAGKKVS 
DLEKAGKKVS 
DLEKAGKKVS 
DLEKAGKKVS 
DLEKAGKKVS 
DLEKAGKKVS 
DLEKAGKKVS 
DLEKAGKKVS 
DLEKAGKKVS 



vPNNKPKIYV 
VPNNKPKIYV 
vPNNKPKIYV 
iPNNKPKIYV 
iPNNKPKIYV 
iPNNKPKIYV 
VPNNKPKIYV 
vPNNKPKIYV 
vPNNKPKIYV 
vPNNKPKIYV 
vPNNKPKIYV 



TMKMVNETIT 
TMKMVNETIT 
TMKMVNETIT 
TMKMVNETIT 
TMKMVNETIT 
TMKMVNETIT 
TMKMVNETIT 
TMKMVNETIT 
TMKMVNETIT 
TMKMVNETIT 
TMKMVNETIT 



QNDGThSIIk 
QNDGThSIIk 
QNDGTySIIk 
QNDGTySIIk 
QNDGTySIIk 
QNDGTySIIk 
QNDGTySIIk 
QNDGTySIIe 
QNDGTySIIk 
QNDGThSIIk 
QNDGThSIIk 



600 

KLYLDRQGNI 
KLYLDRQGNI 
KLYLDRQGNI 
KLYLDRQGNI 
KLYLDRQGNI 
KLYLDRQGNI 
KLYLDRQGNI 
KLYLDRQGNI 
KLYLDRQGNI 
KLYLDRQGNI 
KLYLDRQGNI 



rasa2 3 76 15 . 2 { 3 2 8_116 9NT } 
msa237615.2{328_2603) 
msa237615 . 2 { 328_A909 } 
msa237615 . 2 (328__M732 ] 
msa237615 . 2 f 32B_COHl 
tnsa237615 .2?328_M781 
msa237615.2{328_H36B 
msa237615 . 2 { 328_JM9130013 j 
msa237615 . 2 {328_18RS21 j 
msa237615.2{328_090 
msa237615 . 2 { 328_CJB110 ] 
Consensus 



601 

VAQEIVSDTL 
VAQEIVSDTL 
VAQBIVSDTL 
VAQEIVSDTL 
VAQEIVSDTL 
VAQEIVSDTL 
VAQEIVSDTL 
VAQEIVSDTL 
VAQEIVSDTL 
VAQBIVSDTL 
VAQEIVSDTL 



NQTKSKSTKI 
NQTKSKSTKI 
NQTKSKSTKI 
NQTKSKSTKI 
NQTKSKSTKI 
NQTKSKSTKI 
NQTKSKSTKI 
NQTKSKSTKI 
NQTKSKSTKI 
NQTKSKSTKI 
NQTKSKSTKI 



NPVTTIHKKQ 
NPVTTIHKKQ 
NPVTTIHKKQ 
NPVTTIHKKQ 
NPVTTIHKKQ 
NPVTTIHKKQ 
NPVTTIHKKQ 
NPVTTIHKKQ 
NPVTTIHKKQ 
NPVTTIHKKQ 
NPVTTiHKKQ 



LHQFTAINPM 
LHQFTAINPM 
LHQFTAINPM 
LHQFTAINPM 
LHQFTAINPM 
LHQFTAINPM 
LHQFTAINPM 
LHQFTAINPM 
LHQFTAINPM 
LHQFTAINPM 
LHQFTAINPM 



650 

RNYGKPSNST 
RNYGKPSNST 
RNYGKPSNST 
RNYGKPSNST 
RNYGKPSNST 
RNYGKPSNST 
RNYGKPSNST 
RNYGKPSNST 
RNYGKPSNST 
RNYGKPSNST 
RNYGKPSNST 



msa23761S.2{328_1169NT 
tnsa237615 . 2 {328_2603 
msa237615.2(328_ J A909 
msa237615.2 328_M732 
msa237615>2{328_COHl 
msa237615.2 328_M781 
rasa237615.2{328_H36B 
msa237615 . 2{ 328_JM9130013 
msa237615.2{328_18RS21 
msa237615.2{328 090 
msa237615.2{328_CJB110 
Consensus 



690 



651 

TVKS 

TVKSKQlpkt nseygqsflm svfgvgligi alntkkkhmk 

TVKSKQ 

TVKSKQ 

TVKS 

TVKS — 

TVKS .... 

TVKSK 

TVKSK 

TVKSKQ 

TVKS 
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Table 72: Comparative Sequences relating t SAG0941 



SEQ ZD NO* 7201 
STRAIN 2603 

ATGAATAAACG CGTAAAAATCGTTG CAACACTTGGTCCTGCGGTTGAATTCCGTGGTG 
GTAAGAAGTTTGGTGAGTCTGGAT ACTGGGGTGAAAG CCTTGACGTAGAAGCTTCAGCAG 
AAAAAATTG CTCAATTG ATTAAAGAAGGTG CTAACGTTTTCCGTTTCAACTTCrCACATG 
GAGATCATGCTGAGCAAGGAGCTCGTATGG CTACTGTTOGTAAAGCAGAAGAGATTGCAG 
GACAAAAAGTTGGCTTCCTCCTTGATACrAAAGGACCTGAAAT^ 
AAGATGGTGCAGATTTCCATTCATATACAACAGGTACAAAA 
AAGGTATCAAATCAACTCCAGAAGTGATTGCATTGAATGTTC 

TTGATGACX3TTGAAGTTGGTAAG CAAATCCTTGTIXy^TGATGGTAAACTAGGTCTTACTC 
TGTTTGCAAAAGATAAAGACACI^TGAATTTGAAGTAGTTC CCTTA 
TTGGTAAAO^AAAAGGTGTAAACATCCCTTATACT AAAATTCCITTC 
AACGCGATAATCCTGATATCCGTTTTGGACTTGAGCAAGGAC^ 

CATTTX-rTACGTACTG CT AAAGATGTTAAT^ m 
ATGGACACGTTAAGTTGTTTGCTAAAATTGAAAAT 

AGATTATCGAAGCAGCAGATGGTATTATGATTGCTCGTGGTGATATGGGTATCGAAG 

CATTTGAAATGGTTCCAGTTTACCAAAAAATGATCATTA 

AAGCAGTTATTACAGCAACAAATATGCTTgAAACAATGACTGATAAACCACG 

GT^^[IAGAAGTATCTGATGTCTTCAATG CTGTTATTGATGGTACTGATGCTACAATGCTTT 

CAGGTGAGTCAGCTAATGGTAAATACCCAGTTGAGTCAGTTCGTAC^ 

ATAAAAATGCTCAAACATTACTCAATGAGTATGGTCGCTTAGACT 

GTAATAACAAAACTGATGTTATTGCATCTGCGGTTAAAGATG CAACACACTCAATGGATA 

TCAAACTTGTTGTAACAATTACTGAAAC^ 

GXCGAGATGCAGACATTTTGGCTGTTACATTTGATGAAAAA 

TTAACTGGGGTGTTATCCCTGTCCTTGCAGACAAAOZAGCATCT 

AGGTTGCAGAACGTGTAGCACT/TGAAGCAGGATTTG 

TCGTTGCAGGTGTT CCTGTAGGTACLAGGTGGAACTAACACAATG CGTGTTQGTACTGTTA 
AA 



SEQ ID NO. 7202 
STRAIN 090 

AATAAACGCGTAAAAATCGTTGCAACACr 

ACIGGGGTGAAAGC CTT GACGTAGAAG CTTCAG CAGAAAAAATTGCT CAA 
TTGATTAAAGAAGGTGCXAACXSTTTTCCGTTTCAACTTCTC^ 
TCATGCTGAGCAAGGAGCTCGTATGGCTACTGTTCGTAAA^ 
TTGCAGGACAAAAAGTTGGCTTCCT CCTTGATACTAAAGGACCTGAAATT 
CGTACAGAACITTTTGAAGATGGTTCAGATTrCCATTCAT^ 
TACAGAATTACGTGTTGCTACTAAG CAAGGTATCAAATCAACTCCAGAAG 
TGATTGCATTGAATGTTGCTGGTGGACTTGACATC1"1"1GATG^ 
GTTGGTAAGOUVATCCITGTTGATGATGGTAAACTAGCT 
TGCAAAAGATAAAGACACTCgTGAATrTGAAGTAGTTC 
GCCTTATTGGTAAACAaaaaGGTGTAAACATCCXTITrATACTAaAATTCCT 
TTCCCAgCACTTGCAGAACGCGATAATGCTGATATCCGTTTTGGAC^ 
GCAAGGACTTAACTTTATTGCTATCTCATTTGTACGTACrrGCTAAAGATG 
TTAATGAAGTTCX?IX3CTATTTGTGAAGAAACTGGCAA 
TTGTTTGCTAAAATTGAAAATCAACAAGGTATCGATAATATTG^ 
TATCXSAAGCAGCAGATGGTATrATGATTGCrCGTGGTGATATGGGTATCG 
AAGTTCCATTTGAAATGGTTCCAG1UUACCAAAAAATGATCATTACTAAA 
GTTAATGCAGCTGGTAAAGCAGTTATTACAGCAACAAATATGCTTGAAAC 
AATGACTGATAAACCACGTGCGACTCGITCAGAAGTATCTGATGTCrTCA 
ATG CTGTTATTGATGGTACTGATG CTACAATG CTTTCAGGTGAGTCAGCT 
AATGGTAAATACCCAGTTGAGTCAGTTCGTACAATGGCTACT 
AAATG CT CAAACATT ACTCAATGAGTATGG TCG CTTAGACT CATCTG CAT 
TCCCACGTAATAACAAAACTGATGTTATTG CATCTG CGGTTAAAGATGCA 
ACACACTCAATGGATATCAAACri'Gl'l^ltlACAATTACTGAAArAGGT^ 
TACAGCTCX3TCCCATTTCTAAATTCCGTCCAGATGCAG^ 
TTACATTTGATGAAAAAGTACAACGTTCATTGATGAT^ 
• ATCCCTGTCCTTCC^GACAAACCAGCATCTACAGATGATATGTTTGA 
TGCAGAACGTGTAGCACTTGAAGCAGGACTTGTT^ 

CGTGTTCGTACTGTTAAA 



SEQ XD NO. 7203 
STRAIN A909 

AAXAAACGCGTAAAAATCGTTGCAACACTTGGTC 
CTGCGGTTGAATTCCGTGGTGGTAAGAAGTTTGGTGACT 
GGTGAAAGCCTTGACXn > AGAAGCTTCAGCAGAAAAAATTG CTCAATTGAT 
TAAAGAAGGTGCTAACXnTTTCCXnTrCAACTTCT 

CTGAG CAAGGAG CTCGTATGGCTACTGTTCGTAAAGCAGAAGAGATTGCA 

GGACAAAAAGTTGG CTTCCTCCTTGATACTAAAGGACXrrGAAATTCGTAC 

AGAACTTTTTGAAGATGGTG CAGATTTCCATT CATATACAACAGGTACAA 

AATTACGTGTTG CTACTAAG CAAGGTATCAAATCAACT CCAGAAGTG ATT 

GCATTGAATGTTGCTGGTGGACTTGACATCTTTGAT^ 

TAAGCAAATCCTTGTTGATGATGGTAAACTAGGTCTTAC^ 

AAGATAAAGACACTCGTGAATTTGAAGTAGTTGTIX^^ 

ATTGGTAAACAAAAAGGTGTAAACATCCCTTATACTAAAAT^ 

AGCACITGCAGAACGCGATAATGCTGATATCCGTTT^ 

GACTTAACTTTATTGCTATCTCATTTGT^ 

GAAGTTCGTGCTATTTGTGAAGAAACTGGCAATGGAC^ 

TGCTAAAATTGAAAATCAACAAGGTATCGATAATATTGATGAGA 

AAGCAGCAGATGGTATTA TQATT GCTCGTGGTGATATGGGTAT^ 

CCATTTGAAATGGTTCCAGTTTACCAAAAAATG^ 



1026 



WO 2004/018646 
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Table 72: Comparative Sequences relating to SAG0941 



TGCAGCTGGTAAAGCAGTTATTACAGCAACAAATATGCTTGAAACAATGA 
CTGATAAACCACGTGCX3ACTCGTT CAGAAGTATC^ 

GTTATTGATGGT ACTGATG CTACAATG CTTTCAGGTGAGTCAGCT AATGG 

TAAATACCXAGlTGAGTCAGTrOGTACAATGGCTACrATrGATAAAAATG 

CTCAAACATTACTCAATGAGTATGGTCGCTTAGACTCATCTG 

CGTAATAACAAAACTGATGTTATTG CATCTGCGGTTAAAGATGCAACACA 

CTCAATGGATATCAAACTTGTTGTAACAATTACrGAAACAGGTAATACAG 

CTCGTGCCATTTCTAAATr CCGTC CAGATGCAGACATTTTGGCTGTTACA 

TTTGATGAAAAAGTACAACGTTCATTGATGATTA^ 

TGTCCTTGCAGACAAAC CAG CATCTACAGATGATATGTTTGAGGTTG CAG 
AACGTGTAGCACTTGAAGCAGGATTTGTTGAATCAGGO 

TCGTACTGTTAAA 

SEQ XD NO. 7204 
STRAIN H36B 

AATAAACGCGTAAAAATCGTTGCAAC 



GATACTXXX^TGAAAGCCITGACGTAGAAGCTTCAG 

CAATTGATrAAAGAAGGTG CTAACGTTTTCCGTTTCAACTTCTCACATGG 

AGATCATGCTGAGCAAGGAGCTCGTATGGCTACTGTTCXjTAAAG cagaag 

AGATTGCAGGACAAAAAGTTGG CTTCCTCCTTGATACTAAAGGACCTGAA 

ATTCGTACAGAACTTTTTGAAGATGGTGCAGA^ 

AGGTACAAAATTACGTGTTGCTACTAAGCAAGGTATCAAATCAACTC 

AAGTGATTGCATTGAATGTTGCTGOTGGACTT^ 

GAAGTTGGTAAGCAAATCCITGTTGATGATGG 

GTTTGCAAAAGATAAAGACACTCGTGAATTTGAAGT^ 

ATGGCCTTATTGGTAAACAAAAAGGTGTAAACATCCCTTATACTAAAATT 

CCrri'CCC^GCACTTGCAGAACXKXxATAATGCTGATA 

TGAGCAAGGACTTAACTITATTGCTATCTCATTTC 

ATGTTAATGAAGTTCGTGCnATTTGTGAAGAAA 

AAGTTGTTTGCTAAAATTGAAAATCAACAAGGT 

GATTATCGAAGCAGCAGATGGTATTATGATTGCTCGTGGTGATATG 

TCXxAAGTTCCATTTGAAATGGTTCCAGTTTACCAAAAA^ 

AAAGTTAATGCAGCTGGTAAAGCAGTTATTACAGCAACAAATATC 

AACAATGAcTGATAAACGACGTGCGACTCGTTCAGAACT 

TCAATGCTGTTATTGATGGTACTGATGCTACAATGC^^ 

GCTAATGGTAAATACCCAGTTGAGTCAGTTCGTACAATGGCTACTAT^ 

TAAAAATG CT CAAACATTACT CAATGAGTATGGT<^CTT AGACTCAT CTG 

CATTCCCACGTAATAACAAAACTGATGTTATTGCATCTOCXXn^ 

GCAACACACTCAATGGATATCAAACTTGTTGTAACAATTA 

TAATACAGCTCGTG (XATTTCTAAATTCCGTCCAGATGCAGAC 

CTGTTACATTTGATGAAAAAGTACAACGTTCATTC 

GGTTGCAGAACGTGTAGCZACTTGAAGCAGGATTTGT^ 

ATATCGTTATCGTTGCAGGTGTTCCTGTAgGTACAGGTGGAACTAACACA 

ATGCGTGTTCGTACTGTTAAA 

SEQ XD NO. 7205 
STRAIN 18RS21 

AATAAACGCGTAA AAAT CGTTGCAAC 

GATACTGGGGTGAAAGCCTTGACETAgAAGC^ 

CAATTGATTAAAGAAGGTGCTAACGTTTTCCG^ 

AGA!TCATGCTGAGCAAGGAGCrCX3TATGGCTA 

AGATTGCAGGAQ\AAAAGTTGGCTTCCTCCITTG^ 

ATTCGTACAGAACTTTTTGAAGATGGTGCAGATT^^ 

AGGTACAAAATTACGTGTTGCTACTrAAGCAAGGTATCAAA 

AAGTGATTGCATTGAATGTTGCTGGTGGACT^ 

GAAGTTGGTAAGCAAATCCTTGTTGATGATGGT^ 

GTTTGCAAAAGATAAAGACACTCX3TGAATTTGA 

ATGGCCTTATTGGTAAACAAAAAGGTGTAAACA^ 

CCTTTCCCAGCACTIGCAGAACGCGATAATGCrG^ 

TGAGCAAGGACTTAACTTTATTGCTATCTCAT^ 

ATGTTAATGAAGTTCXSTGCTATTTGTG^ CAATGGACACGTT 
AAGTTGTTTG CTAAAATTGAAAATCAAC^G^ATCGATAATATTGATGA 



TCGAAGTTCCATTTGAAATGGTTCCAGTTTAC 

AAAGTTAATGCAGCTGGTAAAGCAGTTATTACAGCAACAA^ 

AACAATGaCTGATAAACCACGTGCGACTCX?^ 

TCAATGCTGTTATTGATGGTACTGATGCTA 

GCTAATGGTAAATACCCAGTTGAGTCAGTTCCT 

TAAAAATGCTCAAACATTACTCAATGAGTATGGTCGCT^ 

CATTCCCACGTAATAACAAAACTGATGTTATTGCATC 

GCAACACACTCAATGGATATCAAACTTg 

TAATACAGCTCGTGCCATTTCTAAATTCCGTCC^ 

CTGTTACATTTGATGAAAAAGTACAACGTTC^ 

GTTATCXXTTGTCCTTGCAGACAAACXAG 

GGTTGCAGAACGTGTAgCACTTGAAGCAGGATTT^ 

ATGCGTGTTCGTACTGTTAAA 

SEQ XD NO. 7206 
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STRAIN M732 

AATAAACGCGTAAAAATCGTTGCAAC 

ACTTGGTCCTGCGGTAGAATTCCXSTGGTGGTAAGAAGTTTGGT^ 
GATACTGGGGTGAAAGCCTTGACGT AGAA GCTTCAGCAGAAAAAA^^ 
CAATTGATTAAAGAAGGTG CTTAACGTTTTCCGTTTCAACrTCTCACATGG 
AGATCATGCTGAGCAAGGAG CTCX3T ATGGCT^ GAG AAG 
AGATTGCAGGACAAAAAGTTGGCTTCCTCCTTGATACTAA 
ATTCGTACAGAACTTTTTGAAGATGGTGCAG^ 
AGGTAC^AAATTACGTGTTGCTACTAAGCAAGGTATCAAATCAACT 
AAGTGATTGCATTGAATGTTGCTGGTGGACrrTGA 

GAAGTTGGTAAGCAAATCXnTGTTGATGATGGTAAACTAGGT CTTACTGT 

GTTTG CAAAAGATAAAG ACACT CX3TGAATTTG AAG TAGTTGTTGAGAATG 

ATGG CCTTATTGGTAAACAAAAAGGTGTAAACATCCCTTATACTAAAATT 

CCTTTCCCAG CACTTGCAGAACGCGATAATGCTGATATCCGTTTTGGACT 

TGJ^GCAAGGACTTAACTTTATTGCTATCTCATTTGTACGTA 

ATGTTAATGAAGTTCXnX3CTATTTGTGAAGAAACTGGCAATGGACACGTT 

AAG'riXjTri^CTAAAATTGAAAATCAACAAGGTATCGATAATATTGATGA 

GATTATCG/VAGCAGCAGATGQTATTATGATTGCTCXST^ 

TCGAAGTTCCATTTGAAATGGTTCCAGTTTACCAAAAAATGA • 

AAAGTTAATGCAGCTGGTAAAGCAGTTATTACAGC^ 

AACAATGACTGATAAACCACGTGCGACTOT 

TCAATGCTGTTATTGATGGTACTGATGCTACAATGCTTTCAGGTGAGTC^ 

GCTAATGGTAAATACCCAGTTGAGTCAGTTCGTACAATGGCrACTATTGA 

TAAAAATGCTCAAACATTACTC^TGAGTATGGTCGCTTAGACTCATCTG 

CATTCCCACGTAATAACAAAACTGATGTTATTGCATCTGCGGTTAAA 

GCAACACACTCAATGGATATCAAACTTGTTGTAACAATTAC^ 

TAATAC^GCTCGTGCCATTTCTAAATTCCGTC^ 

CTGTTACATTTGATGAAAAAGTACAACGTTCATTGATG^ 

GTTATCCCTGTCCTTGCAGAjCAAACCAGCATCTACAGATGATA 

GGTTGCAGAACGTGTAg CACTTGAAGCAGGACTTGTTGAATCAGGCGATA 

atatcgttatcgttgcaggtgttcctgtaggtacaggtggaactaacaca 

ATGCGTGTTCGTACTGTTAAA 

SKQ ZD HO. 7207 
STRAIN COH1 

AATAAACGCGTAAAAATCGTTGCAAC 

GATACTGGGGTGAAAGCCTTGACGTAGAAG CTTCAGCAGAAAAAATTGCT 

CAATTGATTAAAGAAGGTGCTAACX3TTTrCCX3TTTC 

AGATCATGCTGAGCAAGGAGCTCCTAT^ 

AGATTGCAGGACAAAAAGTTGGCTTCCTCCTTC 

ATTCGTACAGAACTTTITGAAGATGGTGCAGATT^ 

AGGTACAAAATTACXSTGTTGCTACrrAAGCAAGGTATCAAATCAACTCCAG 
AAGTGATTGCATTGAATGTTGCTGGTGGACTTGACATu 
GAAGTTGGTAAGCAAATCCTTGTTGATGATGGTAAACTAGGTCTTACTGT 
GTTTGCAAAAGATAAAGACACTCGTGAATTTGA^ 

ATGGCC^AtTGGTAAACAAAAAGGTGTAAAt^TCCCTTATACTAAAATT 

CCTTTCCCAG CACITGCAGAACGCGATAATGCTGATATCCGTTTTGgACT 

TGAGGAAGGACITAACTTTATTGCTATCT 

ATGTTAATGAAGTTCGTGCTATTTGTGAAGAA^ 

AAGTTGTTTGCTAAAATTGAAAATCAACAAG 

GATTATCGAAGCAG<2AGATGGTATTATGATTGCT 

TCGAAGTTCCATTTGAAATGGTTCCAGT^ 

AAAGTTAATGCAGCTGGTAAAGCAGTTATTACAGCAACAAAT 

AACAATGACTCATAAACCTCGTGCGACTCGTC 

TCAATGCTGTTATTGATGGTACTGATGCTACAATGCT 

GCTAATGGTAAATACCCAGTTGAGTCAGTTCGTACAA^ 

TAAAAATGCTCAAACATTACTCAATGAGTATGGT^ 

CATTCCCACGTAATAACAAAACTGATGTTATTGCAT^^ 

GCAACACACTCAATGGATATCAAACTTGTTGTAACAACT 

TAATACAGCTCXSTGCCATTTCTAAATTCC^ 

GTGTTACATTTGATGAAAAAGTACAACGTTCATTC 

GTTATCCCTGTCCTTGCAGACAAACCAGCATC^ 

GGT'TGCAGAAOTItn'AGCACTTGAAGCAGG 

ATGCGTGTTCGTACTGTTAAA 

SKQ ZD HO. 7208 
STRAIN M781 

AATAAACGCGTAAAAATCGTTG CAAC 

ACTTGGTCCTGCGGTAGAATTXXXrTGGTGGTAAGA^ 

GATACTGGGGTGAAAGCCTTGACGTAGAAGCTTCA^ 

CAATTQATTAAAGAAGGTGCTAACXSTTTTCC^ 

AGATCATGCTGAGCAAGGAGCTCCTATG 

AGATTGCAGGACAAAAAGTTGGCTTCXTIXXriT^ 

ATTCGTACAGAACTTTTTGAAGATGGTGC^ 

AGGTACAAAATTACGTGTTG CTACTAAGCAAG^jTATCAAATCAACTC CAQ 

AAGTX3ATTGCATTGAATGTTGCTGGTGGACTTC 

GAAGTTGGTAAGCAAATCCTTGTTGAT GATGG TAAA 

GTTTGCAAAAGATAAAGACACTCXnXlAATTTQAAGT^^ 

ATGGCCTIATTGgTAAACAAAAAGGTGTAAACATCC^ 

CCTTTCCCAGCAClUHSCAGaaCXSOGMAATC 

TGAGCAAGGACTTAACTTTATTGCTATCTCAT^ 
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ATGTTAATGAAGTTCGTGCTATTTGTGAAGAA^ 

AAGTTGTTTGCTAAAATTGAAAATCAACAAG^TAT^ 

GATTATCX3AAGCAGCAGATGGTATTATGATTGCTCGTGGTC 

TCGAAGTTCCATTTGAAATGGTTCCAGTTT^^ 

AAAGTTAATGCAGCTGGTAAAGCAGTTATTACAGCAACAAATATC 

AACAATGACTGATAAACCACGTGCGACTCGTTCAGAAGTAT^^ 

TCAATGCTGTTATTGATGGTACTGATGCT 

GCTAATGGTAAATACCXZAGTTGAGTCAGTTCGTACAATGGCTACT 

TAAAAATGCTCAAACATTAC1CAATGAGTATGGTCGCTT 

CATTCCCACXjTAATAACAAAACTGATGTTATTGC^ 

GCAACACACTCAATGGATATCAAACTTGT^ 

TAATACAGCTCGTGCCATTTCTAAGTTCX^TC^ 

CTGTTAC3VITTGATGAAAAAGTACAACGTC 

GTTATCCCTX3TCCTTGCAGACAAACCAGCATCTACAGATGATATG 
GGTTG CAGAACGTGT AGCACTTGAAGCAGGACTTC CGATA 
ATATCGTTATCGTTG CAGGTGTTCCTGTAGGTACAGGTGGAACT AACACA 
atgcgtgttcgtactgttaaa 

j 

SEQ ID NO. 7209 
STRAIN GJB110 

AATAAACGCGTAAAAATCGTTGCAAC 

ACITGGTCCTGCGGTTGAATTCCGTGGTGGTAAG^ 

GATACTGGGGTGAAAGCCTTGACGTAgAAGCrrTCAGCAGAAAA 

CAATTGATTAAAGAAGGTGCTAAOGTTTTCCGTTTCAACTT^ 

AGATCATGCTGAGCAAGGAGCTCGTATGGCT^ 

AGATTGCAGGACAAAAAGTTGGCTTCXjrcCTTGATACTA^ 

ATTCGTACAGAACTTTTTCAAGATGGTGCAGATTTCCAT^ 

AGGTACAAAATTACGTGTTGCTACTAAGCAAGGTATCAAATCAACTCCAG 

AAGTGATTGCATTGAATGTTGCTGGTGGAC^ 

GAAGTTGGTAAGCAAATCCTDGTTGATGATGG 

GTTTGCAAAAGATAAAGACACTCGTGAATTTGAA 

ATGGCCTTAtTGGTAAACAAAAAGGTGTAAACATCCCT^ 

CCTTTCCCAGCACTTGCAGAACX3CGATAATGCTGATATC 

TGAACAAGGACTTAACTTTATTGCTAT CTCATTTGTACGTACTGCTAAAG 

ATGTTAATGAAGTTCGTGCTATTTGTGAAGAAACrGGCAATGG^ 

AAGTTGT1TGCTAAAATTGAAAATCAACAAGGTATCGATAATA 

GATTATCGAAGCAGCAGATGGTATTATGATTG 

TCGAAGTTCCATTTGAAATGGTTCCAGTTTACCAAAAAATG^ 

AAAGTTAATGCAGCTGGTAAAGCAGTTATTACA 

AACAATGACTGATAAACCACGTGCGACTCGTTCAGAAGTATC^ 

TCAATGCTGTTATTGATGGTACTGATG CTACAATGCTTT CAGGTGAGTCA 

GCTAATGGTAAATACCCAGTTGAGTCAGTTCGTACAA^ 

TAAAAAXGCTCAAACATTACTCAATGAGTATGGT 

CATTCC(^CGTAATAACAAAACTGATGTTATTGCATCTGCGGTTAAAGAT 

GCAACACACTCAATGGATATCAAACTTGTTGTAACAA 

TAATACAGCTCGTGCCIATTTCTAAATTCCGTCCAGAT^ 

CTGTTACATTTGATGAAAAAGTACAACX5TTGATT^ 

GTTATCCCrGTCCTTGCAGACAAACCAG<^TC 

GGTTGCAGAAOGTGTAGCACITGAAGCAGGATTTGTTGA^ 

ATATCX3tTATCGTTGCAGGTGTTCCTGTAGGTACAGGTGGAACT 

SEQ TD NO. 7210 
STRAIN 1 169NT 

AATAAACGCGTAAAAATCGTTGCAAC 

ACTTGGTCCTGCGGTAGAATTCXXSTG^ 

GATACIXX3GGTGAAAGCCTTGACGTAGAAG 

CAATTGATTAAAGAAGGTGCTAACGTTTTCCG^ 

AGATCATGCTGAGCAAGGAGCTCGTATGGCTAC^ 

AGATTGCAGGACAAAAAGTTGG CTTCCTO^ 

ATTCGTACAGAAL'rriUUGAAGATGGTGCAGATTTCX^TT CATAT ACAAC 

AGGTACAAAATTACGTGTTGCTACrAAGCAAGGTATCAAAT 

AAGTGATTGCATTGAATGTTGCTGGTGGACTTGAC^ 

GAAGTTGGTAAGO^TCCTTGTTGATGATGG 

GTTTGCAAAAGATAAAGACACTCX5TGAATTTGAAGTA 

ATGGCCTTATTCGTJUACAAAAAGGTGTAAACA 

CCTTTCCCAGCACTTGCAGAACG 

TGAGCAAGGACTTAACTTTAITGCrATCTC^ 

ATGTTAATGAAGTTCGTGCTATTTGTGAAGAAA 

AAGTTGTTTG C^AAAATTGAAAATCAaCZAAGGTATCGATAATATTGATGA 

GATTATCGAAGCAGCAGATGGTATTATGATTGCT 

TCGAAGTTCCATTTGAAATGGTTCCAGTT^ 

AaAGTTAATGCAGCTGGTAAAGCAGTTATTACAGC^ 

AACAATGACTGATAAACCACGTGOGAiCTOGTTCAGAACT 

TCAATGCTGTTATTGATGGTACTGATGCTAC^ 

GCTAATGGTAAATACCCAGTTQAGTCAGTTOGT^ 

TAAAAATGCTCAAACA t tACTCAATGAGTATGGTCGTTTAGACTCATCTG 

CATTCCCACGTAATAACAAAACTGATGTTA^ 

GCAACACACrrCAATGGATATCAAAL'riVlU 

TAATAC5AGCTCGTCCCATTTCTAAATTCCGTCCA 

CTOTTACATTTGATGAAAAAGTACAACGTTCATTGAT^ 

GTTATCCCTGTCX7ITGCZAGACAAACCAGCATCT 

GGTTGCAGAACGTGTAGCACTTGAAGCAGGACT 



1029 



WO 2004/018646 



PCTYUS2003/026827 



Table 72: Comparative Sequences relating to SAG0941 



ATATCXOTATCGTTGCRGGTCTTCCTGTAGGTACAG 
ATGCGTGTTCGTACTGTTAAA 



SEQ XD NO. 7211 
STRAIN JM9130013 
AATAAACGCGTAAAAATCGTTGCAAC 

ACTTGGTCCTGCGGTAGAATTCCGTGGTGGTAAGAAGTTTGGTGA 

GATACTGGGGTGAAAGCCTTGACGTAGAAG CTTCAGCAGAAAAAATTGCT 

CAATTGATrAAAGAAGGTGCTAACGTTTTC CGTTTC^ 

AGATCATGCTGAGCAAGGAGCTOSTATGGCTACrGTTCGTAAA^ 

AGATTGCAGGACAAAAAGTTGGCTTCCTCCTTGATACT 

ATTCGTACAGAACTTTnXaAAGATGGTTCAGATTTCCA^ CATATACAAC 

AGGTACAAAATTACGTGl'I^CrACrrAAGC AAGG TATC AAAT C^ 

AAGTGATTGCATTGAATGTTG CTGGTGGACTTGACATCTTTGATGACXnT 

GAAGTTGGTAAGCAAATCX7TTGTTGATGATGGTAAACT 

GTTTGCAAAAGATAAAGACACTCGTGAATTTGAAGTAG 

ATGGCCITATTGGTAAACAAAAAGGTGTAAACATCCCrTATACTAAAA^ 

CCTTTCCCAGCACTTGCAGAACGCGATAATGCTGATATCCGTTT^ 

TGAGCAAGGACTTAACTTTATTGCTATCTCATTTGT 

ATGTTAATGAAGTTCGTGCTATTTGTGAAGAAACT^ 

AAGTTGTTTXSCTAAAATTGaAAATGAaCAAG^ 

GATTATCGAAGCAG CAGATGGTATTATGATTGCTCGTGGTGATATGGGTA 
TCGAAGTTCCATTTGAAATGGTTCCAGTTTACCAAA 
AAAGTTAATGCAGCTGGTAAAGCAGTTAt tACAGCAACAAATATGCTTGA 
AACAATGACTGATAAACCACGTGCGACTC^TTCAGAAGTATCTG^ 
TCAATGCTGTTATTGATGGTACTGATGCTA 

GCTAATGGTAAATACCCAGTTGAGTCAGTTCX5TACAATGG CTACTATTGA 

TAAAAATGCTCAAACATTACTCAATGAGTATGGT 

CATTCCCACGTAATAaCAAAACTGATGTTA 

GCAACACACTCAATGGATATCAAACTTGTTGT^ 

TAATACAGCTCGTGCCATTTCrAAATTCTO 

CTGTTACATTTGATGAAAAAGTACAAC<?ITCA 

GTTATCX^CTGTCCTTGCAGACAAACCAGC^ 

GGTTGCXGAACGTGTAgcACTTGAAGCAGGACrTGTTGAA 

ATATCGTTATCX3TTGCAGGTGTTCCTGTAGGTACAGGTGGAACT 

PRETTY of: /biotmp/msa277466 . 2 {*} February 24, 2003 01:44 



msa277466.2{330_090 
msa277466 .2{330_JM9130013 
ntsa277466.2{330_18RS21 
msa277466.2(330J2603 
msa2774 66 . 2 (330_A909 
msa277466.2(330_H36B 
msa277466 . 2 { 33 0_CJB110 
msa277466.2(330_COHl 
maa277466.2{330 M732 
msa2 77466 . 2 { 330_1169NT 
msa277466 . 2 {330J4781 
Consensus 



AATAAAC 

AATAAAC 

AATAAAC 

atgAATAAAC 

AATAAAC 

AATAAAC 

AATAAAC 

AATAAAC 

AATAAAC 

AATAAAC 

AATAAAC 

********** 



GCGTAAAAAT 
GOGTAAAAAT 
GCGTAAAAAT 
GCGTAAAAAT 
GCGTAAAAAT 
GCGTAAAAAT 
GCGTAAAAAT 
GCGTAAAAAT 
GOGTAAAAAT 
GCGTAAAAAT 
GCGTAAAAAT 
********** 



CGTTGCAACA 
CGTTGCAACA 
CGTTGCAACA 
CGTTGCAACA 
CGTTGCAACA 
CGTTGCAACA 
CGTTGCAACA 
CGTTGCAACA 
CGTTGCAACA 
CGTTGCAACA 
CGTTGCAACA 
********** 



50 

CGGTaGAATT 
CGGTaGAATT 
CGGTtGAATT 
CGGTtGAATT 
CGGTtGAATT 
CGGTtGAATT 
CGGTtGAATT 
CGGTaGAATT 
CGGTaGAATT 
CGGTaGAATT 
CGGTaGAATT 



CTTGGTCCTG 
CTTGGTCCTG 
CTTGGTCCTG 
CTTGGTCCTG 
CTTGGTCCTG 
CTTGGTCCTG 
CTTGGTCCTG 
CTTGGTCCTG 
CTTGGTCCTG 
CTTGGTCCTG 
CTTGGTCCTG 
********** ****_***** 



msa277466.2{330 090 
msa277466.2{330 JM9130013 
m8a2 77466 . 2 { 330_18RS21 ' 
msa277466. 2(330 2603 
msa277466 . 2 { 330~A909 
msa277466 . 2 { 330_H36B 
msa2 774 66 . 2 { 3 3 0_CJB110 
msa277466 .2(33 0_COH1 
msa277466 . 2 { 330J4732 
msa277466 . 2 { 330_1169NT 
cnsa277466.2{330JM781 
Consensus 



51 

CCGTGGTGGT 
CCGTGGTGGT 
CCGTGGTGGT 
CCGTGGTGGT 



CCGTGGTGGT 
CCGTGGTGGT 
CCGTGGTGGT 
CCGTGGTGGT 
CCGTGGTGGT 
CCGTGGTGGT 



AAGAAGTTTG 
AAGAAGTTTG 
AAGAAGTTTG 
AAGAAGTTTG 
AAGAAGTTTG 
AAGAAGTTTG 
AAGAAGTTTG 
AAGAAGTTTG 
AAGAAGTTTG 
AAGAAGTTTG 
AAGAAGTTTG 



GTGAGTCTGG 
GTGAGTCTGG 
GTGAGTCTGG 
GTGAGTCTGG 
GTGAGTCTGG 
GTGAGTCTGG 
GTGAGTCTGG 
GTGAGTCTGG 
GTGAGTCTGG 
GTGAGTCTGG 
GTGAGTCTGG 



ATACTGGGGT 
ATACTGGGGT 
ATACTGGGGT 
ATACTGGGGT 
ATACTGGGGT 
ATACTGGGGT 
ATACTGGGGT 
ATACTGGGGT 
ATACTGGGGT 
ATACTGGGGT 
ATACTGGGGT 



100 

GAAAGCCTTG 
GAAAGCCTTG 
GAAAGCCTTG 
GAAAGCCTTG 
GAAAGCCTTG 
GAAAGCCTTG 
GAAAGCCTTG 
GAAAGCCTTG 
GAAAGCCTTG 
GAAAGCCTTG 
GAAAGCCTTG 



msa277466.2{330_090' 
msa277466.2{330 JM9130013* 
rasa277466 . 2 { 3 3 0_18RS2 1 ' 
tosa277466. 2(330 2603 
msa2 774 66.2(33 0~A909 
msa277466.2{330~H36B 
msa277466 .2{330_CJB110 
msa277466. 2(330 C0H1 
rasa277466.2{330~M732 
msa277466.2{330_1169NT 
tnsa277466.2{330J4781 
Consensus 



Bisa277466.2{330_090} 



101 

ACGTAGAAGC 
ACGTAGAAGC 
ACGTAGAAGC 
ACGTAGAAGC 
ACGTAGAAGC 
ACGTAGAAGC 
ACGTAGAAGC 
ACGTAGAAGC 
ACGTAGAAGC 
ACGTAGAAGC 
ACGTAGAAGC 



TTCAGCAGAA 
TTCAGCAGAA 
TTCAGCAGAA 
TTCAGCAGAA 
TTCAGCAGAA 
TTCAGCAGAA 
TTCAGCAGAA 
TTCAGCAGAA 
TTCAGCAGAA 
TTCAGCAGAA 
TTCAGCAGAA 



AAAATTGCTC 
AAAATTGCTC 
AAAATTGCTC 
AAAATTGCTC 
AAAATTGCTC 
AAAATTGCTC 
AAAATTGCTC 
AAAATTGCTC 
AAAATTGCTC 
AAAATTGCTC 
AAAATTGCTC 



AATTGATTAA 
AATTGATTAA 
AATTGATTAA 
AATTGATTAA 
AATTGATTAA 
AATTGATTAA 
AATTGATTAA 
AATTGATTAA 
AATTGATTAA 
AATTGATTAA 
.AATTGATTAA 



150 

AGAAGGTGCT 
AGAAGGTGCT 
AGAAGGTGCT 
AGAAGGTGCT 
AGAAGGTGCT 
AGAAGGTGCT 
AGAAGGTGCT 
AGAAGGTGCT 
AGAAGGTGCT 
AGAAGGTGCT 
AGAAGGTGCT 



151 200 
AACGTTTTCC GTTTCAACTT CTCACATGGA GATCATGCTG AGCAAGGAGC 
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msa277466.2{330_JM9130013; 

msa277466 . 2 { 330_18RS21 
msa277466.2(330_2603 
msa277466.2<330_A909; 
msa277466. 2(330 H36B 

msa277466.2{330 CJB110 
msa277466 . 2 ( 330_COH1 
msa277466.2{330_M732 

msa277466.2{330_1169NT 
msa277466.2{330_M781 
Consensus 



AACGTTTTCC 
AACGTTTTCC 
AACGTTTTCC 
AACGTTTTCC 
AACGTTTTCC 
AACGTTTTCC 
AACGTTTTCC 
AACGTTTTCC 
AACGTTTTCC 
AACGTTTTCC 



GTTTCAACTT 
GTTTCAACTT 
GTTTCAACTT 
GTTTCAACTT 
GTTTCAACTT 
GTTTCAACTT 
GTTTCAACTT 
GTTTCAACTT 
GTTTCAACTT 
GTTTCAACTT 



CTCACATGGA 
CTCACATGGA 
CTCACATGGA 
CTCACATGGA 
CTCACATGGA 
CTCACATGGA 
CTCACATGGA 
CTCACATGGA 
CTCACATGGA 
CTCACATGGA 



GATCATGCTG 
GATCATGCTG 
GATCATGCTG 
GATCATGCTG 
GATCATGCTG 
GATCATGCTG 
GATCATGCTG 
GATCATGCTG 
GATCATGCTG 
GATCATGCTG 



AGCAAGGAGC 
AGCAAGGAGC 
AGCAAGGAGC 
AGCAAGGAGC 
AGCAAGGAGC 
AGCAAGGAGC 
AGCAAGGAGC 
AGCAAGGAGC 
AGCAAGGAGC 
AGCAAGGAGC 



msa277466.2{330_090 
msa277466 . 2 {330_JM9130013 ' 
msa277466 .2(33 0_18RS2 1 
msa277466.2(330_2603 i 
msa277466 . 2 (330JV909 
msa277466. 2(330 H36B 
msa277466.2{33O_c3B110 
msa277466 . 2 { 330_COH1 
msa277466 .2(33 0_M73 2 
msa277466.2{330_1169NT 
rasa277466.2{330_M7Bl 
Consensus 



201 

TCGTATGGCT 
TCGTATGGCT 
TCGTATGGCT 
TCGTATGGCT 
TCGTATGGCT" 
TCGTATGGCT 
TCGTATGGCT 
TCGTATGGCT 
TCGTATGGCT 
TCGTATGGCT 
TCGTATGGCT 



ACTGTTCGTA 
ACTGTTCGTA 
ACTGTTCGTA 
ACTGTTCGTA 
ACTGTTCGTA 
ACTGTTCGTA 
ACTGTTCGTA 
ACTGTTCGTA 
ACTGTTCGTA 
ACTGTTCGTA 
ACTGTTCGTA 



AAGCAGAAGA 
AAGCAGAAGA 
AAGCAGAAGA 
AAGCAGAAGA 
AAGCAGAAGA 
AAGCAGAAGA 
AAGCAGAAGA 
AAGCAGAAGA 
AAGCAGAAGA 
AAGCAGAAGA 
AAGCAGAAGA 



GATTGCAGGA 
GATTGCAGGA 
GATTGCAGGA 
GATTGCAGGA 
GATTGCAGGA 
GATTGCAGGA 
GATTGCAGGA 
GATTGCAGGA 
GATTGCAGGA 
GATTGCAGGA 
GATTGCAGGA 



250 

CAAAAAGTTG 
CAAAAAGTTG 
CAAAAAGTTG 
CAAAAAGTTG 
CAAAAAGTTG 
CAAAAAGTTG 
CAAAAAGTTG 
CAAAAAGTTG 
CAAAAAGTTG 
CAAAAAGTTG 
CAAAAAGTTG 



msa277466 . 2 {330_090 ' 
msa277466.2{330_JM9130013 
msa277466 . 2 {330_18RS21 
msa277466 . 2 ( 330_2603 
msa277466.2(330_A909' 
msa2 7 74 66 . 2 { 3 3 0JH3 6B 
msa277466 . 2 {330_CJB110 
maa277466. 2(330 COH1 
tnsa277466 . 2 { 330~M732 
msa277466 . 2 { 330_1169NT 
msa277466.2{330_M781 
Consensus 



251 

GCTTCCTCCT 
GCTTCCTCCT 
GCTTCCTCCT 
GCTTCCTCCT 
GCTTCCTCCT 
GCTTCCTCCT 
GCTTCCTCCT 
GCTTCCTCCT 
GCTTCCTCCT 
GCTTCCTCCT 
GCTTCCTCCT 



TGATACTAAA 
TGATACTAAA 
TGATACTAAA 
TGATACTAAA 
TGATACTAAA 
TGATACTAAA 
TGATACTAAA 
TGATACTAAA 
TGATACTAAA 
TGATACTAAA 
TGATACTAAA 



GGACCTGAAA 
GGACCTGAAA 
GGACCTGAAA 
GGACCTGAAA 
GGACCTGAAA 
GGACCTGAAA 
GGACCTGAAA 
GGACCTGAAA 
GGACCTGAAA 
GGACCTGAAA 
GGACCTGAAA 



TTCGTACAGA 
TTCGTACAGA 
TTCGTACAGA 
TTCGTACAGA 
TTCGTACAGA 
TTCGTACAGA 
TTCGTACAGA 
TTCGTACAGA 
TTCGTACAGA 
TTCGTACAGA 
TTCGTACAGA 



300 

ACTTTTTGAA 

ACTTTTTGAA 
ACTTTTTGAA 
ACTTTTTGAA 
ACTTTTTGAA 
ACTTTTTGAA 
ACTTTTTGAA 
ACTTTTTGAA 
ACTTTTTGAA 
ACTTTTTGAA 
ACTTTTTGAA 



msa277466.2{330_090; 
msa277466.2{330_JM9130013 i 
msa277466.2{330_18RS21 
msa277466.2f330_2603 
tnsa277466.2{330_A909 
msa277466 . 2 { 33 0_H36B 
msa277466 . 2 {330_CJB110 
msa277466 . 2 { 33 0_COH1 
tnsa277466 . 2 {330_M732 
msa277466.2{330_1169NT 
msa277466.2{330_M781 
Consensus 



301 

GATGGTtCAG 
GATGGTtCAG 
GATGGTgCAG 
GATGGTgCAG 
GATGGTgCAG 
GATGGTgCAG 
GATGGTgCAG 
GATGGTgCAG 
GATGGTgCAG 
GATGGTgCAG 
GATGGTgCAG 



ATTTCCATTC 
ATTTCCATTC 
ATTTCCATTC 
ATTTCCATTC 
ATTTCCATTC 
ATTTCCATTC 
ATTTCCATTC 
ATTTCCATTC 
ATTTCCATTC 
ATTTCCATTC 
ATTTCCATTC 



ATATACAACA 
ATATACAACA 
ATATACAACA 
ATATACAACA 
ATATACAACA 
ATATACAACA 
ATATACAACA 
ATATACAACA 
ATATACAACA 
ATATACAACA 
ATATACAACA 



GGTACAgAAT 
GGTACAaAAT 
GGTACAaAAT 
GGTACAaAAT 
GGTACAaAAT 
GGTACAaAAT 
GGTACAaAAT 
GGTACAaAAT 
GGTACAaAAT 
GGTACAaAAT 
GGTACAaAAT 



350 

TACGTGTTGC 
TACGTGTTGC 
TACGTGTTGC 
TACGTGTTGC 
TACGTGTTGC 
TACGTGTTGC 
TACGTGTTGC 
TACGTGTTGC 
TACGTGTTGC 
TACGTGTTGC 
TACGTGTTGC 



msa277466.2{330_090 
msa277466.2{330_JM9130013 , 
rasa277466.2{330_18RS21 
insa277466 . 2 { 330_2603 
tnsa277466 .2(33 0_A90 9 
rasa277466 . 2 (330_H36B 
msa277466 . 2 {330_CJB110 
msa277466.2{330 COH1 
msa277466 . 2 { 330^M732 
msa277466.2{330_1169NT 
msa277466.2{330_M781 
Consensus 



351 

TACTAAGCAA 
TACTAAGCAA 
TACTAAGCAA 
TACTAAGCAA 
TACTAAGCAA 
TACTAAGCAA 
TACTAAGCAA 
TACTAAGCAA 
TACTAAGCAA 
TACTAAGCAA 
TACTAAGCAA 



GGTATCAAAT 
GGTATCAAAT 
GGTATCAAAT 
GGTATCAAAT 
GGTATCAAAT 
GGTATCAAAT 
GGTATCAAAT 
GGTATCAAAT 
GGTATCAAAT 
GGTATCAAAT 
GGTATCAAAT 



CAACTCCAGA 
CAACTCCAGA 
CAACTCCAGA 
CAACTCCAGA 
CAACTCCAGA 
CAACTCCAGA 
CAACTCCAGA 
CAACTCCAGA 
CAACTCCAGA 
CAACTCCAGA 
CAACTCCAGA 



AGTGATTGCA 
AGTGATTGCA 
AGTGATTGCA 
AGTGATTGCA 
AGTGATTGCA 
AGTGATTGCA 
AGTGATTGCA 
AGTGATTGCA 
AGTGATTGCA 
AGTGATTGCA 
AGTGATTGCA 



400 

TTGAATGTTG 
TTGAATGTTG 
TTGAATGTTG 
TTGAATGTTG 
TTGAATGTTG 
TTGAATGTTG 
TTGAATGTTG 
TTGAATGTTG 
TTGAATGTTG 
TTGAATGTTG 
TTGAATGTTG 



msa277466 
msa2774 66. 2 (330 
msa2 77466. 2{ 

msa277466. 

msa277466. 

tnsa277466. 
tnsa277466.2{ 

maa277466 

msa277466. 
msa277466.2{ 

msa277466. 



2{330_090 
JM9130013 
330 18RS21 
2{330_2603 
2{330_A909 
2{330_H36B 
330__CJB110 
2(330_COH1 
2{330_M732 
330_1169NT 
2{330_M7B1 
Consensus 



401 

CTGGTGGACT 
CTGGTGGACT 
CTGGTGGACT 
CTGGTGGACT 
CTGGTGGACT 
CTGGTGGACT 
CTGGTGGACT 
CTGGTGGACT 
CTGGTGGACT 
CTGGTGGACT 
CTGGTGGACT 



TGACATCTTT 
TGACATCTTT 
TGACATCTTT 
TGACATCTTT 
TGACATCTTT 
TGACATCTTT 
TGACATCTTT 
TGACATCTTT 
TGACATCTTT 
TGACATCTTT 
TGACATCTTT 



GATGACGTTG 
GATGACGTTG 
GATGACGTTG 
GATGACGTTG 
GATGACGTTG 
GATGACGTTG 
GATGACGTTG 
GATGACGTTG 
GATGACGTTG 
GATGACGTTG 
GATGACGTTG 



AAGTTGGTAA 
AAGTTGGTAA 
AAGTTGGTAA 
AAGTTGGTAA 
AAGTTGGTAA 
AAGTTGGTAA 
AAGTTGGTAA 
AAGTTGGTAA 
AAGTTGGTAA 
AAGTTGGTAA 
AAGTTGGTAA 



450 

GCAAATCCTT 
GCAAATCCTT 
GCAAATCCTT 
GCAAATCCTT 
GCAAATCCTT 
GCAAATCCTT 
GCAAATCCTT 
GCAAATCCTT 
GCAAATCCTT 
GCAAATCCTT 
GCAAATCCTT 



451 



500 



1031 



WO 2004/018646 



PCTYUS2003/026827 



Table 72: Comparative Sequences relating to SAG0941 



msa277466 . 2 {330_090 
msa277466.2{330_JM9130013 
msa277466.2{330_18RS21 
msa277466.2(330_2603 
msa277466. 2(330 A909 
msa277466 . 2 { 330~H36B 
msa277466 . 2 {33O_CJB110 
msa277466 . 2 ( 330_COH1 
msa277466.2{330_M732 
msa277466 . 2 { 330_1169NT 
msa277466.2{330_M781, 
Consensus 



GTTGATGATG 
GTTGATGATG 
GTTGATGATG 
GTTGATGATG 
GTTGATGATG 
GTTGATGATG 
GTTGATGATG 
GTTGATGATG 
GTTGATGATG 
GTTGATGATG 
GTTGATGATG 
********** 



GTAAACTAGG 
GTAAACTAGG 
GTAAACTAGG 
GTAAACTAGG 
GTAAACTAGG 
GTAAACTAGG 
GTAAACTAGG 
GTAAACTAGG 
GTAAACTAGG 
GTAAACTAGG 
GTAAACTAGG 
********** 



TCTTACTGTG 
TCTTACTGTG 
TCTTACTGTG 
TCTTACTGTG 
TCTTACTGTG 
TCTTACTGTG 
TCTTACTGTG 
TCTTACTGTG 
TCTTACTGTG 
TCTTACTGTG 
TCTTACTGTG 
********** 



TTTGCAAAAG 
TTTGCAAAAG 
TTTGCAAAAG 
TTTGCAAAAG 
TTTGCAAAAG 
TTTGCAAAAG 
TTTGCAAAAG 
TTTGCAAAAG 
TTTGCAAAAG 
TTTGCAAAAG 
TTTGCAAAAG 
********** 



ATAAAGACAC 
ATAAAGACAC 
ATAAAGACAC 
ATAAAGACAC 
ATAAAGACAC 
ATAAAGACAC 
ATAAAGACAC 
ATAAAGACAC 
ATAAAGACAC 
ATAAAGACAC 
ATAAAGACAC 
********** 



msa277466 
msa277466.2{330 
msa277466.2{ 

msa277466 

msa2774S6 . 

msa277466. 
msa277466.2{ 

msa277466 . 

msa277466. 
msa277466.2{ 

msa277466 



.2{330_090; 
_JM9130013 
330_18RS21 t 
2(330 2603 
2(330~A909 
2{330_H36B 
330_CJB110 
2{330_COH1 
2{330JM732 
330 1169NT 
2{330_M781 
Consensus 



501 

TCGTGAATTT 
TCGTGAATTT 
TCGTGAATTT 
TCGTGAATTT 
TCGTGAATTT 
TCGTGAATTT 
TCGTGAATTT 
TCGTGAATTT 
TCGTGAATTT 
TCGTGAATTT 
TCGTGAATTT 



GAAGTAGTTG 
GAAGTAGTTG 
GAAGTAGTTG 
GAAGTAGTTG 
GAAGTAGTTG 
GAAGTAGTTG 
GAAGTAGTTG 
GAAGTAGTTG 
GAAGTAGTTG 
GAAGTAGTTG 
GAAGTAGTTG 



TTGAGAATGA 
TTGAGAATGA 
TTGAGAATGA 
TTGAGAATGA 
TTGAGAATGA 
TTGAGAATGA 
TTGAGAATGA 
TTGAGAATGA 
TTGAGAATGA 
TTGAGAATGA 
TTGAGAATGA 



TGGCCTTATT 
TGGCCTTATT 
TGGCCTTATT 
TGGCCTTATT 
TGGCCTTATT 
TGGCCTTATT 
TGGCCTTATT 
TGGCCTTATT 
TGGCCTTATT 
TGGCCTTATT 
TGGCCTTATT 



550 

GGTAAACAAA 
GGTAAACAAA 
GGTAAACAAA 
GGTAAACAAA 
GGTAAACAAA 
GGTAAACAAA 
GGTAAACAAA 
GGTAAACAAA 
GGTAAACAAA 
GGTAAACAAA 
GGTAAACAAA 



msa277466.2{330_090 
msa277466.2{330_JM9130013 
msa277466.2{330 18RS21 
msa277466 . 2 f 3 f 30_2603 
msa277466.2(330_A909 
msa277466.2{330_H36B 
msa277466 . 2 {330_CJB110 
msa27 74 66 .2(33 0_COH1 
msa277466 . 2 { 330_M732 
msa277466 . 2 { 330_1169NT 
msa277466 . 2{330J4781 
Consensus 



551 

AAGGTGTAAA 
AAGGTGTAAA 
AAGGTGTAAA 
AAGGTGTAAA 
AAGGTGTAAA 
AAGGTGTAAA 
AAGGTGTAAA 
AAGGTGTAAA 
AAGGTGTAAA 
AAGGTGTAAA 
AAGGTGTAAA 



CATCCCTTAT 
CATCCCTTAT 
CATCCCTTAT 
CATCCCTTAT 
CATCCCTTAT 
CATCCCTTAT 
CATCCCTTAT 
CATCCCTTAT 
CATCCCTTAT 
CATCCCTTAT 
CATCCCTTAT 



ACTAAAATTC 
ACTAAAATTC 
ACTAAAATTC 
ACTAAAATTC 
ACTAAAATTC 
ACTAAAATTC 
ACTAAAATTC 
ACTAAAATTC 
ACTAAAATTC 
ACTAAAATTC 
ACTAAAATTC 



CTTT CCCAGC 
CTTTCCCAGC 
CTTTCCCAGC 
CTTTCCCAGC 
CTTTCCCAGC 
CTTTCCCAGC 
CTTTCCCAGC 
CTTTCCCAGC 
CTTTCCCAGC 
CTTTCCCAGC 
CTTTCCCAGC 



.600 
ACTTGCAGAA 
ACTTGCAGAA 
ACTTGCAGAA 
ACTTGCAGAA 
ACTTGCAGAA 
ACTTGCAGAA 
ACTTGCAGAA 
ACTTGCAGAA 
ACTTGCAGAA 
ACTTGCAGAA 
ACTTGCAGAA 



msa277466 .2 {330_090 
msa277466 . 2 { 330_JM9130013 ' 
rasa277466.2{330_18RS21 
tnsa277466.2(330_2603 
msa277466.2(330_A909 
msa277466.2{330_H36B 
msa277466.2{330_OJB110 
msa277466 . 2{330_COH1 
msa277466.2{330_M732 
msa277466.2{330 - 1169NT 
msa277466 . 2{330_M781 
Consensus 



601 

CGCGATAATG 
CGCGATAATG 
CGCGATAATG 
CGCGATAATG 
CGCGATAATG 
CGCGATAATG 
CGCGATAATG 
CGCGATAATG 
CGCGATAATG 
CGCGATAATG 
CGCGATAATG 
********** 



CTGATATCCG 
CTGATATCCG 
CTGATATCCG 
CTGATATCCG 
CTGATATCCG 
CTGATATCCG 
CTGATATCCG 
CTGATATCCG 
CTGATATCCG 
CTGATATCCG 
CTGATATCCG 
********** 



TTTTGGACTT 
TTTTGGACTT 
TTTTGGACTT 
TTTTGGACTT 
TTTTGGACTT 
TTTTGGACTT 
TTTTGGACTT 
TTTTGGACTT 
TTTTGGACTT 
TTTTGGACTT 
TTTTGGACTT 
********** 



GAgCAAGGAC 
GAgCAAGGAC 
GAgCAAGGAC 
GAgCAAGGAC 
GAgCAAGGAC 
GAgCAAGGAC 
GAaCAAGGAC 
GAgCAAGGAC 
GAgCAAGGAC 
GAgCAAGGAC 
GAgCAAGGAC 
**_******* 



650 

TTAACTTTAT 
TTAACTTTAT 
TTAACTTTAT 
TTAACTTTAT 
TTAACTTTAT 
TTAACTTTAT 
TTAACTTTAT 
TTAACTTTAT 
TTAACTTTAT 
TTAACTTTAT 
TTAACTTTAT 
********** 



msa277466 
msa277466.2{330 
rasa277466.2{" 

msa277466 . 

rasa277466 . 

mea277466. 
msa277466.2{ 

cnsa277466. 

tnsa277466. 
msa277466.2{ 

msa277466 



2{330_090 
JM9130013 
330_18RS21 
2(330_2603 
2{330_A909 
2(330_H36B 
330 CJB110 
2 { 3 3 0_COH1 
2{330_M732 
330_1169NT 
2{330J4781 
Consensus 



651 

TGCTATCTCA 
TGCTATCTCA 
TGCTATCTCA 
TGCTATCTCA 
TGCTATCTCA 
TGCTATCTCA 
TGCTATCTCA 
TGCTATCTCA 
TGCTATCTCA 
TGCTATCTCA 
TGCTATCTCA 
********** 



TTTGTACGTA 
TTTGTACGTA 
TTTGTACGTA 
TTTGTACGTA 
TTTGTACGTA 
TTTGTACGTA 
TTTGTACGTA 
TTTGTACGTA 
TTTGTACGTA 
TTTGTACGTA 
TTTGTACGTA 
********** 



CTGCTAAAGA 
CTGCTAAAGA 
CTGCTAAAGA 
CTGCTAAAGA 
CTGCTAAAGA 
CTGCTAAAGA 
CTGCTAAAGA 
CTGCTAAAGA 
CTGCTAAAGA 
CTGCTAAAGA 
CTGCTAAAGA 
********** 



TGTTAATGAA 
TGTTAATGAA 
TGTTAATGAA 
TGTTAATGAA 
TGTTAATGAA 
TGTTAATGAA 
TGTTAATGAA 
TGTTAATGAA 
TGTTAATGAA 
TGTTAATGAA 
TGTTAATGAA 
********** 



700 

GTTCGTGCTA 
GTTCGTGCTA 
GTTCGTGCTA 
GTTCGTGCTA 
GTTCGTGCTA 
GTTCGTGCTA 
GTTCGTGCTA 
GTTCGTGCTA 
GTTCGTGCTA 
GTTCGTGCTA 
GTTCGTGCTA 
********** 



msa277466 
rosa277466.2{330 
msa277466.2{ 

msa277466. 

raaa277466 . 

msa277466. 
msa277466.2{ 

msa277466. 

msa277466 
msa277466.2{ 

rasa277466 



2{330_090^ 
JM9130013 
330_18RS21 
2{330_2603 
2(330 A909 
2{330~H36B 
330 CJB110 
2(330 COH1 
2{330~M732 
330_1169NT 
2{330_M781 
Consensus 



701 

TTTGTGAAGA 
TTTGTGAAGA 
TTTGTGAAGA 
TTTGTGAAGA 
TTTGTGAAGA 
TTTGTGAAGA 
TTTGTGAAGA 
TTTGTGAAGA 
TTTGTGAAGA 
TTTGTGAAGA 
TTTGTGAAGA 



AACTGGcaAT 
AACTGGcaAT 
AACTGGcaAT 
AACTGGsmAT 
AACTGGcaAT 
AACTGGcaAT 
AACTGGcaAT 
AACTGGcaAT 
AACTGGcaAT 
AACTGGcaAT 
AACTGGcaAT 



GGACAtGTTA 
GGACAtGTTA 
GGACAcGTTA 
GGACAcGTTA 
GGACAcGTTA 
GGACAcGTTA 
GGACAcGTTA 
GGACAcGTTA 
GGACAcGTTA 
GGACAcGTTA 
GGACACGTTA 



AGTTGTTTGC 
AGTTGTTTGC 
AGTTGTTTGC 
AGTT GTTTG C 
AGTTGTTTGC 
AGTTGTTTGC 
A GTTGTTTG C 
AGTTGTTTGC 
AGTTGTTTGC 
AGTTGTTTGC 
AGTTGTTTGC 



750 

TAAAATTGAA 
TAAAATTGAA 
TAAAATTGAA 
TAAAATTGAA 
TAAAATTGAA 
TAAAATTGAA 
TAAAATTGAA 
TAAAATTGAA 
TAAAATTGAA 
TAAAATTGAA 
TAAAATTGAA 



1032 



WO 2004/018646 



PCT/US2003/026827 



Table 72: Comparative Sequences relating to SAG0941 



msa277466.2{330_090] 
msa277466 . 2 {330_JM9130013 
rasa277466.2{330_18RS21 
msa277466.2{330_2603' 
maa277466.2(330_A909 
raaa277466 . 2 { 330_H36B 
maa2 774 66 . 2 {33 0_CJB11 0 
msa277466. 2(330 COH1 
msa277466.2{330_M732 
msa277466.2{330 1169NT 
msa277466 . 2 { 33* 0_M781 
Consensus 



751 

AATCAACAAG 
AATCAACAAG 
AATCAACAAG 
AATCAACAAG 
AATCAACAAG 
AATCAACAAG 
AATCAACAAG 
AATCAACAAG 
AATCAACAAG 
AATCAACAAG 
AATCAACAAG 



GTATCGATAA 
GTATCGATAA 
GTATCGATAA 
GTATCGATAA 
GTATCGATAA 
GTATCGATAA 
GTATCGATAA 
GTATCGATAA 
GTATCGATAA 
GTATCGATAA 
GTATCGATAA 



TATTGATGAG 
TATTGATGAG 
TATTGATGAG 
TATTGATGAG 
TATTGATGAG 
TATTGATGAG 
TATTGATGAG 
TATTGATGAG 
TATTGATGAG 
TATTGATGAG 
TATTGATGAG 



ATTATCGAAG 
ATTATCGAAG 
ATTATCGAAG 
ATTATCGAAG 
ATTATCGAAG 
ATTATCGAAG 
ATTATCGAAG 
ATTATCGAAG 
ATTATCGAAG 
ATTATCGAAG 
ATTATCGAAG 



800 

CAGCAGATGG 
CAGCAGATGG 
CAGCAGATGG 
CAGCAGATGG 
CAGCAGATGG 
CAGCAGATGG 
CAGCAGATGG 
CAGCAGATGG 
CAGCAGATGG 
CAGCAGATGG 
CAGCAGATGG 



msa277466.2{330 090; 
msa277466 . 2 { 330_JM913 0013 
msa277466 . 2 { 330_18RS21 
maa277466.2{330_2603 
msa2 7 7466 .2(33 0_A90 9 
insa277466 . 2 (330_H36B 
msa277466 . 2 {330_CJB110 
rasa27 74 66 . 2 f 33 0_COH1 
rasa2774 66 .2(33 0 _M73 2 
msa277466.2{330_1169NT 
msa277466.2{330_M781 
Consensus ' 



801 

TATTATGATT 
TATTATGATT 
TATTATGATT 
TATTATGATT 
TATTATGATT 
TATTATGATT 
TATTATGATT 
TATTATGATT 
TATTATGATT 
TATTATGATT 
TATTATGATT 



GCTCGTGGTG 
GCTCGTGGTG 
GCTCGTGGTG 
GCTCGTGGTG 
GCTCGTGGTG 
GCTCGTGGTG 
GCTCGTGGTG 
GCTCGTGGTG 
GCTCGTGGTG 
GCTCGTGGTG 



ATATGGGTAT 
ATATGGGTAT 
ATATGGGTAT 
ATATGGGTAT 
ATATGGGTAT 
ATATGGGTAT 
ATATGGGTAT 
ATATGGGTAT 
ATATGGGTAT 
ATATGGGTAT 
ATATGGGTAT 



CGAAGTTCCA 
CGAAGTTCCA 
CGAAGTTCCA 
CGAAGTTCCA 
CGAAGTTCCA 
CGAAGTTCCA 
CGAAGTTCCA 
CGAAGTTCCA 
CGAAGTTCCA 
CGAAGTTCCA 
CGAAGTTCCA 



850 

TTTGAAATGG 
TTTGAAATGG 
TTTGAAATGG 
TTTGAAATGG 
TTTGAAATGG 
TTTGAAATGG 
TTTGAAATGG 
TTTGAAATGG 
TTTGAAATGG 
TTTGAAATGG 
TTTGAAATGG 



msa277466 . 2 {330_090 
msa277466 . 2 {330_JM9130013 
msa2774 66 . 2 { 33 0_1 8RS2 1 
msa2774 66. 2 ( 33 0_2 603 
tnsa277466 ♦ 2 (33 0_A909 
msa277466.2{330 H36B 
niBa277466 . 2 { 330_QJB110 
msa2 774 66 . 2 {330_COH1 
msa277466.2{330_M732 
msa277466 . 2 {330_1169NT 
msa277466.2{330_M7Bl 
Consensus 



851 

TTCCAGTTTA 
TTCCAGTTTA 
TTCCAGTTTA 
TTCCAGTTTA 
TTCCAGTTTA 
TTCCAGTTTA 
TTCCAGTTTA 
TTCCAGTTTA 
TTCCAGTTTA 
TTCCAGTTTA 
TTCCAGTTTA 



CCAAAAAATG 
CCAAAAAATG 
CCAAAAAATG 
CCAAAAAATG 
CCAAAAAATG 
CCAAAAAATG 
CCAAAAAATG 
CCAAAAAATG 
CCAAAAAATG 
CCAAAAAATG 
CCAAAAAATG 



ATCATTACTA 
ATCATTACTA 
ATCATTACTA 
ATCATTACTA 
ATCATTACTA 
ATCATTACTA 
ATCATTACTA 
ATCATTACTA 
ATCATTACTA 
ATCATTACTA 
ATCATTACTA 



AAGTTAATGC 
AAGTTAATGC 
AAGTTAATGC 
AAGTTAATGC 
AAGTTAATGC 
AAGTTAATGC 
AAGTTAATGC 
AAGTTAATGC 
AAGTTAATGC 
AAGTTAATGC 
AAGTTAATGC 



900 

AGCTGGTAAA 
AGCTGGTAAA 
AGCTGGTAAA 
AGCTGGTAAA 
AGCTGGTAAA 
AGCTGGTAAA 
AGCTGGTAAA 
AGCTGGTAAA 
AGCTGGTAAA 
AGCTGGTAAA 
AGCTGGTAAA 



msa277466 
tnsa277466.2{330 

msa277466.2{ 
msa277466 
msa277466. 
msa277466 

msa27 74 66. 2 { 
msa277466 
rasa277466 

msa277466.2{ 
msa277466 



.2{330_090" 
JM9130013 
330_18RS21 
2{330_2603 
2<330_A909 
2{330_H36B 
330J3JB110 
2{330_C0H1 
2{330_M732 
330_1169NT 
2{330_M781 
Consensus 



901 

GCAGTTATTA 
GCAGTTATTA 
GCAGTTATTA 
GCAGTTATTA 
GCAGTTATTA 
GCAGTTATTA 
GCAGTTATTA 
GCAGTTATTA 
GCAGTTATTA 
GCAGTTATTA 
GCAGTTATTA 



CAGCAACAAA 
CAGCAACAAA 
CAGCAACAAA 
CAGCAACAAA 
CAGCAACAAA 
CAGCAACAAA 
CAGCAACAAA 
CAGCAACAAA 
CAGCAACAAA 
CAGCAACAAA 
CAGCAACAAA 



TATGCTTGAA 
TATGCTTGAA 
TATGCTTGAA 
TATGCTTGAA 
TATGCTTGAA 
TATGCTTGAA 
TATGCTTGAA 
TATGCTTGAA 
TATGCTTGAA 
TATGCTTGAA 
TATGCTTGAA 



ACAATGACTG 
ACAATGACTG 
ACAATGACTG 
ACAATGACTG 
ACAATGACTG 
ACAATGACTG 
ACAATGACTG 
ACAATGACTG 
ACAATGACTG 
ACAATGACTG 
ACAATGACTG 



950 

ATAAACCACG 
ATAAACCACG 
ATAAACCACG 
ATAAACCACG 
ATAAACCACG 
ATAAACCACG 
ATAAACCACG 
ATAAACCACG 
ATAAACCACG 
ATAAACCACG 
ATAAACCACG 



msa277466 
msa277466.2{330 

msa277466.2{ 
msa277466 
msa277466 
msa277466 

msa277466.2{ 
rosa277466. 
msa277466 

msa277466.2{ 
msa277466 



2{330_090| 
_JM9 130013 
330 18RS21 
2(330_2603 
2{330_A909 
2{330_H36B 
330__CJB110 
2(330 COH1 
2{3303l732 
330 1169NT 
2{3?0_M781 
Consensus 



951 

TGCGACTCGT 
TGCGACTCGT 
TGCGACTCGT 
TGCGACTCGT 
TGCGACTCGT 
TGCGACTCGT 
TGCGACTCGT 
TGCGACTCGT 
TGCGACTCGT 
TGCGACTCGT 
TGCGACTCGT 



TCAGAAGTAT 
TCAGAAGTAT 
TCAGAAGTAT 
TCAGAAGTAT 
TCAGAAGTAT 
TCAGAAGTAT 
TCAGAAGTAT 
TCAGAAGTAT 
TCAGAAGTAT 
TCAGAAGTAT 
TCAGAAGTAT 



CTGATGTCTT 
CTGATGTCTT 
CTGATGTCTT 
CTGATGTCTT 
CTGATGTCTT 
CTGATGTCTT 
CTGATGTCTT 
CTGATGTCTT 
CTGATGTCTT 
CTGATGTCTT 
CTGATGTCTT 



CAATGCTGTT 
CAATGCTGTT 
CAATGCTGTT 
CAATGCTGTT 
CAATGCTGTT 
CAATGCTGTT 
CAATGCTGTT 
CAATGCTGTT 
CAATGCTGTT 
CAATGCTGTT 
CAATGCTGTT 



1000 
ATTGATGGTA 
ATTGATGGTA 
ATTGATGGTA 
ATTGATGGTA 
ATTGATGGTA 
ATTGATGGTA 
ATTGATGGTA 
ATTGATGGTA 
ATTGATGGTA 
ATTGATGGTA 
ATTGATGGTA 



rasa277466 . 2 { 330_090 ' 
msa2774 66 . 2 { 33 0_JM9130013 
msa277,466.2{330 18RS21 
msa277466.2(330 2603 
tnsa277466.2(330""A909 
msa277466 . 2 { 33 0~H36B 
nisa277466 . 2 { 330_CJB110 
msa277466 . 2 ( 330__COH1 
msa277466 . 2 { 33 0_«732 
msa277466 ,2{330_1169NT 
msa277466.2{330_M781 
Consensus 



1001 

CTGATGCTAC 
CTGATGCTAC 
CTGATGCTAC 
CTGATGCTAC 
CTGATGCTAC 
CTGATGCTAC 
CTGATGCTAC 
CTGATGCTAC 
CTGATGCTAC 
CTGATGCTAC 
CTGATGCTAC 



AATGCTTTCA 
AATGCTTTCA 
AATGCTTTCA 
AATGCTTTCA 
AATGCTTTCA 
AATGCTTTCA 
AATGCTTTCA 
AATGCTTTCA 
AATGCTTTCA 
AATGCTTTCA 
AATGCTTTCA 



GGTGAGTCAG 
GGTGAGTCAG 
GGTGAGTCAG 
GGTGAGTCAG 
GGTGAGTCAG 
GGTGAGTCAG 
GGTGAGTCAG 
GGTGAGTCAG 
GGTGAGTCAG 
GGTGAGTCAG 
GGTGAGTCAG 



CTAATGGTAA 
CTAATGGTAA 
CTAATGGTAA 
CTAATGGTAA 
CTAATGGTAA 
CTAATGGTAA 
CTAATGGTAA 
CTAATGGTAA 
CTAATGGTAA 
CTAATGGTAA 
CTAATGGTAA 



1050 
ATACCCAGTT 
ATACCCAGTT 
ATACCCAGTT 
ATACCCAGTT 
ATACCCAGTT 
ATACCCAGTT 
ATACCCAGTT 
ATACCCAGTT 
ATACCCAGTT 
ATACCCAGTT 
ATACCCAGTT 



1033 



WO 2004/018646 



PCTYUS2003/026827 



Table 72: Comparative Sequences relating t SAG0941 



msa2774S6 
msa277466.2{330 
msa277466.2{ 

maa277466 . 

msa277466 . 

msa2 7 74 66. 
msa277466.2{ 

msa277466 . 

msa277466. 
msa277466.2{ 

msa277466 



2{330 090 
JM9130013 
330_18RS21 
2{330_2603 
2(330 A909 
2(330~H36B 
330 CJB110 
2 f 3 3 0_COH1 
2{330_M732 
330_1169NT 
2{330_M7B1 
Consensus 



1051 

GAGTCAGTTC 
GAGTCAGTTC 
GAGTCAGTTC 
GAGTCAGTTC 
GAGTCAGTTC 
GAGTCAGTTC 
GAGTCAGTTC 
GAGTCAGTTC 
GAGTCAGTTC 
GAGTCAGTTC 
GAGTCAGTTC 



GTACAATGGC 
GTACAATGGC 
GTACAATGGC 
GTACAATGGC 
GTACAATGGC 
GTACAATGGC 
GTACAATGGC 
GTACAATGGC 
GTACAATGGC 
GTACAATGGC 
GTACAATGGC 



TACTATTGAT 
TACTATTGAT 
TACTATTGAT 
TACTATTGAT 
TACTATTGAT 
TACTATTGAT 
TACTATTGAT 
TACTATTGAT 
TACTATTGAT 
TACTATTGAT 
TACTATTGAT 



AAAAATGCTC 
AAAAATGCTC 
AAAAATGCTC 
AAAAATGCTC 
AAAAATGCTC 
AAAAATGCTC 
AAAAATGCTC 
AAAAATGCTC 
AAAAATGCTC 
AAAAATGCTC 
AAAAATGCTC 



1100 
AAACATTACT 
AAACATTACT 
AAACATTACT 
AAACATTACT 
AAACATTACT 
AAACATTACT 
AAACATTACT 
AAACATTACT 
AAACATTACT 
AAACATTACT 
AAACATTACT 



msa277466.2{330 090 
tnsa277466 . 2 { 330_JM9130t)13 ' 
msa277466 . 2 { 33 0 JL8RS2 1 
msa277466 . 2 f 330_2603 
msa277466.2(330_A909 
msa277466 . 2 { 33 0_H36B 
msa277466.2{330 CJB110 
maa27 74 66 . 2 ( 330_COH1 
msa277466 . 2{330_M732 
msa277466 . 2 { 330_1169NT 
msa277466.2{330_M781 
Consensus 



1101 

CAATGAGTAT 
CAATGAGTAT 
CAATGAGTAT 
CAATGAGTAT 
CAATGAGTAT 
CAATGAGTAT 
CAATGAGTAT 
CAATGAGTAT 
CAATGAGTAT 
CAATGAGTAT 
CAATGAGTAT 



GGTCGcTTAG 
GGTCGcTTAG 
GGTCGcTTAG 
GGTCGcTTAG 
GGTCGcTTAG 
GGTCGcTTAG 
GGTCGcTTAG 
GGTCGcTTAG 
GGTCGcTTAG 
GGTCGtTTAG 
GGTCGcTTAG 



ACTCATCTGC 
ACTCATCTGC 
ACTCATCTGC 
ACTCATCTGC 
ACTCATCTGC 
ACTCATCTGC 
ACTCATCTGC 
ACTCATCTGC 
ACTCATCTGC 
ACTCATCTGC 
ACTCATCTGC 



ATTCCCACGT 
ATTCCCACGT 
ATTCCCACGT 
ATTCCCACGT 
ATTCCCACGT 
ATTCCCACGT 
ATTCCCACGT 
ATTCCCACGT 
ATTCCCACGT 
ATTCCCACGT 
ATTCCCACGT 



1150 
AATAACAAAA 
AATAACAAAA 
AATAACAAAA 
AATAACAAAA 
AATAACAAAA 
AATAACAAAA 
AATAACAAAA 
AATAACAAAA 
AATAACAAAA 
AATAACAAAA 
AATAACAAAA 



rasa277466.2{330_090) 
msa277466.2(330_0M9130013j 
msa2774 66 . 2 { 3 3 0_18RS2 1 } 
msa2774 66 . 2 { 33 0_2603 ] 
msa277466.2{330_A909 
rasa277 4 66 . 2 { 33 0_H3 6B 
msa277466 . 2 { 33 0_CJB110 
msa27 74 66 . 2 { 330_COH1 
msa277466 . 2 { 330_M732 
msa277466.2{330_1169NT 
msa277466.2{330_M78i; 

Consensus 



1151 

CTGATGTTAT 
CTGATGTTAT 
CTGATGTTAT 
CTGATGTTAT 
CTGATGTTAT 
CTGATGTTAT 
CTGATGTTAT 
CTGATGTTAT 
CTGATGTTAT 
CTGATGTTAT 
CTGATGTTAT 



TGCATCTGCG 
TGCATCTGCG 
TGCATCTGCG 
TGCATCTGCG 
TGCATCTGCG 
TGCATCTGCG 
TGCATCTGCG 
TGCATCTGCG 
TGCATCTGCG 
TGCATCTGCG 
TGCATCTGCG 



GTTAAAGATG 
GTTAAAGATG 
GTTAAAGATG 
GTTAAAGATG 
GTTAAAGATG 
GTTA AAGATG 
GTTAAAGATG 
GTTAAAGATG 
GTTAAAGATG 
GTTAAAGATG 
GTTAAAGATG 



CAACACACTC 
CAACACACTC 
CAACACACTC 
CAACACACTC 
CAACACACTC 
CAACACACTC 
CAACACACTC 
CAACACACTC 
CAACACACTC 
CAACACACTC 
CAACACACTC 



1200 
AATGGATATC 
AATGGATATC 
AATGGATATC 
AATGGATATC 
AATGGATATC 
AATGGATATC 
AATGGATATC 
AATGGATATC 
AATGGATATC 
AATGGATATC 
AATGGATATC 



raaa277466.2{330_090 
msa277466.2{330_JM9130013 
msa277466 . 2 { 330_18RS21 
rasa277466 . 2{330_2603 
nisa277466 .2(33 0_A909 
rasa277466 . 2 ( 3 3 0_H3 6B 
rosa2 77466 .2(330 CJB110 
msa277466.2{330_COHl" 
msa277466 . 2{330Ji1732 
msa277466 .2(33 0_1169NT 
msa277466.2{330_M781 
Consensus 



1201 

AAACTTGTTG 
AAACTTGTTG 
AAACTTGTTG 
AAACTTGTTG 
AAACTTGTTG 
AAACTTGTTG 
AAACTTGTTG 
AAACTTGTTG 
AAACTTGTTG 
AAACTTGTTG 
AAACTTGTTG 



TgACAATTAC 
TgACAATTAC 
TaACAATTAC 
TaACAATTAC 
TaACAATTAC 
TaACAATTAC 
TaACAATTAC 
TaACAATTAC 
TaACAATTAC 
TaACAATTAC 
TaACAATTAC 



TGAAACAGGT 
TGAAACAGGT 
TGAAACAGGT 
TGAAACAGGT 
TGAAACAGGT 
TGAAACAGGT 
TGAAACAGGT 
TGAAACAGGT 
TGAAACAGGT 
TGAAACAGGT 
TGAAACAGGT 



AATACAGCTC 
AATACAGCTC 
AATACAGCTC 
AATACAGCTC 
AATACAGCTC 
AATACAGCTC 
AATACAGCTC 
AATACAGCTC 
AATACAGCTC 
AATACAGCTC 
AATACAGCTC 



1250 
GTGCCATTTC 
GTGCCATTTC 
GTGCCATTTC 
GTGCCATTTC 
GTGCCATTTC 
GTGCCATTTC 
GTGCCATTTC 
GTGCCATTTC 
GTGCCATTTC 
GTGCCATTTC 
GTGCCATTTC 



msa277466 
rasa277466.2{330 

msa2774 66. 2 { 
maa277466 
ntsa277466 
tnsa277466 

msa277466.2{ 
msa277466 
msa277466 

msa277466.2{ 
msa277466. 



.2(330 090 
_JM913O013 
330_18RS21 
2{330_2603 
2(330_A909 
2(330_H36B 
330_CJB110 
2{330_COH1 
2(330_M732 
330_1169NT 
2{330_M781 
Consensus 



1251 

TAAaTTCCGT 
TAAaTTCCGT 
TAAaTTCCGT 
TAAaTTCCGT 
TAAaTTCCGT 
TAAaTTCCGT 
TAAaTTCCGT 
TAAaTTCCGT 
TAAaTTCCGT 
TAAaTTCCGT 
TAAgTTCCGT 



CCAGATGCAG 
CCAGATGCAG 
CCAGATGCAG 
CCAGATGCAG 
CCAGATGCAG 
CCAGATGCAG 
CCAGATGCAG 
CCAGATGCAG 
CCAGATGCAG 
CCAGATGCAG 
CCAGATGCAG 



ACATTTTGGC 
ACATTTTGGC 
ACATTTTGGC 
ACATTTTGGC 
ACATTTTGGC 
ACATTTTGGC 
ACATTTTGGC 
ACATTTTGGC 
ACATTTTGGC 
ACATTTTGGC 
ACATTTTGGC 



TGTTACATTT 
TGTTACATTT 
TGTTACATTT 
TGTTACATTT 
TGTTACATTT 
TGTTACATTT 
TGTTACATTT 
TGTTAC ATTT 
TGTTACATTT 
TGTTACATTT 
TGTTACATTT 



1300 
GATGAAAAAG 
GATGAAAAAG 
GATGAAAAAG 
GATGAAAAAG 
GATGAAAAAG 
GATGAAAAAG 
GATGAAAAAG 
GATGAAAAAG 
GATGAAAAAG 
GATGAAAAAG 
GATGAAAAAG 



msa277466.2{330 090 
msa277466.2{330_JM9130013 

msa277466 .2 { 330_18RS21 
msa277466 . 2 { 330_2603 
msa277466.2{330 A909 
maa277466 . 2 ( 33 0_H36B 

msa277466.2{330_CJB110 
msa2 774 66 . 2 { 33 0_COH1 
msa277466 . 2(330J4732 

msa277466.2{330_1169NT 
msa277466 . 2 { 330_M781 



1301 

TACAACGTTC 
TACAACGTTC 
TACAACGTTC 
TACAACGTTC 
TACAACGTTC 
TACAACGTTC 
TACAACGTTC 
TACAACGTTC 
TACAACGTTC 
TACAACGTTC 
TACAACGTTC 



ATTGATGATT 
ATTGATGATT 
ATTGATGATT 
ATTGATGATT 
ATTGATGATT 
ATTGATGATT 
ATTGATGATT 
ATTGATGATT 
ATTGATGATT 
ATTGATGATT 
ATTGATGATT 



AACTGGGGTG 
AACTGGGGTG 
AACTGGGGTG 
AACTGGGGTG 
AACTGGGGTG 
AACTGGGGTG 
AACTGGGGTG 
AACTGGGGTG 
AACTGGGGTG 
AACTGGGGTG 
AACTGGGGTG 



TTATCCCTGT 
TTATCCCTGT 
TTATCCCTGT 
TTATCCCTGT 
TTATCCCTGT 
TTATCCCTGT 
TTATCCCTGT 
TTATCCCTGT 
TTATCCCTGT 
TTATCCCTGT 
TTATCCCTGT 



1350 
CCTTGCAGAC 
CCTTGCAGAC 
CCTTGCAGAC 
CCTTGCAGAC 
CCTTGCAGAC 
CCTTGCAGAC 
CCTTGCAGAC 
CCTTGCAGAC 
CCTTGCAGAC 
CCTTGCAGAC 
CCTTGCAGAC 
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Consensus 



msa277466. 2 { 330_090 ! 
msa277466 . 2 (330_JM9130013 
msa277466.2{330_18RS21 
msa277466 . 2 { 330_26O3 
msa277466 . 2 j 330_A909 
msa277466 . 2 { 330_H36B 
msa277466 . 2 {330_CJB110 
msa277466 . 2 ( 330_C0H1 
msa277466.2{330_M732 
msa277466 . 2 { 330_1169NT 
msa277466.2{330_M781 
Consensus 



1351 

AAACCAGCAT 
AAACCAGCAT 
AAACCAGCAT 
AAACCAGCAT 
AAACCAGCAT 
AAACCAGCAT 
AAACCAGCAT 
AAACCAGCAT 
AAACCAGCAT 
AAACCAGCAT 
AAACCAGCAT 



CTACAGATGA 
CTACAGATGA 
CTACAGATGA 
CTACAGATGA 
CTACAGATGA 
CTACAGATGA 
CTACAGATGA 
CTACAGATGA 
CTACAGATGA 
CTACAGATGA 
CTACAGATGA 



TATGTTTGAG 
TATGTTTGAG 
TATGTTTGAG 
TATGTTTGAG 
TATGTTTGAG 
TATGTTTGAG 
TATGTTTGAG 
TATGTTTGAG 
TATGTTTGAG 
TATGTTTGAG 
TATGTTTGAG 



GTTGCAGAAC 
GTTGCAGAAC 
GTTGCAGAAC 
GTTGCAGAAC 
GTTGCAGAAC 
GTTGCAGAAC 
GTTGCAGAAC 
GTTGCAGAAC 
GTTGCAGAAC 
GTTGCAGAAC 
GTTGCAGAAC 



.1400 
GTGTAGCACT 
GTGTAGCACT 
GTGTAGCACT 
GTGTAGCACT 
GTGTAGCACT 
GTGTAGCACT 
GTGTAGCACT 
GTGTAGCACT 
GTGTAGCACT 
GTGTAGCACT 
GTGTAGCACT 



msa277466 
msa2774 66. 2 {330 

msa277466.2{* 
msa277466 
msa277466. 
msa277466 

msa277466.2{ 
tnsa277466 
msa277466. 

msa277466.2{ 
msa277466. 



2{330_090 
_JM9130013 
330_18RS21 
2{330_2603 
2{330_A909 
2{330_H36B 
330_CJB110 
2(330 COH1 
2{330~M732 
330_1169NT 
2{330_M781 
Consensus 



msa277466. 2 { 330^090 ] 
msa277466.2{330_JM9130013 i 
msa277466 . 2 {330_18RS21 
msa277466 . 2 ( 330_2603 
msa277466.2(330_A909 
msa27 74 66 . 2 { 33 0_H3 6B 
msa277466.2{330_CJB110 
msa277466 . 2 { 33 0_COH1 
msa277466.2{330_M732 
msa2 77 4 66 . 2 { 330_1169NT 
msa277466 . 2{330_M781 
Consensus 



1401 

TGAAGCAGGA 
TGAAGCAGGA 
TGAAGCAGGA 
TGAAGCAGGA 
TGAAGCAGGA 
TGAAGCAGGA 
TGAAGCAGGA 
TGAAGCAGGA 
TGAAGCAGGA 
TGAAGCAGGA 
TGAAGCAGGA 



CTTGTTGAAT 
CTTGTTGAAT 
tTTGTTGAAT 
tTTGTTGAAT 
tTTGTTGAAT 
tTTGTTGAAT 
tTTGTTGAAT 
CTTGTTGAAT 
CTTGTTGAAT 
CTTGTTGAAT 
CTTGTTGAAT 



CAGGCGATAA 
CAGGCGATAA 
CAGGCGATAA 
CAGGCGATAA 
CAGGCGATAA 
CAGGCGATAA 
CAGGCGATAA 
CAGGCGATAA 
CAGGCGATAA 
CAGGCGATAA 
CAGGCGATAA 



TATCGTTATC 
TATCGTTATC 
TATCGTTATC 
TATCGTTATC 
TATCGTTATC 
TATCGTTATC 
TATCGTTATC 
TATCGTTATC 
TATCGTTATC 
TATCGTTATC 
TATCGTTATC 



1450 
GTTGCAGGTG 
GTTGCAGGTG 
GTTGCAGGTG 
GTTGCAGGTG 
GTTGCAGGTG 
GTTGCAGGTG 
GTTGCAGGTG 
GTTGCAGGTG 
GTTGCAGGTG 
GTTGCAGGTG 
GTTGCAGGTG 



1451 

TTCCTGTAGG 
TTCCTGTAGG 
TTCCTGTAGG 
TTCCTGTAGG 
TTCCTGTAGG 
TTCCTGTAGG 
TTCCTGTAGG 
TTCCTGTAGG 
TTCCTGTAGG 
TTCCTGTAGG 
TTCCTGTAGG 



TACAGGTGGA 
TACAGGTGGA 
TACAGGTGGA 
TACAGGTGGA 
TACAGGTGGA 
TACAGGTGGA 
TACAGGTGGA 
TACAGGTGGA 
TACAGGTGGA 
TACAGGTGGA 
TACAGGTGGA 



ACTAACACAA 
ACTAACACAA 
ACTAACACAA 
ACTAACACAA 
ACTAACACAA 
ACTAACACAA 
ACTAACACAA 
ACTAACACAA 
ACTAACACAA 
ACTAACACAA 
ACTAACACAA 



TGCGTGTTCG 
TGOGTGTTCG 
TGCGTGTTCG 
TGCGTGTTCG 
TGCGTGTTCG 
TGCGTGTTCG 
TGCGTGTTCG 
TGCGTGTTCG 
TGCGTGTTCG 
TGCGTGTTCG 
TGCGTGTTCG 



1500 
TACTGTTAAA 
TACTGTTAAA 
TACTGTTAAA 
TACTGTTAAA 
TACTGTTAAA 
TACTGTTAAA 
TACTGTTAAA 
TACTGTTAAA 
TACTGTTAAA 
TACTGTTAAA 
TACTGTTAAA 



SEQ ID NO. 7212 
STRAIN 2603 frame: 1 

MNKRVKI VATLG PAVE FRGG KKFGE SG YWGES LDVEASAEKI AQL IKEGANVFRFNFSHG 
DHAEOX3ARMATVRKAEEIAGQKVGPLLDTKGPBIRTEL 

GI KSTPBVI ALNVAGGLDI FDDVEVGKQI LVDDGKLGLTWAKDKDTREFEVVVENDGL I 
GKQKGVN I PYTKI P FPAIiAERDNAD I RFGLEQGLNF I AI SPVRTAKDVNEVRAI CEETGX 
GHVKLFAKIENQQGIDNIDEI IEAADGIMIARGDMGIEVPFEMVPVYQKMI ITKVNAAGK 
AVI TATNMLETMTDKPRATRSEVSD VFNAV I DGTDATMLSGESANGKYP VBS VRTMAT I D 
KNAOTLLNEYGRIJDSSAFPRKNICITJVIASAVKDATHS^ 

PDADI LAVTFDEKVQRSLMI NWGVI PVLADKPASTDDMFEVABRVALEAGFVBSGDNI VI 
VAGVPVGTGGTNTMRVRTVK 



SEQ ZD NO. 7213 
STRAIN 090 frame: 1 

NKRVKI VATLG PAVE FRGG KKFGESGYVJGE SLD VEASAEKIAQL I KEGANVFRFNF S HGD 

HAEQGARMATVRKAEEIAGQKVGFLLDTKGPE IRTELFEDGSDFHSYTTC 

I KSTPBVIALNVAGGLDI FDDVEVGKQI LVDDGKIX-&TVFAKDKDTREFEVVVENDGLI G 

KQKGVNI PYTKI P FPAIiAERDNAD I RFGLEQGLNF I AI SFVRTAKDVNEVRAI CEETGNG 

HVKLFAKI BNQQGIDNI DB I IEAADGIMIARGDMGIEVPFEMVPVYQKMI ITKVNAAGKA 

VITATNMLETWTDKPRATRSBVSDVFHAVIDGTO^ 

NAQTTiLNF^GRLDSSAFPRNNKTDVIASAVKDATO 

DADI LAVTFDEKVQRSLMINWGVI PVLADKPASTDDMFEVAERVALEAGLVESGDNiyiV 
AGVPVGTGGTNTMRVRTVK 

SEQ ZD NO. 7214 
STRAIN A909 frame: 1 

NKRVKI VATLGPAVEFRGGKKFXSESGYWGESIiDVBASAEKIAQLI KEGANVFRFNFSHGD 
HAEQGARMATVRKAEB IAGQKVGFIiLDTKGPB I RTBLFEDGADFHSY TTGT KLRVATKQG 
I KSTPEVIALNVAGGLD I FDD VEVG KQ I LVDDGKLGLTVFAKDKDTREFEVVVENpGLI G 
KQKGVNI PYTKI PFPALAERDNAD I RFGLEQGLNF IAI SFVRTAKDVNEVRAI CEETGNG 
HVKLFAKIENQQGIDNIDEI IEAADGIMIARGDMGIEVPFEMVPVYQKMI ITKVNAAGKA 
VITATNMLETMTDKPRATRSEVSDVFNAVI DGTDATMLSG ESANG KYPVBSVRTMAT I D K 
NAOTT*LNBYGRLDSSAFPRNNKTDVIASAVKDATHSMDI KLVVTITETGNTARAI SKFRP 
DAD I LAVTFDEKVQRSLMI NWGVI PVLADKPASTDDMFEVABRVALEAGFVESGDNI VIV 
AGVPVGTGGTNTMRVRTVK 

SEQ ZD NO. 7215 
STRAIN H36B frame:! 
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NKRVKIVATLGPAVEFRGGKKFGESGYVTCESIJ3VEASAEKIAQLIKEGANVFRFNFSHGD 
HAEQGARMATVRKAEEI AGQKVGPLLDTKGPBI RTELPEDC3ADFHSYTTGTKLRVATKQG 
I KST PEV IALNVAGGLD I FDDVEVGKQ I LVDDGKLGLTVFAKDKDTREFEWVENDGLI G 
KQKGVN I PYTKI P FPALAERDNAD I RFGLEQGLNFIAI SFVRTAKDVNEVRAICEETGNG 
HVKLFAKI ENQQG I DNI DE Z I EAADG I MI ARGDMG I EVP FEMVPVYQKM I ITKVNAAGKA 
VI TATNMLETMTDKPRATRS EVSDV FNAV I DGTDATML S GE S ANG KYPVE S VRTMAT I DK 
NAQTLLNEYGRLDS S APPRNNKTD V I ASAVKDATH SMD I KLWT I TETGNTARA I SKFRP 
DAD I LAVTFDEKVQRSLM I NWG VT P VLAD KPASTDDM FEVAER VALEAG FVE SGDN I VI V 
AGVPVGTGGTNTMRVRTVK 

SEQ ID NO. 7216 
STRAIN 18RS21 frame: 1 

bnCRVKIVATIjGPAVEFRGGKKFGESGYWGESIjDVEASAEKIAQLIKEGANVFllFNFSHGD 
HAEQGARMATVRKAEE I AGQKVGFLLDTKG PE I RTEL FEDGADFH S YTTGTKLRVATKQG 
I KSTPEV I ALNVAGGLD I FDDVEVG KQ I LVDDGKIX3LTVFAKDKDTRE FEVVVENDGL I G 
KQKGVN I PYTKI PFPALAERDNAD I RFGLEQGLNF IAI SFVRTAKDVNEVRAICEETGNG 
HVKLFAKI ENQQG I DNI DEI I EAADGI MI ARGDMG I EVP FEMVPVYQKM I ITKVNAAGKA 
VI TATNMLETMTDKPRATRS EVSDVFNAV I DGTDATMLSGESANGKY PVE SVRTMAT I DK 
NAQTLLNEYGRLDSSAFPRNNKTD V I AS AVKDATHSMD I KLWT I TETGNTARAI SKFRP 
DADILAVTFDEKVQRSLMINWGVIPVIJ^KPASTDDMFEVAERVAIiEAGFVESGDNIVIV 
AGVPVGTGGTNTMRVRTVK 

SEQ ZD NO. 7217 
STRAIN M732 frame: 1 

NKRVKI VATLGPAVEFRGGKKFGESGYWGESLDVEASAEKI AQL I KEGANVFRFNFSHGD 
HAEQGARMATVRKAEEI AGQKVGFLLDTKGPE I RTELFEDGADFHSYTTGTKLRVATKQG 
I KSTPEVI ALNVAGGLD I FDDVEVGKQ I L VDDGKLGLTVFAKDKDTRE FEVVVENDGL I G 
KQKGVNI PYTKI PFPALAERDNAD I RFGLEQC3LNFI AI SFVRTAKDVNEVRAI CEETGNG 
HVKLFAKI ENQQG I DNI DEI I EAADGI MI ARGDMG I EVP FEMVPVYQKM I ITKVNAAGKA 
VITATNMLETMTDKPRATRSEVSDVFTIAVIDGTDATM 

NAGTLLNEYGRLDSaAFPRNNKTDVIASAVKDATHSMDIKLVV^ SKFRP 
DADI LAVTFDEKVQRSLMINWGV I PVLADKPASTDDMFEVAERVALEAGLVESGDNI VI V 



SEQ ZD NO. 72X8 
STRAIN COH1 frame: 1 

NKRVKI VATLGPAVEFRGGKKFGESGYWGESLDVEASAEKIAQLIKEGANVFRFNFSHGD 
HAEQGARMATVRKAEE I AGQKVGFLLDTKG PE I RTELFEDGADFHSYTTGTKLRVATKQG 
IKSTPEVIALNVAGGLDIFDDVEVGKQILVDDGKLGLTVFAKDKDTR^ 
KQKGVNI PYTKI PFPALAERDNAD I RFGLEQGLNFIAI S FVRTAKDVNEVRA I CEETGNG 
HVKLFAKI ENQQG I DNI DE 1 1 EAADGI M I ARGDMG I EVP FEMVPVYQKM I ITKVNAAGKA 
VITATNMLETMTDKPRATRS EVSDVFNAV I DGTDATMLSGESANG KY PVE SVRTMAT I DK 
NAQTLLNEYGRLDS SAFPRNNKTDVI ASAVKDATHSMD I KLWT I TETGNTARAI SKFRP 
DADI IAVTFDEKVQRSLM INWGVI P VLADKPASTDDM FEVAERVALEAGL VESGDNI VI V 
AGVPVGTGGTNTMRVRTVK 

SEQ ZD NO. 7219 
STRAIN M781 frame: 1 

NKRVKI VATLGPAVE FRGGKKFGESGYWGE SLDVRASAE KI AQL I KEGANVFRFNFSHGD 
HAEC<3ARMATVRKAEEI AGQKVGFLLDTKG PEIRTELFEDGA^ 

I KSTPEVIALNVAGGLD I FDDVEVGKQ I L VDDGKLGLTVFAKDKI>TRE FEVWENDGLI G 
KQKGVNI PYTKI PFPALAERDNAD I RFGLEQGLNF IAI SFVRTAKDVNEVRAICEETGNG 
HVKLFAKIENQQGIDNIDEI I EAADGIMIARGDMGIEVPFEMVPVYQKMI ITKVNAAGKA 
VITATNMLETMTDKPRATRSEVSDVFNAVI DGTDATMLSGESANGKY PVE SVRTMAT I DK 
NAQTLLNEYGRLDS SAFPRNNKTDVIASAVKDATHSMDI KLWT I TETGNTARAI SKFRP 
DADILAVTFDEKVQRSLMINWGVI PVLAD KPASTDDM FE VAERVALEAGL VE SGDN I VI V 
AGVPVGTGGTNTMRVRTVK 

SEQ ZD NO. 7220 
STRAIN CJB1 10 frame: 1 

NKRVKI VATLGPAVE FRGGKKFGE SG YWGESLDVEASAE KI AQL I KEGANVFRFNFSHGD 
HAEQGARMATVRKAEEI AGQKVGFLLDTKG PE I RTEL FEDGADFHSYTTGTKLRVATKQG 
I KSTPEVIALNVAGGLD I FDDVEVGKQ I L VDDGKLGLTVFAKDKDTRE FEVVVENDGL I G 
KQKGVNI PYTKI PFPALAERDNAD I RFGLEQGLNFIAI S FVRTAKDVNEVRAI CEETGNG 
HVKLFAKIENQQGIDNIDEI I EAADG I M I ARGDMG I EVP FEMVPVYQKM I ITKVNAAGKA 
VITATNMLETMTDKPRATRSEVSDVFNAVI DGTDATMIjSGES IDK 
NAQTLLNEYGRLDS SAF PRNNKTD V I ASAVKDATHSMD I KLWT ITETGNTARAI SKFRP 
DADILAVTFDEKVQRSLMINWGVI PVLAD KPASTDDM FEVAERV^^ 
AGVPVGTGGTNTMRVRTVK 

SEQ ZD NO. 7221 

STRAIN 1169NT frame: 1 

NKRVKI VATLGPAVEFRGGKKFGESGYWGESLDVEASAEKIAQLI KEGANVFRFNFSHGD 
HAEQGARMATVRKAEB I AGQKVGFLLDTKGPE I RT 

I KSTPEVIALNVAGGLD I FDDVEVGKQ I LVDDG KLGLTVFAKDKDTRE FEVVVENDGL I G 
KQKGVNI PYTKI PFPALAERDNAD I RFGLEQGLNF IAI S FVRTAKDVNEVRA I CEETGNG 
HVKLFAKIENQQGIDNIDEI I EAADGIMIARGDMGIEVPFEMVPVYQKMI ITKVNAAGKA 
VITATNMLETMTDKPRATRSEVSDVFNAVIDGTDAT^ 

NAQTLLNEYGRLDSSAFPRNNKTDVIASAVKDATHSMDI KLWTI TETGNTARA I SKFRP 
DADILAVTFDEKVQRSLMINWGVI PVLADKPASTDDMFEVAERVALEAGLVESGDNIVIV 
AGVPVGTGGTNTMRVRTVK 
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Table 72: Comparative Sequences relating to SAG0941 . 



SEQ XD NO. 7222 
STRAIN JM9 1300 13 frame: 1 

NKRVKI VATLGPAVE FRGG KKFGE S GYWG E SLDVEAS AEKIAQL I KEGANVFRFNPS HGD 
HAEQGARMATVRKAEEI AGQKVGFLLDTKGPE IRTELFEDGSDFHSYTTGTKLRVATKQG 
I KSTPEVIALNVAGGIiD I FDDVEVGKQ I LVDDGKLGLTVF AKDKDTREFEWVENDGLI G 
KQKGVNI PYTKI PFPALAERDNAD I RFGLEQGLNFI A I S FVRTAKDVNEVRAI CEETGNG 
HVKLFAKI ENQQG I DN I DE 1 1 EAADG I MI ARGDMG I E VPFEMVP VYQKM I ITKVNAAGKA 
VI TATNMIiETMTDKPRATRSEVSDVFNAV I DGTD ATMLSGESANG KY PVESVRTMAT I DK 
NAQTLLNEYGRLDSSAFPRNNKTDVI ASAVKDATHSMD I KLWT I TETGNTARAI S KPRP 
DADI LAVTFDEKVQRSLMINWGVI PVLADKPASTDDM FEVAERVALEAGLVESGDN I VI V 
AGVPVGTGGTNTMRVRTVK 

PRETTY Of i /biotmp/msa277662.2{*} February 24, 2003 01:49 



msa277662.2{330 18RS21 
msa277662 . 2 { 33 0_A90 9 
msa277 6 62 . 2 { 33 0_CJB11 0 
msa277662 . 2 { 330_H36B 
msa277662.2{330_1169NT 
msa277662.2{330_COHl 
msa27 7662 . 2 (33 0_M732 
msa2 7 7662 . 2 { 33 0_M7 8 1 
msa277662.2{330_JM9130013 
rasa277662.2{330_090 
tnsa277662.2{330_2603 
Consensus 



-NKRVKI VAT 
-NKRVKI VAT 
-NKRVKI VAT 
-NKRVKI VAT 
-NKRVKI VAT 
-NKRVKI VAT 
-NKRVKI VAT 
-NKRVKI VAT 
-NKRVKI VAT 
-NKRVKIVAT 
tnNKRVKIVAT 



LG PAVE FRGG 
LGPAVEFRGG 
LG PAVE FRGG 
LG PAVE FRGG 
LGPAVEFRGG 
LG PAVE FRGG 
LGPAVEFRGG 
LGPAVEFRGG 
LGPAVEFRGG 
LGPAVEFRGG 
LGPAVEFRGG 



KKFGESGYWG 
KKFGESGYWG 
KKFGBSGYWG 
KKFGESGYWG 
KKFGESGYWG 
KKFGESGYWG 
KKFGESGYWG 
KKFGESGYWG 
KKFGESGYWG 
KKFGESGYWG 
KKFGESGYWG 



BSLDVEASAE 
ESLDVBASAE 
BSLDVEASAE 
ESLDVBASAE 
BSLDVEASAE 
BSLDVEASAE 
BSLDVEASAE 
BSLDVEASAE 
BSLDVEASAE 
BSLDVEASAE 
BSLDVEASAE 



SO 

KIAQLIKEGA 
KIAQLIKEGA 
KIAQLIKEGA 
KIAQLIKEGA 
KIAQLIKEGA 
KIAQLIKEGA 
KIAQLIKEGA 
KIAQLIKEGA 
KIAQLIKEGA 
KIAQLIKEGA 
KIAQLIKEGA 



msa277662 . 2 { 33 0_18RS21 
msa277662.2{330_A909 
msa277662 .2{330_CJB110 
tnsa2 7 7662 . 2 { 3 3 0_H36B 
msa277662.2{330_ll69NT 
msa2 77 6 62 . 2 { 3 3 0_COH1 
msa277662.2{330_M732 
insa277662 . 2 {330_M781 
msa277662 . 2 { 330_JM9130013 
msa277662.2{330_090 
TOSa277662.2{330_2603 
Consensus 



51 

NVFRFNFSHG 
NVFRFNFSHG 
NVFRFNFSHG 
NVFRFNFSHG 
NVFRFNFSHG 
NVFRFNFSHG 
NVFRFNFSHG 
NVFRFNFSHG 
NVFRFNFSHG 
NVFRFNFSHG 
NVFRFNFSHG 



DHAEQGARMA 
DHAEQGARMA 
DHAEQGARMA 
DHAEQGARMA 
DHAEQGARMA 
DHAEQGARMA 
DHAEQGARMA 
DHAEQGARMA 
DHAEQGARMA 
DHAEQGARMA 
DHAEQGARMA 



TVRKAEEIAG 
TVRKAEEIAG 
TVRKAEEIAG 
TVRKAEEIAG 
TVRKAEEIAG 
TVRKAEEIAG 
TVRKAEEIAG 
TVRKAEEIAG 
TVRKAEEIAG 
TVRKAEEIAG 
TVRKAEEIAG 



QKVGFLLDTK 
QKVGFLLDTK 
QKVGFLLDTK 
QKVGFLLDTK 
QKVGFLLDTK 
QKVGFLLDTK 
QKVGFLLDTK 
QKVGFLLDTK 
QKVGFLLDTK 
QKVGFLLDTK 
QKVGFLLDTK 



100 

GPE IRTELFE 
GPE IRTELFE 
GPE IRTELFE 
GPEIRTELFE 
GPE IRTELFE 
GPEIRTELFE 
GPEIRTELFE 
GPEIRTELFE 
GPEIRTELFE 
GPEIRTELFE 
GPEIRTELFE 



msa277662 .2{330_18RS21 
tnsa277662.2{330 A909 
msa277662.2{330_CJBU0 
msa277662 . 2 { 330_H36B 
msa277662 . 2 { 33 0 JL169NT 
rasa27 7662 .2(33 0_COH1 
msa277662 . 2 { 330 J4732 
msa277662 . 2 { 330J4781 
msa277662.2{330_JM9130013 
msa277662.2{330_090 
msa277662 . 2 { 330_2603 
Consensus 



101 

DGaDFHSYTT 
DGaDFHSYTT 
DGaDFHSYTT 
DGaDFHSYTT 
DGaDFHSYTT 
DGaDFHSYTT 
DGaDFHSYTT 
DGaDFHSYTT 
DGsDFHSYTT 
DGaDFHSYTT 
DGaDFHSYTT 



GTkLRVATKQ 
GTkLRVATKQ 
GTkLRVATKQ 
GTkLRVATKQ 
GTkLRVATKQ 
GTkLRVATKQ 
GTkLRVATKQ 
GTkLRVATKQ 
GTkLRVATKQ 
GTeLRVATKQ 
GTkLRVATKQ 



GIKSTPEVIA 
GIKSTPEVIA 
GIKSTPEVIA 
GIKSTPEVIA 
GIKSTPEVIA 
GIKSTPEVIA 
GIKSTPEVIA 
GIKSTPEVIA 
GIKSTPEVIA 
GIKSTPEVIA 
GIKSTPEVIA 



LNVAGGLDIF 
LNVAGGLDIF 
LNVAGGLDIF 
LNVAGGLDIF 
LNVAGGLDIF 
LNVAGGLDIF 
LNVAGGLDIF 
LNVAGGLDIF 
LNVAGGLDIF 
LNVAGGLDIF 
LNVAGGLDIF 



150 

DDVEVGKQIL 
DDVEVGKQIL 
DDVEVGKQIL 
DDVEVGKQIL 
DDVEVGKQIL 
DDVEVGKQIL 
DDVEVGKQIL 
DDVEVGKQIL 
DDVEVGKQIL 
DDVEVGKQIL 
DDVEVGKQIL 



tnsa277662 . 2 {330_18RS21 
msa277662.2{330_A909 
msa277662.2{330_CJB110 
msa277662 . 2 { 330_H36B 
msa277662 ,2{330_1169NT 
msa2 7 7662 . 2 { 3 3 0_COH1 
rasa277662.2{330_M732 
rasa277662.2(330_M781 
msa277662 . 2 { 330_JM9130013 
msa277662 . 2 {330_090 
msa277662 . 2 { 330_2603 
Consensus 



151 

VDDGKLGLTV 
VDDGKLGLTV 
VDDGKLGLTV 
VDDGKLGLTV 
VDDGKLGLTV 
VDDGKLGLTV 
VDDGKLGLTV 
VDDGKLGLTV 
VDDGKLGLTV 
VDDGKLGLTV 
VDDGKLGLTV 



FAKDKDTREF 
FAKDKDTREF 
FAKDKDTREF 
FAKDKDTREF 
FAKDKDTREF 
FAKDKDTREF 
FAKDKDTREF 
FAKDKDTREF 
FAKDKDTREF 
FAKDKDTREF 
FAKDKDTREF 



EVWENDGLI 
EVWENDGLI 
EVWENDGLI 
EVWENDGLI 
EVWENDGLI 
EVWENDGLI 
EVWENDGLI 
EVWENDGLI 
EVWENDGLI 
EVWENDGLI 
EVWENDGLI 



GKQKGVNIPY 
GKQKGVNIPY 
GKQKGVNIPY 
GKQKGVNIPY 
GKQKGVNIPY 
GKQKGVNIPY 
GKQKGVNIPY 
GKQKGVNIPY 
GKQKGVNIPY 
GKQKGVNIPY 
GKQKGVNIPY 



200 

TKIPFPALAB 
TKIPFPALAB 
TKIPFPALAB 
TKIPFPALAB 
TKIPFPALAB 
TKIPFPALAB 
TKIPFPALAB 
TKIPFPALAB 
TKIPFPALAB 
TKIPFPALAB 
TKIPFPALAB 



msa277662 . 2 { 330JL8RS21 
msa277662 . 2 { 330_A909 
msa277662 . 2 {330_CJB110 
rasa277662 .2{330_H36B 
msa277662.2{330 1169NT 
tnsa277662.2{330 OOH1 
msa277662. 2(330 M732 
msa277662 . 2{330_M781 
msa277662.2{330 JW9130013 
msa277662T2 {330_O9O 
msa277662.2{330_2603 
Consensus 



201 

RDNADIRFGL 
RDNADIRFGL 
RDNADIRFGL 
RDNADIRFGL 
RDNADIRFGL 
RDNADIRFGL 
RDNADIRFGL 
RDNADIRFGL 
RDNADIRFGL 
RDNADIRFGL 
RDNADIRFGL 



EQGLNFIAIS 
EQGLNFIAIS 
EQGLNFIAIS 
EQGLNFIAIS 
EQGLNFIAIS 
EQGLNFIAIS 
EQGLNFIAIS 
EQGLNFIAIS 
EQGLNFIAIS 
EQGLNFIAIS 
EQGLNFIAIS 



FVRTAKDVNE 
FVRTAKDVNE 
FVRTAKDVNE 
FVRTAKDVNE 
FVRTAKDVNE 
FVRTAKDVNE 
FVRTAKDVNE 
FVRTAKDVNE 
FVRTAKDVNE 
FVRTAKDVNE 
FVRTAKDVNE 



VRAICEETGn 
VRAICEETGn 
VRAICEETGn 
VRAICEETGn 
VRAICEETGn 
VRAICEETGn 
VRAICEBTGn 
VRAI CEETG n 
VRAICEETGn 
VRAICEETGn 
VRAICBETGX 



250 

GHVKLFAKXE 
GHVKLFAKIB 
GHVKLFAKIB 
GHVKLFAKIB 
GHVKLFAKIE 
GHVKLFAKIE 
GHVKLFAKIB 
GHVKLFAKIB 
GHVKLFAKIE 
GHVKLFAKIE 
GHVKLFAKIE 
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Table 72: Comparative Sequences relating to SAG0941 



msa277662.2{330_18RS21 , 
msa277662 . 2 { 330_A909 ' 
m9a277662.2{330_CJB110 , 
msa277662 . 2 {330_H36B 
msa277662.2{330_1169NT 
msa277662 . 2 ( 33 0__COH1 
maa2776€2.2{330 M732 
msa277662.2{330~M781 
msa277662 .2{330_JM9130013 
msa277662.2{330_090 
msa277662.2{jJ0_2603 
Consensus 



251 

NQQGIDNIDB 
NQQGIDNIDE 
NQQGIDNIDE 
NQQGIDNIDB 
NQQGIDNIDE 
NQQGIDNIDE 
NQQGIDNIDB 
NQQGIDNIDE 
NQQGIDNIDE 
NQQGIDNIDE 
NQQGIDNIDE 
********** 



IIEAADGIMI 
IIEAADGIMI 
IIEAADGIMI 
IIEAADGIMI 
IIEAADGIMI 
IIEAADGIMI 
IIEAADGIMI 
IIEAADGIMI 
IIEAADGIMI 
IIEAADGIMI 
IIEAADGIMI 
********** 



ARGDMGIEVP 
ARGDMGIEVP 
ARGDMGIEVP 
ARGDMGIEVP 
ARGDMGIEVP 
ARGDMGIEVP 
ARGDMGIEVP 
ARGDMGIEVP 
ARGDMGIEVP 
ARGDMGIEVP 
ARGDMGIEVP 
********** 



FEMVPVYQKM 
FEMVPVYQKM 
FEMVPVYQKM 
FEMVPVYQKM 
FEMVPVYQKM 
FEMVPVYQKM 
FEMVPVYQKM 
FEMVPVYQKM 
FEMVPVYQKM 
FEMVPVYQKM 
FEMVPVYQKM 
********** 



300 

IITKVNAAGK 
IITKVNAAGK 
IITKVNAAGK 
IITKVNAAGK 
IITKVNAAGK 
IITKVNAAGK 
IITKVNAAGK 
IITKVNAAGK 
IITKVNAAGK 
IITKVNAAGK 
IITKVNAAGK 
********** 



maa277662 .2{330_18RS2l| 
msa277662.2{330_A909 
msa277662 . 2 {330_CJB110 
msa277662 . 2 {330_H36B 
msa277662.2{330 1169NT 
msa2 7 7 662 . 2 ( 3 3 0_COH1 
msa277662.2(330_M732 
msa277662 . 2 { 330_M781 
msa277662 .2{330_JM9130013 
msa277662 . 2 { 330_090 
rasa277662.2{330_2603 
Consensus 



301 

AVITATNMLE 
AVI TATNMLE 
AVITATNMLE 
AVITATNMLE 
AVITATNMLE 
AVITATNMLE 
AVITATNMLE 
AVITATNMLE 
AVITATNMLE 
AVITATNMLE 
AVITATNMLE 



TMTDKPRATR 
TMTDKPRATR 
TMTDKPRATR 
TMTDKPRATR 
TMTDKPRATR 
TMTDKPRATR 
TMTDKPRATR 
TMTDKPRATR 
TMTDKPRATR 
TMTDKPRATR 
TMTDKPRATR 



SEVSDVFNAV 
SEVSDVFNAV 
SEVSDVFNAV 
SEVSDVFNAV 
SEVSDVFNAV 
SEVSDVFNAV 
SEVSDVFNAV 
SEVSDVFNAV 
SEVSDVFNAV 
SEVSDVFNAV 
SEVSDVFNAV 



IDGTDATMLS 
IDGTDATMLS 
IDGTDATMLS 
IDGTDATMLS 
IDGTDATMLS 
IDGTDATMLS 
IDGTDATMLS 
IDGTDATMLS 
IDGTDATMLS 
IDGTDATMLS 
IDGTDATMLS 



350 

GESANGKYPV 
GESANGKYPV 
GESANGKYPV 
GESANGKYPV 
GESANGKYPV 
GESANGKYPV 
GESANGKYPV 
GESANGKYPV 
GESANGKYPV 
GESANGKYPV 
GESANGKYPV 



msa277662.2{330 18RS2l| 
msa277662.2{330_A909 ( 
rasa277662 . 2 { 330_CJB110 
rasa277662 .2{330_H36B 
msa277662.2{330_1169NT 
msa277662 . 2 (330_COH1 
msa277662 . 2 (330_M732 
ctisa2 7 7 6 62 . 2 { 33 0_M7 8 1 
msa277662 .2{330_JM9130013 
msa277662.2{330 090 
insa277662.2{330_2603 
Consensus 



351 

ESVRTMATID 
ESVRTMATID 
ESVRTMATID 
ESVRTMATID 
ESVRTMATID 
ESVRTMATID 
ESVRTMATID 
ESVRTMATID 
ESVRTMATID 
ESVRTMATID 
ESVRTMATID 



KNAQTLLNEY 
KNAQTLLNEY 
KNAQTLLNEY 
KNAQTLLNEY 
KNAQTLLNEY 
KNAQTLLNEY 
KNAQTLLNEY 
KNAQTLLNEY 
KNAQTLLNEY 
KNAQTLLNEY 
KNAQTLLNEY 



GRLDS SAFPR 
GRLDSSAFPR 
GRLDSSAFPR 
GRLDSSAFPR 
GRLDSSAFPR 
GRLDSSAFPR 
GRLDSSAFPR 
GRLDSSAFPR 
GRLDSSAFPR 
GRLDSSAFPR 
GRLDSSAFPR 



NNKTDVIASA 
NNKTDVIASA 
NNKTDVIASA 
NNKTDVIASA 
NNKTDVIASA 
NNKTDVIASA 
NNKTDVIASA 
NNKTDVIASA 
NNKTDVIASA 
NNKTDVIASA 
NNKTDVIASA 



400 

VKDATHSMDI 
VKDATHSMDI 
VKDATHSMDI 
VKDATHSMDI 
VKDATHSMDI 
VKDATHSMDI 
VKDATHSMDI 
VKDATHSMDI 
VKDATHSMDI 
VKDATHSMDI 
VKDATHSMDI 



msa277662 .2{330_18RS2i; 

msa277662 . 2 { 330_A909 \ 
msa277662.2{330_CJB110 i 
msa277662.2{330_H36B 
msa2 77662 . 2 {330__1169NT 
msa277662 . 2 ( 33 0_COH1 
ma a277662 .2(330 J4732 
cnsa277662 .2{330__M781 
msa277662 .2{330_JM9130013 
mBa277662.2{330_090 
msa277662.2{330_2603 
Consensus 



401 

KLWTITETG 
KLWTITETG 
KLWTITETG 
KLWTITETG 
KLWTITETG 
KLWTITETG 
KLWTITETG 
KLWTITETG 
KLWTITETG 
KLWTITETG 
KLWTITETG 



NTARAISKFR 
NTARAISKFR 
NTARAISKFR 
NTARAISKFR 
NTARAISKFR 
NTARAISKFR 
NTARAISKFR 
NTARAISKFR 
NTARAISKFR 
NTARAISKFR 
NTARAISKFR 



PDAD I LAVTF 
PDADILAVTF 
PDAD I LAVTF 
PDADILAVTF 
PDADILAVTF 
PDADILAVTF 
PDADILAVTF 
PDADILAVTF 
PDADILAVTF 
PDADILAVTF 
PDADILAVTF 



DEKVQRSLMI 
DEKVQRSLMI 
DEKVQRSLMI 
DEKVQRSLMI 
DEKVQRSLMI 
DEKVQRSLMI 
DEKVQRSLMI 
DEKVQRSLMI 
DEKVQRSLMI 
DEKVQRSLMI 
DEKVQRSLMI 



450 

NWGVIPVLAD 
NWGVIPVLAD 
NWGVIPVLAD 
NWGVIPVLAD 
NWGVIPVLAD 
NWGVIPVLAD 
NWGVIPVLAD 
NWGVIPVLAD 
NWGVIPVLAD 
NWGVIPVLAD 
NWGVIPVLAD 



msa277662.2{330_18RS21 
msa277662 . 2 { 330_A909 
msa277662 .2{330_CJB110 
msa277662.2{330_H36B 
msa277662.2{330 1169NT 
insa277662. 2(330 COH1 
msa277662. 2(330 M732 
msa277662 . 2 { 330 J478 1 
msa277662.2{330_JM9130013 
msa277662 . 2 {330_090 
msa2 7 7 6 62 . 2 { 3 3 0_2 60 3 
Consensus 



451 

KPASTDDMFE 
KPASTDDMFE 
KPASTDDMFE 
KPASTDDMFE 
KPASTDDMFE 
KPASTDDMFE 
KPASTDDMFE 
KPASTDDMFE 
KPASTDDMFE 
KPASTDDMFE 
KPASTDDMFE 



VAERVALEAG 
VAERVALEAG 
VAERVALEAG 
VAERVALEAG 
VAERVALEAG 
VAERVALEAG 
VAERVALEAG 
VAERVALEAG 
VAERVALEAG 
VAERVALEAG 
VAERVALEAG 



fVESGDNIVI 
fVESGDNIVI 
fVESGDNIVI 
fVESGDNIVI 
1VESGDNIVI 
1VESGDNIVI 
1VESGDNIVI 
1VESGDNIVI 
1VESGDNIVI 
1VESGDNIVI 
fVESGDNIVI 



VAGVPVGTGG 
VAGVPVGTGG 
VAGVPVGTGG 
VAGVPVGTGG 
VAGVPVGTGG 
VAGVPVGTGG 
VAGVPVGTGG 
VAGVPVGTGG 
VAGVPVGTGG 
VAGVPVGTGG 
VAGVPVGTGG 



500 

TNTMRVRTVK 
TNTMRVRTVK 
TNTMRVRTVK 
TNTMRVRTVK 
TNTMRVRTVK 
TNTMRVRTVK 
TNTMRVRTVK 
TNTMRVRTVK 
TNTMRVRTVK 
TNTMRVRTVK 
TNTMRVRTVK 
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Table 73: Comparative Sequences relating to SAG0981 



SEQ ID NO. 7301 
STRAIN 2603 

TTGTCTGCTATAATAGACAAAAAGGTGGTGATATTTATGTATTTAG CATTAATCGGTGAT 

ATCATTAATTCAAAACAGATACITGAACGTGAAACTTTC^ 

ATGACCGAACTATCTGATGTATATGGTGAAGAGCTGATTTCTCC^ 

GGTGATGAATTTCAAGCTTTATTGAAACCRTCAAAAAA 

ATTCAACTAGCTCTAAAACCTGTTAATGTAAGGTTCGGCCTCGGTAC^ 

ACATCC^TCAATTCAAATGAAAGTATCGGTGCTGATGGTCCTC 

TCAG CTATTAAT C^TATACATGATAAAAATGATTATGGAACAGTTCAAGTAG CTATTTG C 
CTTGATGATGAAGACCAAAACCTTGAATTAACACTAAATAGTCT 

TTTATCAAGTCAAAATGGACTACAAACCATTTTCAAATC CTTGAGCACTTAATACTTCAA 
GATAATTATCAAGAACAATTTCAACATCAAAAGTTAGC^ 

AGTG CGCTGACT AAACGCX7TTAAAG CAAGCGGTCTGAAGATTTACnTAAGAACGAGAACA 
CAGGCAG CXGATCTATTAGTT AAAAGTTGCACTCAAACTAAAGGGGGA 

SEQ ZD NO. 7302 
STRAIN 090 

T CTG CTAT AATAGA CAAAAAGGTGGTG AT ATTT ATGTATTT 
AGCATTAATCGGTGATATCATTAATTCAAAACAG^ 
CTTTCCAACAGTCTTTTCAGCAAcTAAT<3ACX:GAACT 
I GGTGAAGAGCTGATTTCTCCATTCACTATT^ 

AGCTTTATTGAAAC CATCAAAAAAGGTATTTCAAATTATTGACCATATTC 
AACTAGCTCTAAAACCTGTTAATGTAAGGTT^ tACAGGAAAC 
ATTATAACATCX1ATCAATTTAAATGAAAGTATCG C 
CTACTGGCATGCTCGCTCAGCTATTAATCATATACATGAT 
ATGGAACAGTT CAAGTAGCTATTTG CCTTGATGATGAAGACCAAAACCTT 
GAATTAACACTAAATAGTCTCATTTCAGCTGGTGATTTTATC 
ATGGACTACAAACCATTTTCAAATG CTTGAGCACTTAATACTTCAAGATA 
ATTATCAAGAACAATTTCAACATCAAAAGTTAGCCX^CTGGAAA^ 
GAAC CTAGTG CGCTGACTAAACGCCTTAAAGCAAG CGGTCTGAAGATTTA 
CTTAAGAACGAGAACACAGGCAGCCGATCTATTAGTTAAAAGTTGCACTC 
AAACTAAAGGGGGAAGCTATGATTTC 

SEQ ID NO. 7303 
STRAIN A909 

TCTGCTATAATAGACAAAAAGGTGGTGATATTTATGTAT 

TTAGCATTAATCGGTGATATCATTAATTCAAAACAGATACTT^ 

AACTTTCCAACAGTCTITTCAGCAACTAATGACCGAACT 

ATGGTGAAGAGCTGATTTCTCCATTC&CT^ 

CAAGCTTTATTGAAACCATCAAAAAAGGTATTTC^ 

TCAACTAGCrrCTAAAACCIX51TAATGTAAGGTTCXX3CCTCGOT 

ACATTATAACATCCATCAATTCAAATGAAAGTATCGGTXaC 

GCCTACTGGCATGCTCX3CTCAGCTATTAATCATATACATGATAAAAATGA 

TTATGGAACAGTTCAAGTAGCTATTTGCCTTGATC 

TTGAATTAACACTAAATAGTCTCATTrcAGCTGGTGATTTTA 

AAATGGACTACAAACCATTTTCAAATGCITGA 

TAATTAT CAAGAACAATTTCAACATCAAAAGTTAGCCCAACTGGAAAATA 
TTGAACXTTAGTG CGCTGACTAAACGCCTTAAAGCAAG CGGTCTGAAGATT 
TACTTAAGAACGAGAACACAGGCAGCCGATCTATTAGTTAA 
TCAAACTAAAGGGGGAAGCTATGATTTC 

SEQ ID NO. 7304 
STRAIN H36B 

TCIX3CTATAATAGAC1AAAAAGGTGGTGATATTT 

ATGTATTTAGCATTAATCGGTGATATGATTAATC 

ACGTGAAACTTTCCAACAGTCTTTTCAGCAACT 

ATGTATATGGTGAAGAGCTGATTTCTCCAT^ 

GAATTTCAAGCTTTATTGAAACXATCAAAA 

CXIATATTCAACTAGCrCTAAAACCTCTT 

CAGGAAACATTATAACATCCATCAATTCAAATG^ 

AAATGATTATGGAACAGTTCAAGTAGCTAT^ 

AAAACCTTGAATTAACACTAAATAGTCTCATT^ 

AAGTCAAAATGGACTACAAACCATTTTl^^ 

TCAAGATAATTATCAAGAACAATTTCAACAT^ 

AAAATATTGAACCTAGTGCGCTGACTAAACGCCTT 

AAGATTTACITAAGAACGAGAACACAGGCAGCa^ 

TTGCACTCAAACTAAAGGGGGAAGCTATGATTTC 

SEQ ID NO. 7305 
STRAIN 18RS2I 

TCTGCTATAATAGACAAAAAGGTGGTGATATTT 

ATGTATTTAGCATTAATCGGTGATATCATTAATTCA 

ACGTGAAACTTTCCAAGAGTCTTTT^ 

ATGTATATGGTQAAGAGCTGATTTCTCCATTCACT 

GAATTTCAAGCTTTATTGAAACCATCAAAAAAG^ 

CCATATTdAACTAGCnOTAAAACCTGTTAATGTAA 

CAGGAAACATTATAACATCCATCAATTC 

GGTCCTGCCTACTGGCATGCTCGCTCAGCTATTAAT^ 

AAATOATTATGGAACAGTTCAAGTAGCTATTTGrcTTGA 

AAAACXTTGAAT1!AACACTAAATAGTCTCATTTCAG 

AAGTCAAAATGGACTACAAACXZATTTTCAAAT^ 
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TCAAGATAATTATCAAGAACAATTTCAACATCAAAA^ 
AAAATATTGAACCTAGTGCG CTGACTAAACGCCTTAAAG CAAG CGGTCTG 
AAGATTTACITAAGAACGAGAACA 
TTGCACTCAAACTAAAGGGGGAAGCTATGATTTC 

SEQ ZD NO. 7306 
STRAIN M732 

TCTG CTATAATAGACAAAAAGGTGGTGATATT 

TATGTATTTAGCATTAATCGGTGATATCATTAATTCAAAACAGATAC^ 
AACGTGAAACTTTCCAACAGTCTTTTCAGCAACT 
GATGTATATGGTGAAGAGCTGATTTCTCCATTCACTATTACAGC^^ 
TGAATTTCAAG CTTTATTGAAACaATCAAAAAAGGTAlTTCAAATTATTG 
ACCATATTCAACTAG CTCTAAAACCTGTTAATGTAAGG1TCGGCCTCGGT 
ACAGGAAACATTATAACATCCATCAATTCAAATGAAAGT 

AAAATGATTATGGAACAGTTCAAGTAGCTATTTG CCTTGATGATGAAGAC 

CAAAACCTTCAATTAACACTAAATAGTCrCATTrCAG 

CAAGTCAAAATGGACTACAAACCATTTTCAA^ 

TTCAAGATAATTATCAAGAACAATTTCAACATCAAAAGTTAG 

GAAAATATTGAACCTAGTGCGCPGACTAAACGC^ 

GAAGATTTACT?TAAGAACGAGAACACAGGCAGCCGATCTATrAG 

GTTGC7VCTCAAACTAAAGGGGGAAGCTATGATTTC 

SSQ ZD HO. 7307 
STRAIN COH1 

TCTG CTATAATAGACAAAAAGGTGGTGATATT 

TATGTATTTAGCATTAATCGGTGATATCATTAA^ 

AACXSTGAAACTTTCCAACAGTCITT^ 

GATGTATATGGTGAAGAGCIGATTTCTC 

TGAATTTCAAGCTTTATTGAAACaATCAAAAA 

ACXATATTCAACITAGCTCrAAAACXTGTTAATGTA 

ACAGQAAACATTATAACATCCATCAATTCAAATG 

TGGTCCTGCCTACTXKKZATGCTCG CTCAGCTATTAATCATATACATGATA 

AAAATGATTATGGAACAGTTCAAGTAGCrATrTGCCT 

CAAAACCTTGAATTAACACTAAATAGTCTC^ 

O^AGTCAAAATGGACTACAAACCATTTTCA CACTTAATAC 

TTCAAGATAATTATCAAGAACAATTTC^^CATCA 

GAAAATATTGAACCTAGTGCGCTGACTAAACX3CX7rTAA^ 

GAAGATTTACITAAGAACGAGAACACAGGCAGCCG^ 

GTTGCACICAAACTAAAGGGGGAAGCTATGATTTC 

SEQ ZD HO. 7308 
STRAIN M781 

TCTGCTATAATAGACAAAAAGGTGGTGATATTT 

ATGTATTTAGCATTAATCGGTGATATCATTAATr 

ACS3TGAAACTTTCCAACAGTCITTTCA 

ATGTATATGGTGAAGAGCIXIATTTCTCCATTC CTGGTGAT 

GAATTTCAAGCTTTATTGAAACAATCAAAA 

CCATATTCAACTAGCTCTAAAACCTGTTAATGTA^ 

CAGGAAACATTATAACATCCATCAATTCAAATGAA 

GGTCCTGCCTACIGGCATCCTCGCrCAGCT 

AAATGATTATGGAACAGTTTCAAGTAGCTATTTGCC^ 

AAAACCTTGAATTAACACTAAATAGTCrCATTT^^ 

AAGTCAAAATGGACTACAAACCATTTTCAAATGCT 

TCAAGATAATTATCAAGAACAATTTCAAC^ 

AAAATATTGAACCTAGTGCGCTGACTAAACG 

AAGATTTACTTAAGAACGAGAACACAGGCAG^ 

TTGCACTCAAACTAAAGGGGGAAGCTATGATTTC 

SEQ ZD KO. 7309 
STRAIN CJB 110 

TCreCTATAATAGACAAAAAGGTGGTGGTA 

TTTATCTATTTAGCATTAATCGGTGATATCATTAAT^ 

TGAACGTGAAACTTTCCAACAGTCTTTTC^ 

CTGATG TAIA TGGTGAAGAGCTGA'lTrClCTATTCACTA^ 

GATGAATTTCAAGCTTTATTGAAACXATCAAAA 

TGACCATATTCAACTAG CTCTAAAACXrrGTTAATGTAAGGTTCGGCXriCG 

GTACAGGAAACATTATAACATCC^TCAATTCAAATC 

GATGGTCCTGCCTACTGGCATGCTCGCTC^ 

TAAAAATG ATTA TGGAACAGTTCAAGTAGCTAT^ 

ACCAAAACCTTGAATTAACACrAAATAff 

ATCAAGTCAAAATGGACTACTAACCATTnXM 

ACTTCAAGATAATTATCAAGAACAATTTCAA 

TGGAAAATATTGAACCTAGTGCGCTGACTAAACGCXrrTA 

CTGAAGATTTACTT AAGLAACX1AGAACACAGG CAG CCGAT CTATTAGTTAA 

AAGTTGCACTCAAACrAAAGGGGGAAGCrATGATTTc 

SEQ ZD NO. 7310 
STRAIN JM9 1300 13 

TCTOCTATAATAGACAAAAAGGTGGTGATATTT 

ATOTATTTAGCATTAATOGX3TGATATCATTAATTCAAAA 

ACGTCAAACTTTCCAACACT CriTT 
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ATCOTTATGGTGAAGAGCTGATTC 

GAATTTCAAG L'ri'rATTGAAACCATCAAAAAAGGTATTTCAAATTATTGA 
CCATATT CAACTAG CTTCTAAAACXrTGTTAATGTAAGGTTCXKaCCTCGGT A 
CAGGAAACATTATAACATCCATCAATTCAAATGAAAGTATCGGTC 
GGTCCTGOCTACTOGCATGCTCX3CTCAGCTATTAA 

AAATGATTATGGAACAGTTCAAGTAGCTATTTG CCTTGATGATGAAGACC 

AAAACCTTGAATTAACACTAAATAGTCTCATT^ C 

AAGTCAAAATGGACTACAAACCATTTTCAAATC 

TCAAGATAATTATCAAGAACAATTTCAACATCAAAAG 

AAAATATTGAACCrAGTGOSCTGACTAAACGCCT^^ 

AAGATTTACrTTAAGAACGAGAACACAGGCAGCOGATCTATTAGTT 

TTGCACTCAAACTAAAGGGGGAAGCTATGATTTC 

PRETTY of: /bio tmp/msa3 1912 .2 { * } February 18, 2003 08:19 



msa31912.2{338_18RS21 
msa31912 . 2 ( 338_2603 
ma a3 1912 . 2 (338_A909 
msa31912.2{338 H36B 
msa31912.2{33B_JM9130013 
msa31912.2{338 COH1 
msa31912.2{338lM732 
ma a31912. 2 (338_M781 
msa31912.2{338 090 
rasa31912 . 2 (338_CJB110 
Consensus 



TCTGCTA 

ttgTCTGCTA 

TCTGCTA 

TCTGCTA 

TCTGCTA 

TCTGCTA 

TCTGCTA 

TCTGCTA 

TCTGCTA 

TCTGCTA 



TAATAGACAA 
TAATAGACAA 
TAATAGACAA 
TAATAGACAA 
TAATAGACAA 
TAATAGACAA 
TAATAGACAA 
TAATAGACAA 
TAATAGACAA 
TAATAGACAA 



AAAGGTGGTG 
AAAGGTGGTG 
AAAGGTGGTG 
AAAGGTGGTG 
AAAGGTGGTG 
AAAGGTGGTG 
AAAGGTGGTG 
AAAGGTGGTG 
AAAGGTGGTG 
AAAGGTGGTG 



aTATTTATGT 
aTATTTATGT 
aTATTTATGT 
aTATTTATGT 
aTATTTATGT 
aTATTTATGT 
aTATTTATGT 
aTATTTATGT 
aTATTTATGT 
gTATTTATGT 



50 

ATTTAGCATT 
ATTTAGCATT 
ATTTAGCATT 
ATTTAGCATT 
ATTTAGCATT 
ATTTAGCATT 
ATTTAGCATT 
ATTTAGCATT 
ATTTAGCATT 
ATTTAGCATT 



msa31912 . 2 {338_18RS21 
msa31912 . 2 f 338_2603 
msa31912.2f338_A909 
msa31912 . 2 { 338_H36B 
msa31912 . 2 {338_JM9130013 
msa31912.2.f338_COHl 
msa31912 . 2 133B_M732 
msa31912 . 2 (338_M781 
msa31912 .2{338_090 
insa31912.2{338_CJB110 
Consensus 



51 

AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 
********** 



ATCATTAATT 
ATCATTAATT 
ATCATTAATT 
ATCATTAATT 
ATCATTAATT 
ATCATTAATT 
ATCATTAATT 
ATCATTAATT 
ATCATTAATT 
ATCATTAATT 
********** 



CAAAACAGAT 
CAAAACAGAT 
CAAAACAGAT 
CAAAACAGAT 
CAAAACAGAT 
CAAAACAGAT 
CAAAACAGAT 
CAAAACAGAT 
CAAAACAGAT 
CAAAACAGAT 
********** 



ACTTGAACGT 
ACTTGAACGT 
ACTTGAACGT 
ACTTGAACGT 
ACTTGAACGT 
ACTTGAACGT 
ACTTGAACGT 
ACTTGAACGT 
ACTTGAACGT 
ACTTGAACGT 
********** 



100 

GAAACTTTCC 
GAAACTTTCC 
GAAACTTTCC 
GAAACTTTCC 
GAAACTTTCC 
GAAACTTTCC 
GAAACTTTCC 
GAAACTTTCC 
GAAACTTTCC 
GAAACTTTCC 
********** 



msa31912 . 2{338_18RS21 
msa31912.2{338_2603 
msa31912. 2(338 A909 
msa3 1 912 . 2 { 3 3 8lH3 6B 
msa31912.2{338_JM9130013 
rasa3 1 9 1 2 . 2 ( 3 3 8_COHl 
msa31912.2l338JM732 
msa31912.2{338_M781 
insa31912 .2{338__090 
msa31912 . 2 { 338_CJB110 
Consensus 



101 

AACAGTCTTT 
AACAGTCTTT 
AACAGTCTTT 
AACAGTCTTT 
AACAGTCTTT 
AACAGTCTTT 
AACAGTCTTT 
AACAGTCTTT 
AACAGTCTTT 
AACAGTCTTT 



TCAGCAACTA 
TCAGCAACTA 
TCAGCAACTA 
TCAGCAACTA 
TCAGCAACTA 
TCAGCAACTA 
TCAGCAACTA 
TCAGCAACTA 
TCAGCAACTA 
TCAGCAACTA 



ATGACCGAAC 
ATGACCGAAC 
ATGACCGAAC 
ATGACCGAAC 
ATGACCGAAC 
ATGACCGAAC 
ATGACCGAAC 
ATGACCGAAC 
ATGACCGAAC 
ATGACCGAAC 



TATCTGATGT 
TATCTGATGT 
TATCTGATGT 
TATCTGATGT 
TATCTGATGT 
TATCTGATGT 
TATCTGATGT 
TATCTGATGT 
TATCTGATGT 
TATCTGATGT 



150 

ATATGGTGAA 
ATATGGTGAA 
ATATGGTGAA 
ATATGGTGAA 
ATATGGTGAA 
ATATGGTGAA 
ATATGGTGAA 
ATATGGTGAA 
ATATGGTGAA 
ATATGGTGAA 



msa31912.2{338_18RS21 
tnsa31912.2f338_2603' 
msa31912. 2(338 A909 
msa31912.2{338~H36B 
msa31912.2{338_JM9130013 
msa31912 . 2 (338_C0H1 
msa31912.2(338 M732 
msa31912 . 2 (338_M781 
msa31912.2{338_090 
msa31912 .2{338_CJB110 
Consensus 



151 

GAG CTGATTT 
GAGCTGATTT 
GAGCTGATTT 
GAGCTGATTT 
GAGCTGATTT 
GAGCTGATTT 
GAGCTGATTT 
GAGCTGATTT 
GAGCTGATTT 
GAGCTGATTT 



CTCcATTCAC 
CTCcATTCAC 
CTCCATTCAC 
CTCcATTCAC 
CTCcATTCAC 
CTCcATTCAC 
CTCcATTCAC 
CTCcATTCAC 
CTCcATTCAC 
CTCtATTCAC 



TATTACAGCT 
TATTACAGCT 
TATTACAGCT 
TATTACAGCT 
TATTACAGCT 
TATTACAGCT 
TATTACAGCT 
TATTACAGCT 
TATTACAGCT 
TATTACAGCT 



GGTGATGAAT 
GGTGATGAAT 
GGTGATGAAT 
GGTGATGAAT 
GGTGATGAAT 
GGTGATGAAT 
GGTGATGAAT 
GGTGATGAAT 
GGTGATGAAT 
GGTGATGAAT 



200 

TTCAAGCTTT 
TTCAAGCTTT 
TTCAAGCTTT 
TTCAAGCTTT 
TTCAAGCTTT 
TTCAAGCTTT 
TTCAAGCTTT 
TTCAAGCTTT 
TTCAAGCTTT 
TTCAAGCTTT 



msa31912.2{338 18RS21 
msa31912 . 2 {338_2603 
msa31912.2(338_A909 
ms a3 1 9 1 2 . 2 { 3 3 8_H3 6B 
msa31912.2{338_OM9130013 
msa31912 . 2(338_COHl 
msa31912 . 2 (338_M732 
maa31912.2{338_M781 
msa31912.2{338_090 
tnsa31912.2{338_CJB110 
Consensus 



201 

ATTGAAACcA 
ATTGAAACcA 
ATTGAAACcA 
ATTGAAACcA 
ATTGAAACcA 
ATTGAAACaA 
ATTGAAACaA 
ATTGAAACaA 
ATTGAAACcA 
ATTGAAACcA 



TCAAAAAAGG 
TCAAAAAAGG 
TCAAAAAAGG 
TCAAAAAAGG 
TCAAAAAAGG 
TCAAAAAAGG 
TCAAAAAAGG 
TCAAAAAAGG 
TCAAAAAAGG 
TCAAAAAAGG 



TATTTCAAAT 
TATTTCAAAT 
TATTTCAAAT 
TATTTCAAAT 
TATTTCAAAT 
TATTTCAAAT 
TATTTCAAAT 
TATTTCAAAT 
TATTTCAAAT 
TATTTCAAAT 



TATTGACCAT 
TATTGACCAT 
TATTGACCAT 
TATTGACCAT 
TATTGACCAT 
TATTGACCAT 
TATTGACCAT 
TATTGACCAT 
TATTGACCAT 
TATTGACCAT 



250 

ATT CAACTAG 
ATTCAACTAG 
ATTCAACTAG 
ATTCAACTAG 
ATTCAACTAG 
ATTCAACTAG 
ATTCAACTAG 
ATTCAACTAG 
ATTCAACTAG 
ATTCAACTAG 



msa31912 .2{338_18RS2l) 
msa31912 . 2 {338_2603 } 



251 300 
CTCTAAAACC TGTTAATGTA AGGTTCGGCC TCGGTACAGG AAACATTATA 
CTCTAAAACC TGTTAATGTA AGGTTCGGCC TCGGTACAGG AAACATTATA 
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msa31912. 2(338 A909 
msa31912.2{338~H36B 
msa31912.2{338_JM9130013 
msa3 19 1 2 . 2 { 3 3 8_COHl 
msa3 1912 . 2 ( 338_M732 
msa31912.2{338_M781 
msa31912.2{338_090 
msa31912.2{338_CJB110 \ 
Consensus 



msa31912.2{338_18RS2l) 
msa31912 . 2 { 338_2603 > 
tnsa3 1 9 1 2 . 2 ( 3 3 8_A9 0 9 > 
msa3 1 91 2 . 2 { 3 3 6_H3 6B > 
msa3 1 912 . 2 { 3 3 8_JM913 0 0 13 J 
ras a31912 . 2 (338_COHl> 
msa31912 . 2 ( 338_M732 } 
msa31912.2{338_M78l} 
msa31912.2{338_090) 
msa31912.2{338_CJB110) 
Consensus 



msa31912 . 2 {338_18RS21 
msa31912 . 2 ( 338_2603 
msa3 1912 . 2 { 3 3 8_A9 0 9 
msa31912 . 2 (338_H36B 
msa31912 . 2 {338_JM9130013 
msa31912 . 2 ( 338_COHl 
msa3 19 12 . 2 ( 3 3 8_M7 32 
msa31912 . 2 {338JM781 
msa3 19 12 . 2 { 3 3 8_0 90 
msa31912.2{338_CJB110! 

Consensus 



msa31912.2{338_18RS21 
rasa31912 . 2 (338_2603 
msa31912 . 2 <338_A909 
msa31912 . 2 (338_H36B 
tnsa31912.2{338_JM9130013' 
TOSa31912 . 2 ( 338_C0H1 
msa3 1912 . 2 { 338_M732 f 
tnsa31912 . 2 {338_M781 
msa31912.2{338_090 
msa3 1912 . 2 { 338_CJB110 [ > 
Consensus 



msa31912.2{338_18RS21 
msa31912.2(338_2603 
msa31912.2(338_A909 
ma a3 1 9 1 2 . 2 { 3 3 8__H3 6B 
msa3 1912 . 2 { 338_JM9130013 f 
msa31912 . 2 (338_COHl \ 
msa31912. 2(338 M732'f 
rasa31912.2{338~OT81> 
tnsa31912.2{338_090 \ 
msa31912.2{338_CJB110 \ 
Consensus 



msa31912.2(338_18RS21 
msa31912 . 2 f 338_2603 
msa31912.2f338_A909 
iusa31912.2(338_H36B ( 
msa31912 . 2 { 338_JM9130013 
msa31912 . 2(338_C0H1 
msa31912 . 2(338_M732 
msa31912-2{338_M781 \ 
msa31912 . 2 { 338_090 f 
msa31912.2{33B_CJB110j 
Consensus 



msa31912.2{338_18RS21 
msa31912 . 2 (338_2603 
msa31912. 2(338 A909 
msa31912.2{338 H36B 
insa3 1912 . 2 { 338_JM9130013 
msa31912, 2(338 COH1 
msa31912.2(338 M732 



CTCTAAAACC TGTTAATGTA AGGTTCGGCC TCGGTACAGG AAACATTATA 
CTCTAAAACC TGTTAATGTA AGGTTCGGCC TCGGTACAGG AAACATTATA 
CTCTAAAACC TGTTAATGTA AGGTTCGGCC TCGGTACAGG AAACATTATA 
CTCTAAAACC TGTTAATGTA AGGTTCGGCC TCGGTACAGG AAACATTATA 
CTCTAAAACC TGTTAATGTA AGGTTCGGCC TCGGTACAGG AAACATTATA 
CTCTAAAACC TGTTAATGTA AGGTTCGGCC TCGGTACAGG AAACATTATA 
CTCTAAAACC TGTTAATGTA AGGTTCGGCC TCGGTACAGG AAACATTATA 
CTCTAAAACC TGTTAATGTA AGGTTCGGCC TCGGTACAGG AAACATTATA 



301 350 
ACATCCATCA ATTcAAATGA AAGTATCGGT GCTGATGGTC CTGCCTACTG 
ACATCCATCA ATTcAAATGA AAGTATCGGT GCTGATGGTC CTGCCTACTG 
ACATCCATCA ATTcAAATGA AAGTATCGGT GCTGATGGTC CTGCCTACTG 
ACATCCATCA ATTcAAATGA AAGTATCGGT GCTGATGGTC CTGCCTACTG 
ACATCCATCA ATTcAAATGA AAGTATCGGT GCTGATGGTC CTGCCTACTG 
ACATCCATCA ATTcAAATGA AAGTATCGGT GCTGATGGTC CTGCCTACTG 
ACATCCATCA ATTcAAATGA AAGTATCGGT GCTGATGGTC CTGCCTACTG 
ACATCCATCA ATTcAAATGA AAGTATCGGT GCTGATGGTC CTGCCTACTG 
ACATCCATCA ATTtAAATGA AAGTATCGGT GCTGATGGTC CTGCCTACTG 
ACATCCATCA ATTcAAATGA AAGTATCGGT GCTGATGGTC CTGCCTACTG 



351 400 
GCATGCTCGC TCAGCTATTA ATCATATACA TGATAAAAAT GATTATGGAA 
GCATGCTCGC TCAGCTATTA ATCATATACA TGATAAAAAT GATTATGGAA 
GCATGCTCGC TCAGCTATTA ATCATATACA TGATAAAAAT GATTATGGAA 
GCATGCTCGC TCAGCTATTA ATCATATACA TGATAAAAAT GATTATGGAA 
GCATGCTCGC TCAGCTATTA ATCATATACA TGATAAAAAT GATTATGGAA 
GCATGCTCGC TCAGCTATTA ATCATATACA TGATAAAAAT GATTATGGAA 
GCATGCTCGC TCAGCTATTA ATCATATACA TGATAAAAAT GATTATGGAA 
GCATGCTCGC TCAGCTATTA ATCATATACA TGATAAAAAT GATTATGGAA 
GCATGCTCGC TCAGCTATTA ATCATATACA TGATAAAAAT GATTATGGAA 
GCATGCTCGC TCAGCTATTA ATCATATACA TGATAAAAAT GATTATGGAA 



401 450 
CAGTTCAAGT AGCTATTTGC CTTGATGATG AAGACCAAAA CCTTGAATTA 
CAGTTCAAGT AGCTATTTGC CTTGATGATG AAGACCAAAA CCTTGAATTA 
CAGTTCAAGT AGCTATTTGC CTTGATGATG AAGACCAAAA CCTTGAATTA 
CAGTTCAAGT AGCTATTTGC CTTGATGATG AAGACCAAAA CCTTGAATTA 
CAGTTCAAGT AGCTATTTGC CTTGATGATG AAGACCAAAA CCTTGAATTA 
CAGTTCAAGT AGCTATTTGC CTTGATGATG AAGACCAAAA CCTTGAATTA 
CAGTTCAAGT AGCTATTTGC CTTGATGATG AAGACCAAAA CCTTGAATTA 
CAGTTCAAGT AGCTATTTGC CTTGATGATG AAGACCAAAA CCTTGAATTA 
CAGTTCAAGT AGCTATTTGC CTTGATGATG AAGACCAAAA CCTTGAATTA 
CAGTTCAAGT AGCTATTTGC CTTGATGATG AAGACCAAAA CCTTGAATTA 



451 500 
ACACTAAATA GTCTC ATTTC AGCTGGTGAT TTTATCAAGT CAAAATGGAC 
ACACTAAATA GTCTCATTTC AGCTGGTGAT TTTATCAAGT CAAAATGGAC 
ACACTAAATA GTCTCATTTC AGCTGGTGAT TTTATCAAGT CAAAATGGAC 
ACACTAAATA GTCTCATTTC AGCTGGTGAT TTTATCAAGT CAAAATGGAC 
ACACTAAATA GTCTCATTTC AGCTGGTGAT TTTATCAAGT CAAAATGGAC 
ACACTAAATA GTCTCATTTC AGCTGGTGAT TTTATCAAGT CAAAATGGAC 
ACACTAAATA GTCTCATTTC AGCTGGTGAT TTTATCAAGT CAAAATGGAC 
ACACTAAATA GTCTC ATTT C AGCTGGTGAT TTTATCAAGT CAAAATGGAC 
ACACTAAATA GTCTCATTTC AGCTGGTGAT TTTATCAAGT CAAAATGGAC 
ACACTAAATA GTCTCATTTC AGCTGGTGAT TTTATCAAGT CAAAATGGAC 



501 550 
TACaAACCAT TTTCAAATGC TTGAGCACTT AATACTTCAA GATAATTATC 
TACaAACCAT TTT CAAATGC TTGAGCACTT AATACTTCAA GATAATTATC 
TACaAACCAT TTT CAAATGC TTGAGCACTT AATACTTCAA GATAATTATC 
TACaAACCAT TTTCAAATGC TTGAGCACTT AATACTTCAA GATAATTATC 
TACaAACCAT TTTCAAATGC TTGAGCACTT AATACTTCAA GATAATTATC 
TACaAACCAT TTTCAAATGC TTGAGCACTT AATACTTCAA GATAATTATC 
TACaAACCAT TTTCAAATGC TTGAGCACTT AATACTTCAA GATAATTATC 
TACaAACCAT TTTCAAATGC TTGAGCACTT AATACTTCAA GATAATTATC 
TACaAACCAT TTTCAAATGC TTGAGCACTT AATACTTCAA GATAATTATC 
TACtAACCAT TTTCAAATGC TTGAGCACTT AATACTTCAA GATAATTATC 



551 600 
AAGAACAATT TCAACATCAA AAGTTAGCCC AACTGGAAAA TATTGAACCT 
AAGAACAATT TCAACATCAA AAGTTAGCCC AACTGGAAAA TATTGAACCT 
AAGAACAATT TCAACATCAA AAGTTAGCCC AACTGGAAAA TATTGAACCT 
AAGAACAATT TCAACATCAA AAGTTAGCCC AACTGGAAAA TATTGAACCT 
AAGAACAATT TCAACATCAA AAGTTAGCCC AACTGGAAAA TATTGAACCT 
AAGAACAATT TCAACATCAA AAGTTAGCCC AACTGGAAAA TATTGAACCT 
AAGAACAATT TCAACATCAA AAGTTAGCCC AACTGGAAAA TATTGAACCT 
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msa31912 . 2 {338_M78l} 
msa3 19 12 . 2 { 33 8.J>90 } 
JB110) 
Consensus 



AAGAACAATT TCAACATCAA AAGTTAGCCC AACTGGAAAA TATTGAACCT 
AAGAACAATT TCAACATCAA AAGTTAGCCC AACTGGAAAA TATTGAACCT 
msa3 1912.2 { 338_CJB110 } AAGAACAATT TCAACATCAA AAGTTAGCCC AACTGGAAAA TATTGAACCT 



msa3 19 12 . 2 { 336_18RS21 
msa31912 . 2 (338_2603 
msa31912.2{338 A909 
msa31912.2{338~H36B 
msa31912 . 2 {338_JM9 130013 
msa31912.2(338 COH1 
msa31912.2(338~M732 
tnaa31912.2{338 K781 
msa3 19 12 . 2 { 33 8_090 
rasa31912 . 2 { 338_CJB110 
Consensus 



€01 

AGTGCGCTGA 
AGTGCGCTGA 
AGTGCGCTGA 
AGTGCGCTGA 
AGTGCGCTGA 
AGTGCGCTGA 
AGTGCGCTGA 
AGTGCGCTGA 
AGTGCGCTGA 
AGTGCGCTGA 



CTAAACGCCT 
CTAAACGCCT 
CTAAACGCCT 
CTAAACGCCT 
CTAAACGCCT 
CTAAACGCCT 
CTAAACGCCT 
CTAAACGCCT 
CTAAACGCCT 
CTAAACGCCT 



TAAAGCAAGC 
TAAAGCAAGC 
TAAAGCAAGC 
TAAAGCAAGC 
TAAAGCAAGC 
TAAAGCAAGC 
TAAAGCAAGC 
TAAAGCAAGC 
TAAAGCAAGC 
TAAAGCAAGC 



GGTCTGAAGA 
GGTCTGAAGA 
GGTCTGAAGA 
GGTCTGAAGA 
GGTCTGAAGA 
GGTCTGAAGA 
GGTCTGAAGA 
GGTCTGAAGA 
GGTCTGAAGA 
GGTCTGAAGA 



650 

TTTACTTAAG 
TTTACTTAAG 
TTTA CTTAAG 
TTTA CTTAAG 
TTTACTTAAG 
TTTACTTAAG 
TTTA CTTAAG 
TTTA CTTAAG 
TTTACTTAAG 
TTTACTTAAG 



msa31912.2{338_18RS21 
msa31912.2{338 2603 
msa3 1912 . 2 { 338~A909 
msa31912 . 2 (338_H36B 
msa31912 . 2{338_JM9130013 
msa31912 .2f 338_C0H1 
msa31912.2?338 M732 
msa3 1912. 2 {33835781 
msa31912 .2{338_090 
msa3 1912 . 2 { 338 jCJBHO 
Consensus 



651 

AACGAGAACA 
AACGAGAACA 
AACGAGAACA 
AACGAGAACA 
AACGAGAACA 
AACGAGAACA 
AACGAGAACA 
AACGAGAACA 
AACGAGAACA 
AACGAGAACA 



CAGGCAGCCG 
CAGGCAGCCG 
CAGGCAGCCG 
CAGGCAGCCG 
CAGGCAGCCG 
CAGGCAGCCG 
CAGGCAGCCG 
CAGGCAGCCG 
CAGGCAGCCG 
CAGGCAGCCG 



ATCTATTAGT 
ATCTATTAGT 
ATCTATTAGT 
ATCTATTAGT 
ATCTATTAGT 
ATCTATTAGT 
ATCTATTAGT 
ATCTATTAGT 
ATCTATTAGT 
ATCTATTAGT 



TAAAAGTTGC 
TAAAAGTTGC 
TAAAAGTTGC 
TAAAAGTTGC 
TAAAAGTTGC 
TAAAAGTTGC 
TAAAAGTTGC 
TAAAAGTTGC 
TAAAAGTTGC 
TAAAAGTTGC 



700 

ACTCAAACTA 
ACTCAAACTA 
ACTCAAACTA 
ACTCAAACTA 
ACTCAAACTA 
ACTCAAACTA 
ACTCAAACTA 
ACTCAAACTA 
ACTCAAACTA 
ACTCAAACTA 



msa31912.2{338_18RS21 
msa31912 .2f 338_2603 
msa31912.2{338_A909 ► 
msa31912.2{338 H36B ) 
msa31912.2{338 JM9130013 \ 
msa31912 .2{338_C0H1> 
msa31912. 2(338 M732 
msa31912 -2{338~M781 
msa31912.2{338 090 
msa31912.2{338_CJB110 ) 
Consensus 



701 720 
AAGGGGGAAG CTATGATTTC 
AAGGGGGAAG CTATGATTTC 
AAGGGGGAAG CTATGATTTC 
AAGGGGGAAG CTATGATTTC 
AAGGGGGAAG CTATGATTTC 
AAGGGGGAAG CTATGATTTC 
AAGGGGGAAG CTATGATTTC 
AAGGGGGAAG CTATGATTTC 
AAGGGGGAAG CTATGATTTC 
AAGGGGGAAG CTATGATTTC 



SEQ ZD NO. 7311 
STRAIN 2603 frame: 1 

LSAI IDKKWIFMYLALIGDI INSKQI LERETFQQS FQQLMTELSDVYGEEL I SPFTITA 
GDEFQALLKPSKKVFQI IDHIQLALKPVNVRFGLGTGNI ITS INSNES IGADGPAYWHAR 
SA I NH I HDKND YGTVQVAI CLDDEDQNI1EI1TI1NS L I SAGD P I KSKWTTNHFQMIiEHL I LQ 
DNYQEQFQHQKLAQLENI E PSALTKRLKASGL KI YIjRTRTQAADIjIjVKS CTQTKGG S YD P 

SEQ ID NO. 7312 
STRAIN 090 frame: 1 

SAI IDKKWI FMYLALIGDI INSKQI LERETFQQS FQQLMTELSDVYGEEL I SPFTITAG 
DBFQALLKPSKKVFQI IDHIQLALKPVNVRFGLGTGNI ITS I NLNES I GADGPAYWHARS 
AI NH I HDKND YGTVQVAI CLDDHDQNLELTLNSL I SAGD F I KS KWTTNHFQMLEHL I LQD 
NYQEQFXJHQKLAQLENIEPSALTKRLKASGLKlYIjRTRTQAADLLVKSCTQT 

SEQ ID NO. 73X3 
STRAIN A909 frame: 1 

SAI IDKKWIFMYLALIGDI INS KQ I LERET FQQS FQQLMTELSDVYGEEL I SPFTITAG 
DBFQALLKPSKKVFQI IDHIQLALKPVNVRFGLGTGNI ITS INSNES IGADGPAYWHARS 
AINHI HDKND YGTVQVAI CLDDEDQNLELTLNS L I SAGD F I KS KWTTNHFQMLEHL I LQD 
NYQEQFQHQKLAQLBNI EPSALTKRLKASGLKI YLRTRTQAADLL VKSCTQTKGGS YDF 

SEQ ID NO. 7314 
STRAIN H36B frame: 1 

SAI IDKKWIFMYLALIGDI INS KQILERETFQQSFQQLMTELSDVYGEELI SPFTITAG 
DEFQALLKPSKKVFQ I IDHIQLALKPVNVRFGLGTGNI ITS INSNES I GADGPAYWHARS 
AI NH I HDKND YGTVQVAI CLDDEDQNLELTLNSL I SAGDF I KSKWTTNHFQMLEHLI LQD 
NYQEQFQHQKLAQLBNI EPSALTKRLKASGLKI YLRTRTQAADLLVKS CTQTKGGSYD F 

SEQ ID NO. 7315 
STRAIN 18RS21 frame: I 

SAI IDKKWIFMYLALIGDI INS KQ I LERETFQQS FQQLMTELS DVYGEEL I S P FT I TAG 
DBFQALLKPSKKVFQI IDHIQLALKPVNVRFGLGTGNI ITS INSNES IGADGPAYWHARS 
A I NH I HDKND YGTVQVAI CLDDEDQNLELTLNSL I SAGDF I KSKWTTNHFQMLEHLI LQD 
NYQEQFQHQKLAQLBNI EPS ALTKRLKASGIiK I YLRTRTQAADLLVKS CTQTKGGSYD F 

SEQ ID NO. 7316 
STRAIN M732 frame: 1 

SAI IDKKWIFMYLALIGDI I NSKQ I LERETFQQSFQQLMTELSDVYGEELI SPFTITAG 
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DEFQALLKQSKKVFQI IDHIQLALKPVNVRFGLGTGNI ITSINSNBSIGADGPAYWHARS 
AINHI HDKND YGTVQVAI CLDDEDQNLELTLNSL I SAGD PIKS KWTTNHFQMLBHLI LQD 
NYQEQFQHQKLAQLENI EPSALTKRLKASGLKI YLRTRTQAADLLVKSCTQTKGGSYDF 

SEQ ID HO. 7317 
STRAIN COH1 frame: 1 

SAI I DKKVVI FMYIALIGD I INSKQILERETFQQSFQQLMTELSDVYGEELI SPFTITAG 
DEFQALLKQSKKVFQI I DH I QLALKPVNVRFGLGTGN I ITS INSNESIGADGPAYWHARS 
A I NH I HDKNDYGTVQVAI CLDDEDQNLELTLNSL I SAGDF I KS KWTTNHFQMLEHLI LQD 
NYQEQFQHQKIaAQLENIEPSALTKRLKASGLKIYIiOT 

SEQ XD NO. 7318 
STRAIN M781 Game: 1 

SAIIDKKWI FMYLALIGDI I NS KQ I LERBT FQQ S FQQLMTEL SD VYGEEL I SPFTITAG 
DEFQALLKQSKKVFQI IDHIQLALKPVNVRFGLGTGNI ITSINSNBSIGADGPAYWHARS 
AI NH IHDKNDYGTVQVA I CLDDBDQNLELTLNSL I SAGD FI KS KWTTNHFQMLEHLI LQD 
NYQEQFQHQKIAQLBNIEPSALTKRIjKASGLKIYLRTRTQAADL^ 

SEQ XD HO. 7319 
STRAIN CJB110 frame: I 

SAIIDKKVVVFMYLALIGDIINSKQILERETFQQSFQQIjMTE 

DEPQALLKPSKKVFQI IDHIQLALKPVNVRFGLGTGNI ITS INSNESIGADGPAYWHARS 
AINHIHDKNDYGTVQVAI CLDDEDQNLELTLNSL I SAGDF I KS KWTTNHFQMLEHLI LQD 
NYQEQFQHQKLAQLEN I EP SALTKRLKASGLKI YLRTRTQAADLLVKSCTQTKGGSYDF 

SEQ XD NO. 7320 
STRAIN JM9 130013 frame: 1 

SAI I DKKWI FMYLALIGDI INSKQI LERETFQQSFQQLMTELSDVYGEELI SPFTITAG 
DEFQALLKPSKKVFQI IDHIQLALKPVNVRFGLGTGNI ITSINSNBSIGADGPAYWHARS 
AI NH I HDKNDYGTVQVAI CLDDEDQNLELTLNSL I SAGDF IKS KWTTNHFQMLEHLI LQD 
NYQEQFQHQKLAQLENI EP SALTKRLKASGLKI YIiRTRTQAADLLVKS CTQTKGGSYDF 

PRETTY of: /biotmp/msa32053 .2 { *} February 18, 2003 08:25 . 



msa32053.2{338_18RS21 
msa32053.2{338_2603 
msa32053.2{338_A909 
msa32053 . 2 { 338_CJB110 
msa32053.2(338_COHl 
msa32053.2{338_H36B 
msa32053.2{338_JM9130013 
msa32053.2{338_M732 
msa32053.2{33B_M781 
msa32053.2{338_090 
Consensus 



-SAIIDKKW 
1SAIIDKKW 
-SAIIDKKW 
-SAIIDKKW 
-SAIIDKKW 
-SAIIDKKW 
-SAIIDKKW 
-SAIIDKKW 
-SAIIDKKW 
-SAIIDKKW 



iFMYLALIGD 
iFMYLALIGD 
iFMYLALIGD 
vFMYLALIGD 
IFMYLALIGD 
iFMYLALIGD 
iFMYLALIGD 
iFMYLALIGD 
iFMYLALIGD 
iFMYLALIGD 



I INSKQI LER 
I INSKQI LER 
I INSKQI LER 
I INSKQI LER 
I INSKQI LER 
IINSKQILER 
I INSKQI LER 
IINSKQILER 
IINSKQILER 
IINSKQILER 



ETFQQSFQQL 
ETFQQSFQQL 
ETFQQSFQQL 
ETFQQSFQQL 
ETFQQSFQQL 
ETFQQSFQQL 
ETFQQSFQQL 
ETFQQSFQQL 
ETFQQSFQQL 
ETFQQSFQQL 



50 

MTELSDVYGE 
MTELSDVYGE 
MTELSDVYGE 
MTELSDVYGE 
MTELSDVYGE 
MTELSDVYGE 
MTELSDVYGE 
MTELSDVYGE 
MTELSDVYGE 
MTELSDVYGE 



msa320S3.2{ 
msa32053. 
msa32053 

msa32053.2{ 
raaa32053 
maa32053 
msa32053.2{338 
rasa32053. 
maa32053 
msa32053 



338_1BRS21 
2{338_2603 
2{338_A909 
338_CJB110 
2{338_COHl 
2{33B_H36B 
_JM9130013 
2{338_M732 
2{338_M781 
.2{338_090 
Consensus 



51 

ELI SpFTITA 
ELISpFTITA 
ELI SpFTITA 
ELIS1FTITA 
ELISpFTITA 
ELISpFTITA 
ELISpFTITA 
ELISpFTITA 
ELISpFTITA 
ELISpFTITA 



GDEFQALLKp 
GDEFQALLKp 
GDEFQALLKp 
GDEFQALLKp 
GDEFQALLKq 
GDEFQALLKp 
GDEFQALLKp 
GDEFQALLKq 
GDEFQALLKq 
GDEFQALLKp 



SKKVFQIIDH 
SKKVFQIIDH 
SKKVFQIIDH 
SKKVFQIIDH 
SKKVFQIIDH 
SKKVFQIIDH 
SKKVFQIIDH 
SKKVFQIIDH 
SKKVFQIIDH 
SKKVFQIIDH 



IQLALKPVNV 
IQLALKPVNV 
IQLALKPVNV 
IQLALKPVNV 
IQLALKPVNV 
IQLALKPVNV 
IQLALKPVNV 
IQLALKPVNV 
IQLALKPVNV 
IQLALKPVNV 



100 

RFGLGTGNII 
RFGLGTGNI I 
RFGLGTGNII 
RFGLGTGNII 
RFGLGTGNII 
RFGLGTGNII 
RFGLGTGNII 
RFGLGTGNII 
RFGLGTGNII 
RFGLGTGNII 



msa32053.2{338JL8RS21 
msa32053.2{338_2603 
msa32053.2{338_A909 
msa32053.2{338_CJB110 
msa32053.2(33B_COHl 
msa32053.2{33B_H36B 
Itisa32053 . 2 {338_JM9130013 
rasa32053.2(338_M732 
msa32053.2{338_M781 
msa32053.2{338_090 
Consensus 



101 

TSINsNESIG 
TSINSNESIG 
TSINsNESIG 
TSINsNESIG 
TSINsNESIG 
TSINsNESIG 
TSINsNESIG 
TSINsNESIG 
TSINsNESIG 
TSIN1NESIG 



ADGPAYWHAR 
ADGPAYWHAR 
ADGPAYWHAR 
ADGPAYWHAR 
ADGPAYWHAR 
ADGPAYWHAR 
ADGPAYWHAR 
ADGPAYWHAR 
ADGPAYWHAR 
ADGPAYWHAR 



SAINHIHDKN 
SAINHIHDKN 
SAINHIHDKN 
SAINHIHDKN 
SAINHIHDKN 
SAINHIHDKN 
SAINHIHDKN 
SAINHIHDKN 
SAINHIHDKN 
SAINHIHDKN 



DYGTVQVAIC 
DYGTVQVAIC 
DYGTVQVAIC 
DYGTVQVAIC 
DYGTVQVAIC 
DYGTVQVAIC 
DYGTVQVAIC 
DYGTVQVAIC 
DYGTVQVAIC 
DYGTVQVAIC 



150 

LDDBDQNLBL 
LDDEDQNLEL 
LDDEDQNLEL 
LDDEDQNLEL 
LDDEDQNLEL 
LDDEDQNLEL 
LDDEDQNLEL 
LDDEDQNLEL 
LDDEDQNLEL 
LDDEDQNLEL 



msa32053.2{338_18RS21 
msa32053 . 2 (338_2603 
msa32 053 . 2 { 338_A909 

msa32053.2{338_CJB110 
tnsa32053.2(33B_COHl 
msa3 2 0 5 3 . 2 { 3 3 B_H3 6B 
2053.2(338 JM9130013 
msa32053 . 2 ( 338_M732 
msa32053 . 2 (338_M781 



151 

TLNSLISAGD 
TLNSLI SAGD 
TLNSLISAGD 
TLNSLISAGD 
TLNSLISAGD 
TLNSLISAGD 
TLNSLISAGD 
TLNSLISAGD 
TLNSLISAGD 



FIKSKWTTNH 
FIKSKWTTNH 
FIKSKWTTNH 
FIKSKWTTNH 
FIKSKWTTNH 
FIKSKWTTNH 
FIKSKWTTNH 
FIKSKWTTNH 
FIKSKWTTNH 



FQMLEHLILQ 
FQMLBHLILQ 
FQMLEHLILQ 
FQMLEHLILQ 
FQMLBHLILQ 
FQMLEHLILQ 
FQMLEHLILQ 
FQMLEHLILQ 
FQMLEHLILQ 



DNYQEQFQHQ 
DNYQEQFQHQ 
DNYQEQFQHQ 
DNYQEQFQHQ 
DNYQEQFQHQ 
DNYQEQFQHQ 
DNYQEQFQHQ 
DNYQEQFQHQ 
DNYQEQFQHQ 



200 

KLAQLENIEP 
KLAQLENIEP 
KLAQLENIEP 
KLAQLENIEP 
KLAQLENIEP 
KLAQLENIEP 
KLAQLENIEP 
KLAQLENIEP 
KLAQLENIEP 
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msa32053.2{338_090} 
Consensus 



TLNSLISAGD FIKSKWTTNH FQMLEHLILQ DNYQBQFQHQ KLAQLENIEP 



msa32053.2{33B 18RS21 
rasa32053.2(338_2603 
msa32053 . 2 { 338_A909 
msa32053 .2{338_CJB110 
msa32053.2(338_COHl 
msa32 053 . 2 { 33 8_H3 6B 
msa32053 . 2 {338_JM9130013 
maa32053.2f338_M732 
msa32053.2(338_M781 
msa32053. 2 {338^090 
Consensus 



201 

SALTKRLKAS 
SALTKRLKAS 
SALTKRLKAS 
SALTKRLKAS 
SALTKRLKAS 
SALTKRLKAS 
SALTKRLKAS 
SALTKRLKAS 
SALTKRLKAS 
SALTKRLKAS 



GLKIYLRTRT* 
GLKIYLRTRT 
GLKIYLRTRT 
GLKIYLRTRT 
GLKIYLRTRT 
GLKIYLRTRT 
GLKIYLRTRT 
GLKIYLRTRT 
GLKIYLRTRT 
GLKIYLRTRT 



QAADLLVKSC 
QAADLLVKSC 
QAADLLVKSC 
QAADLLVKSC 
QAADLLVKSC 
QAADLLVKSC 
QAADLLVKSC 
QAADLLVKSC 
QAADLLVKSC 
QAADLLVKSC 



240 

TQTKGGSYDF 
TQTKGGSYDF 
TQTKGGSYDF 
TQTKGGSYDF 
TQTKGGSYDF 
TQTKGGSYDF 
TQTKGGSYDF 
TQTKGGSYDF 
TQTKGGSYDF 
TQTKGGSYDF 
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SEQ ID NO. 7401 
STRAIN 2603 

ATGGAAATGCAAGTTCAAJUVAAGTTTT^ 
CTAGTCCCIAACTCCAATTGGTAATCTAGATGATATGA 
AGAGAAGTTGATTTTATTTGTGCAGAGGATACAayUUVTA 
TTTGATATTACTACTAAACAAATTAGTTTTCAOGAACACAATC 

GGGTTAATTGATTTGTTAAAAGAAGGGAAATCTTTAG CC CAAGTATCTG ATG CAGGAATG 

CCCTCTATTTCTGACCCAGGACATGACCITGTC^GGCTGCT 

GTTGTATCTATACCAGGAGCTAGCGCTGOTATTACT 

CCACAACCTGATATTTTTTATGGCTTCTTACCTOGTAAG 

TTTGAAACAAAGCAAGATTACCCTGAAACACAAATCTTTTAT^ 

TCTGATACG CTAAAACACATGAAAG AGATTTACGGAGAT CGCCAAGTTGT^ C 

GAATTGACXsAAACTCTATGAAGAGTATCAAAGAGGAACXIA 

ATTGAAAAGGTCCCrCrCAAAGGTGAATGCTTAATTATTGTTGAT^ 

GAGCGAGTGAAAGACAGTAGCCAACAAGATCX1AGTAGTATTAGTAA 

AATGGTGATAAAACTAATCAAGCGATAAAAAAAGTAGCAAAAGAAT^ 

CAAGAACTCTATGCTAGTTTCCATGATTTA 

SEQ ZD NO. 7402 
STRAIN 090 

GAAATGCAAGTT<aAAAAAGTTTTAAATCAAATAC^ 

CTATCTAGTCCCAACTCCAATTGGTAATCTAGAT^ 

CCATTAGGATTTTAAGAGAAGTTGATTTTAT^ 

AATACGGGACTTTTACTCAAGCACITTGATA 

TTTTCACX3AACACAATGCTTACGATAAAATCrCTGGGTTAA 

TAAAAGAAGGGAGATCTTTAGCCCAAGTATCTGATGCAGGAATC 

ATT^CTGACCCAGgACATGACCTTGTC^ 

CCCGGTCGTATCTATACCAGGAGCTAGCX5CTGGTATTACTGCTCT 

CTTCAGGTTTAGCTCCACAACCTCATATTTT 

AAGAAAGGTCAACAAATAACTTTTTTTGAAACAAAGAA 

AACACAAATCTTTTATGAGTCACCG tTTCGAGTCTcTGATACXSCTAAAAC 

ACATGAAAGAGATTTACGGAGATCGCCAAGTTGTTT^ 

ACGAAa CTCTATGAAGAGT ATCAAAGAGGAAC CATTAGT CAACTTTTAGG 

GCATATTGAAAAAGTCCCTCTCAAAGGTGAATGCTTAATTATTGT^ 

GTAAGAGAGATACCGAGCGAGTGAAAGACAGTAGCCAACAAGATCCACTA 

GTATTAGTAA 

SEQ ID NO. 7403 
STRAIN A909 

AGTTCAAAAAAGTTTTAAATCAAATATACATTACGGAACACTCTATCTAG 

TCCCAACTCCAAXTGGTAATCTAGATGATATGACTT^ 

ATTTTAAGAGAAGTTGATTTTATTTGTG 

AL;rri _ rACrCAAGCAu - l"rit^TATTACTACTAAACAAATTAU'rri"rC^CG 
AACACAATGCTTACGATAAAATCrCTGGGTTAATTGAu-lU\il"l'AAAAGAA 
GGGAAATCrriAGCCCAAGTATCTOATGCAGGAATGCCCTCTATrrClt^ 
CCCAGGACATGACCTTGTCAAGGCTGCTATTGAAGGGGA 
» TATCTATACCAGGAGCTAG CGCTGGTATTACIt3CTCTCATCGCTTCAGGT 
TTAG CTC CACAACCTCAT ATTTTTTATGG CTT CTT AC CACGTAAGAAAGG 
TCAACAAATAACTlTLU-lU'gAAACAAAGCAAGATTACCCTGAAACACAAA 
TCITITATGAGTCACCGTTTCGAGTCTCtGATACGCT 
GAGATTTACGGAGATCGCCAAGTTGTTTTAGTACGCGAATTGACGA 
CTATGAAGAGTATCAAAGAGGAACCATTAGTCAACITITAGAGCATATTC 
AAAAGGTCCCTCrCAAAGGTGAATGCTTAATTATT^ 
GA3ACCGAGCX3AGTGAAAGACAGTAX3CCAACAAGATCCACTAGTATTAOT 
AA 

SEQ ZD NO* 7404 

STRAIN H36B 

GAAATGCAAGTTCAAAAAAGTTTTAAATCAAATACACATT 

ACGGGACACTCTATCTAGTCCCAACTCCAATTGGTAATCTAGATGATATG 

ACTTTTCGTGCCATTAGGATTTTAAGAgAAGTC 

GGATACA03AAATACGGGACTTTTACTCAAGCACTTTGATATTACTACTA 
AACAAATTAGTTTTCAC<5AACACAATGCTTATGATAAAATCT 
ATTGATTTGTTAAAAGAAGGGAGATCTTTAGCCCAAGTATCTG^ 
AATGCCCTCTATTTCTGAGCCAGGACATGACCTTC 

AAGGGGATATCCCGGTCOTATCTATACCAGGAGCTAGCGCrcGTATTACT 
GCTCTCATCGCITCAGGTTTAGCrCCACAACC^ 

CTTAC^OGTAAGCAAGGTCAACAAATAACTTTrTTTGAAACAAAGAAAO 

ATTACCCTGAAACACAAATCTTTT ATGAGTCACCG t TTCGAGTCTCTGAT 

ACX3CTAAAACACATGAAAGAGATTTATGGAGATCGCCAAG u ri^"rriTAGT 

ACGCGAATIt3ACGAAACTCTATGAAGAGTATC^ 

AACTTTTAGGGCATATTGAAAAGGTCCCTCTCAAAGGTGA^ 

ATTGTTGATGGTAAGAGAGATACTGAGCGAGTGAAAGACAGTAGCCAACA 

AGATCCACTAGTATTAGTAA 

SEQ ID NO. 7405 
STRAIN 18RS21 

GAAATGCAAGTTCAAAAAAGTTTTAAATCAAATATACATT 

ACGGAACACTCTATCTAGTCXXIAACrCCAATTGGTAATCTA 

ACl'l'i't CGTGCCATTAGGATTTTAAGAGAAGTTG^ • 

GgATACACGAAATACXKK^CrriUACTCAAGCACTTTGATATTACTACTA 

AACAAATTAGTITTCACGAACACAATG CTTACGATAAAATCTCTGGGTTA 

ATTG AlTlXJ'iT AAAAGAAGGGAAATCTTTAGCCCAAGTATCTGATGCAGG 
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AATCCCCTCTATTTCTGACCCAGGACA^ 

AAGGGGATATCCCAGTT GTAT CTATACCAGGAi3CT 

GCTCTCATCGCTTCAGGTTTAGCTCCACAACCrrCATO 

CTTACCACX3TAAGAAAGGTCAACAAATAACTTTC t TTGAAACAAAGCAAG 

ATTACCCTGAAACACAAATCTTTTATGAGTCACCG tTT CGAGTCTCTGAT 

ACGCTAAAACACATGAAAGAGATTTACGGAGATCXSC^ 

ACGCGAATTGACGAAACTCTATGAAGAGTATCAAAGAGGAACCATTAGTC 

AACTTTTAGAGCATATTGAAAAGGTCCCTCTCAAAGGTGAATC 

ATTGTTGATGGTAAGAGAGATACCGAGCGAGTGAAAGACAGTAGCCAACA 

AGATCCACTAGTATTAGTAA 

SEQ IB NO. 7406 
STRAIN M732 

GAAATGCAAGTTCAAAAAAGTTTTAAATCAAAT 
ATACATTACGGAACACTCTATCTAGTCCCAACTCC^^ 
TGATATGACTTTTCXSTGCCATTAGGATTTT^ 
GTGCAGAGGATACACGAAATACGGGACTTTTACT 

ACTACTAAACAAATTAGTTTTCACGAACACAATG CTTACGATAAAATCTC 
TGGGTTAATTGATTTGTTAAAAGAAGGGAAATCTT^ 
ATGCAGGAATGCCCTCTATTTCTGACCCAGGACATGACXOT 
GCTATTGAAGGGGATATCCCAGTTGTATCTATACCAGGAGCTAGCGCTGG 
TATTACTGCTCTC^TCXS CITCAGGTTr A^ 
ATGGCTTCITACCACGTAAGAAAGGTCAACRAATAACTT^ 
AAGCAAGATTACCCTGAAACACAAATCTTTTATGAGTCACCGtTTCX^ 
CTCTGATACG CTAAAACACATGAAAGAGATTTACGGAGATCGCCAAGTTG 
TTTTAGTACG CGAATTGACX3AAACTCTATGAAGAGTAT(^AAGAGGAACC 
ATTAGTCAACTTTTAGAGCATATTGAAAAGGTCC CTCTCAAAGGTGAATG 
CITAATTATTGTTGATGGTAAGAGAGATACC^ 
GCCAACAAGATCCACTAGTATTAGTAA 

SEQ ID NO. 7407 
STRAIN COH1 

GAAATGCAAGTTCAAAAAAGTTTTaAATCAAATATACATTAC 

GGftA CRCTCTftTCTAGTOCCRACTC 

TTTTCGTGCCATTAGGATTTTAAGAGAAGTT^ 

ATACACGAAATACGGGAcTTTTACTOVAGCACTT^ 

CAAATTAGTTITCACGAACACAATGCTTAC^ 

TGATTTGTTAAAAGAAGGGAAATCTTTAGCC^ 

TGCCCTCTATTTCTGACCCAGGACATGACC^ 

GGGGATATCCCAGTTGTATCTATACCAGGAGCTAG CX3CTGGTATTACTG C 

TCTCATCGCTTCAGGTTTAG CT CX^CA^ 

TACCACGTAAGAAAGGTCAACAAATAAOT 

TACCCTGAAACACAAATCTTTTATGAGTCACCXStTTCGA^ 

GCTAAAACACATGARAGAGATTTACGGAGATCGCCAA GVIVrrri 'AGTAC 

GCGAATTGACXSAAACTCTATGAAGAGTATCAAAGAGGA^ 

CTTTTAGAGCATATTGAAAAGGTCCCTCTCAAAGGTGAA 

TGTTGATGGTAAGAGAGATACCGAGCGAGTGAAAGACAGTAGCCAACAAG 

ATCCACTAGTATTAGTAA ' 

SEQ ZD NO* 7408 
STRAIN M781 

AAATGCAAGTTCAAAAAAGTITTAAATCA 

TATCTAGTCCCAACTCTAATrGGTAATCrAGATGATATGA 

CATTAGGATTTTAAGAGAAGTTGATTTTA^ 

ATACGGgACTTTTACTCAAGCACITTGATA 

TTTCACGAACACAATGCTTACGA^ 

AAAAGAAGGGAAATCTTTAGCCCAAGTATCTGATGC^ 

TTTCTGACCCAGGAC^TGACCTTGTCAAGGC^ 

CCAGTTGTATCTATACCAGGAGCTAGCGCTGG^ 

TTCAGGTTTAGCTCCACAACCTCATATTTTTTATGGCTTCT^ 

AGAAAGGTCAACAAATAA CTTTC T TTG AAACAAAGCAAG^ 

ACACAAATCTTTTATGAGTCACCGTTTCGAGT cTcTGATACGCTAAAACA 

CATGAAAGAGATTTACGGAGATGGCCAAGTTGT^ 

CGAAACTCTATGAAGAGTATCAAAGAGGAACCATTA^ 

CATATTGAAAAGGTCCCTCTCAAAGGTGAATGCTTA^ 

TAAGAGAGATACCXSAGCGAGTGAAAGACAGTAGCCAACAAGATCCACTAG 

TATTAGTAA 

A 

SEQ ID NO. 7409 
STRAIN CJB 110 

GAAATGCAAGTTCAAAAAAGTTTTAAATCAAATACACATTACG 

TCTATCIAGTCCCAACTCCAATTGGTAATCTAGATGATATG^ 

GCCATTAGGATTTTAAGAGAAGTTGATTTTATTTGTGCA 

AAATAOGGGACTTTTACTCAAGCACTTTGATATTACT 

GTTTTCAOGAACACAATG CITACGATAAAATCTCTGGGTTAATTGATTTG 

TTAAAAGAAGGGAGATCTTT AG CCCAAGTATCTGATG CAGGAATGCCCTC 

TATTTCTGACCCAGGAaiTGACCTTGTCAAGGCT 

TCCCXyTIXXCTATCTATACCAGGAG CTAGCGCTGGTATTACTGCTCTCATC 

GCTTCAGGTTTAGCTCXACAACCTCATATTTTT^ 

TAAGAAAGGTCAACAAATAACTTTtTTTGAAACAA 

AAACACAAATCTtTTATGAGTCACCGtTTcG 

CACATGAAAGAGATTTACGGAGATCGCCAAGTTGTTTTAGT 
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GACGAAACTCTATQAAGAGTATCAAAGAGGAACCATTAGTCAACTTTTAG 
GGCATATTGAAAAAGTCCCTCT CAAAGGTGAATGCTT AATTATTGTTGAT 
GGTAAGAGAGATACCGAGCGAGTGAAAGACAGTAGCCAACAAGATCXACT 
AGTATTA6TAA 

SEQ ID NO. 7410 
STRAIN 1 169NT 

TGCAAGTTCAAAAAAGTTTTAAATCAAATACACATTATGGGACACTCT 
CTAGTCCCAACTCCAATTGGT AATCT AGA^ 

TAGGATTTTAAGAgAAGTTG aTTTTATTTGTGCAGAGGATACACGAAATA 
CXSGGACTTTTACTCAAGCACTTTGATaTTACTACTA 
CACGAACACAATG CTTACGATAAAATCTCrGGGTTAATTGATT t GTTAAA 
AGAAGGGAAATCTTTAGCCCAACTATCTGATGCAGGAATGCCCTCrAT^ 
CTGACCCAGGACATGACCTTGTCAAGGCTC 

AGGTTTAGCTCCACAACCTCATATTTTTTATG^ 

AAGGTCAACAAATAACTTTTTTTGAAACAAAGC^ 

CAAATCTTTTATGAGTCACCGtTTCGAGTCT^ 

GAAAGAGATTTAQSGAGATCGCCAAGTTGTTTTAGT^ 

AACTCTATGAAGAGTATC^U^GAGGAACC^TTaGTCAACTTrTAGAGCAT 

ATTGAAAAGGTCCCTCTCAAAGGTGAATGCTTAATTATTGtTGATGGTAA 

GAGAGAt aCCGAGCGAGTGAAAGACAGTAGCCAACAAGATCCACTAGTAT 

TAGTAA 

SEQ ZD NO. 741X 
STRAJNJM9 130013 

GAAATGCAAGTTCAAAAAAGTTTTAAATCAAATACACATrACGGGA 

CACTCTATCTAGTCCCAACrCCAATTGGTAATCT^ 

OSTGCCATTAGGATTTTAAGAGAAGlTGATTTTATTKnC 

ACGAAATACGGGACTTTTACTCAAGCACTTT^ 

TTAGTTTTCACGAACACAATGCTTATGATAAAATCTCnX^ 

TTGTTAAAAGAAGGGAGATCTTTAGCCCAAGTATCTGATGCAGGAATGCC 

CTCTATTTCrrGACCXIAGGACATGACCTTGTCAAGG C tGCTATTGAAGGGG 

ATATCCCGGTCGTATCTATACCAGGAGCTAGCGCTGGTATTACTGCTCTC 

ATCGCTTTCAGGTTTAGCTCCACAACCTCATATTTTTTAT^ 

GCCTAAGCAAGGTCAACAAATAACtTTTTTTGAAACAAAGA 

CTGAAACACAAATCri'l'iATGAGTCACCGTTTCGAGTCTCTG^ 

AAACACATGAAAGAGATTTATGGAGATCGCCAAGTTC 

ATTGACGAAACTCTATGAAGAGTATCAAaGAGGAACCATTAGTCAACTTT 

TAGGGCATATTGaAAAGGTCCCTCTCAAAGGTGAATGCrTAATTATTGTT 

GATCKSTAAGAGAGATACHX^GOSAGTGAAAGACAGTAGCCAACAAGATCC 

AGTAGTATTAGTAA 



PRETTY of: /biotnp/msa323014 . 2 { *} March 28, 2003 02 $40 



mBa323014.2{343_18RS21 
msa323014.2f343_A909 
msa323014.2< 343_COHl 
msa323014 . 2 (343_M732 
msa323014.2(343_M781 
msa323014 . 2 { 343_2603 
msa323014 . 2 {343_1169NT 
msa323014 . 2 {343_090 
msa323014.2{343_CJB110 
n\Ba323014.2{343_H36B 
raaa323014. 2 {343_0M9 1300X3 
Consensus 



gaaatgc 

gaaatgc 

gaaatgc 

aaatgc 

atggaaatgc 

tgc 

gaaatgc 

gaaatgc 

— -gaaatgc 

gaaatgc 





aAGTTCAAAA 
-AGTTCAAAA 
aAGTTCAAAA 
aAGTTCAAAA 
aAGTTCAAAA 
aAGTTCAAAA 
aAGTTCAAAA 
aAGTTCAAAA 
aAGTTCAAAA 
aAGTTCAAAA 
aAGTTCAAAA 



AAGTTTTAAA 
AAGTTTTAAA 
AAGTTTTAAA 
AAGTTTTAAA 
AAGTTTTAAA 
AAGTTTTAAA 
AAGTTTTAAA 
AAGTTTTAAA 
AAGTTTTAAA 
AAGTTTTAAA 
AAGTTTTAAA 



TCAAATAtAC 
TCAAATAtAC 
TCAAATAtAC 
TCAAATAtAC 
TCAAATAtAC 
TCAAATAtAC 
TCAAATAcAC 
TCAAATAcAC 
TCAAATAcAC 
TCAAATAcAC 
TCAAATACAC 



50 

ATTAcGGaAC 
ATTAcGGaAC 
ATTAcGGaAC 
ATTAcGGaAC 
ATTAcGGaAC 
ATTAcGGaAC 
ATTAtGGgAC 
ATTAcGGgAC 
ATTAcGGgAC 
ATTAcGGgAC 
ATTAcGGgAC 



msa323014 .2 {343_18RS2l' 
tnsa323014.2{343 A909 
msa323014.2< 343~COHl 
msa323014.2l 343_M732 
msa323014 . 2 < ' 343_M78 1 
msa323014 ,2{343_2603 
msa323014.2{343_1169NT 
msa323014.2{343 090 
msa323014.2{343 CJB110 
msa323014 .2{343_H36B 
msa323014.2{343_JM9130013 
Consensus 



51 

ACTCTATCTA 
ACTCTATCTA 
ACTCTATCTA 
ACTCTATCTA 
ACTCTATCTA 
ACTCTATCTA 
ACTCTATCTA 
ACTCTATCTA 
ACTCTATCTA 
ACTCTATCTA 
ACTCTATCTA 



GTCCCAACTC 
GTCCCAACTC 
GTCCCAACTC 
GTCCCAACTC 
GTCCCAACTC 
GTCCCAACTC 
GTCCCAACTC 
GTCCCAACTC 
GTCCCAACTC 
GTCCCAACTC 
GTCCCAACTC 



CAATTGGTAA 
CAATTGGTAA 
CAATTGGTAA 
CAATTGGTAA 
CAATTGGTAA 
CAATTGGTAA 
CAATTGGTAA 
CAATTGGTAA 
CAATTGGTAA 
CAATTGGTAA 
CAATTGGTAA 



TCTAGATGAT 
TCTAGATGAT 
TCTAGATGAT 
TCTAGATGAT 
TCTAGATGAT 
TCTAGATGAT 
TCTAGATGAT 
TCTAGATGAT 
TCTAGATGAT 
TCTAGATGAT 
TCTAGATGAT 



100 

ATGACTTTTC 
ATGACTTTTC 
ATGACTTTTC 
ATGACTTTTC 
ATGACTTTTC 
ATGACTTTTC 
ATGACTTTTC 
ATGACTTTTC 
ATGACTTTTC 
ATGACTTTTC 
ATGACTTTTC 



msa323014.2{343_18RS21 
msa3 2 3 014 . 2 ( 3 4 3_A90 9 
msa32 3014 . 2 < 343_C0H1 
msa323014.2 343 M732 
msa323014.2 '343_M781 
msa323014 . 2 (343_2603 

msa323014 . 2 { 343_1169NT 
rosa323014. 2(343 090 



101 

GTGCCATTAG 
GTGCCATTAG 
GTGCCATTAG 
GTGCCATTAG 
GTGCCATTAG 
GTGCCATTAG 
GTGCCATTAG 
GTGCCATTAG 



GATTTTAAGA 
GATTTTAAGA 
GATTTTAAGA 
GATTTTAAGA 
GATTTTAAGA 
GATTTTAAGA 
GATTTTAAGA 
GATTTTAAGA 



GAAGTTGATT 
GAAGTTGATT 
GAAGTTGATT 
GAAGTTGATT 
GAAGTTGATT 
GAAGTTGATT 
GAAGTTGATT 
GAAGTTGATT 



TTATTTGTGC 
TTATTTGTGC 
TTATTTGTGC 
TTATTTGTGC 
TTATTTGTGC 
TTATTTGTGC 
TTATTTGTGC 
TTATTTGTGC 



150 

AGAGGATACA 
AGAGGATACA 
AGAGGATACA 
AGAGGATACA 
AGAGGATACA 
AGAGGATACA 
AGAGGATACA 
AGAGGATACA 
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msa3 2 3 0 14 . 2 { 3 4 3_CJB 1 1 0 } 
maa323014 . 2{343_H36B) 
rasa323014 .2{343_JM9130013 } 
Consensus 



GTGCCATTAG GATTTTAAGA GAAGTTGATT TTATTTGTGC AGAGGATACA 
GTGCCATTAG G ATTTTA AGA GAAGTTGATT TTATTTGTGC AGAGGATACA 
GTGCCATTAG GATTTTAAGA GAAGTTGATT TTATTTGTGC AGAGGATACA 



msa323014 . 2 {343_18RS21 
msa32 3014 . 2 ( 343_A909 
msa323014.2(343_COHl 
tnsa323014 . 2 f 343_M732 
tnsa323014.2 1 343 M781 
msa323014. 2 (343J2603 
msa323014.2{343_1169NT 
msa323014 . 2 {343_090 
msa323014.2{343_CJB110 
jnsa323014.2{343_H36B 
msa323014 . 2{343_JM9130013 
Consensus 



151 

CGAAATACGG 
CGAAATACGG 
CGAAATACGG 
CGAAATACGG 
CGAAATACGG 
CGAAATACGG 
CGAAATACGG 
CGAAATACGG 
CGAAATACGG 
CGAAATACGG 
CGAAATACGG 



GACTTTTACT 
GACTTTTACT 
GACTTTTACT 
GACTTTTACT 
GACTTTTACT 
GACTTTTACT 
GACTTTTACT 
GACTTTTACT 
GACTTTTACT. 
GACTTTTACT 
GACTTTTACT 



CAAGCACTTT 
CAAGCACTTT 
CAAGCA CTTT 
CAAGCA CTTT 
CAAGCA CTTT 
CAAGCACTTT 
CAAGCACTTT 
CAAGCACTTT 
CAAGCACTTT 
CAAGCACTTT 
CAAGCACTTT 



GATATTACTA 
GATATTACTA 
GATATTACTA 

gatattacta 

GATATTACTA 
GATATTACTA 
GATATTACTA 
GATATTACTA 
GATATTACTA 
GATATTACTA 
GATATTACTA 



200 

CTAAACAAAT 
CTAAACAAAT 
CTAAACAAAT 
CTAAACAAAT 
CTAAACAAAT 
CTAAACAAAT 
CTAAACAAAT 
CTAAACAAAT 
CTAAACAAAT 
CTAAACAAAT 
CTAAACAAAT 



msa323014.2{343 18RS21] 
msa323014.2{343_A909 
msa323014.2 343_C0H1 
insa323014 . 2 343_M732 ' 
msa3 23014 .2 343 JM78 1 ' 
msa323014 . 2 { 343_2603 ' 
msa323014 . 2 { 343JL169NT 
msa323014 . 2 { 343_090 
msa323014 . 2 { 343_CJB110 
msa323014 .2{343_H36B 
msa323014.2{343_JM9130013 
Consensus 



201 

TAGTTTTCAC 
TAGTTTTCAC 
TAGTTTTCAC 
TAGTTTTCAC 
TAGTTTTCAC 
TAGTTTTCAC 
TAGTTTTCAC 
TAGTTTTCAC 
TAGTTTTCAC 
TAGTTTTCAC 
TAGTTTTCAC 



GAACACAATG 
GAACACAATG 
GAACACAATG 
GAACACAATG 
GAACACAATG 
GAACACAATG 
GAACACAATG 
GAACACAATG 
GAACACAATG 
GAACACAATG 
GAACACAATG 



CTTAcGATAA 
CTTAcGATAA 
CTTAcGATAA 
CTTAcGATAA 
CTTAcGATAA 
CTTAcGATAA 
CTTAcGATAA 
CTTAcGATAA 
CTTAcGATAA 
CTTAtGATAA 
CTTAtGATAA 



AATCTCTGGG 
AATCTCTGGG 
AATCTCTGGG 
AATCTCTGGG 
AATCTCTGGG 
AATCTCTGGG 
AATCTCTGGG 
AATCTCTGGG 
AATCTCTGGG 
AATCTCTGGG 
AATCTCTGGG 



250 

TTAATTGATT 
TTAATTGATT 
TTAATTGATT 
TTAATTGATT 
TTAATTGATT 
TTAATTGATT 
TTAATTGATT 
TTAATTGATT 
TTAATTGATT 
TTAATTGATT 
TTAATTGATT 



msa323014.2{343 18RS21] 
msa3 23 0 14 . 2 ( 343_A90 9 
msa3 23 0 14 . 2 { 3 4 3_C0H1 ' 
msa323014.2< 343 M732 
msa323014 .2 343~M781 1 
msa323014 .2{343_2603 
rosa323014.2{343_1169NT' 
tnsa323014 . 2 {343J390 
msa3 23 0 14 . 2 { 3 43_CJB11 0 
msa323014 . 2{343_H36B 
msa323014.2{343_JM9130013 
Consensus 



251 

TGTTAAAAGA 
TGTTAAAAGA 
TGTTAAAAGA 
TGTTAAAAGA 
TGTTAAAAGA 
TGTTAAAAGA 
TGTTAAAAGA 
TGTTAAAAGA 
TGTTAAAAGA 
TGTTAAAAGA 
TGTTAAAAGA 



AGGGAaATCT 
AGGGAaATCT 
AGGGAaATCT 
AGGGAaATCT 
AGGGAaATCT 
AGGGAaATCT 
AGGGAaATCT 
AGGGAgATCT 
AGGGAgATCT 
AGGGAgATCT 
AGGGAgATCT 



TTAGCCCAAG 
TTAGCCCAAG 
TTAGCCCAAG 
TTAGCCCAAG 
TTAGCCCAAG 
TTAGCCCAAG 
TTAGCCCAAG 
TTAGCCCAAG 
TTAGCCCAAG 
TTAGCCCAAG 
TTAGCCCAAG 



TATCTGATGC 
TATCTGATGC 
TATCTGATGC 
TATCTGATGC 
TATCTGATGC 
TATCTGATGC 
TATCTGATGC 
TATCTGATGC 
TATCTGATGC 
TATCTGATGC 
TATCTGATGC 



300 

AGGAATGCCC 
AGGAATGCCC 
AGGAATGCCC 
AGGAATGCCC 
AGGAATGCCC 
AGGAATGCCC 
AGGAATGCCC 
AGGAATGCCC 
AGGAATGCCC 
AGGAATGCCC 
AGGAATGCCC 



msa323014 .2{343_18RS21| 
msa323014 . 2 f 343_A909 
msa323014.2 343 COHl' 
msa323014.2 343_M732 
insa323014.2 343_M781 
msa323014.2{343_2603 
rasa323014 .2{343_1169NT 
msa323014.2{343_090 
msa323014.2{343_CJB110 
msa323014.2{343_H36B 
msa323014.2{343_JM9130013 
Consensus 



301 

TCTATTTCTG 
TCTATTTCTG 
TCTATTTCTG 
TCTATTTCTG 
TCTATTTCTG 
TCTATTTCTG 
TCTATTTCTG 
TCTATTTCTG 
TCTATTTCTG 
TCTATTTCTG 
TCTATTTCTG 



ACCCAGGACA 
ACCCAGGACA 
ACCCAGGACA 
ACCCAGGACA 
ACCCAGGACA 
ACCCAGGACA 
ACCCAGGACA 
ACCCAGGACA 
ACCCAGGACA 
ACCCAGGACA 
ACCCAGGACA 



TGACCTTGTC 
TGACCTTGTC 
TGACCTTGTC 
TGACCTTGTC 
TGACCTTGTC 
TGACCTTGTC 
TGACCTTGTC 
TGACCTTGTC 
TGACCTTGTC 
TGACCTTGTC 
TGACCTTGTC 



AAGGCTGCTA 
AAGGCTGCTA 
AAGGCTGCTA 
AAGGCTGCTA 
AAGGCTGCTA 
AAGGCTGCTA 
AAGGCTGCTA 
AAGGCTGCTA 
AAGGCTGCTA 
AAGGCTGCTA 
AAGGCTGCTA 



350 

TTGAAGGGGa 
TTGAAGGGGa 
TTGAAGGGGa 
TTGAAGGGGa 
TTGAAGGGGa 
TTGAAGGGGa 
TTGAAGGGGa 
TTGAAGGGGg 
TTGAAGGGGg 
TTGAAGGGGa 
TTGAAGGGGa 



msa323014.2{343_18RS21 
msa323014.2(343 A909 
msa323014.2 343 COHl 
msa323014.2 343 M732 
msa323014.2 |343~M781 
msa323014.2{343_2603 
msa323014 .2 {343_1169NT 
msa323 014 . 2 {343_090 
msa323014.2{343 CJB110 
msa323014.2{343 H36B 
msa323014.2{-343_JM9130013 
"~ Consensus 



351 

tATCCCaGTt 
tATCCCaGTt 
tATCCCaGTt 
tATCCCaGTt 
tATCCCaGTt 
tATCCCaGTt 
tATCCCaGTt 
gATCCCgGTc 
gATCCCgGTc 
tATCCCgGTc 
tATCCCgGTc 



GTATCTATAC 
GTATCTATAC 
GTATCTATAC 
GTATCTATAC 
GTATCTATAC 
GTATCTATAC 
GTATCTATAC 
GTATCTATAC 
GTATCTATAC 
GTATCTATAC 
GTATCTATAC 



CAGGAGCTAG 
CAGGAGCTAG 
CAGGAGCTAG 
CAGGAGCTAG 
CAGGAGCTAG 
CAGGAGCTAG 
CAGGAGCTAG 
CAGGAGCTAG 
CAGGAGCTAG 
CAGGAGCTAG 
CAGGAGCTAG 



CGCTGGTATT 
CGCTGGTATT 
CGCTGGTATT 
CGCTGGTATT 
CGCTGGTATT 
CGCTGGTATT 
CGCTGGTATT 
CGCTGGTATT 
CGCTGGTATT 
CGCTGGTATT 
CGCTGGTATT 



400 

ACTGCTCTCA 
ACTGCTCTCA 
ACTGCTCTCA 
ACTGCTCTCA 
ACTGCTCTCA 
ACTGCTCTCA 
ACTGCTCTCA 
ACTGCTCTCA 
ACTGCTCTCA 
ACTGCTCTCA 
ACTGCTCTCA 



msa323014 . 2 { 343__18RS21 



msa323014.2 
maa323014.2 
tnsa323014.2 
maa323014.2 
msa323014.2 



343_A909 
343 COHl 
343"M732 
343_M781 
343 2603 



msa323014 ,2{343_1169NT 



401 

TCGCTTCAGG 
TCGCTTCAGG 
TCGCTTCAGG 
TCGCTTCAGG 
TCGCTTCAGG 
TCGCTTCAGG 
TCGCTTCAGG 



TTTAGCTCCA 
TTTAGCTCCA 
TTTAGCTCCA 
TTTAGCTCCA 
TTTAGCTCCA 
TTTAGCTCCA 
TTTAGCTCCA 



CAACCTCATA 
CAACCTCATA 
CAACCTCATA 
CAACCTCATA 
CAACCTCATA 
CAACCTCATA 
CAACCTCATA 



TTTTTTATGG 
TTTTTTATGG 
TTTTTTATGG 
TTTTTTATGG 
TTTTTTATGG 
TTTTTTATGG 
TTTTTTATGG 



450 

CTTCTTACCa 
CTTCTTACCa 
CTTCTTACCa 
CTTCTTA CCa 
CTTCTTACCa 
CTTCTTACCt 
CTTCTTACCa 
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msa323014.2{343_090) 
msa323014.2(343_CJB110} 
msa323014.2{343 H36BJ 



TCGCTTCAGG TTTAGCTCCA CAACCTCATA TTTTTTATGG CTTCTTACCg 
TCGCTTCAGG TTTAGCTCCA CAACCTCATA TTTTTTATGG CTTCTTACCg 
TCGCTTCAGG TTTAGCTCCA CAACCTCATA TTTTTTATGG CTTCTTACCg 
msa323014.2(343_JM9130013} TCGCTTCAGG TTTAGCTCCA CAACCTCATA TTTTTTATGG CTTCTTACCg 
" Consensus ********** ********** ********** ********** *********. 



msa323014.2{343_18RS21 
msa323014.2{343_A909 
msa323014 . 2 343_COHl 
msa323014.2 343_M732 
msa323014.2 343_M781 
msa323014 .2{343_2603 
msa323014.2{343_1169NT 
msa323014 . 2 (343_090 
msa323014 . 2 { 343_CJB110 
msa323014 . 2 { 343_H36B 
msa323014 .2{343_JM9130013 
Consensus 



451 

CGTAAGaAAG 
CGTAAGaAAG 
CGTAAGaAAG 
CGTAAGaAAG 
CGTAAGaAAG 
CGTAAGaAAG 
CGTAAGaAAG 
CGTAAGaAAG 
CGTAAGaAAG 
CGTAAGcAAG 
CGTAAGcAAG 



GTCAACAAAT 
GTCAACAAAT 
GTCAACAAAT 
GTCAACAAAT 
GTCAACAAAT 
GTCAACAAAT 
GTCAACAAAT 
GTCAACAAAT 
GTCAACAAAT 
GTCAACAAAT 
GTCAACAAAT 



AACTTTcTTT 
AACTTTcTTT 
AACTTTcTTT 
AACTTTcTTT 
AACTTTCTTT 
AACTTTcTTT 
AACTTTtTTT 
AACTTTtTTT 
AACTTTtTTT 
AACTTTtTTT 
AACTTTtTTT 



GAAACAAAGc 
GAAACAAAGc 
GAAACAAAGC 
GAAACAAAGC 
GAAACAAAGc 
GAAACAAAGC 
GAAACAAAGC 
GAAACAAAGa 
GAAACAAAGa 
GAAACAAAGa 
GAAACAAAGa 



500 

AAGATTACCC 
AAGATTAcCC 
AAGATTACCC 
AAGATTAcCC 
AAGATTAcCC 
AAGATTAcCC 
AAGATTAtCC 
AAGATTACCC 
AAGATTAcCC 
AAGATTAcCC 
AAGATTAcCC 



msa323014.2{343_18RS2l| 
msa323014.2(343_A909 
msa323 014.2* 343_COHl 
tnsa3 2 3 0 14 . 2 3 4 3_M73 2 
msa323014. 2(343 M781 
msa323014 . 2 (343~2603 
msa3 23 0 14 . 2 { 3 4 3_1 16 9NT 
msa323014 .2{343_090 
msa323014 .2{343_CJB110 
msa323014. 2(343 H36B 
rasa323014.2{343_JM9130013 
Consensus 



501 

TGAAACACAA 
TGAAACACAA 
TGAAACACAA 
TGAAACACAA 
TGAAACACAA 
TGAAACACAA 
TGAAACACAA 
TGAAACACAA 
TGAAACACAA 
TGAAACACAA 
TGAAACACAA 
********** 



ATCTTTTATG 
ATCTTTTATG 
ATCTTTTATG 
ATCTTTTATG 
ATCTTTTATG 
ATCTTTTATG 
ATCTTTTATG 
ATCTTTTATG 
ATCTTTTATG 
ATCTTTTATG 
ATCTTTTATG 
********** 



AGTCACCGTT 
AGTCACCGTT 
AGTCACCGTT 
AGTCACCGTT 
AGTCACCGTT 
AGTCACCGTT 
AGTCACCGTT 
AGTCACCGTT 
AGTCACCGTT 
AGTCACCGTT 
AGTCACCGTT 
********** 



TCGAGTCTCT 
TCGAGTCTCT 
TCGAGTCTCT 
TCGAGTCTCT 
TCGAGTCTCT 
TCGAGTCTCT 
TCGAGTCTCT 
TCGAGTCTCT 
TCGAGTCTCT 
TCGAGTCTCT 

TCGAGTCTCT 
********** 



550 

GATACGCTAA 
GATACGCTAA 
GATACGCTAA 
GATACGCTAA 
GATACGCTAA 
GATACGCTAA 
GATACGCTAA 
GATACGCTAA 
GATACGCTAA 
GATACGCTAA 
GATACGCTAA 
********** 



msa323014 .2{343_18RS21 
msa323014 . 2 { 343__A909 
msa323014.2 343_C0H1 
msa323014.2 343_M732 
msa323014.2<343_M781 
msa323014.2{343_2603 
msa323014 .2{343_1169NT 
rasa323014.2{343_090 
rasa323014 . 2 { 343_CJB110 
msa323014.2{343 H36B 
msa323014 . 2 { 343_JM9130013 
Consensus 



551 

AACACATGAA 
AACACATGAA 
AACACATGAA 
AACACATGAA 
AACACATGAA 
AACACATGAA 
AACACATGAA 
AACACATGAA 
AACACATGAA 
AACACATGAA 
AACACATGAA 
********** 



AGAGATTTAc 
AGAGATTTAc 
AGAGATTTAc 
AGAGATTTAc 
AGAGATTTAc 
AGAGATTTAC 
AGAGATTTAc 
AGAGATTTAC 
AGAGATTTAC 
AGAGATTTAt 
AGAGATTTAt 
*********_ 



GGAGATCGCC 
GGAGATCGCC 
GGAGATCGCC 
GGAGATCGCC 
GGAGATCGCC 
GGAGATCGCC 
GGAGATCGCC 
GGAGATCGCC 
GGAGATCGCC 
GGAGATCGCC 
GGAGATCGCC 



AAGTTGTTTT 
AAGTTGTTTT 
AAGTT GTTTT 
AAGTTGTTTT 
AAGTTGTTTT 
AAGTTGTTTT 
AAGTTGTTTT 
AAGTTGTTTT 
AAGTTGTTTT 
AAGTTGTTTT 
AAGTTGTTTT 



600 

AGTACGCGAA 
AGTACGCGAA 
AGTACGCGAA 
AGTACGCGAA 
AGTACGCGAA 
AGTACGCGAA 
AGTACGCGAA 
AGTACGCGAA 
AGTACGCGAA 
AGTACGCGAA 
AGTACGCGAA 



********** ********** ********** 



msa323014.2{343_18RS21 
msa323014.2{343_A909' 
msa323014.2 343JCOH1 
raaa323014.2 343_M732 
msa323014.2 343J4781 
tnsa323014.2{343_2603 
msa323014.2{343 1169NT 
msa323014 .2 {343^090 
msa323 0 14 . 2 { 343_CJB110 
msa323014.2{343_H36B 
msa323014 . 2 {343_JM9130013 
Consensus 



601 

TTGACGAAAC 
TTGACGAAAC 
TTGACGAAAC 
TTGACGAAAC 
TTGACGAAAC 
TTGACGAAAC 
TTGACGAAAC 
TTGACGAAAC 
TTGACGAAAC 
TTGACGAAAC 
TTGACGAAAC 



TCTATGAAGA 
TCTATGAAGA 
TCTATGAAGA 
TCTATGAAGA 
TCTATGAAGA 
TCTATGAAGA 
TCTATGAAGA 
TCTATGAAGA 
TCTATGAAGA 
TCTATGAAGA 
TCTATGAAGA 



GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 
GTATCAAAGA 



GGAACCATTA 
GGAACCATTA 
GGAACCATTA 
GGAACCATTA 
GGAACCATTA 
GGAACCATTA 
GGAACCATTA 
GGAACCATTA 
GGAACCATTA 
GGAACCATTA 
GGAACCATTA 



650 

GTCAACTTTT 
GTCAACTTTT 
GTCAACTTTT 
GTCAACTTTT 
GTCAACTTTT 
GTCAACTTTT 
GTCAACTTTT 
GTCAACTTTT 
GTCAACTTTT 
GTCAACTTTT 
GTCAACTTTT 



rasa323014.2{343_18RS2l' 
msa323014.2(343_A909 
msa323014.2 343jCOHl' 
msa323014 . 2 343 J4732 ' 
msa323014.2f343_M781 
msa3 2 3 0 14 . 2 { 34 3_2 6 03 
msa323014.2{343_1169NT 
msa323014 .2{343_090 
msa323014 .2{343_CJB110 
ma 3323014. 2 {343_H36B 
tnsa323014 . 2 {343_JM9130013 
Consensus 



651 

AGaGCATATT 
AGaGCATATT 
AGaGCATATT 
AGaGCATATT 
AGaGCATATT 
AGaGCATATT 
AGaGCATATT 
AGgGCATATT 
AGgGCATATT 
AGgGCATATT 
AGgGCATATT 



GAAAAgGTCC 
GAAAAgGTCC 
GAAAAgGTCC 
GAAAAgGTCC 
GAAAAgGTCC 
GAAAAgGTCC 
GAAAAgGTCC 
GAAAAaGTCC 
GAAAAaGTCC 
GAAAAgGTCC 
GAAAAgGTCC 



CTCTCAAAGG 
CTCTCAAAGG 
CTCTCAAAGG 
CTCTCAAAGG 
CTCTCAAAGG 
CTCTCAAAGG 
CTCTCAAAGG 
CTCTCAAAGG 
CTCTCAAAGG 
CTCTCAAAGG 
CTCTCAAAGG 



TGAATGCTTA 
TGAATGCTTA 
TGAATGCTTA 
TGAATGCTTA 
TGAATGCTTA 
TGAATGCTTA 
TGAATGCTTA 
TGAATGCTTA 
TGAATGCTTA 
TGAATGCTTA 
TGAATGCTTA 



700 

ATTATTGTTG 
ATTATTGTTG 
ATTATTGTTG 
ATTATTGTTG 
ATTATTGTTG 
ATTATTGTTG 
ATTATTGTTG 
ATTATTGTTG 
ATTATTGTTG 
ATTATTGTTG 
ATTATTGTTG 



msa323014. 2(343 18RS21 
msa323014.2(343_A909 
msa323014.2 343_COHl 
msa323014.2 343_M732 
msa323014.2 343_M781 
TOsa323014. 2(343 2603 



701 

ATGGTAAGAG 
ATGGTAAGAG 
ATGGTAAGAG 
ATGGTAAGAG 
ATGGTAAGAG 
ATGGTAAGAG 



AGATACcGAG 
AGATACcGAG 
AGATACcGAG 
AGATACcGAG 
AGATACcGAG 
AGATACcGAG 



CGAGTGAAAG 
CGAGTGAAAG 
CGAGTGAAAG 
CGAGTGAAAG 
CGAGTGAAAG 
CGAGTGAAAG 



ACAGTAGCCA 
ACAGTAGCCA 
ACAGTAGCCA 
ACAGTAGCCA 
ACAGTAGCCA 
ACAGTAGCCA 



750 

ACAAGATCCA 
ACAAGATCCA 
ACAAGATCCA 
ACAAGATCCA 
ACAAGATCCA 
ACAAGATCCA 
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msa323014 .2{343_1169NT 
msa323014 . 2 {343_090 
msa323014 .2{343_CJB110 
msa3 23 0 14 . 2 { 3 4 3_H3 £B 
msa323014.2{343_JM9130013 
Consensus 



ATGGTAAGAG AGATACcGAG CGAGTGAAAG 
ATGGTAAGAG AGATACcGAG CGAGTGAAAG 
ATGGTAAGAG AGATACcGAG CGAGTGAAAG 
ATGGTAAGAG AGATACtGAG CGAGTGAAAG 
ATGGTAAGAG AGATACtGAG CGAGTGAAAG 
********** ******_*** ********** 



ACAGTAGCCA 
ACAGTAGCCA 
ACAGTAGCCA 
ACAGTAGCCA 
ACAGTAGCCA 



ACAAGATCCA 
ACAAGATCCA 
ACAAGATCCA 
ACAAGATCCA 
ACAAGATCCA 



********** ********** 



msa323014.2{343 18RS21 
msa323014.2(343_A909 
msa323014. 2(343 COH1 
tnsa323014 .2{3433l732 
msa323014 . 2 1 343_M781 
msa323014.2{343_2603 
msa323014 .2{343_1169NT 
msa323 014 . 2 { 3 43_090 1 
msa323014.2{343 CJB110 
msa323014 . 2 { 343_H36B 
msa323014 . 2 { 343_JM9130013 
" Consensus 



msa323014 .2 {343_18RS2l' 
msa323014 . 2 f 343_A909 
msa323014 . 2 f 343_C0H1 ' 
msa323014.2f343_M732 
1083323014.2(343^781' 
tnsa323014.2{343_2603 
msa3 23 014 . 2 { 34 3_1 16 9NT 
msa3 23014 .2{343 — 090 
msa323 014 . 2 { 343_CJB110 
msa323014 . 2 { 343_H36B 
msa323014.2{343 - JM9130013 
Consensus 



rasa323014 .2{343_18RS21 
msa323014.2(343_A909 
msa323014 - 2 1 343_C0H1 
msa323014 . 2 f343_M732 
msa323014.2{343_M781 
msa323014 . 2 { 343_2 603 
msa323014.2{343_1169NT 
msa323014 . 2 {343_090 
msa323014.2{343_CJB110 
msa323014.2{343_H36B 
msa323014 . 2 { 343_JM9130013 
Consensus 



751 800 

CTAGTATTAG TAA 

cTAGTATTAG TAA 

CTAGTATTAG TAA 

CTAGTATTAG TAA-——— — — 

CTAGTATTAG TAAA 

cTAGTATTAG TAAAagaata tatcgctaat ggtgataaaa ctaatcaagc 

cTAGTATTAG TAA 

cTAGTATTAG TAA------ 

CTAGTATTAG TAA • — » 

CTAGTATTAG TAA 

gTAGTATTAG TAA > 

801 850 
gataaaaaaa gtagcaaaag aatttaatct caatagacaa gaactctatg 

851 867 
ctagtttcca tgattta 



SEQ ID HO. 7412 
STRAIN 2603 frame: 1 

MBMQVQKS FKSN I HYGTLYL VPTP I GNLDDMTFRA IRI LREVD F I CAEDTRNTGLLLKHF 
DITTKQI SFHEHNAYDKI SGLI DLLKEGKSLAQVSDAGMPS I SDPGHDLVKAAI EGD I PV 
VS I PGASAG I TALI ASGLAPQPUI FYGFLPRKKGQQI TFFETKQDYPETQI FYESPFRVS 
DTLKHMKEI YGDRQWL VRELT KLYEE YQRGT I SQLLEH I EKVPLKGECL 1 1 VOGKRDTE 
RVKDS SQQDPIiVLVKBY I ANGD KTNQA I KKVAKE FNLNRQELYAS FHDIi 

SEQ ZD NO. 7413 

• STRAIN 090 frame: 1 

EMQVQKS FKSNTHYGTL YLVPTP I GNLDDMTFRA I RI LREVD F I CAEDTRNTGLLLKHFD 
I TTKQI SFHEHNAYDKI SGL I DLL KEGRSLAQVSDAGMPS I SDPGHDLVKAAI EGGI PW 
SI PGASAG I TALI ASGLAPQPH I FYG FLPRKKGQQITFFETKKDYPETQ I PYESPFRVSD 
TLKHMKE I YGDRQWLVRELTKLYEEYQRGT I SQLLGHI E KVPLKGECL 1 1 VDGKRDTER 
VKDSS QQDPLVLV 

SEQ ZD NO. 7414 
STRAIN A909 frame: 2 

VQ KS FKSNI HYGTL YLVPT PJ GNLDDMT FRAI R I LREVD F I CAEDTRNTGLLLKHFD I TT 
KQI SFHEHNAYDKI SGLI DLLKEGKSLAQVSDAGMPS I SDPGHDLVKAAI EGD I PWSI P 
GASAGI TALI ASGLAPQPH I FYGFLPRKKGQQI TFFETKQDYPETQ I FYESPFRVSDTLK 
HMKE I YGDRQWLVRELTKLYEEYQRGT I SQLLEHIEKVPLKGECLI IVDGKRDTERVKD 
SSQQDPLVLV 

SEQ ZD NO. 7415 
STRAIN H36B frame: 1 

EMQVQ KS FKSNTHYGTLYL VPT P I GNLDDMTFRAI RI LREVDF I CAEDTRNTGLLLKHFD 
ITTKQI SFHEHNAYDKI SGL I DLLKEGRSLAQVSDAGMPS I SDPGHDLVKAAI EGD I PW 
SI PGASAGITALIASGLAPQPHI FYGFLPRKQGQQITFFBTKKDYPETQI PYESPFRVSD 
TLKHMKE I YGDRQWLVRELTKLYEEYQRGT I SQLLGHI EKVPLKGECLI I VDGKRDTER 
VKDSSQQDPLVLV 

SEQ ZD NO. 7416 
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STRAIN 18RS2I frame: ! 

EMQVQKSPKSNIHYGTLYLVPTP IGNLDDMTFRA I RI LREVDFI CAEDTRNTGLLLKHFD 
ITTKQI SFHEHNAYDKI SGL I DLLKEGKSLAQVSDAGMPS I SD PGHDLVKAAI EGDI PW 
S I PGASAG I TAL I ASGLAPQ PH I FYGFLPRKKGQQI TFFETKQD YPETQ I FYESPFRVSD 
TLKHMKE I YGDRQWLVRELTKL YE BYQRGT I SQLLEH I EKVPLKGECL 1 1 VDGKRDTER 
VKDSSQQDPLVLV 

SEQ ID NO. 7417 
STRAIN M732 frame: 1 

EMQVQKS FKSN I HYGTLYL VPT P I GNLDDMT FRA I R I LRE VD F I CAEDTRNTGLLLKHFD 
ITTKQ I S FHEHNAYDKI SGL I DLLKEGKSLAQVSDAGMPS I SDPGHDLVKAAI EGDI PW 
SIPGASAGITALIASGIiAPQPHIFYGFLPRKKGQQITFFBTKQDYPETQIFYESPFRVSD 
TLKHMKE I YGDRQWIiVRELTKLYEEYQRGT I SQLLEH I EKVPLKGECL 1 1 VDGKRDTER 
VKDSSQQDPLVLV 

SEQ ID HO. 7418 
STRAIN COH1 frame: 1 

EMQVQRSFKSNI HYGTLYLVPTPIGNLDDMTFRAI R I LREVDFI CAEDTRNTGLLLKHFD 
I TTKQI SFHEHNAYDKI SGL I DLLKEGKSLAQVSDAGMPS I SDPGHDLVKAAI EGDI PW 
SIPGASAGITALIASGLAPQPHI FYGFLPRKKGQQ I TFFETKQD YPETQ IFYESP FRVSD 
TLKHMKEI YGDRQWLVRELTKLYEEYQRGTI SQLLEHI EKVPLKGECL 1 1 VDGKRDTER 
VKDSSQQDPLVLV 

SEQ ID HO. 7419 
STRAIN M781 frame: 3 

MQVQKS FKSN I HYGTLYLVPTP I GNLDDMTFRAI RI LREVDFI CAEDTRNTGLLLKHFD I 
TTKQI SFHEHNAYDKI SGL I DLLKEGKSLAQVSDAGMPS I SDPGHDLVKAAI EGD I PWS 
I PGASAG ITAL I ASGLAPQ PHI FYGFLPRKKGQQI TF FETKQDYPETQI FYESPFRVSDT 
LKHMKE I YGDRQWLVRELTKL YE BYQRGT I SQLLEH I EKVPLKGECLI I VDGKRDTERV 
KDSSQQDPLVLV 



SEQ ID NO. 7420 
STRAIN CJB1 10 frame: 1 

EMQVQKS FKSNTHYGTLYLVPTPIGNLDDMTFRAI RI LREVDFI CAEDTRNTGLLLKHFD 
ITTKQI SFHEHNAYDKI SGL I DLLKEGRS LAQVSDAGMP S I SDPGHDLVKAAI EGG I PW 
S I PGASAGI TAL IASGLAPQPH I FYGFLPRKKGQQ I T FFETKKD YPBTQ I FYESPFRVSD 
TLKHMKE I YGDRQWLVRELTKLYEEYQRGTI SQLLGHI EKVPLKGECLI I VDGKRDTER 
VKDSSQQDPLVLV 



SEQ ID NO. 7421 
STRAIN 1169NT frame: 3 

QVQKS FKSNTHYGTL YL VPTP I GNLDDMT FRAI RI LREVDFI CAEDTRNTGLIiLKHFD I T 
TKQI SFHEHNAYDKI SGLI DLLKEGKSLAQVSDAGMPS I SDPGHDLVKAA I EGDI PWS I 
PGASAG I TAL IASGLAPQPH I FYGFLPRKKGQQI TFFETKQD YPETQ I FYESPFRVSDTL 
KHMKE I YGDRQWLVRELT KLYEEYQRGT I SQLLEHI EKVPLKGECLI I VDGKRDTERVK 
DS SQQDPLVLV 

SEQ ID NO. 7422 
STRAIN JM9 1300 13 frame: 1 

EMQVQKS FKSNTHYGTL YLVPTPI GNLDDMTFRAI RI LREVDFI CAEDTRNTGLLLKHFD 
ITTKQI SFHEHNAYDKI SGLI DLLKEGRSLAQVSDAGMPS I SDPGHDLVKAAIEGDI PW 
SI PGASAG I TAL IASGLAPQPH I FYGFLPRKQGQQ IT FFETKKD YPETQ I FYESPFRVSD 
TLKHMKEI YGDRQWLVRELTKLYEEYQRGTI SQLLGHI EKVPLKGECLI I VDGKRDTER 
VKDSSQQDPWLV 



msa324064 .2{343_18RS21 
msa324064 . 2 f 343_A909 
msa324064 .2 343~M781 
roaa324064.2 343 2603 
msa324064.2 343~COHl 
msa324064 . 2 { 343J4732 
mE a3 24 064 . 2 { 3 4 3_1 16 9NT 
rasa324064.2{343 090 
msa324064.2{343_CJB110 
msa3 2 40 64 . 2 { 343_H3 6B 
msa324064 . 2 { 343JJM9130013 
Consensus 



-emqVQKSFK 

VQKSFK 

— mqVQKSFK 
memgVQKSFK 
-emqVQKSFK 
-emqVQKSFK 

qVQKSFK 

-emqVQKSFK 
-emqVQKSFK 
-emqVQKSFK 
-emqVQKSFK 



SNiHYGTLYL 
SNi HYGTLYL 
SNiHYGTLYL 
SNiHYGTLYL 
SNiHYGTLYL 
SNiHYGTLYL 
SNt HYGTLYL 
SNt HYGTLYL 
SNt HYGTLYL 
SNt HYGTLYL 
SNt HYGTLYL 



VPTPIGNLDD 
VPTPIGNLDD 
VPTPIGNLDD 
VPTPIGNLDD 
VPTPIGNLDD 
VPTPIGNLDD 
VPTPIGNLDD 
VPTPIGNLDD 
VPTPIGNLDD 
VPTPIGNLDD 
VPTPIGNLDD 



MTFRAIRILR 
MTFRAIRILR 
MTFRAIRILR 
MTFRAIRILR 
MTFRAIRILR 
MTFRAIRILR 
MTFRAIRILR 
MTFRAIRILR 
MTFRAIRILR 
MTFRAIRILR 
MTFRAIRILR 



50 

EVDFICAEDT 
EVDFICAKDT 
EVDFICAEDT 
EVDFICAEDT 
EVDFICAEDT 
EVDFICAEDT 
EVDFICAEDT 
EVDFICAEDT 
EVDFICAEDT 
EVDFICAEDT 
EVDFICAEDT 



msa324064.2{343_18RS21 
msa324064 . 2 ( 343_A909 
msa324064.2 343_M781 
msa324064.2 343 2603 
msa324064.2 343~C0H1 
msa324064.2{343_M732 
msa324064.2{343 1169NT 
msa324064.2{343 090 
msa324064 . 2 { 343_CJB110 
msa324064.2{343 H36B 
msa324064 .2{343_JM9130013 
~ Consensus 



51 

RNTGLLLKHF 
RNTGLLLKHF 
RNTGLLLKHF 
RNTGLLLKHF 
RNTGLLLKHF 
RNTGLLLKHF 
RNTGLLLKHF 
RNTGLLLKHF 
RNTGLLLKHF 
RNTGLLLKHF 
RNTGLLLKHF 



DITTKQISFH 
D ITTKQI SFH 
DITTKQISFH 
DITTKQISFH 
DITTKQISFH 
DITTKQISFH 
DITTKQISFH 
DITTKQISFH 
DITTKQISFH 
DITTKQISFH 
DITTKQISFH 



EHNAYDKISG 
EHNAYDKISG 
EHNAYDKISG 
EHNAYDKISG 
EHNAYDKISG 
EHNAYDKISG 
EHNAYDKISG 
EHNAYDKISG 
EHNAYDKISG 
EHNAYDKISG 
EHNAYDKISG 



LIDLLKEGkS 
LIDLLKEGkS 
LIDLLKEGkS 
LIDLLKEGkS 
LIDLLKEGkS 
LIDLLKEGkS 
LIDLLKEGkS 
LIDLLKEGrS 
LIDLLKEGrS 
LIDLLKEGrS 
LIDLLKEGrS 



100 

LAQVSDAGMP 
LAQVSDAGMP 
LAQVSDAGMP 
LAQVSDAGMP 
LAQVSDAGMP 
LAQVSDAGMP 
LAQVSDAGMP 
LAQVSDAGMP 
LAQVSDAGMP 
LAQVSDAGMP 
LAQVSDAGMP 
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msa324064.2{343_18RS21 
msa324064 .2{343_A909 
msa324064.2{343_M781 
. msa324064.2| 343J2603 
maa324064 . 2 { 343_COHl 
msa324064.2{343 M732 
msa324064.2{343 1169NT 
maa324064 .2{343__090 
msa324064 . 2 { 343_CJB110 
msa324064.2{343_H36B 
msa324064.2{343_JM9130013 
Consensus 



101 

SISDPGHDLV 
SISDPGHDLV 
SISDPGHDLV 
SISDPGHDLV 
SISDPGHDLV 
SISDPGHDLV 
SISDPGHDLV 
SISDPGHDLV 
SISDPGHDLV 
SISDPGHDLV 
SISDPGHDLV 



KAAIEGdIPV 
KAAIEGdIPV 
KAAIEGdIPV 
KAAIEGdIPV 
KAAIEGdIPV 
KAAIEGdIPV 
KAAIEGdIPV 
KAAIEGglPV 
KAAIEGglPV 
KAAIEGdIPV 
KAAIEGdIPV 



VSIPGASAGI 
VSIPGASAGI 
VSIPGASAGI 
VSIPGASAGI 
VSIPGASAGI 
VSIPGASAGI 
VSIPGASAGI 
VSIPGASAGI 
VSIPGASAGI 
VSIPGASAGI 
VSIPGASAGI 



TALIASGLAP 
TAL I ASGLAP 
TALIASGLAP 
TALIASGLAP 
TALIASGLAP 
TALIASGLAP 
TALIASGLAP 
TALIASGLAP 
TALIASGLAP 
TALIASGLAP 
TALIASGLAP 



ISO 

QPHIFYGFLP 
QPHIFYGFLP 
QPHIFYGFLP 
QPHIFYGFLP 
QPHIFYGFLP 
QPHIFYGFLP 
QPHIFYGFLP 
QPHIFYGFLP 
QPHIFYGFLP 
QPHIFYGFLP 
QPHIFYGFLP 



msa324064 . 2 {343_18RS21 
msa324064 . 2 { 343_A909 
msa324064 . 2 1343_M781 
msa324064.2{343 2603 
msa324064 .2{343~COHl 
msa324064.2{343 M732 
msa324064 . 2 { 343_1169NT 
msa324064.2{343 090 
msa324064 . 2 { 343_CJB110 
msa324064.2{343_H36B 
msa324064.2{343_JM9130013 
Consensus 



151 

RKkGQQITFF 
RKkGQQITFF 
RKkGQQITFF 
RKkGQQITFF 
RKkGQQITFF 
RKkGQQITFF 
RKkGQQITFF 
RKkGQQITFF 
RKkGQQITFF 
RKqGQQITFF 
RKqGQQITFF 



ETKqDYPETQ 
ETKqDYPETQ 
ETKqDYPETQ 
ETKqDYPETQ 
ETKqDYPETQ 
ETKqDYPETQ 
ETKqDYPETQ 
ETKkDYPETQ 
ETKkDYPETQ 
ETKkDYPETQ 
ETKkDYPETQ 



IFYESPFRVS 
IFYESPFRVS 
IFYESPFRVS 
IFYESPFRVS 
IFYESPFRVS 
IFYESPFRVS- 
IFYESPFRVS 
IFYESPFRVS 
IFYESPFRVS 
IFYESPFRVS 
IFYESPFRVS 



DTLKHMKEIY 
DTLKHMKEIY 
DTLKHMKEIY 
DTLKHMKEIY 
DTLKHMKEIY 
DTLKHMKEIY 
DTLKHMKEIY 
DTLKHMKEIY 
DTLKHMKEIY 
DTLKHMKEIY 
DTLKHMKEIY 



200 

GDRQWLVRE 
GDRQWLVRE 
GDRQWLVRE 
GDRQWLVRE 
GDRQWLVRE 
GDRQWLVRE 
GDRQWLVRE 
GDRQWLVRE 
GDRQWLVRE 
GDRQWLVRE 
GDRQWLVRE 



msa324064 . 2 { 343_18RS2 1 
msa324064. 2(343 A909 
msa324064.2(343_M781 
msa324064.2{343_2603 
msa324064 .2f 343_C0H1 
msa324064 . 2 { 343_M732 
msa324064 .2 {343_1169NT 
msa324064.2{343_090 
msa324064 . 2 {343_CJB110 
msa324064 . 2 {343_H36B 
msa324064.2{343_JM9130013 
Consensus 



201 

LTKLYEEYQR 
LTKLYBEYQR 
LTKLYEEYQR 
LTKLYEEYQR 
LTKLYEEYQR 
LTKLYEEYQR 
LTKLYEEYQR 
LTKLYEEYQR 
LTKLYEEYQR 
LTKLYEEYQR 
LTKLYEEYQR 



GTISQLLeHI 
GTISQLLeHI 
GTISQLLeHI 
GTISQLLeHI 
GTISQLLeHI 
GTISQLLeHI 
GTISQLLeHI 
GTISQLLgHI 
GTISQLLgHI 
GTISQLLgHI 
GTISQLLgHI 



********** *******_** 



EKVPLKGECL 
BKVPLKGECL 
EKVPLKGECL 
EKVPLKGECL 
EKVPLKGECL 
EKVPLKGECL 
EKVPLKGECL 
EKVPLKGECL 
EKVPLKGECL 
EKVPLKGECL 
EKVPLKGECL 
********** 



I I VDGKRDTE 
IIVDGKRDTE 
1 1 VDGKRDTE 
IIVDGKRDTE 
IIVDGKRDTE 
IIVDGKRDTE 
IIVDGKRDTE 
IIVDGKRDTE 
IIVDGKRDTE 
IIVDGKRDTE 
IIVDGKRDTE 
********** 



250 

RVKDSSQQDP 
RVKDSSQQDP 
RVKDSSQQDP 
RVKDSSQQDP 
RVKDSSQQDP 
RVKDSSQQDP 
RVKDSSQQDP 
RVKDSSQQDP 
RVKDSSQQDP 
RVKDSSQQDP 
RVKDSSQQDP 
********** 



msa324064 . 2 {343_18RS21 
msa324064 . 2 f 343_A909 
msa324064 . 2 { 343JM781 
msa324064.2< 343_2603 
msa324064.2 343_COHl 
msa324064 .2{343_M732 
msa324064 . 2 { 343_1169NT 
msa324064.2{343_090 
msa324064 . 2 { 343_CJB110 
msa324064 .2{343_H36B 
msa324064. 2 {343_JM9 130013 
Consensus 



251 289 

1VLV 

1VLV 

1VLV 

lVLVkeyian gdktnqaikk vakefnlnrq elyasf hdl 

1VLV 

1VLV 

1VLV 

1VLV 

1VLV 

1VLV 

vVLV 
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SEQ ID NO. 7501 
STRAIN 2603 

AT6AG CGTATATGTTAGTGGAATAGGAATTATT 

TCTTCTTTGGGAAAGAATTATAGCGAGCATAAACAGCATCT 

ATTTCTAAAGATTTATATAAAAATCACGAC^ 

ACTAGTGACCO\GAGGTTCCTGAGCAATACAAAGATGAGAC^^ 

TTTACCGCTTTTGAAGAGGCTCTTGCTTCrc^ 

ATTGCIX3TGTGTTTAGGGACCTCACTTGGGGGAAAGAGTG 

CAATTTGAAGAAGGAGAGCGTCAAGTAGATGCTAGTT^^ 

CATATTGCTGATGAATTGATGG CTTATCATGATATTGTGGGAGCTTCGT ATGTTATTTCA 
ACOTCCTCTTCTGCAAGTAATAATGCaSTAATATTAGGAACACA^ C 
GATTGTGATTTAGCTATTTGTGGTGGCTGTGATGAGTTAAG^ 
TTCACATCACTAGGAGCTATTAATACAGAAATGGCATGTC^ 
GGAATCAATTTGGGTGAGGG CGCreGTTTTGTTC 
AAATATGGAAAAATTATCX3GTGGTCTTATTACTTCAGATG 

AAGCCAACAGGTGAAGGGG CGGCACAGATTGCAAAG CAGCTAGTGACTCAAG CAGGTATT 
GACTACAGTGAGATTGACTATATTAACGGTCACGGTA^ 
ATGGAAAAAAATATGTATGGTAAGTTTTTCCCGACA 
GGGCAAACGGGTCATACTCTAGGGGC1X3 

GCAATAGAGGAACAGACTGTACCAGCAACrAAAAATGAGATTGGGATAGAA 

GAAAATTTTGTCTATCATCAAAAGAGAGAATACCCAATAAGAAATC 

TTTGCTTTTGGTGGAAATAATAGTGGTGTCTTATTGTC^ 

ACATTACCTGCTAGAGAAAATCTTAAAATGGCTATCTTATCATCTC 

AAGAATGAATCACTTTCTATAACCTATGAAAAAGTTGCTAOT 

GCATTACGCTTTAAAGGGGCTAGACCACCCAAAACTGTCA 

ATGGATGATTTTTCCAAAATGGTTGCCGTAACAACAGCT 

ATTAATCTAAAAAAACAAGATACTTTCAAA^ 

CXZAGTTGAGGTTGTTGAAGGTATTGAAAAGCAAATCA 

TCTGCTTCACGATTCCCtnTTACAGTAATGA^ CTATCATT 
TTTAAAATAACAGGTCCITTATCrGTCATTTCGACAAAT 
CAATATGCXIAAGGAAATGATGCGTAACGATAATCTAGACTATG 
AATCAGTGGACAGACATGAGTTTTATGTGGTGGCAACAA 

CCTATAATATTAGGTAGTAAACAATTAAAATATAGCCA^ 

ACTATTTTK3ATGCTCCX3CTTCAAAK 

ATCAAAGGTTTCGTTTGGAATGAGCGGAAGAAGGCAGT^ 

GCGAACTTGTCTGAGTATTATAATATGCCAAACCTTGCrra 

TCTAATGGTGCTGGTGAAGAACTGGACTATACTGTT^ 

TATTTAGTCCTATCTTATTCGAT CTTCGGTGGTAT CT CITTTGCTATTATTG AAAAAAGG 

SEQ ZZ> NO. 7502 
STRAIN 090 

ATGTTAGTGGAATAGGAATTATTTCTTCnT^TGGGAAAGaATTAT 

AGCGAGCATAAACAGCATCTCTTCXIACTTAAAAGAAG 

TTTATATAAAAATCACGACTCTATTTTAGAATCTTATACAGGAAG CATAA 

CTAGTGACCCAGAGGTTCCTGAGCAATACAAAGATGA^ 

AAATTTGCTTTTACOGCTTTTGAAGAGGCTCTTGCTT 

TTTAAAAGCTTATCATAATATTGCTGTC^ 

GAAAGAGTGCTGGTCAAAATGCCTITGTATCAATTTGAAGAA 

CAAGTAGATGCTAGTTTATTAGAAAAAGCATCTGTTTACCATATTGC^ 

TGAATTGATGGCTTATCATGATATTGTGGGAGCTTCGTATGT^ 

CXXSCCIXJITCTGCAAGTAATAATGCCGTAAT^ 

CAAGATGGCGATTGTGATTTAGCTATTTGTGGTGGCTGTC 

TGATATTTCTTTAGCAGGCTTCACATCACTAGGAG CTATTAATACAGAAA 

TGGCATGTCAGCCCTATTCTTCTGGAAAAGGAATC^TTT^ 

AATTATCGGTGGTCTTATTACTTCAGATGGTrATCATATAACAGCACCT 

AGCGAACAGGTGAAGGGGCGGCACAGATTGCIAAAG 

GCAGGTATTGACTACAGTX3AGATTGACTATO 

TACTCAAGCTAATGATAAAATGGAAAAAAATATGTATGGTAAGTTTTTCC 

CGACAACGACATTGATCAGCAGTACCAAGGGG CAAACGGGTCATACTCTA 

GGGG CTGCAGGTATTATCGAATTGATTAATTGTTT AGCGGCAATAGAGG^ 

ACAGACTGTACCAGCAACTAAAAATGAGATTGGGATAGAAGGTTTTC 

AAAATTTTGTCTATCATCAAAAGAGAGAATACCCAATAAGAAATC CTTTA 

AATTTTTCGTTTGCTTTTGGTGGAAATA^ 

TTTAGATTCACCTCTAGAAACATTACCTGCTAG 

CTATCTTATCATCTGTTGCTTCCATTrcr^ 

ACCTATGAAAAAGTTGCTAGTAATTTCAACGACTTTGAAGC^ 

TAAAGGGGCTAGACCACCXZAAAACTGTCAACCCAGCACAATTTA^ 

TGGATGATTTTTCCAAAATGGTTGCOGTAACAACA^ 

GAAAG CAATATTAATCTAAAAAAACAAGATACTTCAAAAGTAGGAATTGT 

ATTTACAACACTTTCTGGAC<^GTTGAGGTTGITGAA 

AAATCACAACAGAAGGATATGCACATGTTTCTGC^ 

AC^GT AATGA ATGCAGCAGCTGGTATGCTTTCTATCA 

AGGTCCTTTATCTCTCATTTCGACAAATAGTGGAG CGCTTGATGGTATAC 

AATATGCCAAGGAAATGATGCtn^AACGATAATCTAG^ 

GTTTCreCTAATCAGTGGACAGACATGAGTTTTAT^ 

AAACTATGATAGTCAAATGTITGTCGGTTCTGATTATTC 

TCCTCTCrOGTOU^CATTGGATAATTCrCCT 

CAATTAAAATATAGCCATAAAACATTCACAGATGTGAT^^ 

TGCTGCGCTTCAAAATTTATTATCAGACTTA^ 

TCAAAGGTTTCXnTTGGAATGAGC<3GAAGAAGGCAGTTA^ 

GA lUTCiU 'AGCGAACTTglXriXlAGTATTATAATATG CCAAACCTTGCTTC 
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TGGT CAGTTTGGATTTTCATCTAATGGTGCT 

CTGTTAATGAAAGTATAGAAAAGGGCT ATTATTTAGTCCTAT CTTATTCG ■ 
ATCTTTGGTGGTATCTCTTTTGCTATTATTGAAAAAAGG 

SEQ XD NO. 7503 
STRAIN A909 

ATGTTAGTGGAATAGGAATTATTTCTTCTTTGGGAAAGAATT 

ATAGOlAGCIATAAACAGCATCTCrTCGACTTAAAAGAAGG^ 

CATTTATATAAAAATCACGACTCTATTTT^ CAT 

AACT AGTGACCCAGAGGTTCCTGAG CAAT ACAAAGATGAGACACGTAATT 

TTAAATTTGCTi'TrACCG LTVL'l'lXSAAGAGGCTCTTGU'lU'L: JL'JL' CAGU'i\i*rr 

AATTTAAAAGCTTATCATAATATTGCTGTCTGT^ 

GGGAAAGAGTGCTGGTCAAAATGCCTTGTATCAAT^^ 

CTCAAGTAGATGCTAGTTTATTAGAAAAAGCA^ 

GATGAATTGAT<X3CTTATCATCATATTGTC 

AACCGCCTGTTCTGCAAGTAATAATGCCGTAATATTAGGAAC^ 

AGTGATATTTCTTTAGCAGGCTTCACATCACTA^ 

AATGGCATGTCAGCCCTATTCTTCTGGAAAAGGAATCAA 

G CXXTTGGTTTTGTTGTTCTTGTCAAAGAT 

AAAATTATCGGTGGTCTTATTACTTCAGATGGTTATC^ 

TAAGCCAACAGGTGAAGGGG CGGCACAGATTGCAAAG CAGCTAGTGACTC 

AAGCAGGTATTGACTACAGTGAGATTGACTATATT^ 

GGTACTCAAG CTAATGATAAAATGG/LAAAAAATATGTATGGTAAGTTTTT 

CXXXSACAACGACATTGATCAGCAGTACCAAGGGGCAAACGGGTCAT^ 

TAGGGGCTGOVGGTATTATO3AATTGATO 

GAACAGACTGTACCAGCAACTAAAAATGAGATTGGGATAGAAGGTW 

AGLAAAATTTTGTCTATCATCAAAAGAGAGAATACCCAATAA 

TAAATTTTTCGTTTGCTTTTGGTGGAAATAATAGTGGTOT 

TCTTTAGATTCACCTCTAGAAACATTACCIX3CT 

GGCTATCTTATGATCTCTTGCTrrCCAT^ 

TAACCTATGAAAAAGTTGCTAGTAATTTG^ 

TTTAAAGGGGCTAGACCACCCAAAACnXjrCAACCCAG CACAATTT AGGAA 

AATGGATGATTTTTCCAAAATGGTrGCCGTAAC^ 

TAGAAAGCAATATTAATCTAAAAAAACAAGATACTTC^ 

GTATTTACAACACnTCTGGACCAGTTCAGGT^ 

GCAAATCACAACAGAAGGATATGCACATGTTTCrGCTTCA 

TTACAGTAATGAATGCAGCAGCTGGTATGCTTTCTAT CATTTTTAAAATA 

ACAGGTCCTTTATCTGTCATTTCXmCAAATAGTGG^ 

ACAATATGCCAAGGAAATGATG CGTAACGATAATCTAGACTATGTGATTC 

TTGTTTCTCCTAATCAGTGGACAGACATGAGTTTrAT^^ 

AGTCCTCTCTCX3TCAAGCATTGGATAATTCTC 

AACAATTAAAATATAGCCATAAAACATTCACAGATGTGATGACTATTTT^ 
GATGCHX3CGCTTCAAAATTTATTATCAGACTTA 

ATGATTTCTTAG CGAACTTGT<nXlAGTATTAT AATATGCCAAAGCTTGCT 
TCTGGTCAGTTTGGATTTTCAT<rrAATGGTC 

TACTCTTAATGAAAGTATAGAAAAGGGCTATTATTTAGTCCTATCT^ 
SEQ XD HO. 7504 

STRAIN H36B 

ATGTTAGTGGAATAGGAATTATTTCITrCTTTGGGAAAG 
GCATAAACAGCATOT^nrCGACTTAAAAGAAGGAAT^ 
ATAAAAATCZACX1ACTCTATTTTAGAATCTTATACAGGAAGCATAACTAGT 
GACCCAGAGGTTCCTGAGCAATACAAAGATGAGA^ 

AAGCTTATCATAATATTCCTGTGTGTT^ 
AGTGCTCGTCAAAATGCCTTGTATCAATTTGAAG 
AGATCCTAGTTTATTAGAAAAAGCATCrrGTT^ 
TGATGGCTTATCATGATATTGTGGGAGCTT 

IXilUXrrGCAAGTAATAATGCCGTAATATTAGGAACACAATTALriiCAAGA 



TTTCTTTAGCAGGCTTCACATCACTAGGAGCTATTAA^ 
TGTCAGCCCTATTCTTCTGGAAAAGGAATCAATTT^ 
TTTTt3TTGTTCITGTCAAAGATCAGTCCTTAG CTAAATATGGAAAAATTA 
TCX3GTGG1VIUATTACTTCAGATGGTTAT 

ACAGGTGAAGGGG CGGCACAGATTG CAAAGCAGCTAGTGACTCAAGCAGG 

TATTGACTACAGTGAGATTGACTATATrAACXJ^ 

AAGCTAATGATAAAATGGAAAAAAATATGTATGGTAAGT^ 

ACGACATTGATCAGCAGTACCAAGGGG CAAACGGGTCATACTCTAGGGGC 

TGCAGGTAT/rATOGAATTGATTAATTGT^ 

CTGTACCAGCAACTAAAAATGAGATTGGGATAGAAGGT^ 

TTTGTCTATCAT<ZAAAAGAGAQAATA€CCAA^ 

TTCGTTTGCTTTIGGTGGAAATAATAGTG^ 

ATTCACCTCTAGAAACATTACCTCCTACSAGAAAATCT 

TTAT^TC UVr iX ^TC CATTTXn'AAGAATGAATC^ 

TGAAAAAGTTX3CTAGTAAT*ITCAACGACTTTGA 

GGGCTAGACCACCCAAAACTGTCAAOCCAGCACAATTTAGGAA 

GATTTTTCCAAAATGGTTCCCGTAACAACAGCTCAAGC^ 

CAATATTAATCTAAAAAAACAAGATACTTCAAAAff 

CAACA LT1TCTO GACCAGTTGAG G1 T G TTGAAG 
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ACAACAGAAGGATATGCACATGTTTCTGCTTC 

AATGAATGCAGCAGCTGGTATGCTTTCTATCATTTT^^ 

CTTTATCTGTCATTT CGACAAATAGTGGAG CGCTTGATGGTATACAATAT 

GCCAAGGAAATGATGCGTAAOGATAATCTAGACrATGTG^TTC^ 

TGCTAATCAGTGGACAGACATGAGTTTTATGTGGTGGCAACAATC 

ATGATAGTCAAATGTTTGTCGGTTCTGATTATTGTTCAG CACAAGTCCTC 

TCTCGTCAAGCATTGGATAATTCTCCTATAATATTAGGTAGTAAAC^A^ 

AAAATATAG CCATAAAACATTC7VCAGATGTGATGACTATTTTTGATGCT 

CGCTTCAAAATTTATTATCAGACTTAGGACTAACCATAAAA 

GGTTTCGTTTGGAATGAGCGGAAGAAGGCAGTTAGTTCAG^ 

CTTAG CGAACTTGTCTGAGTATTATAATATGCCAAACCITGCTTCTGGTC 

AGllTGGATTlTCATCTAATGGTGCUliGlt5AAGAA.CTGGACTATACTGTO 

AATGAAAGTATAGAAAAGGGCTATTATTTAGTCCTATCTrATTCGATCrT 

OGCTGGTATCTCTTTTGCTrATTATTGAAAAAAGQ 



SEQ ID NO. 7505 
STRAIN 18RS21 

ATGTTAGTGGAATAGGAATTATTTCTTCTTTGGGAAAGAATTATAGC 

GAGCATAAACAGCATCTCTTCXSACTTAAAAGAJySGAATITCT 

ATATAAAAATCACGACTCTATTTTAGAATCTTATACAGGAAG CATAACTA 

GTGACCXAGAGGTTCCTGAGCAATACAAAGATGAGACACGTAATTTTAA^ 

TTTGCTTTTACCGCTTTTGAAGAGGCTCTTGCTTCTTC^ 

AAAAGCTTATCATAATATTGCTGTGTGTITAGGGAC^ 

AGAGTGCTGGTCAAAATGCCTTGTATCAATTTGAAGAAGGAG 

GTAGATGCTAGTTTATTAGAAAAAGCATCTGTTTACCA^ 

ATTGATGGCTTATCATGATATTGTGK3GAGCIT 

CCTGTTCTG CAAGTAATAATGCCGTAATATTAGGAACACAATTACTTCAA 
' GATGG CGATTGTGATTTAG CTATTTGTGGTGGCTGTGATGAG'ITAAGTG A 
TATTTCTTTAGCAGGCTTCACATCACTAGGAG CTATTAATACAGAAATGG 
CATGTCAGCCCTATTCTTCTGGAAAAGGAATCAATTT^ 

TAG CTAAATATGGAAAAAT 

CAACAGGTGAAGGGGCXX3CACAGATTGCAAAGCAGCTAGT 

GGTATTGACTACAGTGAGATTGACTATATTAACGGTCT^CGGTACAGGTAC 

TCAAGCTAATGATAAAATGGAAAAAAATATGTATGGTAAGTTTTTCCCG 

CAACGACATTGATCAGCAGTACCAAGGGGCAAACGGGTCATACTCT 

GCTGCAGGTATTATCGAATTGATTAATTGTTTAG CGGCAATAGAGGAACA 

GACTGTACCAGCAACTAAAAATGAGATTGGGATAGAAGGTTTTCCAGAAA 

ATTTTGTCTATCATCAARAGAGAGAATACCCAATAAGAAATG CTTTAAAT 

TTTTCGTTTGCTTTTGGTGGAAATAATAGTGGTGTCTTATTC 

AGATTCACCTCTAGAAACATTACCTGCTAGAGAAAAT 

TCTTATCATCTGT1X3CTTCCATTTCTAAGAATGAATC 

TATGAAAAAGTTGCTAGTAATlT:CAACGACriTTGAAGCATTA 

AGGGGCTAGACCACCCAAAACTGTCAACCCAGCACAATTTAGGAAAATGG 

ATGATTTTTCCAAAATGGTTGCCGTAACAACAGCTCAAGCACTAAT^ 

AGCAATATTAATCTAAAAAAACAAGATACTTCAAAAGTAGGAATTGTATT 

TACAACACTTTCTGGACCAGTTGAGGTTGTTGAAGG 

TCACAACAGAAGGATATGCACATGTTTCT 

GTAATGAATGCAGCAGCTGGTATGCi'riXJ'lATCATl'riTAAAATAACAGG 
TCCrTTATCTGTCATTTCGACAAATAGTGGAG CG CTTGATGGTAT ACAAT 
ATGCCAAGGAAATGATGCGTAACGATAATCTAGACTATGTGAT^ 
TCTGCTAAT CAGTGGACAGACATG AGTTTTATGTGGTGG CAACAATTAAA 
CTATGATAGTCAAATGTTTGTCGGTTCIX^ 
TCTCTCGTCAAGCATTGGATAATTCTCCTATAA^ 

TTAAAATATAGCCATAAAACATTCACAGATGTGATGACTATTTTTGAT^ 
TGCGCTTCAAAATTTATTATCAGACTTAGGACTAACCATAAAAGATATCA 

TTCTTAGCGAACTTGTCIX^CTATTAT^ 
TCAGTTTGGATTTTCATCTAATGGTGCTGGTG 

TTAATGAAAGTATAGAAAAGGGCTATTATTTAGTCCTATCTTATTCGATC 
TTCGGTGGTATCTCTTTTGCTATTATTGAAAAAAGG 



SEQ ID MO. 7506 
STRAIN M732 

ATGTTAGTGGAATAGGAATTATTTCTTCTTTGGGAAAGAATTATAG 

CGAGCATAAACAGCATCTCTTCGACTTAAAAGAAGGAATTT^ 

TATATAAAAATCACX^CTCTATTTTAGAATCTTATACAGGAAGCATAACrr 

AGTGACCCAGAGGTTCCTOAGCAATACAAAGA 

ATTTCCTTTTACCGCTTTTGAAGAGGCrrCTTC 

AAGAGIGCTGGTCAAAATGCCTTGTATCAATTTGAAGA^ CGTCA 
AGTAGATGCTAGTTTATTAGAAAAAGCATCTGTTTACCATATTGCTGATC 
AATTGATGGCTTATCATGATATTGTGGGAGCITC^ 

GCCTGTTCTGCAAGTAATAATGCCCTAATATTAGGAACACAATTACTTCA 

AGATGGCGATTGTGATTTAGCTATTTGTGGTGGCTG^ 

ATAT1"1V1U"1'AGCAGGCTTCA)CATCACTAGGAGCTATTAATACAGAAATC 

GCATGTCAGCCXrrATKriTCTGGAAAAGGA C 

TGGlU'lU^"i"iXJ'l'l'Cl"lGTCAAAGATCAGTCCTTAGCTAAATATGGAAAAA 

TTATCGGTCGTCTTATTACTTCAGATGGTrATCATA^ 

CCAACAGGTGAAGGGGCGGCACAGATTGCAAAGCAGCTAGTX3ACT 

AGGTATTGACTACAGTGAGATTGACrATATTAACXSGTCACG 

CTCAAGCTAATGATAAAATGGAAAAAAATATGTATGGTAAGTTTTO 

ACAACGACATTGATCAG CAOTACCAAGGGGCAAACGGGTCATACTCT AGO 
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GGCTGCAGGTATTATCGAATTGATTAATTGTTTAG CGGCAATAGAGGAAC 

AGACTGTACCAG OUVCTAAAAATGAGATTGGGATAGAAGGTTTTCCAGAA 

AATTTTGTCTATCATCAAAAGAGAG^TACCCAATAAGAAATGCTTTAAA 

TTTTTCGTTTG CTTTTG GTGGAAAT AATAGTGGTGTCTTATTGT CATCTT 

TAGATTCACCTCTAGAAACATTACCTGCTAGAGAAAATCTTAAAATGGCT 

ATCTTATCATCTGTTGCTTCCATTT 

CTATGAAAAAGTTGCTAGTAATTTCAACGACTTTGAA 

AAGGGGCrAGACCACCCAAAACTGTCAACCCAGCACAATTTAGGAAAATG 

GATGATTTTTCXAAAATGGTTGCCGTAACAACAGCTCAAGCACT 

AAGCAATATTAATCTAAAAAAACAAGATACTTCAAAAGTAGGAATTGTAT 

TTACAACACTTTCTGGACCAGTTGAGGTTGTTGAAGG 

ATCACAACAGAAGGATATGCACATGTTTCTGCTTCACGATTCC^ 

AGTAATGAATGCAG CAGCTGGT ATGCTTTCTAT 

GTCCTTTATCTGTCATTTCGACAAATAGTGGAGCG CTTGATGGTATACAA 
TATGCGAAGGAAATGATGCGTAACGATAATCTAGACTATC 
TIXTpCTAATCAGTGGACAGACATGAGTTTTATGTGG 
ACTATGATAGTCAAATGTTTGTCGGTTCTGATTATTGTTCAG CACAAGTC 
CTCTCTCCTCAAGCATTGGATAATTCTCCTATAATATTAGGTAGTAAACA 
ATTAAAATATAG CCATAAAACATTCACAGATGTGATGACTATTTTTGATG 
CTGCGCrTTCAAAATTTATTATC!AGACTTAGGACTAACCATAAAAGATATC 
AAAGGTTTCX3TTTGGAATX1AGCGGAAGAAGGC!AGT^ 
TTTCTTAGCGAACTTGTCTGAGTATTATAATATGCCAAAC 
GTCAGTTTGGATTTTCATCT AATGGTG CTGGTGAAGAACTGGACTAtaCT 
GTTAATGAAAGT ATAGAAAAGGG CTATTATTTAGTCCTATCTTATTCGAT 
CTTCGGTGGTATCTCITTTGCTATTATTGAAAAAAGG 



SEQ ZD NO. 7507 

STRAIN COH1 

ATGTTAGTGGAATAGGAATTATTTCITCTTTGGGAAAGAATTATAGC 
GAG CATAAACAG CATCTCTTCGACTTAAAAGAAGGAATTTCTAAACATTT 
ATATAAAAATC^aSACTCTAl^lTAGAATCrrTATACAGGAAGCATAACTA 
GTGA CCCAGA GGT TCCTGA GCAATACAAAG 
TTTGCTTTTACCGCTTTTGAAGAGGCTCTTC 

AAAAGCTTATCATAATATTGCTGTGTGTTTAGGGACCTCACTTGGGG^ 

AGAGTGCTGGTCAAAATGCCTTGTATCAATTTXSAAG^ 

GTAGATG CTAGTTTATTAGAAAAAG CATCTGTTTACCATATTGCTGATGA 

ATTGATGGCTTATCATGATATTGTGGGAG CTTCGTATGTTATTTCAACCG 

CCTGTTCTCCAAGTAATAATGCCGTAATATTAGGAACACAATrACI^C^ 

GATGGCGATTGTGATTTAGCTATTTGTGGTGG CTGTGATGAGTTAAGTGA 

TATTTCTTTAGCAGG CTTCACATCACTAGGAGCTATTAATACAGAAATGG • 

CATGTCAGCCCTATTCTTCTGGAAAAGGAATCAATTTGGGTGA 

GGl'i^WritSTTCTTGTCAAAGATCAGTCCTrAGCTAAATATGGAAAAAT 

TATCGGTGGTCTTATTACTTCAGATGGTTATCATATAACA^ 

CAACAGGTGAAGGGG CGGCACAGATTG CAAAGCAGCTAGTGACTCAAGCA 

GGTATTGACTACAGTGAGATTGACTATATTAACGGTCACGGTACAGGTAC 

TCMGCTAATGATAAAATGGAAAAAAATATGTATGGTAAGTTTTTC^ 

CAACGACATTGATCAGCAGTACCAAGGGGCAAACGGGTCATACrrCTAGGG 

GCTGGAGGTATTATCX3AATTGATTAATTGTTTAGCGGC 

GACTGTACCAGCAACTAAAAATGAGATTGGGATAGAAGGTT^ 

ATTTT GTCT A TCATC AAAAGAGAGAATACCOUVTAA 

TTTTCXaTTTGCTTTTGGTGGAAATAATAGTGGTGTCTTAT^ 

AGATTCACCTCTAGAAACATTACCTGCrAGAGAAAATCTTAAAATGGCTA 

TCTTATCATCTGTTG CTTCCATTTCTAAGTVATGAATtZACTTTCTATAACC 

TATGAAAAAGTTGCTAGTAATTTCAACGALTl"i"lGAAG CATTACGCi' IT AA 

AGGGGCTAGACCACCCAAAACTGTCAACCCAGCAGAATTTAGGAAAATGG 

ATGATTTTTCCAAAATGGTTGCCGTAACAACAGCTCA 

AGCAATATTAATCTAAAAAAACAAGATACTTCAAAAGTAGGAATTGTATT 

TACAACACTTTCTGGACCAGTTGAGGTT^ 

TCACAACAGAAGGATATGCACATGTTTCTGCTTCACGATTCC 

GTAATGAATGCAGCAGCTGGTATGCTTTCTATCATTTTrAAAATAACAGG 

TCCTTTATCTGTCATTTCGACAAATAGTGGAGC^ 

ATGCCAAGGAAATGATGCGTAACGATAATCTAGACTATGTGATTLTi"i\ii _ l' 

TCTGCTAATCAGTGGACAGACATGAGl'lU'rATGTGGTGGCAACAATTAAA 

CrATGATAGTCAAATGTTTGTCGGTTCTGATTATTGTTC^ 

TCTCTOGTCAAGCATTGGATAATTCTCCTATAATATTAGGTAGT^ 

TTAAAATATAGCCATAAAACATTCACAGATGTGATGACTATTTTTGA 

TGCGCTTCAAAATTTATTATC^GACriTAGGACT 

AAGGTTTCGTTTGGAATGAGOGGAAGAAGGCAGTTAGTT^ 

TCAGTTTGGATTTTCATCTAATGGTGCTGGTGAAG 

TT AATGAAAGTATAGAAAAGGG CTATTATTTAGTCCTATCTTATTCGATC 
TTCGGTGGTATCTCTTTTGCrATTATTGAAAAAAGG 

SEQ ID NO. 7508 
STRAIN M781 

ATGTTAGTGGAATAGGAATTAlL"l"lVri'Cl'i"lGGGAAAGAATTATAGC 

GAGCATAAACAGCATCTCTTCGACTTAAAAGAAGGAATTTCT 

ATATAAAAATCACQACTCTATTTTAGAATCTTATACAGGAAGCATAACTA 

GTGACCCAGAGGTTCCTCAGCAATA(^W^GATGAGACAC^ 

TTTGCfTTTTACCGCTTTTGAAGAGGCTCTTOCTTCCT 

AAAAGCTITATCATAATATTGCTGTGTGTTTAG^ 

AGAGTGCIGGTCAAAATGCCTTGTATCAATTIX5A^ 

GTAGATGCTAGTTTATTAGAAAAAGCATCTGTT^ 



i 
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ATTGATGGCTTATCATGATATTGTGGGAGCTT OGTATGTTATTTC 
CCTGTTCTG CAAGTAATAATGCCX3TAATATTAGGAACACAATTACTTCAA 
GATGGCGATTGTGATTT AG CTATTTGTGGTGGCTGTGATGAGTTAAGTGA 
TATTTCTTTAGCAGGCTTCACATCACTAGG^ 
CATGTCAGCCCTATTCTTCTGGRAAAGGAATCAATTTG^ 
G tfl * l " l " lX» M lWlTLTI GTaVAAGATaVCn^ 

TATCGGTGGTCTTATTACTTCAGATGGTTATCATATAACAGCACCT C 

CAACAGGTaAAGGGGCGGCACAGATTGCAAAG CAGCTAGTGACTCAAGCA 

GGTATTGACTACAGTGAGATTGACTATATTAATGGTCACXKn' 

TCAAGCTAATGATAAAATGGAAAAAAATATGTATGGTAAG 

CAACGACATTGATCAGCAGTACCyVAGGGGCAAACGGGTCATACTrCT 

GCTGCAGCTATTATCGAATTGATTAATTGTTTAGCGGCAATA 

GACTGTACCAGC^CTAAAAATGAGATTGGGATAGAAGGTTTTCCAGAAA 

ATTTTGTCTATCATCAAAAGAGAGAATACCCAATAAGAAATG CTTTAAAT 

TTT^COTTTGCTTTTGGTGGAAATAAT^ 

AGATTCACCTCTAGAAACATTACCTGCTAGAGAAAATCTT^ 

TCTTATCATCTGTTGCTTCCATTTCTAA^ 

TATGAAAAAGTTGCT AGTAATTTCAACGACTTTGAAG CATT ACG CTTTAA 
AGGGGCTAGACCACC<IAAAACrcTCAACCCAGCACAA 
ATGATTTTTCCAAAATGGTTGCCGTAACAACAGCT • 
AG CAATATTAATCTAAAAAAACAAGAT ACTTCAAAAG T AGGAATTGT ATT 
TACAACACTTTCTGGACCAGTTGAGGTTGTTGA^ 
TCACAACAGAAGGATATGCACATGTTTCT^ 

GT AATGAATG CAG CAGCTGGTATG CTTTCTATCATTTTTAAAAT AACAGG 

TCCTTTATCTGTCATTTCGACAAATAGTGGAG C<3CTTG^ 

ATGCCAAGGAAATGATGCGTAACGATAATCTAGACTATGTGATTCTTC 

TCTGCTAATCAGTGGACAGACATGAGTTTTATGTGGTGGCAA 

CTATGATAGTCAAATGTTTGTCGGTTCTGATTATTGTT 

TCTCTCX3TGAAGCATTGGATAATTCTCCTATAATATTAGCT 

TTAAAATATAGCCATAAAACATTCACAGATGTGATGA 

TGCGCTTCAAAATTTATTATCAGACTTAGGACTA^ 

AAGGTTTCGTTTGGAATGAGCGGAAGAAGGCAGT^^ 

TTCTTASCGAACTTGTCTGAGTATTATAATO 

TCAGTTTGGATTTTCATCTAATGGTGCT^ 

TTAATGAAAGTATAGAAAAGGGCTATTATTTAGTCCT^ 

TTTGGTGGTATCTCTTTTG CTATT ATTGAAAAAAGG 



SBQ ID HO. 7509 
STRAIN CJB 110 

ATGTTAGTGGAATAGGAATTATTTCmCTTTGGGAAAGAATTATAGC 
GAGCATAAACAGCATCTCTTCGACTTAAAAGAAGGAATTTCTAAACATTT 
ATATAAAAATCACGACTCTATTTTAGAATCTTATACAGGAAGCATAACTA 
GTGAC CCAGAGGTTCCTGAG CAATACAAAGATGAGACACGTAATTTTAAA 
TTTGCrrriTACCGCITTTGAAGAGGCTCT 

AAAAG CTTATCATAATATTGCTGTGTGTTTAGGGACCTCACrTGG 

AGAGTGCTGGTCAAAATGCCTTGTATCAATTTGAAGAAGGA^ 

GTAGATGCTAGTTTATTAGAAAAAGCATCTGTTTACCATAT^ 

ATTGATGGCTTATCATGATATTGTGK3GAGCT^ 

CCTGTTCTGCAAGTAATAATGCCX3TAATATTA 

GATGGCGATTGTGATTTAGCTArrTGTGGTGG CTrGTGATGAGTT AAGTG A 
TATTTCTTTAGCAGGCTTCACATCACTAGGAGCTATT 
CATGTCAGCCCTATTCTTCTGGAAAAGGAATCAA^ 
GGTTTTGTTGTTCTTGTCAAAGATCAGTC 

CAACAGGTGAAGGGGCGGCACAGATTGCAAAGCAGCTAGTGACT 

GGTATTGACTACAGTGAGATTGACTATATTAAT^ 

TCAAGCTAATGATAAAATGGAAAAAAATATGTATGGTAAGTTTT^ 

CAACGACATTGATCAGCAGTACCAAGG^ 

GCTGCAGGTATTATCGAATTGATTAATTC 

GACTKnACCAGCAACTAAAAATGAGATTGGGA^ 

ATTTTGTCTATCATCAAAAGAGAGAATACCCAATAAGAA A 

TTTTCGTTTGCTTTTGGTGGAAATAATAGTGGTATC^ 

AGATTCACCTCTAGAAACATTACCTGCTAGAGAAAA 

TCTTATCATCTGTTGCTTCCIATTTCTAAaAATGAATCA 

TATGAAAAAGITGCTAGTAATITCAACGAeiU-iGAAGCATTACG CTTTAA 

AGGGGCTAGACXACCCAAAACTGTCAACCCAG CACAATTTAGGAAAATGG 

ATGATTTTTCCAAAATGGTTGCCG CACTAATAGAA 

AGCAATATTAATCTAAAAAAACAAGATACTTCAAA 

TACAACACTTTCTGGACCAGTTGAGGTTGTTG^ 

TCACAACAGAAGGATATGCACATGTTTCTGCTT 

GT AATGAATG CAG CAGCTGGTATGCITTCTATCATT^ 

TCCTTTATCTGTCATTTCGACAA^ 

ATGCCAAGGAAATGATGCXn"AAa3ATAATCTAGACT 

TCTOCTAATCAGTGGACAGACATGAGTTT^ 

CTATGATAGTCAAATGTTTGTCGGTTCTGA 

TCTCTCGTCAAGCATTGGATAATTCTCCTATAATA 

TTAAAATATAGCCATAAAACATTCZACAGATGTGATGACrATT^ 

TGCX3CTTCAAAATTTATTATCAGACTTAGGACT 

AAGGTTTCGTTTGGAATGAGCGGAAGAAGG CAGT^ 

TTCTTAGCGAACTTGTCTGAGTATTATAATATG 

TCAGTTTGGATTTTCATCTAATGGTGCTGG^ 

TTAATGAAAGTATAGAAAAGGG CTATTATTTAGTC<^ATCTTATTCGATC 
TTTGGTGGTATCI'CVlTTXKn'ATTATTGAAAAAAGG 
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• SEQ ID HO. 7510 
STRAIN U69NT 

ATGTTAGTGGAATAGGJ^TTATTTCTTCTTTGGGAAAGAATTATAG 
CGAGCATAAACAGCATCTCTTCGACTTAAAAGAAG 

TATATAAAAATC^CGACTCTATTTTAGAATCTTATAC^GAAGCATAACrr 

AGTGACXTCAGAGGTTCCTGAGCAATACAAAGATGAGA 

ATTTGCITTTACOTCTTTTGAAGAGGCTCTTC 

ARGAGTGCTGGTCAAAATGCCTTGTATCAATTTGAAGAAGGA 

AGTAGATGCTAG'IUTATTAGAAAAAG^TCTGTTTACCATATTGCrGATG 

AATTGATGGCTTATCATGATATTGTGGGAGCTTC^ 

GCCTGTTCTGCAAGTAATAATGCCGTAATATTAGGAACACAATTACTTCA 

AGATGGCX3ATTGTGATTTAGCTATTTGTGCTGGCTGTC 

ATATTTCTTTAG CAGGCTTCACATCACTAGGAG CTATTAATACAGAAATG 

GCATGTCAGCCCTATTCTTCTGGAAAAGGAATCAATrTG^ 

TG G'ri ' nXJri^rirX ' l^ TCAAAGATCAGTCCrTAGCTAA^ 

TTATCGGTGGTCTTATTACTTCAGATGGTT^ 

CCAACAGGTGAAGGGGCGG CACAG ATTGCAAAGCAGCTAGTGACTCAAGC 

AGGTATTGACTACAGTGAGATTGACTATATTAA 

CTCAAGCTAATGATAAAATGGAAAAAAATATGTAra 

ACAACGACATTGATCAGCAGTACCAAGGGCCAAACGGGTCATACTCTAGG 

GGCTCCAGGTATTATCGAATTGATTAATTGTTTAGCGGCAATAG^ 

AGACTGTACCAGCAACTAAAAATGAGATTGGGATAGAAGGTTTTCC^ 

AATTTTGTCTATCATCAAAAGAGAGAATACCCA^ 

TTTTTCGTTTGCTTTTGGTGGAAATAATAGTGCT 

TAGATTCACCTXHAGAAACATTACCTOCT 

ATCITATCATCTGTTGCITCCAm 

CTATGAAAAAGTTGCTAGTAATTTCAACGACTTTGAAGC^ 

AAGGGGCTAGACCACCCAAAACTGTCAACCCAG<^CAATT^ 

GATGATTTTTCXAAAATGGTTGCCX?rAACAACAG CTCAAGCACTAATAGA 

AAG<^TATTAATCTAAAAAAACAAGATACnTCAAAAGTAGGAATTGTAT 

TTACAACACTTTCTGGACXAGTTGAGGTTGTTGAAG^ 

ATCACAACAGAAGGATATGCACATGTTTCT 

AGTAATGAATGCAGCAGCTGGTATGCTTTCTATCATTTTTA 

GTCCTTTATCTGTCATTTCGACAAA^ 

TATGCX3UVGGAAATGATCCX3TAACGATAATCTAGACT 

TTCTGCTAATCAGTGGACAGACATGAGTTTTATGTGG^ 

ACTATGATAGTCAAATGTTTGTCGGTTCTGATTATTC 

CTCTCTCGTCAAGCATTGGATAATTCTCCTATAATATTAGGTAGTA 

ATTAAAATATAGCCATAAAACATTCACAGATGT^ 

CTGCGCTrCAAAATTTATTATa^GACTTAGGACTAAC 

AAAGGTTTCXTTTTGGAATGAGC<X^ 

TTTCTTAGCGAACTTGTCTGACTATTATA 

GTCAGTTTGGATTTTCATCTAATGGTGCTGGTGAAGA^ 

GTTAATCAAAGTATAGAAAAGGGCTATTATTTAGTCCT 

CTTTGGTGGTATCTCTTTTGCTATTATTGAAAAAAGG 



SEQ ZD NO. 75X1 

STRAIN JM9130013 
ATGTTAGTGGAATAGGAATTA, rrr CTTC 

CATAAACAGCATCTCITCGACTTAAAAGAAGGAATTTCT 

TAAAAATCACGACTCTATTTTAGAATCTTATACAGGA 

ACCCAGAGGTTCCTGAGCAATACAAAGATGAG^ 

GCTTTTACCGCTTTTGAAGAGGCTCTTGCTT^ 

AGCTTATCATAATATTGCTGTGTGTTTAGGGACCT 

GTGCTGGTCaAAATGCXrrTGTATCAATTTG 

GATGCTAGTTTATTAGAAAAAGCATCTGTTTACXIA 

GATGGCTTATCATGATATTGTGGGAGCTTCCTA^ 

GTTCTGCAkGTAATAATGCCGTAATATTAGGA 

GG CGATTGTGATTTAGCTATITGTGGTGGCTGTGATGAGTTAAG 

TTCTTTAGCAGG CTTCACATCACTAGGAG CTATTAATACAGAAATGGCAT 

OTCAGCCCTATTCTTCHXaGAAAAGGA 

TTTGTTGTTCTTGTCAAAGATCAGTariTA^ 

CGGTGGTCI^ATTACTTCAGATGGTTATCATATAA 

CAGGTGAAGGGGCGGCACAGATTGCAAAGCAG CTAGTGACTCAAGCAGGT 

ATTGACTACAGTGAGATTGACTATATTAACX3GTCACGOT 

AGCTAATGATAAAATGOAAAAAAATATGTATGGTAAGrrinU^CCGACAA 

CGACATTGATCAGCAGTACCAAGGGGCAAACGGGTCATACTCT 

GCAGGTATTATCGAATTGATTAATTGTTTAG 

TGTACXAGC^CTAAAAATGAGATTGGGATAGAAGGT^ 

TTGTCTATCATCAAAAGAGAGAATACCCAATAAGAAATGCTTTA 

TOJITTGCTTTTGGTGGAAATAATAGTGG'l\»r 

TTCACCTCTAGAAACATTACCTGCrAGAGAAAATCTTAAAATGGCTATCT 

TATCATCTGTTOCTTCCATTTCTAAQ^ 

GAAAAAGTTGCTAGTAATTTCAACGACTrTGAA^ 

GGCTAGACCAC<XIAAAACTGTCAACCCAGCACAAT^ 

ATTTTTCCAAAATGGTTGCCGTAACAACAGCTC^ 

AATATTAATCTAAAAAAACAAGATACITGWUUVGTAGG 

AACACTTTCTGGACaUSTTGAGGTTGT^ 

CAACAGAAGGATATGCACATGTXTCT6CTTCACX5ATTC 

ATGAATGCAGCAGCTGGTATGCTTTCTATCATTTTT^ 

TTTATCTGTCATTTCGACAAATAGTGGAGCXK^TGATG^ 
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CX^AGGAAATGATGCGTAACGATAATCTAGACTATGTGAl'lVllVl'l'rCl' 

GCTAATCAGTGGAGAGACATGAGTTTTATGTGGT^^ 

TGATAGTCAAATGTTTGTCGGTTCTGAT^ 

CTCGTCA^CATTGGATAATTCTCCTATAATATrAGGTAGTAAACAATTA 
AAATATAGCCATAAAACATTCACAGATGTQATGACTATTTTTO 
GCTTCAAAATTTATTATCAGACTTAGGACrAACCATAAAAGATATCAAAG 
GTITCGTTTGGAATGAOOGGAAGAAGGCAOTrAGTTCAGATT 
TTAGCGAACTTGTCTGAGTATTATAATATGCCAAACCTTGCT^ 
GTTTGGATTTTCATCTAATGGTG CTGGTGAAGAACTGGACTATACTGTTA 
ATGAAAGTATAGAAAAGGGCTATTATTTAGTC CTATCTTATTCGATCTTC 
GGTGGTATCTCTTTTGCTATTATTGAAAAAAGG 

PRETTY Of: /biotmp/msall8688 . 2 { * } April 9. 2003 02:55 



msall8688.2{361_18RS2i: 
msall8688.2f361_A909 
msall8688.2{361_COHl 
msall868B.2{361_H36B 
msall8688 .2{361_JM9130013 
rasall8688 .2{361__M732 
msall8688 . 2 {GBS361_2603 
msall8688 . 2 {361_090 
msall8688.2(361_1169NT 
msall8688 . 2 { 361JCJB110 
msallB688 . 2 { 361_M781 
Consensus 



1 50 

ATGTTAGTGG AATAGGAATT ATTTCTTCTT TGGGAAAGAA 

ATGTTAGTGG AATAGGAATT ATTTCTTCTT TGGGAAAGAA 

ATGTTAGTGG AATAGGAATT ATTTCTTCTT TGGGAAAGAA 

ATGTTAGTGG AATAGGAATT ATTTCTTCTT TGGGAAAGAA 

ATGTTAGTGG AATAGGAATT ATTTCTTCTT TGGGAAAGAA 

ATGTTAGTGG AATAGGAATT ATTTCTTCTT TGGGAAAGAA 

atgagcgtat ATGTTAGTGG AATAGGAATT ATTTCTTCTT TGGGAAAGAA 

ATGTTAGTGG AATAGGAATT ATTTCTTCTT TGGGAAAGAA 

" ATGTTAGTGG AATAGGAATT ATTTCTTCTT TGGGAAAGAA 

ATGTTAGTGG AATAGGAATT ATTTCTTCTT TGGGAAAGAA 

ATGTTAGTGG AATAGGAATT ATTTCTTCTT TGGGAAAGAA 



msall8688 ,2{361_18RS21* 
msall8688 .2{361_A909 
msall8688 . 2 { 361_COHl 
msall8688.2{361_H36B 
msall8688 .2{361_jJM9130013 
msall8688.2{361_M732 
msall8688 . 2{GBS361_2603 
msall8688.2{361_090 
msa!18688 .2f 361_1169NT 
msall8 6 8 8 . 2 { 3 6 1_CJB11 0 
rasall8688.2{361_M781 
Consensus 



51 

TTATAGCGAG 
TTATAGCGAG 
TTATAGCGAG 
TTATAGCGAG 
TTATAGCGAG 
TTATAGCGAG 
TTATAGCGAG 
TTATAGCGAG 
TTATAGCGAG 
TTATAGCGAG 
TTATAGCGAG 



CATAAACAGC 
CATAAACAGC 
CATAAACAGC 
CATAAACAGC 
CATAAACAGC 
CATAAACAGC 
CATAAACAGC 
CATAAACAGC 
CATAAACAGC 
CATAAACAGC 
CATAAACAGC 



ATCTCTTCGA 
ATCTCTTCGA 
ATCTCTTCGA 
ATCTCTTCGA 
ATCTCTTCGA 
ATCTCTTCGA 
ATCTCTTCGA 
ATCTCTTCGA 
ATCTCTTCGA 
ATCT CTT CGA 
ATCTCTTCGA 



CTTAAAAGAA 
CTTAAAAGAA 
CTTAAAAGAA 
CTTAAAAGAA 
CTTAAAAGAA 
CTTAAAAGAA 
CTTAAAAGAA 
CTTAAAAGAA 
CTTAAAAGAA 
CTTAAAAGAA 
CTTAAAAGAA 



100 

GGAATTTCTA 
GGAATTTCTA 
GGAATTTCTA 
GGAATTTCTA 
GGAATTTCTA 
GGAATTTCTA 
GGAATTTCTA 
GGAATTTCTA 
GGAATTTCTA 
GGAATTTCTA 
GGAATTTCTA 



101 

msal 18 68 8 . 2 { 3 6 1_1 8RS2 1 V AACATTTATA 

msal 1868 8 . 2 { 3 6 1_A909 > AACATTTATA 

msal 1868 8.2136 l_COHl AACATTTATA 

msall8688.2{361_H36B AACATTTATA 

msall8688.2{361_JM9130013 AACATTTATA 

msall8688.2{361_M732 AAC ATTTA TA 

msall8688.2{GBS361_2603 AACATTTATA 

msall8688.2{361_090 AACATTTATA 

rasall8688 .2(3 61_1169NT \ AACATTTATA 

msall8688.2{361_CJB110 \ AAC ATTTA TA 

msall8688.2{361_M78l) AACATTTATA 

Consensus ********** 



TAAAAATCAC 
TAAAAATCAC 
TAAAAATCAC 
TAAAAATCAC 
TAAAAATCAC 
TAAAAATCAC 
TAAAAATCAC 
TAAAAATCAC 
TAAAAATCAC 
TAAAAATCAC 
TAAAAATCAC 



GACTCTATTT 
GACTCTATTT 
GACTCTATTT 
GACTCTATTT 
GACTCTATTT 
GACTCTATTT 
GACTCTATTT 
GACTCTATTT 
GACTCTATTT 
GACTCTATTT 
GACTCTATTT 



TAGAATCTTA 
TAGAATCTTA 
TAGAATCTTA 
TAGAATCTTA 
TAGAATCTTA 
TAGAATCTTA 
TAGAATCTTA 
TAGAATCTTA 
TAGAATCTTA 
TAGAATCTTA 
TAGAATCTTA 



150 

TACAGGAAGC 

TACAGGAAGC 

TACAGGAAGC 

TACAGGAAGC 

TACAGGAAGC 

TACAGGAAGC 

TACAGGAAGC 

TACAGGAAGC ' 

TACAGGAAGC 

TACAGGAAGC 

TACAGGAAGC 



msall8688 . 2 { 361_18RS2 1 
msall8688.2{361_A909 
msal 18 68 8 . 2 f 361_ COH1 
msall8688.2{361_H36B 
msall8688.2{361__JM9130013 
msall8688.2{361_M732 
msall8688.2{GBS361_2603 
msall8688.2{361_090 
msall8688.2(361_1169NT 
msall8688.2{361_CJB110 
msall8688 . 2 { 361_M781 
Consensus 



msall8688 . 2 { 3 61JL8RS21 
msall8688 . 2 ( 361_A909 
msall8688 . 2 { 361_C0H1 
msall8688 .2{361_H36B 
msall8688 .2(361 JM9130013 
msallB688.2{361_M732 
msall8688 .2{GBS361_2603 
msall8688.2{361_090 
msall8688. 2(361 1169NT 
msall868B . 2 { 361_CJB110 
msal 18688 ,2{361_M781 
Consensus 



151 

ATAACTAGTG 
ATAACTAGTG 
ATAACTAGTG 
ATAACTAGTG 
ATAACTAGTG 
ATAACTAGTG 
ATAACTAGTG 
ATAACTAGTG 
ATAACTAGTG 
ATAACTAGTG 
ATAACTAGTG 



ACCCAGAGGT 
ACCCAGAGGT 
ACCCAGAGGT 
ACCCAGAGGT 
ACCCAGAGGT 
ACCCAGAGGT 
ACCCAGAGGT 
ACCCAGAGGT 
ACCCAGAGGT 
ACCCAGAGGT 
ACCCAGAGGT 



TCCTGAGCAA 
TCCTGAGCAA 
TCCTGAGCAA 
TCCTGAGCAA 
TCCTGAGCAA 
TCCTGAGCAA 
TCCTGAGCAA 
TCCTGAGCAA 
TCCTGAGCAA 
TCCTGAGCAA 
TCCTGAGCAA 



TACAAAGATG 
TACAAAGATG 
TACAAAGATG 
TACAAAGATG 
TACAAAGATG 
TACAAAGATG 
TACAAAGATG 
TACAAAGATG 
TACAAAGATG 
TACAAAGATG 
TACAAAGATG 



200 

AGACACGTAA 
AGACACGTAA 
AGACACGTAA 
AGACACGTAA 
AGACACGTAA 
AGACACGTAA 
AGACACGTAA 
AGACACGTAA 
AGACACGTAA 
AGACACGTAA 
AGACACGTAA 



201 

TTTTAAATTT 
TTTTAAATTT 
TTTTAAATTT 
TTTTAAATTT 
TTTTAAATTT 
TTTTAAATTT 
TTTTAAATTT 
TTTTAAATTT 
TTTTAAATTT 
TTTTAAATTT 
TTTTAAATTT 



GCTTTTACCG 
GCTTTTACCG 
GCTTTTACCG 
GCTTTTACCG 
GCTTTTACCG 
GCTTTTACCG 
GCTTTTACCG 
GCTTTTACCG 
GCTTTTACCG 
GCTTTTACCG 
GCTTTTACCG 



CTTTTGAAGA 
CTTTTGAAGA 
CTTTTGAAGA 
CTTTTGAAGA 
CTTTTGAAGA 
CTTTTGAAGA 
CTTTTGAAGA 
CTTTTGAAGA 
CTTTTGAAGA 
CTTTTGAAGA 
CTTTTGAAGA 



GGCTCTTGCT 
GGCTCTTGCT 
GGCTCTTGCT 
GGCTCTTGCT 
GGCTCTTGCT 
GGCTCTTGCT 
GGCTCTTGCT 
GGCTCTTGCT 
GGCTCTTGCT 
GGCTCTTGCT 
GGCTCTTGCT 



250 

TCTTCAGGTG 
TCTTCAGGTG 
TCTTCAGGTG 
TCTTCAGGTG 
TCTTCAGGTG 
TCTTCAGGTG 
TCTTCAGGTG 
TCTTCAGGTG 
TCTTCAGGTG 
TCTTCAGGTG 
TCTTCAGGTG 
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msall8688 ,2{361_18RS21 
msall8688.2(361_A909 
ma al 1 8 68 8 . 2 f 3 6 1 jCOHl 
msall8688.2{361_H36B 
msall8688.2{361jJM9130013 
msall8688.2{361_M732 
msallB688 . 2 {GBS361.2603 
msall8688 .2{361_090 
rasallS 688 .2(36 1_1169NT 
msall8688 . 2 {361_CJB110 
msall8688.2{361_M781 
Consensus 



251 

TTAATTTAAA 
TTAATTTAAA 
TTAATTTAAA 
TTAATTTAAA 
TTAATTTAAA 
TTAATTTAAA 
TTAATTTAAA 
TTAATTTAAA 
TTAATTTAAA 
TTAATTTAAA 
TTAATTTAAA 
********** 



AGCTTATCAT 
AGCTTATCAT 
AGCTTATCAT 
AGCTTATCAT 
AGCTTATCAT 
AGCTTATCAT 
AGCTTATCAT 
AGCTTATCAT 
AGCTTATCAT 
AGCTTATCAT 
AGCTTATCAT 
********** 



AATATTGCTG 
AATATTGCTG 
AATATTGCTG 
AATATTGCTG 
AATATTGCTG 
AATATTGCTG 
AATATTGCTG 
AATATTGCTG 
AATATTGCTG 
AATATTGCTG 
AATATTGCTG 
********** 



TGTGTTTAGG 
TGTGTTTAGG 
TGTGTTTAGG 
TGTGTTTAGG 
TGTGTTTAGG 
TGTGTTTAGG 
TGTGTTTAGG 
TGTGTTTAGG 
TGTGTTTAGG 
TGTGTTTAGG 
TGTGTTTAGG 
********** 



300 

GACCTCACTT 
GACCTCACTT 
GACCTCACTT 
GACCTCACTT 
GACCTCACTT 
GACCTCACTT 
GACCTCACTT 
GACCTCACTT 
GACCTCACTT 
GACCTCACTT 
GACCTCACTT 
********** 



msall8688 .2{361_18RS21 
msall8688. 2(361 A909 
nisall8688.2(361~COHl 
msall8688.2{361_H36B 
msall8688 . 2 { 361_JM9130013 
msal 18 6 8 8 . 2 { 3 6 1_M73 2 
msall8688.2{GBS361J2603 
msall8688.2{361_090 
msall8688.2(361_1169NT 
msall8688 .2{361_CJB110 
msall8688 . 2 {361_M781 
Consensus 



301 

GGGGGAAAGA 
GGGGGAAAGA 
GGGGGAAAGA 
GGGGGAAAGA 
GGGGGAAAGA 
GGGGGAAAGA 
GGGGGAAAGA 
GGGGGAAAGA 
GGGGGAAAGA 
GGGGGAAAGA 
GGGGGAAAGA 



GTGCTGGTCA 
GTGCTGGTCA 
GTGCTGGTCA 
GTGCTGGTCA 
GTGCTGGTCA 
GTGCTGGTCA 
GTGCTGGTCA 
GTGCTGGTCA 
GTGCTGGTCA 
GTGCTGGTCA 
GTGCTGGTCA 



AAATGCCTTG 
AAATGCCTTG 
AAATGCCTTG 
AAATGCCTTG 
AAATGCCTTG 
AAATGCCTTG 
AAATGCCTTG 
AAATGCCTTG 
AAATGCCTTG 
AAATGCCTTG 
AAATGCCTTG 



TATCAATTTG 
TATCAATTTG 
TATCAATTTG 
TATCAATTTG 
TATCAATTTG 
TATCAATTTG 
TATCAATTTG 
TATCAATTTG 
TATCAATTTG 
TATCAATTTG 
TATCAATTTG 



350 

AAGAAGGAGA 
AAGAAGGAGA 
AAGAAGGAGA 
AAGAAGGAGA 
AAGAAGGAGA 
AAGAAGGAGA 
AAGAAGGAGA 
AAGAAGGAGA 
AAGAAGGAGA 
AAGAAGGAGA 
AAGAAGGAGA 



msa!18688.2{361 18RS21 
msall8688.2(3?l_A909 
msall8688.2f361_COHl. 
msall8688.2{361_H36B 
msall8688 .2{361_JM9130013 
msall8688 . 2 { 361_M732 
msall8688 . 2 {GBS361_2603 
msall8688 . 2 { 361_090 
msa!18688 .2{361_1169NT 
msal 18 68 8 . 2 { 3 6 1_CJB11 0 
msall8688.2{361_M781 
Consensus 



351 

GCGTGAAGTA 
GCGTCAAGTA 
GCGTCAAGTA 
GCGTCAAGTA 
GCGTCAAGTA 
GCGTCAAGTA 
GCGTCAAGTA 
GCGTCAAGTA 
GCGTCAAGTA 
GCGTCAAGTA 
GCGTCAAGTA 



GATGCTAGTT 
GATGCTAGTT 
GATGCTAGTT 
GATGCTAGTT 
GATGCTAGTT 
GATGCTAGTT 
GATGCTAGTT 
GATGCTAGTT 
GATGCTAGTT 
GATGCTAGTT 
GATGCTAGTT 



TATTAGAAAA 
TATTAGAAAA 
TATTAGAAAA 
TATTAGAAAA 
TATTAGAAAA 
TATTAGAAAA 
TATTAGAAAA 
TATTAGAAAA 
TATTAGAAAA 
TATTAGAAAA 
TATTAGAAAA 



AGCATCTGTT 
AGCATCTGTT 
AGCATCTGTT 
AGCATCTGTT 
AGCATCTGTT 
AGCATCTGTT 
AGCATCTGTT 
AGCATCTGTT 
AGCATCTGTT 
AGCATCTGTT 
AGCATCTGTT 



400 

TACCATATTG 
TACCATATTG 
TACCATATTG 
TACCATATTG 
TACCATATTG 
TACCATATTG 
TACCATATTG 
TACCATATTG 
TACCATATTG 
TACCATATTG 
TACCATATTG 



msall8688 .2{361_18RS21^ 
maall8688.2(361_A909 
msal 18 688 .2136 l_COHl 
msall8688 . 2 { 361_H3 6B 
msall8688 .2{361_JM9130013; 
msall8688.2{361_M732 
msall8688 . 2 {GBS361J2603 , 
msall8688 ,2{361_090 
tnsall86BB .2{361_1169NT 
msall8688 . 2 { 361_CJB110 
msall8688.2{361_M781 
Consensus 



401 

CTGATGAATT 
CTGATGAATT 
CTGATGAATT 
CTGATGAATT 
CTGATGAATT 
CTGATGAATT 
CTGATGAATT 
CTGATGAATT 
CTGATGAATT 
CTGATGAATT 
CTGATGAATT 



GATGGCTTAT 
GATGGCTTAT 
GATGGCTTAT 
GATGGCTTAT 
GATGGCTTAT 
GATGGCTTAT 
GATGGCTTAT 
GATGGCTTAT 
GATGGCTTAT 
GATGGCTTAT 
GATGGCTTAT 



CATGATATTG 
CATGATATTG 
CATGATATTG 
CATGATATTG 
CATGATATTG 
CATGATATTG 
CATGATATTG 
CATGATATTG 
CATGATATTG 
CATGATATTG 
CATGATATTG 



TGGGAGCTTC 
TGGGAGCTTC 
TGGGAGCTTC 
TGGGAGCTTC 
TGGGAGCTTC 
TGGGAGCTTC 
TGGGAGCTTC 
TGGGAGCTTC 
TGGGAGCTTC 
TGGGAGCTTC 
TGGGAGCTTC 



450 

GTATGTTATT 
GTATGTTATT 
GTATGTTATT 
GTATGTTATT 
GTATGTTATT 
GTATGTTATT 
GTATGTTATT 
GTATGTTATT 
GTATGTTATT 
GTATGTTATT 
GTATGTTATT 



msall8688 .2{361_18RS21 
msall8688.2{361_A909 
msall8688 . 2 f 361_C0H1 
msall8688.2{361_H36B 
msall8688.2{361 JM9130013 
msall8688 . 2{361_M732 
maall8688 . 2 {GBS36 1_2 603 
msall8688.2{361 090 

msaiieess^fsei^iiegNT 

msall8688.2{361_CJB110 
msall8688.2{361_M781 
Consensus 



451 

TCAACCGCCT 
TCAACCGCCT 
TCAACCGCCT 
TCAACCGCCT 
TCAACCGCCT 
TCAACCGCCT 
TCAACCGCCT 
TCAACCGCCT 
TCAACCGCCT 
TCAACCGCCT 
TCAACCGCCT 



GTTCTGCAAG 
GTTCTGCAAG 
GTTCTGCAAG 
GTTCTGCAAG 
GTTCTGCAAG 
GTTCTGCAAG 
GTTCTGCAAG 
GTTCTGCAAG 
GTT CTGCAAG 
GTTCTGCAAG 
GTTCTGCAAG 



TAATAATGCC 
TAATAATGCC 
TAATAATGCC 
TAATAATGCC 
TAATAATGCC 
TAATAATGCC 
TAATAATGCC 
TAATAATGCC 
TAATAATGCC 
TAATAATGCC 
TAATAATGCC 



GTAATATTAG 
GTAATATTAG 
GTAATATTAG 
GTAATATTAG 
GTAATATTAG 
GTAATATTAG 
GTAATATTAG 
GTAATATTAG 
GTAATATTAG 
GTAATATTAG 
GTAATATTAG 



500 

GAACACAATT 
GAACACAATT 
GAACACAATT 
GAACACAATT 
GAACACAATT 
GAACACAATT 
GAACACAATT 
GAACACAATT 
GAACACAATT 
GAACACAATT 
GAACACAATT 



msall8688.2{361_18RS2i; 
msall8688.2{361_A909, 
msall8688. 2(361 COH1 
msall8688.2{361JI36B 
rasall8688.2{361 JM9130013 
maall8688 .2{361_M732 
msall868B.2{GBS361_2603 
msall8688,2{361_090 
msall868B . 2 ( 361_1169NT 
msall8688 . 2 { 361_CJB110 
msall8688 .2{361_M781 



501 

ACTTCAAGAT 
ACTTCAAGAT 
ACTTCAAGAT 
ACTTCAAGAT 
ACTTCAAGAT 
ACTTCAAGAT 
ACTTCAAGAT 
ACTTCAAGAT 
ACTTCAAGAT 
ACTTCAAGAT 
ACTTCAAGAT 



GGCGATTGTG 
GGCGATTGTG 
GGCGATTGTG 
GGCGATTGTG 
GGCGATTGTG 
GGCGATTGTG 
GGCGATTGTG 
GGCGATTGTG 
GGCGATTGTG 
GGCGATTGTG 
GGCGATTGTG 



ATTTAGCTAT 
ATTTAGCTAT 
ATTTAGCTAT 
ATTTAGCTAT 
ATTTAGCTAT 
ATTTAGCTAT 
ATTTAGCTAT 
ATTTAGCTAT 
ATTTAGCTAT 
ATTTAGCTAT 
ATTTAGCTAT 



TTGTGGTGGC 
TTGTGGTGGC 
TTGTGGTGGC 
TTGTGGTGGC 
TTGTGGTGGC 
TTGTGGTGGC 
TTGTGGTGGC 
TTGTGGTGGC 
TTGTGGTGGC 
TTGTGGTGGC 
TTGTGGTGGC 



550 

TGTGATGAGT 
TGTGATGAGT 
TGTGATGAGT 
TGTGATGAGT 
TGTGATGAGT 
TGTGATGAGT 
TGTGATGAGT 
TGTGATGAGT 
TGTGATGAGT 
TGTGATGAGT 
TGTGATGAGT 



1061 



WO 2004/018646 



PCT/US2003/026827 



Table 75: Comparative Sequences relating to SAG0671 



Consensus 



msall8688 . 2 { 361_18RS21 
msall8688 . 2 { 361_A909 
msall8688 . 2 f 361_COHl 
msall8688 . 2 (361_H36B 
msall8688 .2(361 JM9130013 
msall8688 . 2{361_M732 
msall8688 . 2 (GBS361_2603 
msall86B8.2{361_090 
msall8688 .2(361 1169NT 
msal-18688 . 2 { 361~CJB110 
msall8688.2{361_M781 
Consensus 



551 

TAAGTGATAT 
TAAGTGATAT 
TAAGTGATAT 
TAAGTGATAT 
TAAGTGATAT 
TAAGTGATAT 
TAAGTGATAT 
TAAGTGATAT 
TAAGTGATAT 
TAAGTGATAT 
TAAGTGATAT 



TTCTTTAGCA 
TTCTTTAGCA 
TTCTTTAGCA 
TTCTTTAGCA 
TTCTTTAGCA 
TTCTTTAGCA 
TTCTTTAGCA 
TTCTTTAGCA 
TTCTTTAGCA 
TTCTTTAGCA 
TTCTTTAGCA 



GGCTTCACAT 
GGCTTCACAT 
GGCTTCACAT 
GGCTTCACAT 
GGCTTCACAT 
GGCTTCACAT 
GGCTTCACAT 
GGCTTCACAT 
GGCTTCACAT 
GGCTTCACAT 
GGCTTCACAT 



CACTAGGAGC 
CACTAGGAGC 
CACTAGGAGC 
CACTAGGAGC 
CACTAGGAGC 
CACTAGGAGC 
CACTAGGAGC 
CACTAGGAGC 
CACTAGGAGC 
CACTAGGAGC 
CACTAGGAGC 



600 

TATTAATACA 
TATTAATACA 
TATTAATACA 
TATTAATACA 
TATTAATACA 
TATTAATACA 
TATTAATACA 
TATTAATACA 
TATTAATACA 
TATTAATACA 
TATTAATACA 



msall8688.2{361_18RS21 , 
msall8688.2(361_A909' 
msall8688 . 2 { 361_C0H1 ' 
msall8688 .2{361_H36B' 
msall8688.2{361_JM9130013 
msall8688 . 2 { 361_M732 
msall8668 . 2 {GBS361 J2603 
msall8688.2{361_090 
msall8688.2{361_1169NT 
msalX8688 . 2 { 361_CJB110 
msall86B8.2{361_M781 
Consensus 



601 

GAAATGGCAT 
GAAATGGCAT 
GAAATGGCAT 
GAAATGGCAT 
GAAATGGCAT 
GAAATGGCAT 
GAAATGGCAT 
GAAATGGCAT 
GAAATGGCAT 
GAAATGGCAT 
GAAATGGCAT 



GTCAGCCCTA 
GTCAGCCCTA 
GTCAGCCCTA 
GTCAGCCCTA 
GTCAGCCCTA 
GTCAGCCCTA 
GTCAGCCCTA 
GTCAGCCCTA 
GTCAGCCCTA 
GTCAGCCCTA 
GTCAGCCCTA 



TTCTTCTGGA 
TTCTTCTGGA 
TTCTTCTGGA 
TTCTTCTGGA 
TTCTTCTGGA 
TTCTTCTGGA 
TTCTTCTGGA 
TTCTTCTGGA 
TTCTTCTGGA 
TTCTTCTGGA 
TTCTTCTGGA 



AAAGGAATCA 
AAAGGAATCA 
AAAGGAATCA 
AAAGGAATCA 
AAAGGAATCA 
AAAGGAATCA 
AAAGGAATCA 
AAAGGAATCA 
AAAGGAATCA 
AAAGGAATCA 
AAAGGAATCA 



650 

ATTTGGGTGA 
ATTTGGGTGA 
ATTTGGGTGA 
ATTTGGGTGA 
ATTTGGGTGA 
ATTTGGGTGA 
ATTTGGGTGA 
ATTTGGGTGA 
ATTTGGGTGA 
ATTTGGGTGA 
ATTTGGGTGA 



msall8688.2{361_18RS21 
msall8688 . 2 f 361_A909 
msallB688 . 2 ( 361_C0H1 
msall8688.2{361 H36B 
msall8688 . 2 { 361_JM9130013 
msall8688 . 2 { 361_M732 
msall8688 . 2 (GBS361_2603 
msall8688 ,2{361_090 
msall8688 . 2 ( 361_1169NT 
msall8 6 8 8 . 2 { 3 6 1_CJB110 
msall8688 .2{361_M781 
Consensus 



651 

GGGCGCTGGT 
GGGCGCTGGT 
GGGCGCTGGT 
GGGCGCTGGT 
GGGCGCTGGT 
GGGCGCTGGT 
GGGCGCTGGT 
GGGCGCTGGT 
GGGCGCTGGT 
GGGCGCTGGT 
GGGCGCTGGT 



TTTGTTGTTC 



TTTGTTGTTC 
TTTGTTGTTC 



TTTGTTGTTC 
TTTGTTGTTC 
TTTGTTGTTC 
T TTGTT GT T C 
TTTGTTGTTC 
TTTGTTGTTC 



TTGTCAAAGA 
TTGTCAAAGA 
TTGTCAAAGA 
TTGTCAAAGA 
TTGTCAAAGA 
TTGTCAAAGA 
TTGTCAAAGA 
TTGTCAAAGA 
TTGTCAAAGA 
TTGTCAAAGA 
TTGTCAAAGA 



TCAGTCCTTA 
TCAGTCCTTA 
TCAGTCCTTA 
TCAGTCCTTA 
TCAGTCCTTA 
TCAGTCCTTA 
TCAGTCCTTA 
TCAGTCCTTA 
TCAGTCCTTA 
TCAGTCCTTA 
TCAGTCCTTA 



700 

GCTAAATATG 
GCTAAATATG 
GCTAAATATG 
GCTAAATATG 
GCTAAATATG 
GCTAAATATG 
GCTAAATATG 
GCTAAATATG 
GCTAAATATG 
GCTAAATATG 
GCTAAATATG 



msall8688 . 2 { 361_18RS21 
msall8688.2{361_A909 
msall8688 . 2 { 36 1_C0H1 
msall8688 .2(361_H36B 
msall8688.2{361 JM9130013 
rosall8688 . 2{361_M732 
msall8688 -2{GBS361_2603 
rasall8688.2{361_090 
msall86B8.2(361_1169NT 
msal 18 6 8 8 . 2 { 3 6 l_COB 11 0 
msal 1868 8 . 2 { 3?1_M78 1 
Consensus 



701 

GAAAAATTAT 
GAAAAATTAT 
GAAAAATTAT 
GAAAAATTAT 
GAAAAATTAT 
GAAAAATTAT 
GAAAAATTAT 
GAAAAATTAT 
GAAAAATTAT 
GAAAAATTAT 
GAAAAATTAT 



CGGTGGTCTT 
CGGTGGTCTT 
CGGTGGTCTT 
CGGTGGTCTT 
CGGTGGTCTT 
CGGTGGTCTT 
CGGTGGTCTT 
CGGTGGTCTT 
CGGTGGTCTT 
CGGTGGTCTT 



ATTACTTCAG 
ATTACTTCAG 
ATTACTTCAG 
ATTA CTTC AG 
ATTACTTCAG 
ATTACTTCAG 
ATTACTTCAG 
ATTACTTCAG 
ATTACTTCAG 
ATTACTTCAG 
ATTACTTCAG 



ATGGTTATCA 
ATGGTTATCA 
ATGGTTATCA 
ATGGTTATCA 
ATGGTTATCA 
ATGGTTATCA 
ATGGTTATCA 
ATGGTTATCA 
ATGGTTATCA 
ATGGTTATCA 
ATGGTTATCA 



750 

TATAACAGCA 
TATAACAGCA 
TATAACAGCA 
TATAACAGCA 
TATAACAGCA 
TATAACAGCA 
TATAACAGCA 
TATAACAGCA 
TATAACAGCA 
TATAACAGCA 
TATAACAGCA 



msall8688.2{361_18RS21 
msall8688 . 2 ( 361_A909 
ms al 1 8 6 8 8 . 2 { 3 6 l_COHl 
msall8688.2{361_H36B 
msall8688.2{361_JM9130013 
msall8688 . 2 ( 361_M732 
msall8688.2{GBS361_2603 
msall8688.2{361 090 
msall8688.2{361_1169NT 
msallB688 . 2 (361_CJB110 
msall86B8.2{361_M781 
Consensus 



751 

CCTAAGCCAA 
CCTAAGCCAA 
CCTAAGCCAA 
CCTAAGCCAA 
CCTAAGCCAA 
CCTAAGCCAA 
CCTAAGCCAA 
CCTAAGCCAA 
CCTAAGCCAA, 
CCTAAGCCAA 
CCTAAGCCAA 



CAGGTGAAGG 
CAGGTGAAGG 
CAGGTGAAGG 
CAGGTGAAGG 
CAGGTGAAGG 
CAGGTGAAGG 
CAGGTGAAGG 
CAGGTGAAGG 
CAGGTGAAGG 
CAGGTGAAGG 
CAGGTGAAGG 



GGCGGCACAG 
GGCGGCACAG 
GGCGGCACAG 
GGCGGCACAG 
GGCGGCACAG 
GGCGGCACAG 
GGCGGCACAG 
GGCGGCACAG 
GGCGGCACAG 
GGCGGCACAG 
GGCGGCACAG 



ATTGCAAAGC 
ATTGCAAAGC 
ATTGCAAAGC 
ATTGCAAAGC 
ATTGCAAAGC 
ATTGCAAAGC 
ATTGCAAAGC 
ATTGCAAAGC 
ATTGCAAAGC 
ATTGCAAAGC 
ATTGCAAAGC 



800 

AGCTAGTGAC 
AGCTAGTGAC 
AGCTAGTGAC 
AGCTAGTGAC 
AGCTAGTGAC 
AGCTAGTGAC 
AGCTAGTGAC 
AGCTAGTGAC 
AGCTAGTGAC 
AGCTAGTGAC 
AGCTAGTGAC 



msall8688.2{361_18RS21 
msall8688 .2(361 A909 
maall8688 .2(36l"*COHl 
msall8688 .2(361 H36B 
msall8688. 2(361 JM9130013 
msall8688 . 2 { 361_M732 
msall8688 . 2 (GBS361.2603 
rasall8688 . 2 { 361_090 
msall8688.2(361_1169NT 
msall8688 . 2 (361_CJB110 



801 

TCAAGCAGGT 
TCAAGCAGGT 
TCAAGCAGGT 
TCAAGCAGGT 
TCAAGCAGGT 
TCAAGCAGGT 
TCAAGCAGGT 
TCAAGCAGGT 
TCAAGCAGGT 
TCAAGCAGGT 



ATTGACTACA 
ATTGACTACA 
ATTGACTACA 
ATTGACTACA 
ATTGACTACA 
ATTGACTACA 
ATTGACTACA 
ATTGACTACA 
ATTGACTACA 
ATTGACTACA 



GTGAGATTGA 
GTGAGATTGA 
GTGAGATTGA 
GTGAGATTGA 
GTGAGATTGA 
GTGAGATTGA 
GTGAGATTGA 
GTGAGATTGA 
GTGAGATTGA 
GTGAGATTGA 



CTATATTAAc 
CTATATTAAc 
CTATATTAAc 
CTATATTAAc 
CTATATTAAc 
CTATATTAAc 
CTATATTAAc 
CTATATTAAc 
CTATATTAAc 
CTATATTAAt 



850 

GGTCACGGTA 
GGTCACGGTA 
GGTCACGGTA 
GGTCACGGTA 
GGTCACGGTA 
GGTCACGGTA 
GGTCACGGTA 
GGTCACGGTA 
GGTCACGGTA 
GGTCACGGTA 



1062 



WO 2004/018646 



PCT/US2003/026827 



Table 75: Comparative Sequences relating to SAG0671 



msall868B .2{361_M78l} 
Consensus 



TCAAGCAGGT ATTGACTACA GTGAGATTGA CTATATTAAt GGTCACGGTA 



msall8688.2{361_18RS21 
msa!18688 . 2 (361_A909 
msall8688 .2(361_COHl 
msall8688 .2{361_H36B 
msall8688.2{361_JM9130013 
msall8688.2{361_M732 
maall8688 . 2 {GBS361_2603 
msall8688 ,2{361_090 
msall8688.2(361_1169NT 
msallB68B.2{361 CJB110 
msall8688 . 2 { 361_M781 
Consensus 



851 

CAGGTACTCA 
CAGGTACTCA 
CAGGTACTCA 
CAGGTACTCA 
CAGGTACTCA 
CAGGTACTCA 
CAGGTACTCA 
CAGGTACTCA 
CAGGTACTCA 
CAGGTACTCA 
CAGGTACTCA 



AGCTAATGAT 
AGCTAATGAT 
AGCTAATGAT 
AGCTAATGAT 
AGCTAATGAT 
AGCTAATGAT 
AGCTAATGAT 
AGCTAATGAT 
AGCTAATGAT 
AGCTAATGAT 
AGCTAATGAT 



AAAATGGAAA 
AAAATGGAAA 
AAAATGGAAA 
AAAATGGAAA 
AAAATGGAAA 
AAAATGGAAA 
AAAATGGAAA 
AAAATGGAAA 
AAAATGGAAA 
AAAATGGAAA 
AAAATGGAAA 



AAAATATGTA 
AAAATATGTA 
AAAATATGTA 
AAAATATGTA 
AAAATATGTA 
AAAATATGTA 
AAAATATGTA 
AAAATATGTA 
AAAATATGTA 
AAAATATGTA 
AAAATATGTA 



900 

TGGTAAGTTT 
TGGTAAGTTT 
TGGTAAGTTT 
TGGTAAGTTT 
TGGTAAGTTT 
TGGTAAGTTT 
TGGTAAGTTT 
TGGTAAGTTT 
TGGTAAGTTT 
TGGTAAGTTT 
TGGTAAGTTT 



msall8688.2{361_18RS2l} 
msall8688 .2(361_A909j 
msall8688.2(361_COHl 
msall868B . 2{361_H36B] 
rasall868B . 2 (36WM9130013 
msall8688 . 2 {361_M732 
msall8688 . 2 {GBS361_2603' 
msall8688.2{361_090 
msallB688.2(361_1169NT) 
msall8688.2{361_CJB110 
msall8688.2{361_M78l] 
Consensus 



901 

TTCCCGACAA 
TTCCCGACAA 
TTCCCGACAA 
TTCCCGACAA 
TTCCCGACAA 
TTCCCGACAA 
TTCCCGACAA 
TTCCCGACAA 
TTCCCGACAA 
TTCCCGACAA 
TTCCCGACAA 



CGACATTGAT 
CGACATTGAT 
CGACATTGAT 
CGACATTGAT 
CGACATTGAT 
CGACATTGAT 
CGACATTGAT 
CGACATTGAT 
CGACATTGAT 
CGACATTGAT 
CGACATTGAT 



CAGCAGTACC 
CAGCAGTACC 
CAGCAGTACC 
CAGCAGTACC 
CAGCAGTACC 
CAGCAGTACC 
CAGCAGTACC 
CAGCAGTACC 
CAGCAGTACC 
CAGCAGTACC 
CAGCAGTACC 



AAGGGGCAAA 
AAGGGGCAAA 
AAGGGGCAAA 
AAGGGGCAAA 
AAGGGGCAAA 
AAGGGGCAAA 
AAGGGGCAAA 
AAGGGGCAAA 
AAGGGGCAAA 
AAGGGGCAAA 
AAGGGGCAAA 



950 

CGGGTCATAC 
CGGGTCATAC 
CGGGTCATAC 
CGGGTCATAC 
CGGGTCATAC 
CGGGTCATAC 
CGGGTCATAC 
CGGGTCATAC 
CGGGTCATAC 
CGGGTCATAC 
CGGGTCATAC 



msall8688.2{361_18RS21 1 
msall8688 ,2{361_A909 
msalieeBS^pe^COHl' 
msall8688 . 2 {selves' 
msal 18 6 8 8 . 2 { 3 6 1_JM9 13 0 013 
msall8688 .2{361_M732 
msall8688.2{GBS361_2603 
msall8688.2{361_090 
msall86B8.2{361_1169NT 
msallB688 . 2 {361_CJB110 
msall8688.2{361_M781 
Consensus 



951 

TCTAGGGGCT 
TCTAGGGGCT 
TCTAGGGGCT 
TCTAGGGGCT 
TCTAGGGGCT 
TCTAGGGGCT 
TCTAGGGGCT 
TCTAGGGGCT 
TCTAGGGGCT 
TCTAGGGGCT 
TCTAGGGGCT 



GCAGGTATTA 
GCAGGTATTA 
GCAGGTATTA 
GCAGGTATTA 
GCAGGTATTA 
GCAGGTATTA 
GCAGGTATTA 
GCAGGTATTA 
GCAGGTATTA 
GCAGGTATTA 
GCAGGTATTA 



TCGAATTGAT 
TCGAATTGAT 
TCGAATTGAT 
TCGAATTGAT 
TCGAATTGAT 
TCGAATTGAT 
TCGAATTGAT 
TCGAATTGAT 
TCGAATTGAT 
TCGAATTGAT 
TCGAATTGAT 



TAATTGTTTA 
TAATTGTTTA 
TAATTGTTTA 
TAATTGTTTA 
TAATTGTTTA 
TAATTjGTTTA 
TAATTGTTTA 
TAATTGTTTA 
TAATTGTTTA 
TAATTGTTTA 
TAATTGTTTA 



1000 
GCGGCAATAG 
GCGGCAATAG 
GCGGCAATAG 
GCGGCAATAG 
GCGGCAATAG 
GCGGCAATAG 
GCGGCAATAG 
GCGGCAATAG 
GCGGCAATAG 
GCGGCAATAG 
GCGGCAATAG 



msall8688.2{361_18RS21 
msall8688.2(361_A909 
msall8688.2(361_COHl 
msall86B8 . 2 { 361_H36B 
msall8688.2{361_JM9130013 
msall8688 . 2 {361'_M732 
msal 18 68 8 . 2{GBS361_2603 
msall8688.2{361_090 
msal 18 68 8 . 2 { 3 € 1_116 9NT 
msal 18 6 8 8 . 2 { 3 6 1_OJB110 
msall8688 .2{361JM781 
Consensus 



msall8688.2{361_18RS21 
msall8688 ,2{361_A909 
msall8688.2{361_COHl 
tnsall8688 . 2 { 361_H36B 
msall8688 .2{361_JM9130013 
msall8688 .2{361_M732 
msall8688 . 2 {GBS361_2 603 
msall8688 .2{361_090 
msall8688. 2(361 1169NT 
msall8688.2(361jCJB110 
msall86B8 .2{361J4781 
Consensus 



msall8688.2{361_18RS21 
rasall8688.2f361_A909 ( 
msall86B8. 2(361 COH1 
msall8688 . 2 { 361~H36B 
msall8688 . 2 {361^9130013 ' 
insall8688 . 2 ( 361_M732 
msa 118688 . 2 {GBS361_2603 [ 
msall8688 .2{361_090 
msall8688 . 2 { 361 1169NT 



1001 

AGGAACAGAC 
AGGAACAGAC 
AGGAACAGAC 
AGGAACAGAC 
AGGAACAGAC 
AGGAACAGAC 
AGGAACAGAC 
AGGAACAGAC 
AGGAACAGAC 
AGGAACAGAC 
AGGAACAGAC 



TGTACCAGCA 
TGTACCAGCA 
TGTACCAGCA 
TGTACCAGCA 
TGTACCAGCA 
TGTACCAGCA 
TGTACCAGCA 
TGTACCAGCA 
TGTACCAGCA 
TGTACCAGCA 
TGTACCAGCA 



ACTAAAAATG 
ACTAAAAATG 
ACTAAAAATG 
ACTAAAAATG 
ACTAAAAATG 
ACTAAAAATG 
ACTAAAAATG 
ACTAAAAATG 
ACTAAAAATG 
ACTAAAAATG 
ACTAAAAATG 



AGATTGGGAT 
AGATTGGGAT 
AGATTGGGAT 
AGATTGGGAT 
AGATTGGGAT 
AGATTGGGAT 
AGATTGGGAT 
AGATTGGGAT 
AGATTGGGAT 
AGATTGGGAT 
AGATTGGGAT 



1050 
AGAAGGTTTT 
AGAAGGTTTT 
AGAAGGTTTT 
AGAAGGTTTT 
AGAAGGTTTT 
AGAAGGTTTT 
AGAAGGTTTT 
AGAAGGTTTT 
AGAAGGTTTT 
AGAAGGTTTT 
AGAAGGTTTT 



1051 

CCAGAAAATT 
CCAGAAAATT 
CCAGAAAATT 
CCAGAAAATT 
CCAGAAAATT 
CCAGAAAATT 
CCAGAAAATT 
CCAGAAAATT 
CCAGAAAATT 
CCAGAAAATT 
CCAGAAAATT 



TTGTCTATCA 
TTGTCTATCA 
TTGTCTATCA 
TTGTCTATCA 
TTGTCTATCA 
TTGTCTATCA 
TTGTCTATCA 
TTGTCTATCA 
TTGTCTATCA 
TTGTCTATCA 
TTGTCTATCA 



TCAAAAGAGA 
TCAAAAGAGA 
TCAAAAGAGA 
TCAAAAGAGA 
TCAAAAGAGA 
TCAAAAGAGA 
TCAAAAGAGA 
TCAAAAGAGA 
TCAAAAGAGA 
TCAAAAGAGA 
TCAAAAGAGA 



GAATACCCAA 
GAATACCCAA 
GAATACCCAA 
GAATACCCAA 
GAATACCCAA 
GAATACCCAA 
GAATACCCAA 
GAATACCCAA 
GAATACCCAA 
GAATACCCAA 
GAATACCCAA 



1100 
TAAGAAATGC 
TAAGAAATGC 
TAAGAAATGC 
TAAGAAATGC 
TAAGAAATGC 
TAAGAAATGC 
TAAGAAATGC 
TAAGAAATGC 
TAAGAAATGC 
TAAGAAATGC 
TAAGAAATGC 



1101 

TTTAAATTTT 
TTTAAATTTT 
TTTAAATTTT 
TTTAAATTTT 
TTTAAATTTT 
TTTAAATTTT 
TTTAAATTTT 
TTTAAATTTT 
TTTAAATTTT 



TCGTTTGCTT 
TCGTTTGCTT 
TCGTTTGCTT 
TCGTTTGCTT 
TCGTTTGCTT 
TCGTTTGCTT 
TCGTTTGCTT 
TCGTTTGCTT 
TCGTTTGCTT 



TTGGTGGAAA 
TTGGTGGAAA 
TTGGTGGAAA 
TTGGTGGAAA 
TTGGTGGAAA 
TTGGTGGAAA 
TTGGTGGAAA 
TTGGTGGAAA 
TTGGTGGAAA 



TAATAGTGGT 
TAATAGTGGT 
TAATAGTGGT 
TAATA GTG GT 
TAATAGTGGT 
TAATAGTGGT 
TAATAGTGGT 
TAATAGTGGT 
TAATAGTGGT 



1150 
gTCTTATTGT 
gTCTTATTGT 
gTCTTATTGT 
gTCTTATTGT 
gTCTTATTGT 
gTCTTATTGT 
gTCTTATTGT 
aTCTTATTGT 
aTCTTATTGT 



1063 



WO 2004/018646 



PCT7US2003/026827 



Table 75: Comparative Sequences relating to SAG0671 



msall868B.2{361_CJB110> 

— 1} 



_ TTTAAATTTT TCGTTTGCTT TTGGTGGAAA TAATAGTGGT aTCTTATTGT 

maall8688 .2 {361_M78l} TTTAAATTTT TCGTTTGCTT TTGGTGGAAA TAATAGTGGT aTCTTATTGT 
Consensus ********** ********** ********** ********** _********* 



msall8688.2{361_18RS2i; 
tnsall8688.2{361_A909 1 
msal 18 6 8 8 . 2 { 3 6 1_C0H1 
msall8 6 8 8 . 2 { 3 6 1_H36B 
msall868B.2{361_JM9130013| 
msall8688.2{361_M732 
msall8688 . 2 {GBS361_2603 
msall8688 ,2{361_090 
msall8688.2(361_1169NT 
msall8688.2{361_CJB110 
msall8688.2{361_M781 
Consensus 



1151 

CATCTTTAGA 
CATCTTTAGA 
CATCTTTAGA 
CATCTTTAGA 
CATCTTTAGA 
CATCTTTAGA 
CATCTTTAGA 
CATCTTTAGA 
CATCTTTAGA 
CATCTTTAGA 
CATCTTTAGA 



TTCACCTCTA 
TTCACCTCTA 
TTCACCTCTA 
TTCACCTCTA 
TTCACCTCTA 
TTCACCTCTA 
TTCACCTCTA 
TTCACCTCTA 
TTCACCTCTA 
TTCACCTCTA 
TTCACCTCTA 



GAAACATTAC 
GAAACATTAC 
GAAACATTAC 
GAAACATTAC 
GAAACATTAC 
GAAACATTAC 
GAAACATTAC 
GAAACATTAC 
GAAACATTAC 
GAAACATTAC 
GAAACATTAC 



CTGCTAGAGA 
CTGCTAGAGA 
CTGCTAGAGA' 
CTGCTAGAGA 
CTGCTAGAGA 
CTGCTAGAGA 
CTGCTAGAGA 
CTGCTAGAGA 
CTGCTAGAGA 
CTGCTAGAGA 
CTGCTAGAGA 



1200 
AAATCTTAAA 
AAATCTTAAA 
AAATCTTAAA 
AAATCTTAAA 
AAATCTTAAA 
AAATCTTAAA 
AAATCTTAAA 
AAATCTTAAA 
AAATCTTAAA 
AAATCTTAAA 
AAATCTTAAA 



msall8688.2{361_18RS21> 
msall8688.2{361_A909 
msall8688.2{361_COHl 
msall8688.2{361 H36B 
tnsall8688. 2 {361_JM9 130013 
insall8688.2{361_M732 
msall8688 . 2 {GBS361_2603 
• msall8688. 2(361^090 
msall8688.2(361 1169NT 
rasallB688 .2{361~CJB110 

msall8688.2{3?l_M781 
Consensus 



1201 

ATGGCTATCT 
ATGGCTATCT 
ATGGCTATCT 
ATGGCTATCT 
ATGGCTATCT 
ATGGCTATCT 
ATGGCTATCT 
ATGGCTATCT 
ATGGCTATCT 
ATGGCTATCT 
ATGGCTATCT 



TATCATCTGT 
TATCATCTGT 
TATCATCTGT 
TATCATCTGT 
TATCATCTGT 
TATCATCTGT 
TATCATCTGT 
TATCATCTGT 
TATCATCTGT 
TATCATCTGT 
TATCATCTGT 



TGCTTCCATT 
TGCTTCCATT 
TGCTTCCATT 
TGCTTCCATT 
TGCTTCCATT 
TGCTTCCATT 
TGCTTCCATT 
TGCTTCCATT 
TGCTTCCATT 
TGCTTCCATT 
TGCTTCCATT 



TCTAAGAATG 
TCTAAGAATG 
TCTAAGAATG 
TCTAAGAATG 
TCTAAGAATG 
TCTAAGAATG 
TCTAAGAATG 
TCTAAGAATG 
TCTAAGAATG 
TCTAAGAATG 
TCTAAGAATG 



1250 
AATCACTTTC 
AATCACTTTC 
AATCACTTTC 
AATCACTTTC 
AATCACTTTC 
AATCA CTTTC 
AATCACTTTC 
AATCACTTTC 
AATCACTTTC 
AATCACTTTC 
AATCACTTTC 



msa!18688 .2 {361_18RS21 
msall8688 .2{361_A909 
rasall8688 . 2 {361_C0H1 
msall8688 . 2 { 361_H3 6B 
msall8688.2{361_JM9130013 
msal!8688.2{361 M732 
msall8688.2{GBS361~2603 
msall8688.2{361 090 
msall8688.2f361_1169NT 
msall8688.2{361_CJB110 
msall8688.2{361_M781 
Consensus 



1251 

TATAACCTAT 
TATAACCTAT 
TATAACCTAT 
TATAACCTAT 
TATAACCTAT 
TATAACCTAT 
TATAACCTAT 
TATAACCTAT 
TATAACCTAT 
TATAACCTAT 
TATAACCTAT 



GAAAAAGTTG 
GAAAAAGTTG 
GAAAAAGTTG 
GAAAAAGTTG 
GAAAAAGTTG 
GAAAAAGTTG 
GAAAAAGTTG 
GAAAAAGTTG 
GAAAAAGTTG 
GAAAAAGTTG 
GAAAAAGTTG 



CTAGTAATTT 
CTAGTAATTT 
CTAGTAATTT 
CTAGTAATTT 
CTAGTAATTT 
CTAGTAATTT 
CTAGTAATTT 
CTAGTAATTT 
CTAGTAATTT 
CTAGTAATTT 
CTAGTAATTT 



CAACGA CTTT 
CAACGACTTT 
CAACGACTTT 
CAACGA CTTT 
CAACGACTTT 
CAACGA CTTT 
CAACGACTTT 
CAACGACTTT 
CAACGACTTT 
CAACGACTTT 
CAACGACTTT 



1300 
GAAGCATTAC 
GAAGCATTAC 
GAAGCATTAC 
GAAGCATTAC 
GAAGCATTAC 
GAAGCATTAC 
GAAGCATTAC 
GAAGCATTAC 
GAAGCATTAC 
GAAGCATTAC 
GAAGCATTAC 



msall8688 .2{361_18RS21 
msall8688 . 2 ( 361_A909 
msall8688.2{361 C0H1 
msall8688.2{361~H36B 
msall8688.2{361_JM9130013 
msall8688 . 2 {361_M732 
msall8688 . 2 {GBS361_2603 
msall8688 . 2 {361_090 
maall8688.2{361_1169NT 
msall8688 .2 {361_CJB110 
msall868S.2{361_M781 
Consensus 



1 301 

GCTTTAAAGG 
GCTTTAAAGG 
GCTTTAAAGG 
GCTTTAAAGG 
GCTTTAAAGG 
GCTTTAAAGG 
GCTTTAAAGG 
GCTTTAAAGG 
GCTTTAAAGG 
GCTTTAAAGG 
GCTTTAAAGG 



GGCTAGACGA 
GGCTAGACCA 
GGCTAGACCA 
GGCTAGACCA 
GGCTAGACCA 
GGCTAGACCA 
GGCTAGACCA 
GGCTAGACCA 
GGCTAGACCA 
GGCTAGACCA 
GGCTAGACCA 



CCCAAAACTG 
CCCAAAACTG 
CCCAAAACTG 
CCCAAAACTG 
CCCAAAACTG 
CCCAAAACTG 
CCCAAAACTG 
CCCAAAACTG 
CCCAAAACTG 
CCCAAAACTG 
CCCAAAACTG 



TCAACCCAGC 
TCAACCCAGC 
TCAACCCAGC 
TCAACCCAGC 
TCAACCCAGC 
TCAACCCAGC 
TCAACCCAGC 
TCAACCCAGC 
TCAACCCAGC 
TCAACCCAGC 
TCAACCCAGC 



1350 
ACAATTTAGG 
ACAATTTAGG 
ACAATTTAGG 
ACAATTTAGG 
ACAATTTAGG 
ACAATTTAGG 
ACAATTTAGG 
ACAATTTAGG 
ACAATTTAGG 
ACAATTTAGG 
ACAATTTAGG 



msall8688.2{361_18RS21 
msall8688.2{361_A909 
msall8688. 2(361 COH1 
msall8688.2{361_H36B 
msall8688 .2{361_JM9130013 
msallB688 . 2 { 361_M732 
msalie 6 8 8 . 2 { GBS3 6 1_2 60 3 
msall8688.2{361_090 
msall8688.2f361_1169NT 
msall8688 .2{361_CJB110 
msall8688.2(361_M781 
Consensus 



1351 

AAAATGGATG 
AAAATGGATG 
AAAATGGATG 
AAAATGGATG 
AAAATGGATG 
AAAATGGATG 
AAAATGGATG 
AAAATGGATG 
AAAATGGATG 
AAAATGGATG 
AAAATGGATG 



ATTTTTCCAA 
ATTTTTCCAA 
ATTTTTCCAA 
ATTTTTCCAA 
ATTTTTCCAA 
ATTTTTCCAA 
ATTTTTCCAA 
ATTTTTCCAA 
ATTTTTCCAA 
ATTTTTCCAA 
ATTTTTCCAA 



AATGGTTGCC 
AATGGTTGCC 
AATGGTTGCC 
AATGGTTGCC 
AATGGTTGCC 
AATGGTTGCC 
AATGGTTGCC 
AATGGTTGCC 
AATGGTTGCC 
AATGGTTGCC 
AATGGTTGCC 



GTAACAACAG 
GTAACAACAG 
GTAACAACAG 
GTAACAACAG 
GTAACAACAG 
GTAACAACAG 
GTAACAACAG 
GTAACAACAG 
GTAACAACAG 
GTAACAACAG 
GTAACAACAG 



1400 
CTCAAGCACT 
CTCAAGCACT 
CTCAAGCACT 
CTCAAGCACT 
CTCAAGCACT 
CTCAAGCACT 
CTCAAGCACT 
CTCAAGCACT 
CTCAAGCACT 
CTCAAGCACT 
CTCAAGCACT 



msall8688.2{361 18RS21 
msall8688 .2{ 361_A909 
msal 18688 .2(361_C0H1 
m9allB68B.2{361_H36B 
msall8688 .2{361_JM9130013 
rasal 18688 .2{ 36 1_M732 
msall8688 .2{GBS361_2603 
msall8688.2{361 090 



1401 

AATAGAAAGC 
AATAGAAAGC 
AATAGAAAGC 
AATAGAAAGC 
AATAGAAAGC 
AATAGAAAGC 
AATAGAAAGC 
AATAGAAAGC 



AATATTAATC 
AATATTAATC 
AATATTAATC 
AATATTAATC 
AATATTAATC 
AATATTAATC 
AATATTAATC 
AATATTAATC 



TAAAAAAACA 
TAAAAAAACA 
TAAAAAAACA 
TAAAAAAACA 
TAAAAAAACA 
TAAAAAAACA 
TAAAAAAACA 
TAAAAAAACA 



AGATACTTCA 
AGATACTTCA 
AGATACTTCA 
AGATACTTCA 
AGATACTTCA 
AGATACTTCA 
AGATACTTCA 
AGATACTTCA 



1450 
AAAGTAGGAA 
AAAGTAGGAA 
AAAGTAGGAA 
AAAGTAGGAA 
AAAGTAGGAA 
AAAGTAGGAA 
AAAGTAGGAA 
AAAGTAGGAA 



1064 
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Table 75: Comparative Sequences relating to SAG0671 



msall8688.2{361_1169NT 
msall8688 .2(361_CJB110 
msall8688 .2{361_M781 
Consensus 



AATAGAAAGC AATATTAATC TAAAAAAACA AGATACTTCA AAAGTAGGAA 
AATAGAAAGC AATATTAATC TAAAAAAACA AGATACTTCA AAAGTAGGAA 
AATAGAAAGC AATATTAATC TAAAAAAACA AGATACTTCA AAAGTAGGAA 



1451 

msall8688.2{361_18RS2l} TTGTATTTAC 

msall8688.2(361_A909 * TTGTATTTAC 

msall8688.2(361_COHl} TTGTATTTAC 

msall8688 ,2{361_H36B } TTGTATTTAC 

m8all8688.2{361_JM9130013) TTGTATTTAC 

msall868B.2{361_M732| TTGTATTTAC 

msall8688.2{GBS361_2603 TTGTATTTAC 

msall8688 ,2{361_090l TTGTATTTAC 

msall8688 .2{361_1169NTj TTGTATTTAC 

msal!8688 .2{361_CJB110] TTGTATTTAC 

msall8688.2{361_M781) TTGTATTTAC 

Consensus ********** 



AACACTTTCT 
AACACTTTCT 
AACACTTTCT 
AACACTTTCT 
AACACTTTCT 
AACACTTTCT 
AACACTTTCT 
AACACTTTCT 
AACACTTTCT 
AACACTTTCT 
AACACTTTCT 



GGACCAGTTG 
GGACCAGTTG 
GGACCAGTTG 
GGACCAGTTG 
GGACCAGTTG 
GGACCAGTTG 
GGACCAGTTG 
GGACCAGTTG 
GGACCAGTTG 
GGACCAGTTG 
GGACCAGTTG 



AGGTTGTTGA 
AGGTTGTTGA 
AGGTTGTTGA 
AGGTTGTTGA 
AGGTTGTTGA 
AGGTTGTTGA 
AGGTTGTTGA 
AGGTTGTTGA 
AGGTTGTTGA 
AGGTTGTTGA 
AGGTTGTTGA 



1SO0 
AGGTATTGAA 
AGGTATTGAA 
AGGTATTGAA 
AGGTATTGAA 
AGGTATTGAA 
AGGTATTGAA 
AGGTATTGAA 
AGGTATTGAA 
AGGTATTGAA 
AGGTATTGAA 
AGGTATTGAA 



msall8688 .2{361_18RS2i; 
msall8688 ,2{361_A909 
msal 18 688 . 2 { 361_COHl 
msall8688.2{361_H36B 
msall8688 .2{361_JM9130013 
msall8 688 . 2 { 36 1_M732 
msall8688 . 2 {GBS361_2603 
msa!18688 ,2{361_090 
msallB68B.2(361 1169NT 
msallB 68 8 . 2 { 3 6 1~CJB1 1 0 
msall8688.2{361_M781 
Consensus 



1501 

AAGCAAATCA 
AAGCAAATCA 
AAGCAAATCA 
AAGCAAATCA 
AAGCAAATCA 
AAGCAAATCA 
AAGCAAATCA 
AAGCAAATCA 
AAGCAAATCA 
AAGCAAATCA 
AAGCAAATCA 



CAACAGAAGG 
CAACAGAAGG 
CAACAGAAGG 
CAACAGAAGG 
CAACAGAAGG 
CAACAGAAGG 
CAACAGAAGG 
CAACAGAAGG 
CAACAGAAGG 
CAACAGAAGG 
CAACAGAAGG 



********** ********** 



ATATGCACAT 
ATATGCACAT 
ATATGCACAT 
ATATGCACAT 
ATATGCACAT 
ATATGCACAT 
ATATGCACAT 
ATATGCACAT 
ATATGCACAT 
ATATGCACAT 
ATATGCACAT 
********** 



GTTTCTGCTT 
GTTTCrGCTT 
GTTTCTGCTT 
GTTTCTGCTT 
GTTTCTGCTT 
GTTTCTGCTT 
GTTTCTGCTT 

GTTTCTGCTT 
GTTTCTGCTT 
GTTTCTGCTT 
********** 



1551 

msall8688.2{361_18RS2l} GTTTACAGTA 

msal 18 68 8 . 2 f 3 61_A9 09) GTTTACAGTA 

msal 18688.2{ 3 61_COHl GTTTACAGTA 

msall8688.2{361_H36B) GTTTA CAGTA 

msal 18688. 2 {361_JM9 130 013 GTTTACAGTA 

msall8688 . 2 { 361_M732 1 GTTTACAGTA 

msall8688.2{GBS361_2603} GTTTACAGTA 

msall8688 .2{361_090} GTTTACAGTA 

msall8688 .2 ( 361_1169NT} GTTTACAGTA 

msall8688.2{361_CJB110) GTTTACAGTA 

msall8688.2{361_M781) GTTTACAGTA 

Consensus ********** 



ATGAATGCAG 
ATGAATGCAG 
ATGAATGCAG 
ATGAATGCAG 
ATGAATGCAG 
ATGAATGCAG 
ATGAATGCAG 
ATGAATGCAG 
ATGAATGCAG 
ATGAATGCAG 
ATGAATGCAG 



CAGCTGGTAT 
CAGCTGGTAT 
CAGCTGGTAT 
CAGCTGGTAT 
CAGCTGGTAT 
CAGCTGGTAT 
CAGCTGGTAT 
CAGCTGGTAT 
CAGCTGGTAT 
CAGCTGGTAT 
CAGCTGGTAT 



GCTTTCTATC 
GCTTTCTATC 
GCTTTCTATC 
GCTTTCTATC 
GCTTTCTATC 
GCTTTCTATC 
GCTTTCTATC 
GCrTTCTATC 
GCTTTCTATC 
GCTTTCTATC 
GCTTTCTATC 



1550 
CACGATTCCC 
CACGATTCCC 
CACGATTCCC 
CACGATTCCC 
CACGATTCCC 
CACGATTCCC 
CACGATTCCC 
CACGATTCCC 
CACGATTCCC 
CACGATTCCC 
CACGATTCCC 
********** 

1600 
ATTTTTAAAA 
ATTTTTAAAA 
ATTTTTAAAA 
ATTTTTAAAA 
ATTTTTAAAA 
ATTTTTAAAA 
ATTTTTAAAA 
ATTTTTAAAA 
ATTTTTAAAA 
ATTTTTAAAA 
ATTTTTAAAA 



msall8688 .2{361_18RS2l] 
msall8688 . 2 { 361_A909 
msall8688 .2f361_COHl 
maall8688 . 2 { 361_H36B 
msall8688.2{ 3 61_JM9 130 013 
msall8688.2{361_M732 
msall8688.2{GBS361_2603 
msall8688.2{361_090 
msall8688.2(361_1169NT 
tnsall8688 . 2 {361_CJB110 
msall8688.2{361_M781 
Consensus 



msall8688 .2{361_18RS2i; 
msall8688.2(361__A909 j 
msall8688 .2(361 COH1 
msall8688 ,2{361_H36B' 
msall8688.2{361 - JM9130013 
msal 186 88 .2{361_M732 
tnsall8688.2{GBS361_2603 
msal 18 68 8 . 2 { 3 6 1_0 9 0 
msal 18688 .2(361 1169NT 
msall8688 . 2 { 361 - CJB110 
msall86B8 .2{361_M781 
Consensus 



msall8688 .2{361_18RS21 
msal 18 68 8 . 2 { 3 6 1_A90 9 
msall8688 . 2 j 361__COHl 
msall8688.2{361_H36B 
msall8688 .2{361_JM9130013 
msal!8688 ,2{361_M732 
rasall8688.2{GBS361_2603 



1601 

TAACAGGTCC 
TAACAGGTCC 
TAACAGGTCC 
TAACAGGTCC 
TAACAGGTCC 
TAACAGGTCC 
TAACAGGTCC 
TAACAGGTCC 
TAACAGGTCC 
TAACAGGTCC 
TAACAGGTCC 



TTTATCTGTC 
TTTATCTGTC 
TTTATCTGTC 
TTTAT CTGTC 
TTTATCTGTC 
TTTATCTGTC 
TTTATCTGTC 
TTTATCTGTC 
TTTATCTGTC 
TTTATCTGTC 
TTTATCTGTC 



ATTTCGACAA 
ATTTCGACAA 
ATTTCGACAA 
ATTTCGACAA 
ATTTCGACAA 
ATTTCGACAA 
ATTTCGACAA 
ATTTCGACAA 
ATTTCGACAA 
ATTTCGACAA 
ATTTCGACAA 



ATAGTGGAGC 
ATAGTGGAGC 
ATAGTGGAGC 
ATAGTGGAGC 
ATAGTGGAGC 
ATAGTGGAGC 
ATAGTGGAGC 
ATAGTGGAGC 
ATAGTGGAGC 
ATAGTGGAGC 
ATAGTGGAGC 



1650 
GCTTGATGGT 
GCTTGATGGT 
GCTTGATGGT 
GCTTGATGGT 
GCTTGATGGT 
GCTTGATGGT 
GCTTGATGGT 
GCTTGATGGT 
GCTTGATGGT 
GCTTGATGGT 
GCTTGATGGT 



1651 

ATACAATATG 
ATACAATATG 
ATACAATATG 
ATACAATATG 
ATACAATATG 
ATACAATATG 
ATACAATATG 
ATACAATATG 
ATACAATATG 
ATACAATATG 
ATACAATATG 



CCAAGGAAAT 
CCAAGGAAAT 
CCAAGGAAAT 
CCAAGGAAAT 
CCAAGGAAAT 
CCAAGGAAAT 
CCAAGGAAAT 
CCAAGGAAAT 
CCAAGGAAAT 
CCAAGGAAAT 
CCAAGGAAAT 



GATGCGTAAC 
GATGCGTAAC 
GATGCGTAAC 
GATGCGTAAC 
GATGCGTAAC 
GATGCGTAAC 
GATGCGTAAC 
GATGCGTAAC 
GATGCGTAAC 
GATGCGTAAC 
GATGCGTAAC 



GATAATCTAG 
GATAATCTAG 
GATAATCTAG 
GATAATCTAG 
GATAATCTAG 
GATAATCTAG 
GATAATCTAG 
GATAATCTAG 
GATAATCTAG 
GATAATCTAG 
GATAATCTAG 



1700 
ACTATGTGAT 
ACTATGTGAT 
ACTATGTGAT 
ACTATGTGAT 
ACTATGTGAT 
ACTATGTGAT 
ACTATGTGAT 
ACTATGTGAT 
ACTATGTGAT 
ACTATGTGAT 
ACTATGTGAT 



1701 

TCTTGTTTCT 
TCTTGTTTCT 
T CTTGTTTC T 
TCTTGTTTCT 
TCTTGTTTCT 

TCTTGTTTCT 



GCTAATCAGT 
GCTAATCAGT 
GCTAATCAGT 
GCTAATCAGT 
GCTAATCAGT 
GCTAATCAGT 
GCTAATCAGT 



GGACAGACAT 
GGACAGACAT 
GGACAGACAT 
GGACAGACAT 
GGACAGACAT 
GGACAGACAT 
GGACAGACAT 



GAGTTTTATG 
GAGTTTTATG 
GAGTTTTATG 
GAGTTTTATG 
GAGTTTTATG 
GAGTTTTATG 
GAGTTTTATG 



1750 
TGGTGGCAAC 
TGGTGGCAAC 
TGGTGGCAAC 
TGGTGGCAAC 
TGGTGGCAAC 
TGGTGGCAAC 
TGGTGGCAAC 



1065 
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Table 75: Comparative Sequences relating to SAG0671 



msall8688 .2(361 090} 
msall8688 . 2 [361_11?9NT J 
msall8688 . 2 { 361_CJB110 } 
msall8688.2{361_M78l} 
Consensus 



msall8688.2{361 18RS21 
tnsal 18 6 8 8 . 2 ( 3 ? 1_A90 9 ' 
msallS 68 8 . 2 { 3 6 1 JCOH1 ' 
msall8688.2{361_H36B 
msall8688 .2{361_JM9130013 . 
msall8668 . 2 { 361_M732 
msall8688 . 2 {GBS361_2603 ' 
msall8688 .2{361_09o' 
msalie 68 8 . 2 { 361_1169NT> 
msalie 688 . 2 { 36 1_CJB110 J 
msall8688.2{361_M781) 
Consensus 



TCTTGTTTCT GCTAATCAGT GGACAGACAT GAGTTTTATG TGGTGGCAAC 
TCTTGTTTCT GCTAATCAGT GGACAGACAT GAGTTTTATG TGGTGGCAAC 
TCTTGTTTCT GCTAATCAGT GGACAGACAT GAG TTTTA TG TGGTGGCAAC 
TCTTGTTTCT GCTAATCAGT GGACAGACAT GAGTTTTATG TGGTGGCAAC 



1751 

AATTAAACTA 
AATTAAACTA 
AATTAAACTA 
AATTAAACTA 
AATTAAACTA 
AATTAAACTA 
AATTAAACTA 
AATTAAACTA 
AATTAAACTA 
AATTAAACTA 
AATTAAACTA 



TGATAGTCAA 
TGATAGTCAA 
TGATAGTCAA 
TGATAGTCAA 
TGATAGTCAA 
TGATAGTCAA 
TGATAGTCAA 
TGATAGTCAA 
TGATAGTCAA 
TGATAGTCAA 
TGATAGTCAA 



ATGTTTGTCG 
ATGTTTGTCG 
ATGTTTGTCG 
ATGTTTGTCG 
ATGTTTGTCG 
ATGTTTGTCG 
ATGTTTGTCG 
ATGTTTGTCG 
ATGTTTGTCG 
ATGTTTGTCG 
ATGTTTGTCG 



GTTCTGATTA 
GTTCTGATTA 
GTTCTGATTA 
GTTCTGATTA 
GTTCTGATTA 
GTTCTGATTA 
GTTCTGATTA 
GTTCTGATTA 
GTTCTGATTA 
GTTCTGATTA 
GTTCTGATTA 



1800 
TTGTT CAGCA 
TTGTTCAGCA 
TTGTTCAGCA 
TTGTTCAGCA 
TTGTTCAGCA 
TTGTTCAGCA 
TTGTTCAGCA 
TTGTTCAGCA 
TTGTTCAGCA 
TTGTTCAGCA 
TTGTTCAGCA 



msall8688.2{361 18RS21 
msall8688 . 2 { 361__A909 
msall8688 .2{361_C0H1 
msall8688.2{361_H36B 
msall8688 . 2 { 361_JM9130013 
msall8688 ,2{36l_M732 
msall8688 . 2 {GBS361_2603 
msall8688.2{361_090 
ma all8 688 .2(361_1169NT 
msalie 688 .2{361_CJB110 
msal 18688 . 2 { 361_M781 
Consensus 



1801 

CAAGTCCTCT 
CAAGTCCTCT 
CAAGTCCTCT 
CAAGTCCTCT 
CAAGTCCTCT 
CAAGTCCTCT 
, CAAGTCCTCT 
CAAGTCCTCT 
CAAGTCCTCT 
CAAGTCCTCT 
CAAGTCCTCT 



CTCGTCAAGC 
CTCGTCAAGC 
CTCGTCAAGC 
CTCGTCAAGC 
CTCGTCAAGC 
CTCGTCAAGC 
CTCGTCAAGC 
CTCGTCAAGC 
CTCGTCAAGC 
CTCGTCAAGC 
CTCGTCAAGC 



ATTGGATAAT 
ATTGGATAAT 
ATTGGATAAT 
ATTGGATAAT 
ATTGGATAAT 
ATTGGATAAT 
ATTGGATAAT 
ATTGGATAAT 
ATTGGATAAT 
ATTGGATAAT 
ATTGGATAAT 



TCTCCTATAA 
TCTCCTATAA 
TCTCCTATAA 
TCTCCTATAA 
TCTCCTATAA 
TCTCCTATAA 
TCTCCTATAA 
TCTCCTATAA 
TCTCCTATAA 
TCTCCTATAA 
TCTCCTATAA 



1850 
TATTAGGTAG 
TATTAGGTAG 
TATTAGGTAG 
TATTAGGTAG 
TATTAGGTAG 
TATTAGGTAG 
TATTAGGTAG 
TATTAGGTAG 
TATTAGGTAG 
TATTAGGTAG 
TATTAGGTAG 



msalie 688. 2 (361_18RS21 
msall8688.2(361_A909 
insall8688.2(361_COHl 
msall8688 .2{361_H36B 
msall8688 .2{361_JM9130013 
msall8688.2{361_M732 
msall8688 . 2 {GBS361_2603 
msal 18 68 8 . 2 { 361_090 
msall8688.2(361 1169NT 
msall8688.2{36lICJB110 
msall8688.2{361_M781 
Consensus 



msall8688 . 2 { 361_18RS21 ' 
msall8688. 2(361 A909 
maall8688 . 2 { 361 jOOHl ] 
msall8688 .2{361_H36B 
msall8688 . 2 {36WM9 130013 
msall8688 . 2 {361J4732 
tnsall8688.2{GBS361 2603 
msall8688.2{361_090 
msal 18688 .2{361_1169NT 

msaiiBeae^isei^cjBiio 

msall8688.2{361_M781 
Consensus 



msall8688 . 2 { 361__18RS21 1 
msall8688.2{361_A909' 
msall8688.2{361_COHl 
tnsall8688 . 2 {361JI36B 
msall8688 .2{361_JM9130013 
msall86B8 . 2 { 361_M732 
msall8688 . 2 {GBS361_2603 
msall8688.2{361_090 
msall8688. 2(361 1169NT 
msall8688.2{36CCJB110 
msall8688.2{361_M761 
Consensus 



msallB 688 . 2 { 361_18RS21 
msall8688.2(361_A909 
msall8688.2(361_OOHl 
msall8688.2{361_H36B 
msall8688.2{361 JM9130013 
msall8688 ,2{361_M732 



1851 

TAAACAATTA 
TAAACAATTA 
TAAACAATTA 
TAAACAATTA 
TAAACAATTA 
TAAACAATTA 
TAAACAATTA 
TAAACAATTA 
TAAACAATTA 
TAAACAATTA 
TAAACAATTA 



AAATATAGCC 
AAATATAGCC 
AAATATAGCC 
AAATATAGCC 
AAATATAGCC 
AAATATAGCC 
AAATATAGCC 
AAATATAGCC 
AAATATAGCC 
AAATATAGCC 
AAATATAGCC 



ATAAAACATT 
ATAAAACATT 
ATAAAACATT 
ATAAAACATT 
ATAAAACATT 
ATAAAACATT 
ATAAAACATT 
ATAAAACATT 
ATAAAACATT 
ATAAAACATT 
ATAAAACATT 



CACAGATGTG 
CACAGATGTG 
CACAGATGTG 
CACAGATGTG 
CACAGATGTG 
CACAGATGTG 
CACAGATGTG 
CACAGATGTG 
CACAGATGTG 
CACAGATGTG 
CACAGATGTG 



1900 
ATGACTATTT 
ATGACTATTT 
ATGACTATTT 
ATGACTATTT 
ATGACTATTT 
ATGACTATTT 
ATGACTATTT 
ATGACTATTT 
ATGACTATTT 
ATGACTATTT 
ATGACTATTT 



1901 

TTGATGCTGC 
TTGATGCTGC 
TTGATGCTGC 
TTGATGCTGC 
TTGATGCTGC 
TTGATGCTGC 
TTGATGCTGC 
TTGATGCTGC 
TTGATGCTGC 
TTGATGCTGC 
TTGATGCTGC 



GCTTCAAAAT 
GCTTCAAAAT 
GCTTCAAAAT 
GCTTCAAAAT 
GCTTCAAAAT 
GCTTCAAAAT 
GCTTCAAAAT 
GCTTCAAAAT 
GCTTCAAAAT 
GCTTCAAAAT 
GCTTCAAAAT 



TTATTATCAG 
TTATTATCAG 
TTATTATCAG 
TTATTATCAG 
TTATTATCAG 
TTATTATCAG 
TTATTATCAG 
TTATTATCAG 
TTATTATCAG 
TTATTATCAG 
TTATTATCAG 



ACTTAGGACT 
ACTTAGGACT 
ACTTAGGACT 
ACTTAGGACT 
ACTTAGGACT 
ACTTAGGACT 
ACTTAGGACT 
ACTTAGGACT 
ACTTAGGACT 
ACTTAGGACT 
ACTTAGGACT 



1950 
AACCATAAAA 
AACCATAAAA 
AACCATAAAA 
AACCATAAAA 
AACCATAAAA 
AACCATAAAA 
AACCATAAAA 
AACCATAAAA 
AACCATAAAA 
AACCATAAAA 
AACCATAAAA 



1951 

GATATCAAAG 
GATATCAAAG 
GATATCAAAG 
GATATCAAAG 
GATATCAAAG 
GATATCAAAG 
GATATCAAAG 
GATATCAAAG 
GATATCAAAG 
GATATCAAAG 
GATATCAAAG 



GTTTCGTTTG 
GTTTCGTTTG 
GTTTCGTTTG 
GTTTCGTTTG 
GTTTCGTTTG 
GTTTCGTTTG 
GTTTCGTTTG 
GTTTCGTTTG 
GTTTCGTTTG 
GTTTCGTTTG 
GTTTCGTTTG 



GAATGAGCGG 
GAATGAGCGG 
GAATGAGCGG 
GAATGAGCGG 
GAATGAGCGG 
GAATGAGCGG 
GAATGAGCGG 
GAATGAGCGG 
GAATGAGCGG 
GAATGAGCGG 
GAATGAGCGG 



AAGAAGGCAG 
AAGAAGGCAG 
AAGAAGGCAG 
AAGAAGGCAG 
AAGAAGGCAG 
AAGAAGGCAG 
AAGAAGGCAG 
AAGAAGGCAG 
AAGAAGGCAG 
AAGAAGGCAG 
AAGAAGGCAG 



2000 
TTAGTTCAGA 
TTAGTTCAGA 
TTAGTTCAGA 
TTAGTTCAGA 
TTAGTTCAGA 
TTAGTTCAGA 
TTAGTTCAGA 
TTAGTTCAGA 
TTAGTTCAGA 
TTAGTTCAGA 
TTAGTTCAGA 



2001 

TTATGATTTC 
TTATGATTTC 
TTATGATTTC 
TTATGATTTC 
TTATGATTTC 
TTATGATTTC 



TTAGCGAACT 
TTAGCGAACT 
TTAGCGAACT 
TTAGCGAACT 
TTAGCGAACT 
TTAGCGAACT 



TGTCTGAGTA 
TGTCTGAGTA 
TGT CTGAGTA 
TGTCTGAGTA 
TGTCTGAGTA 
TGTCTGAGTA 



TTATAATATO 
TTATAATATG 
TTATAATATG 
TTATAATATG 
TTATAATATG 
TTATAATATG 



2050 
CCAAACCTTG 
CCAAACCTTG 
CCAAACCTTG 

ccAAACcrra 

CCAAACCTTG 
CCAAACCTTG 
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msallS 6 8 8 . 2 { GBS3 6 1_2 6 03 
msall8688 .2{361_090 
msall8688 ,2{ 361_1169NT 
rasall8688.2(361_CJB110 
msall8688.2(361_M781 
Consensus 



msall8688 .2{361_18RS2l] 
msall8688.2(361_A909 t 
msa!18688 .2(361_C0H1 ( 
msall8688 .2{361_H36B 
msall8688 . 2 { 361_JM9130013 ' 
msall868B .2{361_M732 
msall8688 .2{GBS361_2603 
msall8688 .2{361_090 
msall8688.2(361_1169NT 
msall8688 . 2 {361_CJB110 
msall8688.2(361_M781 
Consensus 



msall8688 .2{361_18RS21 
msall8688. 2(361 A909 
Tnsall8688.2{361~COHl 
msall8668 . 2 { 361_H36B 
msall8688 .2{361_JM9130013 
msall8688 . 2 { 361J4732 
rasaai8688 .2{GBS361_2603 
msall8688.2{361_090 
msall8688.2{361_1169NT 
msall868B.2(361_CJB110 
jnsall86B8.2{361_M781 
Consensus 



rasall8688 .2{361_18RS21 
msall8688 .2{361_A909 
msall868 8 . 2 ( 361_COHl 
msall868B.2(361_H36B 
msall8688.2{361_JM9130013 
msall8688.2{361 M732 
msall8688.2{GBS361~2603 
msall8688 .2(361 090 
ms al 18 688 . 2 ( 3 6 1_1169NT 
msall8688 .2{361_CJB110 
msall8688.2{361_M781 
Consensus 



TTATGATTTC TTAGCGAACT TGTCTGAGTA TTATAATATG CCAAACCTTG 
TTATGATTTC TTAGCGAACT TGTCTGAGTA TTATAATATG CCAAACCTTG 
TTATGATTTC TTAGCGAACT TGTCTGAGTA TTATAATATG CCAAACCTTG 
TTATGATTTC TTAGCGAACT TGTCTGAGTA TTATAATATG CCAAACCTTG 
TTATGATTTC TTAGCGAACT TGTCTGAGTA TTATAATATG CCAAACCTTG 



2051 

CTTCTGGTCA 
CTTCTGGTCA 
CTTCTGGTCA 
CTTCTGGTCA 
CTTCTGGTCA 
CTTCTGGTCA 
CTTCTGGTCA 
CTTCTGGTCA 
CTTCTGGTCA 
CTTCTGGTCA 
CTTCTGGTCA 



GTTTGGATTT 
GTTTGGATTT 
GTTTGGATTT 
GTTTGGATTT 
GTTTGGATTT 
GTTTGGATTT 
GTTTGGATTT 
GTTTGGATTT 
GTTTGGATTT 
GTTTGGATTT 
GTTTGGATTT 



TCATCTAATG 
TCATCTAATG 
TCATCTAATG 
TCATCTAATG 
TCATCTAATG 
TCATCTAATG 
TCATCTAATG 
TCATCTAATG 
TCATCTAATG 
TCATCTAATG 
TCATCTAATG 



GTGCTGGTGA 
GTGCTGGTGA 
GTGCTGGTGA 
GTGCTGGTGA 
GTGCTGGTGA 
GTGCTGGTGA 
GTGCTGGTGA 
GTGCTGGTGA 
GTGCTGGTGA 
GTGCTGGTGA 
GTGCTGGTGA 



2100 
AGAACTGGAC 
AGAACTGGAC 
AGAACTGGAC 
AGAACTGGAC 
AGAACTGGAC 
AGAACTGGAC 
AGAACTGGAC 
AGAACTGGAC 
AGAACTGGAC 
AGAACTGGAC 
AGAACTGGAC 



2101 

TATACTGTTA 
TATACTGTTA 
TATACTGTTA 
TATACTGTTA 
TATACTGTTA 
TATACTGTTA 
TATACTGTTA 
TATACTGTTA 
TATACTGTTA 
TATACTGTTA 
TATACTGTTA 
********** 



ATGAAAGTAT 
ATGAAAGTAT 
ATGAAAGTAT 
ATGAAAGTAT 
ATGAAAGTAT 
ATGAAAGTAT 
ATGAAAGTAT 
ATGAAAGTAT 
ATGAAAGTAT 
ATGAAAGTAT 
ATGAAAGTAT 
********** 



AGAAAAGGGC 
AGAAAAGGGC 
AGAAAAGGGC 
AGAAAAGGGC 
AGAAAAGGGC 
AGAAAAGGGC 
AGAAAAGGGC 
AGAAAAGGGC 
AGAAAAGGGC 
AGAAAAGGGC 
AGAAAAGGGC 
********** 



TATTATTTAG 
TATTATTTAG 
TATTATTTAG 
TATTATTTAG 
TATTATTTAG 
TATTATTTAG 
TATTATTTAG 
TATTATTTAG 
TATTATTTAG 
TATTATTTAG 
TATTATTTAG 



2150 
TCCTATCTTA 
TCCTATCTTA 
TCCTATCTTA 
TCCTATCTTA 
TCCTATCTTA 
TCCTATCTTA 
TCCTATCTTA 
TCCTATCTTA 
TCCTATCTTA 
TCCTATCTTA 
TCCTATCTTA 



2X51 

TTCGATCTTC 
TTCGATCTTc 
TTCGATCTTC 
TTCGATCTTC 
TTCGATCTTC 
TTCGATCTTC 
TTCGATCTTC 
TTCGATCTTt 
TTCGATCTTt 
TTCGATCTTt 
TTCGATCTTt 



GGTGGTATCT 
GGTGGTATCT 
GGTGGTATCT 
GGTGGTATCT 
GGTGGTATCT 
GGTGGTATCT 
GGTGGTATCT 
GGTGGTATCT 
GGTGGTATCT 
GGTGGTATCT 
GGTGGTATCT 



CTTTTGCTAT 
CTTTTGCTAT 
CTTTTGCTAT 
CTTTTGCTAT 
CTTTTGCTAT 
CTTTTGCTAT 
CTTTTGCTAT 
CTTTTGCTAT 
CTTTTGCTAT 
CTTTTGCTAT 
CTTTTGCTAT 



********** ********** 

2193 

TATTGAAAAA AGG 
TATTGAAAAA AGG 
TATTGAAAAA AGG 
TATTGAAAAA AGG 
TATTGAAAAA AGG 
TATTGAAAAA AGG 
TATTGAAAAA AGG 
TATTGAAAAA AGG 
TATTGAAAAA AGG 
TATTGAAAAA AGG 
TATTGAAAAA AGG 



SSQ ZD NO. 7512 
STRAIN 2603 frame: 1 

MSVYVSGIGI I SSLGKNYSEHKQHLFDLKEGI SKHLYKNHDS ILESYTGS ITSDPEVPEQ 
YKDETRNFKFAFTAFEBAIAS SGVNLiKAYHNI AVCLCTSLiGGKSAGQNALYQPEEGERQ V 
DASLLEKASVYH I ADELMAYHDI VGASYVI STACSASNNAVI LGTQLLQDGDCDLAICGG 
CDEItSDI SLAGFTS LGA I NTEMACQPYS SGKG I NLGEGAGFVVLiVKDQSLAKYGKI IGGL 
ITSDG YH I TAPKPTGEGAAQ I AKQLVTQAG I DYS E I D Y I NGHGTGTQANDKMEKNMYGKF 
FPTTTIil SSTTOSQrrGHTljGAAG 1 X ELXNCIiAAI EEQfTVPATKNEI GX EGFPENFVYHQKR 
EYP IIMAIiNPSPAFGGNNSG^I^SLDSPI^riiPARENLKMAILSS VAS I SKNESLS ITY 
EKVASNFNDFEALRPKGARPPKTVNPAQFRKMDDFSKMVAVT^ 

KVG I VFTTTiSGPVEVVEG I EKQ I TTEGYAWS ASRFPFTVMNAAAGMLS 1 1 FKITGPLSV 
I STNSGALDG 1 QYAKEMMRNDNLDYVI LVSANQWTDMS FMWWQQLNYD SQMFVGSD YCSA 
QVLSRQALDNSP I ILGSKQLKYSHKTFTDVMTI FDAALQNLLSDIiGIjTI KDI KGFVWNER 
KKAVSSDYDFLANLSETYKMPhnjASGQFGFSSNGAGEEIiDYTVNES F 
GGISFAIIEKR 

SEQ ID NO. 7513 
STRAIN 090 frame: 3 

VSGIGIISSliGKNYSEHKQHLFDLKEGlSKHLYKNKDSILESYTGSITSDPEVPEQYKDB 

TRNFKFAFTAFEEAIASSGVNLKAYHNIAVCLGTSI^ 

I^KASVYHIADEUtoYHDIVGASYVISTACSASNNAVILG^ 

SDISIJVGFTSLGAINTEMACQPYSSGKGINIjGEGAGFVVLVKDQSIJUC^ igglitsd 
GYHITAPKPTGBGAAQIAKQLVTQAGIDYSEIDYINGHGTG^ 

TLI SSTKGQTGHTLGAAGI IELINCIAAI EEQTVPATKNEIGIEGFPENFVYHQKREYPI 
RNALNFS FAFGGNNSGI UjSSLDS PLETLPARBNLKMAI LSSVAS I S KNESLS I TYEKVA 
SNFNDFEALRFKGARPPKTVNPAQFRKMDDFSKMVAVTT^ 

VFTTLSGPVEWEG IEKQITTEGYAHVSASRFPFTVMNAAAGMLS 1 1 FKITGPLSVI STN 
SOALDGIQYAKEMMRITONLDWILVSANQWT^ 

RQALDNSPI 1 LGSKQLKYSHKTFTDVMTI FDAALQNLLSDLGLTI KDI KGFVWNERKKAV 
SSDYDFLANLSEYYNMPNlASGQFGFSSNGAGEEIiDYTVNES IEKGYYLVLSYS IFGGIS 
FAIIBKR 

SEQ ID NO. 7514 
STRAIN A909 frame: 3 



1067 
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Table 75: Comparative Sequences relating to SAG0671 



VSG I G 1 1 SSLGKNYSEHKQHLFDLKEG I S KHLYKNKDS I LESYTGS I TSD PEVPEQYKDE 
TRNFKFAFTAFEEALAS SGVNLKAYHN IAVCLGTSLGGKSAGQNALYQFEEGERQVDASL 
LE KAS VYH I ADELMAYHD I VGASYV I STACSASNNAV I LGTQLLQDGDCDLA I CGGCDBL 
SDISLAGPTSLGAINTEMACQPYSSGKGINI/jEGAGFVVIjVKDQSIjAKYGKI igglitsd 
GYH I TAPKPTGEGAAQ I AKQLVTQAG IDYSE I DY I NGHGTGTQANDKMEKNMYGKPFPTT 
TLISSTKGQTGHTLGAAGIIBLINOiAAIBEOTVPATK^ 

RNALNFS FAFGGNNS GVLLS SLDS PLETLPARENLKMAI LSSVAS I SKNESLS ITYEKVA 
SNFND FEALRFKGARPPKTVNPAQFRKMDDFSKMVAVTTAQALIBSN^ 
VFTTLSGPVEVVEG I EKQITTEGYAHVSASRFPFTVMNAAAGMLS 1 1 FKITGPLSVI STN 
SGALDG I QYAKEMMRNDNLD YV I LVSANQWTDMS FMWWQQLNYD S QM FVGSDYC SAQVLS 
RQALDNSPI ILGSKQLKYSHKTFTDVMTI FDAALQNLLSDLGLT I KDIKGPVWNERKKAV 
S SD YD FLANLSEYYNMPNLASGQFGFS SNGAGEELDYTVNES IEKGYYLVLSYS IFGGI S 
FAIIEKR 

SEQ ZD NO. 7515 
STRAIN H36B frame: 3 

VSGIGI I SSLGKNYSEHKQHLFDLKEG I SKHLYKNHDSIIiBSYTGS ITSDPEVPEQYKDB 
THNFKFAFTAFEEALASSGVNLKAYHNIAVCLGTSLGGKSAGQ 

LEKASVYHIADELMAYHDI VGASYVI STACSASNNAV I LGTQLLQDGDCDLA I CGGCDBL 
SDI SLAGFTSLGAINTEMACQP YS SGKGI NLGBGAG FVVL VKDQSLAKYGKI IGGLITSD 
GYH I TAPKPTGEGAAQ I AKQLVTQAG I DYSE I DY I NGHGTGTQANDKME KNMYG KFF PTT 
TLISSTKGCTGHTLGAAGIIFJliINCLAAIEEQWPATKNEIG 

RNALNFS FAFGGNNSGVLLSSLDSPLETLPARENLKMAI LSSVAS I SKNESLSITYEKVA 
SNFND FEALRFKGAR PPKTVNPAQ FRKMDDFS KMVAVTTAQAL I E SN I NLKKQDTS KVG I 
VFTTLSGPVEWEGI EKQITTEGYAHVSASRFPFTVMNAAAGMLS 1 1 FKITGPLSVI STN 
SGALDG I QYAKEMMRNDNLDYVI LVSANQWTDMSFMWWQQLNYDSQMFVGSDYCSAQVLS 
RQALDNSPI I LGSKQLKYSHKTFTDVMTI FDAALQNLLSDLGLT I KDI KGFVWNERKKAV 
SSDYDFIJ\NLSBYYNMPNIaASGQFGFSSNGAGEEI^YTVNES IEKGYYLVLSYS IFGGIS 
FAIIEKR 

SHQ ID HO. 7516 
STRAIN 18RS21 frame: 3 

VSGIGI I SSLGKNYSEHKQHLFDLKEGISKHLYKNHDS ILESYTGS ITSDPEVPEQYKDB 
TRNFKFAFTAFEEALAS SGVNLKAYHNIAVCIjGTSLGGKSAGQNALYQFEEGERQVDASL 
LEKASVYHIADELMAYHDI VGASYVI STACSASNNAV I LGTQLLQDGDCDLAI CGGCDBL 
SD I SLAGFTSLGAI NTEMAC^PY^SGKGINI/SEGAGFV^VKDQSLAKYGKI IGGLI TSD 
GYH ITAPKPTGEGAAQ I AKQLVTQAG I DYSE I DY I NGHGTGTQANDKMEKNMYG KFFPTT 
TLI SSTKGQTGHTLGAAGI IELINCLAAIEEQTVPATKNEIGI EGFPENFVYHQKREYPI 
RNALNFSFAFGGNNSGVLLSSLDSPLETLPARENLKMAI LSSVAS I SKNESLSITYEKVA 
SNFND FEALRFKGARP P KTVNPAQFRKMDD FS KMVAVTTAQAL I E SN I NLKKQDTS KVG I 
VFTTLSGPVEVVEG I EKQITTEGYAHVSASRFPFTVMNAAAGMLS 1 1 FTCITC 
SGALDGI QYAKEMMRNDNLDYVI LVSANQWTDMS FMWWQQLNYDSQMFVGSDYCSAQVLS 
RQALDNSPI I LGSKQLKYSHKTFTDVMTI FDAAI*QNI^DLGLTI KDIKGPVWNERKKAV 
SSDYDFLANLSBYYNMPNLASGQFGFS SNGAGEBLDYTVNES IEKGYYLVLSYS IFGGIS 
FAIIEKR 

SBQ XD HO. 7517 
STRAIN M732 frame: 3 

VSGIGI I SSLGKNYSEHKQHLFDLKEGI SKHL YKNHDS I LESYTGS ITSDPEVPEQYKDB 
TRNFKFAFTAFEEALAS SGVNLKAYHNIAVCLGTSLGGKSAGQNALYQFEEGERQVDASL 
LEKASVYHIADELMAYHDI VGASYVI STACSASNNAVI LGTQLLQDGDCDLA I CGGCDBL 
SDI SLAGFTSLGAINTEMACQPYSSGKGINLGEGAGFVVLVKDQSLAKYGKI IGGL ITSD 
GYH ITAPKPTGEGAAQI AKQLVTQAG I DYS E I D Y I NGHGTGTQANDKME KNMYGKFFPTT 
TLI SSTKGQTGHTLGAAGI IELINCLAAIEEQTVPATKNEIGIEGFPENFVYHQKREYPI 
RNALNFS EAFGGNNSGVLLSSLDSPLETLPARENLKMAI LSSVAS I SKNESLS ITYEKVA 
SNPNDFEALRPKGARPPKTVNPAQFRKMDDFSKMVAVTTAQALI 
VFTTLSGPVBVVEGIEKQITTEGYAHVSASRFPFTVMNAAA 

SGALDG I QYAKEMMRNDNLDYVI LVSANQWTDMS FMWWC^LNYDSQMFVGSDYCSAQVLS 
RQALDNSPI I LGS. KQLKYSHKTFTDVMT I FDAALQNLLSDLGLT I KD I KGFVWNERKKAV 
S SDYDFLANLSEYYNMPNLASGQFGFS SNGAGEELDYTVNES I EKGYYLVLSYS I FGGI S 
FAIIEKR 

SEQ ZD HO. 7518 
STRAIN COH1 frame: 3 

VSGIGIISSLGKNYSEH10QHLFDLKEGISKHLYKNHDSILESYTGSITSDPEVPEQYKDE 
TRNFKFAFTAFEEALASSGVNLKAYHNIAVCLGTSL^ 

LEKASVYHIADELMAYHDI VGASYVI STACSASNNAV I LGTQLLQDGDCDLA I CGGCDEL 
SDI SLAGFTSLGAI NTEMACQPYS SGKG INLGEGAGFVVLVKDQSLAKYGKI IGGL ITSD 
GYHI TAPKPTGEGAAQ I AKQLVTQAG I DYSE I DY I NGHGTGTQANDKMEKNMYGKFFPTT 
TLI SSTKGQTGHTLGAAGI I ELINCIiAAIEBC/rVPATKNEIGIEGFPENPVYHQKREYPI 
RNAIaNFSFAFGGNNSGVLLiSSLDSPLETLPA , 
SNFNDFEAIJIF1CGARPPKTVNPAQFRKMDDFSKMVAVTTAQALI ESNI NL KKQDTS KVG I 
VFTTLSGPVEVVEGI EKQITTEGYAHVSASRFPFTVMNAAAGMLS 1 1 FKITGPLSVI STN 
SGALDGI QYAKEMMRNDNLDYV I LVSANQWTDMS FMWWQQLNYDSQMFVGSDYCSAQVLS 
RQALDNSPI ILGSKQLKYSHKTFTDVMTI FDAALQNLLSDLGLT I KDIKGPVWNERKKAV 
SSDYDFI4ANLSBYYNMPNLASGQFGFSSNGAGEBI1DYTVNES I EKGYYLVLSYS I FGGI S 
FAIIEKR 

SEQ ZD NO. 7519 
STRAIN M781 frame: 3 
* VSGIG 1 1 SSLGKNYSEHKQHLFDLKEG ISKHLYKNHDS I LESYTGS ITSDPEVPEQYKDB 
TRNFKFAFTAFEEALAS SGVNLKAYHN IAVCLGTSLGGKSAGQNALYQFEEGERQVDASL 
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IJSKASVYHIADELMAYHDIVGASYVIST^ 

SD I SLAGFTSLGAINTEMACQP YSSGKG INLGEGAGFWLVKDQSLAKYGKI IGGLITSD 
GYHI TAPKPTGEGAAQIAKQLVTQAGI DYSEIDYI NGHGTGTQANDKMEKNMYGKPPPTT 
TLISSTKGQTGHTLGAAGI IELINCLAAIBEQTVPATKNEIGIEGFPENFVYHQKREYPI 
RNALNFS FAFGGNNSG I LLS SLDS PLETLPARENLKMAI LSS VAS I SKNESLS ITYBKVA 
SNF1TOFEALRFKGARPPKTVNPAQFRKMDDFSKMVAVTTAQALI ESN I NLKKQDTSKVG I 
VFTTLSGPVE WEG I EKQI TTEGYAHVSAS RFPFTVMNAAAGMLS 1 1 FKI TG PLS VI STN 
SGALDG I QYAKEMMRNDNLD YV I LVSANQWTDMSFMWWQQLNYDSQMFVGSDYCSAQVLS 
RQALDNSPI ILGSKQLKYSHKTPTDVMTI FDAALQNLLSDLGLT I KD I KGPVWNERKKAV 
SSDTOFLANLSBYYNMPNLASGQFGFSSNGAGEELDYTVNES IBKGYY^ PGGI S 

FAIIEKR 

SEQ ZD NO. 7520 
STRAIN CJB 110 frame: 3 

VSGIGI ISSLGKNYSEHKQHLFDLKEGI SKHLYKNHDS ILtESYTGS ITSDPEVPEQYKDE 
TRNFKFAFTAFEEALAS SGVNLKAYHNI AVCI/H'SLGG KS AGQNALYQ FEEGERQVDASL 
LEKAS VYHI ADELMA YHD I VGASYVT STACSASNNAVI LGTQLLQDGDCDLA I CGGCDEL 
SDI S LAGFTSLGAI NTEMACQP YS SGKG INLGEGAGF^VVLVKDQSLAKYGKI I GGLI TSD 
GYHITAPKPTGEGAAQIAKQLVTQAGIDYSEIDYINGHGTGTQAOTKMEK^YGKFFP^ 
TLISSTKGQTGHTLGAAGI IBLINCIJtftf EEQTVPATKNBIGIEGFPENFVYHQKREYPI 
RNALNFSFAFGGNNSGII^SLDSPLETLPARENLKMAILSSVASISKNESLSITYEKVA 
SNFNDFEALRPKGARPPKTVNPAQFRKMDDFSKMVAVTTAQALI ESNINLKKQDTSKVG I 
VFTTXSGPVEVVEGIEKQITTEGYAHVSASRPPFTVMNAAAGMLS 1 1 PKITGPLSVISTN 
SGALDG I QYAKEMMRNDNLD YVI LVSANQ WTDMS FMWtfQXJLNYDSQMFVGSDYCSAQVLS 
RQALDNSPI ILGSKQLKYSHKTFTDVMTI FDAALQNLLSDLGLTIKDIKGFVWNERKKAV 
S SDYDFLANLSEYYNMPNLASGQFG FS SNGAGEELDYTVNES I EKGYYLVLS Y S I PGGI S 
FAIIEKR 

SEQ ID NO. 7521 
STRAIN 1 169NT frame: 3 

VSGIGI I SSLGKNYS EHKQHLFDLKEG I S KHL YKNHDS I LES YTGS ITSDPEVPEQYKDE 
TRNFKFAFTAFEEALAS SGVNLKAYHN I AVCLGT S LGGKS AGQNALYQFEEGERQVDAS L 
LEKASVYHIADBLMAYHDI VGASYVI STACSASNNAVI LGTQLLQDGDCDLAI CGGCDEL 
SDISLAGFTSLGAINTEMACQPYSSGKGINLGEGAGFVVLViaX2SL^ 
GYHI TAPKPTGEGAAQ I AKQLVTQAG I DYSE I D Y I NGHGTGTQANDKMEKNMYG KFF PTT 
TLISSTKGQTGHTLGAAGI IELINCLAAIEEQTVPATKNEIGIEGPPENFVYHQKREYPI 
RNALNFS FAFGGNNSG I LLS SLDSPLETLPARENLKMAI LSS VAS I SKNESLS ITYBKVA 
SNFNDFEALRFKGARPPKTVNPAQFRKMDDFSKMVAVTTAQALI ESNINLKKQDTSKVG I 
VflTL SGP VEWEG I EKQI TTEGYAHVSAS RF P FTVMNAAAGMLS 1 1 FKITGPLSVI STN 
SGALDG I QYAKEMMRNDNLD YVI LVSANQ WTDMS FMWWQQLNYD SQMFVGSD YCSAQVL S 
RQALDNSPI ILGSKQLKYSHKTFTDVMTI FDAALQNLLSDLGLTIKDIKGFVWNERKKAV 
SSDYDFLANLSEYYNMPNLASGQFGFSSNGAGEELDYTVNES IEKGYYLVLSYS IFGGI S 
• FAIIEKR 

SEQ XD NO. 7522 
STRAIN JM9130013 frame: 3 

VSGIGI I SSLGKNYSEHKQHLFDLKEG I SKHLYKNHDS I LES YTGS ITSDPEVPEQYKDE 

TRNFKFAFTAFEEALAS SGVNLKAYHNIAVCLGTS LGGKSAGQNALYQFEEGERQVDASL 

LEKASVYHIADELMAYHD I VGASYVI STACSASNNAVI LGTQLLQDGDCDLAI CGGCDEL 

SD I SLAGFTSLGAI NTEMACQP YS SGKG INLGEGAGFVVLVKDQSLAKYGKI IGGLITSD 

GYHITAPKPTGEGAAQIAKQLVTQAGIDYSEIDYINGHGTGTQANDKMEKNMYG 

TL I SSTKGQTGHTLGAAG 1 1 EL I NCLAAI EEQTVPATKNE I GI EGFPENPVYHQKREYP I 

RNALNF^ FAFGGNNSGVLLS SLDSPLETLPARENLKMAI LSSVAS I SKN^ 

SNFND FEALRFKGARP PKTVNPAQFRKMDD FSKMVAVTTAQALI E SN INLKKQDTS KVG I 

VFTTLSGPVBWEGI EKQI TTEGYAHVSAS RFPFTVMNAAAGMLS 1 1 FKITGPLSVI STN 

SGALDGI QYAKFJ*!MRNDNLD YVI L VSANQWTDMSFMWWQQLNYD S QMFVG SD YCSAQVLS 

RQALDNSPI ILGSKQLKYSHKTFTDVMTI FDAALQNLLSDLGLT I KDI KGFVWNERKKAV 

SSDYDFLANLSEYYNMPNLASGQFGFSSNGAGEELDYTVNES IEKGYYLVLSYS I PGGI S 

FAIIEKR 



PRETTY of : /biotmp/msall8713 .2 {*} April 9, 2003 02t54 



msall8713.2{361_090 
msall8713. 2(361 1169NT 
meall8713 . 2 (361~CJB110 
msall8713 .2{361_M781 
msall8713 .2{361_18RS21 
msall8713.2{361_A909 
msall8713.2(361_COHl 
msall8713.2{361_H36B 
msall8713.2{361 JM9130013 
msall8713 . 2{361_M732 
msall8713.2{GBS361_2603 
Consensus 



VSGIGI 

VSGIGI 

VSGIGI 

VSGIGI 

VSGIGI 

VSGIGI 

VSGIGI 

VSGIGI 

VSGIGI 

VSGIGI 

mavyVSGIGI 



ISSLGKNYSE 
ISSLGKNYSE 
ISSLGKNYSE 
ISSLGKNYSE 
ISSLGKNYSE 
ISSLGKNYSE 
ISSLGKNYSE 
ISSLGKNYSE 
ISSLGKNYSE 
ISSLGKNYSE 
ISSLGKNYSE 



HKQHLFDLKE 
HKQHLFDLKE 
HKQHLFDLKE 
HKQHLFDLKE 
HKQHLFDLKE 
HKQHLFDLKE 
HKQHLFDLKE 
HKQHLFDLKE 
HKQHLFDLKE 
HKQHLFDLKE 
HKQHLFDLKE 



GISKHLYKNH 
GISKHLYKNH 
GISKHLYKNH 
GISKHLYKNH 
GISKHLYKNH 
GISKHLYKNH 
GISKHLYKNH 
GISKHLYKNH 
GISKHLYKNH 
GISKHLYKNH 
GISKHLYKNH 



50 

DSILESYTGS 
DS I LES YTGS 
DSILESYTGS 
DSILESYTGS 
DSILESYTGS 
DSILESYTGS 
DSILESYTGS 
DSILESYTGS 
DSILESYTGS 
DSILESYTGS 
DSILESYTGS 



msall8713.2{361_090 
msall8713 .2{361_1169NT 
msall8713. 2(361 CJB110 
msall8713.2{3?l_M781 
msall8713 . 2 { 361JL8RS21 



51 100 
ITSDPEVPEQ YKDETRNFKF APTAPEEALA SSGVNLKAYH NIAVCLGTSL 
ITSDPEVPEQ YKDETRNFKF APTAFEEALA SSGVNLKAYH NIAVCLGTSL 
ITSDPEVPEQ YKDETRNFKF APTAFEEALA SSGVNLKAYH NIAVCLGTSL 
ITSDPEVPEQ YKDETRNFKF APTAFEEALA SSGVNLKAYH NIAVCLGTSL 
ITSDPEVPEQ YKDETRNFKF AFTAFEEALA SSGVNLKAYH NIAVCLGTSL 



1069 



WO 2004/018646 



PCT7US2003/026827 



Table 75: Comparative Sequences relating to SAG0671 



msall8713.2(361_A909 
msall8713. 2(361 COH1 
msallB713. 2(361 H36B 
msall8713.2(361_JM9130013 
01831X8713.2(361^32 
msall8713.2(GBS361_2603 
Consensus 



ITSDPEVPBQ 
ITSDPEVPBQ 
ITSDPEVPEQ 
ITSDPEVPBQ 
ITSDPEVPEQ 
ITSDPEVPBQ 



YKDETRNFKF 
YKDETRNFKF 
YKDETRNFKF 
YKDETRNFKF 
YKDETRNFKP 
YKDETRNFKP 



AFTAFEEALA 
AFTAFEEALA 
AFTAFEEALA 
AFTAFEEALA 
AFTAFEEALA 
AFTAFEEALA 



SSGVNLKAYH 
SSGVNLKAYH 
SSGVNLKAYH 
SSGVNLKAYH 
SSGVNLKAYH 
SSGVNLKAYH 



NIAVCLGTSL 
NIAVCLGTSL 
NIAVCLGTSL 
NIAVCLGTSL 
NIAVCLGTSL 
NIAVCLGTSL 



msall8713.2{361_090; 
msall8713 . 2 f 361_1169NT 
msall8713 . 2 { 361_CJB110 
msall8713.2(361_M781 
msall8713.2(361_18RS21 
msall8713 . 2 ( 361_A909 
msall8713 . 2 { 361_COHl 
msall8 7 13.2(36 1_H3 6B 
rasall8713.2{361_JM9130013 
msall8713 .2{361_M732 
msall8713 . 2{GBS361_2603 
Consensus 



101 

GGKSAGQNAL 
GGKSAGQNAL 
GGKSAGQNAL 
GGKSAGQNAL 
GGKSAGQNAL 
GGKSAGQNAL 
GGKSAGQNAL 
GGKSAGQNAL 
GGKSAGQNAL 
GGKSAGQNAL 
GGKSAGQNAL 



YQFEEGERQV 
YQFEEGERQV 
YQFEEGERQV 



YQFEEGERQV 
YQFEEGERQV 
YQFEEGERQV 
YQFEEGERQV 
YQFEEGERQV 
YQFEEGERQV 
YQFEEGERQV 



DASLLBKASV 
DASLLEKASV 
DASLLBKASV 
DASLLEKASV 
DASLLEKASV 
DASLLEKASV 
DASLLEKASV 
DASLLEKASV 
DASLLEKASV 
DASLLBKASV 
DASLLEKASV 



YH I ADBLMAY 
YHIADELMAY 
YHI ADELMAY 
YHIADELMAY 
YHIADELMAY 
YHIADELMAY 
YHIADELMAY 
YHIADELMAY 
YHIADELMAY 
YHIADELMAY 
YHIADELMAY 



150 

HDIVGASYVI 
HDIVGASYVI 
HDIVGASYVI 
HDIVGASYVI 
HDIVGASYVI 
HDIVGASYVI 
HDIVGASYVI 
HDIVGASYVI 
HDIVGASYVI 
HDIVGASYVI 
HDIVGASYVI 



msall8713 . 2 { 361_090 
msall8713 .2 {361_1169Nt! 
msall8713.2(361_CJB110 
msall8713 . 2 { 361_M781 
msall8713 . 2 (361_18RS21 
msall8713 .2(361_A909 
msall8713 . 2 { 361_C0H1 
msall8713 . 2 { 361_H36B 
msall8713. 2(361 JM9130013 
tnsall8713 .2{361_M732 
msall8713.2(GBS361_2603 
Consensus 



151 

STACSASNNA 
STACSASNNA 
STACSASNNA 
STACSASNNA 
STACSASNNA 
STACSASNNA 
STACSASNNA 



STACSASNNA 
STACSASNNA 
STACSASNNA 



VILGTQLLQD 
VILGTQLLQD 
VILGTQLLQD 
VILGTQLLQD 
VILGTQLLQD 
VILGTQLLQD 
VILGTQLLQD 
VILGTQLLQD 
VILGTQLLQD 
VILGTQLLQD 
VILGTQLLQD 



GDCDLAICGG 
GDCDLAICGG 
GDCDLAICGG 
GDCDLAICGG 
GDCDLAICGG 
GDCDLAICGG 
GDCDLAICGG 
GDCDLAICGG 
GDCDLAICGG 
GDCDLAICGG 
GDCDLAICGG 



CDBLSDISLA 
CDELSD I SLA 
CDBLSDISLA 
CDBLSDISLA 
CDBLSDISLA 
CDBLSDISLA 
CDBLSDISLA 
CDBLSDISLA 
CDBLSDISLA 
CDELSD I SLA 
CDBLSDISLA 



200 

GFTSLGAINT 
GFTSLGAINT 
GFTSLGAINT 
GFTSLGAINT 
GFTSLGAINT 
GFTSLGAINT 
GFTSLGAINT 
GFTSLGAINT 
GFTSLGAINT 
GFTSLGAINT 
GFTSLGAINT 



msall8713.2{361 090 
msall8713.2{361_1169NT 
msall8713 . 2 { 361_CJB110 
msall8713 .2{361_M781 
msall8713 . 2 (361_18RS21 
rasall8713 .2{361_A909 
msa!18713 .2(361_COHl 
msall8713 . 2 ( 361_H36B 
msall8713.2(361_JM9130013 
msall8713 . 2 { 361J4732 
msall8713.2(GBS361_2603 
Consensus 



201 

EMACQPYSSG 
EMACQPYSSG 
EMACQPYSSG 
EMACQPYSSG 
EMACQPYSSG 
EMACQPYSSG 
EMACQPYSSG 
EMACQPYSSG 
EMACQPYSSG 
EMACQPYSSG 
EMACQPYSSG 
********** 



KGINLGEGAG 
KGINLGEGAG 
KGINLGEGAG 
KGINLGEGAG 
KGINLGEGAG 
KGINLGEGAG 
KGINLGEGAG 
KGINLGEGAG 
KGINLGEGAG 
KGINLGEGAG 
KGINLGEGAG 
********** 



FWLVKDQSL 
FWLVKDQSL 
FWLVKDQSL 
FWLVKDQSL 
FWLVKDQSL 
FWLVKDQSL 
FWLVKDQSL 
FWLVKDQSL 
FWLVKDQSL 
FWLVKDQSL 
FWLVKDQSL 
********** 



AKYGKI IGGL 
AKYGKIIGGL 
AKYGKI IGGL 
AKYGKIIGGL 
AKYGKIIGGL 
AKYGKIIGGL 
AKYGKIIGGL 
AKYGKIIGGL 
AKYGKIIGGL 
AKYGKIIGGL 
AKYGKIIGGL 
********** 



250 

ITSDGYH ITA 
ITSDGYHITA 
ITSDGYHITA 
ITSDGYHITA 
ITSDGYHITA 
ITSDGYHITA 
ITSDGYHITA 
ITSDGYHITA 
ITSDGYHITA 
ITSDGYHITA 
ITSDGYHITA 
********** 



msall8713.2{361_090 
msall8713.2{361_1169NT 
msall8713 . 2 { 361_CJB110 
msall8713.2(361_M781 
msall8713 .2{361_18RS21 
msall8713.2f361__A909 
msall8713.2f361_COHl 
msall8713.2(361_H36B 
msall8713.2(361_JM9130013 
msall8713. 2(361 M732 
msall8713 . 2 {GBS361~2603 
Consensus 



251 

PKFTGEGAAQ 
PKPTGBGAAQ 
PKPTGEGAAQ 
PKPTGEGAAQ 
PKPTGEGAAQ 
PKPTGEGAAQ 
PKPTGEGAAQ 
PKPTGEGAAQ 
PKPTGEGAAQ 
PKPTGEGAAQ 
PKPTGEGAAQ 
* ********** 



IAKQLVTQAG 
IAKQLVTQAG 
IAKQLVTQAG 
IAKQLVTQAG 
IAKQLVTQAG 
IAKQLVTQAG 
IAKQLVTQAG 
IAKQLVTQAG 
IAKQLVTQAG 
IAKQLVTQAG 
IAKQLVTQAG 
********** 



IDYSEIDYIN 
IDYSEIDYIN 
IDYSEIDYIN 
IDYSEIDYIN 
IDYSEIDYIN 
IDYSEIDYIN 
IDYSEIDYIN 
IDYSEIDYIN 
IDYSEIDYIN 
IDYSEIDYIN 
IDYSEIDYIN 
********** 



GHGTGTQAND 
GHGTGTQAND 
GHGTGTQAND 
GHGTGTQAND 
GHGTGTQAND 
GHGTGTQAND 
GHGTGTQAND 
GHGTGTQAND 
GHGTGTQAND 
GHGTGTQAND 
GHGTGTQAND 
********** 



300 

KMEKNMYGKF 
KMEKNMYGKF 
KMEKNMYGKF 
KMEKNMYGKF 
KMEKNMYGKF 
KMEKNMYGKF 
KMEKNMYGKF 
KMEKNMYGKF 
KMEKNMYGKF 
KMEKNMYGKF 
KMEKNMYGKF 
********** 



msall8713 .2{361_090] 
msall8713 . 2 ( 361_116 9NT 
msal 1 8 7 13 . 2 { 3 6 1_CJB110 
msall8713.2{361 M781 
msall8713 . 2 { 361_18RS21 ' 
tnsall8713 . 2 { 361_A909 
rasall8713.2{361_COHl 
msall8713 . 2 { 361 JH36B 
msall8713 . 2 (361_JM9130013 
msall8713.2{361 M732 
rasall8713 . 2 {GBS361J2603 
Consensus 



301 

FPTTTLISST 
FPTTTLISST 
FPTTTLISST 
FPTTTLISST 
FPTTTLISST 
FPTTTLISST 
FPTTTLISST 
FPTTTLISST 
FPTTTLISST 
FPTTTLISST 
FPTTTLISST 



KGQTGHTLGA 
KGQTGHTLGA 
KGQTGHTLGA 
KGQTGHTLGA 
KGQTGHTLGA 
KGQTGHTLGA 
KGQTGHTLGA 
KGQTGHTLGA 
KGQTGHTLGA 
KGQTGHTLGA 
KGQTGHTLGA 



AGIIELINCL 
AGIIELINCL 
AGIIELINCL 
AGIIELINCL 
AGIIELINCL 
AGIIELINCL 
AGIIELINCL 
AGIIELINCL 
AGIIELINCL 
AGIIELINCL 
AGIIELINCL 



AAI EEQTVPA 
AAIEEQTVPA 
AAI EEQTVPA 
AAIEEQTVPA 
AAIEEQTVPA 
AAIEEQTVPA 
AAIEEQTVPA 
AAIEEQTVPA 
AAI EEQTVPA 
AAIEEQTVPA 
AAIEEQTVPA 



350 

TKNEIGIEGF 
TKNEIGIEGF 
TKNEIGIEGF 
TKNEIGIEGF 
TKNEIGIEGF 
TKNEIGIEGF 
TKNEIGIEGF 
TKNEIGIEGF 
TKNEIGIEGF 
TKNEIGIEGF 
TKNEIGIEGF 



msall8713 .2{361_090 
msall8713. 2(361 1169NT 
msall8713 . 2 { 361~CJB110 
msall8713 . 2 (361_M781 



351 400 
PENFVYHQKR EYPIRNALNF SFAFGGNNSG iLLSSLDSPL ETLPARBNLK 
PENFVYHQKR EYPIRNALNF SFAFGGNNSG iLLSSLDSPL ETLPARBNLK 
PENFVYHQKR EYPIRNALNF SFAFGGNNSG iLLSSLDSPL ETLPARBNLK 
PENFVYHQKR EYPIRNALNF SFAFGGNNSG iLLSSLDSPL ETLPARBNLK 



1070 



WO 2004/018646 



PCT/US2003/026827 



Table 75: Comparative Sequences relating to SAG0671 



msall8713.2(361_18RS21 
msallS 713.2(36 1_A9Q 9 
meall87l3.2{361_COHl 
msall0713 . 2 { 361_H36B 
msall8713.2{361_JM9130013 
msall8713.2{361_M732 
msall8713 . 2 {GBS361_2603 
Consensus 



PENFVYHQKR 
PENFVYHQKR 
PENFVYHQKR 
PENFVYHQKR 
PENFVYHQKR 
PENFVYHQKR 
PENFVYHQKR 



EYPIRNALNF 
EYPIRNALNF 
EYPIRNALNF 
EYPIRNALNF 
EYPIRNALNF 
EYPIRNALNF 
EYPIRNALNF 



SFAFGGNNSG 
SFAFGGNNSG 
SFAFGGNNSG 
SFAFGGNNSG 
SFAFGGNNSG 
SFAFGGNNSG 
SFAFGGNNSG 



vLLSSLDSPL 
vLLSSLDSPL 
vLLSSLDSPL 
vLLSSLDSPL 
VLLSSLDSPL 
vLLSSLDSPL 
vLLSSLDSPL 



ETLPARENLK 
BTLPARBNLK 
ETLPARENLK 
ETLPARENLK 
ETLPARENLK 
ETLPARENLK 
ETLPARENLK 



msall87X3.2(361 090 
msallB713 . 2 ( 361_1169NT; 
rasal 18 7 13 . 2 { 3 6 1_C JBl 1 0 
msall8713.2{361_M781 
msall8713.2{361_18RS21 
msall8713 . 2{361_A909 
msall8713 .2{361_C0H1 
msall87l3.2{361_H36B 
msall8713 .2{361_JM9130013 
msall8713.2{361_M732 
msall8713«2{GBS361_2603 
Consensus 



401 

MAILSSVASI 
MAILSSVASI 
MAILSSVASI 
MAILSSVASI 
MAILSSVASI. 
MAILSSVASI 
MAILSSVASI 
MAILSSVASI 
MAILSSVASI 
MAILSSVASI 
MAILSSVASI 



SKNESLSITY 
SKNBSLSITY 
SKNESLSITY 
SKNESLSITY 
SKNESLSITY 
SKNESLSITY 
SKNESLSITY 
SKNESLSITY 
SKNBSLSITY 
SKNESLSITY 
SKNESLSITY 



EKVASNFNDF 
EKVASNFNDP 
EKVASNFNDF 
EKVASNFNDF 
EKVASNFNDF 
EKVASNFNDF 
EKVASNFNDF 
EKVASNFNDF 
EKVASNFNDF 
EKVASNFNDF 
EKVASNFNDF 



EALRFKGARP 
EALRFKGARP 
EALRFKGARP 
EALRFKGARP 
EALRFKGARP 
EALRFKGARP 
EALRFKGARP 
EALRFKGARP 
EALRFKGARP 
EALRFKGARP 
EALRFKGARP 



450 

PKTVNPAQFR 
PKTVNPAQFR 
PKTVNPAQFR 
PKTVNPAQFR 
PKTVNPAQFR 
PKTVNPAQFR 
PKTVNPAQFR 
PKTVNPAQFR 
PKTVNPAQFR 
PKTVNPAQFR 
PKTVNPAQFR 



mBall8713.2{361 090 
msall8713 .2{361_1169NT 
msal 18 7 13 . 2 { 3 6 1_CJB110 
msall8713 . 2 {361_M781 
msall8713 ,2{361_18RS21 
msall8713.2{361_A909 
msall87l3 .2{361_COHl 
msall8713.2{361_H36B 
msall8713 ,2{361_JM9130013 
msall8713.2{361_M732 
msa!18713 . 2 {GBS361_2603 
Consensus 



451 

KMDDFSKMVA 
KMDDFSKMVA 
KMDDFSKMVA 
KMDDFSKMVA 
KMDDFSKMVA 
KMDDFSKMVA 
KMDDFSKMVA 
KMDDFSKMVA 
KMDDFSKMVA 
KMDDFSKMVA 
KMDDFSKMVA 



VTTAQALIES 
VTTAQALIES 
VTTAQALIES 
VTTAQALIES 
VTTAQALIES 
VTTAQALIES 
VTTAQALIES 
VTTAQALIES 
VTTAQALIES 
VTTAQALIES 
VTTAQALIES 



NINLKKQDTS 
NINLKKQDTS 
NINLKKQDTS 
NINLKKQDTS 
NINLKKQDTS 
NINLKKQDTS 
NINLKKQDTS 
NINLKKQDTS 
NINLKKQDTS 
NINLKKQDTS 
NINLKKQDTS 



KVGIVFTTLS 
KVGIVFTTLS 
KVGI VFTTL S 
KVGIVFTTLS 
KVGIVFTTLS 
KVGIVFTTLS 
KVGIVFTTLS 
KVGIVFTTLS 
KVGI VFTTL S 
KVGIVFTTLS 
KVGIVFTTLS 



500 

GPVEWEGIE 
GPVEWEGIE 
GPVEWEGIE 
GPVEWEGIE 
GPVEWEGIE 
GPVEWEGIE 
GPVEWEGIE 
GPVEWEGIE 
GPVEWEGIE 
GPVEWEGIE 
GPVEWEGIE 



msall8713.2{361_090 
rasallB713.2(361_1169NT| 
msall8713.2{361 CJBllo' 
rasall8713 . 2 {3?1_M781 
msall8713.2{361_18RS21 
msall8713.2(361_A909 
msall8713.2{361_COHl 
msal 1 8 7 13 . 2 { 3 6 1_H3 6B 
msall8713.2{361_JM9130013 
msall8713 .2{361_M732 
msall8713 .2{GBS361_2603 
Consensus 



501 

KQITTBGYAH 
KQITTEGYAH 
KQITTBGYAH 
KQITTEGYAH 
KQITTEGYAH 
KQITTEGYAH 
KQITTEGYAH 
KQITTEGYAH 
KQITTEGYAH 
KQITTEGYAH 
KQITTEGYAH 



VSASRFPFTV 
VSASRFPFTV 
VSASRFPFTV 
VSASRFPFTV 
VSASRFPFTV 
VSASRFPFTV 
VSASRFPFTV 
VSASRFPFTV 
VSASRFPFTV 
VSASRFPFTV 
VSASRFPFTV 



MNAAAGMLSI 
MNAAAGMLSI 
MNAAAGMLSI 
MNAAAGMLSI 
MNAAAGMLSI 
MNAAAGMLSI 
MNAAAGMLSI 
MNAAAGMLSI 
MNAAAGMLSI 
MNAAAGMLSI 
MNAAAGMLSI 



IFKITGPLSV 
IFKITGPLSV 
IFKITGPLSV 
IFKITGPLSV 
IFKITGPLSV 
IFKITGPLSV 
IFKITGPLSV 
IFKITGPLSV 
IFKITGPLSV 
IFKITGPLSV 
IFKITGPLSV 



550 

ISTNSGALDG 
ISTNSGALDG 
ISTNSGALDG 
ISTNSGALDG 
ISTNSGALDG 
ISTNSGALDG 
ISTNSGALDG 
ISTNSGALDG 
ISTNSGALDG 
ISTNSGALDG 
ISTNSGALDG 



msall8713.2{361 090 
msal 18 7 13 . 2 { 3 6 1 JL169NT 
msall8713 . 2 { 361_CJB110 
msall8713 .2{361_M781 
msall8713 .2{361_18RS21 
msal 187 13 . 2 f 3 61__A9 0 9 
msall8713.2(361 COH1 
msall8713 . 2 { 36l"*H36B 
msall8713 . 2 {361_JM9 130013 
maall8713.2{361_M732 
rasall8713 ,2{GBS361_2603 
Consensus 



551 

IQYAKBMMRN 
IQYAKEMMRN 
IQYAKBMMRN 
IQYAKEMMRN 
IQYAKEMMRN 
IQYAKEMMRN 
IQYAKEMMRN 
IQYAKEMMRN 
IQYAKBMMRN 
IQYAKEMMRN 
IQYAKEMMRN 



DNLDYVILVS 
DNLDYVILVS 
DNLDYVILVS 
DNLDYVILVS 
DNLDYVILVS 
DNLDYVILVS 
DNLDYVILVS 
DNLDYVILVS 
DNLDYVILVS 
DNLDYVILVS 
DNLDYVILVS 



ANQWTDMSFM 
ANQWTDMSFM 
ANQWTDMSFM 
ANQWTDMSFM 
ANQWTDMSFM 
ANQWTDMSFM 
ANQWTDMSFM 
ANQWTDMSFM 
ANQWTDMSFM 
ANQWTDMSFM 
ANQWTDMSFM 



WWQQLNYDSQ 
WWQQLNYDSQ 
WWQQLNYDSQ 
WWQQLNYDSQ 
WWQQLNYDSQ 
WWQQLNYDSQ 
WWQQLNYDSQ 
WWQQLNYDSQ 
WWQQLNYDSQ 
WWQQLNYDSQ 
WWQQLNYDSQ 



600 

MFVGSDYCSA 
MFVGSDYCSA 
MFVGSDYCSA 
MFVGSDYCSA 
MFVGSDYCSA 
MFVGSDYCSA 
MFVGSDYCSA 
MFVGSDYCSA 
MFVGSDYCSA 
MFVGSDYCSA 
MFVGSDYCSA 



msall8713.2{361 090] 
msall8713.2{361_1169NT 
msall8713 .2{361_CJB110' 
msall8713.2{361 M781* 
rasall8713 . 2 { 361_18RS21 
msall8713. 2(361 A909 
mBall8713 . 2 i 36l""COHl 
msall8713 .2{361_H36B 
msall8713.2{361 JM9130013 
msall8713.2{361 M732 
msall8713 . 2 {GBS361_2 603 
Consensus 



601 

QVLSRQALDN 
QVLSRQALDN 
QVLSRQALDN 
QVLSRQALDN 
QVLSRQALDN 
QVLSRQALDN 
QVLSRQALDN 
QVLSRQALDN 
QVLSRQALDN 
QVLSRQALDN 
QVLSRQALDN 



SPIILGSKQL 
SPIILGSKQL 
SPIILGSKQL 
SPIILGSKQL 
SPIILGSKQL 
SPIILGSKQL 
SPIILGSKQL 
SPIILGSKQL 
SPIILGSKQL 
SPIILGSKQL 
SPIILGSKQL 



KYSHKTFTDV 
KYSHKTFTDV 
KYSHKTFTDV 
KYSHKTFTDV 
KYSHKTFTDV 
KYSHKTFTDV 
KYSHKTFTDV 
KYSHKTFTDV 
KYSHKTFTDV 
KYSHKTFTDV 
KYSHKTFTDV 



MTIFDAALQN 
MTIFDAALQN 
MTIFDAALQN 
MTIFDAALQN 
MTIFDAALQN 
MTIFDAALQN 
MTIFDAALQN 
MTIFDAALQN 
MTIFDAALQN 
MTIFDAALQN 
MTIFDAALQN 



650 

LLSDLGLTIK 
LLSDLGLTIK 
LLSDLGLTIK 
LLSDLGLTIK 
LLSDLGLTIK 
LLSDLGLTIK 
LLSDLGLTIK 
LLSDLGLTIK 
LLSDLGLTIK 
LLSDLGLTIK 
LLSDLGLTIK 



msall8713. 2 { 361_090} 
msall8713 . 2 { 361_1169NT) 
msall8713.2{361 CJBU0) 



651 700 
DIKGFVWNER KKAVSSDYDF LANLSBYYNM PNLASGQFGF SSNGAGEELD 
DIKGFVWNER KKAVSSDYDF LANLSBYYNM PNLASGQFGF SSNGAGEELD 
DIKGFVWNER KKAVSSDYDF LANLSBYYNM PNLASGQFGF SSNGAGEELD 
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msall8713.2{361 M781 
msail8713 .2 {361_18RS21 
ltlflall8713.2{361_A909 
msall8713 . 2 {361_COHl 
msall8713.2{361_H36B 
msall8713.2{3€l JM9130O13 
msall8713.2{361_M732 
msall8713 . 2 {GBS361_2603 
Consensus 



DIKGFVWNER 
DIKGFVWNER 
DIKGFVWNER 
DIKGFVWNER 
DIKGFVWNER 
DIKGFVWNER 
DIKGFVWNER 
DIKGFVWNER 



KKAVSSDYDF 
KKAVSSDYDF 
KKAVSSDYDF 
KKAVSSDYDF 
KKAVSSDYDF 
KKAVSSDYDF 
KKAVSSDYDF 
KKAVSSDYDF 



LANLSEYYNM 
LANLSEYYNM 
LANLSEYYNM 
LANLSEYYNM 
LANLSEYYNM 
LANLSEYYNM 
LANLSEYYNM 
LANLSEYYNM 



PNLASGQFGF 
PNLASGQFGF 
PNLASGQFGF 
PNLASGQFGF 
PNLASGQFGF 
PNLASGQFGF 
PNLASGQFGF 
PNLASGQFGF 



SSNGAGEELD 
SSNGAGEELD 
SSNGAGEELD 
SSNGAGEELD 
SSNGAGEELD 
SSNGAGEELD 
SSNGAGEELD 



msall8713 . 2 {361_090 
msall8713.2{361_1169NT' 
msall8713 . 2 { 361_C0B110 
msall8713 ,2{361_M781 
msallS 7 13 . 2 { 3 6 1_1 8RS2 1 
msall8713.2(361_A909 
msall8713.2<361jCOHl 
msall8713 .2{361_H36B 
msall8713.2{361jJM913G013 
msall8713 . 2 {361_M732 
msaX18713 . 2 {GBS36 1_2603 
Consensus 



701 

YTVNESIEKG 
YTVNESIEKG 
YTVNESIEKG 
YTVNESIEKG 
YTVNESIEKG 
YTVNESIEKG 
YTVNESIEKG 
YTVNESIEKG 
YTVNESIEKG 
YTVNESIEKG 
YTVNESIEKG 



YYLVLSYSIF 
YYLVLSYSIF 
YYLVLSYSIF 
YYLVLSYSIF 
YYLVLSYSIF 
YYLVLSYSIF 
YYLVLSYSIF 
YYLVLSYSIF 
YYLVLSYSIF 
YYLVLSYSIF 
YYLVLSYSIF 



731 

GGISFAIIEK R 
GGISFAIIEK R 
GGISFAIIEK R 
GGISFAIIEK R 
GGISFAIIEK R 
GGISFAIIEK R 
GGISFAIIEK R 
GGISFAIIEK R 
GGISFAIIEK R 
GGISFAIIEK R 
GGISFAIIEK R 
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SEQ ID NO. 7601 
STRAIN 2603 

ATGAAAAAAGTCATCGATTTAAAAAAACTACAAAAAGCATA^ 

AATAATATTAATTTGGAGGTGTTTAAAGGCGAAATAATTC 

GCAGGGAAATCTACCTTGATTAAAACTATGCT 

GCTCTTGTTCTTGATACTCAAATGCCAG^ 

GCTCAATCTGATGCCTTATAOSJ^n'CTTTAACrrGGOT 

AAAATGAAAGGTATTCAAAAAACTGAATTAAAAC^ 

GTAGATCTAGAAAAO^CITGATAAATTTGTCTCA^ 

CGGCTTTCTCTAGCCATCGCCCTACrTGGAAACCCX^CAGTTT^ 

ACGGTTGGAATTGATCCATCCTTGAGGAGAAAA^ 

GATGAAGGACATTCTATCTTTATTACAACCCACGTTATGGAT^ 

AAGGTTGCACTACTATTACGTGGAAACATTATTGCCI^^ 

AAACAATTTAATGTGAGTACTATTGAGGAAGTTTT CTGAAGGAGAA 

SEQ ID NO. 7602 
STRAIN 090 

ATTTAAAAAAACTACAAAAAGCATATGCCTCAGAAACTC 

ATTAATTTGGAGGTGTTTAAAGGCGAAATAATTGGATTAATAGGACCCT 

TGGAGCAGGGAAATCTACCTTGAT/TAAAACTATCCTT^ 

CAGATAAGGGAAC^GCTC1"1WU'C"1U^TACTCAAATGCCAGATCGTAAT 

ATTTTAAATCAAATTGGCTATATGGCTCA^ 

TTTAACTG CCTTAGAAaATTTATTATTCTTTGGAAAAATGAAAGGTATTC 

AAAAAACTGAATTAAAACAGCAGATAACTCATATTTcTAAAGTAGTAGAT 

CTAGAAAACCAACITGATAAATTTGTCrCAGGTTACrC^GGA 

AAGAOMCTTTCTCTAGCCATCGCCCTACTTGGAAACCCC^ 

TCCTAGATGAACCTACCGTTGGAATTGATCCATCCITGAa 

TGGCAAGAG CTAATTAATATTAaGGATGAAGGACGTTCrATCTTTATTAC 

AACCCACGTTATGGATGAAGCAGAATTAACAAGTAAGGTTGCACrACT 

TACGTGGAAACATTATTGCCTTTGATACTCCATTAC^ 

TTTAATGTGAGTACTATtGAGGAAGTTTTCTTAAAAGCTGAAGGAGAA 

SEQ ID NO. 7603 
STRAIN A909 

AAAAAAGTCATCGATTTAAAAAAACTACAAAAAG CATATGCCTCA 

GAAACCGTTTTAAATAATATTAATTTGGAGGTGTTTAAAGGCGAAATA 

TGGATTAATAGGACCCrrCTGGAGCAGGGAAATCTACCTTG 

CAAATGC CAGAT CATAATATTTTAAAT CAAATTG G CTATATGG CTCAATC 
TGATGCCTTATACGAGTCrrrAACT^ 

GAAAAATGAAAGGTATTCAAAAAACTGAATTAAAACAGCAGATAACTCAT 

ATTTCTAAAGTAGTAGATCTAGAAAACC^CTTGATA 

TTACTCAGGAGGTATGAAAAGAOGGCTTTCTCTAGCCATCX^ 

GAAACCCCACAGTTTTAATCCTAGATGAACCTACCGTTC 

TCCTTGAGG AGAAAAAT CTGG CAAGAG C!T AATTAATATTAAGGATGAAGG 

AOOTCTATCTITATTACAACCCACGTTATGGATGAAGCAGAATTAACAA 

GTAAGGTTCCACTACTATTACG?IGGAAAC^ 

TTACATTTAAAAAAACAATTTAATGTGAGTACTATTGAGGA 

AAAAG CTGAAGGAGAA 

SEQ ID NO. 7604 
STRAIN H36B 

AAAAAAGTCATTGATTTAAAAAAACTACAAAAAGCATATGCC 
TCAGAAACX^GITTT AAATAATATT AATTTGGAGGTGTTTAAAG^ CGAAAT 
AATTGGATTAATAGGACCCTCTGGAGC1AGGGAAATCTACCITGATTAAAA 
CTATG CTTGGCATGGAAAAAGCAGAl^AGGGAaCAGCTCTTC^ 
ACTCAAATGCCAGATCX^AATATT^T!AAATCAAATTGG 
ATCTGATGCCTTATAOGAGTCTTTAACTGGCTTAGAA^ 
TTGGAAAAATGAAAGGTATTCAAAAAACTGAATTAAAACAGCAGATAACT 
CATATTTCTAAAGTAGTAGATCTrAGAAAACCAAC^ 

AGGTTACTCAGGAGGTATGAAAAGACGGGTTTCTCTAGCCATCGCCCTAC 

TTGGAAACCCCACAGTTTTAATCCTAGATGAACCT 

CCATCCTTGAGGAGAAAAATCTGGCAAGAGCTAATTAATAT^ 

AGGACGTTCTATCTTTATTACAACCCAOTTTATGGATG 

CAAGT AAGGTTG CACTACT ATTACGTGGAAACATTATTG CCTTTGATACT 

CCATTACATTTAAAAAAACAATTTAATX3TGAGTACT 

CTTAAAAGCTGAAGGAGAA 

SEQ ZD NO. 7605 
STRAIN 18RS21 

GATTTAAAAAAACTACAAAAAGCATATGCCTC^GAAACCXSTTTTAAATAA 

TATTAATTTGGAGGTGTTTAAAGGCGAAATAATTGGATTAA 

CTGGAGCAGGGAAATCTACcTTGATTAAAACTATGCTTGGCATG^ 

GCAGATAAGGGAACAGCTCTTGTTCTTGATACKIAAATGC CGTAA 

TATTTTAAATCAAATTGGCTATATGGCTCAATcTGATC 

L'ri7'AACTIXyjCTTAGAAAATTrATTAl"lVrriGGAAAAATGAAAG 

CAAAAAACTCAATTAAAACAGCAGATAACTCATATTTCTAAAGTAGTAGA 

TCTAGAAAACCAACITGATAAATTTGTCTCAGGTTAC^ 

AAAGACXKKrrTTCTcTAGCCATOGCCCTACTTG^ 

ATCCTAGATGAACCTACXX3TTGGAATTGAT 

CTGGCAAGAG CTAATTAAT ATTAaGGATGAAGGACATTCTATCTTTATTA 
auVCCXAOGTTATGGATGAAGCAGAATTAACAAG^ 
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TTACGTCXaUVACATTATTGCCTTTGATACT^ 
ATTTAATGTGAGTACTATTGAGGAAGTTTTCTTAAAAGC^ 

SEQ ZD NO. 7606 
STRAIN M732 

AAAAAAGTCATCGATTTAAAAAAACTACAAAAAGCATACX3CCT^ 
GAAACTGTTTTAAATAATATTAATTTGGAGGTGTT^ 
TGGATTAATAGGACCCTCTGGAGCAGGGAAATCTACX^^ 
TGCTTGGCATGGAAAAAGCAGATAAGGGAAC^ 

CAAATGCCAGAT(^TAATATTTTAAATa\AATTGG CT ATATGGCTCAATC 

TGATGCCTTACACGAGTCTTTAACTGG CTTAGAAAATTTATTATTCTTTG 

GAAAAATGAAAGGTATTC^UVAAACTGAATTAAAACAGCAGATAACTCAT 

ATTTCTAAAGTAGTAGATCTAGAAAACCMCTTGATAAATTTGTCTCAGG 

TTACTCAGGAGGTATGAAAAGACGGCTTTCnrrAGCCAT^ 

GAAACCCCACAGTTTTAATCCTAGATGAACCTACCGTTGGAATTGA^ 

TCCITGAGGAGAAAAATCTGGCAAGAGCTAATTAATATIAAGG^ 

ACGTTCTATCTTTATTACAACCCACGTTATGGATGAAG 

GTAAGGTTGCACrACrrATTACGTGGAAACArrATTGCCTTTGATACT 

TTACATTTAAAAAAACAATTTAATGTGAGTACrrATTGAGGAAG'r 

AAAAGCTGAAGGAGAA 

SEQ XD NO. 7607 
STRAIN COH1 

AAAAAAGTCATO^TTTAAAAAAACTACAAAAAGCATACGCCTCAGAA 

ACTGTTTTAAATAATATTAATTTGGAGG 

ATTAATAGGACCCTCTGGAGCAGGGAAATCTACCTTGATTAA 

TTGGCATGGAAAAAGCAGATAAGGGAACAGCTCrTGTTCTTG^ 

ATGCCAGATCGTAATATTTTAAATCAAATTGG CTATATGGCTCAATCTGA 

TGCCTTACACGAGTC1TTAACTGGCTTAG 

AAATGAAAGGTATTC1AAAAAACTGAATTAAAACAG CAGATAACTCATATT 

TCTAAAGTAGTAGATCTTAGAAAACCAACTTGATAAATTTGTCT 

CTCAGGAG GTATGA AAAGACGGCTTTCTCTAGCCATCGCCCrA 

ACCXSCACAGTITTAATCCTAGATGAACCTACCXtTTGGAA 

TTGAGGAGAAAAATCTGGCAAGAGCTAATTAATATTAAGGATGAAGGACG 

TTCTATCITTATTACAACCCACGTTATGGATGAAG CAGAATTAACAAGTA 

AGGTTGCACTACTATTACGTGGAAACA1TATTGCCTTTGATACT 

CATTTAAAAAAACAATITAATGTGAGTACTATTGAGGAAG 

SEQ XD NO. 7608 
STRAIN M781 

AAAAAAGTCATCGATTTAAAAAAACTACAAAAAGCATAC 

GCCTCAGAAACTGTTTTAAATAATATTAATTTGGAGGTGTTTA 

AATAATTGGATTAATAGGACCCTCTGGAGCAGGGAAATCrACCTT^ 

AAACTATGCTTGGCATGGAAAAAGCAGATAAGGGAACAGCT^ 

GATACTCAAATGCCAGATCGTAATA'iuu-rAAATCAAATTGGCTATATGGC 

TCAATCICATGCCTTACACGAGTCTITAACTO 

TCTTTGGAAAAATGAAAGGTATTCAAAAAACTCAATTAAA 

ACTCATATITCrAAAGTAGTAGATCTAGAAAACCAACTTGATAAATTTGT 

CTCAGGTTACTCAGGAGGTATGAAAAGACGGCTTTCTCT 

TACTTGGAAACCCCACAGTTTTAATO^AG^ 

GATCCATCCTTGAGGAGAAAAATCTGGCAAGAGCTAATTAATATTAA 

TCAAGGACXnrrCTATCTTTATTACAACCCACGTTATGGAT^ 

TAACAAGTAAGGTTGCACTACTATTACGTG 

ACTCCATTACATTrAAAAAAACAATTTAATGTGAGTACTATTGAGGAAGT 
TTTCTTAAAAGCTGAAGGAGAA 

SEQ XD NO. 7609 
STRAIN CJB 110 

AAAAAAGTCATCGATTTAAAAAAACTACAAAAAGCATATG 

CCTCAGAAACTGTTTTAAATAATATTAATTTGGAGGTGTT^ 

ATAATTGGATTAATAGGACCCTCTGGAGCAGGGAAATCTACCTTGATTAA 

AACTATGCTTGGCATGGAAAAAGCAGATAAGGGAACAGCTLU'l^lU-Cl'lXS 

ATACTCAAATGCCAGATOGTAATATTTTAAATCAAATTGGCT 

CAATCTGATGCCTTATACGAATCTTTAACTGCCTTAGAAAAT^ 

CTTTGGAAAAATGAAAGGTATTCAAAAAACTGAATTAAAACAGCAGATAA. 

CTCATATTTCTAAAGTAGTAGATCTAGAAAACCAACTTGATAAATTT^ 

TCAGGTTACTCAGGAGGTATGAAAAGACGGCrTTCrn^ 

ACTrGGAAACCCCACAGU'lU'rAATCCTAGATGAACCTACCGTTGGAATTG 

ATCCATCCTTGAGGAGAAAAATCrGGCAAGAGCTAATTAATATTAAGGAT 

GAAGGACGTT CTATCTTTATTACAACX:CAa3T7rATGGATGAA GCAQA ATT 

AACAACTAAGGTTGCACTACTATTACXnXSGAAACM 

CTCCATTACATTTAAAAAAACAATTTAATGTGAGTACTATO 

TTCTT AAAAGCTGAAGGAGAA 

SEQ XD NO. 7610 
STRAIN 1169NT 

AAAAAAGTCATCGATTTAAAAAAACTACAAAAAG CAT AC 

GCCTCAGAAACTGTTTTAAATAATATTAATT^ 

AATAATTGGATTAATAGGACCCTCTGGAGCAG 

AAACTATGCTTGGCATGGAAAAAG CAJGATAAGGGAACAGCTCTTGTTCTT 

GATACTCAAATCCCAGATCCTAA TATTT TAAA 

TCAATCTGATG CCTTATAC<3AATCTTTAACTGCCrr^ 
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TCTTTGGAAAAATGAAAGGTATTCAAAAAACIGAATT^ 

ACTCATATTTCTAAAGTAGTAGATCTAGAAAACCAACTTC 

CTCAGGTTACrCAGGAGGTATGAAAAGACGGCTTTCrCTAGCC^ 

TACITGGAAACCCCACAGTTTTAATCCTAGATGAACCT^ 

GATCCATCXTTTGAGGAQAAAAATCTGGCAAGAGCTAATTAATAT^ 

TGAAGGACGTTCTATCTTTATTACAACCCAC^ CAGAAT 

TAACAAGTAAGGTTG CACTACTATTACGTGGAAACATTATTG C CTTTGAT 

ACTCCATTACATTTAAAAAAAC^TITAATGTGAGTACTATTGAGGAAGT 

TTTCTTAAAAGCTGAAGGAGAA 

SEQ ID HO. 7611 
STRAIN JM9 130013 

AAAAAAGTCATCGATTTAAAAAAACTACAAAAAGCATATGCC 

TCAGAAACCXSTITTAAATAATATTAATTTGGAGGTGTTTAA^ 

AATTGGATrAATAGGACCCTCTGGAGCAGGGAAATCTACCTTGATTAAAA 

CTATGCTTGGCATGGAAAAAGCAGATAAGGGAACAGCT 

ACTCAAATGCCAGATCGTAATATTTTAAATCAAATTGGCT 

ATCTGATGCCTTATACGAGTCTTTAACTGG CTTAGAAAATTTATTATTCT 

1TGGAAAAATGAAAGGTATTCAAAAAACTGAATTAAAACAGCAGATAACT 

CATATTTCTAAAGTAGTAGATCTAGAAAACCAACTTGATA 

AGGTTACTCAGGAGGTATGAAAAGACGGLri-i"iCTCTAGCCAT 

!TGGAAACXrCCACAGi"i"i"iAATCCTAGATGAACCTACCGTT^ 

CCATCCTTGAGGAGAAAAATCTGGCAAGAGCTAATTA 

AGGACGTTCTATCTTTATTACAACCCACGTTAT 

CAAOTAAGGTTGGACTACTATTACGTGGAAACATTATTGCCT 

CCATTACATTTAAAAAAACAATTTAATGTGAGTACTATTGA^ 

CTTAAAAGCTGAAGGAGAA 



PRETTY Oft /biotinp/msal34270.2{*} April 10, 2003 02:14 



msal34270 . 2 f 3 91_C0H1 J aaaaaag 

msal34270. 2{39l_M732> aaaaaag 

msal34270.2{391_M7Bl} ---aaaaaag 

msal34270 . 2 {391_090} 

rosal34270. 2(391 CJB110) aaaaaag 

msal34270 . 2(391~1169NTj 
rasal34270.2{391_18RS21} 
msal34270 . 2 { 391J2603 } 
msal342 7 0 . 2 { 3 9 1_A9 0 9 J 
rasal34270.2{391_JM9130013} 
msal34270 . 2 { 391_H36B) 

Consensus ***- 



atgaaaaaag 
—aaaaaag 
—aaaaaag 



tcatcgATTT 
tcatcgATTT 
tcatcgATTT 

ATTT 

tcatcgATTT 
tcatcgATTT 

gATTT 

tcatcgATTT 
tcatcgATTT 
tcatcgATTT 
tcattgATTT 



AAAAAAACTA 
AAAAAAACTA 
AAAAAAACTA 
AAAAAAACTA 
AAAAAAACTA 
AAAAAAACTA 
AAAAAAACTA 
AAAAAAACTA 
AAAAAAACTA 
AAAAAAACTA 
AAAAAAACTA 



CAAAAAGCAT 
CAAAAAGCAT 
CAAAAAGCAT 
CAAAAAGCAT 
CAAAAAGCAT 
CAAAAAGCAT 
CAAAAAGCAT 
CAAAAAGCAT 
CAAAAAGCAT 
CAAAAAGCAT 
CAAAAAGCAT 



50 

AcGCCTCAGA 
AcGCCTCAGA 
AcGCCTCAGA 
AtGCCTCAGA 
AtGCCTCAGA 
ACGCCTCAGA 
AtGCCTCAGA 
AtGCCTCAGA 
AtGCCTCAGA 
AtGCCTCAGA 
AtGCCTCAGA 



msal34270.2{391 COH1 
msal34270 . 2 { 391~M732 
msal34270 . 2 { 391_M781 
msal34270 . 2 { 3 91__090 
rasal34270.2{391_CJB110 
msal34270.2{391_JL169NT 
msal34270.2{391_18RS21 
Itisal34270.2{391_2603 
tnsal34270.2{391_A909 
msal34270.2{391_JM9130013 
msal34270 . 2 { 391_H36B 
Consensus 



51 

AACtGTTTTA 
AACtGTTTTA 
AACtGTTTTA 
AACtGTTTTA 
AACtGTTTTA 
AACtGTTTTA 
AACcGTTTTA 
AACCGTTTTA 
AACCGTTTTA 
AACcGTTTTA 
AACCGTTTTA 



AATAATATTA 
AATAATATTA 
AATAATATTA 
AATAATATTA 
AATAATATTA 
AATAATATTA 
AATAATATTA 
AATAATATTA 
AATAATATTA 
AATAATATTA 
AATAATATTA 



ATTTGGAGGT 
ATTTGGAGGT 
ATTTGGAGGT 
ATTTGGAGGT 
ATTTGGAGGT 
ATTTGGAGGT 
ATTTGGAGGT 
ATTTGGAGGT 
ATTTGGAGGT 
ATTTGGAGGT 
ATTTGGAGGT 



GTTTAAAGGa 
GTTTAAAGGa 
GTTTAAAGGa 
GTTTAAAGGc 
GTTTAAAGGc 
GTTTAAAGGc 
GTTTAAAGGc 
GTTTAAAGGc 
GTTTAAAGGc 
GTTTAAAGGc 
GTTTAAAGGc 
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GAAATAATTG 
GAAATAATTG 
GAAATAATTG 
GAAATAATTG 
GAAATAATTG 
GAAATAATTG 
GAAATAATTG 
GAAATAATTG 
GAAATAATTG 
GAAATAATTG 
GAAATAATTG 



msal34270 . 2 ( 391_C0H1 
msal34270.2(391_M732' 
msal34270.2{391_M781 
rasal34270.2{391_090 
msal34270.2{391_CJB110 
msal34270.2f391_1169NT 
msal34270 . 2 { 391_18RS21 
msal34270 . 2 f 391_2603 
msal34270 . 2 { 391_A909 
msal34270.2{391_JM9130013 
msal34270 . 2 {391_H36B 
Consensus 
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GATTAATAGG 
GATTAATAGG 
GATTAATAGG 
GATTAATAGG 
GATTAATAGG 
GATTAATAGG 
GATTAATAGG 
GATTAATAGG 
GATTAATAGG 
GATTAATAGG 
GATTAATAGG 



ACCCTCTGGA 
ACCCTCTGGA 
ACCCTCTGGA 
ACCCTCTGGA 
ACCCTCTGGA 
ACCCTCTGGA 
ACCCTCTGGA 
ACCCTCTGGA 
ACCCTCTGGA 
ACCCTCTGGA 
ACCCTCTGGA 



GCAGGGAAAT 
GCAGGGAAAT 
GCAGGGAAAT 
GCAGGGAAAT 
GCAGGGAAAT 
GCAGGGAAAT 
GCAGGGAAAT 
GCAGGGAAAT 
GCAGGGAAAT 
GCAGGGAAAT 
GCAGGGAAAT 



CTACCTTGAT 
CTACCTTGAT 
CTACCTTGAT 
CTACCTTGAT 
CTACCTTGAT 
CTACCTTGAT 
CTACCTTGAT 
CTACCTTGAT 
CTACCTTGAT 
CTACCTTGAT 
CTACCTTGAT 



150 

TAAAACTATG 
TAAAACTATG 
TAAAACTATG 
TAAAACTATG 
TAAAACTATG 
TAAAACTATG 
TAAAACTATG 
TAAAACTATG 
TAAAACTATG 
TAAAACTATG 
TAAAACTATG 



msal34270 . 2 { 391_C0H1 
msal34270 . 2 (391_M732 
rasal34270.2{391_M781 
msal34270.2{391 090 
msal34270.2(391_CJB110 
rasal34270. 2(391 1169NT 
msal34270.2{391 18RS21 
msal34270 . 2 ( 391_2603 
msa!34270. 2(391 A909 



151 

CTTGGCATGG 
CTTGGCATGG 
CTTGGCATGG 
CTTGGCATGG 
CTTGGCATGG 
CTTGGCATGG 
CTTGGCATGG 
CTTGGCATGG 
CTTGGCATGG 



AAAAAGCAGA 
AAAAAGCAGA 
AAAAAGCAGA 
AAAAAGCAGA 
AAAAAGCAGA 
AAAAAGCAGA 
AAAAAGCAGA 
AAAAAGCAGA 
AAAAAGCAGA 



TAAGGGAACA 
TAAGGGAACA 
TAAGGGAACA 
TAAGGGAACA 
TAAGGGAACA 
TAAGGGAACA 
TAAGGGAACA 
TAAGGGAACA 
TAAGGGAACA 



GCTCTTGTTC 
GCTCTTGTTC 
GCTCTTGTTC 
GCTCTTGTTC 
GCTCTTGTTC 
GCTCTTGTTC 
GCTCTTGTTC 
GCTCTTGTTC 
GCTCTTGTTC 



200 

TTGATACTCA 
TTGATACTCA 
TTGATACTCA 
TTGATACTCA 
TTGATACTCA 
TTGATACTCA 
TTGATACTCA 
TTGATACTCA 
TTGATACTCA 
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rasal34270.2{391_JM9130013} 
msal34270.2{391_H36B} 
Consensus 



CTTGGCATGG AAAAAGCAGA TAAGGGAACA GCTCTTGTTC TTGATACTCA 
CTTGGCATGG AAAAAGCAGA TAAGGGAACA GCTCTTGTTC TTGATACTCA 



msaX34270 . 2 (391_C0H1 
msal34270 . 2 { 391_M732 
msal34270 . 2 (391J4781 
msal34270. 2 {391JJ90 
msal34270 . 2 { 391_CJB110 
msal34270 . 2 { 391_1169NT 
msal34270.2{391 18RS21 
maal34270. 2(391 2603 
msal34270.2(391~A909 
msal34270-2{391_JM9130013 
rasal34270.2{391_H36B 
Consensus 



201 

AATGCCAGAT 
AATGCCAGAT 
AATGCCAGAT 
AATGCCAGAT 
AATGCCAGAT 
AATGCCAGAT 
AATGCCAGAT 
AATGCCAGAT 
AATGCCAGAT 
AATGCCAGAT 
AATGCCAGAT 



CgTAATATTT 
CgTAATATTT 
CgTAATATTT 
CgTAATATTT 
CgTAATATTT 
CgTAATATTT 
CgTAATATTT 
CgTAATATTT 
CaTAATATTT 
CgTAATATTT 
CgTAATATTT 



TAAATCAAAT 
TAAATCAAAT 
TAAATCAAAT 
TAAATCAAAT 
TAAATCAAAT 
TAAATCAAAT 
TAAATCAAAT 
TAAATCAAAT 
TAAATCAAAT 
TAAATCAAAT 
TAAATCAAAT 



TGGCTATATG 
TGGCTATATG 
TGGCTATATG 
TGGCTATATG 
TGGCTATATG 
TGGCTATATG 
TGGCTATATG 
TGGCTATATG 
TGGCTATATG 
TGGCTATATG 
TGGCTATATG 



250 

GCTCAATCTG 
GCTCAATCTG 
GCTCAATCTG 
GCTCAATCTG 
GCTCAATCTG 
GCTCAATCTG 
GCTCAATCTG 
GCTCAATCTG 
GCTCAATCTG 
GCTCAATCTG 
GCTCAATCTG 



0tsal3 4270.2(39 l_COHl 
msal34270.2(391_M732 
maal34270.2{391_M781 
msal34270.2{391_090 
msa!34270 . 2 (391_CJB110 
msal34270.2(391_1169NT 
msal34270 . 2 { 391_18RS21 
tnsal34270 . 2( 391J2603 
msal34270.2{391_A909 
msal34270.2{391 JM9130013 
msal34270 . 2 { 391_H36B 
Consensus 



251 

ATGCCTTAcA 
ATGCCTTAcA 
ATGCCTTAcA 
ATGCCTTAtA 
ATGCCTTAtA 
ATGCCTTAtA 
ATGCCTTAtA 
ATGCCTTAtA 
ATGCCTTAtA 
ATGCCTTAtA 
ATGCCTTAtA 



CGAgTCTTTA 
CGAgTCTTTA 
CGAgTCTTTA 
CGAaTCTTTA 
CGAaTCTTTA 
CGAaTCTTTA 
CGAgTCTTTA 
CGAgTCTTTA 
CGAgTCTTTA 
CGAgTCTTTA 
CGAgTCTTTA 



ACTGgCTTAG 
ACTGgCTTAG 
ACTGgCTTAG 
ACTGgCTTAG 
ACTGcCTTAG 
ACTGcCTTAG 
ACTGgCTTAG 
ACTGgCTTAG 
ACTGgCTTAG 
ACTGgCTTAG 
ACTGgCTTAG 



AAAATTTATT 
AAAATTTATT 
AAAATTTATT 
AAAATTTATT 
AAAATTTATT 
AAAATTTATT 
AAAATTTATT 
AAAATTTATT 
AAAATTTATT 
AAAATTTATT 
AAAATTTATT 



300 

ATTCTTTGGA 
ATTCTTTGGA 
ATTCTTTGGA 
ATTCTTTGGA 
ATTCTTTGGA 
ATTCTTTGGA 
ATTCTTTGGA 
ATTCTTTGGA 
ATTCTTTGGA 
ATTCTTTGGA 
ATTCTTTGGA 



msal34270 . 2 { 391_C0H1 
msal34270 . 2 { 391_M732 
msal34270 . 2 { 391_M781 
msal34270 . 2 {391_090 
msal34270 . 2 f 391_CJB110 
msal34270 . 2 { 391_1169NT 
msal34270 . 2 { 391_18RS21 
rasal34270.2{391_2603 
msal34270 . 2 { 391_A909 ) 
msal34270.2{391_JM9130013 
msal34270 . 2{391_H36B 
Consensus 



301 

AAAATGAAAG 
AAAATGAAAG 
AAAATGAAAG 
AAAATGAAAG 
AAAATGAAAG 
AAAATGAAAG 
AAAATGAAAG 
AAAATGAAAG 
AAAATGAAAG 
AAAATGAAAG 
AAAATGAAAG 



GTATTCAAAA 
GTATTCAAAA 
GTATTCAAAA 
GTATTCAAAA 
GTATTCAAAA 
GTATTCAAAA 
GTATTCAAAA 
GTATTCAAAA 
GTATTCAAAA 
GTATTCAAAA 
GTATTCAAAA 



AACTGAATTA 
AACTGAATTA 
AACTGAATTA 
AACTGAATTA 
AACTGAATTA 
AACTGAATTA 
AACTGAATTA 
AACTGAATTA 
AACTGAATTA 
AACTGAATTA 
AACTGAATTA 



AAACAGCAGA 
AAACAGCAGA 
AAACAGCAGA 
AAACAGCAGA 
AAACAGCAGA 
AAACAGCAGA 
AAACAGCAGA 
AAACAGCAGA 
AAACAGCAGA 
AAACAGCAGA 
AAACAGCAGA 



350 

TAACTCATAT 
TAACTCATAT 
TAACTCATAT 
TAACTCATAT 
TAACTCATAT 
TAACTCATAT 
TAACTCATAT 
TAACTCATAT 
TAACTCATAT 
TAACTCATAT 
TAACTCATAT 



msal34 2 7 0 . 2 { 3 9 IJDOHl' 
msal34270 . 2 { 391_M732 
msal34270 . 2 { 391_M781 ' 
msal34270 .2{391_090 
rasal34270 . 2 { 391_CJB110 ' 
msal34270.2(391_1169NT 
msal34270 . 2 {391__18RS21 
maal34270.2f391_2603 
msal34270.2{391_A909 
tnsal34270 . 2 { 391_JM9130013 
msal34270.2{391J136B 
Consensus 



351 

TTCTAAAGTA 
TTCTAAAGTA 
TTCTAAAGTA 
TTCTAAAGTA 
TTCTAAAGTA 
TTCTAAAGTA 
TTCTAAAGTA 
TTCTAAAGTA 
TTCTAAAGTA 
TTCTAAAGTA 
TTCTAAAGTA 



GTAGATCTAG 
GTAGATCTAG 
GTAGATCTAG 
GTAGATCTAG 
GTAGATCTAG 
GTAGATCTAG 
GTAGATCTAG 
GTAGATCTAG 
GTAGATCTAG 
GTAGATCTAG 
GTAGATCTAG 



AAAACCAACT 
AAAACCAACT 
AAAACCAACT 
AAAACCAACT 
AAAACCAACT 
AAAACCAACT 
AAAACCAACT 
AAAACCAACT 
AAAACCAACT 
AAAACCAACT 
AAAACCAACT 



TGATAAATTT 
TGATAAATTT 
TGATAAATTT 
TGATAAATTT 
TGATAAATTT 
TGATAAATTT 
TGATAAATTT 
TGATAAATTT 
TGATAAATTT 
TGATAAATTT 
TGATAAATTT 



400 

GTCTCAGGTT 
GTCTCAGGTT 
GTCTCAGGTT 
GTCTCAGGTT 
GTCTCAGGTT 
GTCTCAGGTT 
GTCTCAGGTT 
GTCTCAGGTT 
GTCTCAGGTT 
GTCTCAGGTT 
GTCTCAGGTT 



msal3 4270.2(39 1_C0H1 
0183134270.2(39^732' 
msal34270.2{391_M781 
msal34270.2{391_090' 
msal34270 . 2 ( 391_CJB110 ' 
msal34270.2(391 1169NT 
msal34270 . 2 { 3908RS21 
msal34270.2(391_2603 
msal34270.2(391_A909 
msal34270.2{391_JM9130013 
msal34270 . 2 { 391_H36B 
Consensus 



401 

ACTCAGGAGG 
ACTCAGGAGG 
ACTCAGGAGG 
ACTCAGGAGG 
ACTCAGGAGG 
ACTCAGGAGG 
ACTCAGGAGG 
ACTCAGGAGG 
ACTCAGGAGG 
ACTCAGGAGG 
ACTCAGGAGG 



TATGAAAAGA 
TATGAAAAGA 
TATGAAAAGA 
TATGAAAAGA 
TATGAAAAGA 
TATGAAAAGA 
TATGAAAAGA 
TATGAAAAGA 
TATGAAAAGA 
TATGAAAAGA 
TATGAAAAGA 



CGGCTTTCTC 
CGGCTTTCTC 
CGGCTTTCTC 
CGG CTTT CTC 
CGGCTTTCTC 
CX3GC1TTCTC 
CGGCTTTCTC 
CGGCTTTCTC 
CGGCTTTCTC 
CGGCTTTCTC 
CGGCTTTCTC 



TAGCCATCGC 
TAGCCATCGC 
TAGCCATCGC 
TAGCCATCGC 
TAGCCATCGC 
TAGCCATCGC 
TAGCCATCGC 
TAGCCATCGC 
TAGCCATCGC 
TAGCCATCGC 
TAGCCATCGC 



450 

CCTACTTGGA 
CCTACTTGGA 
CCTACTTGGA 
CCTACTTGGA 
CCTACTTGGA 
CCTACTTGGA 
CCTACTTGGA 
CCTACTTGGA 
CCTACTTGGA 
CCTACTTGGA 
CCTACTTGGA 



maa!34270 . 

msal34270. 

msal34270 . 
msal34270 
msal34270 
msal34270 
msal34270 

msa!34270. 



2(391_C0H1 
2(391_M732' 
2{391_M781 
270.2{391_090 
.2(391_CJB110 
.2(391_1169OT 
.2{391_1BRS21 
2{391 2603 



451 

AACCCCACAG 
AACCCCACAG 
AACCCCACAG 
AACCCCACAG 
AACCCCACAG 
AACCCCACAG 
AACCCCACAG 
AACCCCACAG 



TTTTAATCCT 
TTTTAATCCT 
TTTTAATCCT 
TTTTAATCCT 
TTTTAATCCT 
TTTTAATCCT 
TTTTAATCCT 
TTTTAATCCT 



AGATGAACCT 
AGATGAACCT 
AGATGAACCT 
AGATGAACCT 
AGATGAACCT 
AGATGAACCT 
AGATGAACCT 
AGATGAACCT 



ACCGTTGGAA 
ACCGTTGGAA 
ACCGTTGGAA 
ACCGTTGGAA 
ACCGTTGGAA 
ACCGTTGGAA 
ACC GTTG GAA 
ACCGTTGGAA 



500 

TTGATCCATC 
TTGATCCATC 
TTGATCCATC 
TTGATCCATC 
TTGATCCATC 
TTGATCCATC 
TTGATCCATC 
TTGATCCATC 



1076 



WO 2004/018646 



PCT/US2003/026827 



Table 76: Comparative Sequences relating to SAG0260 



msal34270.2{391_A909} 
msal34270 . 2 { 391_JM9130013 J 
msal34270 . 2{391_H36B} 
Consensus 



AACCCCACAG TTTTAATCCT AGATGAACCT ACCGTTGGAA TTGATCCATC 
AACCCCACAG TTTTA ATCCT AGATGAACCT ACCGTTGGAA TTGATCCATC 
AACCCCACAG TTTTAATCCT AGATGAACCT ACCGTTGGAA TTGATCCATC 



msal34270.2(391_COHl 
itisal34270.2f391_M732 
msal34270.2{391_M78l' 
msal34270.2{391 090 
msal34270 . 2 { 391_CJB110 
msal34270 . 2 { 391_1169NT 
msal34270 . 2 { 391_18RS2 1 
msal34270.2{391_2603 
msal 3 42 7 0 . 2 { 3 9 1_A90 9 
msal34270.2{391_JM9130013 
msal34270 . 2{391_H36B 
Consensus 



501 

CTTGA GGAGA 
CTTGAGGAGA 
CTTGAGGAGA 
CTTGAGGAGA 
CTTGAGGAGA 
CTTGAGGAGA 
CTTGAGGAGA 
CTTGAGGAGA 
CTTGAGGAGA 
CTTGAGGAGA 
CTTGAGGAGA 



AAAATCTGGC 
AAAATCTGGC 
AAAATCTGGC 
AAAATCTGGC 
AAAATCTGGC 
AAAATCTGGC 
AAAATCTGGC 
AAAATCTGGC 
AAAATCTGGC 
AAAATCTGGC 
AAAATCTGGC 



********** ********** 



AAGAGCTAAT 
AAGAGCTAAT 
AAGAGCTAAT 
AAGAGCTAAT 
AAGAGCTAAT 
AAGAGCTAAT 
AAGAGCTAAT 
AAGAGCTAAT 
AAGAGCTAAT 
AAGAGCTAAT 
AAGAGCTAAT 
********** 



TAATATTAAG 
TAATATTAAG 
TAATATTAAG 
TAATATTAAG 
TAATATTAAG 
TAATATTAAG 
TAATATTAAG 
TAATATTAAG 
TAATATTAAG 
TAATATTAAG 
TAATATTAAG 
********** 



550 

GATGAAGGAC 
GATGAAGGAC 
GATGAAGGAC 
GATGAAGGAC 
GATGAAGGAC 
GATGAAGGAC 
GATGAAGGAC 
GATGAAGGAC 
GATGAAGGAC 
GATGAAGGAC 
GATGAAGGAC 
********** 



msal34270 . 2 { 391_C0H1 
msal34270 . 2 ( 391_M732 ' 
msal34270.2{391_M78l' 
msal34270.2{391_090' 
msal34270.2(391_CJB110' 
msal34270 . 2 {391_1169NT' 
msal34270.2{391_18RS21 
tnsal34270.2(391_2603 
msal34270 . 2 { 391_A909 
msal34270 . 2 {391_JM9130013 
msal34270.2{391_H36B 
Consensus 



551 

gTTCTATCTT 
gTTCTATCTT 
gTTCTATCTT 
gTTCTATCTT 
gTTCTATCTT 
gTTCTATCTT 
aTTCTATCTT 
aTTCTATCTT 
gTTCTATCTT 
gTTCTATCTT 
gTTCTATCTT 



TATTACAACC 
TATTACAACC 
TATTACAACC 
TATTACAACC 
TATTACAACC 
TATTACAACC 
TATTACAACC 
TATTACAACC 
TATTACAACC 
TATTACAACC 
TATTACAACC 



CACGTTATGG 
CACGTTATGG 
CACGTTATGG 
CACGTTATGG 
CACGTTATGG 
CACGTTATGG 
CACGTTATGG 
CACGTTATGG 
CACGTTATGG 
CACGTTATGG 
CACGTTATGG 



ATGAAGCAGA 
ATGAAGCAGA 
ATGAAGCAGA 
ATGAAGCAGA 
ATGAAGCAGA 
ATGAAGCAGA 
ATGAAGCAGA 
ATGAAGCAGA 
ATGAAGCAGA 
ATGAAGCAGA 
ATGAAGCAGA 



600 

ATTAACAAGT 
ATTAACAAGT 
ATTAACAAGT 
ATTAACAAGT 
ATTAACAAGT 
ATTAACAAGT 
ATTAACAAGT 
ATTAACAAGT 
ATTAACAAGT 
ATTAACAAGT 
ATTAACAAGT 



msal34270.2{391_COHl 
msal34270 . 2 { 391_M732 
msal34270 . 2 {391_M781 
rasal34270 . 2 {3 91_090 
msal34270.2(391_CJB110 
msal34270.2(391_1169NT 
rasal34270 .2 {391_18RS21 
msal34270 ,2(391_2603 
msal 3 4 27& . 2 { 391_A909 
msa!34270 . 2 {391_JM9130013 
msal34270.2{391_H36B 
Consensus 



601 

AAGGTTGCAC 
AAGGTTGCAC 
AAGGTTGCAC 
AAGGTTGCAC 
AAGGTTGCAC 
AAGGTTGCAC 
AAGGTTGCAC 
AAGGTTGCAC 
AAGGTTGCAC 
AAGGTTGCAC 
AAGGTTGCAC 



TACTATTACG 
TACTATTACG 
TACTATTACG 
TACTATTACG 
TACTATTACG 
TACTATTACG 
TACTATTACG 
TACTATTACG 
TACTATTACG 
TACTATTACG 
TACTATTACG 



TGGAAACATT 
TGGAAACATT 
TGGAAACATT 
TGGAAACATT 
TGGAAACATT 
TGGAAACATT 
TGGAAACATT 
TGGAAACATT 
TGGAAACATT 
TGGAAACATT 
TGGAAACATT 



ATTGCCTTTG 
ATTGCCTTTG 
ATTGCCTTTG 
ATTGCCTTTG 
ATTGCCTTTG 
ATTGCCTTTG 
ATTGCCTTTG 
ATTGCCTTTG 
ATTGCCTTTG 
ATTGCCTTTG 
ATTGCCTTTG 



650 

ATACTCCATT 
ATACTCCATT 
ATACTCCATT 
ATACTCCATT 
ATACTCCATT 
ATACTCCATT 
ATACTCCATT 
ATACTCCATT 
ATACTCCATT 
ATACTCCATT 
ATACTCCATT 



msal34270 . 2 {391_COHl 
msal34270 . 2 (391_M732 
msal34270.2{391_M781 
msal34270.2{391_090 
msal34270.2{391 CJB110 
msal34270 . 2 { 391~1169NT 
msa!34270 . 2 { 391JL8RS21 
msa!34270. 2(391 2603 
msal34270 ♦ 2 (391~A909 
msal34270 . 2 {391_JM9130013 
rasal34270 . 2 {391_H36B 
Consensus 



651 

ACATTTAAAA 
ACATTTAAAA 
ACATTTAAAA 
AC ATTTA AAA 
ACATTTAAAA 
ACATTTAAAA 
ACATTTAAAA 
ACATTTAAAA 
ACATTTAAAA 
ACATTTAAAA 
ACATTTAAAA 



700 



AAACAATTTA 
AAACAATTTA 
AAACAATTTA 
AAACAATTTA 
AAACAATTTA 
AAACAATTTA 
AAACA ATTTA 
AAACAATTTA 
AAACAATTTA 
AAACAATTTA 
AAACAATTTA 



ATGTGAGTAC 
ATGTGAGTAC 
ATGTGAGTAC 
ATGTGAGTAC 
ATGTGAGTAC 
ATGTGAGTAC 
ATGTGAGTAC 
ATGTGAGTAC 
ATGTGAGTAC 
ATGTGAGTAC 
ATGTGAGTAC 



TATTGAGGAA 
TATTGAGGAA 
TATTGAGGAA 
TATTGAGGAA 
TATTGAGGAA 
TATTGAGGAA 
TATTGAGGAA 
TATTGAGGAA 
TATTGAGGAA 
TATTGAGGAA 
TATTGAGGAA 



GTTTTCTTAA 
GTTTTCTTAA 
GTTTTCTTAA 
GTTTTCTTAA 
GTTTTCTTAA 
GTTTTCTTAA 
GTTTTCTTAA 
GTTTTCTTAA 
GTTTTCTTA A 
GTTTTCTTAA 



701 



714 



msal34270 . 2 ( 391_C0H1 
msal34270.2(391 M732 
msal34270.2{391~M781 
msal34270.2{391 090 
msal 342 70 . 2 f 391_CJB110 
msal34270 . 2 (391_1169NT 
msal34270 . 2 { 391_18RS2 1 
msal34270. 2(391 2603 
msal34270.2{391_A909 
msal34270.2{391_JM9130013 
msal34270.2{391_H36B 
Consensus 



AAGCTGAAGG 
AAGCTGAAGG 
AAGCTGAAGG 
AAGCTGAAGG 
AAGCTGAAGG 
AAGCTGAAGG 
AAGCTGAAGG 
AAGCTGAAGG 
AAGCTGAAGG 
AAGCTGAAGG 
********** 



AGAA 
AGAA 
AGAA 
AGAA 
AGAA 
AGAA 
AGAA 
AGAA 
AGAA 
AGAA 
**** 



SBQ ZD NO. 7612 
STRAIN 2603 frame: 1 

KKVIDLKKLQKAYASBTVIJ^NINLEVPKGBI IGLIGPSGAGKSTLI KTMLGMEKADKGTA 

LVLDTQMPDRNILNQIQYMAQSDAL 

DLENQIJ3KFVSGYSGGMKRRLSIAIALIX^ 

EGHSI FITTHVMDEAELTSKVALLLRGNI IAFDT PLHLKKQFNV 



SBQ ID NO. 7613 



1077 



WO 2004/018646 



PCTVUS2003/026827 



Table 76: Comparative Sequences relating to SAG0260 



STRAIN 090 frame: 3 

LKKLQKAYASETVLNNINliBVFKGBI IGLIGPSGAGKSTLI KTMU24EKADKGTALVLDT 
QMPDRNI LNQIGYMAQSDALYESLTALENLLFFGKMKGIQKTELKQQITHI SKWDLENQ 
LDKFVSGYSGGMKRRLSLAIALLGNPTVLILDBPTVGIDPSLR^ 
FITTHVMDEAELTSKVALLLRGNI IAFDTPLHLKKQFNV 

SEQ ZD NO. 7614 
STRAIN A909 frame: 1 

KKVIDLKKLQKAYASETVLNNINLBVFKGEI IGLIGPSGAGKSTLI KTMLGMEKADKGTA 
LVLDTQM PDHN I LNQ I GYMAQSDAL YESLTGLENLLF FG KMKG I QKTELKQQ I TH I S KW 
DLENQLDKFVSGYSGGMKRRLSLAI ALLGNPTVLI LDEPTVGI DPSLRRKIWQEL INI KD 
EGRS I F I TTHVMD BAELTS KVALLLRGN I IAFDTPLHLKKQFNV 

SEQ ZD NO. 7615 
STRAIN H36B frame: 1 

KKVI DLKKLQKAYASETVLNNI NLBVFKGE 1 1 GL I GPSGAGKSTL I KTMLGMEKADKGTA 
LVLDTQMPDRN I LNQ I G YMAQSDAL YE SLTGLENLLF FGKMKG I QKTELKQQ I THIS KW 
DLHNQLD KWSGYSGGMKRRLSIA I ALLGNPTVL I LDEPTVG I D PSLRRKI WQEL IN I KD 
EGRS I F I TTHVMDEAELTS KVALLLRGN 1 1 AFDTP LHLKKQFNV 

SEQ ZD NO. 7616 
STRAIN 18RS21 frame: 1 

DLKKLQKAYASETVLNNI NLEVFKGE I IGL I GPSGAGKSTLI KTMLGMEKADKGTALVLD 
TQMPDRNI LNQI G YMAQSDALYESLTGLENLLFFGKMKG I QKTELKQQITHI SKWDLEN 
QIJ>KFVSGYSGGMKRRLSLAIALLGNPTVLII^EPWGIDPSIJ^ 
I F I TTHVMDEAELTS KVALLLRGN I IAFDTPLHLKKQFNV 

SEQ ZD NO. 7617 
STRAIN M732 frame: 1 

KKVI DLKKLQKAYASETVLNNINLEVFKGE 1 1 GL I GP SGAGKSTL I KTMLGMEKADKGTA 
LVLDTQMPDRN I LNQI GYMAQSDAIiHESLTGLENLL^ 

DLENQI^KFVSGYSGGMKRRLSLAIALIiGNPTVLILDEPTVGIDPSLRRKIWQELINIKD 
EGRS I F I TTHVMDEAELTS KVALLLRGN I IAFDTPLHLKKQFNV 

SEQ ZD NO. 7618 
STRAIN COH1 frame: 1 

KKVIDLKKLQKAYASETVLiNNINLEVFKGEI I GL I G P SGAGKSTL I KTMLGMEKAD KGT A 
LVLDTQMPDRN I LNQ I GYMAQSDALHESLTGLENLLF FGKMKG I QKTELKQQ ITH I SKW 
DLENQLDKFVSGYSGGMKRRI4SLAIALLGNPTVLILDEPTVGIDPSLRRKI 
EGRS I F I TTHVMDEAELTS KVALLLRGNI IAFDTPLHLKKQFNV 

SEQ ZD NO. 7619 
STRAIN M781 frame: I 

KKVI DLKKLQKAYAS ETVLNNI NLEVFKGE 1 1 GL I GPSGAGKSTL I KTMLGMEKADKGTA 
LVLDTQMPDRNILNQIGYMAQSDALHESLTGLF.NLLFFGKMKGIQKTELKQQITHISKW 
DLENQLDKF VSGYSGGMKRRLSLAIALLGNPTVL I LDEPTVGI DPSLRRKI WQEL INI KD 
EGRS I F I TTHVMDEAELTS KVALLLRGN I IAFDTPLHLKKQFNV 

SEQ ZD NO. 7620 
STRAIN GIB 1 10 frame: 1 

KKVI DLKKLQKAYASETVLNNI NLEVFKGE 1 1 GLI GPSGAGKSTL I KTMLGMEKADKGTA 
LVLDTQMPDRNILNQIGYMAQSDALYESLTALENLIiFFGKMKG 
DLENQLDKFVSGYSGGMKRRLSLAI ALLGNPTVLILDEPTVGIDPSLRRKIWQELI 
EGRS I F I TTHVMDEAELTS KVAT J J iRGN I IAFDTPLHLKKQFNV 

SEQ ZD NO. 7621 
STRAIN 1 169NT frame: 1 

KKVIDLKKLQKAYASETVLNNINLEVFKGEI IGLIGPSGAGKSTLI KTMLGMEKADKGTA 
LVLDTQMPDRN I LNQ I G YMAQSDAL YE SLTALENLLFFGKMKG I QKTELKQQ ITH I S KW 
DLENQLD KFVSG YSGGMKRRLSLAI ALLGNPTVL I LDEPTVG I D PS LRRKI WQEL I N I KD 
EGRS I FITTHVMDEAELTSKVALLLRGNI IAFDTPLHLKKQFNV 

SEQ ZD NO. 7622 
STRAIN JM9 1300 13 frame: 1 

KKVI DLKKLQKAYASETVLNNI NLEVFKGE 1 1 GLI GPSGAGKSTL I KTMLGMEKADKGTA 
LVLDTQMPDRNI LNQ I G YMAQSDAL YESLTGLENLLFFG KMKG I QKTELKQQ ITH I SKW 
DLENQLD KFVSGYS GGMKRRLSLA I ALLGNPTVL I LDEPTVG I D P S LRRKI WQEL I N I KD 
EGRS I F I TTHVMDEAELTS KVALLLRGN I IAFDTPLHLKKQFNV 

PRETTY of : /biotmp/nisal34470 . 2{* } April 10, 2003 02*16 .. 

1 50 

LKKLQ KAYASETVLN N I NLEVFKGE IIGLIGPSGA GKSTLIKTML 

KKVIDLKKLQ KAYASETVLN N I NLEVFKGE IIGLIGPSGA GKSTLIKTML 
KKVTDLKKLQ KAYASETVLN NINLEVFKGE IIGLIGPSGA GKSTLIKTML 
KKVIDLKKLQ KAYASETVLN NINLEVFKGE IIGLIGPSGA GKSTLIKTML 
KKVIDLKKLQ KAYASETVLN NINLEVFKGE IIGLIGPSGA GKSTLIKTML 
KKVIDLKKLQ KAYASETVLN NINLEVFKGE IIGLIGPSGA GKSTLIKTML 

DLKKLQ KAYASETVLN NINLEVFKGE IIGLIGPSGA GKSTLIKTML 

KKVIDLKKLQ KAYASETVLN NINLEVFKGE IIGLIGPSGA GKSTLIKTML 
KKVIDLKKLQ KAYASETVLN NINLEVFKGE IIGLIGPSGA GKSTLIKTML 
KKVIDLKKLQ KAYASETVLN NINLEVFKGE IIGLIGPSGA GKSTLIKTML 



rasal34470.2{391 090 
msal34470 . 2 ( 391_1169NT 
ra8al34470.2(391_CJB110 
msal34470. 2(391 COH1 
maal34470 . 2 { 391 J4732 
maal34470.2{391_M78l' 
meal34470.2{391 18RS21 
msal34470. 2(391 2603 
msal34470.2{39l2H36B 
tnsa!34470. 2(391 JM9130013 



1078 



WO 2004/018646 



PCT/US2003/026827 



Table 76: Comparative Sequences relating to SAG0260 



tnsal 3 4470 . 2 { 3 9 1_A9 o 9 } 
Consensus 



KKVIDLKKLQ KAYASBTVLN NINLEVFKGB IIGLIGPSGA GKSTLIKTML 



msal34470.2{391 090 
msal34470 . 2 { 391_1169NT 
msal34470.2{391_CJB110 
msal34470 ,2{391_COHl 
msal34470 .2(391_M732 
msal34470. 2(391 H781 
msal34470.2{391 18RS21 
msal34470 - 2 { 391_2603 
msal34470.2{391_H36B 
msal34470 . 2{391_JM9130013 
msal34470.2{391_A909 
Consensus 



51 

GMEKADKGTA 
GMEKADKGTA 
GMEKADKGTA 
GMEKADKGTA 
GMEKADKGTA 
GMEKADKGTA 
GMEKADKGTA 
GMEKADKGTA 
GMEKADKGTA 
GMEKADKGTA 
GMEKADKGTA 



LVLDTQMPDr 
LVLDTQMPDr 
LVLDTQMPDr 
LVLDTQMPDr 
LVLDTQMPDr 
LVLDTQMPDr 
LVLDTQMPDr 
LVLDTQMPDr 
LVLDTQMPDr 
LVLDTQMPDr 
LVLDTQMPDh 



********** *********_ 



NILNQIGYMA 
NILNQIGYMA 
NILNQIGYMA 
NILNQIGYMA 
NILNQIGYMA 
NILNQIGYMA 
NILNQIGYMA 
NILNQIGYMA 
NILNQIGYMA 
NILNQIGYMA 
NILNQIGYMA 
********** 



QSDALyESLT 
QSDALyESLT 
QSDALyESLT 
QSDALhESLT 
QSDALhESLT 
QSDALhESLT 
QSDALyESLT 
QSDALyESLT 
QSDALyESLT 
QSDALyESLT 
QSDALyESLT 



100 

aLENLLFFGK 
aLBNLLFFGK 
aLENLLFFGK 
gLENLLFFGK 
gLENLLFFGK 
gLENLLFFGK 
gLENLLFFGK 
gLENLLFFGK 
gLENLLFFGK 
gLENLLFFGK 
gLENLLFFGK 



*****_**** .********* 



msal34470.2{391_090 
msal34470.2(391 1169NT 
msal34470 . 2 {391~CJB110 
msal34470 .2{391_COHl 
msal34470.2(391_M732 
msal34470 ,2{391_M781 
msa!34470.2{391_18RS21 
msal34470 . 2 ( 391_2603 
msal34470 . 2 {391_H36B 
msal34470 . 2{391_JM9 130013 
msal34470 . 2 { 391_A909 
Consensus 



101 

MKGIQKTBLK 
MKGIQKTELK 
MKGIQKTELK 
MKGIQKTELK 
MKGIQKTELK 
MKGIQKTELK 
MKGIQKTELK 
MKGIQKTBLK 
MKGIQKTELK 
MKGIQKTELK 
MKGIQKTELK 



QQITHISKW 
QQITHISKW 
QQITHISKW 
QQITHISKW 
QQITHISKW 
QQITHISKW 
QQITHISKW 
QQITHISKW 
QQITHISKW 
QQITHISKW 
QQITHISKW 



DLENQLDKFV 
DLENQLDKFV 
DLENQLDKFV 
DLENQLDKFV 
DLENQLDKFV 
DLENQLDKFV 
DLENQLDKFV 
DLENQLDKFV 
DLENQLDKFV 
DLENQLDKFV 
DLENQLDKFV 



SGYSGGMKRR 
SGYSGGMKRR 
SGYSGGMKRR 
SGYSGGMKRR 
SGYSGGMKRR 
SGYSGGMKRR 
SGYSGGMKRR 
SGYSGGMKRR 
SGYSGGMKRR 
SGYSGGMKRR 
SGYSGGMKRR 



150 

LSLAIALLGN 
LSLAIALLGN 
LSLAIALLGN 
LSLAIALLGN 
LSLAIALLGN 
LSLAIALLGN 
LSLAIALLGN 
LSLAIALLGN 
LSLAIALLGN 
LSLAIALLGN 
LSLAIALLGN 



msal34470 .2(3 91_090 
msal34470 .2f 391_1169NT' 
msal344 7 0 . 2 { 3 91_CJB1 1 0 
msal34470 . 2 f 391_COHl ' 
msal34470.2(391_M732 
msal34470 . 2 { 391_M78 1 
msal34470 . 2 {391JL8RS21 
msal34470 . 2 { 391_2603 
msal34470 .2{391_H36B 
msal34470.2{391_JM9130013 
tnsal34470 . 2 {391_A909 
Consensus 



151 

PTVLILDEPT 
PTVLILDEPT 
PTVLILDEPT 
PTVLILDEPT 
PTVLILDEPT 
PTVLILDEPT 
PTVLILDEPT 
PTVLILDEPT 
PTVLILDEPT 
PTVLILDEPT 
PTVLILDEPT 
********** 



VG I DPSLRRK 
VGIDPSLRRK 
VG I DPSLRRK 
VGIDPSLRRK 
VGIDPSLRRK 
VGIDPSLRRK 
VGIDPSLRRK 
VGIDPSLRRK 
VGIDPSLRRK 
VGIDPSLRRK 
VGIDPSLRRK 
********** 



IWQELINIKD 
IHQBLINIKD 
IWQELINIKD 
IWQELINIKD 
IWQELINIKD 
IWQELINIKD 
IWQELINIKD 
IWQELINIKD 
IWQELINIKD 
IWQELINIKD 
IWQELINIKD 
********** 



BGrSIFITTH 
EGrSlFITTH 
EGrSIFITTH 
EGrSlFITTH 
EGrSIFITTH 
EGrSIFITTH 
EGhSIFITTH 
EGhSIFITTH 
EGrSIFITTH 
EGrSIFITTH 
EGrSIFITTH 
**_******* 



200 

VMDEABLTSK 
VMDEAELTSK 
VMDEABLTSK 
VMDEAELTSK 
VMDEAELTSK 
VMDEAELTSK 
VMDEAELTSK 
VMDEABLTSK 
VMDEAELTSK 
VMDEAELTSK 
VMDEAELTSK 
********** 



msal34470.2(391 090 
msal34470 . 2 { 391_1169NT 
msal34470 .2 {391__CJB110 
msal34470 .2{391_COHl 
nisal34470 . 2 { 391_M732 
msal34470.2{391_M781 
msal34470.2{391_18RS21 
msal34470.2{391_2603 
msal34470.2{391_H36B 
msal34470. 2 {391_JM9 130013 
msal34470.2{391_A909 
Consensus 



201 

VALLLRGN1I 
VALLLRGNII 
VALLLRGNII 
VALLLRGNII 
VALLLRGNII 
VALLLRGNII 
VALLLRGNII 
VALLLRGNII 
VALLLRGNII 
VALLLRGNII 
VALLLRGNII 



AFDTPLHLKK 
AFDTPLHLKK 
AFDTPLHLKK 
AFDTPLHLKK 
AFDTPLHLKK 
AFDTPLHLKK 
AFDTPLHLKK 
AFDTPLHLKK 
AFDTPLHLKK 
AFDTPLHLKK 
AFDTPLHLKK 



224 
QFNV 
QFNV 
QFNV 
QFNV 
QFNV 
QFNV 
QFNV 
QFNV 
QFNV 
QFNV 
QFNV 
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Table 77: Comparative Sequences relating toSAG2059 



0EQ ZD NO. 7701 
STRAIN 2603 

TTGC CTATGTTGTCTGTTGGTTTAGTTTTAGAGGGTGG CGGAATGAGAGGTCTTTATACT 
GCTGGAGTTTTAGATCCTTTTCTAGATC 

TCTGCTGGTGCATTGTITGGTGTTAATTTTGTA CGA 

TACAATAAAAAGTATTTATCCX2AC CCT AAATATATGAGT CrAAGGTCATGGTTTCGAACA 

GGGAATTTTGTTAATAAAGATTTCACCTATTA 

GACXSATGAAGCATTTAAAAAATCAACTATTGATT TTT 

TC^XKSTAAACCTGAATATTTTAAAATTGATAGTGTTTTTGAA 

GCTAGTT CAGCA TTACCAGTAGTCTCAAAC^ 

GATGGTGGTTTATCTGATAGTATTCCCGTTGATTTTC 

TTGATTGTTGTGATGACTAGGCCGCTCIAATTATCAGAAAA^ 

TATAAAACTCTGTATAGGAAATATCCTAATTTTGTAAAGAC^ 

CAGTATAATAATAGTCTTGAAAAGGTCATGAG CCTTGAAAAAACAGGCGATCTATTTGCA 

ATTAGACCGAGrrAAGAGCTTGGTTATTGGCCGCTTAGAGAAGAATC 

AGTATTTATCAGCTTGGTATGAAAGATGCTAAAAGTC 

CTAATGAAA 



SBQ ZD NO. 7702 
STRAIN 090 

AGGGTGGCGGAATGAGAGGTCTTTATACTGCTGGAGTT^ 

CTAGATGCAGGAATAAAAATAGATGGTATCGTATCTGTCTCTG^ 

ATTGTTTGGTGTTAATTTTGTATCTAGACAAC^ 

ACAATAAAAAGTATTTATCCCACCCTAAATATATGAGTCTAAGGTCATGG 

TTTCGAACAGGGAATTTTGTTAATAAAGATTTCACCTAT^ 

TATGAAATTGGATGTATTTGACX3ATGAAGCATTTAAAA 

ATTTTTACGTAGTTGCTACAGAGATGACATCTGGTAAACCTG^ 

AAAATTGATAGTGTTTTTGAACAAATGGAAATT^ 

ATTACCAGTAGTCTCAAAGATGGTTGATT 

ATGGTGGTTTATCTGATAGTATTCCCXnTGATTT^ 

TTTGACAAGTTGATTGTTGTGATGACTAGGCC^ 

GCCTTCAAGTGGACGATTGTATAAAACTCTCT^ 

TTGTAAAGACAG CCT CGAATCX5GT AC CAACAGTAT AATAATAGTCTTGAA 

AAGGT CATGAGC CTTGAAAAAACAG GCGAT CTATTTG CAATT AGACCGAG 

TAAGAGCITGGTTATTGGCCGCTTAGAGAAGAATCC 

GTATTTATCAG CTTGGTATGA7VAGATGCTAAAAGTGTGATGCCTGAGCTG 

AATAGTTATCTAATGAAA 



SBQ ZD NO. 7703 

STRAIN A909 

CCTATGTTOTCrGTTGGTTTAGTTTTAGAG 
GGTGGCGGAATGAGAGGTCTTTATACIGCTGGAGTTTTAGATC 
AGATGCAGQAATAAAAGTAGATGGTATCATATCTGTCTCTGCTGGTGCAT 
TGTTTGGTGTTAATTTTGTATCTAGACAAC^ 

AATAAAAAGTATTTATCCCACCCTAAATATATGAGTCTAAGGTCATGGCT 

TCGAACAGGGAATTTTGTTAATAAAGATTTCACCTATTATGAAG 

TGAAATTGGATGTATTTGACGATGAAGCATTTAAAAAATCAAGTATT^ 

TTTTACGCAGTTGCTACAGAGATGA(^TCT^ 

AATTGATAGTGTTTTTGAACAAATG^SAAATTT^ 

GGTGGTTTATCTGATAGTATTCCCGTTGATTTTGCC^ 

TGACAAGTTGATTGTTGTGATGACTAGGCCK3CTCAATTA 

CTTCAAGTGGACGAITCTATAAAACTCTGTATAGGAAATATCCTAAT^ 

GTAAAGACAGCCTCGAACCGGTACCAACAGTATAAT^ 

GGTCATGAGCCTTGAAAAAACAGGCGATCTATTTGCAAT^ 

AGAGCTTGGTTATTGGCC^CTTAGAGAAGAA^ 

ATTTATCAGCTTGGTATGAAAGATGCTAAAAG^ 

TAGTTATCTAATGAAA 



SBQ ID NO. 7704 

STRAIN H36B 

CCTATGTTGTCTGTTGGTTTAGTTTTAG 
AGGGTGGOGGAATGAGAGGTCTTTATACTGCTGGAGTTTTAG 
CTAGATGCAGGAATAAAAGTAGATGGTATCATATC 
ATTGTlTGGTGTTAATrTTGTATCTAGACAACGW 

ACAATAAAAAGTATTTATCCCACCCTAAATATATGAGTCTAAGGTCATGG 
CTTO^CAGGGAAinYl^rrAATAAAGATTTCACCTATTATGAAGTTCC 
TATGAAATTGGATGTATTTGACGATGAAGCATTTAAAAAATCAAGTA 
ATTTTTACGCAGTTGCTACAGAGATGACATCT^ 

AAAATTGATAGTGTTTTTGAACAAATGGAAATTTT ACGTGCT C 

ATTACCAGTAGTCTCAAAGAT^ 

ATGGTGGTTTATCTGATAGTATTCC<XnT<^ 

TTTGACAAGTTGAlTtn'TGTGATGACrAGGCCGCT CAATT AT CAGAAAAA 

GCCTTCAAGTGGACGATTGTATAAAACT'CTGTATAGGAAATATC 

TTGTAAAGACAG CCT<X3AACCGGTACXrAACAGTATAATAATAGCCTTGAA 

AAGGTCATGAGCCITGAAAAAACAGGCGATCTATTTC 

TAAGAGCTTGGTTATTGGCXX3CTTAGAGAAGAATCCX3GAT 

GTATTTATCAGCITGGTATGAAAGATG CTAAAAGTGGGATGCCTGAGCTG 

AATAGTTATCTAATGAAA 



SBQ ZD NO. 7705 
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Table 77: Comparative Sequences relating toSAG2059 



STRAI N 18RS 21 

CCTATGITGTCTGTTGGTTTAGTTTTAGAGG 
GTGG<X3GAATGAGAGGTCTTTATACTGCTGGAGTTTT^ 
GATG CAGGAATAAAAATAGATGGTATCGTA^ 
GTTTGGTGTTAATTTTGTATCTAGACAACGAGAG^ 

ATAAAAAGTATTTATCCC^CCCTAAATATATGAGTCTAAGGTCATGGTTT 
OGAACAGGGAATTTTGTTAATAAAGATTTCACCTATTATGA^ 
GAAATTGGATGTATTTGACGATGAAGCATTTAAAAA^ 
TTTACGTAG TTGCrA CAGAGATGA^ 

ATTGATAGTGTITTTGAACAAATGGAAATTTTACGTG CTAGTTCAG CATT 

ACCAGTAGTCTCAAAGATGGTTGATTGG CAGGG GAAAAAG 

GTGGTTTATCTGATAGTATTCCOGTTGATTTTGCCCGTG^ 

GACAAGTTGATTGTTGTGATGACTAGGCCX3CT 

TTCAAGTGGACX^TTGTATAAAACTCTGTATAGGAAA^ 

TAAAGAC^CCTCX1AATCGGTA(XMCAGTATAATAATAGTCTTGAAAAG 

GTCATGAGCCTTGAAAAAAGAGGCGATCTAT^ 

GAGCTTGGTTATTGG02GCTTAGAGAAG 

TTTATCAGCTTGGTATGAAAGATGCTAAAAGTGTGATC 

AGTTATCTAATGAAA 

SSQ ZD NO. 7706 
STRAIN M732 

GGGTGGCGGAATGAGAGGTCTTTATACTtSCTGGAGTTTTA 

TAGATGCAGGAATAAAAATAGATGGTATCGTATCTGTCTCTGCGGGTGCA 

TTGTTTGGTGTTAATTTTGTATCTAGACAAOGA 

CAATAAAAAGTAlTTATCCCACCyrrGA ATATA TGAGTCTAAGATCATGGC 

TTCGAACAGGGAATTTTGTTAATAAAGATTTCACCrATTATGAAGTTC 

ATGAAATTGGATGTATTTGACGATGAAG 

U"rri"lACGTAGTTGCTACAGAGATGACATCTC 

AAATTGATAGTGTTTTTGAACAAATGGAAATTT^ 

TTACCAGTAGTCTCAAAGATGGTTGATTGGCAGGGGAAAA 

TGGTGGTTTATCIX3ATAGTATTCCCGTTGATTTTC 

TTGACAAGTTGATTGTIX3TGAXGACTAGG CCGCT^ 

CCTTCAAGTGGACX3ATIX]rrATAAAACT 

TGTAAAGACAGCX^CGAATCGGTACCAACAGTA^ 

AGGTCA!TC^G CCTTGAAAAAACAGGCGATCT 

AAGAGCTrGGTCATTGGCCGCTTAGAGAAGAATCCGGATAAACITGATAG 

TATTTATCAGCTTGGTATGAAATATGCTAAAAGTC^ 

ATAGTTATCTAATGAAA 

SEQ ID HO. 7707 

STRAIN COH1 

CCrATGTrGTCTGTTGGTTTAGTTTTA 

GAGGGTGGCGGAATGAGAGGTCTTTATACTGCTGG^ 

TCTAGATGCAGGAATAAAAATAGATGGTATCGTATCTGTCTCTGCGGGTG 

CATTGTrrGGTGTTAATTTTGTATCTAGACAACG 

TACAATAAAAAGTATTTATCCCACXCrcAATATATGAGTCrA^ 

GCITCGAACAGGGAATTTrGTTAATAAAGATTTCACOT 

CTATGAAATTGGATGTATTTGACGATGAAGCATTTAA 

GATi'lU'IACOTAG TTGCTA CAGAGATGACATCTGGTAAAC 

TAAAATTGATAGTGTTTTTGAAGAAATGGA 

CATTACCAGTAGTCrCAAAGATGGTTGATTGGCAGGGGAAAAAGTA 

GATGGTGGTTTATCTGATAGTATTCCCGTTG^ 

ATTTGACAAGTTGATTGTTGTGATGACTAGGC 

AGCCTTCAAGTOGACGATTGTATAAAACTCTGTATAGGAA^ 

TTTGTAAAGACAGCCTCGAATCGGTACXIAAC^ 

AAAGGTC^TGAGCCTTGAAAAAACAGGCGATCIATT^ 

GTAAGAGCTtSjGTTATTGGCCGCTTAGAGAAGAATCCG 

AGTATTTATCAGCiTGGTATGAAATATGCTAAAAGTGTGATGCCTGA 

GAATAGTTATCTAATGAAA 

SSQ ZD HO. 7708 
STRAIN M781 

AGGGTGGCX&SAATGAGAGGTCTTTATACTGCrG^ 

CTAGATCCAGGAATAAAAATAGATGGTATCGTATC^ 

ATTGTTTGGTGTTAATTTTGTATCTAGACAACGAGA 

ACAATAAAAAGTATTTATCCCACCCTGAATATATGAG^ 

CTTCGAACAGGGAATTTTGTTAATAAAGATTT 

T ATGAAATTGGATGTATTTGACGATGAAG CATTT AAAAAATCAAGT ATTQ 

ATTTTTACOTAGi w roCTACAGAGATGACATCTGGTAAACC^ 

AAAATTGATAGTGTTTTTGAACAAATGGAAATTTTACGTGCT 

ATTACCAGTAGTCTCAAAGATGGTrGAlT 

ATGGTGGTTTATCTGATAGTATTCCCGTTGA 

TTTGACAAGTTGATTGTTGTGATGACTAGGCCGCT 

GCCTTCAAGTGGACGATTGTATAAAACTCTGTATAGGA 

TTGTAAAGACAGCCTCGAATCGGTACCAAGAOT 

AAGGTCATGAGCCTTGAAAAAACAGGCGATCT 

TAAGAGCTTGGTTATTGGCCGCTTAGAGAAGAATCCGG^ 

GTATTTATCAGCTTGGTATGAAATATGCTAAAAGTGTG^ 

AATAGTTATCTAATGAAA 
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SEQ 3D NO. 7709 
STRAIN CJB 110 

CCTATGTTGTCTGTTGGTTTAGTTTTA 

GAGGGTGGCGGAATGAGAGGTCTTTATACTGCTGGAGTTTTAG^ 

TCTAGATGCAGGAATAAAAATAGATGGTATCGTA^ 

CATTGTTTGGTGTTAATTTTGTATC^^ 

TAC^TAAAAAGTATTTATCC<^CCCTAAATATATGAGTCTAAGGTCATG 

GTTTCGAACAGGGAATTTTGTTAATAAAGATT^ 

CTATGAAATTGGATGTATTTGACGATGAAGCATTTAA 

GATTTTTACGTAGTTGCTACAGAGATGACATCTGGTAAA 

TAAAATTGATAGTGTTTTTGAACAAATGGAA^ 

CATTACGAGTAGTCTCAAAGATGGTTGATTGG CAGGGGAAAAAGTACTTA 

GATGGTGGTTTATCTGATAGTATrCCCGTTGATTXTC 

ATTTGACAAGTTGATTGTTGTGATGACTAGGCCG CTCAATTATCAGAAAA 

AGCCTTCAAGTGGACGATTGTATAAAACrerGTATAGGAAATATCCTAAT 

TTTGTAAAGACAGCCTCGAATCGGTACCAACAGT^ 

AAAGGTCATGAGCCTTGAAAAAACAGGCGATC 

GTAAGAGC riX^XT ATTGGCOGCTTAGAGAAGAATCCGGATAAACTTGAT 

AGTATTTATCAGCTTGGTATGAAAGATGCTAAAAGTC 

GAATAGTTATCTAATGAAA 



SEQ ZD NO. 7710 

STRAIN 1169NT 

0CI7V'i\j"i"i\jiVix»i"iCGTTTAwii J i-iAGAGGGTG 

GCGGAATGAGAGGTCTTTATACTG CIGGAGTTTTAGATGCTTTTCTAGAT 

G C^VGGAATAAAAAT AGATGGTATCGTATCTGT CT CTG CX3GGTGCATTGTT 

TGGTGTTAATTTTGTATCTAGACAACGAGAGAGGGCTTTC 

AAAAGTATTTATCCCACCCTAAATATATGAGTCTAAGATCATGGCT 

ACAGGGAATTTTGTTAATAAAGATT7TC 

ATTGGATGTATTTGACGATGAAGCATTTAAAAAATCA 

ACGCAGTTGCTACAGAGATGACATCreGTAAACCT^ 

GATAGTGTCTTTGAACAAATGGAAATTTT ACGTGCTAGTT CAGCATT AC C 

AGTAGTCTCAAAGATGGTTGATTGG CAGGGGAAAAAGTACTTAGATGGTG 

GTTTATCTGATAG1ATCCCCGTTGATTTTGCCCGTC 

AAGTTGATTGTTGTGATGACTAGGCCGCTCAATTATCA^ 

AAGTGGACGA'iU\ilATAAAACTOTGTATAGGAAATATCCTAA i rrri'GTAA 

AGACAGCCTOIAATCGGTACCAACAGTATAATAATAGCCTTGAAAAGGTC 

ATGAGCCTTGAAAAAACAGGCGATCTATTTGCAATTAGGCCX1AGT 

CTTGGTTATTGTCCGCTTAGAGAAGAATCCX3GATAAACTTGATAGTATT^ 

ATCAGCTTGGTATGAAAGATGCTAAAAGTGTGATGCCTGAGCTGAATAGT 

TATCTAATGAAA 



SEQ ZD MO. 7711 

STRAIN JM9130013 

CCTATGTTCTCTGTTGGTTTAGTTTTAGAG 
GGTGGCGGAATGAGAGGTCTITATACTGCTGGAGTTTTAGATC 

TGTTTGGTGTTAATTTTGTATCTAGACAACGA 

AATAAAAAGTATTTATCCCACCCTAAATATATGAGTCTA 

TCGAACAGGGAAU'IVICTTAATAAAGATTTCACCTATTATGAAGTTCCTA 

TGAAATTGGATGTATTTGACGATGAAGCATTTAAAAAATC 

Tl^LTACGCAGTTGCTAGAGAGATGACA 

AATTGATAGTGTTTTTGAACAAATGGAAATTTTACGTGCT 

TACCAGTAGTCTCAAAGATGGlU\i"i"i"iGGCAGGGGAAAAAGTACTTAGAT 

GGTGGTTTATCTGATAGTATTCCCGTTG^ 

TGACAAGTTGATTGTTGTGATGACTAGGCCGCT^ 

CTTC^VAGTGGACGATTGTATAAAACTCTGTATAGGAAAT^ 

GT AAAGACAGCCTCGAACCGGTACCAACAGTATAATAATAGC CTTGAAAA 

GGTCATGAGCCTTGAAAAAACAGGCGATCTATTTGGAAT^ 

AGAGCTTGGTTATTGGCCGCTTAGAGAAGAATCCGGATAAACTTGATAG^ 

ATTTATCAGCTTGGTATGAAAGATGCTAAAAGTG^ 

TAGTTATCTAATGAAA 

PRETTY of: /biotmp/rasa47199 .2 { *} Pebruary 19, 2003 05:51 



msa47199.2(394 A909 
raaa47199 . 2{394_H36B 
msa47199 . 2 { 394_JM9130013 
msa47199.2(394_090 j 
msa47199. 2(394 18RS21 
msa47199 . 2 (394_2603 
msa47199.2{394jCJB110 
maa47199. 2(394 COH1 
msa47199.2{394~M732 
msa47199.2(394_M781 
msa47199.2{394_1169NT 
Consensus 



CCTATGT 

CCTATGT 

CCTATGT 

CCTATGT 

CCTATGT 

ttgCCTATGT 
---CCTATGT 

CCTATGT 

CCTATGT 

- — CCTATGT 
-—CCTATGT 



TGTCTGTTGG 
TGTCTGTTGG 
TGTCTGTTGG 
TGTCTGTTGG 
TGTCTGTTGG 
TGTCTGTTGG 
TGTCTGTTGG 
TGTCTGTTGG 
TGTCTGTTGG 
TGTCTGTTGG 
TGTCTGTTGG 



TTTAGTTTTA 
TTTAGTTTTA 
TTTAGTTTTA 
TTTAGTTTTA 
TTTAGTTTTA 
TTTAGTTTTA 
TTTAGTTTTA 
TTTAGTTTTA 
TTTAGTTTTA 
TTTAGTTTTA 
TTTAGTTTTA 



GAGGGTGGCG 
GAGGGTGGCG 
GAGGGTGGCG 
GAGGGTGGCG 
GAGGGTGGCG 
GAGGGTGGCG 
GAGGGTGGCG 
GAGGGTGGCG 
GAGGGTGGCG 
GAGGGTGGCG 
GAGGGTGGCG 



50 

GAATGAGAGG 
GAATGAGAGG 
GAATGAGAGG 
GAATGAGAGG 
GAATGAGAGG 
GAATGAGAGG 
GAATGAGAGG 
•GAATGAGAGG 
GAATGAGAGG 
GAATGAGAGG 
GAATGAGAGG 



msa4 7199 . 2 f 3 94_A9 09 } 
msa47 199.2(3 94_H3 6B > 
msa47199.2{394 JM9130013) 



51 100 

TCTTTATACT GCTGGAGTTT TAGATGCTTT TCTAGATGCA GGAATAAAAg 
TCTTTATACT GCTGGAGTTT TAGATGCTTT TCTAGATGCA GGAATAAAAg 
TCTTTATACT GCTGGAGTTT TAGATGCTTT TCTAGATGCA GGAATAAAAg 



1082 
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msa47199.2{394_090} TCTTTATACT 

tnsa47199.2{394_18RS2l' TCTTTATACT 

msa4 7 19 9 . 2 ( 3 94_2 6 03 \ TCTTTATACT 

msa47199.2{394_CJB110J TCTTTATACT 

msa4 7199.2(3 94_COHl J TCTTTATACT 

msa47199.2(394J4732> TCTTTATACT 

msa47199.2{394_M781 T CTTTA TACT 

msa47 1 9 9 . 2 { 3 94_116 9 NT } TCTTTATACT 

Consensus ********** 



GCTGGAGTTT 
GCTGGAGTTT 
GCTGGAGTTT 
GCTGGAGTTT 
GCTGGAGTTT 
GCTGGAGTTT 
GCTGGAGTTT 
GCTGGAGTTT 



TAGATG CTTT 
TAGATG CTTT 
TAGATG CTTT 
TAGATG CTTT 
TAGATG CTTT 
TAGATG CTTT 
TAGATG CTTT 
TAGATGCTTT 



TCTAGATGCA 
TCTAGATGCA 
TCTAGATGCA 
TCTAGATGCA 
TCTAGATGCA 
TCTAGATGCA 
TCTAGATGCA 
TCTAGATGCA 



GGAATAAAAa 
GGAATAAAAa 
GGAATAAAAa 
GGAATAAAAa 
GGAATAAAAa 
GGAATAAAAa 
GGAATAAAAa 
GGAATAAAAa 



msa47 199 . 2 { 394_A909 \ 
msa47199.2{394_H36B i 
tnsa47199 . 2 (394_JM9130013 
msa47199.2{394_090 
msa47199.2{394_18RS21 
msa47199.2{394 2603 
msa47199 . 2 (394_CJB110 
msa47 199 .2(3 94_C0H1 
m8a47199.2(394_M732 
msa47199 . 2 { 394_M781 
msa47199.2(394_1169NT. 

Consensus 



101 

TAGATGGTAT 
TAGATGGTAT 
TAGATGGTAT 
TAGATGGTAT 
TAGATGGTAT 
TAGATGGTAT 
TAGATGGTAT 
TAGATGGTAT 
TAGATGGTAT 
TAGATGGTAT 
TAGATGGTAT 



CaTATCTGTC 
CaTATCTGTC 
CaTATCTGTC 
CgTATCTGTC 
CgTATCTGTC 
CgTATCTGTC 
CgTATCTGTC 
CgTATCTGTC 
CgTATCTGTC 
CgTATCTGTC 
CgTATCTGTC 



TCTGCtGGTG 
TCTGCtGGTG 
TCTGCtGGTG 
TCTGCtGGTG 
TCTGCtGGTG 
TCTGCtGGTG 
TCTGCtGGTG 
TCTGCgGGTG 
TCTGCgGGTG 
TCTGCgGGTG 
TCTGCgGGTG 



CATTGTTTGG 
CATTGTTTGG 
CATTGTTTGG 
CATTGTTTGG 
CATTGTTTGG 
CATTGTTTGG 
CATTGTTTGG 
CATTGTTTGG 
CATTGTTTGG 
CATTGTTTGG 
CATTGTTTGG 



150 

TGTTAATTTT 
TGTTAATTTT 
TGTTAATTTT 
TGTTAATTTT 
TGTTAATTTT 
TGTTAATTTT 
TGTTAATTTT 
TGTTAATTTT 
TGTTAATTTT 
TGTTAATTTT 
TGTTAATTTT 



151 

msa4 7199.2(3 94_A909 J GTATCTAGAC 

tnsa47199.2{394 H36B) GTATCTAGAC 

msa47199 .2(3 94_jJM9130013 J GTATCTAGAC 

msa47199.2{394_090 GTATCTAGAC 

msa47199.2{394_18RS21 GTATCTAGAC 

ms a4 7 1 9 9 . 2 { 3 94_2603 J GTATCTAGAC 

msa47199.2(394_CJB110 GTATCTAGAC 

msa4 7199.2(3 94_COHl ' GTATCTAGAC 

msa47 199 .2(3 94_M732 } GTATCTAGAC 

msa4 7199.2(3 94_M7 8 1 } GTATCTAGAC 

msa47199 . 2(394 JL169NT} GTATCTAGAC 

Consensus ********** 



AACGAGAGAG 
AACGAGAGAG 
AACGAGAGAG 
AACGAGAGAG 
AACGAGAGAG 
AACGAGAGAG 
AACGAGAGAG 
AACGAGAGAG 
AACGAGAGAG 
AACGAGAGAG 
AACGAGAGAG 



GGCTTTGCGA 
GGCTTTGCGA 
GGCTTTGCGA 
GGCTTTGCGA 
GGCTTTGCGA 
GGCTTTGCGA 
GGCTTTGCGA 
GGCTTTGCGA 
GGCTTTGCGA 
GGCTTTGCGA 
GGCTTTGCGA 



TACAATAAAA 
TACAATAAAA 
TACAATAAAA 
TACAATAAAA 
TACAATAAAA 
TACAATAAAA 
TACAATAAAA 
TACAATAAAA 
TACAATAAAA 
TACAATAAAA 
TACAATAAAA 



200 

AGTATTTATC 
AGTATTTATC 
AGTATTTATC 
AGTATTTATC 
AGTATTTATC 
AGTATTTATC 
AGT ATTTA TC 
AGTATTTATC 
AGTATTTATC 
AGTATTTATC 
AGTATTTATC 



201 

msa4 7199.2(3 94_A9 09} CCACCCTaAA 

msa47199.2{394 H36B CCACCCTaAA 

rasa47199.2(394_JM9130013) CCACCCTaAA 

msa47199.2{394 090) CCACCCTaAA 

msa47199.2(394_18RS2l' CCACCCTaAA 

msa4 7 19*9 . 2 { 3 94_2 6 03 J CCACCCTaAA 

msa47199.2{394 CJB110 CCACCCTaAA 

msa4 7 19 9 . 2 ( 3 94_COHl CCACCCTgAA 

msa47199.2(394_M732 CCACCCTgAA 

msa47199.2(394_M781 CCACCCTgAA 

msa47199.2(394_1169NT} CCACCCTaAA 

Consensus *******-** 



TATATGAGTC 
TATATGAGTC 
TATATGAGTC 
TATATGAGTC 
TATATGAGTC 
TATATGAGTC 
TATATGAGTC 
TATATGAGTC 
TATATGAGTC 
TATATGAGTC 
TATATGAGTC 



TAAGgTCATG 
TAAGgTCATG 
TAAGgTCATG 
TAAGgTCATG 
TAAGgTCATG 
TAAGgTCATG 
TAAGgTCATG 
TAAGaTCATG 
TAAGaTCATG 
TAAGaTCATG 
TAAGaTCATG 



GcTTCGAACA 
GcTTCGAACA 
GcTTCGAACA 
GtTTCGAACA 
GtTTCGAACA 
GtTTCGAACA 
GtTTCGAACA 
GCTTCGAACA 
GcTTCGAACA 
GcTTCGAACA 
GcTTCGAACA 



250 

GGGAATTTTG 
GGGAATTTTG 
GGGAATTTTG 
GGGAATTTTG 
GGGAATTTTG 
GGGAATTTTG 
GGGAATTTTG 
GGGAATTTTG 
GGGAATTTTG 
GGGAATTTTG 
GGGAATTTTG 



251 

msa47199.2(394_A909j TTAATAAAGA 

msa47 199 .2(3 94_H3 SB \ TTAATAAAGA 

msa47199.2{394 JM9130013 TTAATAAAGA 

msa47199T2{394_090> TTAATAAAGA 

msa47199 . 2 { 394_18RS21 TTAATAAAGA 

msa47199.2{394 2603 TTAATAAAGA 

msa47199.2(394_CJB110 ) TTAATAAAGA 

msa47199.2(394 COHl} TTAATAAAGA 

msa4 7 199 .2(3 94"*M732 ' TTAATAAAGA 

msa47199.2{394J4781J TTAATAAAGA 

msa47199.2{394_1169NT} TTAATAAAGA 

Consensus ********** 



TTTCACCTAT 
TTTCACCTAT 
TTTCACCTAT 
TTTCACCTAT 
TTTCACCTAT 
TTTCACCTAT 
TTTCACCTAT 
TTTCACCTAT 
TTTCACCTAT 
TTTCACCTAT 
TTTCACCTAT 



TATGAAGTTC 
TATGAAGTTC 
TATGAAGTTC 
TATGAAGTTC 
TATGAAGTTC 
TATGAAGTTC 
TATGAAGTTC 
TATGAAGTTC 
TATGAAGTTC 
TATGAAGTTC 
TATGAAGTTC 



CTATGAAATT 
CTATGAAATT 
CTATGAAATT 
CTATGAAATT 
CTATGAAATT 
CTATGAAATT 
CTATGAAATT 
CTATGAAATT 
CTATGAAATT 
CTATGAAATT 
CTATGAAATT 



300 

GGATGTATTT 
GGATGTATTT 
GGATGTATTT 
GGATGTATTT 
GGATGTATTT 
GGATGTATTT 
GGATGTATTT 
GGATGTATTT 
GGATGTATTT 
GGATGT ATTT 
GGATGTATTT 



msa47199. 2(394 JV909| 
msa47199.2{394_H36B 
msa47199 . 2 { 394_JM9130013 
msa47199.2{394_090 
msa47 1 9 9 . 2 { 3 94_18RS2 1 
msa47199 . 2 (394_2603 
msa47199 . 2 { 394_CJB110 
msa47199.2(394_COHl 
msa47199 . 2 ( 394_M732 
msa47199.2{394_M781 
msa47199.2(394_1169NT] 
Consensus 



msa47199.2(394 A909} 
msa47199 . 2 (394 _H36B) 



301 

GACGATGAAG 
GACGATGAAG 
GACGATGAAG 
GACGATGAAG 
GACGATGAAG 
GACGATGAAG 
GACGATGAAG 
GACGATGAAG 
GACGATGAAG 
GACGATGAAG 
GACGATGAAG 



CATTTAAAAA 
CATTTAAAAA 
CATTTAAAAA 
CATTTAAAAA 
CATTTAAAAA 
CATTTAAAAA 
CATTTAAAAA 
CATTTAAAAA 
CATTTAAAAA 
CATTTAAAAA 
CATTTAAAAA 



ATCAAGTATT 
ATCAAGTATT 
ATCAAGTATT 
ATCAAGTATT 
ATCAAGTATT 
ATCAAGTATT 
ATCAAGTATT 
ATCAAGTATT 
ATCAAGTATT 
ATCAAGTATT 
ATCAAGTATT 



GATTTTTACG 
GATTTTTACG 
GATTTTTACG 
GATTTTTACG 
GATTTTTACG 
GATTTTTACG 
GATTTTTACG 
GATTTTTACG 
GATTTTTACG 
GATTTTTACG 
GATTTTTACG 



•350 

CAGTTGCTAC 
cAGTTGCTAC 
CAGTTGCTAC 
tAGTTGCTAC 
tAGTTGCTAC 
tAGTTGCTAC 
tAGTTGCTAC 
tAGTTGCTAC 
tAGTTGCTAC 
tAGTTGCTAC 
CAGTTGCTAC 



351 400 
AGAGATGACA TCTGGTAAAC CTGAgTATTT TAAAATTGAT AGTGTtTTTG 
AGAGATGACA TCTGGTAAAC CTGAgTATTT TAAAATTGAT AGTGTtTTTG 



1083 



WO 2004/018646 



PCT7US2003/026827 



Table 77: Comparative Sequences relating toSAG2059 



msa47199 . 2 { 394_JM9130013 
msa47199.2{394_090 
msa47199.2{394_IBRS21 
msa47199.2{394_2603 
maa47199.2{394 CJBHO 
msa47199 . 2 (394_C0H1 
msa47199.2 394_M732 
msa47199.2(394_M781 
msa47199.2{394_1169NT 
Consensus 



AGAGATGACA 
AGAGATGACA 
AGAGATGACA 
AGAGATGACA 
AGAGATGACA 
AGAGATGACA 
AGAGATGACA 
AGAGATGACA 
AGAGATGACA 



TCTGGTAAAC 
TCTGGTAAAC 
TCTGGTAAAC 
TCTGGTAAAC 
TCTGGTAAAC 
TCTGGTAAAC 
TCTGGTAAAC 
TCTGGTAAAC 
TCTGGTAAAC 



********** ********** 



CTGAgTATTT 
CTGAaTATTT 
CTGAaTATTT 
CTGAaTATTT 
CTGAaTATTT 
CTGAaTATTT 
CTGAaTATTT 
CTGAaTATTT 
CTGAaTATTT 
****.***** 



TAAAATTGAT 
TAAAATTGAT 
TAAAATTGAT 
TAAAATTGAT 
TAAAATTGAT 
TAAAATTGAT 
TAAAATTGAT 
TAAAATTGAT 
TAAAATTGAT 
********** 



AGTGTtTTTG 
AGTGTtTTTG 
AGTGTtTTTG 
AGTGTtTTTG 
AGTGTtTTTG 
AGTGTtTTTG 
AGTGTtTTTG 
AGTGTtTTTG 
AGTGTcTTTG 
*****_**** 



msa47199.2{394_A909 
msa47199 . 2 {394_H36B 
msa47199.2{394_JM9130013 
msa47199.2{394_090 
rasa47199 . 2 {394_18RS21 
msa47199.2{394 2603 
msa47199 . 2 { 394_GJB110 
msa47199 . 2 { 394_C0H1 
msa47199.2(394_M732 
msa47199.2{394_M781 
msa47199.2{394_1169NT 
Consensus 



401 

AACAAATGGA 
AACAAATGGA 
AACAAATGGA 
AACAAATGGA 
AACAAATGGA 
AACAAATGGA 
AACAAATGGA 
AACAAATGGA 
AACAAATGGA 
AACAAATGGA 
AACAAATGGA 



AATTTTACGT 
AATTTTACGT 
AATTTTACGT 
AATTTTACGT 
AATTTTACGT 
AATTTTACGT 
AATTTTACGT 
AATTTTACGT 
AATTTTACGT 
AATTTTACGT 
AATTTTACGT 



GCTAGTTCAG 
GCTAGTTCAG 
GCTAGTTCAG 
GCTAGTTCAG 
GCTAGTTCAG 
GCTAGTTCAG 
GCTAGTTCAG 
GCTAGTTCAG 
GCTAGTTCAG 
GCTAGTTCAG 
GCTAGTTCAG 



CATTACCAGT 
CATTACCAGT 
CATTACCAGT 
CATTACCAGT 
CATTACCAGT 
CATTACCAGT 
CATTACCAGT 
CATTACCAGT 
CATTACCAGT 
CATTACCAGT 
CATTACCAGT 



450 

AGTCTCAAAG 
AGTCTCAAAG 
AGTCTCAAAG 
AGTCTCAAAG 
AGTCTCAAAG 
AGTCTCAAAG 
AGTCTCAAAG 
AGTCTCAAAG 
AGTCTCAAAG 
AGTCTCAAAG 
AGTCTCAAAG 



maa47199.2{394_A909' 
msa47199.2{394_H36B' 
msa47199.2{394_JM9130013 
msa47199.2{394_090 
msa47199.2{394_18RS21 
msa47199.2{394_2603 
msa47199.2{394_CJB110 
018 a47 199 . 2 { 3 94_C0H1 
msa47199 .2 (394_M732 
msa47199.2(394_M781 
msa47199.2{394_1169NT 
Consensus 



451 

ATGGTTGtTT 
ATGGTTGtTT 
ATGGTTGtTT 
ATGGTTGaTT 
ATGGTTGaTT 
ATGGTTGaTT 
ATGGTTGaTT 
ATGGTTGaTT 
ATGGTTGaTT 
ATGGTTGaTT 
ATGGTTGaTT 



GGCAGGGGAA 
GGCAGGGGAA 
GGCAGGGGAA 
GGCAGGGGAA 
GGCAGGGGAA 
GGCAGGGGAA 
GGCAGGGGAA 
GGCAGGGGAA 
GGCAGGGGAA 
GGCAGGGGAA 
GGCAGGGGAA 



AAAGTACTTA 
AAAGTACTTA 
AAAGTACTTA 
AAAGTACTTA 
AAAGTACTTA 
AAAGTACTTA 
AAAGTACTTA 
AAAGTACTTA 
AAAGTACTTA 
AAAGTACTTA 
AAAGTACTTA 



GATGGTGGTT 
GATGGTGGTT 
GATGGTGGTT 
GATGGTGGTT 
GATGGTGGTT 
GATGGTGGTT 
GATGGTGGTT 
GATGGTGGTT 
GATGGTGGTT 
GATGGTGGTT 
GATGGTGGTT 



500 

TATCTGATAG 
TATCTGATAG 
TATCTGATAG 
TATCTGATAG 
TATCTGATAG 
TATCTGATAG 
TATCTGATAG 
TATCTGATAG 
TATCTGATAG 
TATCTGATAG 
TATCTGATAG 



msa47199.2{394_A909' 
msa47199 . 2 {394JH36B 
msa47199 . 2 { 394_JM9i3 0013 ' 
msa47199.2{394_090 
msa47199.2{394JL8RS21 
msa47199 . 2 {394_2603 
msa471 9 9 . 2 { 3 94JCJB1 10 
msa4 7199. 2(3 94 JCOH1 
msa47199.2f394_M732 
msa47199.2{394 M781 
msa47199 . 2 { 394_1169NT 
Consensus 



501 

TATtCCCGTT 
TATtCCCGTT 
TATtCCCGTT 
TATtCCCGTT 
TATtCCCGTT 
TATtCCCGTT 
TATtCCCGTT 
TATtCCCGTT 
TATtCCCGTT 
TATtCCCGTT 
TATcCCCGTT 
***_****** 



GATTTTGCCC 
GATTTTGCCC 
GATTTTGCCC 
GATTTTGCCC 
GATTTTGCCC 
GATTTTGCCC 
GATTTTGCCC 
GATTTTGCCC 
GATTTTGCCC 
GATTTTGCCC 
GATTTTGCCC 
********** 



GTGGTTTAGG 
GTGGTTTAGG 
GTGGTTTAGG 
GTGGTTTAGG 
GTGGTTTAGG 
GTGGTTTAGG 
GTGGTTTAGG 
GTGGTTTAGG 
GTG GTTT AGG 
GTGGTTTAGG 
GTGGTTTAGG 
********** 



ATTTGACAAG 
ATTTGACAAG 
ATTTGACAAG 
ATTTGACAAG 
ATTTGACAAG 
ATTTGACAAG 
ATTTGACAAG 
ATTTGACAAG 
ATTTGACAAG 
ATTTGACAAG 
ATTTGACAAG 
********** 



550 

TTGATTGTTG 
TTGATTGTTG 
TTGATTGTTG 
TTGATTGTTG 
TTGATTGTTG 
TTGATTGTTG 
TTGATTGTTG 
TTGATTGTTG 
TTGATTGTTG 
TTGATTGTTG 
TTGATTGTTG 
********** 



msa47199.2{394_A909; 
maa47199. 2(394 H36B 
msa47199 . 2 {3 94_JM913 0013 
msa47199.2{394_090' 
msa47199 . 2 { 394_18RS21 
tnsa47 199 . 2 { 3 94_2603 
msa47199.2{394_CJB110 
Oisa47199.2[394 COH1 
msa47199 .2 (394~M732 
msa47199 .2{394_M781 
msa47199.2{394_1169NT 
Consensus 



551 

TGATGACTAG 
TGATGACTAG 
TGATGACTAG 
TGATGACTAG 
TGATGACTAG 
TGATGACTAG 
TGATGACTAG 
TGATGACTAG 
TGATGACTAG 
TGATGACTAG 
TGATGACTAG 



GCCGCTCAAT 
GCCGCTCAAT 
GCCGCTCAAT 
GCCGCTCAAT 
GCCGCTCAAT 
GCCGCTCAAT 
GCCGCTCAAT 
GCCGCTCAAT 
GCCGCTCAAT 
GCCGCTCAAT 
GCCGCTCAAT 



TATCAGAAAA 
TATCAGAAAA 
TATCAGAAAA 
TATCAGAAAA 
TATCAGAAAA 
TATCAGAAAA 
TATCAGAAAA 
TATCAGAAAA 
TATCAGAAAA 
TATCAGAAAA 
TATCAGAAAA 



AGCCTTCAAG 
AGCCTTCAAG 
AGCCTTCAAG 
AGCCTTCAAG 
AGCCTTCAAG 
AGCCTTCAAG 
AGCCTTCAAG 
AGCCTTCAAG 
AGCCTTCAAG 
AGCCTTCAAG 
AGCCTTCAAG 



600 

TGGACGATTG 
TGGACGATTG 
TGGACGATTG 
TGGACGATTG 
TGGACGATTG 
TGGACGATTG 
TGGACGATTG 
TGGACGATTG 
TGGACGATTG 
TGGACGATTG 
TGGACGATTG 



>.2{394_A909 
).2{394_H36B 



msa47l99 
msa47199 
msa47199 . 2 { 394_JM9130013 
msa47199 . 2{394_090 
msa47199 . 2 {394_1BRS21 
msa47199.2{394_2603 
msa47199.2{394 CJB110 
msa47199 . 2 (394_C0H1 
msa47199.2{394_M732 
maa47199.2{394_M781 
msa47199 . 2 {394_1169NT 
Consensus 



601 

TATAAAACTC 
TATAAAACTC 
TATAAAACTC 
TATAAAACTC 
TATAAAACTC 
TATAAAACTC 
TATAAAACTC 
TATAAAACTC 
TATAAAACTC 
TATAAAACTC 
TATAAAACTC 



TGTATAGGAA 
TGTATAGGAA 
TGTATAGGAA 
TGTATAGGAA 
TGTATAGGAA 
TGTATAGGAA 
TGTATAGGAA 
TGTATAGGAA 
TGTATAGGAA 
TGTATAGGAA 
TGTATAGGAA 



ATATCCTAAT 
ATATCCTAAT 
ATATCCTAAT 
ATATCCTAAT 
ATATCCTAAT 
ATATCCTAAT 
ATATCCTAAT 
ATATCCTAAT 
ATATCCTAAT 
ATATCCTAAT 
ATATCCTAAT 



TTTGTAAAGA 
TTTGTAAAGA 
TTTGTAAAGA 
TTTGTAAAGA 
TTTGTAAAGA 
TTTGTAAAGA 
TTTGTAAAGA 
TTTGTAAAGA 
TTTGTAAAGA 
TTTGTAAAGA 
TTTGTAAAGA 



650 

CAGCCTCGAA 
CAGCCTCGAA 
CAGCCTCGAA 
CAGCCTCGAA 
CAGCCTCGAA 
CAGCCTCGAA 
CAGCCTCGAA 
CAGCCTCGAA 
CAGCCTCGAA 
CAGCCTCGAA 
CAGCCTCGAA 



msa47199.2{394_A909) 



651 700 
cCGGTACCAA CAGTATAATA ATAGcCTTGA AAAGGTCATG AGCCTTGAAA 



1084 



WO 2004/018646 



PCT/US2003/026827 



Table 77: Comparative Sequences relating toSAG2059 



msa4 7 19 9 . 2 { 3 94_H3 6B 
msa47199 . 2 {394_JM9130013 
msa47199.2{394_090 
msa47199.2{394 18RS21 
msa47199.2{394_2603 
msa47L99 . 2 { 394_CJB110 
msa47199.2{3 94_COHl 
rasa47199 . 2 { 394_M732 
msa47199.2{394_M781 
msa47199 . 2 { 394_1169NT 
Consensus 



CCGGTACCAA 
cCGGTACCAA 
tCGGTACCAA 
tCGGTACCAA 
tCGGTACCAA 
tCGGTACCAA 
tCGGTACCAA 
tCGGTACCAA 
tCGGTACCAA 
tCGGTACCAA 



CAGTATAATA 
CAGTATAATA 
CAGTATAATA 
CAGTATAATA 
CAGTATAATA 
CAGTATAATA 
CAGTATAATA 
CAGTATAATA 
CAGTATAATA 
CAGTATAATA 



ATAGcCTTGA 
ATAGcCTTGA 
ATAGtCTTGA 
ATAGtCTTGA 
ATAGtCTTGA 
ATAGtCTTGA 
ATAGtCTTGA 
ATAGtCTTGA 
ATAGtCTTGA 
ATAGcCTTGA 



AAAGGTCATG 
AAAGGTCATG 
AAAGGTCATG 
AAAGGTCATG 
AAAGGTCATG 
AAAGGTCATG 
AAAGGTCATG 
AAAGGTCATG 
AAAGGTCATG 
AAAGGTCATG 



AGCCTTGAAA 
AGCCTTGAAA 
AGCCTTGAAA 
AGCCTTGAAA 
AGCCTTGAAA 
AGCCTTGAAA 
AGCCTTGAAA 
AGCCTTGAAA 
AGCCTTGAAA 
AGCCTTGAAA 



msa47 199 . 2 ( 394_A909 
msa47199.2{394_H36B , 
msa47199.2{394_JM9130013 
rosa47199.2{394 090 
msa47199.2{394_18RS21 
msa47199 . 2 {394_2603 
rasa47199.2{394 CJB110 
rosa47199. 2(394 COH1 
msa47199.2{394~M732 
msa47199.2{394_M781 
msa4 7 1 9 9 . 2 { 3 94_1 1 69NT 
Consensus 



701 

AAACAGGCGA 
AAACAGGCGA 
AAACAGGCGA 
AAACAGGCGA 
AAACAGGCGA 
AAACAGGCGA 
AAACAGGCGA 
AAACAGGCGA 
AAACAGGCGA 
AAACAGGCGA 
AAACAGGCGA 



TCTATTTGCA 
TCTATTTGCA 
TCTATTTGCA 
TCTATTTGCA 
TCTATTTGCA 
TCTATTTGCA 
TCTATTTGCA 
TCTATTTGCA 
TCTATTTGCA 
TCTATTTGCA 
TCTATTTGCA 



ATTAGaCCaA 
ATT AG a CC aA 
ATTAGaCCaA 
ATTAGaCCgA 
ATTAGaCCgA 
ATTAGaCCgA 
ATTAGaCCgA 
ATTAGaCCgA 
ATTAGaCCgA 
ATTAGaCCgA 
ATTAGgCOgA 



GTAAgAGCTT 
GTAAgAGCTT 
GTAAgAGCTT 
GTAAgAGCTT 
GTAAgAGCTT 
GTAAgAGCTT 
GTAAgAGCTT 
GTAAgAGCTT 
GTAAgAGCTT 
GTAAgAGCTT 
GTAAaAGCTT 



750 

GGTTATTGgC 
GGTTATTGgC 
GGTTATTGgC 
GGTTATTGgC 
GGTTATTGgC 
GGTTATTGgC 
GGTTATTGgC 
GGTTATTGgC 
GGTTATTGgC 
GGTTATTGgC 
GGTTATTGtC 



msa47199.2{394_A909; 
raea47199 . 2 { 3 94_H3 6B 
msa47199 . 2 {394_JM9130013 
msa47199-2{394_090 
rasa47199.2{394_18RS21 
msa47199 . 2 {394_2603 
msa47199 . 2{394__CJB110 
msa47199 . 2 f 394_COHl 
msa47199.21394_M732 
msa47199 . 2 {394_M781 
msa47199 . 2 {394_1169NT 
Consensus 



751 

CGCTTAGAGA 
CGCTTAGAGA 
CGCTTAGAGA 
CGCTTAGAGA 
CGCTTAGAGA 
CGCTTAGAGA 
CGCTTAGAGA 
CGCTTAGAGA 
CGCTTAGAGA 
CGCTTAGAGA 
CGCTTAGAGA 



AGAATCCGGA 
AGAATCCGGA 
AGAATCCGGA 
AGAATCCGGA 
AGAATCCGGA 
AGAATCCGGA 
AGAATCCGGA 
AGAATCCGGA 
AGAATCCGGA 
AGAATCCGGA 
AGAATCCGGA 



TAAACTTGAT 
TAAACTTGAT 
TAAACTTGAT 
TAAACTTGAT 
TAAACTTGAT 
TAAACTTGAT 
TAAACTTGAT 
TAAACTTGAT 
TAAACTTGAT 
TAAACTTGAT 
TAAACTTGAT 



AGTATTTATC 
AGTATTTATC 
AGTATTTATC 
AGTATTTATC 
AGTATTTATC 
AGTATTTATC 
AGTATTTATC 
AGTATTTATC 
AGTATTTATC 
AGTATTTATC 
AGTATTTATC 



800 

AGCTTGGTAT 
AGCTTGGTAT 
AGCTTGGTAT 
AGCTTGGTAT 
AGCTTGGTAT 
AGCTTGGTAT 
AGCTTGGTAT 
AGCTTGGTAT 
AGCTTGGTAT 
AGCTTGGTAT 
AGCTTGGTAT 



raaa47 19 9 . 2 { 3 94_A9 09 
msa47199.2{394_H36B 
msa47199.2{394 JM9130013 
msa4 719972 { 3 94_090 
msa47199 . 2 {394_18RS21 
msa47199.2{394_2603 
rasa47 19 9 • 2 { 3 94 JCJB1 1 0 
msa47199.2{394 COH1 
maa47199.2f394_M732 
msa47 199 . 2 (394J4781 
msa47199 . 2{394_1169NT 
Consensus 



801 

GAAAgATGCT 
GAAAgATGCT 
GAAAgATGCT 
GAAAgATGCT 
GAAAgATGCT 
GAAAgATGCT 
GAAAgATGCT 
GAAAtATGCT 
GAAAtATGCT 
GAAAtATGCT 
GAAAgATGCT 



AAAAGTGgGA 
AAAAGTGgGA 
AAAAGTGgGA 
AAAAGTGtGA 
AAAAGTGtGA 
AAAAGTGtGA 
AAAAGTGtGA 
AAAAGTGtGA 
AAAAGTGtGA 
AAAAGTGtGA 
AAAAGTGtGA 



TGCCTGAGCT 
TGCCTGAGCT 
TGCCTGAGCT 
TGCCTGAGCT 
TGCCTGAGCT 
TGCCTGAGCT 
TGCCTGAGCT 
TGCCTGAGCT 
TGCCTGAGCT 
TGCCTGAGCT 
TGCCTGAGCT 



GAATAGTTAT 
GAATAGTTAT 
GAATAGTTAT 
GAATAGTTAT 
GAATAGTTAT 
GAATAGTTAT 
GAATAGTTAT 
GAATAGTTAT 
GAATAGTTAT 
GAATAGTTAT 
GAATAGTTAT 



849 

CTAATGAAA 
CTAATGAAA 
CTAATGAAA 
CTAATGAAA 
CTAATGAAA 
CTAATGAAA 
CTAATGAAA 
CTAATGAAA 
CTAATGAAA 
CTAATGAAA 
CTAATGAAA 



SEQ ZD NO. 7712 • 
STRAIN 2603 frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFIXAG I KI DGI VSVS AGALFGVNFVSRQRERALRY 

NKKYIiSHPKYMSLRSWFRTGNPVNKDFTYYBVPMKIiDVTO 

GKPEYFKIDSVFEQMEILRASSALPWSKMVDWQGKKY^ 

IVVWTRPLNYQKKPSSGRLYKTLYRKYFN^ 

RPSKSLVIGRLEKNPDKLDS I YQLGMKDAKS VMPELNS YLMK 

SBQ ZD NO. 7713 
STRAIN 090 frame 1 

PMLSVGLVLBGGGMRGLYTAGVLDAFTjDAGI KI DG I VS VSAGAL FGVNFVS RQRERALRY 
NKKYLSHPKYMSLRS WFRTGNFVNKDFTYYEVPMKLD^ 

GKPBYPKIDS VFEQME I LRASSALPWSKMVDWC^KKYLDGGLSDS I PVDFARGLGFDKL 
I VVMTRPLNYQKKPS SGRL YKTLYRKYPNFVKTASNRYQQYNNS LEKVMSLiEKTGDLFA I 
RP SKSLVT GRLEKNPDKLD S I YQLGMKDAKSVMPELNS YLMK 

SBQ ZD NO. 7714 

STRAIN A909 frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFLDAG I KVDGI I SVSAGALFGVNFVSRQRBRALRY 
NKKYLSHPKYMSLRSWLRTCNFVNKDFTYYBVPMKLDVFDDEAFK^ 
GKPEYFKIDSVFEQMEIIiRASSALPWSKMVVWOGKKYIJXSGLSDS I PVDFARGLGPDKL 
IVVMTRPIWYQKKPSSGRLYKTLYRKYFNFVK^ 
RPSK5LVIGRLBKNPDKLDSIYQLGMKDAKSGMPELNSYXMK 

SBQ ZD NO. 7715 
STRAIN H36B frame: 1 

PMLS VGLVLEGGGMRGLYTAGVLDAFLDAG I KVDG 1 1 SVSAGALFGVNFVSRQRERALRY 
NKKYLSHPKYMSLRSWLRTGNFWKEFTYYEVPMK^ 
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GKPEYFKIDSVFEQMEILRAS SALPWSKMVWQGKICYLDGGLSDSI PVDFARGLGFDKL 
I WMTRPLNYQKKP S SG RL YKTL YRKY PNFVKTASNR YQQ YNNSLEKVMS LE KTGDL FA I 
RPSKSLVIGRLEKNPDKLDSIYQLGMKDAKSGMPELNSYLMK 

SEQ ID NO. 7716 
STRAIN 18RS21 frame: t 

PMIiS VGX. VLEGGGMRGL YTAGVLD AFIiDAG I KI DG I VSVS AGALFGVNFVS RQRERALR Y 
NKKYLSHPKYMSIJiSWFRTGNFVNXDFTYYEVPMKLD^ 

GKPBYFKI DSVFEQME I IjRASSALPWSKMVDWO^KKYLDGGIiSDSIFVDFARGLGFDKL 

IVVMTRPLNYQKKPSSGRIjYKTLYRKYPNFVKTASNRYQQYNNSIjEKV^ 

RPSKSLV IGRLEKNPDKLDS I YQIjGMKDAKS VMPELNSYLMK 

SEQ XD NO. 7717 
STRAIN M732 frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFLDAG I KI DG IVSVSAGAL FGVNFVSRQRERALRY 
NKKYLSHPE YMSLRS WLRTGNFT/NKDFTYYEVPMK 

GKPE Y FKID S VFEQME I LRASSALPWS KMVDWQGKKYLDGGLSDS I PVDFARGLGFDKL 
IVVMTRPLNTQKKPSSGRLYKTLYRXYPNFVKTASNRYQQYNNSLEKV^ 
RPSKSLVIGRLBKNPDKLDS I YQLGMKYAKS VMPELNSYLMK 

SEQ XD NO. 7718 
STRAIN COH1 frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFLDAG IKIDGI VSVSAGAL FGVNFVSRQRERALRY 
NKKYLSHPBYMSLRSWLRTGNFVNKDFTYYEVPMKLDVTO I DFYWATEMTS 

GKPEYFKI DSVFEQME I LRASS ALPWS KMVDWQGKKYLDGGLSDS I PVDFARGLGFDKL 
IVVMTRPLNYQKKPSSGRLYKTLYRJCYPNFVKXASNRYO^ 
RPSKSLVIGRLEKNPDKLDS I YQLGMKYAKS VMPELNSYLMK 

SEQ XD NO. 7719 
STRAIN M781 frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFLDAG I KIDG I VSVSAGAL FGVNFVSRQRERALRY 
NKKYLSHPEYMSLRS WLRTGNFVNKDFTYYEVPMKLDVFDDEAFKKS S I D FYWATEMTS 
GKPEYFKIDSVFEQME I LRAS SAL P WS KMVD WQGKKYLDGGLS D S I PVD FARGLGFDKL 
I WMTRPLNYQKKP S SGRL YKTLYRKYPNFVKTASNRYQQYNNS LEKVMS LE KTGDLFAI 
RPSKSLVIGRLEKNPDKLDS I YQLGMKYAKSVMPELNSYLMK 

SEQ XD NO. 7720 
STRAIN CJB1 10 frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFLDAG I KI DG I VSVSAGALFGVNFVSRQRERALR Y 
NKKYLSHPKYMSLRSWFRTGNFVNKDFTYYEVPMKLDVFDDFJ^ 

GKPEYFKIDSVFEQME I LRAS S ALP WSKMVDWQGKKYLDGGLSDS I PVDFARGLGFDKL 
IVVMTRPIiNYQKKPSSGRLYKTLYRKYPNFVKTASNRYQQYNNSLEKVMSLEKTGDLFAI 
RPSKSLVIGRLEKNPDKLDS I YQLGMKDAKS VMPELNSYLMK 

SEQ XD NO. 7721 
STRAIN JM9 1300 13 frame: 1 

PMLSVGLVLEGGGMRGLYTAGVLDAFLDAG I KVDG 1 1 SVSAGAL FGVNFVSRQRERALRY 
NKKYLSHPKYMSLRS WLRTGNFWKDFTYYEVPMKLDVFDD 

GKPEYFKI DSVFEQME I LRAS SALPWSKMVVWQGKKYLDGGLSDS I PVDFARGLGFDKL 
IVVMTRPLNYQKKPSSGRLYKTLYRKYPttFVKTASNRYQ 
RPSKSLVIGRLEKNPDKLDS I YQLGMKDAKSGMPELNS YLMK 

SEQ XD NO. 7722 
STRAIN 1169NT frame: I 

PMLSVGLVLEGGGMRGLYTAGVLDAFLiDAGI KIDGI VSVSA 
NKKYLSHPKYMSIjRSWLRTGNFVNKDFTYY^VPMKLDVFDDEAF 
GKPEYFKIDSVFEQMEILRASSALPWSKMVDWQGKKYLDGGLSDSIPVDFA 
IVVMTRPLNYQKKPSSGRLYKTLYRKYPNFVKTASNRYQQYNNSLEKVMSL^ 
RPSKSLVIVRLEKNPDKLDS I YQLGMKDAKS VMPELNSYLMK 



msa47322 . 2 (394_A909 
ntsa47322.2(394_H36B 
V msa47322.2{394 JM9130013 
msa4732272{394 090 
msa47322 . 2 f 394_1169NT 
rasa47322.2(394_18RS21 
nma47322.2{394_2603 
msa47322.2{394 CJB110 
msa47322 . 2 ( 3?4_COHl 
msa47322 . 2 (394_M732 
msa47322.2(394_M781 
Consensus 



PMLSVGLVLE 
PMLSVGLVLE 
PMLSVGLVLE 
PMLSVGLVLE 
PMLSVGLVLE 
PMLSVGLVLE 
PMLSVGLVLE 
PMLSVGLVLE 
PMLSVGLVLE 
PMLSVGLVLE 
PMLSVGLVLE 



GGGMRGLYTA 
GGGMRGLYTA 
GGGMRGLYTA 
GGGMRGLYTA 
GGGMRGLYTA 
GGGMRGLYTA 
GGGMRGLYTA 
GGGMRGLYTA 
GGGMRGLYTA 
GGGMRGLYTA 
GGGMRGLYTA 



GVLDAFLDAG 
GVLDAFLDAG 
GVLDAFLDAG 
GVLDAFLDAG 
GVLDAFLDAG 
GVLDAFLDAG 
GVLDAFLDAG 
GVLDAFLDAG 
GVLDAFLDAG 
GVLDAFLDAG 
GVLDAFLDAG 



IKvDGIiSVS 
IKvDGIiSVS 
IKvDGIiSVS 
IKlDGIvSVS 
IKiDGIvSVS 
IKiDGIvSVS 
IKiDGIvSVS 
IKiDGIvSVS 
IKiDGIvSVS 
IKiDGIvSVS 
IKiDGIvSVS 
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AGALFGVNFV 
AGALFGVNFV 
AGALFGVNFV 
AGALFGVNFV 
AGALFGVNFV 
AGALFGVNFV 
AGALFGVNFV 
AGALFGVNFV 
AGALFGVNFV 
AGALFGVNFV 
AGALFGVNFV 



msa473 2 2 . 2 { 3 94_A9 09 
msa47 32 2 .2(3 94_H3 6B 
msa47322 . 2 {394_JM9130013 
msa47322.2{394_090 
msa47322.2{394_1169NT 
msa47322. 2(394 18RS21 



51 

SRQRBRALRY 
SRQRERALRY 
SRQRBRALRY 
SRQRBRALRY 
SRQRERALRY 
SRQRBRALRY 



NKKYLSHPkY 
NKKYLSHPkY 
NKKYLSHPkY 
NKKYLSHPkY 
NKKYLSHPkY 
NKKYLSHPkY 



MSLRSW1RTG 
MSLRSW1RTG 
MSLRSW1RTG 
MSLRSWfRTG 
MSLRSWlRTG 
MSLRSWfRTG 



NFVNKDFTYY 
NFVNKDFTYY 
NFVNKDFTYY 
NFVNKDFTYY 
NFVNKDFTYY 
NFVNKDFTYY 



100 

EVPMKLDVFD 
EVPMKLDVFD 
EVPMKLDVFD 
EVPMKLDVFD 
EVPMKLDVFD 
EVPMKLDVFD 



1086 



WO 2004/018646 



PCT/US2003/026827 



Table 77: Comparative Sequences relating toSAG2059 



msa47322 . 2 {394_2603 
msa47322 . 2 { 394_CJB110 
m8a47322.2(394 COH1 
msa47322.2{394~M732 
maa47322 .2{394_M7B1 
Consensus 



SRQRERALRY NKKYLSHPJcY MSLRSWfRTG 
SRQRERALRY NKKYLSHPkY MSLRSWfRTG 
SRQRERALRY NKKYLSHPeY MSLRSWlRTG 
SRQRERALRY NKKYLSHPeY MSLRSWlRTG 
SRQRERALRY NKKYLSHPeY MSLRSWlRTG 



NFVNKDFTYY EVPMKLDVFD 
NFVNKDFTYY EVPMKLDVFD 
NFVNKDFTYY EVPMKLDVFD 
NFVNKDFTYY EVPMKLDVFD 
NFVNKDFTYY EVPMKLDVFD 



msa47322 . 2 f 394_A909 
msa47322 . 2 (394_H36B 
tnsa47322.2{394_JM9130013 
msa47322 . 2 { 394_090 
msa47322 . 2 f 394_1169NT 
msa47322 . 2 ( 394_18RS21 
msa47322.2{394_2603 
rasa47322.2{394_CJB110 
msa47322 .2 (394_C0H1 
jnsa47322.2<394_M732 
rasa47 3 2 2 . 2 { 3 94_M7 8 1 
Consensus 
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DEAFKKSSID 
DEAFKKSSID 
DEAFKKSSID 
DEAFKKSSID 
DEAFKKSSID 
DEAFKKSSID 
DEAFKKSSID 
DEAFKKSSID 
DEAFKKSSID 
DEAFKKSSID 
DEAFKKSSID 



FYaVATEMTS 
FYaVATEMTS 
FYaVATEMTS 
FYvVATEMTS 
FYaVATEMTS 
FYvVATEMTS 
FYvVATEMTS 
FYvVATEMTS 
FYvVATEMTS 
FYvVATEMTS 
FYvVATEMTS 



GKPEYFKIDS 
GKPEYFKIDS 
GKPEYFKIDS 
GKPEYFKIDS 
GKPEYFKIDS 
GKPEYFKIDS 
GKPEYFKIDS 
GKPEYFKIDS 
GKPEYFKIDS 
GKPEYFKIDS 
GKPEYFKIDS 



VFEQMEILRA 
VFEQMEILRA 
VFEQMEILRA 
VFEQMEILRA 
VFEQMEILRA 
VFEQMEILRA 
VFEQMEILRA 
VFEQMEILRA 
VFEQMEILRA 
VFEQMEILRA 
VFEQMBILRA 
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SSALPWSKM 
SSALPWSKM 
SSALPWSKM 
SSALPWSKM 
SSALPWSKM 
SSALPWSKM 
SSALPWSKM 
SSALPWSKM 
SSALPWSKM 
SSALPWSKM 
SSALPWSKM 



tnsa47322.2(394_A909; 
msa47322 . 2 { 394_H36b' 
msa47322.2{394_JM9130013 
msa47322 . 2 { 394_090 ' 
msa47322.2{394_1169NT' 
msa47322.2{394_18RS21 
maa47322 . 2 { 394_2603 
msa47322.2{394_CJB110 
msa47322 . 2 (394_C0H1 
msa47322.2(394_M732 
msa47322.2{394_M781 
Consensus 



151 

WWQGKKYLD 
WWQGKKYLD 
WWQGKKYLD 
VdWQGKKYLD 
VdWQGKKYLD 
VdWQGKKYLD 
VdWQGKKYLD 
VdWQGKKYLD 
VdWQGKKYLD 
VdWQGKKYLD 
VdWQGKKYLD 



GGLSDSIPVD 
GGLSDSIPVD 
GGLSDSIPVD 
GGLSDSIPVD 
GGLSDSIPVD 
GGLSDSIPVD 
GGLSDSIPVD 
GGLSDSIPVD 
GGLSDSIPVD 
GGLSDSIPVD 
GGLSDSIPVD 



FARGLGFDKL 
FARGLGFDKL 
FARGLGFDKL 
FARGLGFDKL 
FARGLGFDKL 
FARGLGFDKL 
FARGLGFDKL 
FARGLGFDKL 
FARGLGFDKL 
FARGLGFDKL 
FARGLGFDKL 



IWMTRPLNY 
IWMTRPLNY 
IWMTRPLNY 
IWMTRPLNY 
IWMTRPLNY 
IWMTRPLNY 
IWMTRPLNY 
IWMTRPLNY 
IWMTRPLNY 
IWMTRPLNY 
IWMTRPLNY 
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QKKP SSGRLY 
QKKPSSGRLY 
QKKP SSGRLY 
QKKPSSGRLY 
QKKPSSGRLY 
QKKPSSGRLY 
QKKPSSGRLY 
QKKPSSGRLY 
QKKPSSGRLY 



QKKPSSGRLY 



msa47322.2{394_A909 
TOsa47322.2{394_H36B 
msa47322 . 2 {394_JM9130013 
• rasa47322 .2{394_090 
msa47 322 . 2 [ 394_1169NT 
m8a47322.2{394_18RS21 
msa47322.2{394_2603 
msa47322.2{394jCJB110 
msa47322.2{394__C0Hl 
msa47322 . 2 { 394JM732 
msa47322.2{394_M781 
Consensus 



201 

KTLYRKYPNF 
KTLYRKYPNF 
KTLYRKYPNF 
KTLYRKYPNF 
KTLYRKYPNF 
KTLYRKYPNF 
KTLYRKYPNF 
KTLYRKYPNF 
KTLYRKYPNF 
KTLYRKYPNF 
KTLYRKYPNF 



VKTASNRYQQ 
VKTASNRYQQ 
VKTASNRYQQ 
VKTASNRYQQ 
VKTASNRYQQ 
VKTASNRYQQ 
VKTASNRYQQ 
VKTASNRYQQ 
VKTASNRYQQ 
VKTASNRYQQ 
VKTASNRYQQ 



YNNSLEKVMS 
YNNSLBKVMS 
YNNSLEKVMS 
YNNSLEKVMS 
YNNSLEKVMS 
YNNSLEKVMS 
YNNSLEKVMS 
YNNSLEKVMS 
YNNSLEKVMS 
YNNSLEKVMS 
YNNSLEKVMS 



LEKTGDLFAI 
LEKTGDLFAI 
LEKTGDLFAI 
LEKTGDLFAI 
LEKTGDLFAI 
LBKTGDLFAI 
LEKTGDLFAI 
LEKTGDLFAI 
LEKTGDLFAI 
LEKTGDLFAI 
LEKTGDLFAI 



250 

RPSKSLVIgR 
RPSKSLVIgR 
RPSKSLVIgR 
RPSKSLVIgR 
RPSKSLVTvR 
RPSKSLVIgR 
RPSKSLVIgR 
RPSKSLVIgR 
RPSKSLVIgR 
RPSKSLVIgR 
RPSKSLVIgR 



msa47322 . 2 {394_A909 
msa47322.2{394_H36B 
msa47322.2{394_JM9130013 
msa47322 ,2{394_090 
rasa47322 . 2 { 394_1169NT 
msa47322 .2{394_18RS21 
msa47322 . 2 {394J2603 
insa47322 . 2{394_CJB110 
rasa47322. 2(394 COH1 
rasa47322.2{394~M732 
maa47322.2{394_M781 
Consensus 



251 

LEKNPDKLDS 
LBKNPDKLDS 
LEKNPDKLDS 
LEKNPDKLDS 
LBKNPDKLDS 
LEKNPDKLDS 
LBKNPDKLDS 



LEKNPDKLDS 
LEKNPDKLDS 
LBKNPDKLDS 



IYQLGMKdAK 
IYQLGMKdAK 
IYQLGMKdAK 
IYQLGMKdAK 
IYQLGMKdAK 
IYQLGMKdAK 
IYQLGMKdAK 
IYQLGMKdAK 
IYQLGMKyAK 
IYQLGMKyAK 
IYQLGMKyAK 



********** *******.** 



282 

SgMPELNSYL MK 
SgMPELNSYL MK 
SgMPELNSYL MK 
SvMPBLNSYL MK 
SvMPELNSYL MK 
SvMPBLNSYL MK 
SvMPELNSYL MK 
SvMPELNSYL MK 
SvMPBLNSYL MK 
SvMPELNSYL MK 
SvMPELNSYL MK 
*_******** ** 
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SEQ ID NO. 7601 
STRAIN 2603 

ATGAAAGTTTTAGTAGTTGATGAT^ * 

AATAA GTATGATTCTA ACCTCX jTTATAGCAGAGGCGCATGATATC 

ATTTTACTTAGAGAAACTTTTGATGTAGCACTXOT 

GGGTTGCAATTAGCAGAGTATATCAATAAAATGCCCAAACCA 

ACTGCITATGATCAATATGCTATTCAGGCITTTGAG 

AAACCCTATGATTTTGATAGGCTAAAGCMGCTATGGATAGAGTAA 

ACAGTAGAAGATCX3AATCTATCTGGTGTCGGCG^ 

CAAGGAAAACTGATTATACAAACACCTGATAAAAATTATGAAAT^ 

CAATGGCAAGATAAACTACCATCATCTCAATTTGTACGGGTACA 

AACATTAATGCTATTAAAACGATTGAACCTTGGTTTAACCA^ CTT 

TGTAATAAAATAAGAGTTCCTGTTAGCAGAGCAAATGTAA^ 

GGCATATCTACC 

SEQ ID NO. 7802 
STRAIN 090 

AAAGTTTTAGTAGTTGATGATGAACCAGTTGCACGTAA 

03AATTAATTTACCTTCTTAATAAOTATGATTCT 

AGGCGCATGATATGGCTACTGC^TTAGCTATTTTACTTAG 

GATGTAGCALTlVirrAGATATCCATCTCAGAGATGATTCTGGGTTGCAATT 

AGCAGAGTATATCAATAAAATGCCCAAACCACCATTATTGATA 

CTGCTTATGATCAATATGCTATTCAGGCTTT^ 

TATTTGTTAAAACCCTATGATTTTGATAGGCTAAAGC^ 

AGTAAAAGGAGCGCTAAGTACATCTACAATTATAGAGAGCXn'AACITC^ 



rCCTTTTGATTGAAGCTATGCAAGGAAAACT 
GATTATACAAACACCTGATAAAAATTATGAAATTGATGGCTC^^ 
AATGGCAAGATAAACTACCATCATCTCAATTTGTACGGGTAC^TCGCT 
TACATTGTGAACATTAATGCTATTAAAACGATTG 
AACACTTCAGTTACACCITTGTAATAAAATAACAGTTCCTGTT 
CAAATGTAAAACCCCTAAAACAAATGTTAGGCATATCTACC 

SEQ ID NO. 7803 
STRAIN A909 

AAAGTITTAGTAGTTGATGATGAACC^GTTGCACGTAAC 

GAATTAATITACCTTCTTAATAAGTATGATTC 

GGOTCATGATATGGCTACTGCATTAGCTATTTTACTTA^ 



GCA.GAGTATATCAATAAAATGCCCAAACCACCATTATTGATATTCGCGAC 
TG CTTATGATCAATATG CTATTCAAG CTTTTGAGCATGATGCGCGTG ATT 
ATTTGTTAAAACCCTATGAGTTTGATAGGCTAAAGCAAGCTATGGATAGA 
GTAAAAGGAGCG CTAAGTACAT CTAGAATTAT AG AGAG CGTAACTTC CGG 
CCCTCTCTTCAAGaVACAGTATCCATTGACA^ 
TGGTGTCGGCGGATGATATCCTTTTGATTGA^ 

ATTATACAAACACCTGATAAAAATTATGAAATTGATGG CTCTCT ACAACA 

ATGGCAAGATAAACTACCATCATCTCAATTTGTACX3GGTGCA 

ACATTGTGAATATTAATGCTATTAAAACGATTGAACCTTGg 

ACACITCAGTTACACCTTTGTAATAAAATAACAtSTT^ 

AAATGTAAAACCCCTAAAACAAATGTTAGGCATATCTACC 

SEQ ID NO. 7804 
STRAIN H36B 

AAAGTTTTAGTAGTIGATGATGAACCAGTTGCACGT 
AAOGAATTAATTTACCTTCTTAATAAGTATGAITCrA 
AGAGGCGCATGATATGG CTACTGCATTAG CrATTTTACTTAGAGAAACTT 
TTGATGTAGCACTGTTAGATATCCATCTCAGAGATGA 
TT7\GCAGAGTATATCAATAAAATGCCCAAACCACCATTATTGATATT 
GACTGCTTATGATCAATATGCTATTCAAG CTTTTGAG CATGATGCGCGTG 
ATTAITI'GUTAAAACCCTATGAGTTTGATAGGCTAAAGCAAGCTATGGAT 
AGAGTAAAAGGAGCGCTAAGTAGATCTACAATTATAGAGAGCGTAACrTC 



ATCIGGTGTCX^OGGATGATATCurri"lGATTGAAGCTATGCAAGGAAAA 
CK3ATTATACAAACAC£T]XsATAAAAATT^ 

ACAATGGCAAGATAAACTACCATCATCTCAATTTGTACGGGTG CACC^ 
CTTACATTGTGAATATTAATGCTATTAAAAOGATTGA^ 
CAAAGA.CTTGAGTTACACCri'lXTrAATAAAATAAGAGTTCCTG'lTAG GAG 
AGCAAATGTAAAACCCCTAAAACAAATGTTAGGCATATCTACC 

SEQ ID NO. 7805 
STR AIN 18R S21 

AAAGTTTTAOTAGTTGATGATGAACCAGTTGCA03TAAC 

GAATTAATTTACCITCTTAATAAGTATG ATTCT 

GGOGCATGATATGGCTACTGCATTAGCTATTTTACTTAG^ 

ATGTAGCACTGTTAGATATCCATCTCAGAGATGATTCTGGGT^ 

GCAGAGTATATCAATAAAATGCCCAAACCACCATTATTGATATTTGCGAC 

TGCITATGATCAATATGCTATTCAGGCITTTGAGCATGA 

ATTTGTTAAAACCCTATGATTTTGATAGGCEAAA^ 

GTAAAAGGAGCGCTAAGTACATCTACAATTATAGAGAGCGTAACTTCCX5G 
TtXTCTCTTCAAGCTUlCAGTATCGAITGAGAGTAGAA^ 

ATCCTTTTGATTGAAGCTATGCAAGGAAAACTG 
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ATTATACAAACACCTGATAAAAATTATGAAATTGATGGCTCTCTAC^ACA 
ATGG CAAGAT AAACTACCATCATCTCAATTTGTACGGGTACATC 
ACATTGTGAACATTAATGOTATTAAAACGATTGAACCTTGGT^ 
ACACTTCAGTTACACCTTTGTAATAAAATAACAGT^ 
AAATGTAAAACCCCTAAAACAAATGTTAGGCATATCTACC 

SEQ ZD NO. 7B06 
STR AIN M7 32 

AAAGTTTTAGTAGTTGATGATGAACCAGTT 

GCACGTAACGAATTAATTTACCTTCTTAATAAGTATGATTCTAACCTOGT 
TATAG CAGAGG CG CATGAT ATGGCT ACTG CATTAGCTATTTT ACTTAGAG 
AAACTTTTGATGTAG CACTGTTAGATATCCATCT CAGAGATGATTCTGGG 
TTGCAATTAGCAGAGTATATCAATAAAATGCCCAAACC^CCATTATrGAT 
ATTCG CGACTGCn^TATGATCAATATGCTATTCAGG CTTTTGAGCAGGATG 
CGCGTGATTATTTGTTAAAACXrCTATGAGTTTGATAGGTTAA^ CAAGCT 
ATGGATAGAGTAAAAGGAG CGCTAAGTACATCTACAATTATAGAGAGCGT 

GAATCTATCTGGTGTCGGCGGATGATATCCTTTIGATT^ 

GGAAAACTGATTATACAAACACCTGATAAAAATTATGAAATTGA 

TCTACAACAATGGCAAGATAAACTAC^TCATCTCAATTTC 

ATCGCTCrrTACATTGTGAATATTAATGCTATTAAAACX^TTC 

TTTAACCAAACACrTCAGTTACAGCTTTGTAATAA 

TAGCAGAGCAAATGTAAAACCCCTAAAACAAATGITAG^ 

SEQ ZD MO. 7807 
STRAIN COH1 

AAAGTTTTAGTAGTTGATGATGAACCAGTTGCACGTA 

ACCAATTAATTTACCTTCTTAATAAGTATG ^ 

GAGGCGCATGATATGGCTACTGCATTAGCTATTTTAC^ 

TGATGTAGCACTGTTAGATATCCATCTCAGAGATGATTCT^ 

TAGCAGAGTATATCAATAAAATGCCCAAACCACCATTATTGATATTCGCG 

ACTGCTTATGATCAATATGCTATTCAGG 

TTATTTGTTAAAACCCTATGAGTTTGATAGGTTAAAG CAAGCTATGGATA 
GAGTAAAAGGAGCGCTAAGTACATCTACAATTATAGAGAGCGTAGCTTCC 
GGTCCTCTCTTCAAGCAACAGTATCCATTG^ 

TCTGGTGTCGGCGGATGAT ATCCTTTTGATTGAAG CAAGGAAAA.C 

TGATTATACAAACACCTGATAAAAATTATGAAATTGATGGC^ 

CAATGGCAAGATAAACTACCATCATCrCAATTTG 

TTACATTGTGAATATTAATGCTATTAAAACGA^ 

AAACACTTCAGTTACACCTTTGTAATAAAATAACA^ 

GCAAATGTAAAACCCCTAAAACAAATGTrAGGCATATCTACC 

SEQ ZD NO. 7808 

STRAIN M781 

AAAGTTTTAGTAGTTGATGATGAACCAGTTGCACGTAAC 

GAATTAATTTACCITCrTAATAAGTATGATTCTAACCT 

GGCGCATGATATGGCTACTGCATTAGCTATTTTACOT 

GCAGAGTATATCAATAAAATGCCCAAACCACCATTAT^ 

TGCTTATGATCAATATGCTATTCAGGCTTTTGA^ 

ATTTGTTAAAACCCTATGAGTTTGATAGGTTAAA^ 

GTAAAAG<^GCGCTAAGTACATCrACAATTATAGAGAGCGTAGCrTCCX^ 

TCCTCTCTTCAAGCAACAGTATCCATTGA 

TGGTGTCGGCGGATGATATCCTTTTGATTGAAGro 

ATTATACAAACA.CCTGATAAAAATTATGAAA1TX5ATGGCT 

ATGGCAAGATAAACTACCATCATCTCAATTTGTAC^ 

ACATTGTGAATATTAATGCTATTAAAACGATTGA^ 

ACACTTCAGTTACACCITTGTAATAAAATAACA^ CAGAGC 
AAATGTAAAACrCCTAAAACAAATGTTAGGCATATCTACC 

SEQ ZD NO. 7809 
STRAIN CJB110 

CTTAATAAGTATGATTCTAACCTCGTTAT AG 
TACTGCATTAGCTATTrTACTTAGAGAAACTTTTGATCT 
ATATCCATCTCAGAGATGATTCTGGGTTGCAATTAGCAGA^ 
AAAATGCCXZAAACCACCATTATTGATA 
TGCTATTCAAGCTTTTGAGCATGATGCGCGTGATTACT 
ATGAGTTTGATAGGCTAAAGCAAGnTATGGATAGAGTAAAAGGAGCCCTA 
AGTACATCTACAATTATAGAGAGCGTAACTTCCGGCCCTCT^ 
ACAGTATCCATTQACAGTAGAAGATnGAATCTATCTC CGGATG 
ATATCCTTTTGATTGAAGCTATGCAAGGAAAACTGATTATAC^ 
GATAAAAATTATGAAATTGATGGCTCTCTACAACMTGGCAAGATA 
ACCATCATCTCAATTTGTAC^GGTGCACCGCTCTTW 
ATGCTATTAAAACGATTGAACCTTGGTTTAACCAAACAC^^ 
' CTTTGTAATAAAATAACAGTTCCTGTTAGCAGAGCAAATGTA 
AAAACAAATGTTAGG 

SEQ ZD NO. 7810 
STR AIN 1I 69NT 

aaagttttagtagttgatgatgaaccag 

ttgcacgtaacgaattaatttatcttctta^ 

gttatagcagaggcgcatgatatagctactg<^tta^ 



1089 



WO 2004/018646 
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Table 78: Comparative Sequences relating to SAG1016 



AGAAACTTTTGATGTAG CACTGTTAGATATCCAT CTCAGAGATGATTCTG 
GGTTGCAATTAGOXGAGTATATCAATAAAATC 

ATATTCXCG ACTGCTTATGATCAATATGCTATTCAGG CTTTTGAGCATQA 

TOCGCGTGATTATTTGTTAAAACCCTATGAGTTTGATAG^ 

CTATGGATAGAGTAAAAGGAGCGCTAAGTACATCTACAATTATAGAGAGC 

GTAACTTCCGGCCCTCTCrrTCAAGCAACAGTATCCAT^ 

TCGAATCTATCTGGTGTCGGCGGATGATATCCTTTTGATTGAA^ 

AAGGAAAACTGATTATACAAACACCTXSATAAAAATTATGAAATTGATG^ C 

TCTCTACAACAATGGCAAGATAAACTACCATCATCTCAA 

GCACCGCTCTTACATTGTGAATATTAATGCT^ 

GGTTTAACCAAACACTTCAGTTACACCTT^ 

GTTAGCAGAGCAAATGTAAAACCCCTAAAACAAATGTTAGGCATATCTAC 
C 

SBQ ZD HO. 7811 
STRAIN JM9130Q13 

AAAGTTTTAGTAGTTGATGATGAACCAGT 

TTATAGCAGAGGCGCATGATATGGCTACTG CATTAG CTATITTACTTAGA 

GAAACTTTTGATGTAGCACTGTTAGATATCCA^ 

GTTG CAATTAG CAGACTATATGAAT AAAATG CCCAAACCACG 

TATTCGCGACTGCTTATGATCAATATGCT^ 

GCGCGTGATTATTTGTTAAAACCCTATGAGTTTGATAGG 

TATGGATAGAGTAAAAGGAGCGCTAAGTA(^TCTACAATTATAGAGAGCG 

CGAATCTATCTGGTGTCGGCGGATGATATCCTTTTG^ 
AGGAAAACTGATTATACAAACACCTGATAAAAATTAT^ 

CTCTACAACAATGGCAAGATAAACTACCATCATCTCAATT^ 
CACCGCTCTTACA1TGTGAATATTAATGCTATTAAAACGATTG 
GTTTAACCAAACACTTCAGTTACAOrTTTGT 
TTAGCAGAGCAAATGTAAAACCCCTAAAACAAATG^ 

MSA Alignment Results: Pretty output 

PRETTY of i /biotmp/msal41507.2{*} April 10, 2003 06:36 



msal41507 . 2{399_A909 
msal41507 . 2 { 399_CJB110 
rosa!41507 . 2 { 399_H36B 
maal41S07 . 2 { 399_JM9130013 
msal41507 , 2 { 399_1169NT 
msal41507 . 2 { 3 9 9_090 
msal41507 . 2 { 399_18RS21 
msal41507 . 2{ 399_2603 
msal41507.2{399_COHl 
msal41507.2(399 M732 

msal41507.2{399~M781 
Consensus 



1 50 
aaagttt tagtagttga tgatgaacca gttgcacgta acgaattaat 



aaagttt 

aaagttt 

aaagttt 

aaagttt 

aaagttt 

atgaaagttt 

aaagttt 

aaagttt 

— ^-aaagttt 



tagtagttga 
tagtagttga 
tagtagttga 
tagtagttga 
tagtagttga 
tagtagttga 
tagtagttga 
tagtagttga 
tagtagttga 



tgatgaacca 
tgatgaacca 
tgatgaacca 
tgatgaacca 
tgatgaacca 
tgatgaacca 
tgatgaacca 
tgatgaacca 
tgatgaacca 



gttgcacgta 
gttgcacgta 
gttgcacgta 
gttgcacgta 
gttgcacgta 
gttgcacgta 
gttgcacgta 
gttgcacgta 
gttgcacgta 



acgaattaat 
acgaattaat 
acgaattaat 
acgaattaat 
acgaattaat 
acgaattaat 
acgaattaat 
acgaattaat 
acgaattaat 



msa!41507.2{399 A909 
maal41507 . 2 { 399_CJB110 
msal41507 . 2 { 399_H36B 
msal41507 . 2 { 399_JM9130013 
msal41507 . 2 { 399_1169NT 
msal41507.2{399_090 
msal41507 . 2 { 399_18RS2 1 



msal41507 
msal41507 
msal41507 
msa!41507 



399_2603 
399_C0H1 
399_M732 
399_M781 
Consensus 



51 

ttaccttCTT 

CTT 

ttaccttCTT 
ttaccttCTT 
ttatcttCTT 
ttaccttCTT 
ttaccttCTT 
ttaccttCTT 
ttaccttCTT 
ttaccttCTT 
ttaccttCTT 



AATAAGTATG 
AATAAGTATG 
AATAAGTATG 
AATAAGTATG 
AATAAGTATG 
AATAAGTATG 
AATAAGTATG 
AATAAGTATG 
AATAAGTATG 
AATAAGTATG 
AATAAGTATG 



ATTCTAACCT 
ATTCTAACCT 
ATTCTAACCT 
ATTCTAACCT 
ATTCTAACCT 
ATTCTAACCT 
ATTCTAACCT 
ATTCTAACCT 
ATTCTAACCT 
ATTCTAACCT 
ATTCTAACCT 



CGTTATAGCA 
CGTTATAGCA 
CGTTATAGCA 
CGTTATAGCA 
CGTTATAGCA 
CGTTATAGCA 
CGTTATAGCA 
CGTTATAGCA 
CGTTATAGCA 
CGTTATAGCA 
CGTTATAGCA 



100 

GAGGCGCATG 
GAGGCGCATG 
GAGGCGCATG 
GAGGCGCATG 
GAGGCGCATG 
GAGGCGCATG 
GAGGCGCATG 
GAGGCGCATG 
GAGGCGCATG 
GAGGCGCATG 
GAGGCGCATG 



msal4 1507.2(39 9_A9 0 9 ' 
msal41507.2{399_CJB110 ( 
* ' msal41507 . 2 { 399_H36B ( 
msal41507.2{399_JM9130013 t 
msal41507 .2{399_1169NT 
msal4 1 507 . 2 { 3 9 9_0 90 
msal41507.2{399_18RS21 
msal41507.2{399_2603 
msal41507.2{399_COHl 
tnaal41507 . 2 ( 399_M732 
msal41507. 2(399^781 
Consensus 



101 

ATATgGCTAC 
ATATgGCTAC 
ATATgGCTAC 
ATATgGCTAC 
ATATaGCTAC 
ATATgGCTAC 
ATATgGCTAC 
ATATgGCTAC 
ATATgGCTAC 
ATATgGCTAC 
ATATgGCTAC 



TGCATTAGCT 
TGCATTAGCT 
TGCATTAGCT 
TGCATTAGCT 
TGCATTAGCT 
TGCATTAGCT 
TGCATTAGCT 
TGCATTAGCT 
TGCATTAGCT 
TGCATTAGCT 
TGCATTAGCT 



ATTTTACTTA 
ATTTTACTTA 
ATTTTACTTA 
ATTTTACTTA 
ATTTTACTTA 
ATTTTACTTA 
ATTTTACTTA 
ATTTTACTTA 
ATTTTACTTA 
ATTTTACTTA 
ATTTTACTTA 



GAGAAACTTT 
GAGAAA CTTT 
GAGAAACTTT 
GAGAAACTTT 
GAGAAA CTTT 
GAGAAACTTT 
GAGAAACTTT 
GAGAAACTTT 
GAGAAACTTT 
GAGAAACTTT 
GAGAAACTTT 



150 

TGATGTAGCA 
TGATGTAGCA 
TGATGTAGCA 
TGATGTAGCA 
TGATGTAGCA 
TGATGTAGCA 
TGATGTAGCA 
TGATGTAGCA 
TGATGTAGCA 
TGATGTAGCA 
TGATGTAGCA 



maal41507 . 2 { 399_A909 
msal41S07 .2{399_CJB110 

msal41507.2{399_H36B 
mBal41507 . 2{ 399_JM9130013 
msal41507 . 2 { 399_1169NT 



151 

CTGTTAGATA TCCATCTCAG AGATGATTCT 
CTGTTAGATA TCCATCTCAG AGATGATTCT 
CTGTTAGATA TCCATCTCAG AGATGATTCT 
CTGTTAGATA TCCATCTCAG AGATGATTCT 
CTGTTAGATA TCCATCTCAG AGATGATTCT 



200 

GGGTTGCAAT TAGCAGAGTA 
GGGTTGCAAT TAGCAGAGTA 
GGGTTGCAAT TAGCAGAGTA 
GGGTTGCAAT TAGCAGAGTA 
GGGTTGCAAT TAGCAGAGTA 



1090 



WO 2004/018646 
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Table 78: Comparative Sequences relating to SAG1016 



msal41507.2{399_090 
msal4 1 5 07 . 2 { 3 9 9__1 8RS2 1 
msal41507 . 2 { 399_2603 
msal41507 . 2 <399_C0H1 
msal41507 . 2 (399_M732 
msal41507 . 2 { 399J4781 
Consensus 



CTGTTAGATA 
CTGTTAGATA 
CTGTTAGATA 
CTGTTAGATA 
CTGTTAGATA 
CTGTTAGATA 



TCCATCTCAG 
TCCATCTCAG 
TCCATCTCAG 
TCCATCTCAG 
TCCATCTCAG 
TCCATCTCAG 



AGATGATTCT 
AGATGATTCT 
AGATGATTCT 
AGATGATTCT 
AGATGATTCT 
AGATGATTCT 



GGGTTGCAAT 
GGGTTGCAAT 
GGGTTGCAAT 
GGGTTGCAAT 
GGGTTGCAAT 
GGGTTGCAAT 



TAG CAGAGTA 
TAGCAGAGTA 
TAGCAGAGTA 
TAGCAGAGTA 
TAGCAGAGTA 
TAGCAGAGTA 



msal41507.2{399 A909 
msal41507.2{399_CJB110' 
msal41507 . 2 { 399_H36B 
msal41507.2{399_JM9130013 
msal41507.2{399 1169NT 
msal41507 . 2 {399_090 
msal41S07 . 2 { 399_18RS21 
msal41507 . 2 { 399_2603 
msal41507.2{399_COHl 
msal41507.2(399_M732 

msal41507.2(399_M781 
Consensus 



201 

TATCAATAAA 
TATCAATAAA 
TATCAATAAA 
TATCAATAAA 
TATCAATAAA 
TATCAATAAA 
TATCAATAAA 
TATCAATAAA 
TATCAATAAA 
TATCAATAAA 
TATCAATAAA 



ATGCCCAAAC 
ATGCCCAAAC 
ATGCCCAAAC 
ATGCCCAAAC 
ATGCCCAAAC 
ATGCCCAAAC 
ATGCCCAAAC 
ATGCCCAAAC 
ATGCCCAAAC 
ATGCCCAAAC 
ATGCCCAAAC 



CACCATTATT 
CACCATTATT 
CACCATTATT 
CACCATTATT 
CACCATTATT 
CACCATTATT 
CACCATTATT 
CACCATTATT 
CACCATTATT 
CACCATTATT 
CACCATTATT 



GATATTcGCG 
GATATTcGCG 
GATATTCGCG 
GATATTcGCG 
GATATTcGCG 
GATATTtGCG 
GATATTtGCG 
GATATTtGCG 
GATATTcGCG 
GATATTCGCG 
GATATTcGCG 



250 

ACTGCTTATG 
ACTGCTTATG 
ACTGCTTATG 
ACTGCTTATG 
ACTGCTTATG 
ACTGCTTATG 
ACTGCTTATG 
ACTGCTTATG 
ACTGCTTATG 
ACTGCTTATG 
ACTGCTTATG 



msal41507 . 2 { 399_A909 
msal41507.2{399 CJBIIO' 
msal41507.2{399_H36B' 
msal41507.2{399_JM9130013 
msal41507.2{399 1169NT 
msal41507.2{399_090 
msal4 1 5 07 . 2 { 3 99_1 8RS2 1 
msal41507.2{399_2603 
msal41S07.2{399_COHl 
msal41507.2{399_M732 
msal4 15 07 . 2 { 3 9 9_M78 1 
Consensus 



251 

ATCAATATGC 
ATCAATATGC 
ATCAATATGC 
ATCAATATGC 
ATCAATATGC 
ATCAATATGC 
ATCAATATGC 
ATCAATATGC 
ATCAATATGC 
ATCAATATGC 
ATCAATATGC 



TATTCAaGCT 
TATTCAaGCT 
TATTCAaGCT 
TATTCAaGCT 
TATTCAgGCT 
TATTCAgGCT 
TATTCAgGCT 
TATTCAgGCT 
TATTCAgGCT 
TATTCAgGCT 
TATTCAgGCT 



TTTGAGCAtG 
TTTGAGCAtG 
TTTGAGCAtG 
TTTGAGCAtG 
TTTGAGCAtG 
TTTGAGCAtG 
TTTGAGCAtG 
TTTGAGCAtG 
TTTGAGCAgG 
TTTGAGCAgG 
TTTGAGCAgG 



ATGCGCGTGA 
ATGCGCGTGA 
ATGCGCGTGA 
ATGCGCGTGA 
ATGCGCGTGA 
ATGCGCGTGA 
ATGCGCGTGA 
ATGCGCGTGA 
ATGCGCGTGA 
ATGCGCGTGA 
ATGCGCGTGA 



300 

TTATTTGTTA 
TTATTTGTTA 
TTATTTGTTA 
TTATTTGTTA 
TTATTTGTTA 
TTATTTGTTA 
TTATTTGTTA 
TTATTTGTTA 
TTATTTGTTA 
TTATTTGTTA 
TTATTTGTTA 



********** ******_*** ********_* ********** *********** 



msal41507.2{399 A909 
msal4 15 07 . 2 { 3 9 9_CJB11 0 ' 
msal41507.2{399_H36B' 
msal41507.2{399_JM9130013 
msal41507 .2{399_1169NT 
msal41507 . 2 { 399_090 
msal41507 .2{399_18RS21 
msal41507 . 2 f 399_2603 
insal4 1 5 07 . 2 { 3 9 9_COHl 
msal41507 , 2 { 399J4732 
msal41507.2{399_M781 
Consensus 



301 

AAACCCTATG 
AAACCCTATG 
AAACCCTATG 
AAACCCTATG 
AAACCCTATG 
AAACCCTATG 
AAACCCTATG 
AAACCCTATG 
AAACCCTATG 
AAACCCTATG 
AAACCCTATG 



AgTTTGATAG 
AgTTTGATAG 
AgTTTGATAG 
AgTTTGATAG 
AgTTTGATAG 
AtTTTGATAG 
AtTTTGATAG 
AtTTTGATAG 
AgTTTGATAG 
AgTTTGATAG 
AgTTTGATAG 



GcTAAAGCAA 
GcTAAAGCAA 
GCTAAAGCAA 
GcTAAAGCAA 
GcTAAAGCAA 
GcTAAAGCAA 
GcTAAAGCAA 
GcTAAAGCAA 
GtTAAAGCAA 
GtTAAAGCAA 
GtTAAAGCAA 



GcTATGGATA 
GnTATGGATA 
GcTATGGATA 
GCTATGGATA 
GCTATGGATA 
GcTATGGATA 
GcTATGGATA 
GcTATGGATA 
GcTATGGATA 
GcTATGGATA 
GCTATGGATA 



350 

GAGTAAAAGG 
GAGTAAAAGG 
GAGTAAAAGG 
GAGTAAAAGG 
GAGTAAAAGG 
GAGTAAAAGG 
GAGTAAAAGG 
GAGTAAAAGG 
GAGTAAAAGG 
GAGTAAAAGG 
GAGTAAAAGG 



msal41507.2{399_A909 
msal41507 . 2 {399_CJB110 
msal41507.2{399_H36B 
msal41507.2{399_JM9130013 
msal41507.2{399_1169NT 
msal41507.2{399_090 
msal41507 . 2 {399_18RS21 



rosal41507.2 
tnsal41507.2 
tnsal41507.2 
msal41507.2 



399_2603 
399_C0H1 
399_M732 
399_M781 
Consensus 



351 

AGCGCTAAGT 
AGCGCTAAGT 
AGCGCTAAGT 
AGCGCTAAGT 
AGCGCTAAGT 
AGCGCTAAGT 
AGCGCTAAGT 
AGCGCTAAGT 
AGCGCTAAGT 
AGCGCTAAGT 
AGCGCTAAGT 



ACATCTACAA 
ACATCTACAA 
ACATCTACAA 
ACATCTACAA 
ACATCTACAA 
ACATCTACAA 
ACATCTACAA 
ACATCTACAA 
ACATCTACAA 
ACATCTACAA 
ACATCTACAA 



TTATAGAGAG 
TTATAGAGAG 
TTATAGAGAG 
TTATAGAGAG 
TTATAGAGAG 
TTATAGAGAG 
TTATAGAGAG 
TTATAGAGAG 
TTATAGAGAG 
TTATAGAGAG 
TTATAGAGAG 



CGTAaCTTCC 
CGTAaCTTCC 
CGTAaCTTCC 
CGTAaCTTCC 
CGTAaCTTCC 
CGTAaCTTCC 
CGTAaCTTCC 
CGTAaCTTCC 
CGTAgCTTCC 
CGTAgCTTCC 
CGTAgCTTCC 



400 

GGcCCTCTCT 
GGcCCTCTCT 
GGcCCTCTCT 
GGcCCTCTCT 
GGcCCTCTCT 
GGtCCTCTCT 
GGtCCTCTCT 
GGtCCTCTCT 
GGtCCTCTCT 
GGtCCTCTCT 
GGtCCTCTCT 



ntsal41507.2{399_A909; 
msal41507.2{399 CJB110 
rasal41507.2{399 H36B 
msal41507 . 2 { 399_jJM9130013 
msal41507.2{399 1169NT 
msal41507 . 2 {399_090 
msal41507.2{399 18RS21 
nisal41507 . 2 { 399_2603 
msal41507.2l399 COH1 
msal41507 . 2(399~M732 
msal41507.2{399JM781 
Consensus 




401 450 
TCAAGCAACA GTATCCATTG ACAGTAGAAG ATcGAATCTA 
TCAAGCAACA GTATCCATTG ACAGTAGAAG ATnGAATCTA 
TCAAGCAACA GTATCCATTG ACAGTAGAAG ATcGAATCTA 
TCAAGCAACA GTATCCATTG ACAGTAGAAG ATcGAATCTA 
TCAAGCAACA GTATCCATTG ACAGTAGAAG ATcGAATCTA TCTGGTGTCG 
TCAAGCAACA GTATCCATTG ACAGTAGAAG ATcGAATCTA TCTGGTGTCG 
TCAAGCAACA GTATCCATTG ACAGTAGAAG ATcGAATCTA 
TCAAGCAACA GTATCCATTG ACAGTAGAAG ATcGAATCTA 
TCAAGCAACA GTATCCATTG ACAGTAGAAG ATcGAATCTA TCTGGTGTCG 
TCAAGCAACA GTATCCATTG ACAGTAGAAG ATcGAATCTA TCTGGTGTCG 
TCAAGCAACA GTATCCATTG ACAGTAGAAG ATcGAATCTA TCTGGTGTCG 



msal41507 . 2 {399_A909 
msal41507.2{399_CJB110 
msal4 15 07 . 2 { 3 9 9_H3 6B 
msal41507.2{399_JM9 130013 



451 500 
GCGGATGATA TCCTTTTGAT TGAAGCTATG CAAGGAAAAC TGATTATACA 
GCGGATGATA TCCTTTTGAT TGAAGCTATG CAAGGAAAAC TGATTATACA 
GCGGATGATA TCCTTTTGAT TGAAGCTATG CAAGGAAAAC TGATTATACA 
GCGGATGATA TCCTTTTGAT TGAAGCTATG CAAGGAAAAC TGATTATACA 



1091 



WO 2004/018646 



PCT/US2003/026827 



Table 78: Comparative Sequences relating to SAG1016 



msal41507.2{ 
msal41507 
msal4l507.2{ 

msal41507. 

mBal41507. 

msal41507. 

msal41S07. 



399_1169NT 
.2{399_090 
399 18RS21 



399_2603 
399_COHl 
399_M732 
399J4781 
Consensus 



GCGGATGATA 
GCGGATGATA 
GCGGATGATA 
GCGGATGATA 
GCGGATGATA 
GCGGATGATA 
GCGGATGATA 



TCCTTTTGAT 
TCCTTTTGAT 
TCCTTTTGAT 
TCCTTTTGAT 
TCCTTTTGAT 
TCCTTTTGAT 
TCCTTTTGAT 



TGAAGCTATG 
TGAAGCTATG 
TGAAGCTATG 
TGAAGCTATG 
TGAAGCTATG 
TGAAGCTATG 
TGAAGCTATG 



CAAGGAAAAC 
CAAGGAAAAC 
CAAGGAAAAC 
CAAGGAAAAC 
CAAGGAAAAC 
CAAGGAAAAC 
CAAGGAAAAC 



TGATTATACA 
TGATTATACA 
TGATTATACA 
TGATTATACA 
TGATTATACA 
TGATTATACA 
TGATTATACA 



********** ********** ********** ********** ********** 



msa!41507 .2{399_A909 
msal41507 . 2 { 399_CJB110 
msal41507.2{399_H36B 
msal41507.2{399_JM9130013 
msal41507.2{399_1169NT 
msal4 1 50 7 . 2 { 3 99__0 9 0 
msal41507 . 2 {399_18RS21 
msal41507.2f399_2603 
msal41507. 2(399 COH1 
mBal41507.2(399~M732 
msal41507.2{399_M781 
Consensus 



501 

AACACCTGAT 
AACACCTGAT 
AACACCTGAT 
AACACCTGAT 
AACACCTGAT 
AACACCTGAT 
AACACCTGAT 
AACACCTGAT 
AACACCTGAT 
AACACCTGAT 
AACACCTGAT 



AAAAATTATG 
AAAAATTATG 
AAAAATTATG 
AAAAATTATG 
AAAAATTATG 
AAAAATTATG 
AAAAATTATG 
AAAAATTATG 
AAAAATTATG 
AAAAATTATG 
AAAAATTATG 



AAATTGATGG 
AAATTGATGG 
AAATTGATGG 
AAATTGATGG 
AAATTGATGG 
AAATTGATGG 
AAATTGATGG 
AAATTGATGG 
AAATTGATGG 
AAATTGATGG 
AAATTGATGG 



CTCTCTACAA 
CTCTCTACAA 
CTCTCTACAA 
CTCTCTACAA 
CTCTCTACAA 
CTCTCTACAA 
CTCTCTACAA 
CTCTCTACAA 
CTCTCTACAA 
CTCTCTACAA 
CTCTCTACAA 



550 

CAATGGCAAG 
CAATGGCAAG 
CAATGGCAAG 
CAATGGCAAG 
CAATGGCAAG 
CAATGGCAAG 
CAATGGCAAG 
CAATGGCAAG 
CAATGGCAAG 
CAATGGCAAG 
CAATGGCAAG 



msal41507.2{399_A909 
msal41507.2{399_CJBHO' 
msal41507.2{399_H36B 
msal4 1507 . 2 { 399_JM9 130013 
msal41507.2{399_1169NT 
msal41507 . 2 { 399_090 
msal41507.2{399_18RS21 
msal41507.2{399_2603 
msal41507 ,2(399_COHl 
tnsal41507.2 '399J4732 
msal41507.2{399_M781 
Consensus 



551 

ATAAACTACC 
ATAAACTACC 
ATAAACTACC 
ATAAACTACC 
ATAAACTACC 
ATAAACTACC 
ATAAACTACC 
ATAAACTACC 
ATAAACTACC 
ATAAACTACC 
ATAAACTACC 



ATCATCTCAA 
ATCATCTCAA 
ATCATCTCAA 
ATCATCTCAA 
ATCATCTCAA 
ATCATCTCAA 
ATCATCTCAA 
ATCATCTCAA 
ATCATCTCAA 
ATCATCTCAA 
ATCATCTCAA 



TTTGTACGGG 
TTTGTACGGG 
TTTGTACGGG 
TTTGTACGGG 
TTTGTACGGG 
TTTGTACGGG 
TTTGTACGGG 
TTTGTACGGG 
TTTGTACGGG 
TTTGTACGGG 
TTTGTACGGG 



TgCAcCGCTC 
TgCAcCGCTC 
TgCAcCGCTC 
TgCAcCGCTC 
TgCAcCGCTC 
TaCAtCGCTC 
TaCAtCGCTC 
TaCAtCGCTC 
TaCAtCGCTC 
TaCAtCGCTC 
TaCAtCGCTC 



600 

TTACATTGTG 
TTACATTGTG 
TTACATTGTG 
TTACATTGTG 
TTACATTGTG 
TTACATTGTG 
TTACATTGTG 
TTACATTGTG 
TTACATTGTG 
TTACATTGTG 
TTACATTGTG 



msal41507 . 2 { 399_A909 1 
msal41507 . 2 { 399_CJB110 
msal41507.2{399_H36B 
msal41507.2{399_OM9130013 1 
msal41507.2{399 1169NT 
msal4 1507 . 2 { 399_090 
tnsal41507 . 2 { 399_18RS21 
msal41507 . 2 ( 399_2 603 
tnsal4 1507 . 2 { 399_C0H1 
msal41507. 2(399 M732 
tnsal41507,2{399~M781 
Consensus 



601 

AAtATTAATG 
AAtATTAATG 
AAtATTAATG 
AAtATTAATG 
AAtATTAATG 
AAcATTAATG 
AAcATTAATG 
AAcATTAATG 
AAtATTAATG 
AAtATTAATG 
AAtATTAATG 



CTATTAAAAC 
CTATTAAAAC 
CTATTAAAAC 
CTATTAAAAC 
CTATTAAAAC 
CTATTAAAAC 
CTATTAAAAC 
CTATTAAAAC 
CTATTAAAAC 
CTATTAAAAC 
CTATTAAAAC 



GATTGAACCT 
GATTGAACCT 
GATTGAACCT 
GATTGAACCT 
GATTGAACCT 
GATTGAACCT 
GATTGAACCT 
GATTGAACCT 
GATTGAACCT 
GATTGAACCT 
GATTGAACCT 



TGGTTTAACC 
TGGTTTAACC 
TGGTTTAACC 
TGGTTTAACC 
TGGTTTAACC 
TGGTTTAACC 
TGGTTTAACC 
TGGTTTAACC 
TGGTTTAACC 
TGGTTTAACC 
TGGTTTAACC 



650 

AAACACTTCA 
AAACACTTCA 
AAACACTTCA 
AAACACTTCA 
AAACACTTCA 
AAACACTTCA 
AAACACTTCA 
AAACACTTCA 
AAACACTTCA 
AAACA CTTC A 
AAACACTTCA 



insal41507 . 2 { 399_A909 ' 
msal41507 . 2{399_CJB110 
msal41507.2{399__H36B 
msal41507 . 2 {399_JM9130013 
msal41507 . 2 {399_1169NT 
msal41507.2{399_090 
msal41507.2{399_18RS21 
msal41507 . 2 ( 399_2603 
msal41507. 2(399 COH1 
msa!41507 . 2( 399~M732 
msal41507 . 2 { 399_M7B1 
Consensus 



651 

GTTACACCTT 
GTTACACCTT 
GTTACACCTT 
GTTACACCTT 
GTTACACCTT 
GTTACACCTT 
GTTACACCTT 
GTTACACCTT 
GTTACACCTT 
GTTACACCTT 
GTTACACCTT 



TGTAATAAAA 
TGTAATAAAA 
TGTAATAAAA 
TGTAATAAAA 
TGTAATAAAA 
TGTAATAAAA 
TGTAATAAAA 
TGTAATAAAA 
TGTAATAAAA 
TGTAATAAAA 
TGTAATAAAA 



TAACAGTTCC 
TAACAGTTCC 
TAACAGTTCC 
TAACAGTTCC 
TAACAGTTCC 
TAACAGTTCC 
TAACAGTTCC 
TAACAGTTCC 
TAACAGTTCC 
TAACAGTTCC 
TAACAGTTCC 



TGTTAGCAGA 
TGTTAGCAGA 
TGTTAGCAGA 
TGTTAGCAGA 
TGTTAGCAGA 
TGTTAGCAGA 
TGTTAGCAGA 
TGTTAGCAGA 
TGTTAGCAGA 
TGTTAGCAGA 
TGTTAGCAGA 



700 

GCAAATGTAA 
GCAAATGTAA 
GCAAATGTAA 
GCAAATGTAA 
GCAAATGTAA 
GCAAATGTAA 
GCAA ATGTA A 
GCAAATGTAA 
GCAAATGTAA 
GCAAATGTAA 
GCAAATGTAA 



msal41507 . 2 { 399_A909 ' 
msal41507 . 2 {399_CJB110 
msal41507.2{399_H36B 
msal41507 . 2 { 399_JM9130013 
msal41507.2{399_1169NT 
rasal41507-2{399_090 
nisal41507 . 2 { 399_18RS2 1 
msal41507 . 2 ( 399_2603 
msal41507 . 2 ( 399__COHl 
msa!41507 . 2 ( 399_M732 
msal41507 . 2( 399JM781 
Consensus 



701 

AACCCCTAAA 
AACCCCTAAA 
AACCCCTAAA 
AACCCCTAAA 
AACCCCTAAA 
AACCCCTAAA 
AACCCCTAAA 
AACCCCTAAA 
AACCCCTAAA 
AACCCCTAAA 
AACCCCTAAA 



ACAAATGTTA 
ACAAATGTTA 
ACAAATGTTA 
ACAAATGTTA 
ACAAATGTTA 
ACAAATGTTA 
ACAAATGTTA 
ACAAATGTTA 
ACAAATGTTA 
ACAAATGTTA 
ACAAATGTCIA 



732 

GGcatatcta cc 

GG 

GGcatatcta cc 
GGcatatcta cc 
GGcatatcta cc 
GGcatatcta cc 
GGcatatcta cc 
GGcatatcta cc 
GGcatatcta cc 
GGcatatcta cc 
GGcatatcta cc 



SBQ ID NO. 7812 
STRAIN 2603 frame: 1 

KVLWDDEPVARNEL I YLLNKYDSNLVIAEAHDMATALAI LLRET FD VALID I HLRDDSG 
LQLAEYINKMPKPPLLI FATAYDQYAI QAPEHEARDYLL KPYDFD RLKQAMDRVKSALST 
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STI I ESVTSGPLFKQQYPLTVEDRI YLVSADDI LL I EAMQGKLI I QTPDKNYE I DGSLQQ 
WQDKLPSSQFVRVHRSYI VNINAI KTI EPWFNQTLOJ»HI<anCITVPVSRANVKPLKQMLG 
1ST 

SKQ ZD NO. 7813 
STRAIN 090 frame: 1 

KVLVVDDE PVARNBL I YLLNKYDSNLVIAEAHDMATALAI LLRETFDVALLD I HLRDDS G 
LQLAEYINKMPKPPLLI FATAYDQYAI QAFEHDARDYLLKPYDFDRLKQAMDRVKGALST 
STI I ESVTSGPLFKQQYPLTVEDRI YLVSADD I LLI EAMQGKLI IQTPDKNYEIDGSLQQ 
WQDKLPSSQFVRVHRSYI VNINAI KTI EPWFNQfTLQIiHLCNKITVPVSRANVKPLKQMLG 
1ST 

SEQ ID HO. 7814 
STRAIN A909 frame: 1 

KVLWDDEPVARNEL I YLLNKYDSNLV I AEAHDMATALAI LLRETFDVALLDIHLRDDSG 
LQLAEYINKMPKPPLLI FATAYDQYAI QAFEHDARDYLLKPYE FDRLKQAMDRVKGALST 
ST 1 1 BSVTSGPLFKQQYPLTVEDRI YLVSADD I LL I EAMQGKLI I QTPDKNYE I DGSLQQ 
WQDKLPS SQFVRVHRSY I VNI NAI KT I EPWFNQTLQLHLCNKITVPVSRANVKPLKQMLG 
1ST 

SKQ ID NO. 781S 
STRAIN H36B frame: 1 

KVLVVDDEP VARNEL I YLLNKYD SNLV I AEAHDMATALA I LLRETFD VALLD I HLRDD S G 
LQLAEYINKMPKPPLLI FATAYDQYAI QA FEHDARD YLLKP YBFDRLKQAMDRVKGALST 
STIIESVTSGPLFKQQYPLTVEDRIYLVSADDILLIEAMQGKLI IQTPDKNYEIDGSLQQ 
WQDKLPSSQFVRVHRSYI VNINAI KTI EPWFNQTLQLHLCNKITVPVSRANVKPLKQMLG 
1ST 

SEQ ID NO. 7816 
STRAIN I8RS21 frame: 1 

KVLWDDEPVARNEL I YLLNKYDSNLVIAEAHDMATALAI LLRETFD VALLD I HLRDDSG 
LQLAEYINKMPKPPLLI FATAYDQYAI QAFEHDARDYLIjKPYD FDRLKQAMDRVKGALST 
STI I ESVTSGPLFKQQYPLTVEDRI YLVSADD ILL I EAMQGKLI IQTPDKNYEIDGSLQQ 
WQDKLPSSQFVRVHRSYI VNINAI KTIEPWFNQTIiQLHLCNKITVFVSRANVKPLKQMLG 
1ST 

SEQ ID NO. 7817 
STRAIN M732 frame: 1 

KVLWDDEPVARNELI YLLNKYDSNLV I AEAHDMATALAI LLRETFD VALLD I HLRDDSG 
LQLAEYINKMPKPPLLI FATAYDQYAI QAFEQDARD YLLKPYEFDRIjKQAMDRVKGALST 
ST 1 1 ESVASG PLFKQQYPLTVEDR I YLVSADD I LL I EAMQGKL I IQTPDKNYEIDGSLQQ 
WQDKLPSSQFVRVHRSY I VN I NAI KTI EP WFNOTLQLHLCNKI TVPVSRANVKPLKQMLG 
1ST 

SEQ XD NO. 7818 
STRAIN COHl frame: I 

KVLVVDDEP VARNELI YLLNKYDSNLVIAEAHDMATALAI LLRETFDVALLD I HLRDDSG 
LQLAEYINKMPKPPLLI FATAYDQYAI QAFEQI3ARDYLLKPYEFDRLKQAMDRVKGALST 
STI IESVASGPLFKQQYPLTVEDRI YLVSADD I LLI EAMQGKLI IQTPDKNYEIDGSLQQ 
WQDKLPSSQFVRVHRSY I VN I NAI KTI EPWFNQTLQLHLCNKITVPVSRANVKPLKQMLG 
"1ST 

SEQ ID NO. 7819 
STRAIN M781 frame: t 

KVLVVDDEPVARNEL I YLLNKYDSNLV IAEAHDMATALAI LLRETFDVALLD I HLRDDSG 
LQLAEYINKMPKPPLLI FATAYDQYAI QAFEQDARDYLLKP YE FDRLKQ AMDRVKGALST 
STI IESVASGPLFKQQYPLTVEDRI YLVSADDI LLI EAMQGKL I IQTPDKNYEIDGSLQQ 
WQDKLPSSQFVRVHRSYI VNINAI KTI EPWFNQTLQLHLCNKITVPVSRANVKPLKQMLG 
1ST 

SEQ ID NO. 7820 
STRAIN CJB1 10 frame: 1 

LNKYD SNLV I AEAHDMATALAI LLRET FDVALLD I HLRDD SGLQLAEY I NKMPKP PLL I F 
ATAYDQYAI QAFEHDARDYLLKPYE FDRLKQXMDRVKGALSTSTI IESVTSGPLFKQQYP 
LTVEDX I YLVSADD I LL I EAMQGKL 1 1 QTPDKNYE I DGSLQQWQDKL PS SQFVRVHRSY I 
VNINAIKTI EPWFNQTLQLHLCNKI TVFVSRANVKPLKQML 

SEQ ID NO. 7821 
STRAIN 1 169NT frame: 1 

KVLVVDDEPVARNELI YLLNKYDSNLVIAEAHDIATALAI LLRETFDVALLD IHLRDDSG 
LQLAEYINKMPKPPLLI FATAYDQYAI QAFEHDARDYLLKPYE FDRLKQAMDRVKGALST 
STI I ESVTSGPLFKQQYPLTVEDRI YLVSADDILLI EAMQGKLI IQTPDKNYEIDGSLQQ 
WQDKLPSSQFVRVHRSYI VNINAI KTI EPWFNQTLQLHLCNKJTVPVSRANVKPLKQMLG 
1ST 

SEQ ID NO. 7822 
STRAIN JM9 1300 13 frame: 1 

KVLVVDDEPVARNBL I YLLNKYDSNLVI AEAHDMATALAI LLRETFDVALLDIHLRDDSG 
LQLAEYINKMPKPPLLI FATAYDQYAI QAFEHDARDYLLKPYE FDRLKQAMDRVKGALST 
STI I ESVTSGPLFKQQYPLTVEDRI YLVSADD I LL I EAMQGKLI I QTPDKNYE I DGS LQQ 
WQDKLPSSQFVRVHRSY IVNIllAIKTIEPWFNQTLQLH^ 
1ST 



1093 



WO 2004/018646 



PCT/US2003/026827 



Table 78: Comparative Sequences relating to SAG1016 



PRETTY Oft /biotmp/msal41801.2{*} April 10, 2003 06t38 



msal41801.2{399_COHl' 
msal4 1 8 0 1 . 2 ( 39 9_M73 2 \ 
maal4 1 8 0 1 . 2 { 39 9_M78 1 [ 
msal41801 . 2 {399_090 
msal41801.2{399__18RS2l' 
msal41801. 2(399 2603 
msal41801. 2{399~A909 
msal41801.2{399~H36B 
msal 4 1 8 01 . 2 { 3 9 9_JM9 1 3 0 0 13 
msal41801.2(399__1169NT 
msal41B01.2{399_CJB110 
Consensus 



Icvlwddepv 
kvlwddepv 
kvlwddepv 
kvlwddepv 
kvlwddepv 
kvlwddepv 
kvlwddepv 
kvlwddepv 
kvlwddepv 
kvlwddepv 



arneliylLN 
arnel iylLN 
arneliylLN 
arneliylLN 
arneliylLN 
arneliylLN 
arneliylLN 
arneliylLN 
arneliylLN 
arneliylLN 
LN 



KYDSNLVIAE 
KYDSNLVIAE 
KYDSNLVIAE 
KYDSNLVIAE 
KYDSNLVIAE 
KYDSNLVIAE 
KYDSNLVIAE 
KYDSNLVIAE 
KYDSNLVIAE 
KYDSNLVIAE 
KYDSNLVIAE 



AHDmATALAI 
AHDmATALAI 
AHDmATALAI 
AHDmATALAI 
AHDmATALAI 
AHDmATALAI 
AHDmATALAI 
AHDmATALAI 
AHDmATALAI 
AHDiATALAI 
AHDmATALAI 



50 

LLRETFDVAL 
LLRETFDVAL 
LLRETFDVAL 
LLRETFDVAL 
LLRETFDVAL 
LLRETFDVAL 
LLRETFDVAL 
LLRETFDVAL 
LLRETFDVAL 
LLRETFDVAL 
LLRETFDVAL 



msa!4 1801.2(39 9_C0H1 ' 
msal41801 . 2 I 399J4732 
msal41801. 2(399 M781 
msal41801 .2 {399_J)90' 
msal41801.2{399 18RS21 
msal41801. 2(399 2603' 
msal4 18 01 . 2 { 3 9 9~A90 9 
msal41801 . 2 { 399JI36B 
msal41801 . 2 { 399_JM9130013 
msal41801 . 2 ( 399_1169NT 
msal41801 . 2 { 399_CJB110 
Consensus 



51 

LDIHLRDDSG 
LDIHLRDDSG 
LDIHLRDDSG 
LDIHLRDDSG 
LDIHLRDDSG 
LDIHLRDDSG 
LDIHLRDDSG 
LDIHLRDDSG 
LDIHLRDDSG 
LDIHLRDDSG 
LDIHLRDDSG 



LQLAEYINKM 
LQLAEYINKM 
LQLAEYINKM 
LQLAEYINKM 
LQLAEYINKM 
LQLAEYINKM 
LQLAEYINKM 
LQLAEYINKM 
LQLAEYINKM 
LQLAEYINKM 
LQLAEYINKM 



PKPPLLI FAT 
PKPPLLIFAT 
PKPPLLI FAT 
PKPPLLIFAT 
PKPPLLI FAT 
PKPPLLIFAT 
PKPPLLIFAT 
PKPPLLIFAT 
PKPPLLIFAT 
PKPPLLIFAT 
PKPPLLIFAT 



AYDQYAIQAF 
AYDQYAIQAF 
AYDQYAIQAF 
AYDQYAIQAF 
AYDQYAIQAF 
AYDQYAIQAF 
AYDQYAIQAF 
AYDQYAIQAF 
AYDQYAIQAF 
AYDQYAIQAF 
AYDQYAIQAF 



100 

EqDARDYLLK 

EqDARDYLLK . 

EqDARDYLLK 

EhDARDYLLK 

EhDARDYLLK 

EhDARDYLLK 

EhDARDYLLK 

EhDARDYLLK 

EhDARDYLLK 

EhDARDYLLK 

EhDARDYLLK 



msal41801. 2(399 COHl) 
msal41801.2{399~M732J 
msal41801.2{399_M78l} 
msal41801.2{399_090! 
msal41801.2{399_18RS21 
msal4 18 0 1 . 2 ( 3 9 9_2 603 . 
msal41801.2(399JV909 
msal41801.2(399_H36B 
msal41801.2{399_JM9130013 
msal41801.2(399_1169NT] 
msal41801 . 2 { 399_CJB110 J 
Consensus 



101 

PYeFDRLKQa 
PYeFDRLKQa 
PYeFDRLKQa 
PYdFDRLKQa 
PYdFDRLKQa 
PYdFDRLKQa 
PYeFDRLKQa 
PYeFDRLKQa 
PYeFDRLKQa 
PYeFDRLKQa 
PYeFDRLKQx 



MDRVKGALST 
MDRVKGALST 
MDRVKGALST 
MDRVKGALST 
MDRVKGALST 
MDRVKGALST 
MDRVKGALST 
MDRVKGALST 
MDRVKGALST 
MDRVKGALST 
MDRVKGALST 



STIIESVaSG 
STIIESVaSG 
STIIESVaSG 
STIIBSVtSG 
STIIESVtSG 
STIIESVtSG 
STIIBSVtSG 
STIIESVtSG 
STIIESVtSG 
STIIESVtSG 
STIIESVtSG 



PLFKQQYPLT 
PLFKQQYPLT 
PLFKQQYPLT 
PLFKQQYPLT 
PLFKQQYPLT 
PLFKQQYPLT 
PLFKQQYPLT 
PLFKQQYPLT 
PLFKQQYPLT 
PLFKQQYPLT 
PLFKQQYPLT 



150 

VEDr I YLVSA 
VEDrlYLVSA 
VEDr I YLVSA 
VEDrlYLVSA 
VEDr I YLVSA 
VEDrlYLVSA 
VEDrlYLVSA 
VEDrlYLVSA 
VEDrlYLVSA 
VEDrlYLVSA 
VEDxI YLVSA 



msal41801.2(399_COHl 
msal41801 . 2 ( 399J4732 ' 
msal41801.2{399_M781 1 
msal41801 . 2 {399_090 
msal41801.2{399_18RS21 
msal418 01 . 2 ( 399_2603 
msal4 18 01 . 2 f 399_A909 
msal4 18 01 . 2 { 3 99_H3 6B 
msal41801.2{399 JM9130013 
msal41801 . 2 (399_1169NT 
msal41801 . 2 {399_CJB110 
Consensus 



151 

DDILLIBAMQ 
DDILLIBAMQ 
DDILLIBAMQ 
DDILLIBAMQ 
DDILLIBAMQ 
DDILLIBAMQ 
DDILLIBAMQ 
DDILLIBAMQ 
DDILLIBAMQ 
DDILLIBAMQ 
DDILLIBAMQ 



GKLIIQTPDK 
GKLIIQTPDK 
GKLIIQTPDK 
GKLIIQTPDK 
GKLIIQTPDK 
GKLIIQTPDK 
GKLIIQTPDK 
GKLIIQTPDK 
GKLIIQTPDK 
GKLIIQTPDK 
GKLIIQTPDK 



NYEIDGSLQQ 
NYEIDGSLQQ 
NYEIDGSLQQ 
NYEIDGSLQQ 
NYEIDGSLQQ 
NYEIDGSLQQ 
NYEIDGSLQQ 
NYEIDGSLQQ 
NYEIDGSLQQ 
NYEIDGSLQQ 
NYEIDGSLQQ 



WQDKLPSSQF 
WQDKLPSSQF 
WQDKLPSSQF 
WQDKLPSSQF 
WQDKLPSSQF 
WQDKLPSSQF 
WQDKLPSSQF 
WQDKLPSSQF 
WQDKLPSSQF 
WQDKLPSSQF 
WQDKLPSSQF 



200 

VRVHRSYIVN 
VRVHRSYIVN 
VRVHRSYIVN 
VRVHRSYIVN 
VRVHRSYIVN 
VRVHRSYIVN 
VRVHRSYIVN 
VRVHRSYIVN 
VRVHRSYIVN 
VRVHRSYIVN 
VRVHRSYIVN 



msal41801.2(399_COHl J 
msal41801.2(399_M732[ 
msal41801 . 2{399_M781 f 
msal41801.2{399_090 
msal41801 . 2 { 3 99_18RS2 1 ' | 
rasal41801.2{399_2603 
msal41801. 2(399 A909 
msal41801.2{399JI36B ( > 
msal41801.2{399_JM9130013 ) 
msal41801 - 2 ( 399_1169NT 
msal41801 . 2 { 399_CJB110 J 
Consensus 



201 

INAIKTIBPW FNQTLQLHLC 
INAIKTIBPW FNQTLQLHLC 
INAIKTIBPW FNQTLQLHLC 
INAIKTIBPW FNQTLQLHLC 
INAIKTIBPW FNQTLQLHLC 
INAIKTIBPW FNQTLQLHLC 
INAIKTIBPW FNQTLQLHLC 
INAIKTIBPW FNQTLQLHLC 
INAIKTIBPW FNQTLQLHLC 
INAIKTIEPW FNQTLQLHLC 
INAIKTIBPW FNQTLQLHLC 



243 

NKITVPVSRA NVKPLKQMLg ist 
NKITVPVSRA NVKPLKQMLg ist 
NKITVPVSRA NVKPLKQMLg ist 
NKITVPVSRA NVKPLKQMLg ist 
NKITVPVSRA NVKPLKQMLg ist 
NKITVPVSRA NVKPLKQMLg ist 
NKITVPVSRA NVKPLKQMLg ist 
NKITVPVSRA NVKPLKQMLg ist 
NKITVPVSRA NVKPLKQMLg ist 
NKITVPVSRA NVKPLKQMLg ist 
NKITVPVSRA NVKPLKQML 
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SEQ ID NO. 7901 
STRAIN 2603 

ATGGGAATTGAATTTAAAAATGTAAGTTATAC CTATCAAGCCGGCACTCCITTTGAR.GG G 

CGTCCCCTTTTTGACGTCAATCTGAAAAT^ 

CACAOlGGT/rCTGGAAAATCAACTATTATGCA^ 

AAAGGTGAGGTAATTGTCGATGATTTTTOT 

AAATTTATAAGGCAAAAAGTTGGTTTAGTTTTTCA^ 

GAGACAGTTTTAAAGGATGTTG CTriUX3GACCACAAAAlU"luGGTATTTCTCAGATTGAA 

GCTGAAAGGCTGGCTGAAGAAAAATTAAGGTTAGTTGOT 

AAAAATCCATTTGAACITTCTGGAGGGCAGATGAGGCGGGT^ 

GCGATGGAACCXAAAGTACTAGTACIGGATG^ 

AGAAAAGAATTAATGACTCTTTTTAAAAATCTTCATA 

GTGACTCACTTAATGGACX3ATGTAG CGGATTATGCTG ACTATGTGTATGTTTTAGAAGCA 
GGGAAAGTAACCTTATCAGGACAACCAAAACAGA 
AGTAAACAATTAGGAGTTCX^CAAAATCACCAAGTTTGCrO 
TTAAATTTACCTAGTTTACCAATTACTATTAACGAAT^ 



SEQ ID NO. 7902 
STRAIN 090 

GGAATTGAATTTAAAAATGTAAGT TATACC TATCAAGCC 
GGCACTCCTTTTGAAGGGCGTGCCCTTTTTGACGTCA 
AGATGCnTCCTATACCGCGTTCATTGGGCAC^ 
CTATTATGCAACTTTTGAATGGTTTACATATTCCT 

ATTGTCGATGATTTTTCTATTAAAG CAGGGGACAAGAACAAAGAAATCAA 

ATTTATAAGGCAAAAAGTTGGTTTAGTTTTTCAATT^ 

i _ i"i"i~iGAAGAGACAGri"iuAAAGGATGTTGC'l"i"i"iGGAC CACAAAATTTT 

GGTATTTCTCAGATTGAAGCTGAAAGG CTGGCTG AAGAAAAATTAAGGTT 

AGTTGGTATCAGTGAGGATTTATTCGATAAAAA^ 

GAGGGCAGATGAGGCGGGTTGCTATAGCTGGTArri-rA^ 

AAAGTACTAGTACTGGATGAGCGAACAGCTGGACTTGA^ 

AAAAGAATTAATGACTCTTTTTAAAAATCTTCATAAA 

TCGT CTTAGTGACT CACTTAATGGACGATGTAGCGGATT ATG CTGACTAT 

GTGTATGTTTTAGAAGCAGGGAAAGTAACCTTATCA^ 

GAl"l"l"l"i'CAAGAAGTAGAAu-i'i-rrAGAAAGTAAACAATTAGGAGTTCCGA 

AAATCACCAAGTTTGCTCAAAGACTATCTCATAAGGGATTAAATTTACCT 

AGTTTACCAATTACTATTAACGAATTTGTGGAGG CTATTAAGCATGGA 



SEQ ID NO. 7903 
STRAIN A909 

GGAATTGAATTTAAAAATGTAAGTTATACCTATCAA 

GCOGGCACTCCTTTTGAAGGGCXjTGCCC^^ 

TGAAGATGCTTCCTATAC^CGTTCATTGGGCACAO 

CAACTATTATGCAACTTTTGAATGGTTTAC^ 

GTAATTGTCGATGATTTTTCTATTAAAGCAGGGGA 

AGc'A'i-rriGAAGAGACAGl-rriAAAAGATGTTGClTIUGGACCACAAAAT 

TTTGGTATTTCTCAGATTGAAGCTGAAAGG CTGGC^ 

GTTAGTTGGTATC^GTGAGGATTTATTCGATAAAAAT 

CTGGAGGGCAGATGAGGCX3GGTTGCTATAGCrGGTATTrTA^ 

CCCAAAGTACTAGTACTAGATGAGCGAACAGCTGGAC^ 

AAGAAAAGAATTAATGACTCTTTTTAAAAATCITCATAA 

CTATCGTCTTAGTGACT CACTTAATGGACGATGTAGCGGATT 

TATGTGTATGTTTTAGAAGOUSGGAAAGT^ 

GCAGATTTTTCAAGAAGTAGAACTTTTAGAAAOT 

CCAAAATCACCAAGTTTGCTCAAAGGCTATCT^ 

CCTAGTTTACCAATTACrATTAACGAATTTGT^ CATGG 
A 



SEQ ID NO. 7904 
STRAIN H36B 

GGAATTGAATTTAAAAATGTAAGTTATAC 
CTA 

TGAAAATTGAAGATGCITCCTATACCXSCGTTC^ 
GGAAAATCAACTATTATGCAACTTTTGAATG^ 

AGGTGAGGTAA1"1GTCGATGA1"1UV1V1ATTAAAGCAGGGGA(ZAAGAACA 

AAGAAATCAAATTTATAAGGCAAAAAGTTGGTTTA 

GAAAGTCAGCTTTTTGAAGAGACAGTTTTAAAAGAT^ 

ACAAAAi-i-X"iGGTAl"l _ iiJ'iC!AGATTGAAGCTGAAAGG CTGG CTGAAGAAA 

AATTAAGGTTAGTTGGTATCAGTGAGGAT1TATTCGATAAAAATCCA 

GAACTTTCTGGAGGGCAGATGAGGCXK3GTTG 

GATGGAACCCAAAGTACTAGTACTAGATGAGCCAAC^ 

CTAAGGGAAGAAAAGAATTAATGACTCTTTTTAAAA^ 

GGAATGACTATCGTCTTAGTGACTCACTTAAT^ 

TGCTGACTATGTGTATGTTTTAGAAGCAGGG 

AACCAAAGCAGATTTTTCAAGAAGTAGAACT^ 

GGAGTTCCCAAAATCACCAAGTTTGCTCAA 

AAATTTAGCTAGTTTACCAATTACTATTAAGQA 

AGCATGGA 



SEQ ID NO. 7905 
STRAIN 18RS2I 

GGAATTGAATTTAAAAATGTAAGTTATAC 
CTATCAAGCCGGCACTCCTTTTGAAGGGC^ 
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TGAAAATTCAAGATGCTTCCTATACCG 
GGAAAATCAACTATTATGCAACTTTTG^ 

AGGTGAGGTAATTGTCGATGATTTTTCTATTAAAG CAGGGGACAAGAACA 
AAGAAATCAAATTTATAAGGCAAAAAGTTGGTTTAGT-iu-rrCAATTTC^ 
GAAAGTCAGCTTTTTGAAGAGACAGTTTTAAAGGAT^ 

acaaaattttggtatttctcagattgaagctgaaagg 

aattaaggttagttggtatcagtgaggatttattcxsa™ 

gaactttctggaggg cagatgaggcgggttg ctatag ctggtattttagc 

gatggaacccaaagtactagtactggatgagccaacagctggactt^ 

ctaagggaagaaaagaattaatgactcltrrtaaaaatcttcataaaaaa 

ggaatgactatcgtcttagtgactcacttaatggacgatgta^ 

tgctgactatgtgtatgttttagaagcagggaaa^ 

aaccaaaacagatttttcaagaagtagaact 

ggagttcccaaaatcaccaagtttgctcaaagactat ct cataagggatt 

AAATTTACCTAGTITACCAATTACTATTAACGAATTTGTGGAGG CTATTA 
AGCATGGA 

SEQ ZD NO. 7906 
STRAIN M732 

GGAATTGAATTTAAAAATGTAAGTTATAC 

TGAAAATTGAAGATGTTTCCTATACCXXX3TTCATTGGGCACA 
GGAAAATCAACTATTATGCAACTTTTGAATGGTTTACATATTCCTACAAA 
AGGTGAGGTAATTGT CX3ATGATTTTTCTATTAAAGCAGGGGACAAGAACA 
AAGAAATCAAATTTATAAGGCAAAAAGTTGGTTTA^ 

GAAAGTCAGClTri"lGAAGAGACAG , i"lVrAAAGGATGTTGCTTTTGGACC 
ACAAAATTTTGGTATTTCTCAGATTGAAGCIGAAAGGCTG^ 
AATTAAGGTTAGTTGGTATCAGTGAGGATTTATT CGATAAAAAT CCATTT 
GAACTTTCTGGAGGG CAGATGAGG CGGGTTGCTATAGCTGGTATTTTAG C 

gatggaacccaaagtactagtactggatgag ccaacagctggacttgat c 
ctaAgggaagaaaagaattaatgactcttt^ 

GGAATGACTATCGTCTT AGTGA CTCACTTAATGGA 
TGCTGACTATGTGTATGTTTTAGAAG<2AG 

AACCAAAACAGA'IU"riU'CAAGAAGTAGAAL:i - rrrAGAAAGTAAAC!AATTA 
GGAGTTCCCAAAAT CACCAAGTTTGCTCAAAGACTATCTC1ATAAGGGATT 
AAATTTACCTAGTTTACCAATTACTATTAACGAATTTGTGGAG 
AGCATGGA 

SEQ ID NO. 7907 
STRAIN COH1 

GGAATTGAATTTAAAAATGTAAGTTATACCTATCAAGCC 

GGCACTCCTTTTGAAGGGCGTGCCC^^ 

AGATGTTTCCTATACCGCGTTCATTGG 

CTATTATGCAACTTTTGAATGGTTTACATATTC 

ATTGTCGATGATTTTTCTATrAAAGCAGGGGACAAGAACA 

ATrTATAAGGCAAAAAGTTGGTTTAGTTT^ 

TTTTTGAAGAGACAGTTTTAAAGGATGTTGCTT^ 

GGTATTTCT CAGATTGAAG CTGAAAGGCTGGCTGAAGAAAAATTAAGG^ 

AGTTGGTATCAGTGAGGATTTATTCGATAAAAAT 

GAGGGCAGATGAGGCGGGTTGCTATAGCTGGTATTT^ 

AAAGTACTAGTACTGGATGAGCCAACAGCTGGACr^ 

AAAAGAATTAATGACTCTTTTTAAAAATCTTC^^ 

TCGTCTTAGTGACTCACTTAATGGACGATGTA 

GTGTATGTTTTAGAAGCAGGGAAAGTAACCTTAT^ 

GATTTTTCAAGAAGTAGAACTTTTAGAAAGTAAA 

AAATCACCAAGTTTGCTCAAAGACTATCTCATA 

AGTTTACCAATTACTATTAACGAATTTGTG 

SEQ ZD NO. 7908 
STRAIN M78I 

GGAATTGAATTTAAAAATGTAAGTTATAC 

CTATCAAGCCGGCACTCCITTTGAAGGGCGTGCCCT 

TGAAAATTGAAGATGTTTCCTATACCX3CGTTCA 

GGAAAATCAACTATTATGCAACTTTTGAATGGTTTA 

AGGTGAGGTAATTGTCGATGATTTTTCTATTAA 

AAGAAATCAAAITTATAAGGCAAAAAGTTGGTTTAGT^ 

GAAAGTCAGCTTTTTGAAGAGACAGTTTTAAAGGATGTTC 

ACAAAATTTTGGTATTTCTCAGATTGAAGCT^ 

AATTAAGGTTAGTTGGTATCAGTGAGGATTT^ 

GAACTT1CTGGAGGGCIAGATGAGGCGGGTTGCT 

GATGGAACCCAAAGTACTAGTACTGGATGAGCCAACAGCT^ 

CTAAGGGAAGAAAAGAATTAATGACTCTTTTTAAAA 

GGAATGACTATCGTCTTAGTCACTCACTTAAT^ 

TGCTGACTATGTGTATGTTTTAGAAGC^VGGGAAAGTAA 

AACXZAAAACAGATTTTTCAAGAAGTAGAACTTTTAGAAAGT 

GGAGTTCCCAAAATCACCAAGTTTGCTCAAAGACT 

AGCATGGA 

SEQ ZD NO. 7909 
STRAIN CJBt 10 

GGAATTGAATTTAAAAATGTAAGTTATAC 
CTATCAAGCCGGCACrCCTTTTGAAGGGCGTC 
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TGAAAATTGAAGATG CTTCCTATACXX3CGTTCZATTGGGCA.CACAGGTTCT 

GGAAAATCAACTATTATGCAACTTTTGAATGGTTTAC^ 

AGGTG AGGTAATTGTCGATGATTTTTCTATTAAAG CAGGGGACAAGAACA 

AAGAAATCAAATTTATAAGGCAAAAAGTTGGTTTAGTTTT^ 

GAAAGTCAGCTTTTTGAAGAGACAGTTTT AAAGGATGTTG CTTTTGGACC 

ACAAAATTTTGGTATTTCTGAGATTGAAGC^ 

AATTTAAGGTTAGTTGGTATCAGTGAGGATTTATTCGATAAA 

GAACTTTCTGGAGGGCAGATGAGG CGGGTTG CTATAG C7TGGTATTTTAGC 

GATGGAA(X!CAAAGTACn7VGTACTGGATGAGCCAAC 

CTAAGGGAAGAAAAGAATTAATGACTCTTTTTAAAAAT 

GGAATGACTATCGTCTTAGTGACTCACTT^ 

TGCIX3ACTATGTGTATGTTTTAGAAGCAGGGAAAGTAAC CTTATCAGGAC 

AACCAAAACAGATTTTTCAAGAAGTAGAACTTTTAGAAAGTAAACA^ 

GGAGTTC CCAAAAT CACCSVAGTTTGCTCAAAGAGTATCTCATAAGGGATT 

AAATTTACCTAGTTTACCAATTACTATTAAa^ 

AGCATGGA 



SEQ ZD NO. 7910 
STRAIN 1 169NT 
GGAATTGAATTTAAAAATGTAA 

GTTATACCTATCAAGCCGG CACTCCTTTrGAAGGGCGTG C CCTTTTTGAC 

GTCAATCTGAAAATTGAAGATGCTTCCTATACCXaCGTTCATTGG^ 

AGGTTCTGGAAAATCAACTATTATGCAACTTTTGAATGGTTT 

CI7VCAAAAGGTGAGGTAATTGTCX1ATGATTTTTCT 

AAGAACAAAGAAATCAAATTTATAAGGCAAAAAGTTGGTTTAG^ 

ATTTCCAGAAAGTCAGCTTTTTGAAGAGAC^ 

TTGGACXZACAAAATTTTGGTATTTCTC^ 

GAAGAAAAATTAAGGTTAGTTGGTATCAGTGAGGAT^ 

TCCATTTGAA^i i CTGGAGGG CAG ATGAGGCGGGTTGCTAT AG CTGGTA 

TTTTAG CGATGGAACCCAAAGTACTAGTACTGGATGAG CCAACAG CTGGA 

CITGATCCTAAGGGAAGAAAAGAATTAATGACTCTTTTTAAAAAT 

TAAAAAAGGAATGACTATCGTCTTAGTG^ 

CGGATTATG CTGACTATGTGTATGTTTTAGAAGCAGGGAAAGTAACCTTA 

TCAGGACAACCAAAACAGATTTTTCAAGAAGT^ 

ACAATTAGGAGTTCCCIAAAATCACCAAGTTTGCTC 

AGGGATTAAATTTACCTAGTTTACCAATTACTATTAACXIAATTTGT^ 

GCTATTAAGCATGGA 

SEQ ID NO. 7911 
STRAIN JM9130013 
GGAATTGAATTTAAAAATGTAAGTT 

ATACCTATCAAGCCGGCACTCCTTTTGAAGGGCGTGCCCTTT^ 

AATCTGAAAATTGAAGATGCTTCCTATACCGCATTCATTC 

TTCTGGAAAATCAACTATTATGCAACTTTTGA^ 

CAATU^GGTGAGGTAATTGTCGATGATTTI^CTAITAAAGCAGGGGACAAG 

AACAAAGAAATOVAATTTATAAGGCAAAAAGTTGGTITAUUU"ri _ rCAA^ 

TCCAGAAAGTCAGCTTTTTGAAGAGACAGTTTTA^ CTTTTG 

GACXJVCAAAATTTTGGTATTTCTCAGATTGAAG CTG^IAAGGCTGGCTGAA 

GAAAAATTAAGGTTAGTTGGTATTAGTGAGGATTTATTCGATAAAAATC 

ATTTGAAL" I - lU'C"iK3GAGGGCAGATGAGGCGGGTTGCTATAG CTGGTATTT 

TAGCGATGGAACCCAAAGTACTAGTACTGGATGAGCCAACAGCT^ 

GATCCTAAGGGAAGAAAAGAATTAATGACTCTTTTTAAAAATCT^ 

AAAAGGAATGACrATCGTCTTAGTGACTCACTTAATC 

ATTATGCTGACTATGTGTATGTTTTAGAAGCAGGGA 

GGACAACCAAAACAGATTTTTCAAGAAGTAGAACTTTT 

ATTAGGAGTTCCCAAAATCACGAAGTTTGCrrCAAAGACT 

GATTAAATTTACCTAGTTTACCAATTACTATTAACX3AATTTC 

ATTAAGCATGGA 

PRBTTY Of: /bio trap/msa23 8454 . 2{ *} May 14, 2003 06i5S 



msa2 38454 . 2 ( 401_A909 ' 
msa2 3 8 4 54 . 2 { 40 1_H3 6B | 
msa238454.2{401_090' 
msa238454.2(401 1169NT 
moa238454 . 2 { 40O 8RS21 
msa238454. 2(401 2603 
msa238454 . 2 {401_CJB110 
maa238454 ,2{401_COH1 
msa238454. 2(401 M732 
rasa238454 . 2 {401_M781 
msa238454.2{401_JM9130013 
Consensus 



GGAATTG 

GGAATTG 

GGAATTG 

GGAATTG 

GGAATTG 

atgGGAATTG 

GGAATTG 

GGAATTG 

GGAATTG 

GGAATTG 

GGAATTG 



AATTTAAAAA 
AATTTAAAAA 
AATTTAAAAA 
AATTTAAAAA 
AATTTAAAAA 
AATTTAAAAA 
AATTTAAAAA 
AATTTAAAAA 
AATTTAAAAA 
AATTTAAAAA 
AATTTAAAAA 



TGTAAGTTAT 
TGTAAGTTAT 
TGTAAGTTAT 
TGTAAGTTAT 
TGTAAGTTAT 
TGTAAGTTAT 
TGTAAGTTAT 
TGTAAGTTAT 
TGTAAGTTAT 
TGTAAGTTAT 
TGTAAGTTAT 



ACCTATCAAG 
ACCTATCAAG 
ACCTATCAAG 
ACCTATCAAG 
ACCTATCAAG 
ACCTATCAAG 
ACCTATCAAG 
ACCTATCAAG 
ACCTATCAAG 
ACCTATCAAG 
ACCTATCAAG 



50 

CCGGCACTCC 
CCGGCACTCC 
CCGGCACTCC 
CCGGCACTCC 
CCGGCACTCC 
CCGGCACTCC 
CCGGCACTCC 
CCGGCACTCC 
CCGGCACTCC 
CCGGCACTCC 
CCX3GCACTCC 



msa238454 . 

msa238454. 
msa23B454 
msa238454 
msa238454 

msa238454 
msa238454.2{ 



2(401 A909 
2{40l"*H36B 
*^.2{401_090 
.2{401_1169NT 
.2{401_1BRS21 
2{401_2603 
401 CJB110 



51 

TTTTGAAGGG 
TTTTGAAGGG 
TTTTGAAGGG 
TTTTGAAGGG 
TTTTGAAGGG 
TTTTGAAGGG 
TTTTGAAGGG 



CGTGCCCTTT 
CGTGCC CTTT 
CGTGCCCTTT 
CGTGCCCTTT 
CGTGCCCTTT 
CGTGCCCTTT 
CGTGCCCTTT 



TTGACGTcAA 
TTGACGTcAA 
TTGACGTCAA 
TTGACGTCAA 
TTGACGTCAA 
TTGACGTcAA 
TTGACGTcAA 



TCTGAAAATT 
TCTGAAAATT 
TCTGAAAATT 
TCTGAAAATT 
TCTGAAAATT 
TCTGAAAATT 
TCTGAAAATT 



100 

GAAGATGCTT 
GAAGATGcTT 
GAAGATGcTT 
GAAGATGcTT 
GAAGATGcTT 
GAAGATGcTT 
GAAGATGCTT 
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msa238454.2{401_COHl} 
maa238454 . 2 (401_M732 } 
msa23B454.2(401_M781J 
msa238454.2{401_JM9130013) 
Consensus 



TTTTGAAGGG CGTGCCCTTT TTGACGTcAA TCTGAAAATT GAAGATGtTT 
TTTTGAAGGG CGTGCCCTTT TTGACGTcAA TCTGAAAATT GAAGATGtTT 
TTTTGAAGGG CGTGCCCTTT TTGACGTcAA TCTGAAAATT GAAGATGtTT 
TTTTGAAGGG CGTGCCCTTT TTGACGTtAA TCTGAAAATT GAAGATGcTT 



msa238454.2{401_A909| 
msa238454.2{401_H36B 
msa238454.2{401_090 
msa238454.2{401_1169NT) 
msa238454.2{401 18RS21 
msa238454.2{401J2603 
msa2384S4 . 2 {401_CJB110 
msa238454.2(401_COHl 
m8a238454.2(401_M732 
msa2 3 8 4 54 . 2 { 4 0 1_M78 1 
msa238454.2{401_JM9130013] 
Consensus 



101 

CCTATACCGC 
CCTATACCGC 
CCTATACCGC 
CCTATACCGC 
CCTATACCGC 
CCTATACCGC 
CCTATACCGC 
CCTATACCGC 
CCTATACCGC 
CCTATACCGC 
CCTATACCGC 



gTTCATTGGG 
gTTCATTGGG 
gTTCATTGGG 
gTTCATTGGG 
gTTCATTGGG 
gTTCATTGGG 
gTTCATTGGG 
gTTCATTGGG 
gTTCATTGGG 
gTTCATTGGG 
aTTCATTGGG 



CACACAGGTT 
CACACAGGTT 
CACACAGGTT 
CACACAGGTT 
CACACAGGTT 
CACACAGGTT 
CACACAGGTT 
CACACAGGTT 
CACACAGGTT 
CACACAGGTT 
CACACAGGTT 



CTGGAAAATC 
CTGGAAAATC 
CTGGAAAATC 
CTGGAAAATC 
CTGGAAAATC 
CTGGAAAATC 
CTGGAAAATC 
CTGGAAAATC 
CTGGAAAATC 
CTGGAAAATC 
CTGGAAAATC 



150 

AACTATTATG 
AACTATTATG 
AACTATTATG 
AACTATTATG 
AACTATTATG 
AACTATTATG 
AACTATTATG 
AACTATTATG 
AACTATTATG 
AACTATTATG 
AACTATTATG 



msa2 3 8 4 54 . 2 ( 40 1_A90 9 
msa238454 . 2 (401_H36B 
msa238454 .2{401_090 
msa23B454 .2{401_11S9NT 
msa238454 .2(401 18RS21 
tnsa2 3 8 4 54 . 2 { 4 0 1_2 60 3 
msa238454.2{401 CJB110 
msa238454 . 2 { 401_COH1 
msa238454.2f401_M732 
msa238454 .2{401_M781 
msa238454 . 2 { 40WM9130013 
Consensus 



151 

CAACTTTTGA 
CAACTTTTGA 
CAACTTTTGA 
CAACTTTTGA 
CAACTTTTGA 
CAACTTTTGA 
CAACTTTTGA 
CAACTTTTGA 
CAACTTTTGA 
CAACTTTTGA 
CAACTTTTGA 



ATGGTTTACA 
ATGGTTTACA 
ATGGTTTACA 
ATGGTTTACA 
ATGGTTTACA 
ATGGTTTACA 
ATGGTTTACA 
ATGGTTTACA 
ATGGTTTACA 
ATGGTTTACA 
ATGGTTTACA 



TATTCCTACA 
TATTCCTACA 
TATTCCTACA 
TATTCCTACA 
TATTCCTACA 
TATTCCTACA 
TATTCCTACA 
TATTCCTACA 
TATTCCTACA 
TATTCCTACA 
TATTCCTACA 



AAAGGTGAGG 
AAAGGTGAGG 
AAAGGTGAGG 
AAAGGTGAGG 
AAAGGTGAGG 
AAAGGTGAGG 
AAAGGTGAGG 
AAAGGTGAGG 
AAAGGTGAGG 
AAAGGTGAGG 
AAAGGTGAGG 



200 

TAATTGTCGA 
TAATTGTCGA 
TAATTGTCGA 
TAATTGTCGA 
TAATTGTCGA 
TAATTGTCGA 
TAATTGTCGA 
TAATTGTCGA 
TAATTGTCGA 
TAATTGTCGA 
TAATTGTCGA 



msa238454 . 2 (401_A909 
msa238454 .2{401_H36B 
msa238454 . 2 {401_090 
msa238454.2f401_1169NT 
msa238454 . 2 { 401_18RS2 1 
msa2 3 84 54 . 2 { 40 1_2 6 0 3 
msa2384S4 .2{401_CJB110 
msa2 3 8 4 54 . 2 { 4 0 1_C0H1 
msa238454.24 401_M732 
msa2 3 84 54 . 2 { 40 1_M7 8 1 
msa238454.2{401_JM9130013 
~ Consensus 



201 

TGATTTTTCT 
TGATTTTTCT 
TGATTTTTCT 
TGATTTTTCT 
TGATTTTTCT 
TGATTTTTCT 
TGATTTTTCT 
TGATTTTTCT 
TGATTTTTCT 
TGATTTTTCT 
TGATTTTTCT 



ATTAAAGCAG 
ATTAAAGCAG 
ATTAAAGCAG 
ATTAAAGCAG 
ATTAAAGCAG 
ATTAAAGCAG 
ATTAAAGCAG 
ATTAAAGCAG 
ATTAAAGCAG 
ATTAAAGCAG 
ATTAAAGCAG 



GGGACAAGAA 
GGGACAAGAA 
GGGACAAGAA 
GGGACAAGAA 
GGGACAAGAA 
GGGACAAGAA 
GGGACAAGAA 
GGGACAAGAA 
GGGACAAGAA 
GGGACAAGAA 
GGGACAAGAA 



CAAAGAAATC 
CAAAGAAATC 
CAAAGAAATC 
CAAAGAAATC 
CAAAGAAATC 
CAAAGAAATC 
CAAAGAAATC 
CAAAGAAATC 
CAAAGAAATC 
CAAAGAAATC 
CAAAGAAATC 



250 

AAATTTATAA 
AAATTTATAA 
AAATTTATAA 
AAATTTATAA 
AAATTTATAA 
AAATTTATAA 
AAATTTATAA 
AAATTTATAA 
AAATTTATAA 
AAATTTATAA 
AAATTTATAA 



raaa238454 .2f 401_A909 
msa2 3 84 54 . 2 { 4 0 1JH36B 
rasa238454 . 2 {401_090 
ms a23 8 4 54 . 2 { 4 0 1_1 16 9NT 
msa238454.2{401_18RS21 
msa238454 .2{401_2603 
msa238454.2{401_CJB110 
msa2 38454.2(40 1_C0H1 
ms a2 3 8 4 5 4 . 2 { 4 0 1_M7 3 2 
msa23B454.2{401_M781 
msa238454 . 2 {401_JM9130013 
Consensus 



251 

GGCAAAAAGT 
GGCAAAAAGT 
GGCAAAAAGT 
GGCAAAAAGT 
GGCAAAAAGT 
GGCAAAAAGT 
GGCAAAAAGT 
GGCAAAAAGT 
GGCAAAAAGT 
GGCAAAAAGT 
GGCAAAAAGT 



TGGTTTAGTT 
TGGTTTAGTT 
TG GTTTA GTT 
TGGTTTAGTT 
TGGTTTAGTT 
TGGTTTAGTT 
TGGTTTAGTT 
TGGTTTAGTT 
TGGTTTAGTT 
TGGTTTAGTT 
TGGTTTAGTT 



TTTCAATTTC 
TTTCAATTTC 
TTTCAATTTC 
TTTCAATTTC 
TTTCAATTTC 
TTTCAATTTC 
TTTCAATTTC 
TTTCAATTTC 
TTTCAATTTC 
TTTCAATTTC 
TTTCAATTTC 



CAGAAAGTCA 
CAGAAAGTCA 
CAGAAAGTCA 
CAGAAAGTCA 
CAGAAAGTCA 
CAGAAAGTCA 
CAGAAAGTCA 
CAGAAAGTCA 
CAGAAAGTCA 
CAGAAAGTCA 
CAGAAAGTCA 



300 

GCTTTTTGAA 
G CTTTTT GAA 
GCTTTTTGAA 
GCTTTTTGAA 
GCTTTTTGAA 
GCTTTTTGAA 
G CTTTTTGA A 
GCTTTTTGAA 
GCTTTTTGAA 
GCTTTTTGAA 
GCTTTTTGAA 



msa238454 .2f 401_A909 
msa238454.2{401_H36B 
msa238454 . 2 {401_090 
msa238454.2{401_1169NT 
msa238454 . 2 { 401_18RS21 
msa2 3 84 54 . 2 { 4 0 1__2 603 
msa238 454 . 2 { 4 0 1_CJB110 
msa238454.2l401_.COHl 
msa238454 .2(401 M732 
msa238454.2{40l3l781 
msa238454 . 2 {401_JM9130013 
Consensus 



301 

GAGACAGTTT 
GAGACAGTTT 
GAGACAGTTT 
GAGACAGTTT 
GAGACAGTTT 
GAGACAGTTT 
GAGACAGTTT 
GAGACAGTTT 
GAGACAGTTT 
GAGACAGTTT 
GAGACAGTTT 



TAAAaGATGT 
TAAAaGATGT 
TAAAgGATGT 
TAAAgGATGT 
TAAAgGATGT 
TAAAgGATGT 
TAAAgGATGT 
TAAAgGATGT 
TAAAgGATGT 
TAAAgGATGT 
TAAAgGATGT 



TGCTTTTGGA 
TG CTTTTG GA 
TG CTTTTG GA 
TGCTTTTGGA 
TGCTTTTGGA 
TGCTTTTGGA 
TGCTTTTGGA 
TGCTTTTGGA 
TGCTTTTGGA 
TGCTTTTGGA 
TGCTTTTGGA 



CCACAAAATT 
CCACAAAATT 
CCACAAAATT 
CCACAAAATT 
CCACAAAATT 
CCACAAAATT 
CCACAAAATT 
CCACAAAATT 
CCACAAAATT 
CCACAAAATT 
CCACAAAATT 



350 

TTGGTATTTC 
TTGGTATTTC 
TTGGTATTTC 
TTGGTATTTC 
TTGGTATTTC 
TTGGTATTTC 
TTGGTATTTC 
TTGGTATTTC 
TTGGTATTTC 
TTGGTATTTC 
TTGGTATTTC 



maa238454.2{401_A909 
msa238454 . 2 { 401_H36B 
msa238454.2{401_090 
msa23 8 4 54 . 2 [ 4 0 1_1 1 6 9NT 
msa238454 . 2 {401_18RS21 
maa238454.2{401_2603 



351 

TCAGATTGAA 
TCAGATTGAA 
TCAGATTGAA 
TCAGATTGAA 
TCAGATTGAA 
TCAGATTGAA 



GCTGAAAGGC 
GCTGAAAGGC 
GCTGAAAGGC 
GCTGAAAGGC 
GCTGAAAGGC 
GCTGAAAGGC 



TGGCTGAAGA 
TGGCTGAAGA 
TGGCTGAAGA 
TGGCTGAAGA 
TGGCTGAAGA 
TGGCTGAAGA 



AAAATTAAGG 
AAAATTAAGG 
AAAATTAAGG 
AAAATTAAGG 
AAAATTAAGG 
AAAATTAAGG 



400 

TTAGTTGGTA 
TTAGTTGGTA 
TTAGTTGGTA 
TTAGTTGGTA 
TTAGTTGGTA 
TTAGTTGGTA 
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msa238454 . 2 { 401_CJB110 
ms a2 3 8 4 54 . 2 { 40 l_OOHl 
maa238454 .2(401_M732 
msa238454.2{401_M781 
msa238454 .2(40 1_JM9 13 0013 
Consensus 



TCAGATTGAA GCTGAAAGGC TGGCTGAAGA AAAATTAAGG TTAGTTGGTA 
TCAGATTGAA GCTGAAAGGC TGGCTGAAGA AAAATTAAGG TTAGTTGGTA 
TCAGATTGAA GCTGAAAGGC TGGCTGAAGA AAAATTAAGG TTAGTTGGTA 
TCAGATTGAA GCTGAAAGGC TGGCTGAAGA AAAATTAAGG TTAGTTGGTA 
TCAGATTGAA GCTGAAAGGC TGGCTGAAGA AAAATTAAGG TTAGTTGGTA 



msa238454.2{401_A909 
msa238454.2{401_H36B 
rasa238454.2{401_090 
msa238454.2(401_1169NT 
msa238454.2{401_18RS21 
msa238454.2{401_2603 
msa23B454.2{401_CJB110 
msa2 3 8 4 S4 . 2 { 4 0 1_C0H1 
msa238454.2(401_M732 
msa2384S4.2{401_M781 
msa238454 .2{401_JM9130013 
Consensus 



401 

TcAGTGAGGA 
TcAGTGAGGA 
TcAGTGAGGA 
TcAGTGAGGA 
TcAGTGAGGA 
TcAGTGAGGA 
TCAGTGAGGA 
TcAGTGAGGA 
TcAGTGAGGA 
TcAGTGAGGA 
TtAGTGAGGA 



TTTATTCGAT 
TTTATTCGAT 
TTTATTCGAT 
TTTATTCGAT 
TTTATTCGAT 
TTTATTCGAT 
TTTATTCGAT 
TTTATTCGAT 
TTTATTCGAT 
TTTATTCGAT 
TTTATTCGAT 



AAAAATCCAT 
AAAAATCCAT 
AAAAATCCAT 
AAAAATCCAT 
AAAAATCCAT 
AAAAATCCAT 
AAAAATCCAT 
AAAAATCCAT 
AAAAATCCAT 
AAAAATCCAT 
AAAAATCCAT 



TTGAACTTTC 
TTGAACTTTC 
TTGAACTTTC 
TTGAACTTTC 
TTGAACTTTC 
TTGAACTTTC 
TTGAACTTTC 
TTGAACTTTC 
TTGAACTTTC 
TTGAACTTTC 
TTGAACTTTC 



450 

TGGAGGGCAG 
TGGAGGGCAG 
TGGAGGGCAG 
TGGAGGGCAG 
TGGAGGGCAG 
TGGAGGGCAG 
TGGAGGGCAG 
TGGAGGGCAG 
TGGAGGGCAG 
TGGAGGGCAG 
TGGAGGGCAG 



msa23 8 4 54 . 2 { 40 1_A90 9 ' 
msa238454.2{401_H36B' 
msa238454 . 2 {4 01_090 ' 
msa238454 .2{401_1169NT 
msa238454.2{401 18RS21 
msa23 8454 . 2 { 401_2603 
msa238454.2{401_CJB110 
msa238454.2{40I_COHl 
msa238454. 2(401 M732 
msa2 3 8 4 54 . 2 { 40 1_M7 8 1 
msa238454.2{40WM9130013 
Consensus 



451 

ATGAGGCGGG 
ATGAGGCGGG 
ATGAGGCGGG 
ATGAGGCGGG 
ATGAGGCGGG 
ATGAGGCGGG 
ATGAGGCGGG 
ATGAGGCGGG 
ATGAGGCGGG 
ATGAGGCGGG 
ATGAGGCGGG 



TTGCTATAGC 
TTGCTATAGC 
TTGCTATAGC' 
TTGCTATAGC 
TTGCTATAGC 
TTGCTATAGC 
TTGCTATAGC 
TTGCTATAGC 
TTGCTATAGC 
TTGCTATAGC 
TTGCTATAGC 



TGGTATTTTA 
TGGTATTTTA 
TGGTATTTTA 
TGGTATTTTA 
TGGTATTTTA 
TGGTATTTTA 
TGGTATTTTA 
TGGTATTTTA 
TGGTATTTTA 
TGGTATTTTA 
TGGTATTTTA 



********** ********** ********** 



GCGATGGAAC 
GCGATGGAAC 
GCGATGGAAC 
GCGATGGAAC 
GCGATGGAAC 
GCGATGGAAC 
GCGATGGAAC 
GCGATGGAAC 
GCGATGGAAC 
GCGATGGAAC 
GCGATGGAAC 
********** 



500 

CCAAAGTACT 
CCAAAGTACT 
CCAAAGTACT 
CCAAAGTACT 
CCAAAGTACT 
CCAAAGTACT 
CCAAAGTACT 
CCAAAGTACT 
CCAAAGTACT 
CCAAAGTACT 
CCAAAGTACT 
********** 



msa238454.2(401_A909 
msa238454 . 2 {401_H36B' 
msa238454 . 2 {401_090 
msa238454 .2{401_1169NT 
msa238454.2{401_18RS21 
msa238454.2{401_2603 
msa238454.2{401_CJB110 
msa238454.2{401_COHl 
msa238454.2{401_M732 
msa238454.2{401_M781 
rasa23B4S4.2{40WM9130013 
~ Consensus 



501 

AGTACTaGAT 
AGTACTaGAT 
AGTACTgGAT 
AGTACTgGAT 
AGTACTgGAT 
AGTACTgGAT 
AGTACTgGAT 
AGTACTgGAT 
AGTACTgGAT 
AGTACTgGAT 
AGTACTgGAT 



GAGCCAACAG 
GAGCCAACAG 
GAGCCAACAG 
GAGCCAACAG 
GAGCCAACAG 
GAGCCAACAG 
GAGCCAACAG 
GAGCCAACAG 
GAGCCAACAG 
GAGCCAACAG 
GAGCCAACAG 



CTGGACTTGA 
CTGGACTTGA 
CTGGACTTGA 
CTGGACTTGA 
CTGGACTTGA 
CTGGACTTGA 
CTGGACTTGA 
CTGGACTTGA 
CTGGACTTGA 
CTGGACTTGA 
CTGGACTTGA 



TCCTAAGGGA 
TCCTAAGGGA 
TCCTAAGGGA 
TCCTAAGGGA 
TCCTAAGGGA 
TCCTAAGGGA 
TCCTAAGGGA 
TCCTAAGGGA 
TCCTAAGGGA 
TCCTAAGGGA 
TCCTAAGGGA 



550 

AGAAAAGAAT 
AGAAAAGAAT 
AGAAAAGAAT 
AGAAAAGAAT 
AGAAAAGAAT 
AGAAAAGAAT 
AGAAAAGAAT 
AGAAAAGAAT 
AGAAAAGAAT 
AGAAAAGAAT 
AGAAAAGAAT 



tnsa238454.2{401_A909 
msa238454.2{401_H36B 
msa238454 . 2 {401_090 
msa238454.2{401_1169NT 
msa238454 . 2 (401_18RS21 
msa238454.2{401_2603 
msa23 8 4 54 . 2 { 4 0 1_CJB110 
0isa2384 54 . 2 { 40 l_COHl 
msa238454.2{401_M732 
msa238454 ,2{401_M781 
msa238454.2{401_JM9 130013 
Consensus 



551 

TAATGACTCT 
TAATGACTCT 
TAATGACTCT 
TAATGACTCT 
TAATGACTCT 
TAATGACTCT 
TAATGACTCT 
TAATGACTCT 
TAATGACTCT 
TAATGACTCT 
TAATGACTCT 



TTTTAAAAAT 
TTTTAAAAAT 
TTTTAAAAAT 
TTTTAAAAAT 
TTTTAAAAAT 
TTTTAAAAAT 
TTTTAAAAAT 
TTTTAAAAAT 
TTTTAAAAAT 
TTTTAAAAAT 
TTTTAAAAAT 



CTTCATAAAA 
CTTCATAAAA 
CTTCATAAAA 
CTTCATAAAA 
CTTCATAAAA 
CTTCATAAAA 
CTTCATAAAA 
CTTCATAAAA 
CTTCATAAAA 
CTTCATAAAA 
CTTCATAAAA 



AAGGAATGAC 
AAGGAATGAC 
AAGGAATGAC 
AAGGAATGAC 
AAGGAATGAC 
AAGGAATGAC 
AAGGAATGAC 
AAGGAATGAC 
AAGGAATGAC 
AAGGAATGAC 
AAGGAATGAC 



600 

TATCGTCTTA 
TATCGTCTTA 
TATCGTCTTA 
TATCGTCTTA 
TATCGTCTTA 
TATCGTCTTA 
TATCGTCTTA 
TATCGTCTTA 
TATCGTCTTA 
TATCGTCTTA 
TATCGTCTTA 



msa238454.2U01_A909 
msa238454.2(401_H36B 
maa238454 . 2 {401_090 
msa238454 . 2(401 1169NT 
msa238454 . 2 { 401_18RS21 
msa2 3 84 54 . 2 { 40 1_2 603 
msa238454 . 2 {401_CJB110 
tnsa2 3 8 4 54 . 2 f 4 0 l_COHl 
msa238454.2(401_M732 
msa238454.2{401_M781 
msa238454.2{401 - JM9130013 
Consensus 



601 

GTGACTCACT 
GTGACTCACT 
GTGACTCACT 
GTGACTCACT 
GTGACTCACT 
GTGACTCACT 
GTGACTCACT 
GTGACTCACT 
GTGACTCACT 
GTGACTCACT 
GTGACTCACT 



TAATGGACGA 
TAATGGACGA 
TAATGGACGA 
TAATGGACGA 
TAATGGACGA 
TAATGGACGA 
TAATGGACGA 
TAATGGACGA 
TAATGGACGA 
TAATGGACGA 
TAATGGACGA 



TGTAGOGGAT 
TGTAGCGGAT 
TGTAGOGGAT 
TGTAGCGGAT 
TGTAGCGGAT 
TGTAGCGGAT 
TGTAGCGGAT 
TGTAGCGGAT 
TGTAGCGGAT 
TGTAGCGGAT 
TGTAGCGGAT 



TATGCTGACT 
TATGCTGACT 
TATGCTGACT 
TATGCTGACT 
TATGCTGACT 
TATGCTGACT 
TATGCTGACT 
TATGCTGACT 
TATGCTGACT 
TATGCTGACT 
TATGCTGACT 



650 

ATGTGTATGT 
ATGTGTATGT 
ATGTGTATGT 
ATGTGTATGT 
ATGTGTATGT- 
ATGTGTATGT 
ATGTGTATGT 
ATGTGTATGT 
ATGTGTATGT 
ATGTGTATGT 
ATGTGTATGT 



tnsa238454 .2f 401_A909 
msa23B454.2{401_H36B 
msa2384S4.2{401 090 
msa238454.2{401_1169NT 
msa238454 . 2 (401_18RS21 



651 700 
TTTAGAAGCA GGGAAAGTAA CCTTATCAGG ACAACCAAAg CAGATTTTTC 
TTTAGAAGCA GGGAAAGTAA CCTTATCAGG ACAACCAAAg CAGATTTTTC 
TTTAGAAGCA GGGAAAGTAA CCTTATCAGG ACAACCAAAa CAGATTTTTC 
TTTAGAAGCA GGGAAAGTAA CCTTATCAGG ACAACCAAAa CAGATTTTTC 
TTTAGAAGCA GGGAAAGTAA CCTTATCAGG ACAACCAAAa CAGATTTTTC 



1099 



WO 2004/018646 



PCTYUS2003/026827 



Table 79: Comparative Sequences relating to SAG21S0 



tnsa2 3 84 54 . 2 { 4 0 1_2 6 0 3 
msa238454 . 2 { 401_CJB110 
maa238454 . 2 f 401_COH1 
msa238454.2{401_M732 
msa238454.2{401_M781 
msa238454.2{401_JM9130013 
Consensus 



TTTAGAAGCA 
TTTAGAAGCA 
TTTAGAAGCA 
TTTAGAAGCA 
TTTAGAAGCA 
TTTAGAAGCA 



GGGAAAGTAA 
GGGAAAGTAA 
GGGAAAGTAA 
GGGAAAGTAA 
GGGAAAGTAA 
GGGAAAGTAA 



********** ********** 



CCTTATCAGG 
CCTTATCAGG 
CCTTATCAGG 
CCTTATCAGG 
CCTTATCAGG 
CCTTATCAGG 
********** 



ACAACCAAAa 
ACAACCAAAa 
ACAACCAAAa 
ACAACCAAAa 
ACAACCAAAa 
ACAACCAAAa 
*********. 



CAGATTTTTC 
CAGATTTTTC 
CAGATTTTTC 
CAGATTTTTC 
CAGATTTTTC 
CAGATTTTTC 
********** 



msa238454.2(401_A909 
tnsa238454 . 2{401__H36B 
rasa238454.2{401_090 
msa238454.2{401_1169NT 
msa238454 .2{401_18RS21 
msa238454.2{401_2603 
msa238454.2{401_CJB110 
msa238454.2(401_COHl 
msa238454 . 2{401_M732 
msa238454.2(401_M781 
msa238454 . 2{401_JM9130013 
Consensus 



701 

AAGAAGTAGA 
AAGAAGTAGA 
AAGAAGTAGA 
AAGAAGTAGA 
AAGAAGTAGA 
AAGAAGTAGA 
AAGAAGTAGA 
AAGAAGTAGA 
AAGAAGTAGA 
AAGAAGTAGA 
AAGAAGTAGA 



ACTTTTAGAA 
ACTTTTAGAA 
ACTTTTAGAA 
ACTTTTAGAA 
ACTTTTAGAA 
ACTTTTAGAA 
ACTTTTAGAA 
ACTTTTAGAA 
ACTTTTAGAA 
ACTTTTAGAA 
ACTTTTAGAA 



AGTAAACAAT 
AGTAAACAAT 
AGTAAACAAT 
AGTAAACAAT 
AGTAAACAAT 
AGTAAACAAT 
AGTAAACAAT 
AGTAAACAAT 
AGTAAACAAT 
AGTAAACAAT 
AGTAAACAAT 



TAGGAGTTCC 
TAGGAGTTCC 
TAGGAGTTCC 
TAGGAGTTCC 
TAGGAGTTCC 
TAGGAGTTCC 
TAGGAGTTCC 
TAGGAGTTCC 
TAGGAGTTCC 
TAGGAGTTCC 
TAGGAGTTCC 



750 

CAAAATCACC 
CAAAATCACC 
CAAAATCACC 
CAAAATCACC 
CAAAATCACC 
CAAAATCACC 
CAAAATCACC 
CAAAATCACC 
CAAAATCACC 
CAAAATCACC 
CAAAATCACC 



msa238454.2{401_A909 
msa238454 .2{401_H36B 
msa238454.2{401_090 
msa238454.2{401_1169NT 
msa238454.2{401_18RS21 
msa238454.2{401_2603 
msa238454 .2 {401__CJB110 
msa238454 . 2 ( 401_COH1 
msa2 3 84 54 . 2 ( 4 0 1_M73 2 
msa238454.2{401_M781 
msa238454 . 2 { 401_JM9130013 
Consensus 



751 

AAGTTTGCTC 
AAGTTTGCTC 
AAGTTTGCTC 
AAGTTTGCTC 
AAGTTTGCTC 
AAGTTTGCTC 
AAGTTTGCTC 
AAGTTTGCTC 
AAGTTTGCTC 
AAGTTTGCTC 
AAGTTTGCTC 



AAAGgCTATC 
AAAGgCTATC 
AAAGaCTATC 
AAAGaCTATC 
AAAGaCTATC 
AAAGaCTATC 
AAAGaCTATC 
AAAGaCTATC 
AAAGaCTATC 
AAAGaCTATC 
AAAGaCTATC 



TCATAAGGGA 
TCATAAGGGA 
TCATAAGGGA 
TCATAAGGGA 
TCATAAGGGA 
TCATAAGGGA 
TCATAAGGGA 
TCATAAGGGA 
TCATAAGGGA 
TCATAAGGGA 
TCATAAGGGA 



TTAAATTTAC 
TTAAATTTAC 
TTAAATTTAC 
TTAAATTTAC 
TTAAATTTAC 
TTAAATTTAC 
TTAAATTTAC 
TTAAATTTAC 
TTAAATTTAC 
TTAAATTTAC 
TTAAATTTAC 



800 

CTAGTTTACC 
CTAGTTTACC 
CTAGTTTACC 
CTAGTTTACC 
CTAGTTTACC 
CTAGTTTACC 
CTAGTTTACC 
CTAGTTTACC 
CTAGTTTACC 
CTAGTTTACC 
CTAGTTTACC 



msa238454 . 2{401_A909 
msa238454.2{401_K36B 
msa238454 .2{401_090 
msa238454 .2 f 401_1169NT 
msa238454.2{401 18RS21 
msa238454 . 2 {401_2603 
msa238454 . 2 { 401_CJB110 
cnsa2 3 8 4 54 . 2 f 4 0 1JCOH1 
msa238454 . 2 f 40 1_M73 2 
maa238454 . 2 {401J4781 
msa2 3 8 4 54 . 2 { 4 0 1_JM9 13 0 0 13 
Consensus 



801 

AATTACTATT 
AATTACTATT 
AATTACTATT 
AATTACTATT 
AATTACTATT 
AATTACTATT 
AATTACTATT 
AATTACTATT 
AATTACTATT 
AATTACTATT 
AATTACTATT 



AACGAATTTG 
AACGAATTTG 
AACGAATTTG 
AACGAATTTG 
AACGAATTTG 
AACGAATTTG 
AACGAATTTG 
AACGAATTTG 
AACGAATTTG 
AACGAATTTG 
AACGAATTTG 



TGGAGGCTAT 
TGGAGGCTAT 
TGGAGGCTAT 
TGGAGGCTAT 
TGGAGGCTAT 
TGGAGGCTAT 
TGGAGGCTAT 
TGGAGGCTAT 
TGGAGGCTAT 
TGGAGGCTAT 
TGGAGGCTAT 



840 

TAAGCATGGA 
TAAGCATGGA 
TAAGCATGGA 
TAAGCATGGA 
TAAGCATGGA 
TAAGCATGGA 
TAAGCATGGA 
TAAGCATGGA 
TAAGCATGGA 
TAAGCATGGA 
TAAGCATGGA 



SBQ ZD NO. 7912 
STRAIN 2603 frame 1 

MGIEFKNVSYTYQAGTPFEGRALFDVNLKI EDAS YTAF I GHTGSGKSTI MQLLNG LH I PTK 
GBVI VDDFS I KAGDKNKEIKFIRQKVGLVFQFPESQLFEETVLKDVAFGPQNFGISQIEA 
ERLAEEKLRLVG I SEDLFDKNPFELSGGQMRRVAIAG I LAMBPKVLVLDEPTAGLDPKGR 
KELMTLFKNLHKKGMTI VLVTHLMDDVADYADYVYVLEAGKVTLSGQPKQI FQEVELLES 
KQLGVPKTTKPAQRLSHKGLNLPSLPITINEPVEAI KHG 



SEQ ZD HO. 7913 
STRAIN 090 frame: 1 

GI EFKNVSYTYQAGT PFEGRALFD VNLKI EDASYTAF IGHTG SG KST I MQLLNGLH I PTK 
GBVI VDDFSI KAGDKNKEI KFIRQKVGLVFQFPESQLFEETVLKDVAFGPQNFGI SQIEA 
F^RLAEEKLRIiVGISEDLFDKNPFELSGGQMRRVAIAGIljAMEPKVL 
KELMrLFKNLHKKGOTIVLVTHLh©^^ FQEVELLES 
KQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAI KHG 

SBQ ZD NO. 7914 

STRAIN 090 frame: 1 

G I EFKNVSYTYQAGT PFEGRALFD VNLKI EDASYTAF I GHTGSGKSTI MQLLNGLH I PTK 
GBVI VDDFS I KAGDKNKEI KFIRQKVGLVFQFPESQLFEETVLKDVAFGPQNFGI SQIEA 
ERLAEEKLRLVG I SEDLFDKNPFELSGGQMRRVAIAG I LAMEP KVLVLDEPTAGLDPKGR 
KELMTLFKNLHKKGMTI VLVTHLMDDVADYADYVYVLEAGKVTLSGQPKQI FQEVELLES 
KQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAIKHG 

SBQ ZD NO. 7915 
STRAIN H36B frame: 1 

GI BFKNVSYTYQAGTPFEGRALFD VNLKI EDASYTAF I GHTGSG KST I MQLLNGLH I PTK 
GEVI VDDFS I KAGDKNKE I KFI RQKVGLVFQFPBSQLFEETVLKDVAFGPQNFG I SQIEA 
ERLAEEKLRLVG I SEDLFDKNPFBLSGGQMRRVAIAGIIJVMEPKVLVLDEPTAGLDPKGR 
KEIJfrLFKNLHKKGMT I VLVTHL^ I FQEVELLES 

KQl/jVPKITKFAQRLSHKGIiNLPSLPITINEFVEAIKHG 



SBQ ZD NO. 7916 



1100 



WO 2004/018646 



PCTYUS2003/026827 



Table 79: Comparative Sequences relating to SAG2150 



STRAIN 18RS21 frame: I 

GIEPK^SYTYQAGTPP^RALFDVNLKIEimSYTAPIGHTGSGKSTIMQLI^GLHIPTK 
GEVI VDDFS I KAGDKNKE I KF I RQKVGLVFQFPESQLFEEITVLKDVAFGPQNFG I SQ I EA 
ERLAEEKLRLVG I S EDL FDKNP FEL SGGQMRR VA I AG I LAME PKVL VLDE PT AGLD P KG R 
KELMTLFKNLHKKGMTIVLVTHLMDDVADYADYV^^ FQEVELLES 
KQIX3VPKITKFAQRLSHKGLNLPSLPITINEFVBAIKHG 

SEQ ZD NO. 7917 
STRAIN M732 frame: I 

GI EFKNVSYTYQAGTPFEGRALFDVNLKI ETWSYTAF I GHTGSGKST I MQLLNGLHI PTK 
GEVI VDDFS I KAGDKNKE I KF I RQKVGLVFQFPESQLFEETVLKDVAFGPQNFGI SQIEA 
ERLAEEKLRLVGI SEDLFDKNPFELSGGQMRRVAI AGILAMEPKVLVLDBPTAGL^ 
KE LMTLFKNLHKKGMT I VLVTHLMDDVADYAD YVYVLEAGKVTLSGQPKQI FQE VELLE S 
KQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAI KHG 

SEQ ZD NO. 7918 
STRAIN COH1 frame: 1 

G I EFKNVSYTYQAGTPFEGRALFDVNLKI EDVSYTAF I GHTGSGKST I MQLLNGLHI PTK 
GEVT VDDFS I KAGDKNKE I KFI RQKVGLVFQF PESQLFEETVLKDVAFGPQNFG I SQI EA 
ERLAEEKLRLVG I SEDLFDKNPFELSGGQMRRVAI AG I LAMEPKVLVLDE PTAGLDP KGR 
KEIWTLFKNLHKKGMTI VLVTHLMDDVADYADYVYVLEAGKVTLSGQPKQ I FQBVELLES 
KQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAI KHG 

SEQ ZD NO. 7919 
STRAIN M7 81 frame: 1 

GI EFKNVSYTYQAGTPFEGRALFDVNLKI EDVSYTAF I GHTGSGKST I MQLLNGLHI PTK 
GEVI VDD FS I KAGDKNKE I KFI RQKVGLVFQFPESQLFEETVLKDVAFGPQNFG I SQI EA 
ERLAEEKLRLVG I SEDLFDKNPFELSGGQMRRVAIAG I LAME PKVLVLDEPTAGLDPKGR 
KELMTLFKNLHKKGMT I VLVTHLMDDVADYAD YVYVLEAGKVTLSGQPKQ I FQBVELLES 
KQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAIKHG 

SEQ ZD NO. 7920 
STRAIN CJBUO frame: 1 

GI EFKNVSYTYQAGTPFEGRALFDVNLKI EDAS YTAF I GHTGSGKST I MQLLNGLH I PTK 
GEVI VDDFS I KAGDKNKE I KFI RQKVGLVFQFPESQLFEETVLKDVAFGPQNFG I SQI EA 
ERIiAEEKLRLVGISEDLFDKNPFELSGGQMRRVAIAGILAMEPKVLVIuDE 
KELMTLFKNLHKKGMTI VLVTHLMDDVADYAD YV^ FQEVELLES 
KQLGVPKITKFAQRLSHKGLNLPSLPITINEFVEAIKHG 

SEQ ZD NO. 7921 
STRAIN 1169NT frame: 1 

GI EFKNVSYTYQAGTPFEGRALFDVNLKI EDASYTAFIGHTGSGKSTIMQLLNGLHI PTK 
GEVI VDDFS I KAGDKNKE I KFI RQKVGLVFQF PESQLFEETVLKDVAFGPQNFG I SQI EA 
ERLAEEKLRLVG I SEDL FDKNPFELSGGQMRRVA I AGI LAME PKVLVLDE PTAGLDP KGR 
KEIjMTLFKNLHKKGMT I VLVTHLMDDVADYAD YVYVLEAG KVTLSGQPKQ I FQEVELLE S 
KQLGVPKITKFAQRLSHKGLNLPSLPIT I NEFVEA I KHG 

SEQ ZD NO. 7922 
STRAIN JM9 1300 13 frame: 1 

G I EFKNVSYTYQAGTPFEGRALFDVNLKI EDAS YTAF I GHTGSGKST I MQLLNGLHI PTK 
GEVT VDDFS I KAGDKNKE I KFI RQKVGLVFQF PESQL FE ETVLKD VAFGPQNFG I SQ I EA 
ERLAEEKLRLVG I SEDLFDKNPFELSGGQMRRVAI AG I LAME PKVLVLDEPTAGLDPKGR 
KBLMTLFKNLHKKGMTI VLVTHIiTODVADYADYVYVI^GKVTLSGQPKQI FQEVELLES 
KQLGVPKITKFAQRLSHKGLNLPSLPIT I NEFVEAI KHG 

PRETTY of: /biottnp/msa238553 . 2 { * } May 14, 2003 06; 55 



msa238553.2{401_090 
msa238553 . 2 (401_1169NT 
msa2 3 8 553 . 2 { 4 0 1_18 RS2 1 
maa238553. 2(401 2603 
maa238553 . 2 {401_CJB110 
msa238553.2{401 H36B 
msa238553.2{401_JM9130013 
maa238553.2(401_GOHl 
msa238553 .2<401_M732 
msa238553.2{401_M781 
Consensus 



-GIEFKNVSY 
-GIEFKNVSY 
-GIEFKNVSY 
raGIEFKNVSY 
-GIEFKNVSY 
-GIEFKNVSY 
-GIEFKNVSY 
-GIEFKNVSY 
-GIEFKNVSY 
-GIEFKNVSY 



TYQAGTPFEG 
TYQAGTPFEG 
TYQAGTPFEG 
TYQAGTPFEG 
TYQAGTPFEG 
TYQAGTPFEG 
TYQAGTPFEG 
TYQAGTPFEG 
TYQAGTPFEG 
TYQAGTPFEG 



RALFDVNLKI 
RALFDVNLKI 
RALFDVNLKI 
RALFDVNLKI 
RALFDVNLKI 
RALFDVNLKI 
RALFDVNLKI 
RALFDVNLKI 
RALFDVNLKI 
RALFDVNLKI 



EDaSYTAFIG 
EDaSYTAFIG 
EDaSYTAFIG 
EDaSYTAFIG 
EDaSYTAFIG 
EDaSYTAFIG 
EDaSYTAFIG 
EDVSYTAF I G 
EDVSYTAF I G 
EDvSYTAFIG 



50 

HTGSGKSTIM 
HTGSGKSTIM 
HTGSGKSTIM 
HTGSGKSTIM 
HTGSGKSTIM 
HTGSGKSTIM 
HTGSGKSTIM 
HTGSGKSTIM 
HTGSGKSTIM 
HTGSGKSTIM 



msa238 553 . 2 { 4 0 1_090 
msa238553.2{401_1169NT 
rasa238553.2{401_18RS21 
msa238553.2{401_2603 
mBa23B553 .2{401_CJB110 
msa238553.2{401_H36B 
raea2385S3 . 2{ 401_JM9130013 
maa238553. 2(401 COH1 
mea238553 . 2M01_M732 
msa238553 . 2 (401_M781 



51 

QLLNGLHIPT 
QLLNGLHIPT 
QLLNGLHIPT 
QLLNGLHIPT 
QLLNGLHIPT 
QLLNGLHIPT 
QLLNGLHIPT 
QLLNGLHIPT 
QLLNGLHIPT 
QLLNGLHIPT 



KGEVI VDDFS 
KGEVI VDDFS 
KGEVI VDDFS 
KGEVI VDDFS 
KGEVI VDDFS 
KGEVI VDDFS 
KGEVI VDDFS 
KGEVI VDDFS 
KGEVI VDDFS 
KGEVI VDDFS 



I KAGDKNKE I 
I KAGDKNKE I 
I KAGDKNKE I 
I KAGDKNKE I 
I KAGDKNKE I 
I KAGDKNKE I 
I KAGDKNKE I 
I KAGDKNKE I 
I KAGDKNKE I 
I KAGDKNKE I 



KFIRQKVGLV 
KFIRQKVGLV 
KFIRQKVGLV 
KFIRQKVGLV 
KFIRQKVGLV 
KFIRQKVGLV 
KFIRQKVGLV 
KFIRQKVGLV 
KFIRQKVGLV 
KFIRQKVGLV 



100 

FQFPESQLFE 
FQFPESQLFE 
FQFPESQLFE 
FQFPESQLFE 
FQFPESQLFE 
FQFPESQLFE 
FQFPESQLFE 
FQFPESQLFE 
FQFPESQLFE 
FQFPESQLFE 



1101 



WO 2004/018646 



PCTYUS2003/026827 



Table 79: Comparative Sequences relating to SAG2150 



Consensus 



msa238553.2{401_090 
msa238553.2{401_1169NT 
msa238553 . 2 (401_18RS21 
msa238553.2{401_2603 
ma a2 3 8 553 . 2 { 40 1_C JB1 1 0 
ms a2 3 8 5 5 3 . 2 { 4 0 1_H 3 6B 
msa238S53 . 2{401_JM9130013 
msa238S53 .2{401_COH1 
mBa238553 .2(401_M732 
msa238553 ,2{401_M781 
Consensus 



101 

ETVLKDVAPG 
ETVLKDVAFG 
ETVLKDVAFG 
ETVLKDVAFG 
ETVLKDVAFG 
ETVLKDVAFG 
ETVLKDVAFG 
ETVLKDVAFG 
ETVLKDVAFG 
ETVLKDVAFG 



PQNFGISQIB 
PQNFGISQIE 
PQNFGISQIE 
PQNFGISQIE 
PQNFGISQIE 
PQNFGISQIE 
PQNFGISQIE 
PQNFGISQIE 
PQNFGISQIE 
PQNFGISQIE 



AERLAEEKLR 
ABRLAEEKLR 
AERLAEEKLR 
AERLAEEKLR 
AERLAEEKLR 
AERLAEEKLR 
AERLAEEKLR 
AERLAEEKLR 
AERLAEEKLR 
AERLAEEKLR 



LVGISEDLFD 
LVGISEDLFD 
LVGISEDLFD 
LVGISEDLFD 
LVGISEDLFD 
LVGISEDLFD 
LVGISEDLFD 
LVGISEDLFD 
LVGISEDLFD 
LVGISEDLFD 



150 

KNPFELSGGQ 
KNPFELSGGQ 
KNPFELSGGQ 
KNPFELSGGQ 
KNPFELSGGQ 
KNPFELSGGQ 
KNPFELSGGQ 
KNPFELSGGQ 
KNPFELSGGQ 
KNPFELSGGQ 



msa238553.2(401 090 
msa23B553 . 2 { 401_11?9NT 
msa238553.2{401_18RS21 
msa238553 .2{401_2603 
msa238553 . 2 {401_CJB110 
msa23B553.2{401_H36B 
msa238553.2{401_JM9130013 
msa238553.2(401_COHl 
msa238553.2{401_M732 
maa238553 .2{401_M7B1 
Consensus 



151 

MRRVAIAGIL 
MRRVAIAGIL 
MRRVAIAGIL 
MRRVAIAGIL 
MRRVAIAGIL 
MRRVAIAGIL 
MRRVAIAGIL 
MRRVAIAGIL 
MRRVAIAGIL 
MRRVAIAGIL 



AMBPKVLVLD 
AMBPKVLVLD 
AMBPKVLVLD 
AMBPKVLVLD 
AMBPKVLVLD 
AMBPKVLVLD 
AMBPKVLVLD 
AMBPKVLVLD 
AMBPKVLVLD 
AMBPKVLVLD 



EPTAGLDPKG 
EPTAGLDPKG 
EPTAGLDPKG 
EPTAGLDPKG 
EPTAGLDPKG 
EPTAGLDPKG 
EPTAGLDPKG 
EPTAGLDPKG 
EPTAGLDPKG 
EPTAGLDPKG 



RKELMTLFKN 
RKELMTLFKN 
RKELMTLFKN 
RKELMTLFKN 
RKELMTLFKN 
RKELMTLFKN 
RKELMTLFKN 
RKELMTLFKN 
RKELMTLFKN 
RKELMTLFKN 



200 

LHKKGMTIVL 
LHKKGMTIVL 
LHKKGMTIVL 
LHKKGMTIVL 
LHKKGMTIVL 
LHKKGMTIVL 
LHKKGMTIVL 
LHKKGMTIVL 
LHKKGMTIVL 
LHKKGMTIVL 



msa238553.2{401_090 
msa238553 . 2 f 401_1169NT 
msa238553 . 2 { 401_18RS21 
mea238553.2{401_2603 
maa238553 . 2 { 401_CJB110 
rasa238553 ,2{401JH36B 
msa238553.2{401_JM9130013 
msa2 3 8 553 . 2 { 4 0 l_COHl 
moa238553 ,2f401_M732 
msa238553.2{401_M781 
Consensus 



201 

VTHLMDDVAD 
VTHLMDDVAD 
VTHLMDDVAD 
VTHLMDDVAD 
VTHLMDDVAD 
VTHLMDDVAD 
VTHLMDDVAD 
VTHLMDDVAD 
VTHLMDDVAD 
VTHLMDDVAD 



YADYVYVLEA 
YADYVYVLEA 
YADYVYVLEA 
YADYVYVLEA 
YADYVYVLEA 
YADYVYVLEA 
YADYVYVLEA 
YADYVYVLEA 
YADYVYVLEA 
YADYVYVLEA 



GKVTLSGQPK 
GKVTLSGQPK 
GKVTLSGQPK 
GKVTLSGQPK 
GKVTLSGQPK 
GKVTLSGQPK 
GKVTLSGQPK 
GKVTLSGQPK 
GKVTLSGQPK 
GKVTLSGQPK 



QIFQEVELLE 
QIFQEVELLE 
QIFQEVELLE 
QIFQEVELLE 
QIFQEVELLE 
QIFQEVELLE 
QIFQEVELLE 
QIFQEVELLE 
QIFQEVELLE 
QIFQEVELLE 



250 

SKQLGVPKIT 
SKQLGVPKIT 
SKQLGVPKIT 
SKQLGVPKIT 
SKQLGVPKIT 
SKQLGVPKIT 
SKQLGVPKIT 
SKQLGVPKIT 
SKQLGVPKIT 
SKQLGVPKIT 



msa238553 . 2 {401_090 
msa238553 . 2 { 401_1169NT 
msa238553 .2{401_18RS21 
maa2 3 8 553 . 2 { 4 0 1_260 3 
msa238553 .2 {401_CJB110 
msa238553 .2{401_H36B 
insa238553.2{401_JM9130013 
msa238553 . 2 { 401_C0H1 
msa238553.2{401_M732 
maa2385S3 . 2 { 401_M781 
Consensus 



251 

KFAQRLSHKG 
KFAQRLSHKG 
KFAQRLSHKG 
KFAQRLSHKG 
KFAQRLSHKG 
KFAQRLSHKG 
KFAQRLSHKG 
KFAQRLSHKG 
KFAQRLSHKG 
KFAQRLSHKG 



LNLPSLPITI 
LNLPSLPITI 
LNLPSLPITI 
LNLPSLPITI 
LNLPSLPITI 
LNLPSLPITI 
LNLPSLPITI 
LNLPSLPITI 
LNLPSLPITI 
LNLPSLPITI 



280 

NEFVEAIKHG 
NEFVEAIKHG 
NEFVEAIKHG 
NEFVEAIKHG 
NEFVEAIKHG 
NEFVEAIKHG 
NEFVEAIKHG 
NEFVEAIKHG 
NEFVEAIKHG 
NEFVEAIKHG* 



1102 



WO 2004/018646 
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Table 80: Comparative Sequences relating to SAG1266 



SEQ ID NO. 8001 
STRAIN 2603 

GTGAACCACTTACTT AACCT CAGT AAAGAAAATATAG CTAAAATAGATTTTGACTTTCTT 
AATGAGGCACTTAATGCAAATATT CGTTTGAAAGAATTAGT AGATQAACTAAAAATTTCA 
AAAGAACTCGACAGTAAAGGTTGGTCCAAAAAAGACTCTCGAACXIA^ 
GATGGCCTTATCAATAAACATATAGTTTCCCTAGATCG 
GTCATTCCATTTGCTAATGTACATG 

AAAAATTATAGAATATACAACTACAGTGATTATGAAATGGAGTTAATCAATG 

CAACAATTTTCAAAATATGAAAGAGTTGATTTAG^ 

AATATTGATGACTACATTTCATCATATTTAACAATA 

SEQ ID NO. 8002 
STRAIN H36B 

AACCACTTACTrAACCTCAGTAAAGAAAATATAGCT ' 
AAAATAGATTTTGACTTTCTTAATGAGGC^ 

GAAAGAATTAGTAGATGAACTAAAAATTTCAAAAGAACTGGACAGTAAAG 

GTTGGTCCAAAAAAGACTCT CGAACGATAAAAAT CTTGTACGATGG CCTT 

ATCAATAAACATATAGTTTCCCTAGATCGTGCAGATTATAACATTATCCA 

AGTCATTCIZATTTGCTAATGTACATGTACTACTGTTTT^ 

GGGAGAATTCTAAAAATTATAgAATATACAACTACAGTGATTATGAAATG 

GAGTTAATCAATGAGGATAGGCAACAATTTTCAAAATATGA 

TTTAGACCAATTGATACTTGTTGATATTTTTAATATT^ 

CATCATATTTAACAATA 

SEQ ID NO. 8003 
STRAIN 18RS21 

AACXACTTACTTAACCTCAGTAAAGAAAATATAG 

CTAAAATAGATTTTGACTTTCTTAATGAGGCACTTAATG CAAATATTCGT 

TTGAAAGAATTAGTAGATGAACTAAAAATTTCAAAAGAACTGGACAGTAA 

AGGTTGGTCCMAAAAGACTCTCX3AACGATAAAAATCTTG 

TTATCAATAAACATATAGTTTCCCTAGATCXjTGCAGATTATAACATTATC 

CAAGTCATTCCATTTG CTAATGTACATGTACTACTGTTTTTAATACCAGA 

AAGGGAGAATTCTAAAAATTATAGAATATACAACTACAGTGATTATGAAA 

TGGAGTTAATCAATGAGGATAGGGAACAATTITCAAAATATGAAA 

GATTTAGACCAATTGATACTTGTTGATATTTTTAATATTGA^ 

TTCATCATATTTAACAATA 



PRETTY of: /biotmp/msa49308 . 2 { *} February 19, 2003 07:45 



msa49308.2{408_18RS2l} 
msa49308.2f40B_2603 J 
msa49308.2{408_H36BJ 



Consensus 



1 50 

AACCACT TACTTAACCT CAGTAAAGAA AAT AT AG CTA AAATAGATTT 

gtgAACCACT TACTTAACCT CAGTAAAGAA AATATAGCTA AAATAGATTT 
AACCACT TACTTAACCT CAGTAAAGAA AATATAGCTA AAATAGATTT 



51 

TGACTTTCTT 



100 

AATGAGGCAC TTAATGCAAA TATTCGTTTG AAAGAATTAG 



msa49308.2{408_18RS2lJ 

msa49308.2{408 2603) TGA CTTTCTT AATGAGGCAC TTAATGCAAA TATT CG TTTG AAAGAATTAG 

msa49308 .2{4 08_H36B} TGA CTTTCTT AATGAGGCAC TTAATGCAAA TATTCGTTTG AAAGAATTAG 

Consensus ********** ********** ********** ********** ********** 



maa49308.2{408_18RS2l) 
msa49308.2{408_2603) 
msa49308.2{408_H36B) 
Consensus 



101 150 
TAGATGAACT AAAAATTTCA AAAGAACTGG ACAGTAAAGG TTGGTCCAAA 
TAGATGAACT AAAAATTTCA AAAGAACTGG ACAGTAAAGG TTGGTCCAAA 
TAGATGAACT AAAAATTTCA AAAGAACTGG ACAGTAAAGG TTGGTCCAAA 



nisa49308.2{408_lBRS2l} 
msa49308.2(408_2603> 
msa49308.2{408_H36B} 
Consensus 



151 200 
AAAGACTCTC GAACGATAAA AATCTTGTAC GATGGCCTTA TCAATAAACA 
AAAGACTCTC GAACGATAAA AATCTTGTAC GATGGCCTTA TCAATAAACA 
AAAGACTCTC GAACGATAAA AATCTTGTAC GATGGCCTTA TCAATAAACA 



msa49308. 2(408 18RS21) 
msa49308 .2{408_2603J 
msa49308 . 2 {408_H36B} 
Consensus 



201 250 
TATAGTTTCC CTAGATCGTG CAGATTATAA CATTATCCAA GTCATTCCAT 
TATAGTTTCC CTAGATCGTG CAGATTATAA CATTATCCAA GTCATTCCAT 
TATAGTTTCC CTAGATCGTG CAGATTATAA CATTATCCAA GTCATTCCAT 



msa49308.2{4O8_18RS2l} 
msa49308 . 2 f 408J2603 } 
msa49308.2{408_H36B} 
Consensus 



251 300 
TTGCTAATGT ACATGTACTA CTGTTTTTAA TACCAGAAAG GGAGAATTCT 
TTGCTAATGT ACATGTACTA CTGTTTTTAA TACCAGAAAG GGAGAATTCT 
TTGCTAATGT ACATGTACTA CTGTTTTTAA TACCAGAAAG GGAGAATTCT 



msa49308.2{408 18RS21) 
msa49308 . 2 f 408_2603 J 
msa49308 . 2 {408_H36B} 
Consensus 



301 350 
AAAAATTATA GAATATACAA CTACAGTGAT TATGAAATGG AGTTAATCAA 
AAAAATTATA GAATATACAA CTACAGTGAT TATGAAATGG AGTTAATCAA 
AAAAATTATA GAATATACAA CTACAGTGAT TATGAAATGG AGTTAATCAA 



1103 



WO 2004/018646 
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351 400 
TGAGGATAGG CAACAATTTT CAAAATATGA AACAGTTGAT TTAGACCAAT 

„ _ TGAGGATAGG CAACAATTTT CAAAATATGA AACAGTTGAT TTAGACCAAT 

msa49308 .2{408_H36B} TGAGGATAGG CAACAATTTT CAAAATATGA AACAGTTGAT TTAGACCAAT 
Consensus ********** ********** ********** ********** ********** 



msa49308.2{408 18RS21) 
msa493pB.2{408_2603} 



msa49308 . 2 {408_18RS2l} 
msa49308.2{408_2603> 
msa49308.2{408_H36B) 
Consensus 



401 450 

TGATACTTGT TGATATTTTT AATATTGATG ACTACATTTC ATCATATTTA 
TGATACTTGT TGATATTTTT AATATTGATG ACTACATTTC ATCATATTTA 
TGATACTTGT TGATATTTTT AATATTGATG ACTACATTTC ATCATATTTA 



451 

msa49308.2{408 18RS21) ACAATA 
msa49308.2U08_2603) ACAATA 
msa49308 . 2 {408_H36B) ACAATA 
Consensus ****** 



SKQ ZD NO. 8004 
STRAIN 2603 frame: 1 

VNHLLNLSKENIAKI DFDFLNEALNAN I RLKELVDELKI SKELDSKGWSKKDSRTIKILY 
DGLINKHIVSLDRADYNIIQVIPFANVHVLLFLIPERENSKNYRIYNYSDYBMELINEDR 
QQFS KYETVDLDQL I LVD I FN I DDYI S SYLT I 

SKQ XD NO. 8005 
STRAIN H36B Game: 1 

NHLLNLSKBNIAKIDFDFLNEALNANI RLKELVDELKI S KELDSKGWSKKDSRT I KI LYD 
GLINKHI VSLDRADYNI IQVI PFANVHVLLFLI PERENSKNYRI YNYSD YEMEL I NEDRQ 
QFSKYETVDLDQLILVDIFNIDDY1 SSYLTI 

SBQ ZD NO. 8006 
STRAIN I8RS21 frame: 1 

NHLLNLSKEN I AKID FD FLNEALNANI RLKELVDELKI SKELDSKGWSKKDSRTI KI LYD 
GLINKHI VSLDRADYNI IQVI PFANVHVLLFLI PERENSKNYRI YNYSD YEMEL I NEDRQ 
QFSKYETVDLDQLILVDIFNIDDYISSYLTI 



PRETTY of: /biotmp/msa49418 . 2 { *} February 19, 2003 07:47 



msa49418 . 2 {408_18RS2l) 
msa49418.2(408_2603l 
msa49 4 1 8 . 2 { 4 0 8_H3 6B } 
Consensus 



1 50 
-NHLLNLSKE NIAKIDFDFL NEALNANIRL KELVDELKIS KELDSKGWSK 
vNHLLNLSKE NIAKIDFDFL NEALNANIRL KELVDELKIS KELDSKGWSK 
-NHLLNLSKE NIAKIDFDFL NEALNANIRL KELVDELKIS KELDSKGWSK 



rosa49418 . 2 {408_18RS2l} 
msa49418 .2{408_2603) 
msa49418.2{408_H36B) 
Consensus 



51 100 
KDSRTIKILY DGLINKHIVS LDRADYNIIQ VIPFANVHVL LFLIPERENS 
KDSRTIKILY DGLINKHIVS LDRADYNIIQ VIPFANVHVL LFLIPERENS 
KDSRTIKILY DGLINKHIVS LDRADYNIIQ VIPFANVHVL LFLIPERENS 



rasa49418.2{408_18RS2l} 
cnsa49418 .2{408_2603> 
msa49418 . 2 { 408_H36B) 
Consensus 



101 150 
KNYRI YNYSD YEMEL INEDR QQFSKYETVD LDQLILVDIF NIDDYISSYL 
KNYRI YNYSD YEMELINEDR QQFSKYETVD LDQLILVDIF NIDDYISSYL 
KNYRI YNYSD YEMELINEDR QQFSKYETVD LDQLILVDIF NIDDYISSYL 



151 

msa49418.2{408_18RS2l) TI 
rasa49418.2{408_2603 TI 
msa49418.2{408_H36B> TI 
Consensus ** 



1104 



WO 2004/018646 PCT/US2003/026827 
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SEQ XD NO. 8101 
STRAIN 090 

AGCAAGCCTAATGTTGTTCAGTTAAA 

TAATGAATATATTAACGATGAG AAT CTAAAAAAACXHTACGAAG CTGAGG 

AGTTACGCC^AAAAAATCXyrTTAATGGGTTGG 

CTTTTATTTATTTTACCCACTTATAATTTAGTTA 

ACAAGAACGTCXJTCAAGAAGTTGTAAAAITAACGAAAGACTATCAC^ 

TAACTAATAGAACTGAGAACCAGAAGTTGCTAGCAAAACAACTAAAAAAT 

CCAGATTACGTTCAAAAATATGCTCGAGCTAAGTATTATTTCTCTAA^ 

OGGCGAAATGATTTACCCATTACCAGACCTTTTACCAAAA 

SEQ XD HO. 8102 
STRAIN A909 

AGCAAGCCTAATGTTGTTCAGTTAAATAATCAATA 
TATTAACGATGAGAATCTAAAAAAACX3TTACGAAGCTGAGGAG 

TTTAATGGGTTGGGTTCTTATTTTTGTOVTGCTt t tATTTATTTTACCCACTTATAATTT 

AGTTAAGAGTTACAGAACTTTACAAGAACGTCGTCA^ 

CTATCAGACATTAACTAATAGAACTGAGAACCAGAAGTTACT 

TCCAGATTACGTTCAAAAATATGCTCQAGCTAAGTATTATTTCT 

GATTTACCCATTACCAGACCT 

SEQ XD NO. 8103 
STRAIN H36B 

AGCAAGCCTAATGTTGTTCAGTTAAA 

TAATCAATATATTAACXSATGAGAATCTAAAAAAACGTTACGAAG CTGAGG 
AGTTACGCCGAAAAAATCGTTTAATGGGTTGGGTTCI^Aiuu-iU<5TC^^ 
CnTTTATTTATTTTACCCACre 

ACAAGAACGTraTCAAGAAGTTGTAAAATTAACGAAAGACTATCAGA 
TAACTAATAGAACTGAGAAC CAGAAGTTACTAGCAAAACAACTAAAAAAT 
CCAGATTACraTTCAAAAATATGCTCGAGCTrAAGTATTATTTCTCTA^ 
CGGCGAAATGATTTACCCATTACCAGACGtTTTACCAAAA 

SEQ XD NO. 8104 
STRAIN 18RS21 

AGCAAGCCTAATGTTGTTCAGTTAAA 

CGTTACGAAGCTGAGGAGTTACXKXIGAAAAAATCGTTTAATG 

GTCATGC1TTTATTTATTTTACCGACTTATAA 

GAACGTCGTGAAGAAGTTGTAAAATTAACGAAAGACTATCAGACA 

G&GAACCAGAAGTTGCTAG CAAAACAACTAAAAAATCCAGATTACXaTTCAAAAATATGCT 

CXjAGCTAAGTATTATTTCTCTAAGACCGGCGAAATGATTTACCC^ 

CCAAAA 

SEQ ID NO. 8105 
STRAIN M732 

AGCAAGCCTAATGTTGTTCAGTTAAA 

TAATCAATATATTAACGATGAGAATCTAAAAAAACGTTACXaAAG CTGAGG 

AGTTACGCXXIAAAAAATCGTTTAATGGGTTGGGTTCT 

CTTTTATTTATTTTACCCACTTATAATTTAGT^ 

ACAAGAACGTCGTCAAGAAGTTCTAAAATTAACGAAAG^ 

TAACTAATAGAACTGAGAACCAGAAGTTACTAGCAAAACAACT 

CCAGATTACGTTClAAAAATATGCrCGAGC^ 

CGG CGAAATGATTT ACC CATTACCAGACX: t TTTACCAAAA 

SEQ ID NO. 8106 
STRAIN COH1 

AGCAAGCCTAATGTTGTTCAGTTAAATAATC 

AATATATTAAOGATGAGAATCTAAAAAAACGTTACXSA^ CTGAGGAGTTA 

CGCCGAAAAAATCGTTTAATGGGTTGGGTTCT^ t 

ATTTATL"1UACCCACTTATAATTTAGTTAAGAGTTACAGAA 

AACGTCX3TCAAGAAGTTGTAAAATTAACGAAAGA 

AATAGAACTGAGAACOVGAAGTTACTAGCAAAACAACTAAAA 

TTACX3TTO\AAAATATGCnXAGCGLAACTAT^ 

AAATGATTTACCCATTACCAGACCTTTTACCAAAA 

SEQ XD NO. 8107 
STRAIN M781 

AGCaAGCCTAATGTTGTTCAGTT 

AAATAATCAATATaTTAACGATGAGAATCTAAAAAAACQTT ACQAA 

AGGAGTTACG CtDGAAAAAATOTTTTAATGGGTTGGGu"lV'lTA , i"ri"riGT , C 

ATGCTTTTATTTATTTTACCCACTTATAATTTAGT^ 

TTTACAAGAACGTCGTCAAGAAGTTGTAAAATTA^ 

CATTAACTAATAGAACIXjAGAACCAGAAGTTACTAGCA 

AATCCAGATTACGTTCAAAAATATGCTCGAGCG^ 

GACCGGCGAAATGATTTACCCATTACCAGACC tTTTACCAAAA 

SEQ XD NO. 8108 
STRAIN CJB110 

AGCAAGCCTAATGTTGTTCAGTTAAATAATC 

AATAT ATTAA(^TGAGAATCT AAAAAAACGTTACGAAG CTGAGQAGTT A 
CGCCGAAAAAATCGTTTAATGGGTTGGG'I'lVl^ t 
ATTTATTTTACCCACTTATAATTTAGTTAAGA 
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AACGTCGTCAAGAAGTTGTAAAATTAACGAAAGACTAT^ 
AATAGAACTGAGAACCAGAAGTTGCTAGCAAAAC^CTAAAAAATCCAGA 
TTACGTTCAAAAATATGCTCGAGCTAAGTATTATTTCTCTAAGACCGGCG 
AAATGATTTACCCATTACCAGACCtTTTACCAAAA 

SBQ ID NO. 8109 
STRAIN 1169NT 

AGCAAGCCTAATGTTGTTCAGTTAAA 

TAATCAATATATTAAOGATGAGAATCTAAAAAAACX3TT Aa3AA 

AGTTACG CCGAAAAAATCGTTTAATGGGTTGGGTTCITATTTT^ 

CTTTTATTTATTTTACCCACTTATAATTTAGTTAAGAOT 

ACAAGAACGTCGTCAAGAAGTTGTAAAATTAACGAAAGACTATCAGACAT 

TAACTAATAGAACTGAGAACCAGAAGTTACTAGCAAAACAACTAAAAAAT 

C^GATTACGTrCAAAAATATGCTCGAGCTAAGTATTATTTCTCTA^ 

CXSGCGAAATGATTTACCCATTACXIAGACCtTTTACCAAAA 

SBQ ZD NO. 8110 

STRAIN JM9130013 

AGCaAGCCTAATGTTGTTCAGTTAAA 

TAATCAATATATTAACGATGAGAATCTAAAAAARCXyrTACGAAGCTQAGG 

AGTTACGCCGAAAAAATCGTTTAATGGGTTGGGTTCT^ 

CITTTATTTATTTTACC CACTTATAATTTAGTTAAGAGTT ACAGAACTTT 

AC^GAAOGTOGTO^AAGTTGTAAAATTAAOGAAAGACTATCAGACAT 

TAACTAATAGAACTGAGAACCAGAAGTTACTAGCAAAACAACTAAAAAAT 

CCAGATTACGTTCAAAAATATGCTCGAGCGAAGTATTAT^ 

TGGCXSAAATGATTTACCCATTACCAGACCtTTTACCAAAA 

SBQ ID NO. 8111 
STRAIN 2603 

agcaagcctaatgttgttcagttaaataatcaatatattaacgatgagaa 
tctaaaaaaacgttacgaagctgaggagttacgccgaaaaaatcgtttaa 
tgggttgggttcttatttttgtcatgcttttatttattttacccacttat 
aatt tagtt aagagt tacagaact t tacaagaacgtcgt caagaag t tgt 
aaaattaacgaaagactatcagacattaactaatagaactgagaaccaga 
agttgctagcaaaacaactaaaaaatccagattacgttcaaaaatatgct 
cgagc taag tat tat 1 1 ct ctaagaccggcgaaatgat 1 1 acccat tacc 
agaccttttaccaaaa 



PRETTY of: /biotmp/msa25643 .2 { *} . April 29. 2002 05s59 



msa25643 . 2 f 418_CX)H1^ 
msa25643.2(418_M732 
msa25643 . 2 { 418_M781 
rasa25643.2{418_JM9130013 ( 
msa25643 . 2 { 418_090 ' 
msa2S643.2{418_18RS21 
msa25643 . 2 {418_2603 
msa2 5643.2(4 18_CJB1 1 0 
msa25643.2(418_1169NT 
msa25643 . 2 (41B_A909 
msa25643 . 2 (418_H36B 
Consensus 



AGCAAGCCTA 
AGCAAGCCTA 
AGCAAGCCTA 
AGCAAGCCTA 
AGCAAGCCTA 
AGCAAGCCTA 
AGCAAGCCTA 
AGCAAGCCTA 
AGCAAGCCTA 
AGCAAGCCTA 
AGCAAGCCTA 



ATGTTGTTCA 
ATGTTGTTCA 
ATGTTGTTCA 
ATGTTGTTCA 
ATGTTGTTCA 
ATGTTGTTCA 
ATGTTGTTCA 
ATGTTGTTCA 
ATGTTGTTCA 
ATGTTGTTCA 
ATGTTGTTCA 



GTTAAATAAT 
GTTAAATAAT 
GTTAAATAAT 
GTTAAATAAT 
GTTAAATAAT* 
GTTAAATAAT 
GTTAAATAAT 
GTTAAATAAT 
GTTAAATAAT 
GTTAAATAAT 
GTTAAATAAT 



CAATATATTA 
CAATATATTA 
CAATATATTA 
CAATATATTA 
CAATATATTA 
CAATATATTA 
CAATATATTA 
CAATATATTA 
CAATATATTA 
CAATATATTA 
CAATATATTA 



50 

ACGATGAGAA 
ACGATGAGAA 
ACGATGAGAA 
ACGATGAGAA 
ACGATGAGAA 
ACGATGAGAA 
ACGATGAGAA 
ACGATGAGAA 
ACGATGAGAA 
ACGATGAGAA 
ACGATGAGAA 



msa25643.2(418_COHi; 
msa25643.2(418 M732 
msa25643.2(418_M781 
msa25643 . 2 {4 18_JM9130013 
msa25643.2{418_090 
msa25643.2{418_18RS21 
msa25643.2{418 2603 
msa2 5643 . 2 f 418_CJB110 
msa25643.2{418_1169NT 
msa25643.2(418 A909 
msa2 5643.2{418_H36B 
Consensus 



51 

TCTAAAAAAA 
TCTAAAAAAA 
TCTAAAAAAA 
TCTAAAAAAA 
TCTAAAAAAA 
TCTAAAAAAA 
TCTAAAAAAA 
TCTAAAAAAA 
TCTAAAAAAA 
TCTAAAAAAA 
TCTAAAAAAA 



CGTTACGAAG 
CGTTACGAAG 
CGTTACGAAG 
CGTTACGAAG 
CGTTACGAAG 
CGTTACGAAG 
CGTTA CGAAG 
CGTTACGAAG 
CGTTACGAAG 
CGTTACGAAG 
CGTTACGAAG 



CTGAGGAGTT 
CTGAGGAGTT 
CTGAGGAGTT 
CTGAGGAGTT 
CTGAGGAGTT 
CTGAGGAGTT 
CTGAGGAGTT 
CTGAGGAGTT 
CTGAGGAGTT 
CTGAGGAGTT 
CTGAGGAGTT 



ACGCCGAAAA 
ACGCCGAAAA 
ACGCCGAAAA 
ACGCCGAAAA 
ACGCCGAAAA 
ACGCCGAAAA 
ACGCCGAAAA 
ACGCCGAAAA 
ACGCCGAAAA 
ACGCCGAAAA 
ACGCCGAAAA 



100 

AATCGTTTAA 
AATCGTTTAA 
AATCGTTTAA 
AATC GTTTA A 
AATCGTTTAA 
AATCGTTTAA 
AATCGTTTAA 
AATCGTTTAA 
AATCGTTTAA 
AATCGTTTAA 
AATCGTTTAA 



msa25643.2(418 COH1 
msa25643.2l418_M732 
msa25643 . 2 (418_M781 
msa25643 . 2 {418_JM9130013 
msa2 5643 . 2 { 418_0 90 
rasa25643 .2{418_18RS21 
msa25643 . 2 {418_2603 
msa25643 . 2 Ul8_CJB110 
msa25643 . 2 (418_1169NT 
msa25643 . 2 f 418_A909 
tnsa25643.2(418_H36B 
Consensus 



101 

TGGGTTGGGT 
TGGGTTGGGT 
TGGGTTGGGT 
TGGGTTGGGT 
TGGGTTGGGT 
TGGGTTGGGT 
TGGGTTGGGT 
TGGGTTGGGT 
TGGGTTGGGT 
TGGGTTGGGT 
TGGGTTGGGT 



TCTTATTTTT 
TCTTATTTTT 
TCTTATTTTT 
TCTTATTTTT 
TCTTATTTTT 
TCTTATTTTT 
TCTTATTTTT 
TCTTATTTTT 
TCTTATTTTT 
TCTTATTTTT 
TCTTATTTTT 



GTCATGCTTT 
GTCATGCTTT 
GTCATGCTTT 
GTCATGCTTT 
GTCATGCTTT 
GTCATGCTTT 
GTCATGCTTT 
GTCATGCTTT 
GTCATGCTTT 
GTCATGCTTT 
GTCATGCTTT 



TATTTATTTT 
TATTTATTTT 
TATTTATTTT 
TATTTATTTT 
TATTTATTTT 
TATTTATTTT 
TATTTATTTT 
TATTTATTTT 
TATTTATTTT 
TATTTATTTT 
TATTTATTTT 



150 

ACCCACTTAT 

ACCCACTTAT 

ACCCACTTAT 

ACCCACTTAT 

ACCCACTTAT 

ACCCACTTAT 

ACCCACTTAT 

ACCCACTTAT 

ACCCACTTAT 

ACCCACTTAT • 

ACCCACTTAT 
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Table 81: Comparative Sequences relating to SAG0011 



msa25643.2(418 COH1 
msa25643 . 2 (418*1*732 
msa25643.2{418~M781 
msa25643 . 2 { 4 18_JM9 130013 
msa2S643.2{418 090 ' 
msa25643 . 2 { 418_18RS21 
msa25643 . 2 {418_2603 
msa25643.2{4l8_CJB110' 
msa25643 . 2 (418JL169NT 
msa25643. 2(418 A909 
msa25643 . 2 {418"ji36B 
Consensus 



151 

AATTTAGTTA 
AATTTAGTTA 
AATTTAGTTA 
AATTTAGTTA 
AATTTAGTTA 
AATTTAGTTA 
AATTTAGTTA 
AATTTAGTTA 
AATTTAGTTA 
AATTTAGTTA 
AATTTAGTTA 



AGAGTTACAG 
AGAGTTACAG 
AGAGTTACAG 
AGAGTTACAG 
AGAGTTACAG 
AGAGTTACAG 
AGAGTTACAG 
AGAGTTACAG 
AGAGTTACAG 
AGAGTTACAG 
AGAGTTACAG 



AACTTTACAA 
AACTTTACAA 
AACTTTACAA 
AACTTTACAA 
AACTTTACAA 
AACTTTACAA 
AA CTTTA CAA 
AACTTTACAA 
AACTTTACAA 
AACTTTACAA 
AACTTTACAA 



GAACGTCGTC 
GAACGTCGTC 
GAACGTCGTC 
GAACGTCGTC 
GAACGTCGTC 
GAACGTCGTC 
GAACGTCGTC 
GAACGTCGTC 
GAACGTCGTC 
GAACGTCGTC 
GAACGTCGTC 



200 

AAGAAGTTGT 
AAGAAGTTGT 
AAGAAGTTGT 
AAGAAGTTGT 
AAGAAGTTGT 
AAGAAGTTGT 
AAGAAGTTGT 
AAGAAGTTGT 
AAGAAGTTGT 
AAGAAGTTGT 
AAGAAGTTGT 



msa25643. 2(418 COH1 
msa2 5 64 3 . 2 { 41 8J47 32 
msa2 564 3 . 2 { 4 18_M7 81 
msa25643 . 2 { 418_JM9130013 
msa25643.2{418_090 
msa25643 . 2 { 418_18RS21 
msa2 564 3 . 2 { 4 18_2 6 03 
msa25643 . 2 ( 418_CJB110 
msa25643 . 2 (418_1169NT 
msa25643. 2(418 A909 
tnsa25643 . 2 {418_H36B 
Consensus 



201 

AAAATTAACG 
AAAATTAACG 
AAAATTAACG 
AAAATTAACG 
AAAATTAACG 
AAAATTAACG 
AAAATTAACG 
AAAATTAACG 
AAAATTAACG 
AAAATTAACG 
AAAATTAACG 



AAAGACTATC 
AAAGACTATC 
AAAGACTATC 
AAAGACTATC 
AAAGACTATC 
AAAGACTATC 
AAAGACTATC 
AAAGACTATC 
AAAGACTATC 
AAAGACTATC 
AAAGACTATC 



AGACATTAAC 
AGACATTAAC 
AGACATTAAC 
AGACATTAAC 
AGACATTAAC 
AGACATTAAC 
AGACATTAAC 
AGACATTAAC 
AGACATTAAC 
AGACATTAAC 
AGACATTAAC 



TAATAGAACT 
TAATAGAACT 
TAATAGAACT 
TAATAGAACT 
TAATAGAACT 
TAATAGAACT 
TAATAGAACT 
TAATAGAACT 
TAATAGAACT 
TAATAGAACT 
TAATAGAACT 



250 

GAGAACCAGA 
GAGAACCAGA 
GAGAACCAGA 
GAGAACCAGA 
GAGAACCAGA 
GAGAACCAGA 
GAGAACCAGA 
GAGAACCAGA 
GAGAACCAGA 
GAGAACCAGA 
GAGAACCAGA 



rasa25643 . 2 {418_COHl} 
msa25643.2{418_M732} 
msa25643 . 2 { 418_M781 } 
msa25643 . 2 {418_JM9130013* 
rasa25643.2{418_090 i 
msa25643 . 2 {418_18RS21 
msa2 5 64 3 . 2 { 4 18_2 603 ' 
msa25643 ,2{418_CJB110 t 
msa25643 . 2 {418_1169NT} 
msa25643 .2{418_A909} 
msa25643 . 2 {418_H36B} 
Consensus 



251 

AGTTaCTAGC 
AGTTaCTAGC 
AGTTaCTAGC 
AGTTaCTAGC 
AGTTgCTAGC 
AGTTgCTAGC 
AGTTgCTAGC 
AGTTgCTAGC 
AGTTaCTAGC 
AGTTaCTAGC 
AGTTaCTAGC 



AAAACAACTA 
AAAACAACTA 
AAAACAACTA 
AAAACAACTA 
AAAACAACTA 
AAAACAACTA 
AAAACAACTA 
AAAACAACTA 
AAAACAACTA 
AAAACAACTA 
AAAACAACTA 



AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 
AAAAATCCAG 



ATTAOGTTCA 
ATTACGTTCA 
ATTACGTTCA 
ATTACGTTCA 
ATTACGTTCA 
ATTACGTTCA 
ATTACGTTCA 
ATTACGTTCA 
ATTACGTTCA 
ATTACGTTCA 
ATTACGTTCA 



300 

AAAATATGCT 
AAAATATGCT 
AAAATATGCT 
AAAATATGCT 
AAAATATGCT 
AAAATATGCT 
AAAATATGCT 
AAAATATGCT 
AAAATATGCT 
AAAATATGCT 
AAAATATGCT 



msa25643 . 2 {418_COHl } 
msa2 5643 . 2 {4 18_M732 } 
msa25643 .2{418_M78l} 
msa25643 .2 {418_JM9130013; 
msa25643.2{418_090 
msa25643 . 2 {418_18RS21 
rasa25643 . 2 {418_2603 
msa25643 . 2 (418_CJB110 ' 
msa25643.2{418_1169NT 
tnsa25643 . 2 f 418_A909 j 
msa25643.2{418_H36B] 
Consensus 



301 

CGAGCgAAGT 
CGAGCgAAGT 
CGAGCgAAGT 
CGAGCgAAGT 
CGAGCtAAGT 
CGAGCtAAGT 
CGAGCtAAGT 
CGAGCtAAGT 
CGAGCtAAGT 
CGAGCtAAGT 
CGAGCtAAGT 



ATTATTTCTC 
ATTATTTCTC 
ATTATTTCTC 
ATTATTTCTC 
ATTATTTCTC 
ATTATTTCTC 
ATTATTTCTC 
ATTATTTCTC 
ATTATTTCTC 
ATTATTTCTC 
ATTATTTCTC 



TAAGACcGGC 
TAAGACcGGC 
TAAGACcGGC 
TAAGACtGGC 
TAAGACcGGC 
TAAGACcGGC 
TAAGACcGGC 
TAAGACcGGC 
TAAGACcGGC 
TAAGACcGGC 
TAAGACcGGC 



GAAATGATTT 
GAAATGATTT 
GAAATGATTT 
GAAATGATTT 
GAAATGATTT 
GAAATGATTT 
GAAATGATTT 
GAAATGATTT 
GAAATGATTT 
GAAATGATTT 
GAAATGATTT 



350 

ACCCATTACC 
ACCCATTACC 
ACCCATTACC 
ACCCATTACC 
ACCCATTACC 
ACCCATTACC 
ACdCATTACC 
ACCCATTACC 
ACCCATTACC 
ACCCATTACC 
ACCCATTACC 



msa25643.2{418 COH1 
msa25643 . 2{418*"M732 
msa25643 . 2 {418_M781 
msa2 5643 . 2 {418_JM913 0013 
msa25643.2{418 090 
msa25643.2{418 18RS21 
msa25643 ,2{4l8_2603 
msa25643. 2(418 CJB110 
msa25643 . 2 {418~1169NT 
msa2 5643 . 2 ( 4 18_A909 
maa25643 .2(418_H36B 
Consensus 



351 

AGACCTttta 
AGACCTttta 
AGACCTttta 
AGACCTttta 
AGACCTttta 
AGACCTttta 
AGACCTttta 
AGACCTttta 
AGACCTttta 

AGACCT 

AGACCTttta 
****** 



366 
ccaaaa 
ccaaaa 
ccaaaa 
ccaaaa 
ccaaaa 
ccaaaa 



ccaaaa 
ccaaaa 



SEQ ID NO. 8112 
STRAIN 090 

SKPNWQLNNQY INDENLKKRYBAEELRRKNRLMGWVLI FVMLLFILPTYNL 

VKSYim^ERRQBVVKLTKDYOTLTNR^ 

IYPLPDLLPK 

SEQ XD NO. 8113 
STRAIN A909 

SKPNWQLNNQY 1 1TOENLKKRYEAKKIJUIKNRLMGWVL I FVMLLPILPTYNL 
VKSYRTI^ERRQEVVKLTKDYOTLTN^ 
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IYPIiPD 

SEQ ID NO. 8114 
STRAIN H36B 

S KPNWQLNNQ Y I NDENLKKRYEAEELRRKNRLMG WVL I FVMLiLF I LPTYNL 

VKSYRTLQERRQBWKLTKDYQTLTNRTENQKIiLAK^^ 

IYPLPDLLPK 

SEQ ID NO. 8115 
STRAIN 18RS21 

SKPNWQLNNQY I NDENLKKRYEAEELRRKNRLMGWVL I FVMLLFI LPTYNLVKSYRTLQ 
ERRQEWKLTKD YQTLTNRTENQKLLAKQL KN PDYVQKY ARAKYY FSKTGEM I YPLPDLL 
PK 

SEQ ID NO. 8116 
STRAIN M732 

SKPNVVQIiNNQYINDENLKKRYEAEEliRRKNRLMGWVIiI FVMLLF I LPTYNL 

VKSYRTLQERRQEVVKLTKDYQTLTNRTENQKIiliAKQLKNPDYVQKY 

IYPLPDLLPK 

SEQ ZD NO. 8117 
STRAIN COH1 

SKFNWQ1NNQYINDENLKKRYEAEELRRKNRLMGWVLI FVMLLF I LPTYNLVK 

SYRTLQERRQEVVKLTKDYQTLTNRTBNQKLLAKQLKNPDY^ 

PLPDLLPK 

SEQ ID NO. 8118 
STRAIN M781 

SKPNVVQI^QYIITOENLKKRYEAEEIiRRKNRI^GWVLI PVMLLFILPTYN 

LVKSYRTIiQERRQEVVKLTKDYQTLTNRTENQKLlJUCQLKNPDYVQKY 

MIYPLPDLLPK 

SEQ ZD NO. 8119 
STRAIN CJB110 

SKPNWQLNNQY I NDENIiKKRYEAEELRRKNRliMGWVL I FVMLLF I LPTYNLVK 

SYRTLQERRQEVVKLTKDYQTLTNRTENQKLI^ 

PLPDLLPK 

SEQ ZD NO. 8120 
STRAIN 1169NT 

SKPNWQLNNQY I NDENLKKRYEAEELRRKNRLMG WVL I FVMLLF I LPTYNL 

VKSYRTIiQERRQEVVKLTKDYQTLTNRTENQKIiLAKQLKN 

IYPLPDLLPK 

SEQ ZD NO* 8121 
STRAIN JM91 3001 3 

SKPNWQLNNQYINDENLKKRYEAEELRRKNRLMGWVLI FVMLLFILPTYNL 

VKSYRTLQBRRQEVVKLTKDYQTLTNRTBNQKLL 

IYPLPDLLPK 

SEQ. ZD NO. 8122 
STRAIN 2603 

SKPNWQLNNQY INDENLKKRYEAEELRRKNRLMG WVLI FVMLLF ILPTYNLVKSYRTLQ 
ERRQEWKLT KD YG/IXTNRTENQKLIiAKQLKNPD YVQKYARAKYY FS KTGEM I Y PLPDLL 
PK 



MSA Alignment Results j Pretty output 

PRETTY of: /biotmp/msa20122 .2{*} April 29, 



2002 06:08 



msa20122 .2{418_090 
msa20122 . 2 {418_A909 
msa20122. 2(418 1169NT 
msa20122.2{418 18RS21 
ma a2 012 2. 2 {418 2603 
msa20122 . 2 {418_CJB110 
maa20122.2(418_COHl 
m8a20122.2{418_H36B 
msa20122. 2(418 JM9130013 
msa20122. 2(418 J4732 
msa20122.2(418_M781 
Consensus 



msa20122.2{418_090) 
ntsa20122.2(418_A909> 



SKPNWQLNN 
SKPNWQLNN 
SKPNWQLNN 
SKPNWQLNN 
SKPNWQLNN 
SKPNWQLNN 
SKPNWQLNN 
SKPNWQLNN 
SKPNWQLNN 
SKPNWQLNN 
SKPNWQLNN 



QYINDENLKK 
QYINDENLKK 
QYINDENLKK 
QYINDENLKK 
QYINDENLKK 
QYINDENLKK 
QYINDENLKK 
QYINDENLKK 
QYINDENLKK 
QYINDENLKK 
QYINDENLKK 



RYEAEELRRK 
RYBAEELRRK 
RYEAEELRRK 
RYEAEELRRK 
RYEAEELRRK 
RYEAEELRRK 
RYEAEELRRK 
RYEAEELRRK 
RYEAEELRRK 
RYEAEELRRK 
RYEAEELRRK 



NRLMGWVLIF 
NRLMGWVLIF 
NRLMGWVLIF 
NRLMGWVLIF 
NRLMGWVLIF 
NRLMGWVLIF 
NRLMGWVLIF 
NRLMGWVLIF 
NRLMGWVLIF 
NRLMGWVLIF 
NRLMGWVLIF 



50 

VMLLFILPTY 
VMLLFILPTY 
VMLLFILPTY 
VMLLFILPTY 
VMLLFILPTY 
VMLLFILPTY 
VMLLFILPTY 
VMLLFILPTY 
VMLLFILPTY 
VMLLFILPTY 
VMLLFILPTY 



51 100 
NLVKSYRTLQ ERRQEWKLT KDYQTLTNRT ENQKLLAKQL KNPDYVQKYA 
NLVKSYRTLQ ERRQEWKLT KDYQTLTNRT ENQKLLAKQL KNPDYVQKYA 



1108 



WO 2004/018646 



PCTAJS2003/026827 



Table 81: Comparative Sequences relating to SAGOO 11 



msa20122.2{418 1169NT 
msa20122.2{418_18RS21 
msa20122.2{418 2603 
msa20122.2{418_CJB110 
msa20122.2{418 COH1 
rasa20122.2(418~H36B 
msa20122 .2{418_JM9130013 
msa20122 . 2 ( 418_M732 
rasa20122 . 2 {418_M781 
Consensus 



NLVKSYRTLQ 
NLVKSYRTLQ 
NLVKSYRTLQ 
NLVKSYRTLQ 
NLVKSYRTLQ 
NLVKSYRTLQ 
NLVKSYRTLQ 
NLVKSYRTLQ 
NLVKSYRTLQ 



ERRQEWKLT 
ERRQBWKLT 
ERRQEWKLT 
ERRQEWKLT 
ERRQEWKLT 
ERRQBWKLT 
ERRQEWKLT 
ERRQEWKLT 
ERRQEWKLT 



KDYQTLTNRT 
KDYQTLTNRT 
KDYQTLTNRT 
KDYQTLTNRT 
KDYQTLTNRT 
KDYQTLTNRT 
KDYQTLTNRT 
KDYQTLTNRT 
KDYQTLTNRT 



ENQKLLAKQL 
BNQKLLAKQL 
ENQKLLAKQL 
ENQKLLAKQL 
ENQKLLAKQL 
ENQKLLAKQL 
ENQKLLAKQL 
ENQKLLAKQL 
ENQKLLAKQL 



knpdyvqkya 
knpdyvqkya 
knpdyvqkya 
knpdyvqkya 
knpdyvqkya 
knpdyvqkya 
knpdyvqkya 
knpdyvqkya 
knpdyvqkya 



msa20122.2{418_090; 
msa20122.2{418_A909; 
msa20122.2{418_1169NT 
msa20122.2{418_18RS21 

msa20122.2{418_2603 - 
msa20122 . 2 {418_CJB110 f 
msa20122.2(418_COHl | 
msa20122.2{418_H36B 
msa20122.2{418_JM9130013 
msa20122.2{418_M732 
msa20122 . 2 (418_M781 
Consensus 



101 122 
RAKYYPSKTG EMIYPLPDll pk 
RAKYYFSKTG EMIYPLPD — — 
RAKYYPSKTG EMIYPLPDll pk 
RAKYYFSKTG EMIYPLPDll pk 
RAKYYFSKTG EMIYPLPDll pk 
RAKYYFSKTG EMIYPLPDll pk 
RAKYYFSKTG EMIYPLPDll pk 
RAKYYFSKTG EMIYPLPDll pk 
RAKYYFSKTG EMIYPLPDll pk 
RAKYYFSKTG EMIYPLPDll pk 
RAKYYFSKTG EMIYPLPDll pk 
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SEQ ID NO. 8201 
STRAIN 2603 

ATGAAAAATTTATTGTTAAAATGTAAGGAT AAGAAGGTTAAAG CATTTACACTTTTAGAA 

TGTTTGGTAG CATTGGTTACAATGACAGGAGC r r l ACTAGTTTATCAAGG ACIGACAAAA 

TTGTTGGCTCAACAGATAGTAGTGATGTCTTCHTCCAOT 

AcTCAGCAACTAAATGCAGAATTTGAAGGCGCTC^ 

CTTTATTTACGTAAGCAAGATAAGATTGTAACCTTTG^ 

CGTAAGACAGGTTATGATGGTCGAGGTTATC^CCAATGGTTTATGGGT^ 

CAAATGAGTCAGACCAAAAGTATGGTAAAACTTGTTTT^ 

AGGACATTTTACTATGATITTAAAGAAGAAACTTAA 

SEQ ID NO. 8202 
STRAIN 090 

AATTCGAAGGCGCTCACTTGQAATATTTAAGACAGAACAAAC^ 
CGTAAGCAAGATAAGATTGTAACCTTTGGCAAAT CT AATAAAGATGATTT 
CCGTAAGAC^GGTTATGATGGTCXJAGGTTAT 
TAGACAATTGTCAAATGAGTCAAACCAAAAGTATGGTAAAACT 
TATTITAAGGACGGGTTAAAAAGGACATTTTACT 1 
AACT 

SEQ ID NO. 8203 
STRAIN A909 

CAGAATTTGAAGGCG CTCATCTGGAATATTT 

TTACGTAAG CAAGATAAGATTGTAACCT!TrGGCAAATCrAATAAAGATG A 

TTTCCGTAAGACAGGTTATGATGGTCGAGGTTATCAACCAATGGTT^ 

GGTTAGACAATTGTCAAATGAGTCAGACCAAAAGTATGG 

TTTTATTTTAAGGACGGGTTAAAAAGGACATTTTACT 

AGAAACT 

SEQ ID NO. 8204 
STRAIN H36B 

ATGCAGAATTTGAAGGCGCTCATCTGGAATATTTAAGA 

TATTTACGTAAGCAAGATAAGATTGTAACCTTTGG CAAATCTAAT A 

TGATTTCCGTAAGACAGGTTATGATGGTCGAGGTTATCAACCAAT^ 

ATGGGTTAGACAATTGTCAAATGAGTCAGACCAAAAGT^ 

GTTTTTTATTTTAAGGACXXKnTAAAAAGGACATTTTACT 

AGAAGAAACT 

SEQ ID NO. 8205 
STRAIN 18RS21 

AGAATTTGAAGGCXSCTCATCTGGAATATT^ 

TACGTAAGCAAGATAAGATTGTAACCITTGGCAAAT 

TXCCGTAAGACIAGGT1ATGATGGTCGAGGTTATCAA 

GTTAGACAATTGTCAAATGAGTCAGAC CAAAAGTATGGTAAAACTTGTTT 

TTTATTTTAAGGACGGGTTAAAAAGGACATTTTACTATGA'A 

GAAACT 

SEQ ID NO. 8206 

STRAIN M732 

CAGAATTCGAAGGCGCTCACTTGGAATATTTAAGACAG 

TT ACGTAAG C^GATAAGATTGT AACCTTTGG CAAAT CTAAT AAAGATGA 

TTTCCGTAAGAGAGGTTATAATGGTCGA^^ 

GGTTAGACAATTGTCAAATGAGTC^VGACCAAAAGTATGGTAAAAC^ 

TTTTATTTTAAGGACGGGTTAAAAAGGACATTTTACT 

AGAAACT 

SEQ ID NO. 8207 
STRAIN COH1 

GAATTCGAAGGCGCTCA.CTTGGAATATTTAAGACAGAACA 

ACGTAAGCAAGATAAGATTGTAACCTTTGG CAAATCTAATAAAGATGATT 

TCCGTAAGACAGGTTATAATGGTCGAGGTTATCAACCAATGy 

TTAGACAATTGTCAAATGAGTCAGACCAAAAGTATGGT^ 

TTATTTTAAGGACGGGTTAAAAAGGACATTTTACTATGA 

AAACT 

SEQ ID NO. 8208 
STRAIN M781 

AGAATTCGAAGG CG CTCACTTGGAATATTT AAGACAG AACAAACTTT ATT 

TACGTAAGCAAGATAAGATTGTAACCTTTGGCAAATCrrAATAAAGATGAT 

TTCX^GTAAGACAGGTTATAATGGTCXxAGGTTAT^ 

GTTAGACAATTGTCAAATGAGTCAGACCAAAAOT 

TTTJVTTTTAAGGACGGGTTAAAAAGGACATTTTACrATGA 

GAAACT 

SEQ ZD NO. 8209 
STRAIN CJBU0 

GAATTCGAAGGCGCTCACTTGGAATATTTAAGACAGAACAAACT^ 

ACGTAAG C3VAGATAAGATTGTAACCTTTGGCAAATCTAATAAAGATGATT 

TCCXH!AAGACAGGTTATGATGGTCGAGGTTATC^ 

TTAGACAATTGTCAAATGAGTCAAACCAAAAGTA 

TTATTTTAAGGACX3GGTTAAAAAGGACATTTTACTATGA^ 

AAACT 
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SEQ ZD HO. 8210 
STRAIN 1169NT 

TCGAAGGCXjCTCACTTGGAATATTTAAGACAGA^ 

AAGCAAGATAAGATTGTAAC CrTTGGOUVA.TCTAATAAAGATGATTTTCG 

TAAGACAGGTTATGATGGTCGAGGTTATCAArcAATG 

ACAATTGTCAAATGAGTCAAAC CAAAAGTATGGTAAAACTTGTTTTTTAT 

TTTAAGGACGGGTTAAAAAGGACATTTTACTATGAT^ 

T 

SEQ ZD NO. 8211 
STRAIN JM9 1300 13 

TGCAGAATTTGAAGGCGCTCATCTGGAATATTTAAGACAG 

ATTT ACGTAAGCAAGATAAGATTGTAACCTTTGG CAAATCTAATAAAGAT 

GATTTCCGTAAGACAGGTTATGATGGTCGA 

TGGGTTAGACAATTGTCAAATGAGTCAGACCAAAAGTATGGTAAAACT 

TTTTTTATTTTAAGGACGGGTTAAAAAGGACATTTTACr 

GAAGAAACT 



PRETTY of: /biotmp/msal28189.2{*} February 7, 2003 08tl9 



maal28189.2{6 18RS21' 
msal28189 . 2T6_2603 ( 
. msal28189.2<6_A909 t 
msal28189 . 2 { 6_H36B 
msal28189.2{6_JM9130013| 
msal28189 . 2 f 6_OOHl 
msal2 8 18 9 . 2 { 6_M7 3 2 
msal28189 . 2 { 6_M78 1 
msal28189.2{6__090 
msal28189.2{6_CJB110 
msal28189 . 2 { 6_116 9NT; 

Consensus 



50 



atgaaaaatt tattgttaaa atgtaaggat aagaaggtta aagcatttac 



msal28189.2{6 
msal28189 
msal28189 
msal28189 



18RS21 
2603 
A909 
H36B 



H»sal2 8 IB 9 . 2 { 6__JM9 13 0 0 13 
msal28189 . 2 ( 6_C0H1 
ms al2 8 1 8 9 . 2 { 6_M73 2 
msal28ie9.2{6_M781 
msal28189.2{6_090 
msal28189.2{6_CJB110 
msal28189.2{6_1169NT 
Consensus 



51 



100 



acttttagaa tgtttggtag cattggttac aatcacagga gctttactag 



msal28189.2{6 
maal28189 
msal28189 
msal28189 



101 



150 



18RS21 
2603 
A909 
H36B 



msal28189.2{6_JM9130013 
maal28189.2{6 COH1 
msal28189.2f6J4732 
maal28189 . 2 { 6JM781 
msal28189.2{6_090 
msal28189.2{6 GJB110 
msal28 189 . 2 { 6~1169NT; 

Consensus 



tttatcaagg actgacaaaa ttgttggctc aacagatagt agtgatgtct 



msal28189.2{6 
msal28189 
msal26189 
msal28189 



18RS21 
2603 
A909 
H36B 



msal28189.2{6_JM9130013 
msal 2 8 18 9 . 2 f 6_COHl 
msal28189 . 2 { 6_M732 
msal28189 . 2 (6_M781 
msal28189.2{6_090 
msal28189 . 2 ( 6_CJB110 
msal28189 . 2 { 6_1169NT 
Consensus 



msal28189.2{6 18RS21) 
cnsal28189 . 2f6_2603 ) 
rasal28189 . 2 f 6_A909) 
mflal2B189.2(6_H36B} 



151 200 

. - — . — . aga 

tcttccagtc agtctgaatg ggtgttatta actcagcaac taaATGCaga 

. Caga 

. , ATGCaga 

« — — ™ TGCaga 

ga 

Caga 

aga 

- , ~ —........—a 

ga 



201 250 
atTtGAAGGC GCTCAtcTGG AATATTTAAG ACAGAACAAA CTTTATTTAC 
atTtGAAGGC GCTCAtcTGG AATATTTAAG ACAGAACAAA CTTTATTTAC 
atTtGAAGGC GCTCAtcTGG AATATTTAAG ACAGAACAAA CTTTATTTAC 
atTtGAAGGC GCTCAtcTGG AATATTTAAG ACAGAACAAA CTTTATTTAC 



1111 



WO 2004/018646 



PCT/US2003/026827 



Table 82: Comparative Sequences relating to SAG0165 



msal28189.2{6_JM9130013] 
msal28 18 9 . 2 ( 6_COHl 
msal 2 8 18 9 . 2 { 2 
msal28189.2{6_M78l 
rasal28189.2{6_090 
msal28 1 8 9 . 2 { 6_CJB1 10 
msal28189.2{6_1169NT 
Consensus 



atTtGAAGGC 
atTcGAAGGC 
atTcGAAGGC 
atTcGAAGGC 
atTcGAAGGC 
atTcGAAGGC 
— TcGAAGGC 



GCTCAtcTGG 
GCTCActTGG 
GCTCActTGG 
GCTCActTGG 
GCTCActTGG 
GCTCActTGG 
GCTCActTGG 



AATATTTAAG 
AATATTTAAG 
AATATTTAAG 
AATATTTAAG 
AATATTTAAG 
AATATTTAAG 
AATATTTAAG 



ACAGAACAAA 
ACAGAACAAA 
ACAGAACAAA 
ACAGAACAAA 
ACAGAACAAA 
ACAGAACAAA 
ACAGAACAAA 



CTTTATTTAC 
CTTTATTTAC 
CTTTATTTAC 
CTTTA TTTAC 
CTTTATTTAC 
CTTTATTTAC 
CTTTATTTAC 



msal281B9.2{6 18RS21 
msal28189.2l6_2603 i 
maal28189.2(6_A909 
m8al28189.2{6_H36B 
maal28189.2{6_JM9130013 
msal28189 . 2 f 6_C0H1 
msal28189.2(6_M732 
msal28189.2{6 M781 
msal28189.2{6_090 
rasal2B 189 . 2 ( 6_CJB110 
msal28189 . 2 { 6_1169NT 
Consensus 



251 

GTAAGCAAGA 
GTAAGCAAGA 
GTAAGCAAGA 
GTAAGCAAGA 
GTAAGCAAGA 
GTAAGCAAGA 
GTAAGCAAGA 
GTAAGCAAGA 
GTAAGCAAGA 
GTAAGCAAGA 
GTAAGCAAGA 



TAAGATTGTA 
TAAGATTGTA 
TAAGATTGTA 
TAAGATTGTA 
TAAGATTGTA 
TAAGATTGTA 
TAAGATTGTA 
TAAGATTGTA 
TAAGATTGTA 
TAAGATTGTA 
TAAGATTGTA 



ACCTTTGGCA 
ACCTTTGGCA 
ACCTTTGGCA 
ACCTTTGGCA 
ACCTTTGGCA 
ACCTTTGGCA 
ACCTTTGGCA 
ACCTTTGGCA 
AC CTTT GGCA 
ACCTTTGGCA 
ACCTTTGGCA 



AATCTAATAA 
AATCTAATAA 
AATCTAATAA 
AATCTAATAA 
AATCTAATAA 
AATCTAATAA 
AATCTAATAA 
AATCTAATAA 
AATCTAATAA 
AATCTAATAA 
AATCTAATAA 



300 

AGATGATTTc 
AGATGATTTc 
AGATGATTTc 
AGATGATTTc 
AGATGATTTc 
AGATGATTTc 
AGATGATTTc 
AGATGATTTC 
AGATGATTTc 
AGATGATTTc 
AGATGATTTt 



msal28189.2{6 18RS21; 
msal28189 . 2jV2603 
msal28189.24 6_A909 
msal 2 8 189 . 2 { 6_H36B 
msal28189.2{6 JM9130013 
maal28189.2(6__COHl 
msal2 81 8 9 . 2 { 6_M732 
msal28189.2{6_M781 
msal28189.2{6_090 
msal28189.2(6_CJB110 
msal28189.2{6_1169NT 
Consensus 



301 

CGTAAGACAG 
CGTAAGACAG 
CGTAAGACAG 
CGTAAGACAG 
CGTAAGACAG 
CGTAAGACAG 
CGTAAGACAG 
CGTAAGACAG 
CGTAAGACAG 
CGTAAGACAG 
CGTAAGACAG 



GTTATgATGG 
GTTATgATGG 
GTTATgATGG 
GTTATgATGG 
GTTATgATGG 
GTTATaATGG 
GTTATaATGG 
GTTATaATGG 
GTTATgATGG 
GTTATgATGG 
GTTATgATGG 



TCGAGGTTAT 
TCGAGGTTAT 
TCGAGGTTAT 
TCGAGGTTAT 
TCGAGGTTAT 
TCGAGGTTAT 
TCGAGGTTAT 
TCGAGGTTAT 
TCGAGGTTAT 
TCGAGGTTAT 
TCGAGGTTAT 



CAACCAATGG 
CAACCAATGG 
CAACCAATGG 
CAACCAATGG 
CAACCAATGG 
CAACCAATGG 
CAACCAATGG 
CAACCAATGG 
CAACCAATGG 
CAACCAATGG 
CAACCAATGG 



350 

TTTATGGGTT 
TTTATGGGTT 
TTTATGGGTT 
TTTATGGGTT 
TTTATGGGTT 
TTTATGGGTT 
TTTATGGGTT 
TTTATGGGTT 
TTTATGGGTT 
TTTATGGGTT 
TTTATGGGTT 



msal28189.2{6 18RS21 
msal28189 . 2l6_2603 
msal28189 . 2? 6_A909 
tnsal28189.2{6_H36B 
rasal28189 . 2 { 6_JM9130013 
msal2B189 . 2{ 6_C0H1 
msal28189 . 2 { 6_M732 
msal 28 1 8 9 . 2 { 6_M78 1 
rasal28189.2{6_090 
msal28189 . 2 { 6_CJB110 
msal28 189 . 2 { 6_1169NT 
Consensus 



351 

AGACAATTGT 
AGACAATTGT 
AGACAATTGT 
AGACAATTGT 
AGACAATTGT 
AGACAATTGT 
AGACAATTGT 
AGACAATTGT 
AGACAATTGT 
AGACAATTGT 
AGACAATTGT 



CAAATGAGTC 
CAAATGAGTC 
CAAATGAGTC 
CAAATGAGTC 
CAAATGAGTC 
CAAATGAGTC 
CAAATGAGTC 
CAAATGAGTC 
CAAATGAGTC 
CAAATGAGTC 
CAAATGAGTC 



AgACCAAAAG 
AgACCAAAAG 
AgACCAAAAG 
AgACCAAAAG 
AgACCAAAAG 
AgACCAAAAG 
AgACCAAAAG 
AgACCAAAAG 
AaACCAAAAG 
AaACCAAAAG 
AaACCAAAAG 



TATGGTAAAA 
TATGGTAAAA 
TATGGTAAAA 
TATGGTAAAA 
TATGGTAAAA 
TATGGTAAAA 
TATGGTAAAA 
TATGGTAAAA 
TATGGTAAAA 
TATGGTAAAA 
TATGGTAAAA 



400 



CTTGTTTTTT 
CTTGTTTTTT 
CTTGTTTTTT 
CTTGTTTTTT 
CTTGTTTTTT 
CTTGTTTTTT 
CTTGTTTTTT 
CrTGTTTTTT 



msal28i89.2{6 18RS21; 
msal28189 . 2T6_2603 
msal28189.2{6_A909 
msa!28189 . 2 (6_H36B 
msa!28189 .2{6_JM9130013 
msal28189 . 2 { 6_C0H1 
msal2818 9 . 2 { 6_M732 
msal28189.2{6_M781 
msal28189.2{6_090 
msal28189.2{6_CJB110 
maal28189.2{6_1169NT 
Consensus 



401 

ATTTTAAGGA 
ATTTTAAGGA 
ATTTTAAGGA 
ATTTTAAGGA 
ATTTTAAGGA 
ATTTTAAGGA 
ATTTTAAGGA 
ATTTTAAGGA 
ATTTTAAGGA 
ATTTTAAGGA 
ATTTTAAGGA 



CGG GTTA AAA 
CGGGTTAAAA 
CGGGTTAAAA 
CGGGTTAAAA 
CGGGTTAAAA 
CGGGTTAAAA 
CGGGTTAAAA 
CGGGTTAAAA 
CGGGTTAAAA 
CGGGTTAAAA 
CGGGTTAAAA 



AGGACATTTT 
AGGACATTTT 
AGGACATTTT 
AGGACATTTT 
AGGACATTTT 
AGGACATTTT 
AGGACATTTT 
AGGACATTTT 
AGGACATTTT 
AGGACATTTT 
AGGACATTTT 



ACTATGATTT 
ACTATGATTT 
ACTATGATTT 
ACTATGATTT 
ACTATG ATTT 
ACTATGATTT 
ACTATGATTT 
ACTATGATTT 
ACTATGATTT 
ACTATG ATTT 
ACTATGATTT 



450 

TAAAGAAGAA 
TAAAGAAGAA 
TAAAGAAGAA 
TAAAGAAGAA 
TAAAGAAGAA 
TAAAGAAGAA 
TAAAGAAGAA 
TAAAGAAGAA 
TAAAGAAGAA 
TAAAGAAGAA 
TAAAGAAGAA 



msal28189.2{6 18RS21 
msal26189,2T6_2603; 
maal28189.2(6_A909, 
msal28189 . 2 { 6_H36B; 
msal2 8 1 8 9 . 2 { 6_JM9 13 0 013 
msal28189 . 2 ( 6_C0H1 
tnsal28189.2{6_M732 
msal28189.2{6 M781 
msal28189.2{6_090 
msal28189.2(6 CJB110 
msa!28189 . 2 { 6_1169NT 
Consensus 



451 

ACT 

ACTtaa 

ACT 

ACT 

ACT- 
ACT 

ACT 

ACT 

ACT 

ACT 

ACT 



SHQ ZD HO. 8212 

STRAIN 2603 frame: 1 

MKNIJJiKCroKKVKAFTIiIiBCLVA^ 

TQ£LNAEFEGAHIiEYIJlQNKLYLRKQ^ 
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QMSC2TKSMVKLVFYFKDGLKRTFYYDPKEET . 

SEQ ID MO. 8213 
STRAIN 090 frame: 3 

FEGAHLEYLRQNKLYLRKQDKIVTFGKSNKDDFRKTGYDGRGYQPMVYGLD^ 
MVKLVFYFKDGLKRTFYYDFKEET 

SEQ XD NO. 8214 

STRAIN A909 frame: 3 

EFEGAHLEYLRQNKLYLRKQDKIWFGKSNKDDFRKTGYDGRGYQPMVYGLDNC^^QfrK 
SMVKLVFYFKDGLKRTFYYDFKEET 

SEQ ID MO. 8215 
STRAIN H36B frame: 3 

AEFEGAHLEYl^QNKLYLRKQDK^VTFGKSNKDDFRKTGYDGRGYQPMVYGLDNCQMSOT 
KSMVKLVFYFKDGLKRTFYYDFKEET 

SEQ XD MO. 8216 
STRAIN 18RS21 frame: 2 

BFEGAHLEYLRQNKLYLRKQDKIVTFGKSNKDDFRKTGYDGRGYQPMVyGLDNCC»1SQTK 
SMVKLVFYFKDGLKRTFYYDFKEET 

SEQ XD MO. 8217 
STRAIN M732 frame: 3 

EFEGAHLBYIjRQNKLYTiRKQDKIWFGKSNKDDFRKTC 
SMVKLVFYFKDGLKRTFYYDFKEET 

SEQ XD MO. 8218 , 
STRAIN COH1 frame: 1 

EFEGAHLEYI»RQNKLYIiRKQDKIVTFGKSNKDDFRKTO 
SMVKLVFYFKDGLKRTFYYDFKEET 

SEQ ID MO. 8219 
STRAIN M781 frame: 2 

EFEGAHLBYliRQNKLYLRKQDKIVTroKSNKDDFR 
SMVKLVFYFKDGLKRTFYYDFKEET 

SEQ ID MO. 8220 
STRAIN CJB1 10 frame: 1 

EFEGAHLEYI^QNKLYLRKQDKIVTFGKSNKDDFRKrGYDGR 
SMVKLVFYFKDGLKRTFYYDFKEET 

SEQ ID MO. 8221 
STRAIN 1 169NT frame: 3 

EGAHI1EYI1RQNKLYLRKQDKIVTFGKSNKDDFRKTGYDGRGYQPM 
VKLVFYFKDGLKRT FYYDFKBET 

SEQ ID MO. 8222 
STRAIN JM9130013 frame: 2 

AE FEGAHLE YliRQNKLYLRKQDKI VTFGKSNKDDFRKTGYDGRGYQP 
KSMVKLVFYFKDGLKRTFYYDFKEET 



PRETTY of: /biotntp/msal2B319.2{*} February 7, 2003 08s 27 



msal2B319.2{6_090 
maal28 3 19 . 2 { 6_116 9NT 
msal28319.2{6 18RS21 
msal28319.2l6 2603 
rasal2 83 1 9 . 2 { 6_H3 6B 
msal28319 . 2 { 6_JM9130013 
ma al 2 8 3 1 9 . 2 { 6_A9 0 9 
msal28319.2{6 CJB110 
msal28319 . 2T6_COHl 
msal28319 . 2 { 6__M732 
msal2B319.2{6JM781 
Consensus 



msal28319.2{6 090 
tnsal2 8 3 1 9 . 2 ( 6 JL169NT 
maal28319.2{6 18RS21 
msal28319.2T6_2603 
msal28319 . 2{ 6_H36B 
rasal283 19 . 2 { 6_JM9130013 
rasal28319.2{6 A909 
msal28319.2{6 CJB110 
msal28319.2T6 COH1 
msal2B3 19.21 6_M7 32 
msal28319.2{6_M781 



50 



mknlllkckd kkvkaftlle clvalvtitg allvyqgltk llaqqlwtns 



51 



100 



f EG AHLEYLRQNK LYLRKQDKIV TFGKSNKDDF 

EG AHLEYLRQNK LYLRKQDKIV TFGKSNKDDF 

Ef EG AHLEYLRQNK LYLRKQDKIV TFGKSNKDDF 

sssqsewvll tqqlnABfEG AHLEYLRQNK LYLRKQDKIV TFGKSNKDDF 

AEfEG AHLEYLRQNK LYLRKQDKIV TFGKSNKDDF 

AEfEG AHLEYLRQNK LYLRKQDKIV TFGKSNKDDF 

Ef EG AHLEYLRQNK LYLRKQDKIV TFGKSNKDDF 

Bf EG AHLEYLRQNK LYLRKQDKIV TFGKSNKDDF 

Ef EG AHLEYLRQNK LYLRKQDKIV TFGKSNKDDF 

Ef EG AHLEYLRQNK LYLRKQDKIV TFGKSNKDDF 

Ef EG AHLEYLRQNK LYLRKQDKIV TFGKSNKDDF 



Consensus 
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msal28319.2{6_090 < 
msal28319 . 2 ( 6_1169NT 
msal28319.2{6 18RS2l' 
msal28319.2T6 2603 
msal28319.2{6~H36B' 
msal283l9.2{6_JM9130013 
msal2B319 . 2 {6_A909 
msal28319 . 2{6 CJB110 
msal28319 . 2T6_COHl 
msal28319.2(6 M732 
rasal28319.2(6_M781 
Consensus 



101 

RKTGYdGRGY 
RKTGYdGRGY 
RKTGYdGRGY 
RKTGYdGRGY 
RKTGYdGRGY 
RKTGYdGRGY 
RKTGYdGRGY 
RKTGYdGRGY 
RKTGYnGRGY 
RKTGYnGRGY 
RKTGYnGRGY 



QPMVYGLDNC 
QPMVYGLDNC 
QPMVYGLDNC 
QPMVYGLDNC 
QPMVYGLDNC 
QPMVYGLDNC 
QPMVYGLDNC 
QPMVYGLDNC 
QPMVYGLDNC 
QPMVYGLDNC 
QPMVYGLDNC 



QMSQTKSMVK 
QMSQTKSMVK 
QMSQTKSMVK 
QMSQTKSMVK 
QMSQTKSMVK 
QMSQTKSMVK 
QMSQTKSMVK 
QMSQTKSMVK 
QMSQTKSMVK 
QMSQTKSMVK 
QMSQTKSMVK 



LVPYFKDGLK 
LVPYPKDGLK 
LVFYFKDGLK 
LVFYPKDGLK 
LVPYPKDGLK 
LVFYFKDGLK 
LVFYFKDGLK 
LVFYFKDGLK 
LVFYFKDGLK 
LVFYFKDGLK 
LVFYFKDGLK 



150 

RTFYYDFKEE 
RTFYYDFKBB 
RTFYYDFKEE 
RTFYYDFKEE 
RTFYYDFKEE 
RTFYYDFKEE 
RTFYYDFKEE 
RTFYYDFKEE 
RTFYYDFKEE 
RTFYYDFKEE 
RTFYYDFKEE 



msal28319.2{6 090 
msal28319 . 2 { 6_1169NT 
msal28319.2{6 18RS21 
tnsal28319 . 27*6_2603 
msal28319.2(6_H36B 
tnsal28319.2{6_JM9130013 
msal28319.2{6_A909 
msal28319.2{6 CJB110 
msal 2 6 3 19 . 2Ts_COHl 
msal28319 . 2 { 6_M732 
rasal28319.2{6_M781 
Consensus 
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Table 83: Comparative Sequences relating to SAG0108 



SEQ ID NO. 8301 
STRAIN 2603 

atgaaaaagattcgattatcaaagtttattaaaatgattgttgttattttgtttttaatt 
agtgtagcagctagtttttattttttccacgttgcccaagttcgagatgataaatccttt 
atttcaaatggtcaacgtaagcctggaaactctttatatgcttatgataaatcctttgat 
aagctattaaagcaaaaaatagaaatgacaaaccaaaatataaagcaagttgcttggtat 
gttcctgctgttaagaaaactcataagacagct^ttgtcgttcatggttttgcgaatagc 
aaagagaatatgaaggcatatggttggctgtttcataagttaggatacaatgttcttatg 
cctgacaatattgcacatggtgaaagtcatgggcagttgataggctatggctggaacgac 
cgcgagaacattatcaaatggacagaaatgatagttgataagaatccatcaagccaaatt 
actttatttggtgtttcaatgggtggagcaacagtcatgatggctagtggtgaaaaatta 
cctagtcaggttgttaatatcattgaagattgcggttattctagtgtttgggatgaatta 
aaatttcaggctaaagagatgtatggtttaccagccttcccactcttatatgaagtttca 
acaatttctaaaatcagagcaggtttttcgtatggacaagcaagtagtgtcgaacaattg 
aaaaagaataatttaccagccctctttattcatggtgataaggataattttgttccaaca 
agtatggtttatgacaactataaagctacagcaggtaagaaagagctttatattgtaaaa 
ggggcaaaacatgcgaaatcttttgaaacagagccagaaaaatatgagaaacgtatctct 
agttttttgaaaaaatatgaaaaa 

SEQ ID NO. 8302 
STRAI N 090 

GCTAGTTTTTATTTTTTCCAOGTTGCCCAAGTTOQ 
AGATGATAAATCCTTTATTTCAAATGGT^ 

TATATG CTT ATGATAAATCCTTTGAT AAG CT ATT AAAGCAAAAAATAGAA 

ATGACAAACCAAAATATAAAGCAAGTTGCTTGGTATGTTCCTC 

GAAAACTCATAAGACAG CTGTTGTCGTTCATGGTTTTGCGAATAgCAAAG 

AGAATATGAAGGCATATGGTTGGCTGTTTCATA^ 

cTTATGCCTGACAATATTGCACATGGtGAAAGTCAT^ 

CTATGGCTGOAACGACCGCGAGAACATTATCaAATGGACAGAAATGATAG 

TTGATAAGAATCCATCAAGCCIAAATTACTT t aTTTGGTGTTTCAATGGGT 

GGAGCAACAGTCATGATGGCTAGTGGTGAAAAATTACCTAGT 

TAATATCATTGAAGATTGCGGTTATTCTAGTGTTTGGGATGAA 

TTCAGGCTAAAGAGATGTATGGTTTACCAGCCTTCC 

GTTTCAACAATTTCTAAAATCAGAGCAGGTTTTTCG 

TAGTGTCX3AACAATTGAAAAAGAATAATITACC^ 

GTGATAAGGATAATTTTGTTCCAACAAGTATGGTT^ 

GCTACAGCAGGTAAGAAAGAGC^TTATATTGTAAAAGGGGCAAAACATGC 

GAAATCTTITCAAACAGAGCCAGAAAAATATGAGAAACGTAT^ 

TTTTGAAAAAATATGAAAAA 

SEQ ID NO. 8303 
STRAIN A909 

AATC ClUTA TTrCAAATGGTCAACGTAAJGC CTGGA 

TATGATAAATCCTTTGATAAGCTATTAAA 

CCAAAATATAAAGCAAGTTGCTTGGTATGTTCCTC 

ATAAGACAGCTGTTGTC GTTCA TGGTTTTGCGAATA^ 

AAGGCATATGGTTGGl:i%31"1uCATAAGTTAGGATAGAATGi ■ivitaTGCC 

TGACAACATTGCACATGGTGAAAGTCATGGGCAGTTGATAGG CTATGGCT 

GGAACGACCGCGAGAACATTATCAAATGGACAGAAATGATAGTTGATAAG 

AATTCATCAAGCCAAATIACTTTATTTGGTGT^ 

AGTCATGATGGCTAGTGGTGAAAAATTACCTAGTCAGuiAWi" 

TTGAAGAtTGCGGTTATTCTGGTGTTTGGGATGAA 

AAAGAGATGTATGGTTTACCAGCCTTCCCACTCTTATAT^ 

AATTTCTAAAATCAGAGCAGGTTTTTCGTATGGACAA 

AACAATTGAAAAAGAATAATTTACCAGCCLUVriUATTCATGGTGATAAG 

GATAATTTTGTTCCAACAaGTATGGTTTATGACAACT 

AGGTAAGAAAGAGCTTTATATTGTAAAAGGGGCAAAACATG CGAAATCTT 

TTGAAaCAGAGCCAGAAAAATATGAGAAACX5TATCTCTAG'l"l"i"l"l"lGAAA 

AAATATGAAAAA 

SEQ ID NO. 8304 
ST RAIN H36B 

AGTTTTTATTTTTTCCACGTTGCCCAAGTTOT 

TTCAAATGGTCAAOGTAAGCCTGGAAACTCTTTATAT^ 

CCTTTGATAAGCTATTAAAGCAAAAAATAGAAATGACAAA 

AAGCAAGTTGCTTGGTATGTTCCTGCTG CTAAGAAAACT 

TGTTGTCGTTCATGGTTTTGCGAATAGCAAAQAQA^ 

GTTGGCTGTTTC^TAAGTTAGGATACAATGTTcOTATGC 

GCACATGGTGAAAGTCATGGGCAGTTGATAGGCT^ 

CGAGAACATTATCAAATGGACAGAAATGATAGTTGATAAGAATTCATO 

GCCAAATTACTTTATTTGGTGTTTCAATGGGTG . 

GCTAGTGGTGAAAAATTACCEAGTCAGGTTGTTAATATO 

CGGTTATTC t GGTGTTTGGGATGAATTAAAATTTCAGG 

ATGGTTTACCAG<XriTCCC!ACTCTTATATGAAu 

ATCAGAGCAGGTTTTTCGTATGGACAAgCAAGTAGTGT^ 

AAAGAATAATTTACCAGCCCTCTTTATTCATGG 

TTCCAACAAGTATGGTTTATGACAACTATAAAGCTA 

GAGCTTTATATTGTAAAAGGGGCAAAACATGCGAAAT 

GCCAGAAAAATATGAGAAACCTATCTCTAGl'iUU'riXiAAAAAaTATgAAA 

AA 

SEQ ID NO. 8305 
STRAIN 18RS21 
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GCTAGTTTTTATTTTTTCCACGTTG CCCAAGTTCGA 

GATGATAAAT<XrrTTATTTCAAATGGTCAACGT^ 

ATATGCTTATGATAAATCXTTTTGATAAGCTA^ 

TGACAAACCAAAATATAAAGCAAGTTGCTTGGTATGTTCCT^ 

AAAACTCATAAGACAGCTGTTGTCGTTCATGGTTTTGCGAA 

GAATATGAAGGCATATGGTTGGCTGTTTCATAAGTT^ 

TTATG CCTGACAAT ATTGCACATGGTGAAAGT CATGGGCAGTTGATAGG C 

TATGGCTGGAACGACCG CX3AGAACATTATCAAATGGACAGAAATGATAGT 

TGATAAGAATCCATCAAGCCAAATTACTTTATTTGXi^^ 

GAGCAACAGTCATGATGGCTAGTGGTGLAAAAATT^ 

AATATCATTGAAGATTGCGGTT ATT cTAGTGTTTGGGATgAATTAAAATT 

TCAGGCTAAAGAGATGTATGGTTTACCAGCCTTCCCACTCTTATATGAAG 

TTTCAACAATTTCTAAAATCAGAGCAGGTTTTTCGTAT G 

AGTGTCGAACAATTGAAAAAGAATAATTTACCAGCCCrCT^ 

TGATAAGGATAATTTTGTTCCAACAAGTATGGTC 

CTACAGCAGGTAAGAAAGAG CTTTATATTGTAAAAGGGGCAAAACATGCG 

AAATCTTTTGAAaCAGAGCCAGAAAAATATGAGAAAC^ 

TTTGAAAAAATATGAAAAA 

SKQ ZD NO* 8306 
STR AIN M732 

GCTAGTTTTTATTTTTTCCACGTTG CCCAAGTTCGA 
GATGATAAATCCTTTATTTCAAATGGTCAACGTAA 

ATATGCTTATGATAAATCCTTTGATAAG CTATTAAAGCAAAAAATAGAAA 
TGACAAACCAAAATATAAAGCAAGTTGC1TGOTATGTTC 
AAAACTCATAAGACAGTTGTTGTCGTTCATGGTTTTG CGAATAGCAAAGA 
GAATATGJVAGGCATAT<K3TTGG CTGTTTCATAAGTTAGGATACAATGTTC 
TTATGCXrrGACAACATTG CACATGGTGAAAGTCATGG^CAGTTGATAGGC 
TATGGCHXKIAACGACCGCGAGAACATTATCAAATGGAC^ 
GGATAAGAATCCATCAAGCCAAATTaCITTATTTC 

GAGCAACAGTCATGATGGCTAGTGGTGAAAAATTACCT ' 
AATATCATTGAAGATTGTGGTTATTCTAGTGT^ 

TCAGGCTAAAGAGATGTATGGTTTACCAG CCTTCCCACTCTTATATGAAG 
TTTCAACAATTT CTAAAATCAGAG CAGG , ri"i"l^X^GTATGGACAAgCAAGT 
AGTGTCGAACAATTGAAAAAGAATAATTTACCAG CCCTcTTTATTCATGG 
TGATAAGGATAATTTTGTTCCAAOVRGTATGGTTTATG 
CTACAGCAGGTAAGAAAGAG CTTTATATTGTAAAAGGGG CAAAACATGCG 
AAATCTITTGAAACAGAGCCAGAAAAATATGAGAA^ 
TTTGAAAAAATATGAAAAA 

SBQ ZD NO. 8307 
STR AIN COH 1 

GCTAG'lTri"17VlMU"lU"lXXAC<nTGCCCAAGTTC 
GAGATGATAAATCCTTTATTTCAAATGGTCAAC^ 

TTATATGCH^ATGAT AAATCCTTTGAT AAGCT ATTAAAG CAAAAAATAGA 

AATG aCAAACCAAAATATAAAG CAAGTTGCTTGGT ATGTTCXnX3CTGCTA 

AGAAAACTCATAAGACAGTTGTTGTCGTTCATG^ 

GAGAATATGAAGGCATATGGTTGGCTGTTTCATA 

TCrTATGCCTGACAACATTGCACATG^ 

GCTATGGCTGGAACGACCXjCX^GAACATTATC^ 

GTGGATAAGAATCXATOAGCCAAATTAc'i'l'lATTTGGTC 

TGGAGCAACAGTCATGATGGCTAGTGGTGAAAAATT^^ 

TTAATATCATTGAAGATTGTGGTTATTcTAG^ 

TTTCAGGCTAAAGAGATGTATGGTTTACCAGCCT 

AGTTTCAACAATTTCTAAAATCAGAGCAGGTTTTTOT 

GTAGTGTCGAACAATTGLAAAAAGAATAATTTACX3AGCCCT 

GGTGATAAGGATAATTTTGTTCCAACAaGTATGGTTTA^ 

AGCTACAGCAGGTAAGAAAGAGCTTTATATTGTAAAAGG 

CXSAAATCTTTTGAAaCAGAGCCAGAAAAATATGAGA 

TTTTTGAAAAAATATGAAAAA 

SKQ ZD NO. 8308 
STR AIN M781 

GCTAGTTTTTATTTTTT CCACGTTG CCCAAGTTCG 

AGATGATAAATCCTTTATTTCAAATGGTCAACGT AAG CCTGGAAACTCTT 
TATATGCTTATGATAAATCCTTTGATAA GCTA TTAAAGCA 

GAAAACTCATAAGACAGTTGTTGTCGTTCATGGTT^ 

AGAATATGAAGGCATATGGTTGGCTGTITCATAAGTT 

CTTATGCCTX^CAACATTGCACATGGTGAAA^ 

CTATG^jCTGGAACGACCGCGAGAACATTA^ 

TGGATAAGAATCCATCAAGCCAAATTaCTTTATTT^ 

GGAGCAACAGTCATGATGGCTAGTGGTGAAAAATTAC 

TAATATCATTGAAGATTGTGGTTATTcTAGTG 

TTCAGGcTAAAGAGATGTATGXSTTTACCAGCCTTCCCACT 

GTTTCAacAATTTcTAAAAT cAgAGCRGGTTTT^ 

TAgTGTCGAACAAT t GAAAAAGAATAATTTACXIAGCCCTcTITATTCATG 

GTGATAAGGATAATTTTGTTCCAACAaGTAT^ 

GCTACAGCAGGTAAQAAAOAGCTTTATATTGTAA^ 

GAAATCTTTTGAAaCAGAGCCAGAaaAATATGAGAAACGT 

TTTTGAAAAAATATGAAAAA 

SBQ ZD NO. 8309 
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STRAIN CJB 110 

GCTAGTTTTTAI"rri"lTCCACGlTG CCCAAGTTCGAG 

ATGATAAATCCTTTATTTCAAATGGTC^CGTAAGCCTGGAAA 

TATGCTT ATGATAAATCCTTTG ATAAG CT ATT AAAGCAAAAAATAGAAAT 

GACAAACCAAAATATAAAQCAAGTT<XriTGGTATGTT 

AAACTCATAAGACAGCTGTTGTCGTTCATGGTT^^ 

AATATGAAGGCATATGGTTGGCTGTTTCATAAGTTA» 

TATGCCTGACAATATTGCACATGGTGAAAGTCATGGG 

ATGGCTGGAACGACCCCGAGAACATTATCAAATGGACA^ 

GATAAGAATCCATCAAGCCAAATTACTTTATTTGGTGTTT 

AGCAAC^GTCATGAT<y3CTAGT<^TGAAAAATTACCT 

ATATCATTGAAGATTGCGGTTATT cTAGTGTTTGGGATgAATTAAAATTT 

CAGGCTAAAGAGATOTATGCTTTACCAGCCTTCXIC^ 

TTCAACAATTTCTAAAATCAGAG CAGGTTTT^ 

gTGTCGAACAATTGAAAAAGAATAATTTACXIAGCCCT 

GATAAGGATAATTTTGTTCCAACAAGTATCGTTTATGACA^ 

TACAG CAGGTAAGAAAGAGCTTTATATTGTAAAAG GGGCAAAACATG 

AATCTTTTGAAACAGAGCCAGAAAAATATGAGAAACXyTA 

TTGAAAAAATATGAAAAA 

SEQ ID NO. 8310 
STRAIN 1169NT 

GCTAGUTTa"rAU'rri - iU'CCAC<3TT<3 CCCAAGTTCGA 

GATGATAAATCCTTTATTTCAAATGGTCAACCT 

ATATGCTTATGATAAATCCTTTGATAAGCTATTAAAGCAAAAAA 

AAAACnX2ATAAGACAGCTGTTGTCX3TTCATGGTT^ 

gAATATOAACKSCATATGGTTGGCTOTTTCATAAGTTA^ 

TTATACCTGACAATATTCCACATGGTGAAAGTCATGGG CAGTTGATAGGC 

TATGGCTGGAACGACCGCGAGAACATTATCAAATGGACAGAAAT^ 

TGATAAGAATCCATCAAGCCAAATTACTTTATTTGGTG^ 

GAGCAACAGTCATGATGG CTAGTGGTGAAAAATT ACX7TAGTCAGGTTGTT 

AATATCATTGAAGATTgCGGTTATTcTAGTGTTTGGGOT 

TCAGGCTAaAGAGATGT ATGGTTTaCCAGCCTITCCC^ cTTATATGAAG 

TTTCAACAATTTCTAAAATCAGAGCAGGTTTT^ 

AGTGTAfiAACAATTGAAAAAGAATAATTTACCAGCCCTC^ 

TGATAAGGATAATTTTGTTCCAACAAGTATGG^ 

CTACAGCAGGTAAGAAAGAGCTTTATATTGTAAAAGGGG CAAAACATGCG 

AAATCTTTTGAAaCAGAGCCAGAAAAATATGAGAAACOT 

TTTGAAAAAATATGAAAAA 

SEQ ID NO. 83X1 
STRAIN JM9130013 

GCTAGTTTTTATTTTTTCCACGTTGCCCAAGTTCQ 

AGATGATAAATCCTTTATTTCAAATGGTCAACGTAAGCCTGGAA 

TATATGCTTATGATAAATCXZTTTGATAAGC^ 

GAAAACTCATAAGACAGCTGTTGTCGTTCAT^ 

CTTATGCCTGACAATATTGCACATGG^ 

CTATGGCTGGAACGACCGCGAGAACATTATCaAATCGACAGAAAT^ 

GGAGCAACAGTCATGATGGCTAGTGGTGAAAAATTACCTA 

TAATATCATTCAAGJVTTGCGGTTATTcTAG 

TTCAGGCTAAAGAGATGTATGGTTTACCAGC^ 

GTTTCAACAATTTCTAAAATCAGAGCAGGTTT^ 

TAGT<3TCGAACAA!TTGAAAAAGAATAATTTACCAG 

GTGATAAGGATAATTTTGTTCCAACAAGTATGGTTTATGACAACT 

GCTACAG CAGGTAAGAAAGAGCTTTAT ATTGTAAAAGGGGCAAAACATGC 

GAAATCTTTTGAAACAGAGCCAGAAAAATATGAGAAACXar 

TTTTGAAAAAATATGAAAAA 
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maa2 8 66 08. 2 I 662_C0H1 
maa286608 .21 662_M732 
msa286608 .2- 662_M78l' 
msa2 8 66 08. 2 1 66 2_A9 09 
msa2 86608 .2{662_H36B' 
msa286608.2{662_090 
msa286608 . 2 ( 662_CJB11 0 
msa286608 . 2 { 662_18RS2 1 
tnsa28 6608 .2(662 2603 
tnsa286608.2{662 JM9130013 
msa286608 . 2 { 662_1169NT 
Consensus 



atgaaaaaga ttcgattatc aaagtttatt aaaatgattg ttgttatttt 



msa286608 
msa286608 
msa286608 



:_COHl} 
M732J 
M781} 



51 



100 

— g ctagttttta ttttttccac gttgcccaag 
~g ctagttttta ttttttccac gttgcccaag 
— g ctagttttta ttttttccac gttgcccaag 
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Table 83: Comparative Sequences relating to SAG0108 



msa286608.2(662_A909 
msa286608 .2{662_H36B' 
msa286608 . 2 { 662_090 
msa286608 .2{662_CJB110 
msa286608.2{662_18RS21 
msa286608.2{662_2603 
msa286608 . 2 { 662_JM9130013 
msa286609 . 2{662_1169NT 
Consensus 



— agttttta ttttttccac gttgcccaag 

g ctagttttta ttttttccac gttgcccaag 

g ctagttttta ttttttccac gttgcccaag 

_g ctagttttta ttttttccac gttgcccaag 

gtttttaatt agtgtagcag ctagttttta ttttttccac gttgcccaag 

g ctagttttta ttttttccac gttgcccaag 

,~ g ctagttttta ttttttccac gttgcccaag 



101 

msa286608 .2{662_COHl> ttcgagatga 

msa2 8 66 08. 2 |662_M73 2) ttcgagatga 

msa286608.2< 662_M781) ttcgagatga 

msa286608 .2( 662_A909j 

msa286608 . 2{ 662_H36B> ttcgagatga 

msa286608 .2{662_090 \ ttcgagatga 

msa286608 . 2 { 662_CJB110 i ttcgagatga 

msa2 8 66 08 .2 {662_18RS21 ttcgagatga 

msa286608 . 2{662_2603 j ttcgagatga 

msa2 86608 . 2 { 662_JM9130013 I ttcgagatga 

msa2 86608 . 2 { 66 2_1169NT) ttcgagatga 

Consensus 



taAATCCTTT 
taAATCCTTT 
taAATCCTTT 
--AATCCTTT 
taAATCCTTT 
taAATCCTTT 
taAATCCTTT 
taAATCCTTT 
taAATCCTTT 
taAATCCTTT 
taAATCCTTT 



ATTTCAAATG 
ATTTCAAATG 
ATTTCAAATG 
ATTTCAAATG 
ATTTCAAATG 
ATTTCAAATG 
ATTTCAAATG 
ATTTCAAATG 
ATTTCAAATG 
ATTTCAAATG 
ATTTCAAATG 



GTCAACGTAA 
GTCAACGTAA 
GTCAACGTAA 
GTCAACGTAA 
GTCAACGTAA 
GTCAACGTAA 
GTCAACGTAA 
GTCAACGTAA 
GTCAACGTAA 
GTCAACGTAA 
GTCAACGTAA 



150 

GCCTGGAAAC 
GCCTGGAAAC 
GCCTGGAAAC 
GCCTGGAAAC 
GCCTGGAAAC 
GCCTGGAAAC 
GCCTGGAAAC 
GCCTGGAAAC 
GCCTGGAAAC 
GCCTGGAAAC 
GCCTGGAAAC 



msa286608 . 2 ( 662_COHl 
msa286608 .2 662_M732 
msa286608.2 662_M781 
msa286608.2 662_A909 
msa2 86608 . 2 ( 662_H36B 
msa286608.2{662 090 
msa28 6608 . 2 f 662_CJB110 
msa286608 . 2 { 662_18RS21 
msa286608 . 2 { 662_2603 
tnsa286608 . 2 { 662_JM9130013 
msa286608 . 2 { 662_1169NT 
Consensus 



151 

TCTTTATATG 
TCTTTATATG 
TCTTTATATG 
TCTTTATATG 
TCTTTATATG 
TCTTTATATG 
TCTTTATATG 
TCTTTATATG 
TCTTTATATG 
TCTTTATATG 
TCTTTATATG 



CTTATGATAA 
CTTATGATAA 
CTTATGATAA 
CTTATGATAA 
CTTATGATAA 
CTTATGATAA 
CTTATGATAA 
CTTATGATAA 
CTTATGATAA 
CTTATGATAA 
CTTATGATAA* 



ATCCTTTGAT 
ATCCTTTGAT 
ATCCTTTGAT 
ATC CTTTG AT 
ATCCTTTGAT 
ATCCTTTGAT 
ATCCTTTGAT 
ATCCTTTGAT 
ATCCTTTGAT 
ATCCTTTGAT 
ATCCTTTGAT 



AAGCTATTAA 
AAGCTATTAA 
AAGCTATTAA 
AAGCTATTAA 
AAGCTATTAA 
AAGCTATTAA 
AAGCTATTAA 
AAGCTATTAA 
AAGCTATTAA 
AAGCTATTAA 
AAGCTATTAA 



200 

AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 
AGCAAAAAAT 



msa286608 .21 662_COHl 
msa286608.2(662_M732 
msa2 8 66 0 8 . 2 { 6 62_M78 1 
msa286608 .2f662_A909 
msa286608 . 2 { 662_H36B 
msa286608 . 2 { 662_090 
msa286608 . 2 { 662_CJB110 
mea286608 . 2{662_18RS21 
maa286608 . 2 { 662_2603 
msa286608 . 2 { 662_JM9130013 
msa286608 . 2 { 662_1169NT 
Consensus 



201 

AGAAATGACA 
AGAAATGACA 
AGAAATGACA 
AGAAATGACA 
AGAAATGACA 
AGAAATGACA 
AGAAATGACA 
AGAAATGACA 
AGAAATGACA 
AGAAATGACA 
AGAAATGACA 



AACCAAAATA 
AACCAAAATA 
AACCAAAATA 
AACCAAAATA 
AACCAAAATA 
AACCAAAATA 
AACCAAAATA 
AACCAAAATA 
AACCAAAATA 
AACCAAAATA 
AACCAAAATA 



TAAAGCAAGT 
TAAAGCAAGT 
TAAAGCAAGT 
TAAAGCAAGT 
TAAAGCAAGT 
TAAAGCAAGT 
TAAAGCAAGT 
TAAAGCAAGT 
TAAAGCAAGT 
TAAAGCAAGT 
TAAAGCAAGT 



TGCTTGGTAT 
TGCTTGGTAT 
TGCTTGGTAT 
TGCTTGGTAT 
TGCTTGGTAT 
TGCTTGGTAT 
TGCTTGGTAT 
TGCTTGGTAT 
TGCTTGGTAT 
TGCTTGGTAT 
TGCTTGGTAT 



250 

GTTCCTGCTG 
GTTCCTGCTG 
GTTCCTGCTG 
GTTCCTGCTG 
GTTCCTGCTG 
GTTCCTGCTG 
GTTCCTGCTG 
GTTCCTGCTG 

GTTCCTGCTG 
GTTCCTGCTG 



msa2 86608.2^66 2_C0H1 
msa2866 08 .2 662_M732 
msa2866 08 .2 662_M781 
msa286608 . 2 f 662_A909 
msa28 6608 . 2 { 662_H36B 
msa286608.2{662_090 
msa286608 . 2 { 662_CJB110 
msa286608.2{662 18RS21 
msa286608.2{6?2 2603 
tnsa286608 . 2 { 662_JM9130013 
msa286608 .2{662_1169NT 
Consensus 



251 

CTAAGAAAAC 
CTAAGAAAAC 
CTAAGAAAAC 
CTAAGAAAAC 
CTAAGAAAAC 
CTAAGAAAAC 
CTAAGAAAAC 
tTAAGAAAAC 
tTAAGAAAAC 
tTAAGAAAAC 
CTAAGAAAAC 



TCATAAGACA 
TCATAAGACA 
TCATAAGACA 
TCATAAGACA 
TCATAAGACA 
TCATAAGACA 
TCATAAGACA 
TCATAAGACA 
TCATAAGACA 
TCATAAGACA 
TCATAAGACA 



GtTGTTGTCG 
GtTGTTGTCG 
GtTGTTGTCG 
GcTGTTGTCG 
GcTGTTGTCG 
GCTGTTGTCG 
GcTGTTGTCG 
GcTGTTGTCG 
GCTGTTGTCG 
GcTGTTGTCG 
GcTGTTGTCG 



TTCATGGTTT 
TTCATGGTTT 
TTCATGGTTT 
TTCATGGTTT 
TTCATGGTTT 
TTCATGGTTT 
TTCATGGTTT 
TTCATGGTTT 
TTCATGGTTT 
TTCATGGTTT 
TTCATGGTTT 



300 

TGCGAATAGC 
TGCGAATAGC 
TGCGAATAGC 
TGCGAATAGC 
TGCGAATAGC 
TGCGAATAGC 
TGCGAATAGC 
TGCGAATAGC 
TGCGAATAGC 
TGCGAATAGC 
TGCGAATAGC 



tnsa286608.2J 662_C0H1' 
msa2 86608.21 662_M732 
msa286608.2« 662_M78l' 
msa286608.2 662 A909 
msa286608.2{662_H36B 
msa28 6608 . 2 {662^090 ' 
rasa286608.2{662_CJB110 
msa286608.2{662_18RS21 
tnsa286608 . 2 { 662_2603 
msa286608 .2 {662_JM9130013 
msa286608.2{662_1169NT 
Consensus 



301 

AAAGAGAATA 
AAAGAGAATA 
AAAGAGAATA 
AAAGAGAATA 
AAAGAGAATA 
AAAGAGAATA 
AAAGAGAATA 
AAAGAGAATA 
AAAGAGAATA 
AAAGAGAATA 
AAAGAGAATA 



TGAAGGCATA 
TGAAGGCATA 
TGAAGGCATA 
TGAAGGCATA 
TGAAGGCATA 
TGAAGGCATA 
TGAAGGCATA 
TGAAGGCATA 
TGAAGGCATA 
TGAAGGCATA 
TGAAGGCATA 



TGGTTGGCTG 
TGGTTGGCTG 
TGGTTGGCTG 
TGGTTGGCTG 
TGGTTGGCTG 
TGGTTGGCTG 
TGGTTGGCTG 

TGGTTGGCTG 
TGGTTGGCTG 
TGGTTGGCTG 



TTTCATAAGT 
TTTCATAAGT 
TTTCATAAGT 
TTTCATAAGT 
TTTCATAAGT 
TTTCATAAGT 
TTTCATAAGT 
TTTCATAAGT 
TTTCATAAGT 
TTTCATAAGT 
TTTCATAAGT 



350 

TAGGATACAA 
TAGGATACAA 
TAGGATACAA 
TAGGATACAA 
TAGGATACAA 
TAGGATACAA 
TAGGATACAA 
TAGGATACAA 
TAGGATACAA 
TAGGATACAA 
TAGGATACAA 



msa2 86608 . 2 { 662_C0H1 } 
msa286608 . 2 ( 662_M732 } 



351 400 
TGTTCTTATg CCTGACAAcA TTGCACATGG TGAAAGTCAT GGGCAGTTGA 
TGTTCTTATg CCTGACAAcA TTGCACATGG TGAAAGTCAT GGGCAGTTGA 
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Table 83: Comparative Sequences relating to SAG0108 



msa286608 . 2f 662^781' 
msa286608 .2(562 A909' 
msa2 8 66 0 6 . 2 { 662~H3 6B 
msa28660B .2 { 662_090 
msa286608.2{662 CJB110 
msa286608.2{662_18RS21 
msa286608 .2{662_2603 
msa286608 . 2 ( 662_JM9130013 
msa286608.2{662_1169NT 
Consensus 



TGTTCTTATg 
TGTTCTTATg 
TGTTCTTATg 
TGTTCTTATg 
TGTTCTTATg 
TGTTCTTATg 
TGTTCTTATg 
TGTTCTTATg 
TGTTCTTATa 
*********_ 



CCTGACAAcA 
CCTGACAAcA 
CCTGACAAcA 
CCTGACAAtA 
CCTGACAAtA 
CCTGACAAtA 
CCTGACAAtA 
CCTGACAAtA 
CCTGACAAtA 
********„* 



TTGCACATGG 
TTGCACATGG 
TTGCACATGG 
TTGCACATGG 
TTGCACATGG 
TTGCACATGG 
TTGCACATGG 
TTGCACATGG 
TTGCACATGG 
********** 



TGAAAGTCAT 
TGAAAGTCAT 
TGAAAGTCAT 
TGAAAGTCAT 
TGAAAGTCAT 
TGAAAGTCAT 
TGAAAGTCAT 
TGAAAGTCAT 
TGAAAGTCAT 
********** 



GGGCAGTTGA 
GGGCAGTTGA 
GGGCAGTTGA 
GGGCAGTTGA 
GGGCAGTTGA 
GGGCAGTTGA 
GGGCAGTTGA 
GGGCAGTTGA 
GGGCAGTTGA 
********** 



msa286608.2i 662_COHl 
msa286608 . 2 i 662_M732 
msa286608.2(662_M781 
maa286608 . 2 ( 662_A909 ' 
msa2B6608.2{662 H36B* 
msa286608 . 2 { 662_090 
msa286606 . 2 ( 662_CJB110 
msa286608. 2(662 18RS21 
msa286608 . 2 { 662J2603 
msa286608.2{662_JM9130013 
msa286608.2{662_1169NT 
Consensus 



401 

TAGGCTATGG 
TAGGCTATGG 
TAGGCTATGG 
TAGGCTATGG 
TAGGCTATGG 
TAGGCTATGG 
TAGGCTATGG 
TAGGCTATGG 
TAGGCTATGG 
TAGGCTATGG 
TAGGCTATGG 



CTGGAACGAC 
CTGGAACGAC 
CTGGAACGAC 
CTGGAACGAC 
CTGGAACGAC 
CTGGAACGAC 
CTGGAACGAC 
CTGGAACGAC 
CTGGAACGAC 
CTGGAACGAC 
CTGGAACGAC 



CGCGAGAACA 
CGCGAGAACA 
CGCGAGAACA 
CGCGAGAACA 
CGCGAGAACA 
CGCGAGAACA 
CGCGAGAACA 
CGCGAGAACA 
CGCGAGAACA 
CGCGAGAACA 
CGCGAGAACA 



TTATCAAATG 
TTATCAAATG 
TTATCAAATG 
TTATCAAATG 
TTATCAAATG 
TTATCAAATG 
TTATCAAATG 
TTATCAAATG 
TTATCAAATG 
TTATCAAATG 
TTATCAAATG 



450 

GACAGAAATG 
GACAGAAATG 
GACAGAAATG 
GACAGAAATG 
GACAGAAATG 
GACAGAAATG 
GACAGAAATG 
GACAGAAATG 
GACAGAAATG 
GACAGAAATG 
GACAGAAATG 



msa28 6608 . 2 \ 662_COHl 
msa286608 .2( 662__M732' 
tnsa286608 .2f662_M781 
msa286608 . 2 662_A909 ' 
msa2 8 66 08 .2{662__H36B' 
msa286608.2{662_090 
msa286608 . 2 ( 662_CJB110 
msa2 86608 .2{662_18RS21 
ms a2 86608 .2{662_2 603 
msa286608.2{662_JM9130013 
msa286608 . 2 { 662_1169NT 
Consensus 



451 

ATAGTgGATA 
ATAGTgGATA 
ATAGTgGATA 
ATAGTtGATA 
ATAGTtGATA 
ATAGTtGATA 
ATAGTtGATA 
ATAGTtGATA 
ATAGTtGATA 
ATAGTtGATA 
ATAGTtGATA 
*****_**** 



AGAATcCATC 
AGAATCCATC 
AGAATcCATC 
AGAATtCATC 
AGAATtCATC 
AGAATcCATC 
AGAATcCATC 
AGAATcCATC 
AGAATcCATC 
AGAATCCATC 
AGAATcCATC 
*****_**** 



AAGCCAAATT 
AAGCCAAATT 
AAGCCAAATT 
AAGCCAAATT 
AAGCCAAATT 
AAGCCAAATT 
AAGCCAAATT 
AAGCCAAATT 
AAGCCAAATT 
AAGCCAAATT 
AAGCCAAATT 
********** 



ACTTTATTTG 
ACTTTATTTG 
ACTTTATTTG 
ACTTTATTTG 
ACTTTATTTG 
ACTTTATTTG 
ACTTTATTTG 
ACTTTATTTG 
ACTTTATTTG 
ACTTTATTTG 
ACTTTATTTG 
********** 



500 

GTGTTTCAAT 
GTGTTTCAAT 
GTGTTTCAAT 
GTGTTTCAAT 
GTGTTTCAAT 
GTGTTTCAAT 
GTGTTTCAAT 
GTGTTTCAAT 
GTGTTTCAAT 
GTGTTTCAAT 
GTGTTTCAAT 
********** 



msa286608.2| 662_COHl 
msa2 6 6608 . 2 { 662_M73 2 
ms a2 8 66 08 .2 662_M78l' 
msa286608. 2(662 A909* 
msa286608 . 2 { 662_H3 6B' 
msa286608.2{662_090 < 
msa286608 .2{662_CJB110 
msa286608.2{662_18RS21 
msa286608 .2{662_2603 
msa2 8 66 08 . 2 { 662_JM9 13 0 0 1 3 
msa286608 .2{662_1169NT 
Consensus 



501 

GGGTGGAGCA 
GGGTGGAGCA 
GGGTGGAGCA 
GGGTGGAGCA 
GGGTGGAGCA 
GGGTGGAGCA 
GGGTGGAGCA 
GGGTGGAGCA 
GGGTGGAGCA 
GGGTGGAGCA 
GGGTGGAGCA 



ACAGTCATGA 
ACAGTCATGA 
ACAGTCATGA 
ACAGTCATGA 
ACAGTCATGA 
ACAGTCATGA 
ACAGTCATGA 
ACAGTCATGA 
ACAGTCATGA 
ACAGTCATGA 
ACAGTCATGA 



TGGCTAGTGG 
TGGCTAGTGG 
TGGCTAGTGG 
TGGCTAGTGG 
TGGCTAGTGG 
TGGCTAGTGG 
TGGCTAGTGG 
TGGCTAGTGG 
TGGCTAGTGG 
TGGCTAGTGG 
TGGCTAGTGG 



TGAAAAATTA 
TGAAAAATTA 
TGAAAAATTA 
TGAAAAATTA 
TGAAAAATTA 
TGAAAAATTA 
TGAAAAATTA 
TGAAAAATTA 
TGAAAAATTA 
TGAAAAATTA 
TGAAAAATTA 



550 

CCTAGTCAGG 
CCTAGTCAGG 
CCTAGTCAGG 
CCTAGTCAGG 
CCTAGTCAGG 
CCTAGTCAGG 
CCTAGTCAGG 
CCTAGTCAGG 
CCTAGTCAGG 
CCTAGTCAGG 
CCTAGTCAGG 



m3a286608.2 662_COHl 
msa286608.2 |662_M732* 
msa286608 . 2 662_M7B1 
ms a2 8 66 08. 2 (662_A909' 
msa286608 .2{662_H36B 
msa286608. 2 {662JD90 ' 
msa2e6608.2^662_CJB110 , 
msa286608 . 2 { 662_18RS2 1 
ntsa286608 . 2 { 662_2 603 
msa286608.2{662_JM9130013 
msa286608 ,2{662_1169NT 
Consensus 



551 

TTGTTAATAT 
TTGTTAATAT 
TTGTTAATAT 
TTGTTAATAT 
TTGTTAATAT 
TTGTTAATAT 
TTGTTAATAT 
TTGTTAATAT 
TTGTTAATAT 
TTGTTAATAT 
TTGTTAATAT 



CATTGAAGAT 
CATTGAAGAT 
CATTGAAGAT 
CATTGAAGAT 
CATTGAAGAT 
CATTGAAGAT 
CATTGAAGAT 
CATTGAAGAT 
CATTGAAGAT 
CATTGAAGAT 
CATTGAAGAT 



TGtGGTTATT 
TGtGGTTATT 
TGtGGTTATT 
TGcGGTTATT 
TGcGGTTATT 
TGcGGTTATT 
TGcGGTTATT 
TGcGGTTATT 
TGcGGTTATT 
TGcGGTTATT 
TGcGGTTATT 



CTaGTGTTTG 
CTaGTGTTTG 
CTaGTGTTTG 
CTgGTGTTTG 
CTgGTGTTTG 
CTaGTGTTTG 
CTaGTGTTTG 
CTaGTGTTTG 
CTaGTGTTTG 
CTaGTGTTTG 
CTaGTGTTTG 



600 

GGATGAATTA 
GGATGAATTA 
GGATGAATTA 
GGATGAATTA 
GGATGAATTA 
GGATGAATTA 
GGATGAATTA 
GGATGAATTA 
GGATGAATTA 
GGATGAATTA 
GGATGAATTA 



msa2 86608 . 2 662_COHl 
msa2 8 6608 . 2 662 J473 2 
msa286608.2 662_M781 
msa286608.2i 662__A909 
msa28 6608 . 2 { 662_H36B 
maa286608.2{662_090 
msa2 86608 .2(662_CJB110 
msa286608.2{662_18RS21 
msa286608.2{662 2603 
msa286608.2{662 JM9130013 
msa286608.2{662 - 1169NT 
Consensus 



601 

AAATTTCAGG 
AAATTTCAGG 
AAATTTCAGG 
AAATTTCAGG 
AAATTTCAGG 
AAATTTCAGG 
AAATTTCAGG 
AAATTTCAGG 
AAATTTCAGG 
AAATTTCAGG 
AAATTTCAGG 



CTAAAGAGAT 
CTAAAGAGAT 
CTAAAGAGAT 
CTAAAGAGAT 
CTAAAGAGAT 
CTAAAGAGAT 
CTAAAGAGAT 
CTAAAGAGAT 
CTAAAGAGAT 
CTAAAGAGAT 
CTAAAGAGAT 



GTATGGTTTA 
GTATGGTTTA 
GTATGGTTTA 
GTATGGTTTA 
GTATGGTTTA 
GTATGGTTTA 
GTATGGTTTA 
GTATGGTTTA 
GTATGGTTTA 
GTATGGTTTA 
GTATGGTTTA 



CCAGCCTTCC 
CCAGCCTTCC 
CCAGCCTTCC 
CCAGCCTTCC 
CCAGCCTTCC 
CCAGCCTTCC 
CCAGCCTTCC 
CCAGCCTTCC 
CCAGCCTTCC 
CCAGCCTTCC 
CCAGCCTTCC 



650 

CACTCTTATA 
CACTCTTATA 
CACTCTTATA 
CACTCTTATA 
CACTCTTATA 
CACTCTTATA 
CACTCTTATA 
CACTCTTATA 
CACTCTTATA 
CACTCTTATA 
CACTCTTATA 



msa286608.2{662_COHl} 



651 700 
TGAAGTTTCA ACAATTTCTA AAATCAGAGC AGGTTTTTCG TATGGACAAG 



1119 



WO 2004/018646 



PCT7US2003/026827 



Table 83: Comparative Sequences relating to SAG0108 



msa286608 . 2(662_M732 
msa286608 . 2 { 662_M78 1 , 
msa286608. 2(662 A909 
msa2 8 660 8 . 2 { 662~H3 6B 
msa28660B.2{662_090 
msa28 6608 . 2 ( 662 _CJB110 
msa286608 . 2 { 662_18RS21 
msa286608.2{662_2603 
msa286608 . 2 { 662_JM9130013 
msa28660B . 2 { 662_1169NT 
Consensus 



TGAAGTTTCA 
TGAAGTTTCA 
TGAAGTTTCA 
TGAAGTTTCA 
TGAAGTTTCA 
TGAAGTTTCA 
TGAAGTTTCA 
TGAAGTTTCA 
TGAAGTTTCA 
TGAAGTTTCA 



ACAATTTCTA 
ACAATTTCTA 
ACAATTTCTA 
ACAATTTCTA 
ACAATTTCTA 
ACAATTTCTA 
ACAATTTCTA 
ACAATTTCTA 
ACAATTTCTA 
ACAATTTCTA 



AAATCAGAGC 
AAATCAGAGC 
AAATCAGAGC 
AAATCAGAGC 
AAATCAGAGC 
AAATCAGAGC 
AAATCAGAGC 
AAATCAGAGC 
AAATCAGAGC 
AAATCAGAGC 



AGGTTTTTCG 
AGGTTTTTCG 
AGGTTTTTCG 
AGGTTTTTCG 
AGGTTTTTCG 
AGGTTTTTCG 
AGGTTTTTCG 
AGGTTTTTCG 
AGGTTTTTCG 
AGGTTTTTCG 



TATGGACAAG 
TATGGACAAG 
TATGGACAAG 
TATGGACAAG 
TATGGACAAG 
TATGGACAAG 
TATGGACAAG 
TATGGACAAG 
TATGGACAAG 
TATGGACAAG 



msa286608 . 2 I 662_C0H1 
tnsa286608 .2 <! 662J4732 
msa286608.2i662JM781 
msa286608 .2(662_A909 
msa286608 .2(662_H36B 
msa286608 . 2 { 662_090 
msa2 86608 ,2( 662_CJB110 
msa286608 . 2 { 662_18RS21 
msa286608 .2(662 2603 
msa28 6608 . 2 { 662_JM9130013 
tnsa286608 . 2 { 662_1169NT 
Consensus 



701 

CAAGTAGTGT 
CAAGTAGTGT 
CAAGTAGTGT 
CAAGTAGTGT 
CAAGTAGTGT 
CAAGTAGTGT 
CAAGTAGTGT 
CAAGTAGTGT 
CAAGTAGTGT 
CAAGTAGTGT 
CAAGTAGTGT 



cGAACAATTG 
CGAACAATTG 
CGAACAATTG 
CGAACAATTG 
CGAACAATTG 
CGAACAATTG 
CGAACAATTG 
CGAACAATTG 
CGAACAATTG 
CGAACAATTG 
aGAACAATTG 



AAAAAGAATA 
AAAAAGAATA 
AAAAAGAATA 
AAAAAGAATA 
AAAAAGAATA 
AAAAAGAATA 
AAAAAGAATA 
AAAAAGAATA 
AAAAAGAATA 
AAAAAGAATA 
AAAAAGAATA 



ATTTACCAGC 
ATTTA CCAGC 
ATTTACCAGC 
ATTTACCAGC 
ATTTACCAGC 
ATTT ACCAGC 
ATTTACCAGC 
ATTTACCAGC 
ATTTACCAGC 
ATTTACCAGC 
ATTTACCAGC 



750 

CCTCTTTATT 
CCTCTTTATT 
CCTCTTTATT 
CCTCTTTATT 
CCTCTTTATT 
CCTCTTTATT 
CCTCTTTATT 
CCT CTTTA TT 
CCTCTTTATT 
CCT CTTTA TT 
CCTCTTTATT 



msa286608.2i 662 COH1 
msa28 6608 ,2 662_M732 ' 
msa286608.2i 662 M781 
msa286608.2(662~A909' 
msa286608,2(662_H36B 
msa286608 .2{662_090 
msa286608 .2 { 662_CJB110 
msa2B6608 . 2 { 662_18RS21 
msa286608 .2(662 2603 
msa2 8 66 08 . 2{662_JM91 30 013 
msa286608 .2{662_1169NT 
Consensus 



751 

CATGGTGATA 
CATGGTGATA 
CATGGTGATA 
CATGGTGATA 
CATGGTGATA 
CATGGTGATA 
CATGGTGATA 
CATGGTGATA 
CATGGTGATA 
CATGGTGATA 
CATGGTGATA 
********** 



AGGATAATTT 
AGGATAATTT 
AGGATAATTT 
AGGATAATTT 
AGGATAATTT 
AGGATAATTT 
AGGATAATTT 
AGGATAATTT 
AGGATA ATTT 
AGGATAATTT 
AGGATAATTT 
********** 



TGTTCCAACA 
TGTTCCAACA 
TGTTCCAACA 
TGTTCCAACA 
TGTTCCAACA 
TGTTCCAACA 
TGTTCCAACA 
TGTTCCAACA 
TGTTCCAACA 
TGTTCCAACA 
TGTTCCAACA 
********** 



AGTATGGTTT 
AGTATGGTTT 
AGTATGGTTT 
AGTATGGTTT 
AGTATGGTTT 
AGTATGGTTT 
AGTATGGTTT 
AGTATGGTTT 
AGTATGGTTT 
AGTATGGTTT 
AGTATGGTTT 
********** 



800 

ATGACAACTA 

ATGACAACTA. 

ATGACAACTA 

ATGACAACTA 

ATGACAACTA 

ATGACAACTA 

ATGACAACTA 

ATGACAACTA 

ATGACAACTA 

ATGACAACTA 

ATGACAACTA 

********** 



msa286608.2 662_C0H1 
tnsa286608.2^ 662_M732' 
msa286608.2 662 M781 
maa286608.2 |662~A909 
tnsa286608 .2{662_H36B 
msa286608.2(662_090 
rasa286608 . 2 ( 662_CJB110 
msa286608 .2 { 662_1BRS21 
tnsa286608.2(662 2603 
msa2 86608 . 2 (662 JM9130013 
msa286608 . 2 (662_1169NT 
Consensus 



801 

TAAAGCTACA 
TAAAGCTACA 
TAAAGCTACA 
TAAAGCTACA 
TAAAGCTACA 
TAAAGCTACA 
TAAAGCTACA 
TAAAGCTACA 
TAAAGCTACA 
TAAAGCTACA 
TAAAGCTACA 



GCAGGTAAGA 
GCAGGTAAGA 
GCAGGTAAGA 
GCAGGTAAGA 
GCAGGTAAGA 
GCAGGTAAGA 
GCAGGTAAGA 
GCAGGTAAGA 
GCAGGTAAGA 
GCAGGTAAGA 
GCAGGTAAGA 



AAGAGCTTTA 
AAGAGCTTTA 
AAGAGCTTTA 
AAGAGCTTTA 
AAGAGCTTTA 
AAGAGCTTTA 
AAGAGCTTTA 
AAGAGCTTTA 
AAGAGCTTTA 
AAGAGCTTTA 
AAGAGCTTTA 



TATTGTAAAA 
TATTGTAAAA 
TATTGTAAAA 
TATTGTAAAA 
TATTGTAAAA 
TATTGTAAAA 
TATTGTAAAA 
TATTGTAAAA 
TATTGTAAAA 
TATTGTAAAA 
TATTGTAAAA 



850 

GGGGCAAAAC 
GGGGCAAAAC 
GGGGCAAAAC 
GGGGCAAAAC 
GGGGCAAAAC 
GGGGCAAAAC 
GGGGCAAAAC 
GGGGCAAAAC 
GGGGCAAAAC 
GGGGCAAAAC 
GGGGCAAAAC 



msa286608.2 662 COH1 
tnsa2B6608 . 2 662~M732 ' 
msa286608 .2 662~M781 ' 
msa286608.2 662~A909' 
msa286608 . 2 { 662_H36B 
msa286608.2(662_090 
msa286608 .2(662 CJB110 
msa2 86608 . 2{ 662_18RS21 
msa286608.2{662 2603 
msa286608 . 2 { 662_JM9130013 
msa286608.2{66?_1169NT 
Consensus 



851 

ATGCGAAATC 
ATGCGAAATC 
ATGCGAAATC 
ATGCGAAATC 
ATGCGAAATC 
ATGCGAAATC 
ATGCGAAATC 
ATGCGAAATC 
ATGCGAAATC 
ATGCGAAATC 
ATGCGAAATC 



TTTTG AAACA 
TTTTGAAACA 
TTTTGAAACA 
TTTTGAAACA 
TTTTGAAACA 
TTTTGAAACA 
TTTTGAAACA 
TTTTGAAACA 
TTTTGAAACA 
TTTTGAAACA 
TTTTGAAACA 



GAGCCAGAAA 
GAGCCAGAAA 
GAGCCAGAAA 
GAGCCAGAAA 
GAGCCAGAAA 
GAGCCAGAAA 
GAGCCAGAAA 
GAGCCAGAAA 
GAGCCAGAAA 
GAGCCAGAAA 
GAGCCAGAAA 



AATATGAGAA 
AATATGAGAA 
AATATGAGAA 
AATATGAGAA 
AATATGAGAA 
AATATGAGAA 
AATATGAGAA 
AATATGAGAA 
AATATGAGAA 
AATATGAGAA 
AATATGAGAA 



900 

ACGTATCTCT 
ACGTATCTCT 
ACGTATCTCT 
ACGTATCTCT 
ACGTATCTCT 
ACGTATCTCT 
ACGTATCTCT 
ACGTATCTCT 
ACGTATCTCT 
ACGTATCTCT 
ACGTATCTCT 



msa286608 . 2 { 662_C0H1 
tnsa286608.2 662_M732 
" tnsa286608.2 S62_M781 
msa286608 .2 662_A909 
msa286608.2{662_H36B 
msa286608 . 2 (662_090 
msa286608. 2(662 CJB110 
msa2 8 6608 . 2 { 6 62_1 8RS2 1 
msa286608. 2(662 2603 
msa286608 . 2 { 662_JM9130013 
msa2 86608 . 2 { 662_1169NT 
Consensus 



901 

AGTTTTTTGA 
AGTTTTTTGA 
AGTTTTTTGA 
AGTTTTTTGA 
AGTTTTTTGA 
AGTTTTTTGA 
AGTTTTTTGA 
AGTTTTTTGA 
AGTTTTTTGA 
AGTTTTTTGA 
AGTTTTTTGA 



AAAAATATGA 
AAAAATATGA 
AAAAATATGA 
AAAAATATGA 
AAAAATATGA 
AAAAATATGA 
AAAAATATGA 
AAAAATATGA 
AAAAATATGA 
AAAAATATGA 
AAAAATATGA 



924 
AAAA 
AAAA 
AAAA 
AAAA 
AAAA 
AAAA 
AAAA 
AAAA 
AAAA 
AAAA 
AAAA 



SBQ ZD NO. 8312 



1120 



WO 2004/018646 PCT/US2003/026827 
Table 83: Comparative Sequences relating to SAG0108 



STRAIN 2603 frame: 1 

MKKIRLSKFI KMIWILFLI SVAASFYFFHVAQVRDDKSFISNGQRKPGNSLYAYDKSFD 
KLLKQKI EMTNQNI KGVAWYVP AVKKTHKTAVVVHGFAN S KENMKAYGWL FHKLG YNVLM 
PDNIAHGESHGQLIGYGWNDRENI I KWTFJ4IVDKNPSSQITLFGVSMGGATVMMASGEKL 
PSQWNI IEDOTYSSVWDELKFQAKEMYGLPAFPLLYEVSTI SKI RAGFSYGQASSVEQL 
KKNNLPALF I HGDKDNFVPTSMVYDNYKATAGKKELY I VKGAKHAKS FETEP EKYEKR I S 
SFLKKYEK 

SBQ ID NO. 8313 
STRAIN 090 frame: 1 

AS FYFFHVAQVRDDKSFI SNGQRICPGNSLYAYDKS FDKLLKQKI EMTNQNI KQVAWYVPA 
AKKTHKTAVVVHG FANS KENMKAYG WLFHKLGYNVLMPDN I AHGESHGQL I GYGWNDREN 
1 1 KWTEMIVDKNPSSQITLFGVSMGGATVMMASGEKLPSQVVNI I EDCGYSSVWDELKFQ 
AKEMYGLPAF PLLYEVSTI S KI RAG FSYGQAS SVEQLKKNNLPALF I HGDKDNFVPTSMV 
YDNYKATAGKKELY I VKGAKHAKS FETEPEKYEKKISSFLKKYEK 

SBQ ZD NO. 8314 
STRAIN A909 frame: 3 

S F I SNGQRKPGNSLYAYDKS FDKLLKQKI EMTNQNI KQVAWYVPAAKKTHKTAVWHGFA 
NS KENMKAYGWL FHKLGYNVLM PDNIAHGESHGQLIGYGWNDRENI I KWTEM I VDKNSSS 
QITLFGVSMGGATVMMASGEKLPSQVVNI IEDCX5YSGVWDELKFQAKEMYGLPAFPLLYE 
VSTISKIRAGFSYGCASSVEQLKKNNLPALFIHGDKDNFVPTSMVYDNY^ 
VKGAKHAKS FETE PEKYEKRI SSFLKKYEK 

SBQ ZD NO. 8315 
STRAIN H36B frame: 1 

SFYFFHVAQVRDDKSF I SNGQRKPGNSLYAYDKSFDKLLKQKI EMTNQNI KQVAWYVPAA 
KKTHKTAVVVHG FANS KENMKAYG WLFHKLGYNVLMPDNI AHGESHGQL I GYGWNDREN I 

I KWTEM I VDKNS SS QI TLFGVSMGGATVMMASGEKLPSQVVN I 1 EDCGYSGVWDELKFQA 
KEMYGLP AF PLLYEVST I SKI RAGF8YGQASSVEQLKKNNLPALFIHGDKDNFVPTSMVY 
DNYKATAGKKELY I VKGAKHAKS FETE PEKYEKRI SSFLKKYEK 

SBQ ZD NO. 8316 
STRAIN 18RS21 frame: 1 

AS FYF FHVAQVRDDKS F I SNGQRKPGNSLYAYDKS FDKLLKQKI EMTNQN I KQVAWYVPA 
VKKTHKTAVVVHG FANS KENMKAYG WLFHKLG YNVLMPDNI AHGE SHGQL I G YG WNDREN 

I I KWTEMIVDKNPSSQITLFGVSMGGATVMMASGEKLPSQVVNI I EDCGYSSVWDELKFQ' 
AKEMYGLPAFPLLYEVSTI SKI RAG FSYGQAS SVEQLKKNNLPALFI HGDKDNFVPTSMV 
YDNYKATAGKKELY I VKGAKHAKS FETEPEKYEKRI SSFLKKYEK 

SBQ ZD NO. 8317 
STRAIN M732 frame: 1 

AS FYFFHVAQVRDDKSFI SNGQRKPGNSLYAYDKS FDKLLKQKI EMTNQNI KQVAWYVPA 
AKKTHKTVVVVHGFANS KENMKAYGWLFHKLG YNVLMPDN IAHGESHGQL I GYGWNDREN 
1 1 KWTEMIVDKNPSSQI TLFGVSMGGATVMMASGEKLPSQVVNI I EDCGYSSVWDELKFQ 
AKEMYGLPAFPLLYEVSTI SKI RAG FSYGQAS SVEQLKKNNLPALF I HGDKDNFVPTSMV 
YDNYKATAGKKELY I VKGAKHAKS FETEPEKYEKRI SSFIjKKYEK 

SBQ ZD NO. 8318 
STRAIN COH1 frame: 1 

AS FYFFHVAQVRDDKSFI SNGQRKPGNSLYAYDKS FDKLLKQKI EMTNQNI KQVAWYVPA 
AKKTHKTVVVVHGFANS KENMKAYGWLFHKLG YNVLMPDNIAHGESHGQLIGYGWNDREN 
I IKWTEMIVDKNPSSQITLFGVSMGGATVMMASGEKLPSQVVNI I EDCGYSSVWDELKFQ 
AKEMYGLPAFPLLYEVSTI SKI RAG FSYGQAS SVEQLKKNNLPALF IHGDKDNFVPTSMV 



SBQ ZD NO. 8319 
STRAIN M781 frame: 1 

AS FYFFHVAQVRDDKSFI SNGQRKPGNSLYAYDKS FDKLLKQKI EMTNQNI KQVAWYVPA 
AKKTHKTVVVVHGFANS KENMKAYG WLFHKLG YNVIj^ 

I IKWTEMIVDKNPSSQITLFGVSMGGATVMMASGEKLPSQVVNI I EDCGYSSVWDELKFQ 
AKEMYGLPAFPLLYEVSTI S KI RAGFSYGQASSVEQLKKNNL PALF IHGDKDNFVPTSMV 
YDNYKATAGKKELY I VKGAKHAKS FETEPEKYEKRI SSFLKKYEK 

SBQ ZD NO. 8320 
STRAIN CJB1 10 frame: 1 

AS FYFFHVAQVRDDKSFI SNGQRKPGNSLYAYDKS FDKLLKQKI EMTNQNI KQVAWYVPA 
AKKTHKTAVVVHGFANSKENMKAYGWLFHKLGYNVLM 

1 1 KWTEMIVDKNPSSQITLFGVSMGGATVMMASGBKLPSQVVNI I EDCGYSSVWDELKFQ 
AKEMYGLPAFPLLYEVSTI SKI RAGFSYGQAS SVEQLKKNNLPALF I HGDKDNFVPTSMV 



SBQ ZD NO. 8321 
STRAIN 1 !69NT frame: 1 

AS FYF FHVAQVRDDKS F I SNGQRKPGNSLYAYDKS FD KLLKQKI EMTNQN I KQVAWYVPA 
AKKTHKTAVVVHGFANS KENMKAYG WLFHKLGYNVL I PDNIAHGESHGQL I GYGWNDREN 
1 1 KWTEMIVDKNPSSQITLFGVSMGGATVMMASGEKLPSQVVNI I EDCGYSSVWDELKFQ 
AKEMYGLPAFPLLYEVSTI SKI RAGFSYGQAS SVEQLKKNNLPALF I HGDKDNFVPTSMV 
YDNYKATAGKKELY I VKGAKHAKS FETEPEKYEKRI SSFLKKYEK 

SEQ ZD NO. 8322 



1121 



WO 2004/018646 



PCT/US2003/026827 



Table 83: Comparative Sequences relating to SAG0108 



STRAIN JM9130013 frame: 1 

ASFY FFHVAQVRDDKSP I SNGQRKPGNSLYAYDKSFDKLLKQKI EMTNQN I KQVAWYVPA 
VKKTHKTAVWHGFANSKENMKAYGWLFHKLGYNVLMPDNIAHGE 

IIKWTEMIVDKNPSSQITLFGVSMGGATVMMASGEKLPSQVVNI I EDCGYSS VWDELKFQ 
AKEMYGLPAFPLLYEVSTISKI RAGFSYGQASSVEQLKKNNLPALFIHGDKDNFVPTSMV 
YDNYKATAGKKELYIVKGAKHAKSFETEPEKYEKRISSFLKKYEK 

PRETTY of: /biotmp/msa286876 . 2 { * } February 24, 2003 06:46 



msa286876. 2(662 A909 
msa286876 . 2 { 662~H36B 
rasa28 6876 . 2 { 662_C0H1 
msa286876 . 2 { 662_M732 
msa286876 . 2 ( 662J4781 
msa2868 76 . 2 { 662_18RS2 1 
msa286876.2{662_2603 
msa286876.2{662_JM9130013 
msa286876.2{662 090 
msa286876.2{662 CJB110 
msa286876 . 2 { 662~1169NT 
Consensus 



SF 

SFYFFH VAQVRDDKSF 

ASFYFFH VAQVRDDKSF 

ASFYFFH VAQVRDDKSF 

ASFYFFH VAQVRDDKSF 

ASFYFFH VAQVRDDKSF 

mkkirlskf i kmiwilfli svaASFYFFH VAQVRDDKSF 

ASFYFFH VAQVRDDKSF 

ASFYFFH VAQVRDDKSF 

ASFYFFH VAQVRDDKSF 

ASFYFFH VAQVRDDKSF 



50 

ISNGQRKPGN 
XSNGQRKPGN 
ISNGQRKPGN 
ISNGQRKPGN 
ISNGQRKPGN 
ISNGQRKPGN 
ISNGQRKPGN 
ISNGQRKPGN 
ISNGQRKPGN 
ISNGQRKPGN 



msa286876 . 2 ( 662_A909 
msa286876 . 2 { 662_H36B 
msa286876 . 2 662_C0H1 
rasa286876 . 2 1 662_M732 
msa28 6876. 2(662 M78l' 
msa2 8 68 7 6 . 2 { 66 2_1 BRS2 1 
msa2 8 68 7 6 . 2 { 66 2_2 6 0 3 
msa2 86876. 2 {662.JM913 0013 
msa286 87 6 . 2 { 662_090 
msa286876 . 2 { 662_CJB110 
msa286876 . 2 ( 662_1169NT 
Consensus 



51 

SLYAYDKSFD 
SLYAYDKSFD 
SLYAYDKSFD 
SLYAYDKSFD 
SLYAYDKSFD 
SLYAYDKSFD 
SLYAYDKSFD 
SLYAYDKSFD 
SLYAYDKSFD 
SLYAYDKSFD 
SLYAYDKSFD 



KLLKQKIBMT 
KLLKQKIEMT 
KLLKQKIBMT 
KLLKQKIEMT 
KLLKQKIEMT 
KLLKQKIEMT 
KLLKQKIEMT 
KLLKQKIEMT 
KLLKQKIEMT 
KLLKQKIEMT 
KLLKQKIEMT 



NQNIKQVAWY 
NQNIKQVAWY 
NQNIKQVAWY 
NQNIKQVAWY 
NQNIKQVAWY 
NQNIKQVAWY 
NQNIKQVAWY 
NQNIKQVAWY 
NQNIKQVAWY 
NQNIKQVAWY 
NQNIKQVAWY 



VPAaKKTHKT 
VPAaKKTHKT 
VPAaKKTHKT 
VPAaKKTHKT 
VPAaKKTHKT 
VPAVKKTHKT 
VPAvKKTHKT 
VPAvKKTHKT 
VPAaKKTHKT 
VPAaKKTHKT 
VPAaKKTHKT 



100 

aVWHGFANS 
aVWHGFANS 
vVWHGFANS 
vWVHGFANS 
VVWHGFANS 
aVWHGFANS 
aVWHGFANS 
aVWHGFANS 
aVWHGFANS 
aVWHGFANS 
aVWHGFANS 



msa286876.2f662_A909; 
rasa286876 . 2 f 662_H36B 
msa28 6876 . 2 - 662_C0H1 ' 
msa286876.2{662_M732 
msa286876 . 2 { 662_M781 
msa286876 . 2 { 662_18RS21 
msa286876 . 2{662_2603 
msa2 8 6876 .2{662_JM9 130013 
msa28 687 6 . 2 { 66 2_090 
msa286876 . 2 { 662_GIB110 
msa286876 . 2 { 662_1169NT 
Consensus 



101 

KENMKAYGWL 
KENMKAYGWL 
KENMKAYGWL 
KENMKAYGWL 
KENMKAYGWL 
KENMKAYGWL 
KENMKAYGWL 
KENMKAYGWL 
KENMKAYGWL 
KENMKAYGWL 
KENMKAYGWL 



FHKLGYNVLm 
FHKLGYNVLm 
FHKLGYNVLm 
FHKLGYNVLm 
FHKLGYNVLm 
FHKLGYNVLm 
FHKLGYNVLm 
FHKLGYNVLm 
FHKLGYNVLm 
FHKLGYNVLm 
FHKLGYNVLi 



PDNIAHGESH 
PDNIAHGESH 
PDNIAHGESH 
PDNIAHGESH 
PDNIAHGESH 
PDNIAHGESH 
PDNIAHGESH 
PDNIAHGESH 
PDNIAHGESH 
PDNIAHGESH 
PDNIAHGESH 



GQLIGYGWND 
GQLIGYGWND 
GQLIGYGWND 
GQLIGYGWND 
GQLIGYGWND 
GQLIGYGWND 
GQLIGYGWND 
GQLIGYGWND 
GQLIGYGWND 
GQLIGYGWND 
GQLIGYGWND 



150 

RBNIIKWTEM 
RENIIKWTEM 
RENIIKWTEM 
RENIIKWTEM 
RENIIKWTEM 
RENIIKWTEM 
RENIIKWTEM 
RENIIKWTEM 
RENIIKWTEM 
RENIIKWTEM 
RENIIKWTEM 



msa286876.2< 662_A909 
msa286876 .2 662_H36B 
msa28 6876 . 2 / 662_C0H1 ( 
msa286876.2 662 M732| 
msa28 6876 . 2 { 662~M78 1 ' 
msa286876.2{662_18RS21 
msa286876 . 2 { 662_2603 
msa286876.2{662_JM9130013 
msa286876.2{662_090 
msa286876.2(662 CJB110 
msa286876 . 2 (662_1169NT 
Consensus 



151 

IVDKNBSSQI 
IVDKNsSSQI 
IVDKNpSSQI 
IVDKNpSSQI 
IVDKNpSSQI 
IVDKNpSSQI 
IVDKNpSSQI 
IVDKNpSSQI 
IVDKNpSSQI 
IVDKNpSSQI 
IVDKNpSSQI 
*****_**** 



TLFGVSMGGA 
TLFGVSMGGA 
TLFGVSMGGA 
TLFGVSMGGA 
TLFGVSMGGA 
TLFGVSMGGA 
TLFGVSMGGA 
TLFGVSMGGA 
TLFGVSMGGA 
TLFGVSMGGA 
TLFGVSMGGA 
********** 



TVMMASGEKL 
TVMMASGEKL 
TVMMASGEKL 
TVMMASGEKL 
TVMMASGEKL 
TVMMASGEKL 
TVMMASGEKL 
TVMMASGEKL 
TVMMASGEKL 
TVMMASGEKL 
TVMMASGEKL 



PSQWNIIED 
PSQWNIIED 
PSQWNIIED 
PSQWNIIED 
PSQWNIIED 
PSQWNIIED 
PSQWNIIED 
PSQWNIIED 
PSQWNIIED 
PSQWNIIED 
PSQWNIIED 



200 

CGYSgVWDEL 
CGYSgVWDEL 
CGYSsVWDEL 
CGYSsVWDEL 
CGYSsVWDEL 
CGYSsVWDEL 
CGYSsVWDEL 
CGYSsVWDEL 
CGYSsVWDEL 
CGYSsVWDEL 
CGYSsVWDEL 



********** ********** ****_***** 



msa286876 . 2 ( 662_A909 
msa2868 76 . 2( 662_H36B 
msa286876.2 662 COH1 
msa286876.2< 662~M732 
msa286876 . 2 { 662~M781 
msa286876 .2 {662_18RS21 
msa286876. 2(662 2603 
msa286876 . 2 { 662_JM9130013 
msa286876.2{662_090 
msa286876 . 2 { 662_CJB110 
msa286876.2{662_1169NT 
Consensus 



201 

KFQAKEMYGL 
KFQAKEMYGL 
KFQAKEMYGL 
KFQAKEMYGL 
KFQAKEMYGL 
KFQAKEMYGL 
KFQAKEMYGL 
KFQAKEMYGL 
KFQAKEMYGL 
KFQAKEMYGL 
KFQAKEMYGL 



PAFPLLYEVS 
PAFPLLYEVS 
PAFPLLYEVS 
PAFPLLYEVS 
PAFPLLYEVS 
PAFPLLYEVS 
PAFPLLYEVS 
PAFPLLYEVS 
PAFPLLYEVS 
PAFPLLYEVS 
PAFPLLYEVS 



TXSKIRAGFS 
TISKIRAGFS 
TISKIRAGFS 
TISKIRAGFS 
TISKIRAGFS 
TISKIRAGFS 
TISKIRAGFS 
TISKIRAGFS 
TISKIRAGFS 
TISKIRAGFS 
TISKIRAGFS 



YGQASSVEQL 
YGQASSVEQL 
YGQASSVEQL 
YGQASSVEQL 
YGQASSVEQL 
YGQASSVEQL 
YGQASSVEQL 
YGQASSVEQL 
YGQASSVEQL 
YGQASSVEQL 
YGQASSVEQL 



250 

KKNNLPALFI 
KKNNLPAL.FI 
KKNNLPALFI 
KKNNLPALFI 
KKNNLPALFI 
KKNNLPALFI 
KKNNLPALFI 
KKNNLPALFI 
KKNNLPALFI 
KKNNLPALFI 
KKNNLPALFI 



msa286876 
msa286876 
msa286876 



251 300 
_A909) HGDKDNFVPT SMVYDNYKAT AGKKELYIVK GAKHAKSFET EPEKYEKRIS 
H36B) HGDKDNFVPT SMVYDNYKAT AGKKELYIVK GAKHAKSFET EPEKYEKRIS 
COHl) HGDKDNFVPT SMVYDNYKAT AGKKELYIVK GAKHAKSFET EPEKYEKRIS 
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Table 83: Comparative Sequences relating to SAG0108 



msa286876.2(662_M732 
msa286876 . 2 (662_M781 
msa286876.2{662 18RS21 
tnsa286876.2{662 2603 
tnaa286876.2{662 JM9130013 
msa28687672{662_090 
msa286876.2f662_CJB110 
msa2 86876 . 2 { 662_1169NT 
Consensus 



HGDKDNFVPT 
HGDKDNFVPT 
HGDKDNFVPT 
HGDKDNFVPT 
HGDKDNFVPT 
HGDKDNFVPT 
HGDKDNFVPT 
HGDKDNFVPT 



SMVYDNYKAT 
SMVYDNYKAT 
SMVYDNYKAT 
SMVYDNYKAT 
SMVYDNYKAT 
SMVYDNYKAT 
SMVYDNYKAT 
SMVYDNYKAT 



AGKKELYIVK 
AGKKELYIVK 
AGKKELYIVK 
AGKKELYIVK- 
AGKKELYIVK 
AGKKELYIVK 
AGKKELYIVK 
AGKKELYIVK 



GAKHAKSFET 
GAKHAKSFET 
GAKHAKSFET 
GAKHAKSFET 
GAKHAKSFET 
GAKHAKSFET 
GAKHAKSFET 
GAKHAKSFET 



EPEKYEKRIS 
EPEKYEKRIS 
EPEKYEKRIS 
EPEKYEKRIS 
EPEKYEKRIS 
EPEKYEKRIS 
EPEKYEKRIS 
EPEKYEKRIS 



msa286876.2(662_A909 
msa286876.2 662_H36B 
msa286876.2 662_COHl 
msa286876 . 2 66 2_M7 3 2 
rasa28 6876 . 2 { 662J4781 
msa286876 . 2 { 662_18RS21 
msa286876 . 2 { 662_2603 
msa2 8 6876 . 2 {66 2_JM9 13 0013 
msa286876.2{662_090 
msa286876.2{662_CJB110 
msa286876.2{662_1169NT 
Consensus 



301 

SFLKKYEK 
SFLKKYEK 
SFLKKYEK 
SFLKKYEK 
SFLKKYEK 
SFLKKYEK 
SFLKKYEK 
SFLKKYEK 
SFLKKYEK 
SFLKKYEK 
SFLKKYEK 
******** 
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Table 84: Comparative Sequences relating to SAG0267 



SEQ ZD MO. 8401 
STRAIN 2603 

ATGATGAAAGTTTTAGCCTTTGATACTTCAAGCAAA^ 

AATATGGAATGTTTAGCGACTGTCACTATCAATATCAAAAAQAATC^ 

ATGCCAGCCATTGATTTTTTAATGCAA 

ATCGTAGTAGCAGAGGGTCCAGGATCTTATACGGGCTTACGTGTAGC^ 
AAAATGCTAG CITATACGCTTAAGATTGACTTAGTTGGAGTATCTAG CCTGTACG CTTTA 
ACAAATGGATTTTCAGAAAATGATTTATTGGTACCACITATAGA 

GTTTATGTTGGTTTCTATCAAAATGGTGATACTGTTAAAC CAGACTGTCACACTTCTCTT 
GAAGAAGTCTTACAAGAGGTGGGGAATAAAG CCAATGTTCATTTTGTCGGAGAGGTTGCA 
GCATTTITTGATCAGATTAAGAAAGCCITACCACATGCTA 

TGTG CAGTAGCAATTGGG CG CAAAGGACAAAAAATGAAAAG CGTTAATGTAGATGCGTTT 
GTTCCACGATACTTAAAACGTGTTGAAG CTGAGGAAAATTGGTTAA7UWVCCACTGTGAA 
ACGAATACAGAAGAATATATTAAGAGAGTT 

SBQ XD NO. 8402 
STRAIN 090 

AAAGTTTTAG CCT'ITGATACTTCAAGCAAAGCACTATCAGTGGCTGTACT 

AAACAATATGGAATGTTTAGCGACTGTCACTaTCAATATCA 

ATAGCATTAATTTGATGCCAGCCATTGATTT^ 

TTAGAACCTCAAGATTTGGACCGTATCGTAGTGGGAGAGGGTCCAG 

TTATACXXjKSCTTACGTGTAGCTGTTGCTACAGCAAA 

CX3CTTAAGATTGACTTAGTTGGAGTATCT 

GGATTTTCAGAAAATGATTTGTTGCTACCA 

CAATGTTTATGTTGGTTTCTATCAAAATGGTGA^ 

GTCAC ACTT CTCTTGAAGAAGTCTTA 

GTTCATTTTGTCGGAGAGGTTG CAGCATTTTTTGATCAGATTAAgAAAGC 

CTTACCACATGCTAAAATTACAGAAACTTTACCTTGTGCAGTGGCAATTG 

GGCX3CAAAGGACAAAAAATGGAAAGCX»TTAATGTAG^ 

CGATACTTAAAACXSAGTTGAAGCTGAGGAAAATTGGTTAAAA 

TGAAACGAAT 

SEQ ID NO. 8403 
STRAIN A909 

AAAGTTTTAGCCTTTGATACTTCAAGCAAAGCACTATCAG 

TGGCTGTACTAAACAATATGGAATGTTTAGCGACTGTCACT 

AAAAAGAATCATAGCATTAATTTGATGCCAGCCATTGATT^ 

ATCAATTGATTTAGAACCTCAAGATTTGGACXGTATCGTAOT 

GT(X! AGG ATCTTATAa3GGCTTACXnX3TAGCTGTTO 

CTAGCITATACGCTTAAGATTGACTTAGTTGGAGTATCT 

TTTAACAAATGGATTTTCAGAAAATGATTTATTGGTA 

CACX^CGTAACAATGTrTATGTTGGTTTCTATCA^ 

AAACCAGACTGTCACACTTCTCITGAAGAAGTCTT 

TAAAGCC^ATGTTCATTTTGTCGGAgAGGTTG 

tTAAgAAAGl - lUTACCACATGCTAAAATTACAGAAACTi"iACCTTGTGCA 
GtGGCAATTGGGCGCAAAGGACAAAAAATGAAAAGCGTTAATGTAGATGC 
GTTTGTTCCACGATACTTAAAACGTGTTGAAGCrGAGG^ 
GAAACCACTGTGAAACGAAT 

SEQ ID NO. 8404 
STRAIN H36B 

AAAG AG CC'ii'iGATACTTCAAGCAAAGCACTATCA 
GTGGCTGTACTAAACyVATATGGAATGTTTAGCGAC^^ 
CAAAAAGAATCATAGCATTAATTTGATGCCAGCCATTGA1 
AATCyVATTGATTTAGAACCTCAAGATTTGGA 

GGTCCAGGATCTTATACGGG CTTACGTGTAGCTGTTGCTACAGCAAAAAT 

GCTAGCTTATACGCTTAAGATTGACTTAGTTGGA 

CTTTAACAAATGGATTTTCAGAAAATGATT 

GCACGACGTAACAATGTTTATGTTGGTTTCT^ 

TAAACCAGACrGTCACACTTCTCTTGAAG 

ATAAAGCCAATGTTCATTTTGTCGGAGAGGTTGC^^ 

ATTAAGAAAGTTTTACCACATGCTAAAATTACAGAAACTTT 

AGTGGCAATTGGGCGCAAAGGACAAAAAATGAAAAGCGTTAATGTAGATG 

CGTTTGTTCCACGATACrTAAAACGTGTTGAAGCTGAGG^ 

AGAAACCACTGTGAAACGAATACAGAAGAATATATTAAGAGAGTT 

SBQ ID NO. 8405 
STRAIN 18RS21 

AAAGTTTTAGCCTTTGATACTTCAAG CAAAGCACTATCA 
GTGGCTGTACTAAACAATATGGAATGTTTAGCGACTGTCACT 
CAAAAAGAATCATAG CATTAATTTGATG CCAG CCATTGATTTTTTAATG C 

GGTCCAGGATCTTATACGGG CTTACGTGTAGCTGTTGCT 

GCTAGCITATAC<5CTTAAGATTGACTTAGTT<^ 

CTTTAACAAATGGATTTTCAGAAAATGATTTAT^ 

GCACGACGTAATAATGTTTATGTTGGTTTCTATC 

TAAACCAGACTGTCACACTTCTCT^ 

ATAAAGCCAATGTTCATTTTGTCGGAGAGG tTGCAGCATTTTTTGATCAg 
ATTAAgAAAGCCTTACCACATG CTAAAATTACAGAAACTTTACCTTGTGC 
AGTAGCAATTGGGCGCAAAGGACAAAAAATGAAAAGCGTrAA 
CXnTTGTTCCACGATACTTAAAACOTGTTC 

AAAAACCACTGTGAAACGAATACAGAAGAATATATTAAGAGAGTT 
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Table 84: Comparative Sequences relating to SAG0267 



SEQ ID NO. 8406 
STRAIN M732 

AAAGTTTTAGCCTTTGATACTTCAAGCAAAGCACTATCA 

GTGGCTGTACTAAACAATATGGAATGTTTAGCGACTGTCACT 

CAAAAAGAATCATAGCATTAATITGATGCCAGCCATTGAl"l'rrrrAATGC 

AATCAATTGATTTAGAACCTCAAGATTTGGACCGTAT^ 

GGTCCAGGATCTTATACGGG CTTACGTGT AGCTGTTG CT ACAGCAAAAAT 

GCTAGCrTATACGCTTAAGATrcACTTAGTTGGAGTATCTAG CCTGTACG 

CTITAACAAATGGATTTTCAGAAAATGATT^ 

GCACGACCTAACAATGTTTATGTTGGTTT 

TAAACCAGACTGTCACACTTCTCTTGAAGAAGTCTT 

ATAAAGCCAATGTTCATTTTGTCGGAGAGGTTGCAGCA1 

ATTAAGAAAGCCTTACCACATGCTAAAATTACAGAAACTT^ 

AGTAGCAATTGGGCGCAAAGGACAAAAAATGAAAAGCGTTAATGTAGAnn 

CGTTTGTTCCACGATACTTAAAACGTGTTGAAGCTGAGGAAA^ 

AAAAACCACTGTGAAACGAATACAGAAGAATATATTAAGAGAGTT 

SEQ ID NO. 8407 
STR AIN CO H1 

AAAGTTTTAGCCTTTGATACTTCAAGCAAAGCAC 
TATCAGTGGCIXjrACTAAACAAT^TGGAATGTTTAGCG^ 
AATATCAAAAAGAATCATAGCATTAATTTGATGCCAGCCATTGAT^ 
AATGCAATCAATTGATTTAGAACCTCAAGATTT 

CAGAGGGTCCAGGATCTTATACGGG CrTACGTGTAGCTGTTGCTACAGCA 

AAAATGCTAGCTTATACGCTTAAGATTGACTTAGTTGGAGTATCTAG 

GTACGC7Tl'AACAAATGGA'i-i-i-rCAGAAAATGATTTATTGGTACCACTTA 

TAGATGCACGACGTAACAATGTTTATGTTGGTTT CTATCAAAATGGTGAT 

ACTGTTAAACCAGACTGTCACACTTCTCTTGAAGAAGTCTT^ 

GGGGAATAAAGCOVATGTTCATTTTGTCGGAGAGGTTGCAGC^ 

ATCAGATTAAGAAAG CCTTACGACATGCTAAAATTACAGAAACTTTACCT 

TGTGCAGTAGCAATTGGGCGCAAAGGACAAAAAATGAAAAG CGTTAATGT 

AGATGCXSTTTGTTCCACGATACTTAAAACGTGTTGAAGCT^^ 

GGTTAAAAAACCACTGTG^W\CGAATACAGAAGAATATATTAAGAGAGTT 

SEQ XD NO. 8408 
STR AIN M7 8 1 

AAAGTTTTAGCCTTTGATACTTCAAGCAAAGGACTA 

TCAGTGGCTGTACTAAACAATATGGAATGTTTAGCGACTGTCACT 

TATCAAAAAGAATCATAGCATTAATTTGATGCCAG CCATTGATTTTTTAA 

TGCAATCAATTGATTTAGAACCTCAAGATTTGGACCX3 

GAGGGTCCAGGATCTTATACXXX3CTTACGTGTAGCTGTTGCT 

AATG CTAGCTTAT ACGCTTAAGATTGACTT AGTTGGAGT ATCTAG CCTGT 

ACGCTTTAACAAATGGATTTTCAGAAAATGATTTATTG 

GATGCACGACGTAACAATGTTTATGTTGGTTTCTATCAAAATGGTGA 

TGTTAAACCAGACTGTCACACTTCTCrTG 

GGAATAAAGCCAATGTTCATTTTGTCX3GAGAGGTTGCAG CATTTTTTGAT 
CAGATTAAGAAAGCCTTACCACATGCTAAAATTACAG 
TGCAGTAGCAATtGGG CXX!AAAGGACAAAAAATGAAAAGCGTTAATGTAG 
ATGCGTTTGTTCCACGATACTTAAAACGTK3TTGAAG 
TTAAAAAACCACTOTGAAACGAATACAGAAGAATATATTAAGAGAGTT 

SEQ ID HO. 8409 
STRAIN CJB1 10 

AAAGTTTTAG CCTTTGATACTTCAAGCAAAG CACTATCA 

GTGGCTG t aCTAAACAATATGGAATGTTTAGCGACTGTCACTATCAATAT 

CAAAAAGAATCATAGCATTAATTTGATGCCAGCCAT7n3A 

AATCAATTGATTTAGAACCTCAAGATTTGGACCGTAT 

GGTCCAGGATCTTATACX3GGCTTACGTGTAGCTGTTGCTACAGCAA 

GCTAGCTTATACXXrrTAAGATTGACTTAGTTGGAGTATCrA 

CTTTAACAAATGGATTTTCAGAAAATGA1TTG 

GCACGACGTAACAATGTTTATGTTGGTTTCTATCAAA^ 

TAAACCAGACTGTCACACT1CTCTTGAAGAAGTCTTAC 

ATAAAGCCAATGTTCATTITGTCGGAGAGGTTG CAGCATTTTTt gATCAG 

ATTAAGAAAGCCTTACCACATGCTAAAATTACAGAAACTT^ 

AGTGGCAATTGGGCGCAAAGGACAAAAAATGGAAAGCGTTAATGTAgA 

CXjTTTGTTCCACGATACTTAAAACGAGTTGAAG 

AAAAACCACTGTGAAACGAATACAGAAGAATATATTAAGAGAGTT 

SEQ XD NO. 8410 
STRAIN 1169NT 

AAAGTTTTAGCCTTTGATACTTCAAGCAAAGCACTATCA 

GTGGCTGTACTAAACAATATGGAATGTTTAGCXjACTGTC^ 

CAAAAAGAATCATAGCATTAATTTGATGCCAGCCaTTGATTTT^ 

AATCAATTGATTTAGAACCTCAAGATITGGACCGTAT^ 

GGTCCAGGATCTTATACGGGCTTACGTGTAGCTGTTGCTACAG 

GCTAGCTTATACGCTTAAGATTGACTTAGTTGGAGTATCTAGCCTOT 

CTTTAACAAATGGATTTTC^GAAAATGATTTATTGGTACC^ 

GCACGACGTAACAATGTTTATGTTGGTTTCTATCAAAATG 

TAAACCAGAGTGTCACACriTCrCTTGAAGAAGTCTT 

ATTAAGAAAGCTTTACCACAtGCTAAAATTACAGAAACTTT 
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Table 84: Comparative Sequences relating to SAG0267 



AGTGGCAATTGGGCXSCA^GGACAAAAAATGGAAAGCGTTAATGTAgATG 
CGTTTCTTCCACGATACTTAAAACCT^ 

AAAAACCACTGTGAAACGAATACAGAAGAATATATTAAGAGAGTT 

SEQ ID NO.' 8411 
STR AIN JM 913 0013 

AAAGTTTTAGCCTTTGATACTTCAAGCAAAGCACTATCA 

GTGGCTGTACTAAACAATATGGAATGTTTAGCGA<^^ 

CAAAAAGAATCATAGCATTAATTTGATGCCAGCC^^ 

AATGAATTGATTTAGAACCTCAAGATTTGGACC 

GGTCCAGGATCTTATACGGGCTTAOTICTAGCT^ 

gCTAGCTTATACGCTTAAGATTGACTTAGTTGGAGTATCTAGCCTGTACG 

GTTTAACAAATGGATTTTCAGAAAATGATTTATT^ 

GCACGACXJTAACAATGTTTATGTTGGTTTCTATCAAAATGGAGATACTC 

TAAACC^GACTGTCACACTTCTCTTGAAGAAGTCTTAGAAGAGGTGGGGA 

ATAAAGCCAATGTTCATi"lUGTCGGAGAGGTTGCAGCAl - riX3"l'IXSACCAG 

ATTAAGAAAGTTTTACCACATGCTAAAATTAC^GAAACrTTACCTTGTG 

AGTGGCAATTGGGCGCAAAGGACAAAAAATGAAAAGCGTTAATGTAGATG 

CGTTTGTTCCACGAT ACTTAAAACGTGTTGAAG CTGAGGAAAATTGGTTA 

AGAAACCACTGTGAAACGAATACAGAAGAATATATTAAGAGAGTT 



PRETTY Of: /biotmp/rasaS21675 . 2{ *} March 10, 2003 08t34 



msa521675.2{69_A909 
msa521675.2{69 H36B 
msa521675.2{69 JM9130013 
msa521675.2l69 1169NT 
msa521675 .2TS9_090 
msa521675 . 2 { 69_CJB110 
msa521675 . 2 {69_18RS21 
rasaS21675.2{69_2603 
msa52167S . 2 { 69_C0H1 
tnsa521675 . 2 { 69JM732 
rasa521675.2{69 > _M7Bl 
Consensus 



1 50 

AAAG TTTTAGCCTT TGATACTTCA AGCAAAGCAC TATCAGTGGC 

AAAG TTTTAGCCTT TGATACTTCA AGCAAAGCAC TATCAGTGGC 

AAAG TTTTA GCCTT TGATACTTCA AGCAAAGCAC TATCAGTGGC 

AAAG TTTTAGCCTT TGATACTTCA AGCAAAGCAC TATCAGTGGC 

AAAG TTTTAGCCTT TGATACTTCA AGCAAAGCAC TATCAGTGGC 

AAAG TTTTAGCCTT TGATACTTCA AGCAAAGCAC TATCAGTGGC 

AAAG TTTTAGCCTT TGATACTTCA AGCAAAGCAC TATCAGTGGC 

atgatgAAAG TTTTAGCCTT TGATACTTCA AGCAAAGCAC TATCAGTGGC 

AAAG TTTTAGCCTT TGATACTTCA AGCAAAGCAC TATCAGTGGC 

AAAG TTTTAGCCTT TGATACTTCA AGCAAAGCAC TATCAGTGGC 

AAAG TTTTAGCCTT TGATACTTCA AGCAAAGCAC TATCAGTGGC 



ms a52 167 5 . 2 { 69_A9 0 9 
msaS2 1675 . 2 { 69_H3 6B 
msa521675.2{69 JM9130013 
msa521675.2T69 1169NT 
msa521675.2X69 090 
msa521675 . 2 ( 69_CJB110 
msa521675.2(69 18RS21 



msa521675.2 
msa521675.2 
msaS21675-2 
msa521675.2 



69_2603 
69_C0H1 
69_M732 
69J4781 
Consensus 



51 

TGTACTAAAC 
TGTACTAAAC 
TGTACTAAAC 
TGTACTAAAC 
TGTACTAAAC 
TGTACTAAAC 
TGTACTAAAC 
TGTACTAAAC 
TGTACTAAAC 
TGTACTAAAC 
TGTACTAAAC 



AATATGGAAT 
AATATGGAAT 
AATATGGAAT 
AATATGGAAT 
AATATGGAAT 
AATATGGAAT 
AATATGGAAT 
AATATGGAAT 
AATATGGAAT 
AATATGGAAT 
AATATGGAAT 



GTTTAGCGAC 
GTTTAGCGAC 
GTTTAGCGAC 
GTTTAGCGAC 
GTTTAGCGAC 
GTTTAGCGAC 
GTTTAGCGAC 
GTTTAGCGAC 
GTTTAGCGAC 
GTTTAGCGAC 
GTTTAGCGAC 



TGTCACTATC 
TGTCACTATC 
TGTCACTATC 
TGTCACTATC 
TGTCACTATC 
TGTCACTATC 
TGTCACTATC 
TGTCACTATC 
TGTCACTATC 
TGTCACTATC 
TGTCACTATC 



100 

AATATCAAAA 
AATATCAAAA 
AATATCAAAA 
AATATCAAAA 
AATATCAAAA 
AATATCAAAA 
AATATCAAAA 
AATATCAAAA 
AATATCAAAA 
AATATCAAAA 
AATATCAAAA 



msa521675.2{69_A909 
msa521675 . 2{ 69__H36B 
msa521675.2{69 JM9130013 
mea521675.2T69 1169NT 
rasa521675.2 7 i 69_090 
msa521675 . 2 { 69_CJB110 
msa521675 . 2 { 69_18RS21 
msa521675.2{69 2603 
msa5 2 16 7 5 . 2 1 69~COHl 
msa521675 . 2 f 69_M732 
msa521675 . 2 { 69_M781 
Consensus 



101 

AGAATCATAG 
AGAATCATAG 
AGAATCATAG 
AGAATCATAG 
AGAATCATAG 
AGAATCATAG 
AGAATCATAG 
AGAATCATAG 
AGAATCATAG 
AGAATCATAG 
AGAATCATAG 



CATTAATTTG 
CATTAATTTG 
CATTAATTTG 
CATTAATTTG 
CATTAATTTG 
CATTAATTTG 
CATTAATTTG 
CATTAATTTG 
CATTAATTTG 
CATTAATTTG 
CATTAATTTG 



ATGCCAGCCA 
ATGCCAGCCA 
ATGCCAGCCA 
ATGCCAGCCA 
ATGCCAGCCA 
ATGCCAGCCA 
ATGCCAGCCA 
ATGCCAGCCA 
ATGCCAGCCA 
ATGCCAGCCA 
ATGCCAGCCA 



TTGATTTTTT 
TTGATTTTTT 
TTGATTTTTT 
TTGATTTTTT 
TTGATTTTTT 
TTGATTTTTT 
TTGATTTTTT 
TTGATTTTTT 
TTGATTTTTT 
TTGATTTTTT 
TTGATTTTTT 



150 

AATGCAATCA 
AATGCAATCA 
AATGCAATCA 
AATGCAATCA 
AATGCAATCA 
AATGCAATCA 
AATGCAATCA 
AATGCAATCA 
AATGCAATCA 
AATGCAATCA 
AATGCAATCA 



msa521675 . 2( 69_A909 
msa521675 . 2 { 69_H3 6B 
msa521675.2{69 JM9130013 
msa521675.2X69 1169NT 
msaS21675.2T69_090 
msa521675.2{69 CJB110 
msa521675 . 2 { 69_1BRS21 



msa521675.2 
msa521675.2 
msa521675.2 
msa521675.2 



69 2603 
69~C0H1 
69~M732 
69_M781 
Consensus 



151 

ATTGATTTAG 
ATTGATTTAG 
ATTGATTTAG 
ATTGATTTAG 
ATTGATTTAG 
ATTGATTTAG 
ATTGATTTAG 
ATTGATTTAG 
ATTGATTTAG 
ATTGATTTAG 
ATTGATTTAG 



AACCTCAAGA 
AACCTCAAGA 
AACCTCAAGA 
AACCTCAAGA 
AACCTCAAGA 
AACCTCAAGA 
AACCTCAAGA 
AACCTCAAGA 
AACCTCAAGA 
AACCTCAAGA 
AACCTCAAGA 



TTTGGACCGT 
TTTGGACCGT 
TTTGGACCGT 
TTTGGACCGT 
TTTGGACCGT 
TTTGGACCGT 
TTTGGACCGT 
TTTGGACCGT 
TTTGGACCGT 
TTTGGACCGT 
TTTGGACCGT 



ATCGTAGTag 
ATCGTAGTag 
ATCGTAGTag 
ATCGTAGTag 
ATCGTAGTgg 
ATCGTAGTgg 
ATCGTAGTag 
ATCGTAGTag 
ATCGTAGTag 
ATCGTAGTag 
ATCGTAGTat 



200 

CAGAGGGTCC 
CAGAGGGTCC 
CAGAGGGTCC 
CAGAGGGTCC 
CAGAGGGTCC 
CAGAGGGTCC 
CAGAGGGTCC 
CAGAGGGTCC 
CAGAGGGTCC 
CAGAGGGTCC 
CAGAGGGTCC 



msa52 167 5 . 2 { 69_A909 J 
msa521675 . 2{ 69_H36B} 



201 250 
AGGATCTTAT ACGGG CTTA C GTGTAGCTGT TGCTACAGCA AAAATGCTAG 
AGGATCTTAT ACGGGCTTAC GTGTAGCTGT TGCTACAGCA AAAATGCTAG 
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Table 84: Comparative Sequences relating t SAG0267 



msa521675.2{69 JM9130013 
msa521675.2X69 1169NT 
msaS21675 . 2T69_090 
mea521675 . 2 { 69_CJB110 
msa521675 . 2 { 69_18RS21 



msa521675.2 
maa521675.2 
msa521675.2 
msa521675.2 



69_2603 
69_COHl 
69_M732 
69__M781 
Consensus 



AGGATCTTAT 
AGGATCTTAT 
AGGATCTTAT 
AGGATCTTAT 
AGGATCTTAT 
AGGATCTTAT 
AGGATCTTAT 
AGGATCTTAT 
AGGATCTTAT 



ACGGGCTTAC 
ACGGGCTTAC 
ACGGGCTTAC 
ACGGGCTTAC 
ACGGGCTTAC 
ACGGGCTTAC 
ACGGGCTTAC 
ACGGGCTTAC 
ACGGGCTTAC 



GTGTAGCTGT 
GTGTAGCTGT 
GTGTAGCTGT 
GTGTAGCTGT 
GTGTAGCTGT 
GTGTAGCTGT 
GTGTAGCTGT 
GTGTAGCTGT 
GTGTAGCTGT 



TGCTACAGCA 
TGCTACAGCA 
TGCTACAGCA 
TGCTACAGCA 
TGCTACAGCA 
TGCTACAGCA 
TGCTACAGCA 
TGCTACAGCA 
TGCTACAGCA 



AAAATGCTAG 
AAAATGCTAG 
AAAATGCTAG 
AAAATGCTAG 
AAAATGCTAG 
AAAATGCTAG 
AAAATGCTAG 
AAAATGCTAG 
AAAATGCTAG 



msa521675.2{69 A909 
tnsa52167S . 2 { 69_H3 6B 
msa52l675.2{69 JM9130013 
maa521675.2T69 1169NT 
rasa521675 . 2l69_090 
msa521675 . 2 { 69_CJB110 
msa521675 . 2 { 69_18RS2 1 



msa521675.2 
msa521675.2 
msa521675.2 
msa521675.2 



69 2603 
69~COHl 
69 M732 
69~M781 
Consensus 



251 

CTTATACGCT 
CTTATACGCT 
CTTATACGCT 
CTTATACGCT 
CTTATACGCT 
CTTATACGCT 
CTTATACGCT 
CTTATACGCT 
CTTATACGCT 
CTTATACGCT 
CTTATACGCT 



TAAGATTGAC 
TAAGATTGAC 
TAAGATTGAC 
TAAGATTGAC 
TAAGATTGAC 
TAAGATTGAC 
TAAGATTGAC 
TAAGATTGAC 
TAAGATTGAC 
TAAGATTGAC 
TAAGATTGAC 



TTAGTTGGAG 
TTAGTTGGAG 
TTAGTTGGAG 
TTAGTTGGAG 
TTAGTTGGAG 
TTAGTTGGAG 
TTAGTTGGAG 
TTAGTTGGAG 
TTAGTTGGAG 
TTAGTTGGAG 
TTAGTTGGAG 



TATCTAGCCT 
TATCTAGCCT 
TATCTAGCCT 
TATCTAGCCT 
TATCTAGCCT 
TATCTAGCCT 
TATCTAGCCT 
TATCTAGCCT 
TATCTAGCCT 
TATCTAGCCT 
TATCTAGCCT 



30 0 

GTACGCTTTA 
GTACGCTTTA 
GTACGCTTTA 
GTACGCTTTA 
GTACGCTTTA 
GTACGCTTTA 
GTACGCTTTA 
GTACGCTTTA 
GTACGCTTTA 
GTACGCTTTA 
GTACGCTTTA 



msa521675 . 2 { 69_A909 
msa521675.2(69_H36B 
msa521675.2{69 JM9130013 
msa521675.2l69 1169NT 
msa521675 . 2TS9_090 
msa521675 .2( 69_CJBX10 
msa521675 . 2 { 69JL8RS21 
msa521675 . 2 f 69_2603 
msa521675 . 2 { 69_COHl 
msa521675 . 2 { 69_M732 
rasa521675 . 2 { 69_M781 
Consensus 



301 

ACAAATGGAT 
ACAAATGGAT 
ACAAATGGAT 
ACAAATGGAT 
ACAAATGGAT 
ACAAATGGAT 
ACAAATGGAT 
ACAAATGGAT 
ACAAATGGAT 
ACAAATGGAT 
ACAAATGGAT 
********** 



TTTCAGAAAA 
TTTCAGAAAA 
TTTCAGAAAA 
TTTCAGAAAA 
TTTCAGAAAA 
TTTCAGAAAA 
TTTCAGAAAA 
TTTCAGAAAA 
TTTCAGAAAA 
TTTCAGAAAA 
TTTCAGAAAA 
********** 



TGATTTaTTG 
TGATTTaTTG 
TGATTTaTTG 
TGATTTaTTG 
TGATTTgTTG 
TGATTTgTTG 
TGATTTaTTG 
TGATTTaTTG 
TGATTTaTTG 
TGATTTaTTG 
TGATTTaTTG 
******_*** 



GTACCACTTA 
GTACCACTTA 
GTACCACTTA 
GTACCACTTA 
GTACCACTTA 
GTACCACTTA 
GTACCACTTA 
GTACCACTTA 
GTACCACTTA 
GTACCA CTTA 
GTACCACTTA 
********** 



350 

TAGATGCACG 
TAGATGCACG 
TAGATGCACG 
TAGATGCACG 
TAGATGCACG 
TAGATGCACG 
TAGATGCACG 
TAGATGCACG 
TAGATGCACG 
TAGATGCACG 
TAGATGCACG 
********** 



msa521675 . 2 { 69_A909 
msa52 1675 . 2 { 69_H3 6B 
msa521675.2{69 JM9130013 
rasaS21675.2T69 1169NT 
msa521675.2T69_090 
msa521675 . 2 f 69_CJB110 
msa521675 . 2 { 69_18RS21 
rasa521675 . 2 { 69_2603 
msa521675 . 2 f 69_COHl 
msa521675.2{69_M732 
msa521675.2{69_M781 
Consensus 



351 

ACGTAAcAAT 
ACGTAAcAAT 
ACGTAAcAAT 
ACGTAACAAT 
ACGTAAcAAT 
ACGTAACAAT 
ACGTAAtAAT 
ACGTAAtAAT 
ACGTAAcAAT 
ACGTAAcAAT 
ACGTAAcAAT 



GTTTATGTTG 
GTTTATGTTG 
GTTTATGTTG 
GTTTATGTTG 
GTTTATGTTG 
GTTTATGTTG 
GTTTATGTTG 
GTTTATGTTG 
GTTTATGTTG 
GTTTATGTTG 
GTTTATGTTG 



GTTTCTATCA 
GTTTCTATCA 
GTTTCTATCA 
GTTTCTATCA 
GTTTCTATCA 
GTTTCTATCA 
GTTTCTATCA 
GTTTCTATCA 
GTTTCTATCA 
GTTTCTATCA 
GTTTCTATCA 



AAATGGaGAT 
AAATGGaGAT 
AAATGGaGAT 
AAATGGtGAT 
AAATGGtGAT 
AAATGGtGAT 
AAATGGtGAT 
AAATGGtGAT 
AAATGGtGAT 
AAATGGtGAT 
AAATGGtGAT 



400 

ACTGTTAAAC 
ACTGTTAAAC 
ACTGTTAAAC 
ACTGTTAAAC 
ACTGTTAAAC 
ACTGTTAAAC 
ACTGTTAAAC 
ACTGTTAAAC 
ACTGTTAAAC 
ACTGTTAAAC 
ACTGTTAAAC 



msa521675 . 2 { 69_A909 
rasa52 167 5 . 2 { 6 9_H3 6B 
msa521675.2{69 JM9130013 
msa521675.2T69 1169NT 
msa521675 . 2T69_090 
rasa521675 . 2 ( 69_CJB110 
msa521675 - 2 { 69_18RS2 1 



msa521675.2 
msa52l675.2 
msa521675.2 
msa52l675.2 



69_2603 
69_COHl 
69_M732 
69_M781 
Consensus 



401 

CAGACTGTCA 
CAGACTGTCA 
CAGACTGTCA 
CAGACTGTCA 
CAGACTGTCA 
CAGACTGTCA 
CAGACTGTCA 
CAGACTGTCA 
CAGACTGTCA 
CAGACTGTCA 
CAGACTGTCA 



CACTTCTCTT 
CACTTCTCTT 
CACTTCTCTT 
CACTTCTCTT 
CACTTCTCTT 
CACTTCTCTT 
CACTTCTCTT 
CACTTCTCTT 
CACTTCTCTT 
CACTTCTCTT 
CACTTCTCTT 



GAAGAAGTCT 
GAAGAAGTCT 
GAAGAAGTCT 
GAAGAAGTCT 
GAAGAAGTCT 
GAAGAAGTCT 
GAAGAAGTCT 
GAAGAAGTCT 
GAAGAAGTCT 
GAAGAAGTCT 
GAAGAAGTCT 



TACAAGAGGT 
TACAAGAGGT 
TACAAGAGGT 
TACAAGAGGT 
TACAAGAGGT 
TACAAGAGGT 
TACAAGAGGT 
TACAAGAGGT 
TACAAGAGGT 
TACAAGAGGT 
TACAAGAGGT 



450 

GGGGAATAAA 
GGGGAATAAA 
GGGGAATAAA 
GGGGAATAAA 
GGGGAATAAA 
GGGGAATAAA 
GGGGAATAAA 
GGGGAATAAA 
GGGGAATAAA 
GGGGAATAAA 
GGGGAATAAA 



msa521675.2f69_A909; 
msa521675 . 2 { 69_H36B 
msaS2167S.2{69 JM9130013 
msa521675.2T69 1169OT 
msa521675.2T69 090 
msa521675 . 2 { 69_CJB110 
rasa521675.2(69_18RS21 
msa521675 . 2 ( 69_2603 
msa521675 . 2 f 69_COHl 
msa521675 . 2 f 69_M732 
msa521675.2{69_M781 
Consensus 



451 

GCCAATGTTC 
GCCAAT GTTC 
GCCAATGTTC 
GCCAATGTTC 
GCCAATGTTC 
GCCAATGTTC 
GCCAATGTTC 
GCCAATGTTC 
GCCAATGTTC 
GCCAATGTTC 
GCCAATGTTC 



ATTTTGTCGG 
ATTTTGTCGG 
ATTTTGTCGG 
ATTTTGTCGG 
ATTTTGTCGG 
ATTTTGTCGG 
ATTTTGTCGG 
A TTTTGTC GG 
ATTTTGTCGG 
ATTTTGTCGG 
ATTTTGTCGG 



AGAGGTTGCA 
AGAGGTTGCA 
AGAGGTTGCA 
AGAGGTTGCA 
AGAGGTTGCA 
AGAGGTTGCA 
AGAG GTTG CA 
AGAGGTTGCA 
AGAG GTTG CA 
AGAGGTTGCA 
AGAGGTTGCA 



GCATTTgTTG 
GC ATTTg TTG 
GCATTTgTTG 
GCATTTgTTG 
GCATTTtTTG 
GCATTTtTTG 
GCATTTtTTG 
GCATTTtTTG 
GCATTTtTTG 
GCATTTtTTG 
GCATTTtTTG 



500 

AcCAGATTAA 
AcCAGATTAA 
ACCAGATTAA 
AcCAGATTAA 
At CAGATTAA 
AtCAGATTAA 
At CAGATTAA 
AtCAGATTAA 
AtCAGATTAA 
AtCAGATTAA 
AtCAGATTAA 



msa521675 . 2 {69_A909} 



501 550 
GAAAGttTTA CCACATGCTA AAATTACAGA AACTTTACCT TGTGCAGTgG 



1127 



WO 2004/018646 



PCT/US2003/026827 



Table 84: Comparative Sequences relating to SAG0267 



maa521675.2{69 H36B 
msa521675.2{69 JM9130013 
msa521675.2T69 1169NT 
msa521675 .2T69_090 
msa521675 . 2 { 69_GJB110 
msa521675 . 2 { 69_18RS21 
msa521675.2(69 2603 
msa52 1675 . 2 { 69~COHl 
msa52167S .2<69_M732 
msa52 1675 . 2 { 69_M7 8 1 
Consensus 



GAAAGttTTA 
GAAAGttTTA 
GAAAGctTTA 
GAAAGccTTA 
GAAAGccTTA 
GAAAGccTTA 
GAAAGccTTA 
GAAAGCCTTA 
GAAAGccTTA 
GAAAGccTTA 



CCACATGCTA 
CCACATGCTA 
CCACATGCTA 
CCACATGCTA 
CCACATGCTA 
CCACATGCTA 
CCACATGCTA 
CCACATGCTA 
CCACATGCTA 
CCACATGCTA 



AAATTACAGA 
AAATTACAGA 
AAATTACAGA 
AAATTACAGA 
AAATTACAGA 
AAATTACAGA 
AAATTACAGA 
AAATTACAGA 
AAATTACAGA 
AAATTACAGA 



AACTTTACCT 
AACTTTACCT 
AACTTTACCT 
AACTTTACCT 
AACTTTACCT 
AACTTTACCT 
AACTTTACCT 
AACTTTACCT 
AACTTTACCT 
AACTTTACCT 



TGTGCAGTgG 
TGTGCAGTgG 
TGTGCAGTgG 
TGTGCAGTgG 
TGTGCAGTgG 
TGTGCAGTaG 
TGTGCAGTaG 
TGTGCAGTaG 
TGTGCAGTaG 
TGTGCAGTaG 



msa521675 . 2 { 69_A909 
msa521675 . 2 { 69_H36B 
tnsa521675.2{69 JM9130013 
msa521675.2X69 1169NT 
msa521675.2T69_090 
msa521675 . 2 ( 69_CJB110 
msa521675 . 2 { 69_18RS21 
msa521675.2{ 69 2603 
msa521675 . 2 i 69~COHl 
msa521675 . 2 ? 69_M732 
msa52 1675 . 2 { 69_M78 1 
Consensus 



551 

CAATTGGGCG 
CAATTGGGCG 
CAATTGGGCG 
CAATTGGGCG 
CAATTGGGCG 
CAATTGGGCG 
CAATTGGGCG 
CAATTGGGCG 
CAATTGGGCG 
CAATTGGGCG 
CAATTGGGCG 



CAAAGGACAA 
CAAAGGACAA 
CAAAGGACAA 
CAAAGGACAA 
CAAAGGACAA 
CAAAGGACAA 
CAAAGGACAA 
CAAAGGACAA 
CAAAGGACAA 
CAAAGGACAA 
CAAAGGACAA 



AAAATGaAAA 
AAAATGaAAA 
AAAATGaAAA 
AAAATGgAAA 
AAAATGgAAA 
AAAATGgAAA 
AAAATGaAAA 
AAAATGaAAA 
AAAATGaAAA 
AAAATGaAAA 
AAAATGaAAA 



GCGTTAATGT 
GCGTTAATGT 
GCGTTAATGT 
GCGTTAATGT 
GCGTTAATGT 
GCGTTAATGT 
GCGTTAATGT 
GCGTTAATGT 
GCGTTAATGT 
GCGTTAATGT 
GCGTTAATGT 



600 

AGAtgCGTTT 
AGAtgCGTTT 
AGAtgCGTTT 
AGAtgCGTTT 
AGAtgC GTTT 
AGAtgCGTTT 
AGAtgCGTTT 
AGAtgCGTTT 
AGAtgCGTTT 
AGAnnCGTTT 
AGAtgCGTTT 



msa521675.2{69 A9091 
msa521675 . 2 { 69_H3 SB 
msa521675.2{69 JM9130013 
msa521675.2X69 1169NTJ 
msa521675 . 2T69_090 J 
msa521675 . 2 ( 69_CJB110 ] 
msa521675.2{69_18RS2lj 
msa521675.2{69_2603 
msa521675 . 2 < 69_C0H1 
tnsa521675 . 2 { 69_M732 
rasa52 1675 . 2 { 69_M7B 1 ] 
Consensus 



601 

GTTCCACGAT 
GTTCCACGAT 
GTTCCACGAT 
GTTCCACGAT 
GTTCCACGAT 
GTTCCACGAT 
GTTCCACGAT 
GTTCCACGAT 
GTTCCACGAT 
GTTCCACGAT 
GTTCCACGAT 



ACTTAAAACG 
ACTTAAAACG 
ACTTAAAACG 
ACTTAAAACG 
ACTTAAAACG 
ACTTAAAACG 
ACTTAAAACG 
ACTTAAAACG 
ACTTAAAACG 
ACTTAAAACG 
ACTTAAAACG 



tGTTGAAGCT 
tGTTGAAGCT 
tGTTGAAGCT 
tGTTGAAGCT 
aGTTGAAGCT 
aGTTGAAGCT 
tGTTGAAGCT 
tGTTGAAGCT 
tGTTGAAGCT 
tGTTGAAGCT 
tGTTGAAGCT 



GAGGAAAATT 
GAGGAAAATT 
GAGGAAAATT 
GAGGAAAATT 
GAGGAAAATT 
GAGGAAAATT 
GAGGAAAATT 
GAGGAAAATT 
GAGGAAAATT 
GAGGAAAATT 
GAGGAAAATT 



650 

GGTTAAgAAA 
GGTTAAgAAA 
GGTTAAgAAA 
GGTTAAaAAA 
GGTTAAaAAA 
GGTTAAaAAA 
GGTTAAaAAA 
GGTTAAaAAA 
GGTTAAaAAA 
GGTTAAaAAA 
GGTTAAaAAA 



msa521675.2{69_A909 
msa521675 . 2 { 69_H36B 
msa521675.2{69 JM9130013 
msa521675.2T69 1169NT 
msa521675 . 2l69_090 
msa521675 . 2 f 69_CJB110 
tnsa52167S . 2 { 69_18RS21 
msa521675 . 2 { 69_2603 
msa52 1675 . 2 { 69_COHl 
msa521675.2(69_M732 
msa521675.2{69_M781 
Consensus 



651 

CCACTGTGAA 
CCACTGTGAA 
CCACTGTGAA 
CCACTGTGAA 
CCACTGTGAA 
CCACTGTGAA 
CCACTGTGAA 
CCACTGTGAA 
CCACTGTGAA 
CCACTGTGAA 
, CCACTGTGAA 



690 



ACGAAT 

ACGAATACAG 
ACGAATACAG 
ACGAATACAG 

ACGAAT 

ACGAATACAG 
ACGAATACAG 
ACGAATACAG 
ACGAATACAG 
ACGAATACAG 
ACGAATACAG 



AAGAATATAT 
AAGAATATAT 
AAGAATATAT 



TAAGAGAGTT 
TAAGAGAGTT 
TAAGAGAGTT 



AAGAATATAT 
AAGAATATAT 
AAGAATATAT 
AAGAATATAT 
AAGAATATAT 
AAGAATATAT 



TAAGAGAGTT 
TAAGAGAGTT 
TAAGAGAGTT 
TAAGAGAGTT 
TAAGAGAGTT 
TAAGAGAGTT 



SEQ ID NO. 8412 
STRAIN 2603 frame: 1 

MMKVLAFDTSSKALSVAVIjNNMECXATVTINI KKNHS INLMP AI D FLMQS I DLE PQDLDR 
I VVAEGPGS YTGLRVAVATAKMLAYTLKI DLVC4VSSL YALTNGFSENDLLVPL IDARRNN 
VYVGFYQNGDTVKPDCHTSLEEVLQEVGNKANV^ KKALPHAKI TETLP 

CAVA! GRKGQKMKSVNVDAFVPRYLKRVSABENWLKNHCi ^l'NTK E Y I KRV 

SBQ ID NO. 8413 
STRAIN 090 frame: 1 

KVIAFDTSSKAIiSVAVLNNMECIiATVTINIKK^ 

VAEGPGSYTGLRVAVATAKMLAYTLKI DLVGVSSLYALTNGFSENDLLVPLI DARRNNVY 

VGFYQNGDTVKPDCOTSLEEVI^EVGNKANVHFV^ 

VAIGRXISQKMBSVNVDAFVPRYLKRVBABCNWIiKimCBTN 

SBQ ZD NO. 8414 

STRAIN A909 frame: 1 

KVLAFDTSS KALSVAVLNNMECLATVT I N I KKNHS INLMPAI DFLMQS IDLEPQDLDRI V 
VAEGPGS YTGLRVAVATAKMLAYTLKI DLVGVSSLYALTNGFSBNDLLVPLI DARRNNVY 
VGFYQNGDTVICPDOn'SIiBBVIiQBVGNKANVHPVGEVA KKVLPHAKITETLPCA 
VAI GRKG QKMKSVNVDAFVPRYLKRVEAEENWIJttJHCETN 

SBQ ZD NO. 8415 
STRAIN H36B frame: 1 

KVIAFDTSSKALSVAVLNNMBOATVTINI KKNHS INLMPAI DFLMQS IDLEPQDLDRI V 
VAEGPG S YTOLRVAVAT AKMLAYTL KI DLVGVSS L YALTNGFSEKDLLV PL I DARRNNVY 
VGFYQNGDTVKPDCtHTSLEEVLQHVGNKANVH FVGEVAAFVDQ I KKVLPHAKITETLPCA 
VAIGRKGQKMKS VNVDAFVPRYIJOlVEAEENVrLRNHC Y I KRV 



SEQ ZD NO. 8416 



1128 



WO 2004/018646 



PCT/US2003/026827 



Table 84: Comparative Sequences relating to SAG0267 



STRAIN 18RS21 frame: 1 

KVLAFDTSS KALSVAVLNNMECLATVT INI KKNHS I NLMPAI DFLMQS I DLE PQDLDRI V 
VAEG PG SYTG LRVAVATAKMLA YTLKI DLVGVS SLYALTNGF S ENDLL VPL I DARRNNVY 
VGFYQNGI7rVKPDCHTSLEEVU3EVGNKANVHFVGEVAAFFDQI KKALPHAKITETLPCA 
VAIGRKGQKMKSVNVDAFVPRYLKRVEAEENWLKNHCETNTEEYI KRV 

SHQ ID NO. 8417 
STRAIN M732 frame: 1 

KVIAFDTSSKALS VAVLNNMECLATVT IN I KKNHS I NLMPAI DFLMQS I DLE PQDLDRI V 
VAEGPGS YTGIjRVAVATAKMLAYTLKI DLVGVSSLYALTNGFSENDLLVPLI DARRNNVY 
VGFYQNGDTVKPDCOTSLEEVLQEVGNKANVHFVGEVAAFF^ 
VAIGRKGQKMKS VNVXXFVPRYLKRVEAEENWLKNHC^ I KRV 

SKQ XD NO. 8418 
STRAIN COH1 frame: 1 

KVIAFDTSSKALSVAVLNNMECIJVrVTINIKKNHS I NLMPAI DFLMQS IDLE PQDLDRI V 
VAEG PGS YTGLRVAVATAKMLAYTLKI DL VGV S S LYALTNG FSENDLLVPLI DARRNNVY 
VGFYQNGDTVKPDCHTSLEEVLQEVGNKANVHFVGEVAAFFDQI KKALPHAKITETLPCA 
VAI GRKGQKMKS VNVDAFVPRYLKRVEAEENWLKNHCETNTEBY I KRV 

SEQ ID NO. 8419 
STRAIN M781 frame: 1 

KVLAFDTSS KALSVAVLNNMECLATVT INI KKNHS INLMPAIDFLMQSIDLEPQDLDRIV 
VSEG PGS YTGLRVAVATAKMLAYTL KI DLVGVS SLYALTNGFSENDLLVPL I DARRNNVY 
VG FYQNGDTVKPDCHTSLEEVLQEVGNKANVH EVGEVAAFFDQI KKALPHAKITETLPCA 
VAIGRKGQKMKS VNVDAFVPRYLKRVEAEENWLKNHCETNTEEYI KRV 

SEQ ID NO. 8420 
STRAIN CJB1 10 frame: 1 

KVLAFDTSS KALSVAVLNNMECIATVT IN I KKNHS INLMPAI DFLMQS I DLE PQDLDRI V 
VAEG PGS YTGLRVAVATAKMLAYTL KI DLVGVS SLYALTNGFSENDLLVPL I DARRNNVY 
VGFYO^GDTVKPDCOTSLEEVLQEVGNKANVHFVGEVAAFFDQI KKALPHAKITETLPCA 
VAIGRKGQKMESVNVDAFVPRYLKRVEAEENWLKNHCETNTEBYI KRV 

SEQ XD NO. 8421 
STRAIN H69NT frame: 1 

KVLAFDTSS KALSVAVLNNMECLATVT IN I KKNHS I NLMPAI DFLMQS I DLE PQDLDRI V 
VAEGPGS YTGLRVAVATAKMLAYTLKI DLVGVSS LYALTNGFSENDLLVPL I DARRNNVY 
VGFYQNGDTVKPDCHTSLEEVLQEVGNKANVHWGEVA^ KKALPHAKITETLPCA 
VAIGRKGQKMESVNVDAFVPRYLKRVEAEENWLKNHCETNTEEYI KRV 

SEQ ID NO. 8422 
STRAIN JM9 1300 13 frame: 1 

KVLAFDTSS KALSVAVLNNMECIATVTINI KKNHS IN^ DPLMQS I DLE PQDLDRI V 
VAEGPGSYTGIiRVAVATAKNOAYTLKIDLVGVSSLYALTNGFSENDLLVPLIDARRNNVY 
VGFYQNGDTVKPDCHTSLEEVLQEVGNKANVHFVGEVAAF 
VAIGRKGQKMKS VNVDAFVPRYLKRVEAEENWLRNHCETNTEEY I K^ 

PRETTY of i /biotmp/msa521982.2{*} March 10, 2003 08t40 



msa521982 . 2 { 69_A909 
msa521982.2{69 H36B 
msa521982 - 2 { 69_JM9130013 
msa521982.2{69_090 
msaS21982 . 2 { 69_CJB110 
msaS21982 .2{69_18RS21 
msa521982.2{69_2603 
msa521982 . 2 f 69_C0H1 
msa521982 . 2 { 69_M781 
msaS21982.2{69_1169NT 
msa521982 . 2 { 69J4732 
Consensus 



— KVLAFDTS 
— KVLAFDTS 
— KVLAFDTS 
— KVLAFDTS 
— KVLAFDTS 
—KVLAFDTS 
mmKVLAFDTS 
— KVLAFDTS 
— KVLAFDTS 
— KVLAFDTS 
—KVLAFDTS 



SKALSVAVLN 
SKALSVAVLN 
SKALSVAVLN 
SKALSVAVLN 
SKALSVAVLN 
SKALSVAVLN 
SKALSVAVLN 
SKALSVAVLN 
SKALSVAVLN 
SKALSVAVLN 
SKALSVAVLN 



NMECLATVTI 
NMECLATVTI 
NMECLATVTI 
NMECLATVTI 
NMECLATVTI 
NMECLATVTI 
NMECLATVTI 
NMECLATVTI 
NMECLATVTI 
NMECLATVTI 
NMECLATVTI 



NI KKNHS INL 
NI KKNHS INL 
N I KKNHS INL 
NI KKNHS INL 
N I KKNHS INL 
NIKKNHSINL 
NI KKNHS INL 
NIKKNHSINL 
NIKKNHSINL 
NIKKNHSINL 
NIKKNHSINL 



50 

MPAI DFLMQS 
MPAI DFLMQS 
MPAI DFLMQS 
MPAI DFLMQS 
MPAI DFLMQS 
MPAIDFLMQS 
MPAIDPLMQS 
MPAIDFLMQS 
MPAIDFLMQS 
MPAIDFLMQS 
MPAIDFLMQS 



msa52 1982 . 2 { 69_A9 0 9 
tnsa52 1982 . 2 { 69_H36B 
msa521982.2{69 JM9130013' 
msa521982 . 2 { 69_090 
msaS21982.2{69 CJB110 
msa521982.2{69_18RS21 
msaS2 1982 . 2 ( 69_2603 
rasa521982 . 2 j 69_C0H1 
rasa521982.2(69_M781 
msa521982 . 2 { 69_1169NT 
m8a521982 . 2 { 69_M732 
Consensus 



51 

IDLBPQDLDR 
IDLEPQDLDR 
IDLBPQDLDR 
IDLEPQDLDR 
IDLBPQDLDR 
IDLBPQDLDR 
IDLEPQDLDR 
IDLBPQDLDR 
IDLEPQDLDR 
IDLBPQDLDR 
IDLEPQDLDR 



IWaEGPGSY 
IWaBGPGSY 
IWaEGPGSY 
IWaEGPGSY 
IWaBGPGSY 
IWaEGPGSY 
IWaEGPGSY 
IWaEGPGSY 
IWaEGPGSY 
IWaEGPGSY 
IWaEGPGSY 



TGLRVAVATA 
TGLRVAVATA 
TGLRVAVATA 
TGLRVAVATA 
TGLRVAVATA 
TGLRVAVATA 
TGLRVAVATA 
TGLRVAVATA 
TGLRVAVATA 
TGLRVAVATA 
TGLRVAVATA 



KMLA YTLKI D 
KMLA YTLKI D 
KMLAYTLKID 
KMLAYTLKID 
KMLAYTLKID 
KMLAYTLKID 
KMLAYTLKID 
KMLAYTLKID 
KMLAYTLKID 
KMLAYTLKID 
KMLAYTLKID 



100 

LVGVSSLYAL 
LVGVSSLYAL 
LVGVSSLYAL 
LVGVSSLYAL 
LVGVSSLYAL 
LVGVSSLYAL 
LVGVSSLYAL 
LVGVSSLYAL 
LVGVSSLYAL 
LVGVSSLYAL 
LVGVSSLYAL 



msa521982.2{69 A909) 
msa521982 . 2{69~H36B} 



101 150 
TNGFSENDLL VPLIDARRNN VYVGFYQNGD TVKPDCHTSL EEVLQEVGNK 
TNGFSENDLL VPLIDARRNN VYVGFYQNGD TVKPDCHTSL EEVLQEVGNK 



1129 



WO 2004/018646 



PCT/US2003/026827 
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msa521982.2{69_JM9130013 
msa521982.2{69_090 
rasa521982 .2f 69jCJB110 
maa521982 . 2 { 69_1BRS21 
msa521982.2{69_2603 
msa521982 . 2 { 69_COHl 
msa521982 . 2 { 69_M7B1 
msa521982 . 2 { 69_U69NT 
msa521982.2{69_M732 
Consensus 



TNGFSENDLL 
TNGFSENDLL 
TNGFSENDLL 
TNGFSENDLL 
TNGFSENDLL 
TNGFSENDLL 
TNGFSENDLL 
TNGFSENDLL 
TNGFSENDLL 



VPLIDARRNN 
VPLIDARRNN 
VPLIDARRNN 
VPLIDARRNN 
VPLIDARRNN 
VPLIDARRNN 
VPLIDARRNN 
VPLIDARRNN 
VPLIDARRNN 



VYVGFYQNGD 
VYVGFYQNGD 
VYVGFYQNGD 
VYVGFYQNGD 
VYVGFYQNGD 
VYVGFYQNGD 
VYVGFYQNGD 
VYVGFYQNGD 
VYVGFYQNGD 



TVKPDCHTSL 
TVKPDCHTSL 
TVKPDCHTSL 
TVKPDCHTSL 
TVKPDCHTSL 
TVKPDCHTSL 
TVKPDCHTSL 
TVKPDCHTSL 
TVKPDCHTSL 



EEVLQEVGNK 
BEVLQEVGNK 
EEVLQEVGNK 
EEVLQEVGNK 
BEVLQEVGNK 
EEVLQEVGNK 
EEVLQEVGNK 
EEVLQEVGNK 
EEVLQEVGNK 



msa521982 . 2 { 69_A909 
msa521982 . 2 { 69_H36B 
tnsa521982.2{69_JM9130013 
msa521982.2{69_090 
maa521982 . 2 ( 69_CJB110 
msa521982 . 2 { 69_18RS21 
msaS21982.2(69_2603 
msa521982.2(69_COHl 
msa521982 . 2 { 69_M781 
msa521982 . 2 { 69_1169NT 
tnsa521982.2{69_M732 
Consensus 



msaS219B2.2f69_A909 
insa521982 . 2{ 69_H36B 
msa521982 . 2 { 69_JM9130013 
msaS21982 .2{69_090 
msa5219B2.2(69 CJB110 
msa521982.2{69_18RS21 
msa521982 . 2 { 69_2603 
ms aS 2 1 9 8 2 . 2 i € 9_COHl 
msa52 1 982 . 2 { 6 9_M7 8 1 
maa521982 . 2 { 69_1169NT 
msa521982 . 2{69_M732 
Consensus 



151 200 
ANVHFVGEVA AFvDQIKKvL PHAKETETLP CAVAIGRKGQ KMkSVNVdaF 
ANVHFVGEVA AFvDQIKKvL PHAKITETLP CAVAIGRKGQ KMkSVNVdaF 
ANVHFVGEVA AFvDQIKKvL PHAKITETLP CAVAIGRKGQ KMkSVNVdaF 
ANVHFVGEVA AFfDQIKKaL PHAKITETLP CAVAIGRKGQ KMeSVNVdaF 
ANVHFVGEVA AFfDQIKKaL PHAKITETLP CAVAIGRKGQ KMeSVNVdaF 
ANVHFVGEVA AFfDQIKKaL PHAKITETLP CAVAIGRKGQ KMkSVNVdaF 
ANVHFVGEVA AFfDQIKKaL PHAKITETLP CAVAIGRKGQ KMkSVNVdaF 
ANVHFVGEVA AFfDQIKKaL PHAKITETLP CAVAIGRKGQ KMkSVNVdaF 
ANVHFVGEVA AFfDQIKKaL PHAKITETLP CAVAIGRKGQ KMkSVNVdaF 
ANVHFVGEVA AFvDQIKKaL PHAKITETLP CAVAIGRKGQ KMeSVNVdaF 
ANVHFVGEVA AFfDQIKKaL PHAKITETLP CAVAIGRKGQ KMkSVNVxxF 
********** **_*«***..* ********** ********** **.•***__* 

201 230 

. VPRYLKRVEA EENWLrNHCE TN 

VPRYLKRVEA EENWLrNHCE TNTEEYIKRV 
VPRYLKRVEA EENWLrNHCE TNTEEYIKRV 

VPRYLKRVEA EENWLkNHCE TN 

VPRYLKRVEA EENWLkNHCE TNTEEYIKRV 
VPRYLKRVEA EENWLkNHCE TNTEEYIKRV 
VPRYLKRVEA EENWLkNHCE TNTEEYIKRV 
VPRYLKRVEA EENWLkNHCE TNTEEYIKRV 
VPRYLKRVEA EENWLkNHCE TNTEEYIKRV 
VPRYLKRVEA EENWLkNHCE TNTEEYIKRV 
VPRYLKRVEA EENWLkNHCE TNTEEYIKRV 
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SEQ ID NO. 8501 
STRAIN 2603 

atgagtaaacgacaaaatttaggaattagtaaaaaaggagcaattatatcagggctctca 
gtggcactaattgtagtaataggtggctttttatgggtacaatctcaacctaataagagt 
gcagtaaaaactaactacaaagtttttaatgttagagaaggaagtgtttcgtcctcaact 
cttttgacaggaaaagctaaggctaatcaagaacagtatgtgtattttgatgctaataaa 
ggtaatcgagcaactgtcacagttaaagtgggtgataaaatcacagctggtcagcagtta 
gttcaatatgatacaacaactgcacaagcagcctacgacactgctaatcgtcaattaaat 
aaagtagcgcgtcagattaataatctaaagacaacaggaagtcttccagctatggaatca 
agtgatcaatcttcttcatcatcacaaggacaagggactcaatcgactagtggtgcgacg 
aatcgtctacagcaaaattatcaaagtcaagctaatgcttcatacaaccaacaacttcaa 
gatttgaatgatgcttatgcagatgcacaggcagaagtaaataaagcacaaaaagcattg 
aatgatactgttattacaagtgacgtatcagggacagttgttgaagttaatagtgatatt 
gatccagcttcaaaaactagtcaagtacttgtccatgtagcaactgaaggtaaactccaa 
gtacaaggaacgatgagtgagtatgatttggctaatgttaaaaaagaccaggctgttaaa 
ataaaatctaaggtctatcctgacaaggaatgggaaggtaaaatttcatatatctcaaat 
tatccagaagcagaagcaaacaacaatgactctaataacggctctagtgctgtaaattat 
aaatataaagtagatattactagccctctcgatgcattaaaacaaggttttaccgtatca 
gttgaagtagttaatggagataagcaccttattgtccctacaagttctgtgataaacaaa 
gataataaacactttgtttgggtatacaatgattctaatcgtaaaatttccaaagttgaa 
gtcaaaattggtaaagctgatgctaagacacaagaaattttatcaggtttgaaagcagga 
caaatcgtggttactaatccaagtaaaaccttcaaggatgggcaaaaaattgataatatt 
gaatcaatcgatcttaactctaataagaaatcagaggtgaaa 

SEQ ID NO. 8502 
STRAIN 090 

•I'l-i-j-iAT GGG TACAATCTCAA 

CAAAGTTTTTAATGTTAGAGAAGGAAGTCnTrCGTCCTCAACT 

CAGGAAAAG CTAAGGCTAATCAAGAACAGTATGTGTATTTTO 

AAAGGTAAT QGAGCAA CTGTCACAGTTAAAGTGGGTGATA 

TGGTCAGCAGTTAGTTCAATATGATACAACAACTGC^ 

ACACTGCTAATCCTCAATTAAATAAAGTAGCGCGTCAGATTA 

AAQACAACAGGAAGTCTTCCaGCTATGGAATTAAG 

ATCATCACAAGGACAAGGGACTCAATOGACTAGTGGT^ 

TACAGCAAAATTATCAAAGTCAAGCTAATGCTTCATACAACCAACAACTO 

CAAGATTTGAATGATGCTTATGCAGATG<^ 

ACAAAAAGCATTGAATGATACTGTTATTACAAGTGACXn'A 

TTGTTGAAGTTAATAGTGATATTGATCCAGCTTCAAAAACTAGTCA^ 

CnTGTCCA TGTA GCAACTGAAGGTAAACTCCAAGTACAAGGAACG^ 

TGAGTATGATTTGGCTAATGTTAAAAAAGACXAGGCTGT^ 

CTAAGGTCTATCCTGACAAGGAATGGGAAGGTAAAATTTCAT 

AATTATCCAGAAGCAGAAGCAAACAACAATGACTCTAATA^ 

TGCTCTAAATTATAAATATAAAGTAGATATTACTAGCCCT 

TAAA ACAAGGTTTTACCSTATCAGTTGAAGT 

CTTATTGTCCCTACAAGTTCTGTGATAAA 

TTGGGTATACAATGATTCTAATCCTAAAATTTC^ 

TTGGTAAAGCTGATGCTAAGACACAAGAAATTTTA^ 

GGACAAATCGTGGTTACTAATCCIAAGTAAAACCTTCAAGGATG 

AATIX^TAATATTGAATCAATCGATCTTAACTCTAATAAGAAAT 

SEQ ID NO. 8503 
STRAIN A909 

TTTTTATGGGTACAATCTCAACCTAATAAGAGTGCAGTAAAAACTAA 
CTACAAAUlVriUAATGTTAGAGAAGGAA Gl^ 

TGACAGGAAAAGCTAAGGCTAATCAAGAACAGTATGTGTA^^ CT 

AATAAAGCTAATCGAGCAACTGTTACAG 

AGCTGGTCAGCAGTTAGTTCAATATGATACAACAACTGC^ 

ACGACACTCCTAATCGTCAATTAAAT^ 

CTAAAGACAACAGGAAGTCITCCAGCTATGGAATCAAGT^ 

ATCATCATCACAAGGACAAGGGGCTCAATCGACTAGTGGTGCG^ 

GTC TACAGCAAAATTATCAAAGTCAAGCTAATGCTTCATA 

CTTCAAGATTTGAATGATGCTTATGCAGATGCACAGGC^ 

AGCACAAAAAGCATTGAATGATACTGTTATTACA 

CAGTTGTTGAAGTTAATAGTGATATTGATCCAG 

GTACTTGTCCATGTAGCAACTGAGGGTAAACTCEAA^ 

GAGTGAGTATGATTTGGCTAATGTTAAAAAAGACCAGT^ 

AATCTAAGGTCTATCCTGACAAGGAATGGGAAGGTAAAATTTC^ 

TCAAATTMCCAGAAGCAGAAGCAAACAACAATGACTCT 

TAGTGCTGTAAATTATAAATATAAAGTAGATATTACTAGCCC^ 

CATTAAAACAAGGTTTTACTGTATCAGTrGA 

CACCTTATTGTTCCTACAAGTTCTCTX1AC 

TGTTTGGGTATACAATGATTCTAATCGTAAAATTTCC^^ 

aaattggtaaagctg atoc taaqacacaagaaattt™ 

GCAGGACAAATCX3TGGTTACTAATCCAAG CAAAACTTTCAAGGATGGGCA 

AAAAATTGATAATATTGAATCAATAGATCTTAAGTCTAATAAGA 

AGGTGAAA 

SEQ ID NO. 8504 
STRAIN H36B 

TTTTTATGGGTACAATCTCAACCTAATAAGAGTC 
CAAAGiyiU"17UlUX»lTAGAQAAGGAAU'ltyTrrOGTCCTCA 
CAGGAAAAGCTAAGGCTAATCAAGAACAGTATGTGTATTTTG^ 
AAGGGTAATCGAGCAACTGTTACAGTTAAAGTGGGTGAT^ 
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TGGTCAG CAGTTAGTTCAATATGAT ACAACAACTG CACAAGCAG CCTACG 

ACACTGCTAATCGT CAATTAAAlAAAGTAGCGCXyTCAGATTAATAATCTA 

AAGACAACAGGAAGTCTTCCAGCTATGGAATCA 

ATCATCAOUUX^CAAGGGACTCAATCGACTAGTGGTGCGAC^ 

TACAG CAAAATTAT CAAAGTCAAG CTAATG CTTCATACAACCAACAACTT 

CAAGATTTGAATGATGCTTATG CAGATGCACAGGCAGAAGTAAATAAAGC 

ACAAAAAGCATTGAATGATACTGTTAT^ACAAGTGACOT 

TTGTTGAAGTTAATAGTGATATTGATCCMCTTCAAA 

CTTGTCCATGTAGCAACTGAAGGTAAACTCCAAGTACAAGGAACGATGAG 

TGAGTATGATTTGGCTAATGTAAAAAAAGACCAGGCTGTTAAAATAAAAT 

CTAAGGTCTATCCTGACAAGGAATGGGAAGGTAAAATTTCATATATCTCA 

AATTATCCAGAAGCAGAAGCAAACAACAATGACTCrAATAACXSGC^ 

TG CTGTAAATTATAAATAT AAAGT AGATATTACT AGCCCTCT CGATGCAT 

TAAAACAAGGTTTTACTGTATCAGTTGAAGTAGTTAATGGAGATAAGC^ 

CTTATTGTTCCTACAAGTTCTGTGACAAACAAAGATAATAAAC^ 

TTGGGTATACAATGATTCTAATCGTAAAATTTCCAAAGTTG^ 

TTGGTAAAGCTGATGCTAAGACACAAGAAATTTT^ 

GGACAAATCGTAGTTACTAATCCAAGTAAAGCT^ 

AATTGATAATATTGAATCAATCGATCTTAAGTCTAATAAG 

TG 

SBQ XD NO. 8505 
STRAIN 18RS21 

TTTITATGGGTACAATCTCAACCTAATAAGAGTG CAGTAAAAACTAACTA 

CAAAGTTTTTAATGTTAGAGAAGGAAGTGTTTCGTCCTC 

CAGGAAAAGCTAAGGCTAATCAAGAACAGTATGTGTATTTTGA 

AAAGGTAATCGAGCAACTGTCACAGTTAAAGTGGGTGATAAAAT^ 

TGGTCAGCAGTTAGTTCAATATGATACAACAACK3C^ 

ACACTGCTAATOTrC^TTAAATAAAGTAGCGCGTCAGATTAATAATCTA 

AAGACAACAGGAAGTCTTCCAGCTAT^ 

ATCATCACAAGGACAAGGGACrCAATCGACrAGTGGT^ 

TACAGCAAAATTATCAAAGTCAAGCTAATGCTTC^ 

CAAG^TTTGAATGATGCTTATGCAGATC 

ACAAAAAGCATTGAATGATACTGTTATTACAAGTGA 

TTGTTGAAGTTAATAGTGATATTGATCCAGCTrCAAAAACTAGTC^ 

CTTGTCCATGTAGCAACTGAAGGTAAACTCCAAGTACAAG^ 

TGAGTATGATTTGGCTAATGTTAAAAAAGACCAGGCTGTTAAAATAAA^ 

CTAAGGTCTATCCTGACAAGGAATGGGAAGGTAAAATTrCATATATCTCA 

AATTATCCAGAAGCAGAAG CAAACAACAATGACTCTAATAACGGCTCTAG 

TGCTGTAAATTATAAATATAAAGTAGATATTACT^ CAT 

TAAAACAAGGTTTTACCGTATCAGTTGAAGTAGTTA^ 

CTTATTGTCCCTACAAGTTCTGTGATAAACAAAG^ 

TTGGGTATACAATGATTCTAATCGTAAAATTTCCA 

TTGGTAAAGCTGATGCTAAGACACAAGAAATT^ 

GGACAAATCGTGGTTACTAATCCAAGTAAAACXTI^ 

AATTGATAATATTGAATCAATCGATCTTAACTCTAATAA 

SBQ ID NO. 8506 
STRAIN M732 

TTTTT ATGGGTACAATCTCAACCTAATAAGAGTG CAGTAAAAACTAATTA 

CAAAGlTrrrAATGTTAGAGAAGGAAGTGTTTOGTC^ 

GAGGAAAAGCTAAGGCTAATCAAGAACAGTATGTGTATTT^ 

AAAGGTAATC^GCAACTGTTACAGTTAAAGTGGGTGATAAAATOVCAGC 

TGGTCAGCAGTTAGTTCAATATGATACAACIAACTG CACAAGCAGCCTACG 

ACACTCKJIAATCC^CAATTAAATAAAGTAGCXS 

AAGACAACAGGGAGTTTTCCAGCTATC^GAATC^ 

ATCATCACAAGGACAAGGGACTCAATCGAC^^ 

TACAGCAAAATTATCAAAGTCAAGCTAATGCT^ 

CAAGATTTGAATGATGCTT ATG CAGATGCA CAGG CAGAAGTAAAT AAAG C 

ACAAAAAGCATTGAATGATACTGTTATTACAAGTGA 

TTGTTGAAGTTAATAGTGATATTGATCCAGCTTCAAAAACT^ 

CITGTCXIATGTAGCAACTGAAGGTAAACTCCAA^ 

TGAGTATGATTTGGCTAATGTrAAAAAAGATCAGGCTGT^ 

CTAAGOTCTATCCTGACAAGGAATGGGAAGGTAAAATTrCATATATCT^ 

AATTATCCAGAAGCAGAAG CAAACAACAATGACnTT 

TGCTGTAAATTATAAATATAAAGTAGATATTACT^ CAT 

TAAAAC^^GGTTTTACCGTATCAGTTGAAGTAGT^ 

CTTATTGTCCCTACAAGTTCIX3TGATAAACAAAGA 

TltXjGTATACAATGATTCTAATCGTAAAATTTC^^ 

TTGGTAAAGCTGATGCTAAGACACAAGAAATTTTATa 

GGACAAATCGTGGTTACTAATCCAAGCAAAACTT^ CAAAA 

AATTGATAATATTGAATCAATCX3ATCTTAAGTCT 

TGAA 

SBQ ZD NO. 8507 
STRAIN COH1 

TTTITATGGGTACAATCTCAACCTAATAAGAGTO 
TAATTACAAAGTTTTTAATGTTAC^A^ 

TTTTGACAGGAAAAG CTAAC^CTAATCAAGL^ACAGTATGTGTAl'l'I'lGAT 

GCTAATAAAGGTAATCGAGCAACTCTTACAGT^ 

CACAGCrGGTCAGCAGTTAGTTCAAT^ 

CCTACGACACrcCrAATCGTCAATTAAATAAACT 

AATCTAAAGACAACAGGGAGTTTrCCAGCTATC^ 
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TTCATCATCATCACAAGGACAAGGGACT 

ATCGTCTACAGCAAAATTATaWVAGTCAAGCTAATGCTTCATACAACC^ 
CAACTTCAAGATTTGAATGATGCTTATGCAGATGCACAGGCA 
TAAAGCACAAAAAGCATTGAATGATACTGTTATTACAAGTGACGTATCA 
GGACAGTTGTTCAAGTTAATAGTGATATTGATCC^ 

CAAGTACTTGTCCATGTAGCAACTGAAGGTAAACTCCAAGTACAAGGAAC 

GATGAGrTGAGTATGATTTGGCTAATGTTAAAAAAGATCAGGCTCT^ 

TAAAATCTAAGGTCTATCCTGACAAGGAATGGGAAGGTAAAATTTCATAT 

ATCTCAAATTATCCAGAAG CAGAAGCAAACAACAATGACT CTAATAACGG 

CTCTAGTGCTGTAAATTATAAATATAAAGTAGATATTACTAGCCCTCTCG 

ATGC^TTAAAACAAGGTTTTACCGTATCAGITGAAGTAGTTAATGGAGAT 

AAGCACCTTATTCTCCCTACAAGTTCrGTGATAAACAAAGATAATAAACA 

CTTTGTTTGX3GTATACAATGATTCTAATCCT 

TCAAAATTGGTAAAGCTGATGCTAAGACACAAGAAAT TTTA TC^ 

AAAGCAGGACAAATCGTGGTTACTAATCCAAGCAAAACTTTCAAG 

G CAAAAAATTGATAATATTGAATCAATCGATCTTAAGTCTAATAAGAAAT 

CAGAGGTGAA 

SEQ ID NO. 8507 
STRAIN M781 

TTTTTATGGGTACAATCTCAACCTAATAAGAGTGCAGTAAAAACT 

CAAAGTTTTTAATGTTAGAGAAGGAAGTGTTTCXyrCCTCAACT 

GAGGAAAAGCTAAGGCTAATCAAGAACAGTATGTGTATTTT^ 

AAAGGTAATCGAG CAACTGTTACAGTTAAAGTGGGTGATAAAATCIACAGC 

TGGTCAGCAGTTAGTTCAATATGATACAACAACTG CACAAGCAGCCTACG 

ACACTGCTAATC^TCAATTAAATAAAGTAGCXSCGTC^ 

AAGAGAACAGGGAGTTTTCC^AGCrATGGAATCAA 

ATCAT CACAAGGACAAGGGACTCAATCGACTAGTGGTGCGACXSA^ 

TACAGCAAAATTATCAAAGTCAAGCTAATGCTTCATACAAaZA^ 

CAAGATTTGAATGATGCTTATGCAGATGCACAGGCAGAAOT 

ACAAAAAGCATTGAATGATACTGTTATTACAAGTGACGTATCAGGGAC^ 

TTGTTGAAGTTAATAGTGATATTGATCCAGCCT 

CTTGTCCATGTAGCAACTGAAGGTAAACTCCAAGTACA 

TGAGTATGATTTCGCTAATGTTAAAAAAGA^ 

CTAAGGTCTATCCTGACAAGGAATGGGAAGGTAAAATTTCATATATCTCA 

AATTATCCAGAAGCAGAAG CAAACAAGAATGACKnTlATAACGGCTCTAG 

TGCTGTAAATTATAAATATAAAGTAGATATTACTAG^ 

TAAAACAAGGTTTTACCGTATCAGTTGAAGTAGTTAATGGA^ 

CTTATTGTCCCTACAAGTTCIXjTGATAAACAAAG^ 

TTGGGTATACAATGATTCTAATCGTAAAATTT^ 

TTGGTAAAGCTGATGCTAAGACACAAGAAA^ 

GGACAAATCGTGGTTACTAATCCAAGCAAAACrrTTCAA^ CAAAA 

AATTGATAATATTGAATCAATCGATCTTAAGTCTAATAAGAAATC^ 

TGAA 

SEQ ID NO. 8508 
STRAIN CJB1 10 

TTTTTATGGGTACAATCrCAACCTAATAA 

CAAA inTriT AATGTTAGAGAAGGAAGatJ^ 

CAGGAAAAGCTAAGGCTAATCAAGAACAGTATGTGTATTTTGATC 

AAAGGTAATCGAGCAACTGTCACAGTTAAAGTGGGTGATAAAATCA C 

TGGTCAGCAGTTAGTTCAATATGATACAACAACTGCACAAGC^ 

ACACTGCIAATCGTCAATTAAATAAAGTAGCGOGTCAGA^ 

AAGACAACAGGAAGTCTTCCAGCTATGGAATTA 

ATCATCACAAGGACAAGGGAGTCAATCGACTAGTGGTGCGACGAA^^ 

TACAGCAAAATTATCAAAGTCAAGCrAATGCTTCATACAA 

CAAGATTTGAATGATGCTTATGCAGATGCACAGG 

ACAAAAAGCATTGAATGATACTGTTATTACAAGTGACt^ 

TTGTTGAAGTTAATAGTGATATTGATCCAGCTTCAAAAACT 

CTTGTCCATGTAGCAACItSAAGGTAAACTCaVAGTA 

TGAGTATGATTTGG CTAATGTTAAAAAAGACX^^GCTGTTAAAATAAAAT 

CTAAGGTCTATCCTGACAAGGAATGGGAAGGTAAAAT^ 

AATTATCCAGAAGCAGAAGGAAACAACAATGACTCT 

TAAAACAAGGTTTTACCGTATCAGTTG AAGTAGTTAAT^ CAC 

CTTATTGTCCCTACAAGTTCTGTGATAAACAAA 

TTGGGTATACAATGATTCTAATCGTAAAATTTCCAAA 

TTGGTAAAGCTGATGCTAAGACACAAGAAATTTT^ 

GGACAAATCGTGGTTACTAATCCAAGTAAAACCTTCAAGGAT^ 

AATTGATAATATTGAATCAATCGATCTTAACTCTAAT 

TGA 

SEQ ID NO. 8509 
STRAIN 1169NT 

TTTTTATGGGTACAATCrCAACCrAATAAGAGTG CAGTAAAAACT 

AACTACAAAGTTTTTAATGTTAGAGAAGGAAGTGTTTC^ 

TTTGACAGGAAAAGCTAAGGCTAATCAAGAAOVGTATGT^ 

CTAATAAAGGTAATCGAGCAACTGTCACAGTTAAAG^ 

ACAGCTGGTCAGCAGTTAGTTCAATATGATACAACAACTO 

CTACGACACTGCTAATCCTCAATTAAATAAACT 

ATCTAAAGACIAACAGGAAGTCITCCAG CT ATG-GAATCAAGTGATCAATCT 

TCTTCATCATCACAAGGACAAGGGACTCAA 

TCXTTCTACAGCAAAATTATCAAAGTCAAGCTA^ 
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AACTTCAAGATTTGAATGATGCTTATGCAGATGCACAGGCA^ 

AAAG CACAAAAAG C7VTTGAATG AT ACTGTT ATTACAAGTGACGT ATCAG G 

GACAGTTGTTGAAGTTAATAGTGATATTGATCCAGCTTCAA 

AAGTACTTGTCCATGTAGCAACTGAAGGTAAACTCCAAOT 

ATGAGTGAGTATGATTTGGCTAATGTTAAAA 

AAAATCTAAGGTCTATCCTGA(^GGAATGGGAAGGTAAAATTTCATATA 
TCTCAAATT ATCCAGAAG CAGAAGCAAACAACAATGACTCTAAT AACGGC 
TCTAGTG CTX3TAAATTATAAATATAAAGTAGATATTACTAGCCCTCTCX3A 
TGCATTAAAACAAGo'i"i"i"i'ACC<n , ATCAGTTGAAGTAG 
AGCACCITATTGTCCCTACAAGTTCrroTGATAAACAA 
TTTGTTTGGGTATACAATGATTCTAATCGTAAAATTTCXZAAA 
CAAAATTGGTAAAGCTGATG CTAAGACACAAGAAATTTTATCAGQT^ 
AAGCAGGACAAATCGTGGTTACTAATCCAAGTAAAAC CTTCAAGGATGGG 
CAAAAAATTGATAATATTGAATCAATCGATCITAACTCTAAT 
AGAGGTGAA 

SBQ ZD HO. 8510 
STRAIN JM9 1300 13 

TTTTTATGG GTACAATCTCAAC CTAATAAGAGTG CAGTAAAAACTAACTA 

CAAAGl'i'l'i'rAATGTTAGAGAAGGAAGTGTTTCGTCX^TCAACT 

CAGGAAAAGCTAAGGCTAATCAAGAACAGTATGTGTATTTTGATGCTAAT 

AAAGGTAAT CGAG CAACTGTTACAGTTAAAGTGGGTGATAAAATCACAG C 

TGGTCAGCAGTTAGTTGAATATGATACAAC^ 

ACACTGCTAATCGTCAATTAAATAAAGTAGCX3CX5TC^ 

AAGACAACAGGAAGTCITCCAGCTATGGAATCAAGTGATC^ 

ATCATCACAAGGACAAGGGGCTCAATCGACTAGTGGTGCG^ 

TACAGCAAAATTATCAAAGTCAAGOTAATGCTTCATACAA 

CAAGATTTGAATGATGCTTATGCAGATGCA^ 

ACAAAAAGCATTGAATGATACTGTTATTACAAGTGAC^ 

TTGTTGAAGTTAATAGTGATATTGATCCAGCITCAAAA^ 

CTTGT CCATGTAGC^CTGAGGGT AAACT CCAAGTACAAGGAACGATGAG 

TGAGTATGATTTGGCTAATGTTAAAAAA 

CTAAGGTCTATCCTGACyVAGGAATGGGAAGGTAAAATT^ 

AATTATCCAGAAGCAGAAGCAAACAACAATGACTCrrAATAACGGCTCT^ 

TGCTGTAAATTATAAATATAAAGTAGATATTACTAGCCCTCTCGATGCAT 

TAAAACAAGGTTTTACTGTATCAGTTGAAGTAGTTAATXX^ 

CTTATTGTTCCrAOWSTTCTGTGACAAACAAAGATAA 

TTGGGTATACAATGATTCTAATCGTAAAATTTCXZAA^ 

TTGGTAAAGCTGATGCTAAGACACAAGAAATTT^ 

GGACAAATCX3TGGTTACTAATCCAAGCAAAACITT 

AATTGATAATATTGAATCAATAGAT CTTAAGTCTAATAAGAAATCAGAGG 
TGAAA 



PRETTY of: /biotmp/msa363690 .2{ *} March 31, 2003 07:01 



msa3 63690 . 2 ( 690_COH1 
msa363690 . 2 (690_M732 
msa363690.2{690_M781 
msa363690 . 2 { 690_090 
msa363690 .2{690_CJB110 
msa363690.2f690_1169NT 
msa3 63 6 9 0 . 2 { 6 9 0_18RS2 1 
msa363690.2{690_2603 
msa363690.2{690_A909 
rasa3 63690. 2 {690_«JM9 130013 
msa363690.2{690_H36B 
Consensus 
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atgagtaaac gacaaaattt aggaattagt aaaaaaggag caattatatc 



me a3 63 6 90 . 2 { 690_COH1 
msa3 63690 .21 690_M732 
maa363690.2{690_M781 
msa363690 .2{690_090 
msa3 63690 . 2 { 690_CJB110 
msa363690.2i690_1169NT 
msa363690 . 2 { 690_18RS21 
msa363690 . 2 { 690__2603 
msa363690.2{690_A909 
mBa363690.2{690_JM9130013 
rafl a3 63 6 9 0 . 2 { 6 90_H3 6B 
Consensus 



51 100 

TTT TTATGGGTAC 

TTT TTATGGGTAC 

» ........ TTT TTATGGGTAC 

„, , TTT TTATGGGTAC 

. TTT TTATGGGTAC 

«, -TTT TTATGGGTAC 

TTT TTATGGGTAC 

agggctctca gtggcactaa ttgtagtaat aggtggcTTT TTATGGGTAC 

— _ , TTT TTATGGGTAC 

. TTT TTATGGGTAC 

„ ™- TTT TTATGGGTAC 



msa3 63690 . 2 {690_COH1 
msa363690 . 2 f 690_M732 
tnsa363690.2{690_M781 
msa3 63690 . 2 { 690_090 
msa363690 . 2 { 690_CJB110 
msa363.690 .2 {690_1169NT 
rasa363690 .2 { 690_18RS21 
msa363690.2{690 2603 



101 

AATCTCAACC 
AATCTCAACC 
AATCTCAACC 
AATCTCAACC 
AATCTCAACC 
AATCTCAACC 
AATCTCAACC 
AATCTCAACC 



TAATAAGAGT 
TAATAAGAGT 
TAATAAGAGT 
TAATAAGAGT 
TAATAAGAGT 
TAATAAGAGT 
TAATAAGAGT 
TAATAAGAGT 



GCAGTAAAAA 
GCAGTAAAAA 
GCAGTAAAAA 
GCAGTAAAAA 
GCAGTAAAAA 
GCAGTAAAAA 
GCAGTAAAAA 
GCAGTAAAAA 



CTAAtTACAA 
CTAAtTACAA 
CTAAtTACAA 
CTAAcTACAA 
CTAAcTACAA 
CTAAcTACAA 
CTAACTACAA 
CTAACTACAA 



150 

AGTTTTTAAT 
AGTTTTTAAT 
AGTTTTTAAT 
AGTTTTTAAT 
AGTTTTTAAT 
AGTTTTTAAT 
AGTTTTTAAT 
AGTTTTTAAT 



1134 



WO 2004/018646 



PCT/US2003/026827 



Table 85: Comparative Sequences relating to SAG1361 



msa363690.2{690_A909) 
msa363690.2{690_JM9130013j 
msa363690.2{690_H36B) 
Consensus 



AATCTCAACC TAATAAGAGT GCAGTAAAAA CTAAcTACAA AGTTTTTAAT 
AATCTCAACC TAATAAGAGT GCAGTAAAAA CTAAcTACAA AGTTTTTAAT 
AATCTCAACC TAATAAGAGT GCAGTAAAAA CTAAtTACAA AGTTTTTAAT 



ms a3 63 6 90 . 2 ( 6 9 0_COH1 
msa363690 . 2( 690J4732 
msa363690 . 2 { 690_M781 
msa363690 . 2 { 690_090 
msa363690.2{690_eJB110 
msa363690.2l690_1169NT 
msa363690.2{690_18RS21 
msa363690 . 2 f 690_2603 
msa363690 . 2 { 690_A909 
msa363690 . 2{ 690_JM9130013 
msa363690.2{690_H36B 
Consensus 



151 

GTTAGAGAAG 
GTTAGAGAAG 
GTTAGAGAAG 
GTTAGAGAAG 
GTTAGAGAAG 
GTTAGAGAAG 
GTTAGAGAAG 
GTTAGAGAAG 
GTTAGAGAAG 
GTTAGAGAAG 
GTTAGAGAAG 



GAAGTGTTTC 
GAAGTGTTTC 
GAAGTGTTTC 
GAAGTGTTTC 
GAAGTGTTTC 
GAAGTGTTTC 
GAAGTGTTTC 
GAAGTGTTTC 
GAAGTGTTTC 
GAAGTGTTTC 
GAAGTGTTTC 



GTCCTCAACT 
GTCCTCAACT 
GTCCTCAACT 
GTCCTCAACT 
GTCCTCAACT 
GTCCTCAACT 
GTCCTCAACT 
GTCCTCAACT 
GTCCTCAACT 
GTCCTCAACT 
GTCCTCAACT 



CTTTTGACAG 
CTTTTGACAG 
CTTTTGACAG 
CTTTTG ACAG 
CTTTTGACAG 
CTTTTGACAG 
CTTTTGACAG 
CTTTTGACAG 
CTTTTGACAG 
CTTTTGACAG 
CTTTTGACAG 



200 

GAAAAGCTAA 
GAAAAGCTAA 
GAAAAGCTAA 
GAAAAGCTAA 
GAAAAGCTAA 
GAAAAGCTAA 
GAAAAGCTAA 
GAAAAGCTAA 
GAAAAGCTAA 
GAAAAGCTAA 
GAAAAGCTAA 



msa3 63690 . 2 f 690_COH1 
msa363690 . 2 f 690_M732 
msa363690.2{690_M781 
msa363690 . 2 { 690_090 
msa363690 . 2 { 690_CJB110 
msa363690 . 2 { 690_1169NT 
msa363690 . 2 { 690_18RS21 
msa363690 . 2 { 690_2603 
msa363690 . 2 { 690_A909 
msa363690.2{690_JM9 130013 
ms a3 63 6 90 . 2 { 69 0_H3 6B 
Consensus 



201 

GGCTAATCAA 
GGCTAATCAA 
GGCTAATCAA 
GGCTAATCAA 
GGCTAATCAA 
GGCTAATCAA 
GGCTAATCAA 
GGCTAATCAA 
GGCTAATCAA 
GGCTAATCAA 
GGCTAATCAA 



GAACAGTATG 
GAACAGTATG 
GAACAGTATG 
GAACAGTATG 
GAACAGTATG 
GAACAGTATG 
GAACAGTATG 
GAACAGTATG 
GAACAGTATG 
GAACAGTATG 
GAACAGTATG 



TGTATTTTGA 
TGTATTTTGA 
TGTATTTTGA 
TGTATTTTGA 
TGTATTTTGA 
TGTATTTTGA 
TGTATTTTGA 
TGTATTTTGA 
TGTATTTTGA 
TGTATTTTGA 
TGTATTTTGA 



TGCTAATAAa 
TGCTAATAAa 
TGCTAATAAa 
TGCTAATAAa 
TGCTAATAAa 
TGCTAATAAa 
TGCTAATAAa 
TGCTAATAAa 
TGCTAATAAa 
TGCTAATAAa 
TGCTAATAAg 



250 

GGTAATCGAG 
GGTAATCGAG 
GGTAATCGAG 
GGTAATCGAG 
GGTAATCGAG 
GGTAATCGAG 
GGTAATCGAG 
GGTAATCGAG 
GGTAATCGAG 
GGTAATCGAG 
GGTAATCGAG 



msa363690. 2(690 COH1 
msa363690 . 2 { 690^732 
msa363690.2{690_M781 
msa363 690 . 2 { 690_090 
msa363690 . 2 { 690_CJB110 
insa363690 . 2 { 690_1169NT 
msa363690.2(690_18RS21 
msa363690 . 2 f 690_2603 
msa363690.2{690 A909 
msa363690.2{690_JM9130013 
msa3 63690 . 2 { 69 0_H3 6B 
Consensus 



251 

CAACTGTtAC 
CAACTGTtAC 
CAACTGTtAC 
CAACTGTcAC 
CAACTGTCAC 
CAACTGTcAC 
CAACTGTcAC 
CAACTGTcAC 
CAACTGTtAC 
CAACTGTtAC 
CAACTGTtAC 



AGTTAAAGTG 
AGTTAAAGTG 
AGTTAAAGTG 
AGTTAAAGTG 
AGTTAAAGTG 
AGTTAAAGTG 
AGTTAAAGTG 
AGTTAAAGTG 
A GTTA AAGTG 
AGTTAAAGTG 
AGTTAAAGTG 



GGTGATAAAA 
GGTGATAAAA 
GGTGATAAAA 
GGTGATAAAA 
GGTGATAAAA 
GGTGATAAAA 
GGTGATAAAA 
GGTGATAAAA 
GGTGATAAAA 
GGTGATAAAA 
GGTGATAAAA 



TCACAGCTGG 
TCACAGCTGG 
TCACAGCTGG 
TCACAGCTGG 
TCACAGCTGG 
TCACAGCTGG 
TCACAGCTGG 
TCACAGCTGG 
TCACAGCTGG 
TCACAGCTGG 
TCACAGCTGG 



300 

TCAGCAGTTA 
TCAGCAGTTA 
TCAGCAGTTA 
TCAGCAGTTA 
TCAGCAGTTA 
•TCAGCAGTTA 
TCAGCAGTTA 
TCAGCAGTTA 
TCAGCAGTTA 
TCAGCAGTTA 
TCAGCAGTTA 



msa363690 . 2 f 690 jCOHl 
msa363690 . 2 f 690J4732 
msa363690 . 2 { 690J4781 
rasa363690 . 2 { 690_090 
msa363690 . 2 f 690_CJB110 
msa363690 . 2 ( 690_1169NT 
msa363690.2{690 18RS21 
insa363690 . 2 ( 690_2603 
msa363690 . 2 { 690_A909 
msa363690.2{690_JM9130013 
ms'a363690 . 2 { 690__H36B 
Consensus 



301 

GTTCAATATG 
GTTCAATATG 
GTTCAATATG 
GTTCAATATG 
GTTCAATATG 
GTTCAATATG 
GTTCAATATG 
GTTCAATATG 
GTTCAATATG 
GTTCAATATG 
GTTCAATATG 



ATACAACAAC 
ATACAACAAC 
ATACAACAAC 
ATACAACAAC 
ATACAACAAC 
ATACAACAAC 
ATACAACAAC 
ATACAACAAC 
ATACAACAAC 
ATACAACAAC 
ATACAACAAC 



TGCACAAGCA 
TGCACAAGCA 
TGCACAAGCA 
TGCACAAGCA 
TGCACAAGCA 
TGCACAAGCA 
TGCACAAGCA 
TGCACAAGCA 
TGCACAAGCA 
TGCACAAGCA 
TGCACAAGCA 



GCCTACGACA 
GCCTACGACA 
GCCTACGACA 
GCCTACGACA 
GCCTACGACA 
GCCTACGACA 
GCCTACGACA 
GCCTACGACA 
GCCTACGACA 
GCCTACGACA 
GCCTACGACA 



350 

CTGCTAATCG 
CTGCTAATCG 
CTGCTAATCG 
CTGCTAATCG 
CTGCTAATCG 
CTGCTAATCG 
CTGCTAATCG 
CTGCTAATCG 
CTGCTAATCG 
CTGCTAATCG 
CTGCTAATCG 



msa3 63 690 . 2 { 69 0_COH1 
msa363690 . 2 { 690_M732 
msa363690,2{690 M781 
msa363690 . 2 {690_090 
msa363690.2(690 CJB110 
msa363690 . 2 i 690"*1169KT 
msa363 6 9 0 . 2 { 6 9 0^18RS2 1 
msa363690 . 2 ( 690_2 603 
tnsa363690.2{690 A909 
msa363690.2{690_JM9130013 
msa363690 . 2 { 690_H36B 
Consensus 



351 

TCAATTAAAT 
TCAATTAAAT 
TCAATTAAAT 
TCAATTAAAT 
TCAATTAAAT 
TCAATTAAAT 
TCAATTAAAT 
TCAATTAAAT 
TCAATTAAAT 
TCAATTAAAT 
TCAATTAAAT 



AAAGTAGCGC 
AAAGTAGCGC 
AAAGTAGCGC 
AAAGTAGCGC 
AAAGTAGCGC 
AAAGTAGCGC 
AAAGTAGCGC 
AAAGTAGCGC 
AAAGTAGCGC 
AAAGTAGCGC 
AAAGTAGCGC 



GTCAGATTAA 
GTCAGATTAA 
GTCAGATTAA 
GTCAGATTAA 
GTCAGATTAA 
GTCAGATTAA 
GTCAGATTAA 
GTCAGATTAA 
GTCAGATTAA 
GTCAGATTAA 
GTCAGATTAA 



TAATCTAAAG 
TAATCTAAAG 
TAATCTAAAG 
TAATCTAAAG 
TAATCTAAAG 
TAATCTAAAG 
TAATCTAAAG 
TAATCTAAAG 
TAATCTAAAG 
TAATCTAAAG 
TAATCTAAAG 



400 

ACAACAGGgA 
ACAACAGGgA 
ACAACAGGgA 
ACAACAGGaA 
ACAACAGGaA 
ACAACAGGaA 
ACAACAGGaA 
ACAACAGGaA 
ACAACAGGaA 
ACAACAGGaA 
ACAACAGGaA 



msa363690 . 2 { 690_COH1 
msa363690.2{690 M732 
msa363690 . 2 { 690~M781 
rasa363690. 2(690 090 
maa363690. 2(690 CJB110 
msa363690 . 2 i 690^1169NT 
msa363690.2{690~18RS21 



401 

GTtTTCCAGC 
GTtTTCCAGC 
GTtTTCCAGC 
GTcTTCCAGC 
GTcTTCCAGC 
GTcTTCCAGC 
GTCTTCCAGC 



TATGGAATcA 
TATGGAATcA 
TATGGAATCA 
TATGGAATtA 
TATGGAATtA 
TATGGAATcA 
TATGGAATcA 



AGTGATCAAT 
AGTGATCAAT 
AGTGATCAAT 
AGTGATCAAT 
AGTGATCAAT 
AGTGATCAAT 
AGTGATCAAT 



CTTCaTCATC 
CTTC aTCATC 
CTTCaTCATC 
CTTCtTCATC 
CTTCtTCATC 
CTTCtTCATC 
CTTCtTCATC 



450 

ATCACAAGGA 
ATCACAAGGA 
ATCACAAGGA 
ATCACAAGGA 
ATCACAAGGA 
ATCACAAGGA 
ATCACAAGGA 



1135 



WO 2004/018646 



PCT/US2003/026827 



Table 85: Comparative Sequences relating to SAG1361 



maa363690 . 2 ( 690_2603 ) 
msa363690.2{690_A909) 
msa363690 . 2 {690_JM9130013 J 
msa363690.2{690_H36B}, 
Consensus 



GTcTTCCAGC TATGGAATcA AGTGATCAAT CTTCtTCATC ATCACAAGGA 
GTCTTCCAGC TATGGAATcA AGTGATCAAT CTTCaTCATC ATCACAAGGA 
GTCTTCCAGC TATGGAATcA AGTGATCAAT CTTCaTCATC ATCACAAGGA 
GTcTTCCAGC TATGGAATcA AGTGATCAAT CTTCaTCATC ATCACAAGGA 



msa363690 . 2 { 690_C0H1 
rasa363690.2{690_M732 
maa363690 . 2 { 690_M781 
msa363690.2{690_090 
msa3 63 6 9 0 . 2 { 6 9 0_CJB1 1 0 
msa363690 .2{690_1169NT 
msa363690.2(690_18RS21 
msa363690.2{690_2603 
msa363690 . 2 { 690_A909 
msa363690 . 2 { 690_JM9130013 
msa363690.2{690_H36B 
Consensus 



451 

CAAGGGaCTC 
CAAGGGaCTC 
CAAGGGaCTC 
CAAGGGaCTC 
CAAGGGaCTC 
CAAGGGaCTC 
CAAGGGaCTC 
CAAGGGaCTC 
CAAGGGgCTC 
CAAGGGgCTC 
CAAGGGaCTC 



AATCGACTAG 
AATCGACTAG 
AATCGACTAG 
AATCGACTAG 
AATCGACTAG 
AATCGACTAG 
AATCGACTAG 
AATCGACTAG 
AATCGACTAG 
AATCGACTAG 
AATCGACTAG 



TGGTGCGACG 
TGGTGCGACG 
TGGTGCGACG 
TGGTGCGACG 
TGGTGCGACG 
TGGTGCGACG 
TGGTGCGACG 
TGGTGCGACG 
TGGTGCGACG 
TGGTGCGACG 
TGGTGCGACG 



AATCGTCTAC 
AATCGTCTAC 
AATCGTCTAC 
AATCGTCTAC 
AATCGTCTAC 
AATCGTCTAC 
AATCGTCTAC 
AATCGTCTAC 
AATCGTCTAC 
AATCGTCTAC 
AATCGTCTAC 



500 

AGCAAAATTA 
AGCAAAATTA 
AGCAAAATTA 
AGCAAAATTA 
AGCAAAATTA 
AGCAAAATTA 
AGCAAAATTA 
AGCAAAATTA 
AGCAAAATTA 
AGCAAAATTA 
AGCAAAATTA 



msa3 63690 . 2 f 690_COH1 
msa363690 . 2 j 690_M732 
msa3 63690 . 2 { 690JM781 
msa363690.2{690_090 
msa363690.2(690 CJB110 
msa363 690 . 2 { 690_1169NT 
ms a3 63 6 90 . 2 { 6 9 0_1 BRS2 1 
msa363690.2{690_2603 
msa3 63690 . 2 { 690_A909 
maa363690 . 2 { 690_JM9130013 
msa363690.2{690_H36B 
Consensus 



501 

TCAAAGTCAA 
TCAAAGTCAA 
TCAAAGTCAA 
TCAAAGTCAA 
TCAAAGTCAA 
TCAAAGTCAA 
TCAAAGTCAA 
TCAAAGTCAA 
TCAAAGTCAA 
TCAAAGTCAA 
TCAAAGTCAA 



GCTAATGCTT 
GCTAATGCTT 
GCTAATGCTT 
GCTAATGCTT 
GCTAATGCTT 
GCTAATGCTT 
GCTAATGCTT 
GCTAATGCTT 
GCTAATGCTT 
GCTAATGCTT 
GCTAATGCTT 



CATACAACCA 
CATACAACCA 
CATACAACCA 
CATACAACCA 
CATACAACCA 
CATACAACCA 
CATACAACCA 
CATACAACCA 
CATACAACCA 
CATACAACCA 
CATACAACCA 



ACAACTTCAA 
ACAACTTCAA 
ACAACTTCAA 
ACAACTTCAA 
ACAACTTCAA 
ACAACTTCAA 
ACAACTTCAA 
ACAACTTCAA 
ACAACTTCAA 
ACAACTTCAA 
ACAACTTCAA 



550 

GATTTGAATG 
GATTTGAATG 
GATTTGAATG 
GATTTGAATG 
GATTTGAATG 
GATTTGAATG 
GATTTGAATG 
GATTTGAATG 
GATTTGAATG 
GATTTGAATG 
GATTTGAATG 



msa363690 . 2 { 690_COH1 
rasa3 636 90 . 2 { 6 9 0_M73 2 
msa363690 . 2{690_M78l' 
msa363690 . 2 { 690_090 
msa363690 . 2 { 690__CJB110 
msa3 63690 .21 690_1169NT 
msa363690 .2{690_18RS21 
msa363690.2f 690_2603 
msa363690 . 2 { 690_A909 
msa363690 . 2 { 690_JM9130013 
msa3 63690 . 2 { 690 JH36B 
Consensus 



551 

ATGCTTATGC 
ATGCTTATGC 
ATGCTTATGC 
ATGCTTATGC 
ATGCTTATGC 
ATGCTTATGC 
ATGCTTATGC 
ATGCTTATGC 
ATGCTTATGC 
ATGCTTATGC 
ATGCTTATGC 



AGATGCACAG 
AGATGCACAG 
AGATGCACAG 
AGATGCACAG 
AGATGCACAG 
AGATGCACAG 
AGATGCACAG 
AGATGCACAG 
AGATGCACAG 
AGATGCACAG 
AGATGCACAG 



GCAGAAGTAA 
GCAGAAGTAA 
GCAGAAGTAA 
GCAGAAGTAA 
GCAGAAGTAA 
GCAGAAGTAA 
GCAGAAGTAA 
GCAGAAGTAA 
GCAGAAGTAA 
GCAGAAGTAA 
GCAGAAGTAA 



ATAAAGCACA 
ATAAAGCACA 
ATAAAGCACA 
-ATAAAGCACA 
ATAAAGCACA 
ATAAAGCACA 
ATAAAGCACA 
ATAAAGCACA 
ATAAAGCACA 
ATAAAGCACA 
ATAAAGCACA 



600 

AAAAGCATTG 
AAAAGCATTG 
AAAAGCATTG 
AAAAGCATTG 
AAAAGCATTG 
AAAAGCATTG 
AAAAGCATTG 
AAAAGCATTG 
AAAAGCATTG 
AAAAGCATTG 
AAAAGCATTG 



rasa3 63 690 . 2 f 69 0_COH1 
Risa363690 . 2 J 690_M732 \ 
rasa3 636 90 . 2 { 69 0 _M7 8 1 ' 
msa363690.2{690_090 
msa363690 . 2 ( 690_CJB110 
msa3 63 690 .2(690 1169NT 
msa363 690 . 2 { 690_18RS21 
msa3 63690 . 2{690_2603 
msa363690 ,2{690_A909 
msa363690 . 2 { 690_JM9130013 
msa3 63 6 9 0 . 2 { 69 0_H3 6B 
Consensus 



601 

AATGATACTG 
AATGATACTG 
AATGATACTG 
AATGATACTG 
AATGATACTG 
AATGATACTG 
AATGATACTG 
AATGATACTG 
AATGATACTG 
AATGATACTG 
AATGATACTG 



TTATTACAAG 
TTATTACAAG 
TTATTACAAG 
TTATTACAAG 
TTATTACAAG 
TTATTACAAG 
TTATTACAAG 
TTATTACAAG 
TTATTACAAG 
TTATTACAAG 
TTATTACAAG 



TGACGTATCA 
TGACGTATCA 
TGACGTATCA 
TGACGTATCA 
TGACGTATCA 
TGACGTATCA 
TGACGTATCA 
TGACGTATCA 
TGACGTATCA 
TGACGTATCA 
TGACGTATCA 



GGGACAGTTG 
GGGACAGTTG 
GGGACAGTTG 
GGGACAGTTG 
GGGACAGTTG 
GGGACAGTTG 
GGGACAGTTG 
GGGACAGTTG 
GGGACAGTTG 
GGGACAGTTG, 
GGGACAGTTG' 



650 

TTGAAGTTAA 
TTGAAGTTAA 
TTGAAGTTAA 
TTGAAGTTAA 
TTGAAGTTAA 
TTGAAGTTAA 
TTGAAGTTAA 
TTGAAGTTAA 
TTGAAGTTAA 
TTGAAGTTAA 
TTGAAGTTAA 



msa363690.2( 690 COH1 
msa3 63 6 90 . 2 { 69 o""M73 2 ' 
msa363690 . 2 { 690*14781 ' 
msa363690.2{690_090 
msa3 63690 . 2 ( 690_CJBH0 
msa3 63690 . 2 { 690_1169NT 
insa363 690 .2(69 0_18RS21 
msa363690.2(690_2603 
msa3 636 90 . 2 { 690_A909 
msa363690 . 2 { 690_JM9130013 
msa3 63690. 2{ 6 9 0_H3 6 B 
Consensus 



651 

TAGTGATATT 
TAGTGATATT 
TAGTGATATT 
TAGTGATATT 
TAGTGATATT 
TAGTGATATT 
TAGTGATATT 
TAGTGATATT 
TAGTGATATT 
TAGTGATATT 
TAGTGATATT 



GATCCAGCTT 
GATCCAGCTT 
GATCCAGCTT 
GATCCAGCTT 
GATCCAGCTT 
GATCCAGCTT 
GATCCAGCTT 
GATCCAGCTT 
GATCCAGCTT 
GATCCAGCTT 
GATCCAGCTT 



CAAAAACTAG 
CAAAAACTAG 
CAAAAACTAG 
CAAAAACTAG 
CAAAAACTAG 
CAAAAACTAG 
CAAAAACTAG 
CAAAAACTAG 
CAAAAACTAG 
CAAAAACTAG 
CAAAAACTAG 



TCAAGTACTT 
TCAAGTACTT 
TCAAGTACTT 
TCAAGTACTT 
TCAAGTACTT 
TCAAGTACTT 
TCAAGTACTT 
TCAAGTACTT 
TCAAGTACTT 
TCAAGTACTT 
TCAAGTACTT 



700 

GTCCATGTAG 
GTCCATGTAG 
GTCCATGTAG 
GTCCATGTAG 
GTCCATGTAG 
GTCCATGTAG 
GTCCATGTAG 
GTCCATGTAG 
GTCCATGTAG 
GTCCATGTAG 
GTCCATGTAG 



msa3 63 6 9 0 . 2 ( 690_COH1 
msa363690. 2(690 M732 
maa3 636 90 . 2 ( 690J478 1 
rasa363690.2{690 090 
msa363690 . 2 {690_CJB110 
msa363690 . 2 { 690_1169NT 



701 

CAACTGAaGG 
CAACTGAaGG 
CAACTGAaGG 
CAACTGAaGG 
CAACTGAaGG 
CAACTGAaGG 



TAAACTCCAA 
TAAACTCCAA 
TAAACTCCAA 
TAAACTCCAA 
TAAACTCCAA 
TAAACTCCAA 



GTACAAGGAA 
GTACAAGGAA 
GTACAAGGAA 
GTACAAGGAA 
GTACAAGGAA 
GTACAAGGAA 



CGATGAGTGA 
CGATGAGTGA 
CGATGAGTGA 
CGATGAGTGA 
CGATGAGTGA 
CGATGAGTGA 



750 

GTATGATTTG 
GTATGATTTG 
GTATGATTTG 
GTATGATTTG 
GTATGATTTG 
GTATGATTTG 



1136 



WO 2004/018646 



PCT/US2003/026827 



Table 85: Comparative Sequences relating to SAG1361 



msa363690.2{690_18RS21 
msa363690 . 2 ( 690_2603 
msa363690.2{690_A909 
tnsa363690 . 2 { 690_JM9130013 
ma a3 6 3 6 9 0 . 2 { 6 9 0_H3 6B 
Consensus 



CAACTGAaGG TAAACTCCAA GTACAAGGAA CGATGAGTGA GTATGATTTG 
CAACTGAaGG TAAACTCCAA GTACAAGGAA CGATGAGTGA GTATGATTTG 
CAACTGAgGG TAAACTCCAA GTACAAGGAA CGATGAGTGA GTATGATTTG 
CAACTGAgGG TAAACTCCAA GTACAAGGAA CGATGAGTGA GTATGATTTG 
CAACTGAaGG TAAACTCCAA GTACAAGGAA CGATGAGTGA GTATGATTTG 



msa3 63690 . 2 f 690_COH1 
msa363690. 2(690 M732 
msa363690.2{690_M781 
msa363690 . 2 { 690_090 
msa363690 . 2 f 690_CJB110 
msa363690 .2 [ 690_1169NT 
msa363690.2{690_18RS21 
msa363690.2(690_2603 
msa363690.2{690_A909 
msa363690.2{690_JM9X30013 
msa363690.2{690_H36B 
Consensus 



751 

GCTAATGTtA 
GCTAATGT t A 
GCTAATGTtA 
GCTAATGTtA 
GCTAATGTtA 
GCTAATGTtA 
GCTAATGTtA 
GCTAATGTtA 
GCTAATGTtA 
GCTAATGTtA 
GCTAATGTaA 



AAAAAGAtCA 
AAAAAGAtCA 
AAAAAGAtCA 
AAAAAGAcCA 
AAAAAGAcCA 
AAAAAGAcCA 
AAAAAGAcCA 
AAAAAGAcCA 
AAAAAGAcCA 
AAAAAGAcCA 
AAAAAGAcCA 



GgCTGTTAAA 
GgCTGTTAAA 
GgCTGTTAAA 
GgCTGTTAAA 
GgCTGTTAAA 
GgCTGTTAAA 
GgCTGTTAAA 
GgCTGTTAAA 
GtCTGTTAAA 
GtCTGTTAAA 
GgCTGTTAAA 



ATAAAATCTA 
ATAAAATCTA 
ATAAAATCTA 
ATAAAATCTA 
ATAAAATCTA 
ATAAAATCTA 
ATAAAATCTA 
ATAAAATCTA 
ATAAAATCTA 
ATAAAATCTA 
ATAAAATCTA 



800 

AGGTCTATCC 
AGGTCTATCC 
AGGTCTATCC 
AGGTCTATCC 
AGGTCTATCC 
AGGTCTATCC 
AGGTCTATCC 
AGGTCTATCC 
AGGTCTATCC 
AGGTCTATCC 
AGGTCTATCC 



rasa363690 . 2 { 690_COH1 
msa363690.2{690_M732 
rasa363690 . 2 { 690_M781 ' 
msa363690.2{690_090' 
msa363690.2(690_CJB110' 
msa3 63 6 9 0 . 2 { 69 0JL16 9NT 
rasa3 63 690 . 2 { 69 0_18RS2 1 
maa363690.2f690_2603 
msa363690.2{690_A909 
msa363690 . 2 { 690_JM9130013 
msa3 63690 . 2 { 690_H36B 
Consensus 



801 

TGACAAGGAA 
TGACAAGQAA 
TGACAAGGAA 
TGACAAGGAA 
TGACAAGGAA 
TGACAAGGAA 
TGACAAGGAA 
TGACAAGGAA 
TGACAAGGAA 
TGACAAGGAA 
TGACAAGGAA 



TGGGAAGGTA 
TGGGAAGGTA 
TGGGAAGGTA 
TGGGAAGGTA 
TGGGAAGGTA 
TGGGAAGGTA 
TGGGAAGGTA 
TGGGAAGGTA 
TGGGAAGGTA 
TGGGAAGGTA 
TGGGAAGGTA 



AAATTTCATA 
AAATTTCATA 
AAATTTCATA 
AAATTTCATA 
AAATTTCATA 
AAATTTCATA 
AAATTTCATA 
AAATTTCATA 
AAATTTCATA 
AAATTTCATA 
AAATTTCATA 



TATCTCAAAT 
TATCTCAAAT 
TATCTCAAAT 
TATCTCAAAT 
TATCTCAAAT 
TATCTCAAAT 
TATCTCAAAT 
TATCTCAAAT 
TATCTCAAAT 
TATCTCAAAT 
TATCTCAAAT 



850 

TATCCAGAAG 
TATCCAGAAG 
TATCCAGAAG 
TATCCAGAAG 
TATCCAGAAG 
TATCCAGAAG 
TATCCAGAAG 
TATCCAGAAG 
TATCCAGAAG 
TATCCAGAAG 
TATCCAGAAG 



msa3 63690 . 2 f 690_COH1 
msa363690.2{690 M732 
msa363690.2{690~M781 
msa363690 . 2 { 690_090 
rasa3 63 6 9 0 . 2 { 69 0JZJB1 1 0 
msa363690 . 2 t 690JL169NT 
msa363690.2{690 18RS21 
msa363690 . 2{690_2603 
msa363690.2{690_A909 
msa363690 . 2 { 690_JM9130013 
msa363690 . 2 { 690_H36B 
Consensus 



851 

CAGAAGCAAA 
CAGAAGCAAA 
CAGAAGCAAA 
CAGAAGCAAA 
CAGAAGCAAA 
CAGAAGCAAA 
CAGAAGCAAA 
CAGAAGCAAA 
CAGAAGCAAA 
CAGAAGCAAA 
CAGAAGCAAA 



CAACAATGAC 
CAACAATGAC 
CAACAATGAC 
CAACAATGAC 
CAACAATGAC 
CAACAATGAC 
CAACAATGAC 
CAACAATGAC 
CAACAATGAC 
CAACAATGAC 
CAACAATGAC 



TCTAATAACG 
TCTAATAACG 
TCTAATAACG 
TCTAATAACG 
TCTAATAACG 
TCTAATAACG 
TCTAATAACG 
TCTAATAACG 
TCTAATAACG 
TCTAATAACG 
TCTAATAACG 



GCTCTAGTGC 
GCTCTAGTGC 
GCTCTAGTGC 
GCTCTAGTGC 
GCTCTAGTGC 
GCTCTAGTGC 
GCTCTAGTGC 
GCTCTAGTGC 
GCTCTAGTGC 
GCTCTAGTGC 
GCTCTAGTGC 



900 

TGTAAATTAT 
TGTAAATTAT 
TGTAAATTAT 
TGTAAATTAT 
TGTAAATTAT 
TGTAAATTAT 
TGTAAATTAT 
TGTAAATTAT 
TGTAAATTAT 
TGTAAATTAT 
TGTAAATTAT 



msa363690 . 2 f 690_COH1| 
msa363690.2(690_M732 
msa363690.2{690 M781 
msa363690.2{690 090 
msa3 63 6 9 0 . 2 ( 69 0_CJB110 
msa3 63 690 . 2 ( 690_1169NT 
msa363690.2{690 18RS21 
msa3 63 6 90 . 2 { 6 9 0_2 6 03 
msa363690.2(690 A909 
msa363690 . 2 { 690_JM9130013 
msa363690 . 2 { 690_H36B 
Consensus 



901 

AAATATAAAG 
AAATATAAAG 
AAATATAAAG 
AAATATAAAG 
AAATATAAAG 
AAATATAAAG 
AAATATAAAG 
AAATATAAAG 
AAATATAAAG 
AAATATAAAG 
AAATATAAAG 



TAGATATTAC 
TAGATATTAC 
TAGATATTAC 
TAGATATTAC 
TAGATATTAC 
TAGATATTAC 
TAGATATTAC 
TAGATATTAC 
TAGATATTAC 
TAGATATTAC 
■TAGATATTAC 



********** ********** 



TAGCCCTCTC 
TAGCCCTCTC 
TAGCCCTCTC 
TAGCCCTCTC 
TAGCCCTCTC 
TAGCCCTCTC 
TAGCCCTCTC 
TAGCCCTCTC 
TAGCCCTCTC 
TAGCCCTCTC 
TAGCCCTCTC 
********** 



GATGCATTAA 
GATGCATTAA 
GATGCATTAA 
GATGCATTAA 
GATGCATTAA 
GATGCATTAA 
GATGCATTAA 
GATGCATTAA 
GATGCATTAA 
GATGCATTAA 
GATGCATTAA 



950 

AACAAG GTTT 
AACAAGGTTT 
AACAAGGTTT 
AACAAGGTTT 
AACAAGGTTT 
AACAAGGTTT 
AACAAGGTTT 
AACAAGGTTT 
AACAAGGTTT 
AACAAGGTTT 
AACAAGGTTT 



********** ********** 



msa3 63 690. 2(69 0 jCOHl ' 
m8a363690.2{690J4732 
rasa363690 . 2 { 690J4781 1 
rasa363690 . 2 (690_090 
msa3 63690 . 2 f 690_CJB110 
msa363690.2f690_1169NT 
msa363690.2(690_18RS21 
msa363690 . 2 f 690_2603 
msa363690.2(690_A909 
msa363690.2{690 JM9130013 
rasa363690.2{690_H36B 
Consensus 



951 

TACcGTATCA 
TACcGTATCA 
TACcGTATCA 
TACcGTATCA 
TACcGTATCA 
TACcGTATCA 
TACcGTATCA 
TACcGTATCA 
TACtGTATCA 
TACtGTATCA 
TACtGTATCA 



GTTGAAGTAG 
GTTGAAGTAG 
GTTGAAGTAG 
GTTGAAGTAG 
GTTGAAGTAG 
GTTGAAGTAG 
GTTGAAGTAG 
GTTGAAGTAG 
GTTGAAGTAG 
GTTGAAGTAG 
GTTGAAGTAG 



TTAATGGAGA 
TTAATGGAGA 
TTAATGGAGA 
TTAATGGAGA 
TTAATGGAGA 
TTAATGGAGA 
TTAATGGAGA 
TTAATGGAGA 
TTAATGGAGA 
TTAATGGAGA 
TTAATGGAGA 



TAAGCACCTT 
TAAGCACCTT 
TAAGCACCTT 
TAAGCACCTT 
TAAGCACCTT 
TAAGCACCTT 
TAAGCACCTT 
TAAGCACCTT 
TAAGCACCTT 
TAAGCACCTT 
TAAGCACCTT 



1000 
ATTGTcCCTA 
ATTGTcCCTA 
ATTGTcCCTA 
ATTGTcCCTA 
ATTGTcCCTA 
ATTGTcCCTA 
ATTGTcCCTA 
ATTGTcCCTA 
ATTGTtCCTA 
ATTGTtCCTA 
ATTGTtCCTA 



msa363690. 2(690 COH1 
msa363690 . 2 { 690_M732 
msa363690.2(690 M781 
msa363690 . 2 { 690_090 
msa363690. 2(690 CJB110 



1001 

CAAGTTCTGT 
CAAGTTCTGT 
CAAGTTCTGT 
CAAGTTCTGT 
CAAGTTCTGT 



GAtAAACAAA GATAATAAAC ACTTTGTTTG 
GAtAAACAAA GATAATAAAC A CTTTGTTTG 
GAtAAACAAA GATAATAAAC A CTTTGTTTG 
GAtAAACAAA GATAATAAAC ACTTTGTTTG 
GAtAAACAAA GATAATAAAC ACTTTGTTTG 



1050 
GGTATACAAT 
GGTATACAAT 
GGTATACAAT 
GGTATACAAT 
GGTATACAAT 



1137 



WO 2004/018646 



PCT/US2003/026827 



Table 85: Comparative Sequences relating to SAG1361 



msa3 63 6 9 0 . 2 ( 69 0_1 16 9NT 
m8a363690.2{690_18RS21 
msa363690.2{690_2603 
maa363690.2{690_Aa09 
msa3 63690 . 2 { 690_JM9130013 
msa3 63 69 0 . 2 { 690_H3 6B 
Consensus 



CAAGTTCTGT 
CAAGTTCTGT 
CAAGTTCTGT 
CAAGTTCTGT 
CAAGTTCTGT 
CAAGTTCTGT 



GAtAAACAAA 
GAtAAACAAA 
GAtAAACAAA 
GAcAAACAAA 
GAcAAACAAA 
GAcAAACAAA 



GATAATAAAC 
GATAATAAAC 
GATAATAAAC 
GATAATAAAC 
GATAATAAAC 
GATAATAAAC 



ACTTTGTTTG 
ACTTTGTTTG 
ACTTTGTTTG 
ACTTTGTTTG 
ACTTTGTTTG 
ACTTTGTTTG 



GGTATACAAT 
GGTATACAAT 
GGTATACAAT 
GGTATACAAT 
GGTATACAAT 
GGTATACAAT 



msa3 63690 . 2 ( 690_COH1 
msa363690 . 2 j 690 J4732 
msa363690. 2(690 M781 
msa363690.2{690_090 
msa3 63690. 2(690__CJB110 
msa363690 . 2 < 690_1169NT 
msa363690 .2 { 690_18RS21 
msa363690 . 2f 690_2603 
ma a3 63690 . 2 { 690_A909 
msa3 63690. 2 {690_JM913 0013 
rasa363690 . 2 { 690_H36B 
Consensus 



1051 

GATTCTAATC 
GATTCTAATC 
GATTCTAATC 
GATTCTAATC 
GATTCTAATC 
GATTCTAATC 
GATTCTAATC 
GATTCTAATC 
GATTCTAATC 
GATTCTAATC 
GATTCTAATC 



GTAAAATTTC 
GTAAAATTTC 
GTAAAATTTC 
GTAAAATTTC 
GTAAAATTTC 
GTAAAATTTC 
GTAAAATTTC 
GTAAAATTTC 
GTAAAATTTC 
GTAAAATTTC 
GTAAAATTTC 



CAAAGTTGAA 
CAAAGTTGAA 
CAAAGTTGAA 
CAAAGTTGAA 
CAAAGTTGAA 
CAAAGTTGAA 
CAAAGTTGAA 
CAAAGTTGAA 
CAAAGTTGAA 
CAAAGTTGAA 
CAAAGTTGAA 



GTCAAAATTG 
GTCAAAATTG 
GTCAAAATTG 
GTCAAAATTG 
GTCAAAATTG 
GTCAAAATTG 
GTCAAAATTG 
GTCAAAATTG 
GTCAAAATTG 
GTCAAAATTG 
GTCAAAATTG 



1100 
GTAAAGCTGA 
GTAAAGCTGA 
GTAAAGCTGA 
GTAAAGCTGA 
GTAAAGCTGA 
GTAAAGCTGA 
GTAAAGCTGA 
GTAAAGCTGA 
GTAAAGCTGA 
GTAAAGCTGA 
GTAAAGCTGA 



msa363690.2{690 COH1 
maa363690.2{690~M732' 
msa363690. 2(690 M731 
rasa363690 . 2 {690_090 
msa363690.2{690_CJB110 
msa363690 . 2 { 690_1169NT 
msa3 63 6 90 . 2 ( 69 0_18RS2 1 
msa3 63690. 2{690_2603 
msa363690.2(690_A909 
msa363690.2{690 JM9130013 
msa363690.2{690_H36B 
Consensus 



1101 

TGCTAAGACA 
TGCTAAGACA 
TGCTAAGACA 
TGCTAAGACA 
TGCTAAGACA 
TGCTAAGACA 
TGCTAAGACA 
TGCTAAGACA 
TGCTAAGACA 
TGCTAAGACA 
TGCTAAGACA 
********** 



CAAGAAATTT 
CAAGAAATTT 
CAAGAAATTT 
CAAGAAATTT 
CAAGAAATTT 
CAAGAAATTT 
CAAGAAATTT 
CAAGAAATTT 
CAAGAAATTT 
CAAGAAATTT 
CAAGAAATTT 
********** 



TATCAGGTTT 
TATCAGGTTT 
TATCAGGTTT 
TATCAGGTTT 
TATCAGGTTT 
TATCAGGTTT 
TATCAGGTTT 
TATCAGGTTT 
TATCAGGTTT 
TATCAGGTTT 
TATCAGGTTT 
********** 



GAAAGCAGGA 
GAAAGCAGGA 
GAAAGCAGGA 
GAAAGCAGGA 
GAAAGCAGGA 
GAAAGCAGGA 
GAAAGCAGGA 
GAAAGCAGGA 
GAAAGCAGGA 
GAAAGCAGGA 
GAAAGCAGGA 
********** 



1150 
CAAATCGTgG 
CAAATCGTgG 
CAAATCGTgG 
CAAATCGTgG 
CAAATCGTgG 
CAAATCGTgG 
CAAATCGTgG 
CAAATCGTgG 
CAAATCGTgG 
CAAATCGTgG 
CAAATCGTaG 
********_* 



rasa3 636 9 0 . 2 { 6 9 0_COH1 
msa3 63690 . 2 f 690J4732 ' 
msa3 63690 . 2 { 690 J478 1 ' 
msa363690 . 2 {690_090 ' 
msa363690 . 2 { 690_CJB110 
msa363690.2(690_1169NT 
msa363690.2{690_18RS21 
msa363690.2(690_2603 
msa3 63 690 . 2 { 690_A909 
msa363690 .2{690_JM9130013 
msa363690.2{690_H36B 
Consensus 



1151 

TTACTAATCC 
TTACTAATCC 
TTACTAATCC 
TTACTAATCC 
TTACTAATCC 
TTACTAATCC 
TTACTAATCC 
TTACTAATCC 
TTACTAATCC 
TTACTAATCC 
TTACTAATCC 



AAGcAAAaCt 
AAGcAAAaCt 
AAGcAAAaCt 
AAGtAAAaCc 
AAGtAAAaCc 
AAGtAAAaCc 
AAGtAAAaCc 
AAGtAAAaCc 
AAGcAAAaCt 
AAGcAAAaCt 
AAGtAAAgCt 



TTCAAGGATG 
TTCAAGGATG 
TTCAAGGATG 
TTCAAGGATG 
TTCAAGGATG 
TTCAAGGATG 
TTCAAGGATG 
TTCAAGGATG 
TTCAAGGATG 
TTCAAGGATG 
TTCAAGGATG 



GGCAAAAAAT 
GGCAAAAAAT 
GGCAAAAAAT 
GGCAAAAAAT 
GGCAAAAAAT 
GGCAAAAAAT 
GGCAAAAAAT 
GGCAAAAAAT 
GGCAAAAAAT 
GGCAAAAAAT 
GGCAAAAAAT 



1200 
TGATAATATT 
TGATAATATT 
TGATAATATT 
TGATAATATT 
TGATAATATT 
TGATAATATT 
TGATAATATT 
TGATAATATT 
TGATAATATT 
TGATAATATT 
TGATAATATT 



msa3 63690 . 2 { 690_COH1 
msa363690 . 2 { 690_M732 
msa3 63690 . 2 { 690_M78 1 
msa3 63 690 . 2 { 6 90_0 9 0 
msa3 63690 . 2 { 690_CJB110 
msa363690 . 2 { 690_1169NT 
msa363690.2{690_18RS21 
msa363690.2{690_2603 
msa363690.2{690_A909 
msa3 63690 .2{690__JM913 0013 
tns a363690. 2 (690_H36B 
Consensus 



1201 

GAATCAATcG 
GAATCAATcG 
GAATCAATcG 
GAATCAATcG 
GAATCAATcG 
GAATCAATcG 
GAATCAATcG 
GAATCAATCG 
GAATCAATaG 
GAATCAATaG 
GAATCAATcG 



ATCTTAAgTC 
ATCTTAAgTC 
ATCTTAAgTC 
ATCTTAAcTC 
ATCTTAAcTC 
ATCTTAAcTC 
ATCTTAAcTC 
AT CTTA AcTC 
ATCTTAAgTC 
ATCTTAAgTC 
ATCTTAAgTC 



TAATAAGAAA 
TAATAAGAAA 
TAATAAGAAA 
TAATAAGAAA 
TAATAAGAAA 
TAATAAGAAA 
TAATAAGAAA 
TAATAAGAAA 
TAATAAGAAA 
TAATAAGAAA 
TAATAAGAAA 



1242 

TCAGAGgtga a~ 
TCAGAGgtga a- 
TCAGAGgtga a~ 

TCAGAGg — 

TCAGAGgtga — 
TCAGAGgtga a~ 

TCAGAG 

TCAGAGgtga aA 
TCAGAGgtga aA 
TCAGAGgtga aA 
TCAGAGgtg 



SEQ ID NO. 8511 
STRAIN 2603 frame: 1 

MSKRQNLGI SKKGAI I SGLSVALI WI GGFLWVQSQPNKSAVKTNYKVFNVREGSVSSST 
LLTGKAKANQEQYVYFDANKGNRATVTVKVGD KI TAGQQLVQ YDTTTAQAAYDTANRQIiN 



DLNDAYADAQAKVNKAQKALNDTVI TSDVSGTWE VNSD I D PAS KTSQVLVHVATEGKLQ 
VQGTMSBYDLANVKKDQAVKI KSKVYPDKEWEGKI S Y I SNYPEAEANNND SNNGS SAVNY 
KYKVD ITS PLDALKOGPTVSVBVVNGDKHL I VPTSSV INKDinOHPVV^ S IWE 

VKI GKADAKTQE I LSGLKAGQ I WTNPSKT FKDGQKI DN I ES I DLNSNKKSEVK 



SEQ ID NO. 8512 
STRAIN 090 frame: I 

PLWQSQPinCSAVKTNYKVFNVREGSVSSSTIXTGKAKANO^^ 

VGDKI TAGQQLVQYDTTTAOAA YDTANRQLNKVARQ I NNLKTTGSLPAMBLS DQS S S SSQ 
GQGTQSTSGATNIUXX^^QSQANASYNQQLQDLNDAYADAQAEVN KAQKALNDTVIT SDV 
SGTWEVNSD IDPAS KTSQVLVHVATEGKLQVQGTMSBYDLANVKKDQAVKI KSKWPDK 
BWEGKISYI SNYPEAEANNNDSNNGSSAVNYKYKVDI TSPLDAIiKQGPTVSVBWKGDKH 
LIVPTSSVINKDNKHFVWVYNDSNRKISKVEVKIGKADAKTQEILSGLKA 
TFKDGQKI DNI 5S I DLNSNKKS B 



1138 



WO 2004/018646 



PCT/US2003/026827 



Table 85: Comparative Sequences relating to SAG1361 



SEQ ID HO. 85X3 
STRAIN A909 frame 1 

FLWQSQPNKSAVKTNYTCVFNVREGSVSSSTLLTGKAKANQEQYWFDANKGNR^ 
VGD KI TAGQQLVQYDTT^AQAAYDTANRQIiNKVARQ I NNLKTTG S LP AME SSDQSSSSSQ 
G<X^QSTSGATNRLQQNYQ SQANAS YNQQ LQDLNDA YADAQAKVNKAQ KALNDTV I TSDV 
SGT\AmVNSDIDPASKTSQVIjVHVATEGKLQVQGTMSEYDLANVKKDQSVKI KSKVYPDK 
EWEGKI SY I SNYPEAEANNNDSNNGSSAVNYKYKVDITSPLDALKC^FTVS VEWNGDKH 
LI VPTSSVTNKDNKHFVWVYNDSNRKI SKVEVKIGKADAKTQE I LSGLKAGQI WTNPSK 
TFKDGQKIDNIESIDLKSNKKSEVK 

SEQ ZD NO. 8514 
STRAIN H36B frame: 1 

F1*WVQSQPNKSAVKTNYKVE , NVREGSVSS STLLTGKA 

VGDKI TAGQQLVQYDTTTAGAAYDTANRQLNKVARQ I NNLKTTGS LPAME SSDQSSSSSQ 
GQGTQST SGATNRLQQNYQ S QANAS YNQQLQDLNDAYADAQAEVNKAQKALNDTV I TSDV 
SGTWEVNSD I D PAS KXS QVLVHVATEGKIjQVQGTMS EYDLANVKKDQAVKI KS KVY PDK 
EWEGKI SYI SNYPEAEANNNDSNNG S S AVNYKYKVD I TS PLDALRQGFTVSVEWNGDKH 
III VPTS SVTNKDNKHFVWVYNDSNRKI S KVEVKI G KADAKTQE I LSGLKAGQ I WTNPS K 
AFKDGQKI DNI ES I DLKSNKKSEV 

SEQ ZD HO. 8515 
STRAIN I8RS21 frame: 1 

PLWVQSQPNKSAVKTNYKVFNVREGSVSSSTLLTGKAKANQEQYVY 
VGDKITAGQ^LVQYDTTTAG^^YDTANRQIiNKVARQINNLKTTG SSDQSSSSSQ 
GG^TQSTSGATNRLQQNTQS QANAS YNG^LQDLNDAYADAQABVN^ 
SGTWEVNSD I D PAS KT SQVLVHVATEGKLiQVQGTMS EYDLANVKKDQAVKI KSKVYPDK 
EWEGKI SYI SNYPEAEANNNDSNNGSSAVNYKYKVD ITSPLDALKQGFTVSVEVVNGDKH 
LIVPTSSVINKDNKHFVWVYNDSNRKI SKVEVKIGKADAKTQE I LSGLKAGQ I WTNPSK 
TFKDGQKIDN I ES IDLNSNKKSE 

SEQ ZD HO. 8516 
STRAIN M732 frame: 1 

FLWVQSQPNKSAVKTNYKVFNVREGS VS S STLLTGKAKANQEQYVYFDANKGNRATVTVK 

VGDKI TAGQQLVQYDTTTAQAAYDTANRQLNKVARQ I NNLKTTG S FPAME SSDQSSSSSQ 

GQGTQSTSGATNRIjQQNYQSQANASYNQQLQDIjNDAYADAQJ^EWKA 

SGTWEVNSD I DPAS KT S QVLVHVATEGKLQVQGTMS EYDLANVKKDQAVKI KSKVYPDK 

EWEGKI SYI SNYPEAEANNNDSNNGSSAVNYKYKVD I TSPLDALKGX3FTVSVE^ 

LIVPTSSVINKDNKHFVWVYNDSNRKI SKVEVKIGKADAKTQE I LSGLKAGQ I WTNPSK 

TFKDGQKIDNIES I DLKSNKKSEV 

SEQ ID HO. 8517 
STRAIN COH1 frame: 1 

FLWVQSQPN KSAVKTNY KVFNVREGS VS S S TUVTGKAKANQEQ YVYFDANKGNRATVTW 
VGDKI TAGQQLVQYDTTTAQAAYDTANRQLNKVARQ I NNLKTTGS FPAMESSDQSSSSSQ 
" GQGTQSTSGATNRLQQNYQSQANASYNQQIiQDLNDAYADAQJ^VNK^ 
SGTWEVNSD I DPAS KTS QVLVHVATEGKLQ VQGTMS EYDLANVKKDQAVKI KSKVYPDK 
EWEGKI SYISNYPEAEANNNDSNNGSSAVNYKYKVDITSPLDAIjKQGFT^ 
LIVPTSSVINKDNKHFVWVYNDSNRKI SKVEVKIGK^ 
TFKDGQKIDNIES I DLKSNKKSEV 

SEQ ZD HO. 8518 
STRAIN M781 frame: 1 

FLWVQSQPNKSAVKTNYKVFNVREGSVSSSTLLTGKAKANQEQYVYF 

VGDKI TAGQQLVQYDTTTAQAAYDTANRQLNKVARQ INNLKTTG S FPAMES S DQS S S SSQ 

GQGTQSTSGATNRIjOXmQSQANASYNQQLQDI2ro^ 

SGTWEVNSD I DPAS KTSQVLVHVATEGKLQVGGTMS EYDLANVKKDQAVKI KSKVYPDK 
EWEGKI SYI SNYPEAEANNNDSNNGSSAVNYKYKVDITSPLDA 
LIVPTSSVINKDNKHFVWVYNDSNRKISKVEVKIGKADAIOTEILS 
TFKDGQKIDNIES I DLKSNKKSEV 

SEQ ZD HO. 8519 
STRAIN M781 frame: 1 

FLWVQSQPNKSAVKl'NY KVFNVREGSVS S STLLTG KAKANQEQYVYFDANKGNRATVTVK 
VGDKITAGQQLVQYDTTTAQAAYDTANRQIiNKVARG^^ 
GC<3TQSTSGATNRIiQQNYQSQANASYNQQLQDLNDAYADAQAEVNKAQKA^ 
SGTWEVNSD I D PAS KT S QVLVHVATEGKLQVQGTMS EYDLANVKKDQAVKI KSKVYPDK 
EWEGKI SYI SNYPEAEANNNDSNNGSSAVNYKYKVD I TS PLDALKQG FTVSVEWNGDKH 
LIVPTSSVINKDNKHFVWVYNDSNRKI SKVEVKIGKADAKTQEII^GLK^ 
TFKDGQKIDN I ESI DLKSNKKSEV 

SEQ ZD HO. 8520 
STRAIN CJB1 10 frame: I 

FLWVQSQPNKSAVKTNYKVFNVREGSVS S STLLTGKAKANQEQYVYFDANKGmATVTVK 

VGDKI TAGQQLVQYDTTTAQAAYDTANRQLNKVARQ I NNLKTTGS LP AMELSDQS S S SS Q 

GQX?TQSTSGATNRLC^NYQSQANASYNQQLQDLNDAYADAQAEVNKA 

SGTWEVNSD I D PASKTS QVLVHVATEGKLQVQGTMS EYDLANVKKDQAVKI KSKVYPDK 

EWEGKISYISNYPBAEANNNDSNNGSSAVNYKYKVDITSPLDALKQGFT^ 

LIVPTSSVINKDNKHFVWVYNDSNRKI SKVEVKIGKADJUCTO 

TFKDGQKIDN IBS I DLNSNKKSEV 

SEQ ZD HO. 8521 



1139 



WO 2004/018646 



PCT7US2003/026827 



Table 85: Comparative Sequences relating to SAG1361 



STRAIN 1169NT frame: 1 

FLWVQSQPNRSAVKTNYKVFNVREGSVSSSTLLTGKAKANQEQYVYFD 
VGDKITAGQQL VQYDTTTAQAA YDTANRQLNKVARQ I NNL KTTG SL PAMES SDQSSSSSQ 
GQGTQSTSGAT^mL<MNYQSQANASYNQQI J QDIi^roAYADAQAE^ 

SGTWEVNSD I DPAS KTSQ VLVHVATEGKLQVQGTMS EYDLANVKKDQAVKI KSKVYPDK 
EWEGKI SYI SNYPEAEANNNDSNNGSSAVNYKYKVDI TS PLDAL KQGFTVSVEVVNGDKH 
LI VPTSSVINKDNKHFVWVYNDSNRKI SKVEVKIGKADAKTQEI LSGLKAGQI WTNPSK 
TPKDGQKIDNIBSIDLNSNKKSEV 

SBQ ID NO. 8522 
STRAIN JM9130013 frame: 1 

FLWVQSQPNKSAVKTNYKVFNVRBGSVSSSTI^TGKAK^ 

VGD KI TAGQQL VQ YDTTTAQ AAYDTANRQLNKVARQ I NNLKTTG S LPAME SSDQSSSSSQ 
GC^QSTSGATNRLQQNYQSCANASYNQXMDIi^ 

SGTWEVNSD I D PAS KTSQVljVHVATEGKLQVQGTMSBYDIiANVKKDQSVKI KSKVYPDK 
EWEGKI SYI SNYPEAEANNNDSNNGSSAVNYKYKVDI TSPLDALKQGFTVSVEWNGDKH 
LI VPTSSVTNKDNKHFVWVYNDSNRKI SKVBVXIGKADAKTQE I LSGLKAGQI WTNPSK 
TFKDGQKIDNIES I DLKSNKKSBVK 



PRETTY Of: /biotmp/msa375805 . 2 { *} April 1, 2003 02:58 



msa375805.2(690_COHl 
msa3 7 5 8 05 . 2 { 69 0_M73 2 
msa375805 . 2 { 690_M781 
msa375805.2{690 090 
msa375805 . 2 { 690_CJB110 
msa3 75 B 0 5 . 2 j 69 0_1 16 9NT 
msa375805.2{690_18RS21 
msa375805 . 2 ( 690_2603 
msa375805 . 2 { 690_A909 
msa37580S . 2 { 690_JM9130013 
msa375805 . 2 { 690_H36B 
Consensus 



1 50 

p LWVQSQPNKS AVKTNYKVFN 

F LWVQSQPNKS AVKTNYKVFN 

p LWVQSQPNKS AVKTNYKVFN 

p LWVQSQPNKS AVKTNYKVFN 

p LWVQSQPNKS AVKTNYKVFN 

p LWVQSQPNKS AVKTNYKVFN 

p LWVQSQPNKS AVKTNYKVFN 

mskrqnlgis kkgaiisgls valiwiggF LWVQSQPNKS AVKTNYKVFN 

p LWVQSQPNKS AVKTNYKVFN 

p LWVQSQPNKS AVKTNYKVFN 

j p LWVQSQPNKS AVKTNYKVFN 



msa375805 . 2 ( 690_COH1 
msa375805 . 2 j 690_M732 
msa375805 . 2 (690_M7B1 
msa375805.2{690_090 
msa37 5 8 0 5 . 2 ( 69 0_CJB11 0 
msa375805 . 2 { 690_1169NT 
msa375805.2{690_18RS21 
cnsa375805.2(690_2603 
msa375805.2{69Q_A909 
msa375805.2{690_JM9130013 
msa375B05.2{690_H36B 
Consensus 



51 

VREGSVSSST 
VREGSVSSST 
VREGSVSSST 
VREGSVSSST 
VREGSVSSST 
VREGSVSSST 
VREGSVSSST 
VREGSVSSST 
VREGSVSSST 
VREGSVSSST 
VREGSVSSST 



LLTGKAKANQ 
LLTGKAKANQ 
LLTGKAKANQ 
LLTGKAKANQ 
LLTGKAKANQ 
LLTGKAKANQ 
LLTGKAKANQ 
LLTGKAKANQ 
LLTGKAKANQ 
LLTGKAKANQ 
LLTGKAKANQ 



EQYVYFDANK 
BQYVYFDANK 
EQYVYFDANK 
BQYVYFDANK 
EQYVYFDANK 
EQYVYFDANK 
EQYVYFDANK 
BQYVYFDANK 
BQYVYFDANK 
EQYVYFDANK 
EQYVYFDANK 



GNRATVTVKV 
GNRATVTVKV 
GNRATVTVKV 
GNRATVTVKV 
GNRATVTVKV 
GNRATVTVKV 
GNRATVTVKV 
GNRATVTVKV 
GNRATVTVKV 
GNRATVTVKV 
GNRATVTVKV 



100 

GDKITAGQQL 
GDKITAGQQL 
GDKITAGQQL 
GDKITAGQQL 
GDKITAGQQL 
GDKITAGQQL 
GDKITAGQQL 
GDKITAGQQL 
GDKITAGQQL 
GDKITAGQQL 
GDKITAGQQL 



msa375805 . 2 { 690_COH1 
msa375805 . 2 \ 690_M732 
msa375805. 2(690 M781 
msa375805.2{690 090 
msa375805.2(690 CJB110 
msa375805.2f690^1169NT 
msa375805 . 2 { 690_18RS21 
msa375805.2(690_2603 
msa375B05-2{690_A909 
msa375805.2{690_jJM9130013 
msa375805 . 2 {690_H36B 
Consensus 



101 

VQYDTTTAQA 
VQYDTTTAQA 
VQYDTTTAQA 
VQYDTTTAQA 
VQYDTTTAQA 
VQYDTTTAQA 
VQYDTTTAQA 
VQYDTTTAQA 
VQYDTTTAQA 
VQYDTTTAQA 
VQYDTTTAQA 



AYDTANRQLN 
AYDTANRQLN 
AYDTANRQLN 
AYDTANRQLN 
AYDTANRQLN 
AYDTANRQLN 
AYDTANRQLN 
AYDTANRQLN 
AYDTANRQLN 
AYDTANRQLN 
AYDTANRQLN 



KVARQINNLK 
KVARQINNLK 
KVARQINNLK 
KVARQINNLK 
KVARQINNLK 
KVARQINNLK 
KVARQINNLK 
KVARQINNLK 
KVARQINNLK 
KVARQINNLK 
KVARQINNLK 



TTGSf PAMEs 
TTGSf PAMEs 
TTGSf PAMEs 
TTGSlPAMEl 
TTGSlPAMEl 
TTGS1 PAMEs 
TTGSl PAMEs 
TTGS1 PAMEs 
TTGSl PAMEs 
TTGSl PAMEs 
TTGS1PAMES 



150 

SDQSSSSSQG 
SDQSSSSSQG 
SDQSSSSSQG 
SDQSSSSSQG 
SDQSSSSSQG 
SDQSSSSSQG 
SDQSSSSSQG 



SDQSSSSSQG 



msa375805. 

msa375805. 

msa375805. 
msa375805 
msa375805.2 
msa375805.2 
tnsa375805.2 

msa375805. 

msa375805. 
msa375805.2{690 

msa375805. 



2(690_COH1 
2f 690J4732 
2{690_M781 i 
.2{690_090 
690_CJB110 
690_1169NT 
690 18RS21 
2(690 2603 
2{690~A909 
_JM9130013 
2{690_H36B 
Consensus 



151 

QGtQSTSGAT 
QGtQSTSGAT 
QGtQSTSGAT 
QGtQSTSGAT 
QGtQSTSGAT 
QGtQSTSGAT 
QGtQSTSGAT 
QGtQSTSGAT 
QGaQSTSGAT 
QGaQSTSGAT 
QGtQSTSGAT 



NRLQQNYQSQ 
NRLQQNYQSQ 
NRLQQNYQSQ 
NRLQQNYQSQ 
NRLQQNYQSQ 
NRLQQNYQSQ 
NRLQQNYQSQ 
NRLQQNYQSQ 
NRLQQNYQSQ 
NRLQQNYQSQ 
NRLQQNYQSQ 



ANASYNQQLQ 
ANASYNQQLQ 
ANASYNQQLQ 
ANASYNQQLQ 
ANASYNQQLQ 
ANASYNQQLQ 
ANASYNQQLQ 
ANASYNQQLQ 
ANASYNQQLQ 
ANASYNQQLQ 
ANASYNQQLQ 



DLNDAYADAQ 
DLNDAYADAQ 
DLNDAYADAQ 
DLNDAYADAQ 
DLNDAYADAQ 
DLNDAYADAQ 
DLNDAYADAQ 
DLNDAYADAQ 
DLNDAYADAQ 
DLNDAYADAQ 
DLNDAYADAQ 



200 

AEVNKAQKAL 
AEVNKAQKAL 
AEVNKAQKAL 
AEVNKAQKAL 
AEVNKAQKAL 
AEVNKAQKAL 
AEVNKAQKAL 
AEVNKAQKAL 
AEVNKAQKAL 
AEVNKAQKAL 
AEVNKAQKAL 



raaa375805.2{690 COHl) 
msa375805 . 2 j 690~M732 } 
msa375805.2{690_M78l} 
msa375805.2{690_090) 



201 250 
NDTVITSDVS GTWBVNSDI DPASKTSQVL VHVATBGKLQ VQGTMSEYDL 
NDTVITSDVS GTWBVNSDI DPASKTSQVL VHVATBGKLQ VQGTMSEYDL 
NDTVITSDVS GTWBVNSDI DPASKTSQVL VHVATBGKLQ VQGTMSEYDL 
NDTVITSDVS GTWBVNSDI DPASKTSQVL VHVATBGKLQ VQGTMSEYDL 
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Table 85: Comparative Sequences relating to SAG1361 



msa3 7 5 8 05 . 2 ( 6 9 0_CJB11 0 
tnsa375805.2f690_1169NT 
mea375805.2(690_18RS21 
msa375805 . 2 ( 69O_2603 
msa375805.2(690_A909 
msa375805.2{690 JM9130013 
msa375805.2{690_H36B 
Consensus 



NDTVITSDVS 
NDTVITSDVS 
NDTVITSDVS 
NDTVITSDVS 
NDTVITSDVS 
NDTVITSDVS 
NDTVITSDVS 



GTWEVNSDI 
GTWEVNSDI 
GTWEVNSDI 
GTWEVNSDI 
GTWEVNSDI 
GTWEVNSDI 
GTWEVNSDI 



DPASKTSQVL 
DPASKTSQVL 
DPASKTSQVL 
DPASKTSQVL 
DPASKTSQVL 
DPASKTSQVL 
DPASKTSQVL 



VHVATEGKLQ 
VHVATEGKLQ 
VHVATEGKLQ 
VHVATEGKLQ 
VHVATEGKLQ 
VHVATEGKLQ 
VHVATEGKLQ 



VQGTMSEYDL 
VQGTMSEYDL 
VQGTMSEYDL 
VQGTMSEYDL 
VQGTMSEYDL 
VQGTMSEYDL 
VQGTMSEYDL 



msa3 7 5 8 05 . 2 { 6 9 0_C0H1 
msa37S805.2(690_M732 
msa375805.2{690_M781 
msa375805.2(690 090 
msa375805 ,2f 690_CJB110 
msa375805.2j690_1169NT 
maa375805.2{690_18RS21 
msa375805.2{690_2603 
msa375805 . 2 (690_A909 
tnsa375805 . 2 {690_JM9130013 
tnsa375805.2{690_H36B 
Consensus 



251 

ANVKKDQaVK 
ANVKKDQaVK 
ANVKKDQaVK 
ANVKKDQaVK 
ANVKKDQaVK 
ANVKKDQaVK 
ANVKKDQaVK 
ANVKKDQaVK 
ANVKKDQsVK 
ANVKKDQaVK 
ANVKKDQaVK 



IKSKVYPDKE 
IKSKVYPDKE 
IKSKVYPDKE 
IKSKVYPDKE 
IKSKVYPDKE 
IKSKVYPDKE 
IKSKVYPDKE 
IKSKVYPDKE 
IKSKVYPDKE 
IKSKVYPDKE 
IKSKVYPDKE 



WEGKISYISN 
WEGKISYISN 
WEGKISYISN 
WEGKISYISN 
WEGKISYISN 
WEGKISYISN 
WEGKISYISN 
WEGKISYISN 
WEGKISYISN 
WEGKISYISN 
WEGKISYISN 



YPBABANNND 
YPEAEANNND 
YPEAEANNND 
YPEAEANNND 
YPEAEANNND 
YPEAEANNND 
YPEAEANNND 
YPEAEANNND 
YPEAEANNND 
YPEAEANNND 
YPEAEANNND 



300 

SNNGS SAVNY 
SNNGSSAVNY 
SNNGS SAVNY 
SNNGSSAVNY 
SNNGSSAVNY 
SNNGSSAVNY 
SNNGSSAVNY 
SNNGSSAVNY 
SNNGSSAVNY 
SNNGSSAVNY 
SNNGSSAVNY 



msa375805 . 2{ 690_COH1 
msa375805 . 2 f 690J4732 
tnsa375805 . 2 { 690_M781 
msa375805 . 2 { 690__090 
msa375805 . 2 { 690_CJB110 
msa375805 . 2 { 690_1169NT 
msa375805 . 2 { 690_1BRS21 
msa375805.2{690_2603 
msa375805 . 2 { 690_A909 
msa3 7 58 05 . 2 { 69 0JJM9 X 3 0 0 13 
msa375805.2{690_H36B 
Consensus 



301 

KYKVDITSPL 
KYKVDITSPL 
KYKVDITSPL 
KYKVDITSPL 
KYKVDITSPL 
KYKVDITSPL 
KYKVDITSPL 
KYKVDITSPL 
KYKVDITSPL 
KYKVDITSPL 
KYKVDITSPL 



DALKQGPTVS 
DALKQGPTVS 
DALKQGPTVS 
DALKQGPTVS 
DALKQGFTVS 
DALKQGPTVS 
DALKQGFTVS 
DALKQGFTVS 
DALKQGFTVS 
DALKQGFTVS 
DALKQGFTVS 



VEWNGDKHL 
VEWNGDKHL 
VEWNGDKHL 
VEWNGDKHL 
VEWNGDKHL 
VEWNGDKHL 
VEWNGDKHL 
VEWNGDKHL 
VEWNGDKHL 
VEWNGDKHL 
VEWNGDKHL 



IVPTSSV1NK 
IVPTSSV1NK 
IVPTSSViNK 
IVPTSSViNK 
IVPTSSViNK 
IVPTSSViNK 
IVPTSSViNK 
IVPTSSViNK 
IVPTSSVtNK 
IVPTSSVtNK 
IVPTSSVtNK 



350 

DNKHFVWVYN 
DNKHFVWVYN 
DNKHFVWVYN 
DNKHFVWVYN- 
DNKHFVWVYN 
DNKHFVWVYN 
DNKHFVWVYN 
DNKHFVWVYN 
DNKHFVWVYN 
DNKHFVWVYN 
DNKHFVWVYN 



msa375805 . 2 { 690_C0H1 
msa375805.2{690_M732 
msa375805.2{690_M781 
msa375805.2{690__090 
msa3758 05 . 2 { 690_CJB110 
msa375805 . 2 { 690_1169NT 
msa375805 . 2 { 690_18RS21 
msa3758 05 . 2 { 690_2603 
msa375805.2{690_A909 
msa375805.2{690_JM9130013 
maa375805 . 2 { 690_H36B 
Consensus 



351 

DSNRKISKVE 
DSNRKI SKVB 
DSNRKISKVE 
DSNRKISKVE 
DSNRKISKVE 
DSNRKISKVE 
DSNRKISKVE 
DSNRKISKVE 
DSNRKI SKVB 
DSNRKISKVE 
DSNRKISKVE 



VKIGKADAKT 
VKIGKADAKT 
VKIGKADAKT 
VKIGKADAKT 
VKIGKADAKT 
VKIGKADAKT 
VKIGKADAKT 
VKIGKADAKT 
VKIGKADAKT 
VKIGKADAKT 
VKIGKADAKT 



QEILSGLKAG 
QEILSGLKAG 
QEILSGLKAG 
QEILSGLKAG 
QEILSGLKAG 
QEILSGLKAG 
QEILSGLKAG 
QEILSGLKAG 
QEILSGLKAG 
QEILSGLKAG 
QEILSGLKAG 



QIWTNPSKt 
QIWTNPSKt 
QIWTNPSKt 
QIWTNPSKt 
QIWTNPSKt 
QIWTNPSKt 
QIWTNPSKt 
QIWTNPSKt 
QIWTNPSKt 
QIWTNPSKt 
QIWTNPSKa 



400 

FKDGQKIDNI 
FKDGQKIDNI 
FKDGQKIDNI 
FKDGQKIDNI 
FKDGQKIDNI 
FKDGQKIDNI 
FKDGQKIDNI 
FKDGQKIDNI 
FKDGQKIDNI 
FKDGQKIDNI 
FKDGQKIDNI 



msa375805 . 2 f 690_COH1 
rasa375805 . 2 { 690_M732 
msa375805.2{690 M781 
msa375805 . 2 {690_090 
msa375805 . 2 { 690_CJB110 
msa3 758 0 5 . 2 { 6 9 0_1 1 6 9NT 
msa375805 . 2 { 690_18RS21 
msa3 7 5 8 05 . 2 { 69 0_2 603 
msa3 7 5 8 0 5 . 2 { 69 0_A90 9 
msa3 758 05 . 2 { 69 0_JM9 1 3 0 0 1 3 
msa375805 . 2 { 690_H36B 
Consensus 



401 

ESIDLkSNKK 
ESIDLkSNKK 
ESIDLkSNKK 
BSIDLnSNKK 
ESIDLnSNKK 
ESIDLnSNKK 
ESIDLnSNKK 
BSIDLnSNKK 
ESIDLkSNKK 
ESIDLkSNKK 
ESIDLkSNKK 
*****.**** 



414 
SEv- 
SEv- 
SEv~ 
SE~ 
SEv- 
SEv- 
SE— 
SEvK 
SEvK 
SEvK 
SBv- 
**-* 
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SKQ ID NO. 8601 
STRAIN 2603 

atgaaaaaaattggaattattgtcctcacactactgaccttctttttggtatcttgcgga 
caacaaactaaacaagaaagcactaaaacaactatttctaaaatgcctaaaattgaaggc 
ttcacctattatggaaaaattcctgaaaatccgaaaaaagtaattaattttacatattct 
tacactgggtatttattaaaactaggtgttaatgtttcaagttacagtttagacttagaa 
aaagatagccccgtttttggtaaacaactgaaagaagctaaaaaattaactgctgatgat 
acagaagctattgccgcacaaaaacctgatttaatcatggttttcgatcaagatccaaac 
atcaatactctgaaaaaaattgcaccaactttagttattaaatatggtgcacaaaattat 
ttagatatgatgccagccttggggaaagtattcggtaaagaaaaagaagctaatcagtgg 
gttagccaatggaaaactaaaactctcgctgtcaaaaaagatttacaccatatcttaaag 
cctaacactacttttactattatggatttttatgataaaaatatctatttatatggtaat 
aattttggacgcggtggagaactaatctatgattcactaggttatgctgccccagaaaaa 
gtcaaaaaagatgtctttaaaaaagggtggtttaccgtttcgcaagaagcaatcggtgat 
tacgttggagattatgcccttgttaatataaacaaaacgactaaaaaagcagcttcatca 
cttaaagaaagtgatgtctggaagaatttaccagctgtcaaaaaagggcacatcatagaa 
agtaactacgacgtgttttatttctctgaccctctatctttagaagctcaattaaaatca 
1 1 1 acaaaggct at caaagaaaat acaaat 

SSQ ID NO. 8602 
STRAIN 090 

GAAGG CITCACCTATTATGGAAAAATTCCTGAAAATCCGAAAAAAGTAAT 

TAATTTTACATATTCTTACACTGGGTATTTATTAAAACTAGGTGTTAATQ 

TTTCAAGTTACAGTTTAGACTTAG AAAAAGATAG CCCCGTTTTTGGTAAg 

CAACTGAAAGAAGCTAAAAAATTAACTGCnX^TGATACAGAAGCTA 

CGCACAAAAACCTGATTTAATCATGGTTTTCGATCAAGATCCAAA<^ 

ATACTCTGAAAAAAATTGCACCAACTTTAGTTATTAAAtATGGTG CACAA 

AATTATTTAGATATCATGCCAG CCTTGGGGAAAGTATTCGGT AAAGAAAA 

AGAAGCTAATCAGTGGGTTAGCCAATGGAAAACTAAAACTCTCGCTGCCA 

AAAAAGATTTACZACCAT ATCTT AAAG CCTAACACTACTTTT ACT ATTATG 

GATTTTTATGATAAAAATATCTATTTATATGGTAATAATTTTGGACG 

tGGAGAACTAATCTATGATTCACTAGGTTATGC^ 

AAAAAgATGTcTTTAAAAAAGGGTGGTTTACCXSTTTCgCAAGAAGCAATC 
GGtGATTACGTTGGAGATTATGCX:CTTGTTAATATAAACAAA^ 
AAAAG CAGCTTCa t cACTTAAAGAAAGTGATGTCTGGAAGAATTT 
CTGTCaAAAAAGGGCACATCATAGAAAGTAacTACGACGTGTTTTATTTC 
TCTGACCCTCTATCnTTAGAAGCTCAATTAAAATCATTTACAAA 

SKQ ID NO. 8603 
STRAIN A909 

GAAGGCTTCACCTATTATGGAAAAATTCCTG 

AAAATCCGAAAAAAGTAATTAATTTTACATATTCTTACACTGGATA 

TTAAAACTrAGGAGTTAATGTTTCAAGTTACAGTTTAGACT 

TAgCCCCGTTTTTGGTAAaCAACTGAAAGGAGCTAAAAAATTAACTGCTG 

ATGATACAGAAGCTATTGCCXSCACAAAAACCTGATTTAaTCAT^ 

GATCAAGATCCAAACATCAATACTCTGAAAAAAATTG 

TATTAAATATGGTGCACAAAATTATTTAgATaTGATC 

AAGTATTCGGTAAAGAAAAAGAAG CTAATCAGTGGGTTAGCCAaTGGAAA 

ACTAAAACTCTCGCTGCCAAAAAAGATTTACACCATATCTTAAAACCTAA 

CACTACTTTTACCATTATGGATTTTTATGATAAAAATA 

GTAATAATTTTGGACGCGGTGGAGAACTAATCTATGATTCACTAGGTTAT 

GCTGCCCCAGAAAAAGTCAAAAAAGATGTCTTTAAAAAAGGGTGGT^ 

QaTTTCXSCAAGAAG CAATCGGTg ATTACGTT^ 

ATATAAACAAAACGACTAAAAAAG CAGCTTCATCACTTAAAGAAAGTGAT 
GTCTGGAAGAATTTACCAG CrGTOUUVAAAGGGCACATCATAGAAAGTAA 
CTACGACGTGTTTTATTTCTCTGACCCTcTATCTTTAGAAGCTCAAT^ 
AATCATTTACAAA 

SEQ ID NO. 8604 
STRAIN H36B 

GAAGGCTTCACCTATTATGGAAAA 

ATTCCTGAAAATCCGAAAAAAGTAATTAATTTTAC^ 

ATATTTATTAAAACTAGGAGTTAATGTTOCAAGTTACAGTTTAGACTTAG 

AAAAAGATAgCCCC Gl "l M r r TG GTAAgCAACTGAAAGGAGCTAAAAAATTA 

ACTG CTGATG ATACAGAAGCTATTG CCGCACAAAAACCTCATTTAaTCAT 

GGTTTTTGATCAAgATCCAAACATCAATACTCKSA^ 

CTTTAGTTATTAAATATGGTGCACAAAATTATTTAgATaTgATC 

TTGGGGAaAGT ATTCGGTAAAGAAAAAGAAG CTAATCAGTGGGTTAGCCA 

ATGGAAAACTAAAACTCTCGCTGCCAAAAAAGATTTACACCATATCTTAA 

GGCCTaACIAcTACTTTTACTATTATAGAtTTTTATGATAAAAATATCTAT 

TTATATGGTAATAATTTTGGACGCGG t GGAgAACTAATCTATGATt CACT 

AGGTTATGCTGCCCCAgAAAAAGTCAAAAAAgATGTCrTTAAAAAAGGGT 

GGTT^CCGTTTCgCAAGAAGCAATCXMTgATTACGTTGGAGATTATGCC 

Cn^iTAATATAAACAAAACGACTAAAAAAGCAGC^CaXCACTTAAAGA 

AAGTGATGTTTGGAAGAATTTACCAG CTGT 

AAAGTAACTACGACGTGTTTTATTTCTCTGACCCTCTATCTTTAGAAGCT 
CAATTAAAATCATTTACAAA 
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Table 86: Comparative Sequences relating to SAG1393 



SEQ ID NO. 8605 
STRAIN 18RS21 
GAAGGCTTCACCTATTATGGA 

AAAATTCCTGAAAATCCGAAAAAAGTAATTAATTTTACATATTCTTACAC 
TGGGTATTTATT AAAACT AGGTGTTAATGTTT CAAGTT ACAGTTTAG ACT 
TAGAAAAAGATAGCCCCGTTTTTGGTAAACAACT 
TTAACIX3C!TGATGATACAGAAGCTATTGCCGC^ 
CATGGTTTTCGATCAAGATCCAAACATCAATACTCTOAAAAA^ 
CAACTTTAGTTATTAAATATGGTGCACAAAATTATTTAgATaTGATGCCA 
GCCTTGGGGAAAGTATT CX^TAAAGAAAAAgAAGCTAAT CAGTGGGTT AG 
CCAATGGAAAACTAAAACTCTCXaCTGTCA^ 

TAAAGCCTAACACTACTTTTACTATTATGGATTTTTATGATAAAAATATC 
TATTTATATGGTAATAATTTTG G ACG CGGTGGAGAACTAATCTATGATTC 
ACTAGGTTATGCTGCCCCAgAAAAAGTCAAAAAAgATGTCTTTAAAAAAG 
GGTGGTTTACCGTTTCGCAAGAAGCAATCXK3TGATTACGTTGGAGATTAT 
GCCCTTGTTAATATAAACAAAACgACTAAAAAAG CAGCTTCATCACTTAA 
AGAAAGTGATGTCTGGAAGAATTTACCAGCTGTCAAAAAAGGGCACATCA 
TAGAAAGTAACTACGACGTGTTTTATTTCTCTGACCCrrCTATCnTTAGM 
G CTCAATTAAAATCATTT ACAAA 

SEQ ID NO. 8606 
STRAIN M732 
GAAGGCTTCACCTATTATGG 

AAAAATTCCTGAAAATCCGAAAAAAGTAATTAATTTTACATATTCTTACA 

CTGGGTATTTATTAAAACTAGGTGTTAATGTTTCAAGTTACAGTTTAGAC 

TTAGAAAAAGATAGCCCCGT^TTTGGTAAGCAACTGAAAGAAGCTA 

ATTAACTGCTGATG ATACAGAAG CTATTGCCGCACAAAAACCTGATTT AA 

TCATGGTTTTCGATCAAGATCCAAACATCAATACTCTGAAAAAAAT/IG 

CC!AACTTTAGTTATTAAATATGGTGCACAAAATTATTT^ 

AGCCTTGGGGAAAGTATTCGGTAAAGAAAAAGAAGCTAATCAGtGGGTTA 

GCCAATGGAAAACTAAAACTCTCGCTGCCAAAAAAGATTTACAC 

TTAAAGCCTAACACTACTTTTACTATTATGGATTTTTATGATAAAAATAT 

CT ATTTAT ATGGTAAT AATTT TGGACg CGGt GGAg AACTAAT CTATGATT 

CACTAGGTTATG CTG CCCCAG AAAAAGTCAAAAAAGATGTCTTTAAAAAA 

GGGTGGTTTACCGTTTCGCAAGAAGCAATCGGTGATTACGTTGGAGAOT 

TGCCCTTX5TTAATATAAACAAAACG ACTAAAA7VAGCAG CTTCATCACTTA 

AAGAAAGTGATGTCTGGAAGAAtTTACCAGCTGTCAAAAAAGGGCACATC 

ATAGAAT^GTAACTACGACGTGTTTTATTTCTCTGACCCTCTATCT^ 

AGCTCAATTAAAATCATTTACAAA 

SEQ ZD NO. 8607 
STRAIN COH1 
GAAGGCTTCACCTATTATG 

GAAAAATTCCTGAA7VATCCGAAAAAAGTAATTAATTTTACATATTCTTAC 

ACTGGGTATTTATTAAAACTAGGTCTTAATGTTTCAAGTTA 

CTTAGAAAAAGATAGCCCCGTTTTTGGTAAGCAACTGAAAGAAGCTAAAA 

AATTAACTGCTGATGATAC^GAAGCTATTGCCGCACAAAAACCT^ 

ATCATGGTTTTCGATCAAGATCCAAACATCAATAC^^ 

ACCAACITTAGTT ATTAAATATGGTGGACAA C 

CAGCCTTGGGGAAAGTaTT cGGTAAAGAAAAAGAAGCTAATCAGTGGGTT 

AGCCAATGGAAAACTAAAACTCTCGCTGCCAAAAAAGATTTACACCATAT 

CTTAAAGCCTAACACTACTTTTACTATTATGGATTTTTATGATAAAAATA 

TCTATTTATATGGTAATAATTTTGGAOGCX^TGGAGAACTAATCTATGAT 

TCACTAGG^rTATGCTGCCCCAGAAAAAGTCAAAAAAGATGTCrTTAAAAA 

AGGGTGGTTTACCGTTTOSCAAGAAGCAATCGGTGATTACGTTGGAGATO 

ATGCCCTTGTTAATATAAACAAAACGACTAAAAAAGCAGCTTCATCACTT 

AAAGAAAGTGATGTCTGGAAGAATTTACCAG CTGTCAAAAAAGGG CACAT 

CATAGAAAGTAACTACGACGTGTTTTATTTCTCTGACCCTCTATCTTTAG 

AAGCTCAATTAAAATCATTTACAAA 

SEQ XD NO. 8608 
STRAIN M781 

GAAGGCTTCACCTATTATGG 

AAAAATTCCTGAAAATCCGAAAAAAGTAATTAATTT^ 

CTGGGTATTTATTAAAACTAGGTGTTAATGTTTCA^ 

TTAgAAAAAGATAGCCCraTTTTTGGTAAGCAACTGAAAG 

ATTAACTGCTGATGATACAGAAGCTATTGCCGCACAAAAACC^ 

TCAT GGTTT TCGATCAAGATCCAAACATCAATAC^ 

C CAACTTT AGTT ATTAAATATGGTG CACAAAATT ATTTAg AT ATG ATGC C 
AGCCTTGGGGAAAGTATTCGGtAAAGAAAAAGAAGCTAATCAGTGGGTTA 
GCCAATGGAAAACTAAAACTCTCGCTGCCAAAAAAGATTTAC^ 

CT ATTTAT ATGG T AAT AATTTTGGACG CGGTGG AGAACT AATCT ATG ATT 
CACTAGGTTATGCTGCCCCAGAAAAAGTCAAAAAAGATGTCTTTAAAAAA 
GGGTGGTTTACCGTTTCGCAAGAAGCAATCX^TGATTACGTTGGAGATTA 
TGCCCTTGTTAATATAAACAAAACGACrAAAAAAGCAGCITCATCA 
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AAGAAAGTGATGTCTGGAAGAATTTACCAGCTGTCAAAAAAGGGCACATC 
AT AGAAAGTAACT ACGACGTGTTTT ATTTCTCTG AC CCTCTATCTTT AGA 
AGCTCAATTAAAATCATTTACAAA 

SEQ ID NO. 8609 

STRAIN CJB1 10 

G AAGG CTTCACCTATTATGGA 

AAAATTCCTGAAAATCCGAAAAAAGTAATTAATTTTACATATTCTTACAC 

TGGGTATTTATTAAAACTAGGTGTTAATGTTTCAAGTTACZA^ 

TAGAAAAAGATAGCCCCGTTTTTGGTAAGCAACTGAAAGAAGCTAAAAAA 

TTAACTGCTGATGATACAGAAO ATTGCCG CACAAAAACCTGATTTAAT 

CATGGTTTTCG AT CAAG AT CC^AACATCAAT ACTCTGAAAAAAATTG CAC 

CAACTTTAGTTATTAAATATGGTGCACAAAATTATTTAgATATGATGCCA 

G CCTTGGGGAAAGTATTCGG TAAAG AAAAAGAAG CTAATCAGTGGGTT AG 

CCAATGGAAAACTAAAACTCTCGCTGCCAAAAAAGATTTACACCATATCT 

TAAAGCCTAACACTACTTTTACrATTATGGATTTTTATGATAAAAATATC 

T ATTTATATGGTAATAATTTTGG ACG CGG t GGAGAACTAAT CTATGATTC 

ACTAGGTTATGCTGCCCCAGAAAAAGTCAAAAAAGATGTCTTTAAAAAAG 

GGTGGTTTACCGTTTCGOU^GAAGCAATCGGTGATTACGTTGGAGATTAT 

GCCCTTGTTAATATAAACAAAACGACTAAAAAAGCAGCT^ 

AGAAAGTGATGTCTGGAAGAATTTACCAGCTGTCAAAAAAGGGCACATXA 

TAGAAAGTAACTACG ACGTGTTTTATTTCTCTG ACCCT CTATCTTTAGAA 

GCTCAATTAAAATCATTTACAAA 

SEQ ID NO. 8610 
STRAIN U69NT 

GAAGGCTTCACCTATTATGGAAAAATT 

CCTGAAAATCCGAAAAAAGTAATTAATTTTACATATTCTTACACTGGGTA 

TTTATTAAAACTAGGTGTTAATGTTTCAAGTTACAGTTTW 

AAGATAGCCCCGTTTTTGGTAAGCAACTGAAAGAAG CT AAAAAATTAACT 

GCH^TGATACAGAAGCTATTGCCgcACAAaaACCTGATTTAATCATGGT 

TTTCGATCAAGATCCAAAGATCAATACTCTGAAAAAA^ 

TAGTTATTAAATATGGTGCACAAAATTATTTAgATATGATGCCAGCCTTG 

GGGAAAGTATTCGGTAAAGAAAAAGaaGCTAATCAGTGGGTTAGCCAATG 

GAAAACTAAAACTCTCGCTGCCAAAAAAGATTTACACCATATCTTA 

CTAACACTACTTTTACTATTATGGATTTTTATGATAAAAAT^ 

TATGGTAATAATTTTGGACGCGGTGGAGAACTAATCTATGATTCACTAGG 

TTATGCTGCC CCAgAAAAAGTCAAAAAAGATGTCTTTAAAAAAGGGTGGT 

TTACCGTTTCgCAAGAAGCAATCGGTGATTACGTTGGAGATTATC 

GTTAATATAAACAAAACGACTAAAAAAGCAGCTTCATCACTTAAAGAAAG 

TGATGTCTGGAAGAATTTACCAGCTGTCAAAAAAGGGC^a^TCATAGAAA 

GTAACTACXxACGTGTTTTATTTci^rGACCCT 

TTAAAATCATTTACAAA 

SEQ ID NO. 8611 
STRAIN JM9130013 
GAAGGCTTCACCTATTATG 

GAAAAATTCCTGAAAATCCGAAAAAAGTAATTAATTTTACATATTCTTAC 
ACTGGATATTTATTAAAACTAGGAGTTAATGTTTCAAGTTACAGTTTAGA 

AATTAACTGCTGATGATACAGAAG CTATTGCCGCACAAAAACCTGATTTA 
ATCATGGTTTTTGATCAAGATCCAAACATCAATACT 
ACCAACTTTAGTTATTAAATATGGTGCACAAAATTATTTAgATATGATGC 
CAGCTTTGGGGAAAGTATTCGGTAAAGAAAAAGAAGCTAATCAGTGGGTT 
• AGCCAATGGAAAACTAAAACTCTCGCTGCCAAAAAAGATTT 
CTTAAAACCTAACACTACriUTACCATTATGGATTTT^ 
TCTATTTATATGGTAATAATTTTGGACGCGGtGGAGAACTAATCTATGAT 
TCACTAGGTTATGCTGCCCCAgAAAAAGTCAAAAAAGATGTCTTTAAAAA 
AGGGTGGTTTACTOTTTCgCAAGAAGCAATCGGTGATTACGTTGGAGA 
ATGCCCTTGTTAATATAAACAAAACGACTAAAAAAGCAGCTTCATCACTT 
AAAGAAAGTGATGTCTGGAAGAATTTACCAGCTGTCAAAAAAGGGCACAT 
CATAGAAAGTAACTAC^CGTGTTTTATTTCTCIX3A 
AAGCTCAATTAAAATCATTTACAAA 



PRETTY of: /biotmp/msa521731.2{*} April 28, 2003 08:07 



mfla521731 . 2 { 691_090 
msa521731 . 2 { 691_1169NT 
msaS21731.2{691 CJB110 
msa521731 . 2 { 691_C0H1 
msaS21731 . 2 691_M732 
msaS21731 . 2 { 691_M781 
mfiaS21731 . 2 { 691_18RS21 
msa521731 . 2 {691_2603 



50 



atgaaaaaaa ttggaattat tgtcctcaca ctactgacct tctttttggt 
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msa521731.2{691_A909} 
msa521731 . 2 { 691JJM9130013 > 
msa521731.2{691_H36B} 
Consensus 



msa521731.2{691_090 
msa521731 . 2 { 691_1169NT 
rasaS21731 . 2 { 691_CJB110 
msa521731.2{691 COH1 
msa521731 .2 691~M732 
msa521731 . 2 { 691_M7 81 
msa521731 . 2 {691_18RS21 
msa521731 . 2 i 691_2603 
msa521731.2{691_A909 
msa521731 . 2 { 691_JM9130013 
msa521731 . 2 {691_H36B 
Consensus 



51 



100 



atcttgcgga caacaaacta aacaagaaag cactaaaaca actatttcta 



********** ********** ********** ********** ********** 



msaS21731.2{691 090 
msa52i731 . 2 { 691_1169NT 
msa521731 . 2 { 691_CJB110 
msa521731 . 2 { 691_COHl 
msa521731 .2 691_M732 
rasa521731.2{691_M7Bl 
msa521731.2{691 18RS21 
msa521731.2{691 2603 
msa521731.2{691_A909 
msa521731 . 2 { 691__JM9130013 
msa521731 . 2 {691_H36B 
Consensus 



101 150 

GAAGGC TTCACCTATT ATGGAAAAAT TCCTGAAAAT 

GAAGGC TTCACCTATT ATGGAAAAAT TCCTGAAAAT 

GAAGGC TTCACCTATT ATGGAAAAAT TCCTGAAAAT 

GAAGGC TTCACCTATT ATGGAAAAAT TCCTGAAAAT 

• GAAGGC TTCACCTATT ATGGAAAAAT TCCTGAAAAT 

GAAGGC TTCACCTATT ATGGAAAAAT TCCTGAAAAT 

GAAGGC TTCACCTATT ATGGAAAAAT TCCTGAAAAT 

aaatgcctaa aattGAAGGC TTCACCTATT ATGGAAAAAT TCCTGAAAAT 

GAAGGC TTCACCTATT ATGGAAAAAT TCCTGAAAAT 

GAAGGC TTCACCTATT ATGGAAAAAT TCCTGAAAAT 

GAAGGC TTCACCTATT ATGGAAAAAT TCCTGAAAAT 



msa521731 . 2 { 691_090 
msa521731 . 2 { 691_1169Nt' 
msa521731 .2(6 91_CJB110 
msa521731.2{69 l_COHl ' 
msa521731 . 2 (691_M732 
msa521731 . 2 { 691_M781 
msa521731 . 2 { 691JL8RS21 
msa521731 . 2 (691_2603 
msa521731 . 2 {691_A909 
msa521731 . 2 { 691_JM9130013 
msa521731 . 2 { 691_H36B 
Consensus 



151 

CCGAAAAAAG 
CCGAAAAAAG 
CCGAAAAAAG 
CCGAAAAAAG 
CCGAAAAAAG 
CCGAAAAAAG 
CCGAAAAAAG 
CCGAAAAAAG 
CCGAAAAAAG 
CCGAAAAAAG 
CCGAAAAAAG 



TAATTAATTT 
TAATTAATTT 
TAATTAATTT 
TAATTAATTT 
TAATTAATTT 
TAATTAATTT 
TAATTAATTT 
TAATTAATTT 
TAATTAATTT 
TAATTAATTT 
TAATTAATTT 



TACATATTCT 
TACATATTCT 
TACATATTCT 
TACATATTCT 
TACATATTCT 
TACATATTCT 
TACATATTCT 
TACATATTCT 
TACATATTCT 
TACATATTCT 
TACATATTCT 



TACACTGGgT 
TACACTGGgT 
TACACTGGgT 
TACACTGGgT 
TACACTGGgT 
TACACTGGgT 
TACACTGGgT 
TACACTGGgT 
TACACTGGaT 
TACACTGGaT 
TACACTGGaT 



200 

ATTTATTAAA 
ATTTATTAAA 
ATTTATTAAA 
ATTTATTAAA 
ATTTATTAAA 
ATTTATTAAA 
ATTTATTAAA 
ATTTATTAAA 
ATTTATTAAA 
ATTTATTAAA 
ATTTATTAAA 



. msa521731 . 2 { 691_090 
msa521731.2(691_1169NT 
msa521731 . 2 { 691_CJB110 
msa521731 . 2 ( 691_COHl 
msa521731 . 2 { 691_M732 
msa521731 . 2 { 691_M781 
msa521731 . 2 { 691_18RS21 
msa521731 . 2 [ 691__2603 
msa521731 . 2 (691_A909 
msa521731 . 2 { 691_JM9130013 
msa521731.2{691_H36B 
Consensus 



201 

ACTAGGtGTT 
ACTAGGtGTT 
ACTAGGtGTT 
ACTAGGtGTT 
ACTAGGtGTT 
ACTAGGtGTT 
ACTAGGtGTT 
ACTAGGtGTT 
ACTAGGaGTT 
ACTAGGaGTT 
ACTAGGaGTT 
******_*** 



AATGTTTCAA 
AATGTTTCAA 
AATGTTTCAA 
AATGTTTCAA 
AATGTTTCAA 
AATGTTTCAA 
AAT GTTTC AA 
AATGTTTCAA 
AATGTTTCAA 
AATGTTTCAA 
AATGTTTCAA 



GTTACAGTTT 
GTTACAGTTT 
GTTACAGTTT 
GTTACAGTTT 
GTTACAGTTT 
GTTACAGTTT 
GTTACAGTTT 
GTTACAGTTT 
GTTACAGTTT 
GTTACAGTTT 
GTTACAGTTT 



AGACTTAGAA 
AGACTTAGAA 
AGACTTAGAA 
AGACTTAGAA 
AGACTTAGAA 
AGACTTAGAA 
AGACTTAGAA 
AGACTTAGAA 
AGACTTAGAA 
AGACTTAGAA 
AGACTTAGAA 



250 

AAAGATAGCC 
AAAGATAGCC 
AAAGATAGCC 
AAAGATAGCC 
AAAGATAGCC 
AAAGATAGCC 
AAAGATAGCC 
AAAGATAGCC 
AAAGATAGCC 
AAAGATAGCC 
AAAGATAGCC 



********** ********** ********** ********** 



msa521731 . 2 { 691_090 ] 
msa521731.2(691 1169NT 
msa521731 . 2 { 691*-CJB110 \ 
msa521731 . 2 { 6?l_COHl ' 
msa521731.2i691_M732' 
msa521731 . 2 { 691J4781 
msa521731.2{691 18RS21 
msa521731.2{691 2603 
msa521731 . 2 { 691_A909 
msa521731.2{691 JM9130013 
msa521731.2{691_H36B 
Consensus 



251 

CCGTTTTTGG 
C CGTTTTTG G 
CCGTTTTTGG 
CCGTTTTTGG 
CCGTTTTTGG 
CCGTTTTTGG 
CCGTTTTTGG 
CCGTTTTTGG 
CCG TTTTTG G 
CCGTTTTTGG 
CCGTTTTTGG 



TAAgCAACTG 
TAAgCAACTG 
TAAgCAACTG 
TAAgCAACTG 
TAAgCAACTG 
TAAgCAACTG 
TAAaCAACTG 
TAAaCAACTG 
TAAaCAACTG 
TAAgCAACTG 
TAAgCAACTG 



AAAGaAGCTA 
AAAGaAGCTA 
AAAGaAGCTA 
AAAGaAGCTA 
AAAGaAGCTA 
AAAGaAGCTA 
AAAGaAGCTA 
AAAGaAGCTA 
AAAGgAGCTA 
AAAGgAGCTA 
AAAGgAGCTA 



AAAAATTAAC 
AAAAATTAAC 
AAAAATTAAC 
AAAAATTAAC 
AAAAATTAAC 
AAAAATTAAC 
AAAAATTAAC 
AAAAATTAAC 
AAAAATTAAC 
AAAAATTAAC 
AAAAATTAAC 



300 

TGCTGATGAT 
TGCTGATGAT 
TGCTGATGAT 
TGCTGATGAT 
TGCTGATGAT 
TGCTGATGAT 
TGCTGATGAT 
TGCTGATGAT 
TGCTGATGAT 
TGCTGATGAT 
TGCTGATGAT 



301 



350 



msa5 2 17 3 1 . 2 { 6 9X_0 9 0 \ ACAGAAGCTA TTGCCGCACA AAAACCTGAT TTAATCATGG TTTTcGATCA 
msa521731 . 2 { 6 91JL16 9NT } ACAGAAGCTA TTGCCGCACA AAAACCTGAT TTAATCATGG TTTTcGATCA 
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rasaS2 1731 . 2 { 691_CJB110 
msa521731 . 2 ( 691_COHl 
msa521731.2( 691_M732 
msa521731.2{691 M781 
rasa521731 . 2 {691_18RS21 
msa521731 . 2 ( 691_2603 
msaS 2 1 73 1 . 2 { 6 9 1_A9 0 9 
msa521731 . 2 { 691_JM9130013 
msa521731.2{691_H36B 
Consensus 



ACAGAAGCTA 
ACAGAAGCTA 
ACAGAAGCTA 
ACAGAAGCTA 
ACAGAAGCTA 
ACAGAAGCTA 
ACAGAAGCTA 
ACAGAAGCTA 
ACAGAAGCTA 
********** 



TTGCCGCACA 
TTGCCGCACA 
TTGCCGCACA 
TTGCCGCACA 
TTGCCGCACA 
TTGCCGCACA 
TTGCCGCACA 
TTGCCGCACA 
TTGCCGCACA 
********** 



AAAACCTGAT 
AAAACCTGAT 
AAAACCTGAT 
AAAACCTGAT 
AAAACCTGAT 
AAAACCTGAT 
AAAACCTGAT 
AAAACCTGAT 
AAAACCTGAT 
********** 



TTAATCATGG 
TTAATCATGG 
TTAATCATGG 
TTAATCATGG 
TTAATCATGG 
TTAATCATGG 
TTAATCATGG 
TTAATCATGG 
TTAATCATGG 
********** 



TTTTcGATCA 
TTTTcGATCA 
TTTTcGATCA 
TTTTcGATCA 
TTTTCGATCA 
TTTTcGATCA 
TTTTtGATCA 
TTTTtGATCA 
TTTTtGATCA 
********** 



msa521731 . 2 { 691_090 
msaS21731.2(691 1169NT 
msa521731 . 2 {69l3cJB110 
msa521731.2( 691 COH1 
msa521731 . 2 j 691~M732 
msa521731 . 2 { 691_M781 
msa521731.2{691_18RS21 
maa521731 . 2 ( 691_2603 
msaS21731 . 2 { 691_A909 
msa521731 . 2 { 691_JM9130013 
msa521731 . 2 { 691_H36B 
Consensus 



351 

AGATCCAAAC 
AGATCCAAAC 
AGATCCAAAC 
AGATCCAAAC 
AGATCCAAAC 
AGATCCAAAC 
AGATCCAAAC 
AGATCCAAAC 
AGATCCAAAC 
AGATCCAAAC 
AGATCCAAAC 



ATCAATACTC 
ATCAATACTC 
ATCAATACTC 
ATCAATACTC 
ATCAATACTC 
ATCAATACTC 
ATCAATACTC 
ATCAATACTC 
ATCAATACTC 
ATCAATACTC 
ATCAATACTC 



TGAAAAAAAT 
TGAAAAAAAT 
TGAAAAAAAT 
TGAAAAAAAT 
TGAAAAAAAT 
TGAAAAAAAT 
TGAAAAAAAT 
TGAAAAAAAT 
TGAAAAAAAT 
TGAAAAAAAT 
TGAAAAAAAT 



TGCACCAACT 
TGCACCAACT 
TGCACCAACT 
TGCACCAACT 
TGCACCAACT 
TGCACCAACT 
TGCACCAACT 
TGCACCAACT 
TGCACCAACT 
TGCACCAACT 
TGCACCAACT 



400 

TTAGTTATTA 
TTAGTTATTA 
TTAGTTATTA 
TTAGTTATTA 
TTAGTTATTA 
TTAGTTATTA 
TTAGTTATTA 
TTAGTTATTA 
TTAGTTATTA 
TTAGTTATTA 
TTAGTTATTA 



msa521731 . 2 {691__090 
msa521731 . 2 ( 691_1169NT 
msa521731.2{691 CJB110 
msa521731 . 2 ( 691_COHl 
msa521731 . 2 { 691_M732 
msa521731 . 2 { 691_M781 
msaS21731 . 2 {691JL8RS21 
msa521731 . 2 ( 691_2603 
rasa521731 . 2 { 691_A909 
insaS21731 . 2 {691_JM9130013 
msaS21731 . 2 { 691_H36B 
Consensus 



401 

AATATGGTGC 
AATATGGTGC 
AATATGGTGC 
AATATGGTGC 
AATATGGTGC 
AATATGGTGC 
AATATGGTGC 
AATATGGTGC 
AATATGGTGC 
AATATGGTGC 
AATATGGTGC 
********** 



ACAAAATTAT 
ACAAAATTAT 
ACAAAATTAT 
ACAAAATTAT 
ACAAAATTAT 
ACAAAATTAT 
ACAAAATTAT 
ACAAAATTAT 
ACAAAATTAT 
ACAAAATTAT 
ACAAAATTAT 
********** 



TTAGATATGA 
TTAGATATGA 
TTAGATATGA 
TTAGATATGA 
TTAGATATGA 
TTAGATATGA 
TTAGATATGA 
TTAGATATGA 
TTAGATATGA 
TTAGATATGA 
TTAGATATGA 
********** 



TGCCAGCcTT 
TGCCAGCcTT 
TGCCAGCcTT 
TGCCAGCcTT 
TGCCAGCcTT 
TGCCAGCCTT 
TGCCAGCcTT 
TGCCAGCcTT 
TGCCAGCtTT 
TGCCAGCtTT 
TGCCAGCtTT 
*******_** 



450 

GGGGAAAGTA 
GGGGAAAGTA 
GGGGAAAGTA 
GGGGAAAGTA 
GGGGAAAGTA 
GGGGAAAGTA 
GGGGAAAGTA 
GGGGAAAGTA 
GGGGAAAGTA 
GGGGAAAGTA 
GGGGAAAGTA 
********** 



rasa521731 . 2 { 691_090 
msa521731 . 2 { 691_1169NT 
msa521731.2{691 CJB110 
msa521731 . 2 { 691_COHl 
msa521731 . 2 { 691_M732 
msa521731 . 2 { 691_M781 
msa521731 . 2 { 691_18RS21 
msaS21731. 2(691 2603 
msa521731 . 2 { 691~A909 
msa521731 . 2 { 691_JM9130013 
msa521731 . 2 { 691_H36B 
Consensus 



451 

TTCGGTAAAG 
TTCGGTAAAG 
TTCGGTAAAG 
TTCGGTAAAG 
TTCGGTAAAG 
TTCGGTAAAG 
TTCGGTAAAG 
TTCGGTAAAG 
TTCGGTAAAG 
TTCGGTAAAG 
TTCGGTAAAG 



AAAAAGAAGC 
AAAAAGAAGC 
AAAAAGAAGC 
AAAAAGAAGC 
AAAAAGAAGC 
AAAAAGAAGC 
AAAAAGAAGC 
AAAAAGAAGC 
AAAAAGAAGC 
AAAAAGAAGC 
AAAAAGAAGC 



TAATCAGTGG 
TAATCAGTGG 
TAATCAGTGG 
TAATCAGTGG 
TAATCAGTGG 
TAATCAGTGG 
TAATCAGTGG 
TAATCAGTGG 
TAATCAGTGG 
TAATCAGTGG 
TAATCAGTGG 



GTTAGCCAAT 
GTTAGCCAAT 
GTTAGCCAAT 
GTTAGCCAAT 
GTTAGCCAAT 
GTTAGCCAAT 
GTTAGCCAAT 
GTTAGCCAAT 
GTTAGCCAAT 
GTTAGCCAAT 
GTTAGCCAAT 



500 

GGAAAACTAA 
GGAAAACTAA 
GGAAAACTAA 
GGAAAACTAA 
GGAAAACTAA 
GGAAAACTAA 
GGAAAACTAA 
GGAAAACTAA 
GGAAAACTAA 
GGAAAACTAA 
GGAAAACTAA 



msa521731.2{691 090 
msa521731 . 2 ( 691_1169NT 
msa521731 . 2 {691_CJB110 
msa521731 . 2 { 691_COHl 
msa521731 . 2 1 691_M732 
msa521731.2{691 M781 
msaS21731 . 2 { 691_18RS21 
msa521731.2{691_2603 
msa521731 . 2 { 691_A909 
msa521731 . 2 { 691_JM9130013 
msa521731.2{691_H36B 
Consensus 



501 

AACTCTCGCT 
AACTCTCGCT 
AACTCTCGCT 
AACTCTCGCT 
AACTCTCGCT 
AACTCTCGCT 
AACTCTCGCT 
AACTCTCGCT 
AACTCTCGCT 
AACTCTCGCT 
AACTCTCGCT 



GcCAAAAAAG 
GcCAAAAAAG 
GcCAAAAAAG 
GcCAAAAAAG 
GcCAAAAAAG 
GcCAAAAAAG 
GtCAAAAAAG 
GtCAAAAAAG 
GcCAAAAAAG 
GcCAAAAAAG 
GcCAAAAAAG 



ATTTACACCA 
ATTTACACCA 
ATTTACACCA 
ATTTACACCA 
ATTTACACCA 
ATTTACACCA 
ATTTACACCA 
ATTTACACCA 
ATTTA CACCA 
ATTTACACCA 
ATTTACACCA 



TATCTTAAag 
TATCTTAAag 
TATCTTAAag 
TATCTTAAag 
TATCTTAAag 
TATCTTAAag 
TATCTTAAag 
TATCTTAAag 
TATCTTAAaa 
TATCTTAAaa 
TATCTTAAgg 



550 

CCTAACACTA 
CCTAACACTA 
CCTAACACTA 
CCTAACACTA 
CCTAACACTA 
CCTAACACTA 
CCTAACACTA 
CCTAACACTA 
CCTAACACTA 
CCTAACACTA 
CCTAACACTA 



msa521731 
msa521731.2 
msa521731.2 

msa521731 

msa521731. 

msa521731 . 
msa521731.2{ 

msa521731. 

msa521731. 
msa521731.2{691 



.2{691_090 
691_1169NT 
691_CJB110 
2{691_COHl 
2(691_M732 
2(691^781 
691 18RS21 
2(691 2603 
2{691~A909 
JM9130013 



551 

CTTTTACtAT 
CTTTTACtAT 
CTTTTACtAT 
CTTTTACtAT 
CTTTTACtAT 
CTTTTACtAT 
CTTTTACtAT 
CTTTTACtAT 
CTTTTACcAT 
CTTTTACcAT 



TATgGATTTT 
TATgGATTTT 
TATgGATTTT 
TATgGATTTT 
TATgGATTTT 
TATgGATTTT 
TATgGATTTT 
TATgGATTTT 
TATgGATTTT 
TATgGATTTT 



TATGATAAAA 
TATGATAAAA 
TATGATAAAA 
TATGATAAAA 
TATGATAAAA 
TATGATAAAA 
TATGATAAAA 
TATGATAAAA 
TATGATAAAA 
TATGATAAAA 



ATATCTATTT 
ATATCTATTT 
ATATCTATTT 
ATATCTATTT 
ATATCTATTT 
ATATCTATTT 
ATATCTATTT 
ATATCTATTT 
ATATCTATTT 
ATATCTATTT 



600 

ATATGGTAAT 
ATATGGTAAT 
ATATGGTAAT 
ATATGGTAAT 
ATATGGTAAT 
ATATGGTAAT 
ATATGGTAAT 
ATATGGTAAT 
ATATGGTAAT 
ATATGGTAAT 
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Table 86: Comparative Sequences relating to SAG1393 



rasa521731 . 2 { 691_H36B } 
Consensus 



CTTTTACtAT TATaGATTTT TATGATAAAA ATATCTATTT ATATGGTAAT 



rasa521731 . 2 { 691_090 
msaS21731.2{691 1169NT 
msa521731.2{691~CJB110 
msa521731 . 2 f 691_COHl 
msa521731 .2 691_M732 
msa521731 . 2 { 691_M781 
msa521731.2{691 18RS21 
rasa521731 . 2 f 691_2603 
msa521731 . 2 { 691_A909 
msa521731 . 2{ 691_JM9130013 
msa521731 . 2 { 691_H36B 
Consensus 



601 

AATTTTGGAC 
AATTTTGGAC 
AATTTTGGAC 
AATTTTGGAC 
AATTTTGGAC 
AATTTTGGAC 
AATTTTGGAC 
AATTTTGGAC 
AATTTTGGAC 
AATTTTGGAC 
AATTTTGGAC 



GCGGTGGAGA 
GCGGTGGAGA 
GCGGTGGAGA 
GCGGTGGAGA 
GCGGTGGAGA 
GCGGTGGAGA 
GCGGTGGAGA 
GCGGTGGAGA 
GCGGTGGAGA 
GCGGTGGAGA 
GCGGTGGAGA 



ACTAATCTAT 
ACTAATCTAT 
ACTAATCTAT 
ACTAATCTAT 
ACTAATCTAT 
ACTAATCTAT 
ACTAATCTAT 
ACTAATCTAT 
ACTAATCTAT 
ACTAATCTAT 
ACTAATCTAT 



GATTCACTAG 
GATTCACTAG 
GATTCACTAG 
GATTCACTAG 
GATTCACTAG 
GATTCACTAG 
GATTCACTAG 
GATTCACTAG 
GATTCACTAG 
GATTCACTAG 
GATTCACTAG 



650 

GTTATGCTGC 
GTTATGCTGC 
GTTATGCTGC 
GTTATGCTGC 
GTTATGCTGC 
GTTATGCTGC 
GTTATGCTGC 
GTTATGCTGC 
GTTATGCTGC 
GTTATGCTGC 
GTTATGCTGC 



msa521731 . 2 { 691_090 
tnsa521731 . 2 { 691_1169NT 
msa521731 . 2 { 691_CJB110 
msa521731.2(691_COHl 
msaS21731 . 2 { 691J4732 
msaS21731.2{691 M781 
msa521731.2{691 18RS21 
msa521731 . 2 { 6 91_26 03 
msa521731 . 2 { 691_A909 
msa521731 . 2 { 691_JM9130013 
msa521731 . 2 { 691_H36B 
Consensus 



651 

CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
********** 



GTCAAAAAAG 
GTCAAAAAAG 
GTCAAAAAAG 
GTCAAAAAAG 
GTCAAAAAAG 
GTCAAAAAAG 
GTCAAAAAAG 
GTCAAAAAAG 
GTCAAAAAAG 
GTCAAAAAAG 

GTCAAAAAAG 
********** 



ATGTCTTTAA 
ATGTCTTTAA 
ATGTCTTTAA 
ATGTCTTTAA 
ATGTCTTTAA 
ATGTCTTTAA 
ATGTCTTTAA 
ATGTCTTTAA 
ATGTCTTTAA 
ATGTCTTTAA 

ATGTCTTTAA 
********** 



AAAAGGGTGG 
AAAAGGGTGG 
AAAAGGGTGG 
AAAAGGGTGG 
AAAAGGGTGG 
AAAAGGGTGG 
AAAAGGGTGG 
AAAAGGGTGG 
AAAAGGGTGG 
AAAAGGGTGG 
AAAAGGGTGG 
********** 



700 

TTTACCGTTT 
TTTACCGTTT 
TTTACCGTTT 
TTTACCGTTT 
TTTACCGTTT 
TTTACCGTTT 
TTTACCGTTT 
TTTACCGTTT 
TTTACCGTTT 
TTTACCGTTT 
TTTACCGTTT 
********** 



msa521731 . 2 { 691_090 ) 
msa521731 . 2 ( 691JL169NT > 
msa52173X . 2 { 691_CJB110 } 
msa52173X . 2 { 691JCOH1 } 
msa521731 . 2 f 691_M732 J 
msa521731 . 2 { 691_M781 
rasa521731 . 2 { 691_18RS21 
msa521731 . 2 f 691_2603 
msa521731 . 2 { 691_A909 
msa521731.2{691_JM9130013 
msa52173X . 2 {691_H36B] 
Consensus 



701 

CGCAAGAAGC 
CGCAAGAAGC 
CGCAAGAAGC 
CGCAAGAAGC 
CGCAAGAAGC 
CGCAAGAAGC 
CGCAAGAAGC 
CGCAAGAAGC 
CGCAAGAAGC 
CGCAAGAAGC 
CGCAAGAAGC 



AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 
AATCGGTGAT 



TACGTTGGAG 
TACGTTGGAG 
TACGTTGGAG 
TACGTTGGAG 
TACGTTGGAG 
TACGTTGGAG 
TACGTTGGAG 
TACGTTGGAG 
TACGTTGGAG 
TACGTTGGAG 
TACGTTGGAG 



ATTATGCCCT 
ATTATGCCCT 
ATTATGCCCT 
ATTATGCCCT 
ATTATGCCCT 
ATTATGCCCT 
ATTATGCCCT 
ATTATGCCCT 
ATTATGCCCT 
ATTATGCCCT 
ATTATGCCCT 



750 

TGTTAATATA 
TGTTAATATA 
TGTTAATATA 
TGTTAATATA 
TGTTAATATA 
TGTTAATATA 
TGTTAATATA 
TGTTAATATA 
TGTTAATATA 
TGTTAATATA 
TGTTAATATA 



msa521731 . 2 { 691_090 
msa521731 . 2 { 691_1169NT 
msa521731 . 2 { 691_CJB110 
msa521731 . 2 (691_COHl 
msa521731 . 2 691_M732 
msa521731. 2(691 H781 
msa521731 . 2 { 6 91_18RS21 
msa521731 . 2 { 691_2603 
' msa521731.2{691_A909 
msa521731 . 2{ 691_JM9130013 
msa521731 . 2 { 691_H36B 
Consensus 



751 

AACAAAACGA 
AACAAAACGA 
AACAAAACGA 
AACAAAACGA 
AACAAAACGA 
AACAAAACGA 
AACAAAACGA 
AACAAAACGA 
AACAAAACGA 
AACAAAACGA 
AACAAAACGA 



CTAAAAAAGC 
CTAAAAAAGC 
CTAAAAAAGC 
CTAAAAAAGC 
CTAAAAAAGC 
CTAAAAAAGC 
CTAAAAAAGC 
CTAAAAAAGC 
CTAAAAAAGC 
CTAAAAAAGC 
CTAAAAAAGC 



AGCTTCATCA 
AGCTTCATCA 
AGCTTCATCA' 
AGCTTCATCA 
AGCTTCATCA 
AGCTTCATCA 
AGCTTCATCA 
AGCTTCATCA 
AGCTTCATCA 
AGCTTCATCA 
AGCTTCATCA 



CTTAAAGAAA 
CTTAAAGAAA 
CTTAAAGAAA 
CTTAAAGAAA 
CTTAAAGAAA 
CTTAAAGAAA 
CTTAAAGAAA 
CTTAAAGAAA 
CTTAAAGAAA 
CTTAAAGAAA 
CTTAAAGAAA 



800 

GTGATGTcTG 
GTGATGTcTG 
GTGATGTcTG 
GTGATGTcTG 
GTGATGTCTG 
GTGATGTcTG 
GTGATGTcTG 
GTGATGTcTG 
GTGATGTcTG 
GTGATGTcTG 
GTGATGTtTG 



msa521731 . 2 { 691_090 
msa52X73X.2f69X 1169HT 
msa52X731 . 2 { 691^CJB110 
msa521731.2f 691 COH1 
msa521731 . 2 i 691^M732 
msa521731 . 2 { 691_M781 
msa52173X . 2 { 69X_X8RS2X 
msa52X73X.2(69X 2603 
msa521731 . 2 { 69llA909 
msa521731 . 2 { 69WM913 0013 
msa521731 . 2 { 691_H36B 
Consensus 



801 

GAAGAATTTA 
GAAGAATTTA 
GAAGAATTTA 
GAAGAATTTA 
GAAGAATTTA 
GAAGAATTTA 
GAAGAATTTA 
GAAGAATTTA 
GAAGAATTTA 
GAAGAATTTA 
GAAGAATTTA 



CCAGCTGTCA 
CCAGCTGTCA 
CCAGCTGTCA 
CCAGCTGTCA 
CCAGCTGTCA 
CCAGCTGTCA 
CCAGCTGTCA 
CCAGCTGTCA 
CCAGCTGTCA 
CCAGCTGTCA 
CCAGCTGTCA 



AAAAAGGGCA 
AAAAAGGGCA 
AAAAAGGGCA 
AAAAAGGGCA 
AAAAAGGGCA 
AAAAAGGGCA 
AAAAAGGGCA 
AAAAAGGGCA 
AAAAAGGGCA 
AAAAAGGGCA 
AAAAAGGGCA 



CATCATAGAA 
CATCATAGAA 
CATCATAGAA 
CATCATAGAA 
CATCATAGAA 
CATCATAGAA 
CATCATAGAA 
CATCATAGAA 
CATCATAGAA 
CATCATAGAA 
CATCATAGAA 



850 

AGTAACTACG 
AGTAACTACG 
AGTAACTACG 
AGTAACTACG 
AGTAACTACG 
AGTAACTACG 
AGTAACTACG 
AGTAACTACG 
AGTAACTACG 
AGTAACTACG 
AGTAACTACG 



msa52X73X . 2 { 691_090 
msa521731 . 2 ( 691_1169NT 
msa521731 . 2 { 691_CJB110 
msa521731.2{691 COH1 



851 900 
AOGTGTTTTA TTTCTCTGAC CCTCTATCTT TAGAAGCTCA ATTAAAATCA 
ACGTG TTTTA TTT CTCTGAC CCTCTATCTT TAGAAGCTCA ATTAAAATCA 
ACGTG TTTTA TTT CTCTGAC CCTCTATCTT TAGAAGCTCA ATTAAAATCA 
ACGTGTTTTA TTTCTCTGAC CCTCTATCTT TAGAAGCTCA ATTAAAATCA 
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msa521731 . 2 { 691_M732 } 
msa521731.2{691_M781J 
msa521731 . 2 { 691_18RS21 } 
msa521731 . 2 f 691_2603 } 
msa521731.2(691_A909) 
msa52173 1 . 2 { 691_JM913 0013 J 
moa521731 . 2 { 691_H36B) 
Consensus 



ACGTGTTTTA 
ACGTGTTTTA 
ACX3TGTTTTA 
ACGTGTTTTA 
ACGTGTTTTA 
ACGT GTTTT A 
ACGTGTTTTA 



TTTCTCTGAC 
TTTCTCTGAC 
TTTCTCTGAC 
TTTCTCTGAC 
TTTCTCTGAC 
TTTCTCTGAC 
TTTCTCTGAC 



CCTCTATCTT 
CCTCTATCTT 
CCTCTATCTT 
CCTCTATCTT 
CCTCTATCTT 
CCTCTATCTT 
CCTCTATCTT 



TAGAAGCTCA 
TAGAAGCTCA 
TAGAAGCTCA 
TAGAAGCTCA 
TAGAAGCTCA 
TAGAAGCTCA 
TAGAAGCTCA 



ATTAAAATCA 
ATTAAAATCA 
ATTAAAATCA 
ATTAAAATCA 
ATTAAAATCA 
ATTAAAATCA 
ATTAAAATCA 



msa521731 . 2 {691_090 
msa521731 . 2 { 691_1169NT 
msa521731 . 2 { 691_CJB110 
msa521731 . 2 ( 691_C0H1 
msa52 1731 . 2 { 691_M732 
msa521731 .2(691 M761 
msa521731.2{691 1?RS21 
msa521731 . 2 f 691_2603 
msa521731 . 2 { 691_A909 
msa521731 . 2{ 691_JM9130013 
msa521731 . 2 { 691_H36B 
Consensus 



901 930 

TTTACAAA — ~ 

TTTACAAA — 

TTTACAAA — 

TTTACAAA — 

TTTACAAA — 

TTTACAAA — ~ — 

TTTACAAA 

TTTACAAAgg ctatcaaaga aaatacaaat 

TTTACAAA — ~ 

TTTACAAA— 

TTTACAAA — 



SEQ ID NO. 8612 
STRAIN 2603 frame: 1 

MKKXGI IVLTLLTP FLVSCGQQTKQESTKTTI SKMPKI EGPTYYGKI PENPKKVINPTYS 
YTGYLLKLGVNVSS YSLDLEKDS PVFGKQLiKEAKKLTADDTBAIAAQKPDLIMVFDQDPN 
INTLKKIAPTLVI KYGAQNYIiDMMPALGKVFGKEKEANQWVSQWKTKTIAVKKDLHH I LK 
PNTTFTIMDFYDKNIYLYGNNFGRGGELIYDSIXSYAAPEKVKKDVFKK^ 
WGDYALVNINKTTKKAASSIiKESDVWKNLPAVKKGHI IESNYDVFYFSDPLSLEAQLKS 
FTKAIKENTN 

SEQ ID MO. 8613 
STRAIN 090 frame: 1 

EGFTYYGKI PENPKKVINFTYSYTGYLLKIiGVNVSSYS LDLEKDS PVFGKQLKEAKKLTA 

DDTEAIAAQKPDLIMVFDQDPNIOTIiKKIAPTLVIKYGAQNYIiDMMP 

QWSQWKTKTIiAAKKDIiHHILKPNTTFTIMDFYDKNIYLYGN^ 

EKVKKD VFKKGWFTVS QEA I GD YVGD YALVNTNKTTKKAASS LKESD VWKNL PAVKKGHI 
IESNYDVFYFSDPLSLEAQLKSFT 

SEQ ID NO. 8614 
STRAIN A909 frame: I 

EGPTYYGKI PENPKKVINFTYSYTGYIiLKLGVNVSSYSLDLEKDS P VFGKQ LKGAKKLTA 
DDTBAIAAQKPDLIMVFDQDPNINTLKKIAPTLVIKYGAQNYLDMMPALGKVFGKEKEAN 
QWVSQWKTKTLAAKKDLHH I IjKPNTTFTIMDFYDKNI YLYGNNPGRGGELI YDSIX3YAAP 
EKVKIOJVFKKGWFTVSQEAIGDYVGDYALVNINKTT^ 
I ESNYD VFYFSD PLS LEAQLKS FT 

SEQ ID NO. 8615 
STRAIN H36B frame: 1 

EGFTYYGKI PENPKKVINFTYSYTGYIiLKI/GVNVSSYSLDLEKDSPVFG 

DDTEAIAAQKPDLIMVFDQDPNINTIiKKIAPTLVIKYGAQNYLDMMPA 

QWVSQWKTKTIiAAKKDLHHILRPNTTFTIIDFYDKNIY^ 

EKVKKDVPKKGWPTVSQEAIGDYVGDYAI.WINKTTKKAASSI^ 

IESNYDVFYFSDPLSLEAQLKSFT 

SEQ ID NO. 8616 
STRAIN 18RS21 frame: 1 

EGPTYYGKI PENPKKVINFTYSYTGYIiLKLGVNVSSYSIjDIiEKDS PVFGKQLKEAKKLTA 
DDTEAIAAQKPDLI^n^FDQDPNINTLKKIAPTLVIKYGAQNYLDMMPAIiGKVFGKEKEAN 
QWSQWKTKTIAVKKDIjHHIIiKPNTTFTIMDFYDKNIYLY 

EKVKKDVFKKGWFTVSQEAIGDYVGDYALWINKTTKXAA^ SDVWKNLPAVKKGHI 
IESNYDVFYFSDPLSLEAQLKSFT 

SEQ ID NO. 8617 
STRAIN M732 frame: 1 

EGFTYYGKI PENPKKVI NFTYSYTGYLLKLGVNVS SYSLDLEKDS PVFGKQLKEAKKLTA 

DDTEAIAAQKPDLIMVFDQDPNINTI^KKIAPTLVIKYGAQNYLDMMPALGKVFGKEKEAN 

QWVSQWKTKTLAAKKDLHHILKPNTTPTIMDPYDKNIYLYGNNFGRGGBL 

EKVKKDWKKGWPTVSQEAIGDYVGDYALVNINKTTKKAASSLKE 

IESNYDVFYFSDPLSLEAQLKSFT 

SEQ ID NO. 8618 
STRAIN COH1 frame: I 

EGPTYYGKI PENPKKVINFTYSYTGYLLKLGVNVSS YSLDLEKDS PVFGKQLKEAKKLTA 
DDT EAXAAQKPDLI MVFD QD PN INTLKKI APTLVI KYGAQNYLDMMPALGKVFGKEKEAN 
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QWVSQWKTKTLAAKKDLHHILKPNTTFTIMD 

E KVKKD VFKKGW FTVSQEA I GD YVGD YAL VN I NKTTKKAAS S LKES D VWKNLPAVKKGHI 
I ESNYDVFYFSD PLSLEAQLKS FT 

SEQ ID NO. 8619 
STRAIN M781 frame: 1 

EGFTYYGKI PENPKKVINFTYSYTGYIiLKLGVNVSSYSLDLEKD S PVFGKQLKEAKKLTA 
DDTEAIAAQKPDLIMVFDQDPNINTLKKlAPTLVIKYGAQNYIi^ 

QWVS QWKTKT LAAKKDLHH I LKPNTTFT I MDF YDKN IYLYGNNFGRGG EL I YD S LGYAAP 

EKVKKDVFKKGWFTVSQEAIGDYVGDYALVNINKTTKKAASSL 

IESNYDVFYFSDPLSLEAQLKSFT 

SEQ ID NO. 8620 
STRAIN CJB1 10 frame: 1 

EGFTYYGKI PENPKKVINFTYSYTGYLLKLGVNVS S YSLDLEKDS PVFGKQLKEAKKLTA 
DDTEAIAAQKPDLIMVFDQDPNINTLKKIAPTLVIKYGAQNYIiDl^PAIiGKVFGKEKEAN 
QWVSQWKTKTLAAKKDLHH I LKPNTTFTIMDFYDKNI YLYGNNFGRGGELI YDSLG YAAP 
EKVKKDVFKKGWFTVSQEMGDYVGDYALVNINKTTO 
IESNYDVFYFSDPLSLEAQLKSFT 

SEQ ID NO. 8621 
STRAIN 1169NT frame: 1 

EGFTYYGKI PENPKKVINFTYSYTGYLLKLGVNVSSYSLDLEKDS PVFGKQLKEAKKLTA 
DDTEAI AAQKPDLIMVFDQDPNINTLKKIAPTLVI KYGAQNYLDMMPALGKVFGKEKEAN 
QWVSQWKTKTLAAKKDLHHILKPNTTFTIMDFYDKNIYLYGNNFGRGGELI 
EKVKKDWKKGWFWSQEAIGDWGDYALWINKTTKK^ 
IESNYDVFYFSDPLSLEAQLKSFT 

SEQ ID NO. 8622 
STRAIN JM91300I3 frame: I 

EGFTYYGKI PENPKKVXNFTYSYTGYLIiKLGVNVSSYSLDLEKDS 

DDTEAIAAQKPDLIMVFDQDPNINTLKKIAPTLVIKYGAQNYI^MMPALGKVFGK^ 

QWSQWKTKTIiAAKKDLHHILKPNTTFTIMDFTO 

EKVKKD VFKKGWFTVSQEAIGD YVGD YALVNINKTTKKAAS SLKE SDVWKNLPAVKKGHI 
IESNYDVFYFSDPLSLEAQLKSFT 

PRETTY of : /biotmp/msaS22124 . 2 { * } April 28, 2003 08:17 .. 



msa5 22 124 . 2 { 6 91_0 9 0 
msa522124 . 2 { 691_1169NT 
msa522124 . 2 { 691_CJB110 
msa522124.2f 691 COH1 
msaS22124.2(691~M732 
msa522124 . 2 { 691_M781 
msa522124.2{691_18RS21 
maa522124 . 2 f 691_2603 
msa522124.2{691_A909 
msa522124 . 2 { 69WM9130013 
msa522124 . 2 { 691_H36B 
Consensus 



1 50 

EG FTYYGKIPEN 

EG FTYYGKIPEN 

EG FTYYGKIPEN 

EG FTYYGKIPEN 

EG FTYYGKIPEN 

EG FTYYGKIPEN 

EG FTYYGKIPEN 

mkkigiivlt lltfflvscg qqtkqestkt tiskmpkiEG FTYYGKIPEN 

EG FTYYGKIPEN 

EG FTYYGKIPEN 

EG FTYYGKIPEN 



msa522124 . 2 { 6 91_090 
msa522124.2{691_1169NT 
msa522124 . 2 { 691_CJB110 ' 
msa522124 . 2 { 691_COHl 
msa522124.2{691_M732 
msa522124.2{691_M781 
msa522124 . 2 { 691_18RS21 
tnsa522124 . 2 { 691_2603 
msa522124.2{691 A909 
msa522124.2{691 JM9130013 
msa522124 .2{691_H36B 
Consensus 



SI 

PKKVINFTYS 
PKKVINFTYS 
PKKVINFTYS 
PKKVINFTYS 
PKKVINFTYS 
PKKVINFTYS 
PKKVINFTYS 
PKKVINFTYS 
PKKVINFTYS 
PKKVINFTYS 
PKKVINFTYS 



YTGYLLKLGV 
YTGYLLKLGV 
YTGYLLKLGV 
YTGYLLKLGV 
YTGYLLKLGV 
YTGYLLKLGV 
YTGYLLKLGV 
YTGYLLKLGV 
YTGYLLKLGV 
YTGYLLKLGV 
YTGYLLKLGV 



NVSSYSLDLE 
NVSSYSLDLE 
NVSSYSLDLE 
NVSSYSLDLE 
NVSSYSLDLE 
NVSSYSLDLE 
NVSSYSLDLE 
NVSSYSLDLE 
NVSSYSLDLE 
NVSSYSLDLE 
NVSSYSLDLE 



KDSPVFGKQL 
KDSPVFGKQL 
KDSPVFGKQL 
KDSPVFGKQL 
KDSPVFGKQL 
KDSPVFGKQL 
KDSPVFGKQL 
KDSPVFGKQL 
KDSPVFGKQL 
KDSPVFGKQL 
KDSPVFGKQL 



100 

KeAKKLTADD 
KeAKKLTADD 
KeAKKLTADD 
KeAKKLTADD 
KeAKKLTADD 
KeAKKLTADD 
KeAKKLTADD 
KeAKKLTADD 
KgAKKLTADD 
KgAKKLTADD 
KgAKKLTADD 



msaS22124 . 2 { 691JD90 
msa522124.2(691_1169NT 
T08a522124 . 2 { 691_CJB110 
msa522124 . 2 { 691_C0H1 
msaS22124 .2{691_M732 
msa522124 .2(691 JM7B1 
msa522124 . 2 { 691_18RS21 
msa522124 . 2 1 691_2603 
msa522124 . 2 { 691_A909 
msaS22124.2{691 JM9130013 



101 

TEAIAAQKPD 
TEAIAAQKPD 
TEAIAAQKPD 
TEAIAAQKPD 
TEAIAAQKPD 
TEAIAAQKPD 
TEAIAAQKPD 
TEAIAAQKPD 
TEAIAAQKPD 
TEAIAAQKPD 



LIMVFDQDPN 
LIMVFDQDPN 
LIMVFDQDPN 
LIMVFDQDPN 
LIMVFDQDPN 
LIMVFDQDPN 
LIMVFDQDPN 
LIMVFDQDPN 
LIMVFDQDPN 
LIMVFDQDPN 



INTLKKIAPT 
INTLKKIAPT 
INTLKKIAPT 
INTLKKIAPT 
INTLKKIAPT 
INTLKKIAPT 
INTLKKIAPT 
INTLKKIAPT 
INTLKKIAPT 
INTLKKIAPT 



LVIKYGAQNY 
LVI KYGAQNY 
LVIKYGAQNY 
LVIKYGAQNY 
LVIKYGAQNY 
LVIKYGAQNY 
LVIKYGAQNY 
LVIKYGAQNY 
LVIKYGAQNY 
LVIKYGAQNY 



150 

LDMMPALGKV 
LDMMPALGKV 
LDMMPALGKV 
LDMMPALGKV 
LDMMPALGKV 
LDMMPALGKV 
LDMMPALGKV 
LDMMPALGKV 
LDMMPALGKV 
LDMMPALGKV 
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Table 86: Comparative Sequences relating to SAG1393 

msa522124.2{691__H36B} TKAIAAQKPD LIMVFDQDPN INTLKKIAPT LVIKYGAQNY LDMMPALGKV 
Consensus ********** ********** ********** ********** ********** 



msa522124 . 2 { 691_090 
msa522124.2{691 1169NT 
msa522124 . 2 { 691~CJB110 
msa522124. 2(691 COH1 
msa522124 . 2 { 691~M732 
msa522124 . 2 { 691_M781 
msa522124.2{691__18RS21 
msa522124 . 2 [ 691_2$03 
msa522124 . 2{691_A909 
msa522124.2{691_JM9130013 
msa522124.2{691_H36B 
Consensus 



IILSaS22124 . 2 { 691_090 
msa522124 . 2 I 691_1169NT 
msa522124 . 2 { 691_CJB110 
msa522124.2{691 COH1 
msa522124 . 2 j 691~M732 
msa52 2124 . 2 { 691_M781 
rasa522124.2{691 18RS21 
msa522124 . 2 {691_2603 
msaS2 212 4 . 2 { 6 91_A9 0 9 
msa522124 . 2 { 691_JM9130013 
msa522124.2{691_H36B 
Consensus 



151 

FGKEKEANQW 
FGKEKEANQW 
FGKEKEANQW 
FGKEKEANQW 
FGKEKEANQW 
FGKEKEANQW 
FGKEKEANQW 
FGKEKEANQW 
FGKEKEANQW 
FGKEKEANQW 
FGKEKEANQW 



VSQWKTKTLA 
VSQWKTKTLA 
VSQWKTKTLA 
VSQWKTKTLA 
VSQWKTKTLA 
VSQWKTKTLA 
VSQWKTKTLA 
VSQWKTKTLA 
VSQWKTKTLA 
VSQWKTKTLA 
VSQWKTKTLA 



********** ********** 



aKKDLHHILk 
aKKDLHHILk 
aKKDLHHILk 
aKKDLHHILk 
aKKDLHHILk 
aKKDLHHILk 
vKKDLHHILk 
vKKDLHHILk 
aKKDLHHILk 
aKKDLHHILk 
aKKDLHHILr 
-**★*★***_ 



PNTTFTImDF 
PNTTFTImDF 
PNTTFTImDF 
PNTTFTImDF 
PNTTFTImDF 
PNTTFTImDF 
PNTTFTImDF 
PNTTFTImDF 
PNTTFTImDF 
PNTTFTImDF 
PNTTFTliDF 
*******_** 



201 

NFGRGGELIY 
NFGRGGELIY 
NFGRGGELIY 
NFGRGGELIY 
NFGRGGELIY 
NFGRGGELIY 
NFGRGGELIY 
NFGRGGELIY 
NFGRGGELIY 
NFGRGGELIY 
NFGRGGELIY 



DSLGYAAPEK 
DSLGYAAPEK 
DSLGYAAPEK 
DSLGYAAPEK 
DSLGYAAPEK 
DSLGYAAPEK 
DSLGYAAPEK 
DSLGYAAPEK 
DSLGYAAPEK 
DSLGYAAPEK 
DSLGYAAPEK 



VKKDVFKKGW 
VKKDVFKKGW 
VKKDVFKKGW 
VKKDVFKKGW 
VKKDVFKKGW 
VKKDVFKKGW 
VKKDVFKKGW 
VKKDVFKKGW 
VKKDVFKKGW 
VKKDVFKKGW 
VKKDVFKKGW 



FTVSQEAIGD 
FTVSQEAIGD 
FTVSQEAIGD 
FTVSQEAIGD 
FTVSQEAIGD 
FTVSQEAIGD 
FTVSQEAIGD 
FTVSQEAIGD 
FTVSQEAIGD 
FTVSQEAIGD 
FTVSQEAIGD 



200 

YDKNIYLYGN 
YDKNI YLYGN 
YDKNIYLYGN 
YDKNIYLYGN 
YDKNIYLYGN 
YDKNIYLYGN 
YDKNIYLYGN 
YDKNIYLYGN 
YDKNIYLYGN 
YDKNIYLYGN 
YDKNIYLYGN 
********** 

250 

YVGDYALVNI 
YVGDYALVNI 
YVGDYALVNI 
YVGDYALVNI 
YVGDYALVNI 
YVGDYALVNI 
YVGDYALVNI 
YVGDYALVNI 
YVGDYALVNI 
YVGDYALVNI 
YVGDYALVNI 



msaS22124 . 2 { 691_090 
rasa522124 . 2 f 691_1169NT 
msa522124 . 2 { 691_CJB110 
msa522124 . 2 f 691_COHl 
msa522124 . 2 { 691_M732 
msa522124.2{691_M781 
msa522124.2{691 18RS21 
msa522124 . 2 ( 691_2603 
msa522124 . 2 {691_A909 
msa522124 . 2 { 691_JM9130013 
msa522124.2{691_H3SB 
Consensus 



msa522124 . 2 { 691_090 
msa522124 . 2 f 691_1169NT 
msa522124 . 2 { 691_CJB110 
msa522124 . 2 ( 691_COHl 
msa522124 . 2 (691_M732 
msa522124 . 2 { 691_M781 
msa522124 . 2 { 691_18RS21 
msa522124 . 2 ( 691_2603 
msa522 124 . 2 { 691_A909 
msa522124.2{691_JM9130013 
msa522124 . 2 { 691_H36B 
Consensus 



251 300 
NKTTKKAASS LKESDVWKNL PAVKKGHIIE SNYDVFYFSD PLSLEAQLKS 
NKTTKKAASS LKESDVWKNL PAVKKGHIIE SNYDVFYFSD PLSLEAQLKS 
NKTTKKAASS LKESDVWKNL PAVKKGHIIE SNYDVFYFSD PLSLEAQLKS 
NKTTKKAASS LKESDVWKNL PAVKKGHIIE SNYDVFYFSD PLSLEAQLKS 
NKTTKKAASS LKESDVWKNL PAVKKGHIIE SNYDVFYFSD PLSLEAQLKS 
NKTTKKAASS LKESDVWKNL PAVKKGHIIE SNYDVFYFSD PLSLEAQLKS 
NKTT KKAASS LKESDVWKNL PAVKKGHIIE SNYDVFYFSD PLSLEAQLKS 
NKTTKKAASS LKESDVWKNL PAVKKGHIIE SNYDVFYFSD PLSLEAQLKS 
NKTTKKAASS LKESDVWKNL PAVKKGHIIE SNYDVFYFSD PLSLEAQLKS 
NKTTKKAASS LKESDVWKNL PAVKKGHIIE SNYDVFYFSD PLSLEAQLKS 
NKTTKKAASS LKESDVWKNL PAVKKGHIIE SNYDVFYFSD PLSLEAQLKS 

301 310 

FT 

FT 

FT 

FT 

FT 

FT 

FT 

FTkaikentn 

FT 

FT 

FT 

********** 
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SEQ XD NO. 8701 
STRAIN 2603 

ATGAAATTATCGAAGAAGTTATTGTT 

TTAACAATGGTGGCGGGGTCAACTGTTGAACCAGTA^ 

ATTGTAAGAGCTGCAGAAGTGTCACAAGAACX3CCCAGCGAAAACAAC^^ 

AAATTACAAGCTGATAGTTATAAATCGGAAATTACTTC 

GACGGOlAAGTAATATCrAACrATGCTAAACTTGGTGAC^ 

GTAGAGTTTAAACGTTATAAAGTCAAGACGGATAT^ 

ACAACAGTTGAAGCAGCAGATGa\AAAGTTG<3^ 

CCTCAAAAAACTAATGCTCAAGGTTTGGTCGTCGATC 

AGATACITGTATGTAGAAGATTTAAAGAATT^^ CTTATGCT 

ATTAATATTTACCCTAAAAACXnTGTAACTGATGAACCA 

AAATTAGGTCAGGACGATGCAGGTTATACGATTGGT^ 

TCTACAATCCCTGO^TTTAGGTGACTATGAAAAA 

GATGGCTTGACTTATA^TCTGTTGGAAAAATC^ 

GATGAGCACTACACTATTGATGAACCAACAGTTGATAACCAAAATA 

TTTAAACCAGAGAAATTTAAAGAAATTGCTGAGCTACTTAAA 

AATCAAGATGCTCTTGATAAAGCTACTGCAAATACAGA 

CCAGTTGCATCAACrATTAATGAAAAAGCAGTTTTAGGAAA^ 

GAACTTCAATATGACCATACTCCTGATAAAGCTGAC^ 

AGAAAACCAGAAGTTCATACTGGTGGGAAA 

CAAACACTAGGTGGTGCTGAGTITGATTTG^ 

ACAGATGCTCTTATTAAAG CGAATACTAAT AAAAACT ATATTG CTGGAGAAG CTGTTACT 
GGGCAACCAATCAAATTGAAATCACATACAGACGGTAOGTTT^ 

TATG CAGTTGATGCGAATG CAGAGGGTACAGCAG TAACTTACAAATTAAAAGAAACAAAA 

GCACCAGAAGGTTATGTAATCCCTGATAAAGAAATCGAGTTTACAGTAT 

TATAATACAAAACCAACTGACATCACGGTTGATAGTC 

AAAAACAACAAACGTCCITCAATCCCTAATACrrGGTGGTATTGGTAa 

GCTATCGGTGCTGCGGTGATGGCrTTT<3CTGTT 

AAC 



SEQ ZD NO. 8702 
STRAIN 090 

GCAGAAGTGTCACAAGAACGCCCAGCGAAAAC 

AGCAGTAAATATCTATAAATTACAAGCTGATAGTTATAAATCGGAAATTA 

CTTCTAATGGTGGTATCGAGAATAAAGACGGCGAAGTAATATCTAACTAT 

GCTAAACTTGGTGACAATGTAAAAGGTTTG CZAAGGTGTACAGTTTAAACG 

TTATAAAGTCAAGACGGATATTTCTGTTGATGAATTC 

CAGTTGAAGCAGCAGATGCAAAAGTTGGAACGATTC^^ 

AGTCTACCTCAAAAAACTAATGCTCAAG/3TTTGGT 

TTCAAAAAGTAATGTGAGATACTTGTATGTAGAAGATTTAAAGA^ 

CTTCAAACATTACX3AAAG£TrTATGCT 

GTTG CTAACTCTACAGGTACAGGTTTCCTTTcTGAA^ 

TAAAAACGTTGTAACTGATGAACCAAAAACAGATAAAGATGTTAAAAAAT 

TAGGTCAGGACGATGCAGGTTATACGATTG<3TGAAGA 

TTGAAATCTACAATCCCTGCXIAATTTAGGTGACT 

TACTGATAAATTTCCAGATGGCTTGACTTATAAATCrc 

AGATTGGTTCGAAAACACTGAATAGAGATGAGCACTACACT 

CCAACAGTTGATAACCAAAATACATTAAAAATTACGTTTAAAC 

ATTTAAAGAAATIGCIGAGC^ 

AAGATGCTCTTGATAAAGCTACTCCAAATACAGATGATGC^ 
GAAATTCCAGTTCCATCAACTATTAATGAAAAA^ 

AATTGAAAATALVlU"IXaAACTTCAATATGACCATACTCXrrcATAAAGC^ 

ACAATCCAAAACCATCTAATCCTCCAAGAAAACCAGAAGTT^ 

GGGAAACGATTTGTAAAGAAAGACTCAACAGAAACACA 

TGCrGAGTTTGATTTGTTGGCTTC CAGTAAAATGGACAa 

ATGCTCITATTAAAGCGAATACTAATAAAAACTATATTGCTGGAGAAGCT 

GTTACTGGGCAACCAATCAAATTGAAATCACATACAGAC 

GATTAAAGGTTTGGCTTATGCAGTTGATGCG 

TAACTTACAAATTAAAAGAAACAAAAGCAC CAGAAGGTTATGTAATCCCT 
GATAAAGAAATCGAGTTTACAGTATCACAAAC^TCTTATAATACAAAACC 
AACTGACATCACGGTTGATAGTGCTGATGCAACACCTGATACA^ 
ACAACAAACGTCCTTCA 



SEQ ID NO. 8703 
STRAIN A909 

GCAGAAGTGTCACAAGAACGCCCAGCGAA 

AACAACAGTAAATATCTATAAATTACAAGCTGATAGTTATAAATCGGAAA 

TTACTTCTAATGGTGGTATCX3AGAATAAAGACG^ 

TATGCTAAACTTGGTGACAATGTAAAAGGTTTGCAAGGTGTA 

ACGTTATAAAGTCAAGACGGATATTTCTGTT^^ 

CAACAGTTGAAGCAGCAGATGCAAAAGTTGGAACt^TTCT^ 

GTCAGTCTACCTCAAAAAACTAATOCTCAAGGT^ 

GGATTCAAAAAGTAATGTGAGATACTTOTATGTAGAAGATTT 

CACCTTCAAACATTACCAAAGCTTATG CTGTACXX3TTTGTGTTGGAATTA 

CCAGTTGCTAACTCTACAGGTACAGGTTTCCn^ 

CCCT Aa aAACGTTGTAACTGATGAACXIAAAAACAGATAAAGATG TTAAAA 
AATT AGGTCAGGACGATG CAGGTTATACGATTGGTGAAG AATTCAAATGG 
TTCTTGAAATCTACAATCCCTGCCAATTTAGGTGA 

AATTACntSATAAATTTG CAGATGGCITGACTTATAAAT<nXnTGGAAAAA 

TCAAGATTGGTTCX3AAAACACTGAATAGAGATGAGCACT 

GAAC<1AACAGTTGATAACCAAAATACATTAAAAAT 
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GAAATTTAAAGAAATTGCTGAGCTACn^A^ 

ATCAAGATG CTCTTGATAAAGCTACTG CAAATACAGATGATGCGGCATTT 

TTGGAAATTC CAGTTGCATCAACTATTAATGAAAAAGCAGTTTT AGG AAA 

AGCAATTGAAAATACTTTTGAACTTCAATATGACCATAC t CCTGATAAAG 

CTGACMTCCAAAACCATCTAATCCTCCAAGAAAACCAGAAGTTO 

GGTGGGAAACGATTTGTAAAGAAAGACTCAACAGAAACACAAACACT 

TGGTGCTGAGTTTGATTTGTTGGCTTCTGATGGGA 

CAGATGCTCTTATTAAAGQjAATACTAATAAAAACTATATTC 

GCTGTTACTGGGCAACCAATCAAATTGAAATCACATACAGAC^ 

TGAGATTAAAGGTTTGGCTTATGCAGTTGATGCGAATGCAG^ 

CAGTAACTTACAAATTAAAAGAAACAAAAGCACCAGAAG 

CCTGATAAAGAAATCGAGTTTACAGTATCACAAACATCTT 

ACCAACTGAC^TCAGGGTTGATAGTGCTGATGCAA 

AAAACAACAA 

SEQ ZD HO. 8704 
STRAIN 18RS21 

GCAGAAGTGTCACAAGAACGCCCAGCGAAAAC 

AG CAGTAAAT ATCT ATAAATTACAAG CTGATAGT7T AT AAATCGG AAATTA 
CITCTAATGGTGGTATCGAGAATAAAGAaKSCGAW 

GCTAAACTTGGTGACAATGTAAAAGuriUtSCAAGGTGTACAGTTTAAACC 
1TATAAAGTC1AAGACGGATATTTCTGTTGATGAATTGAAA 
CAGTTGAAGCAGCAGATGCAAAAGTTGGAACGATTCTTGAA^ 
AGTCTACCTCAAAAAACTAATG CTCAAGGTTTGGTCGTCX1RTGCTCTGGA 
TTCAAAAAGTAATGTGAGATACTTGTATGTAGAAGATTTAAAGAATTCAC 

GTTGCTAACTCTACAGGTACAGGTTTCCTTTCK3AAA 

TAAAAA03TTGTAACTGATGAACCAAAAACAGATAAAGATGTTAAATAAT 

TAGGTCAGGAGSATGCAGGTTATACGATTGGTGAAGA^ 

TTGAAAT CT ACAATCCCTG CCAATTTAGGTGACTATGAAAAATTTGAAAT " 

TACTGATAAATTTGCAGATGGCTIX3ACITATA 

AGATTGGTTCX3AAAACACTGAATAGAGATGAGCACTACACT 

CCAACAGTTGATAACGAAAATACATTAAAAATTACXn^AAACCAgAGAA 

ATTTAAAGAAATTG CTGAGCTACITAAAGGAATGACCCTTGTTAAAAATC 

AAGATCCTCTITGATAAAGCTACTGCAAATACAG^ 

GAAATTXXAGTTGCATCAACTATTAATGAAAA 

AATTGAAAATACTTTTGAACTTCAATATGACCATACTCCn^ 

ACAATCXZAAAACCATCTAATCCTCCAAGAAAACCAG^ 

GGGAAACGATTTGTAAAGAAAGACTCAACAGAAACACAAACACTAGGTGG 

TGCTGAGTTTGATTTGTTGGCTTCTGATGG 

ATGCTCTTATTAAAGCGAATACTAATAAAAACTATATTGCTGGAGAAGCT 

GTTACTGGGCAACCAATCAAATTGAAATCACATACAGACGGTACG^ 

GATTAAAGGTTTGGCTTATGCAGTTGATGCGAATGCAGAGGGTACAG 

TAACTTACAAATTAAAAGAAAC^AAGCACCAGAAGGTTATGTAATCCCT 

GATAAAGAAATCGAGTTTACAGTATCACAAACATCTTATAATACAAAACC 

AACTGACATCACGGTrGATAGTGCTGATGCAACACCTGATACAATTAAAA 

ACAACAAACGTCCTTCA 

SEQ ZD NO. S705 
STRAIN M732 

GCAGAAGTGTCACAAGAACX3CCCAGCGAAAACAACAGT 

AAATATCTATAAATTACAAGCIX^TAGTTATAAATCGGAAATTACTTCTA 

ATGGTGGTATCGAGAATAAAGACGG CGAAGTAAT ATGTAACTATG CTAAA 

CTTGGTGACAATGTAAAAGGTTTGCAAGGTGTA 

AGTCAAGACGGATATTTCTGTTGATGAATTGAAAAAAT^ 

AAGCAGCAGATGCAARAGTTGGAACGATTCTTGAAGAAGG 

AAGTAATGTGAGATACTTGTATOTAGAAGATTTA 
AC^TTACCAAAGCTTATGCTGTACCGTTIXnxyrTGGAATTACCAG^ 

CGTTGTAACTGATGAACCAAAAACAGATAAAGATGTTAAAAAATTAGGTC 

AGGACGATGCAGGTTATACGATTGGTGAAGAATT 

TCTAGAATCCCTGCCAATTTAGGTGACTATGAAAAATTTGAAATTAC^ 

TAAATTTGCAGATGGCTTGACTTATAAATCriX3TTGGAAA 

GTTCGAAAACAC1X3AATAGAGATGAGCACTACACTATTGATGAA^ 

GTTGATAACCAAAATACATTAAAAATTACX3TTTAAACCAGAGAAATTTAA 

AGAAATTGCTGAGCTACTTAAAGGAATGACCCT 

CT CTTGAT AAAG CTACTGCAAATACAGATGATG CGG CATTTTTGGAAATT 

CCAGTIX3CATCAACTATTAATGAAAAAGCAGTTITAG 

AAATACTTTTGAACTTCAATATGACCATACTCCrGATAAAGCT^ 

CAAAACCATCTAATCCTCCAAGAAAACCAGAAGTTCATACTGGTG^ 

CGATTTGTAAAGAAAGACTCAACAGAAACACAAACACT 

GTTrGATTTGTTGGCTTCTGATGGGACAG CAGTAAAATGGACAGATG CTC 

TTATTAAAG CGAATACTAATAAAAACTATATTGCTGGAGAAGCTGTTACT 

GGGCAACCAAT<^AATTGAAATCACATACAGACGGTACX3^^ 

AGGTrTGGCTTATGCAGTIX5ATGCGAATG CAGAGGGTACAGCAGTAACTT 

ACAAATTAAAAGAAACAAAAGCACCAGAAGGTTATGTAATCCCTGATAAA 

GAAATCGAGTTTACAGTATCACAAACATCTTATAATACAAAAC^ 

CATCACGGTTGATAGTGCTGATGCAACACCTGATACAATTAAAAAC^ 

AACGTCCTTCA 

SEQ ZD NO. 8706 
STRAIN COH1 
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GCAGAAGTGTCACAAGAACGCCCAGCGAAAAC 

AGCAGTAAATATCTATAAATTACAAGCrGATAGTTATAAATCGGAAATTA 

CTTnTAATGGTGGTATCXaAGAATAAAGACGGCGAAGTAATATCTAACTAT 

GCTAAACnTGGTGACAATGTAAAAGGTTTGCAAGGTGTACAG 

TTATAAAGTCAAGACGGATATTTCTGTTGATGAATTGAAAAAA 

CAGTTGAAGCAGCAGATGC^AAAGTTGGAACXSATT CTTGAAGAAGGTGTC 

AGTCTACCTCAAAAAACTAATGCTCAAGGTTTGGTC^ 

TTCAAAAAGTAATGTGAGATACrrTGTATGTAGAAGATTTAAAGA^ 

CTTCAAAGATTACCAAAGCTTATGCTGTACCGTTTGTGTTG^ 

GTTGCTAACTCTACAGGTACAGGTTTCCTTTCTGAAATTAATAW 

TAAAAACGTTGTAACTGATGAACCAAAAAC^VGATAAAGATGTTAAA 

TAGGTCAGGACGATG CAGGTTATACXIATTGGTGAAGAATTOUVATGGTTC 

TTGAAATCTACAATCCCTG CCAATTTAGGTGACTATGA 

TACKIATAAATTTGCAGATGGCITGACTTATAAA 

AGATTGGTTCGAAAACACTGAATAGAGATGAGC^CTAC^CrATTCATGAA 

CCAACAGTTGATAACCAAAATACATTAAAAATTACXnTTA 

ATTTAAAGAAATTG CTGAG CTACTTAAAGGAATGACCCTTGTTAAAAATC 

AAGATGCTCTTGATAAAGCTACTGCAAATACAGATGATC 

GAAATTCCAGTTGCATC!AACTATT AATGAAAAAG CAGT^ C 

AATTGAAAATACTTTTGAACTTCAATATGACCATACTCCrGATAAAGCrG 

ACAATCCAAAACCATCTAATCXTTCCAAGAAA^ 

GGGAAAOIATTTGTAAAGAAAGACTCAACAGAAACACAAACACTAG^ 
TGCTGAGTTTGATTTGTTGGCTTCTGATGGGACAG CAGTAAAATGGACAG 
ATGCTCTTATTAAAGCXIAATACTAATAAAAACrATATTG CTGGAGAAGCT 
GTTACTGGGCAACCAATCAAATTGAAATCACATACAG^ 
GATTAAAGGTTTGG CTTATG CAGTTGATGCGAATG CAGAGGGTACAG CAG 
TAACTTACAAATTAAAAGAAACAAAAGCACCAGAAGGTTATGTAATC 
GATAAAGAAATCGAGTTTACAGTATCmCAAACATCrTATAATACAAAACC 
AACTGACATCACGGTTGATAGTGCTGATGCAACAC 
ACAACAAACGTCCTTCA 

SKQ ID NO. 8707 
STRAIN M781 

gcagaagtgtcacaagaacgcccagcgaaaacag 
cagtaaatatctataaattacaag'ciwtagttat 
tctaatggtggtatcgagaataaagacx^asaagtaatatctaactatc 
• taaacttggtgacaatgtaaaaggtttgcaaggtc 
ataaagtcaagacggatatttctgttgatglaattgaaaaaat^ 
gttgaagcagcagatgcaaaagttggaacgattcttc 

TCTACCTGAAAAAACTAATGCTCAAGGTTTG^ 

O^AAAGtAATGTGAGATACTTGTATGTAGAAGATTTAAAGAATTC^ 

TCAAACATTACCAAAGCTTATGCTGTACCGTTTGTGTTG^ 

TGCTAACTCTACAGGTACAGGTTTCCrrTTCTGaAATTAAT^ 

AAAACXnTCTAACTGATGAACCAAAAACAGATAAAGATGTTAAAAAATTA 

GGTCAGGACGATGCAGGTTATACGATTGGTGAAGAA 

GAAATCTACAATCCCTGCCAATTTAGGTGACTATGAAA 

CTGATAAATTTG CAGATGG CTTGACTTATAAATCTGTTGGAAAAATCAAG 

ATTGGTTCGAAAACACTGAATAGAGATGAGCACTACACrATTGA 

AACAGTTGATAACCAAAATACATTAAAAATTACGTTTAAACCAGAGAAAT 

TT AAAGAAATTGCTGAGCTACITAAAGGAATGACCCTTGTTAA 

GATGCTCTTGATAAAGCTACTG CAAATACAGATGATGCGGCA 'iTlTl 'GGA 

AATTCCAGTTGCATCAACTATTAATGAAAAAGCAGTTTTAGGAAAA^ 

TTGAAAATACTTTTGAACTTCAATATGACCA^ 

AATCCAAAACCATCTAATCCTCCAAGAAAACC^ 

GAAACX5ATTTGTAAAGAAAGACTCAACAGAAACA 

CTGAGTTTGATTTGTTGGCTTCTGATGGGA 

GCTCTTATTAAAGCGAATACTAATAAAAACTATATTGCTGGAGAAG 
TACTGGGCRACOUVTCAAATTGAAATCA^ 

TTAAAGGTTTGGCITATGCAGTTGATG CGAATGCAGAGGGTACAGCAGTA 
ACTTACAAATTAAAAGAAACAAAAGCACCAGAAGGTTATGTAATCCCIt^ 
. TAAAGAAATCGAGTTTACAGTATCACAAACATCITO 
CrGACATCAOXnTGATAGTGCrGATGCAACAOT 
AACAAACGT 

SBQ ID NO. 8708 
STRAIN CJB 1 10 

GCAGAAGTGTCACAAGAACX3CCCAGCGAA 

AACAGCAGTAAATATCTATAAATTACAAGCTGATAGTTATAAAT^ 

TTACTTCTAATGGTGGTATCGAGAATAAAGACGGCGAAGTAATATCT 

TATGCTAAACTTGGTGACAATGTAAAAGGTTTGC 

ACGTTATAAAGTCAAGAGGGATATTTCTGTTGATGAATTGAAAA 

CAACAGTTGAAGCAGCAGATGCAAAAGTrGGAACGATTC^ 

GTCAGTCTACCTCAAAAAACTAATGCTCAAGGTTTGGT^ 

GGATTCAAAAAGTAATGTGAGATACITGTATGTAGA^ 

CACCTTCAAACATTACCAAAGCTTATGCTGTA 

CCAGTTGCTAA^TCTACAGGTACAGGTTTCCTr^ 

CCCTAAAAACGTTGTAACKSATGAACXZAAAAACA^ 

AATTAGGTCAGGACGATGCAGGTTATAOGAlTXXynSAAGAATT^ 

TTCTTGAAATCTACAATCCCTGCCAAT^ 

AATTACTGATAAATTTGCAGATGGCTTGACTTATAAATCTGTTGG 
TCAAGATTGGTTOGAAAACACTGAATAGAGATQAGCACTAGACrATTGAT 
GAACCAACAGTTGATAACXIAAAATACATTAAAAATTACGTTTAAAC^ 
GAAATTTAAAGAAATTGCTGAG CTACTTAAAGGAATGACCCTTGTTAAAA 
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ATCAAGATG CTCITGATAAAGCTACTGCAAATAGAjGA^ 

TTGGAAATTCCAGTTGCATCAACTATTAATGAAAAAGCAGT^^ 

AGCAATTGAAAATACTTTTGAACTTaVATATGAC 

CTGACAATcCAAAACCATCTAATCCrcCAAGAAAACCAGAA^ 

GGTGGGAAACGATTTGTAAAGAAAGACTCAACAGAAACA 

TGGTGCTGAGTTTGATTTGTTGGCT 

CAGATGCTCTTATTAAAGCXaAATACTAATAA^ 

GCTGTTACTGGGCAACCAATCAAATTGAAATCACATACAG^ 

TGAGATT AAAGGTTTGGCTTATG CAGTTGATGCG AATG CAGAGGGTA CAG 

CAGTAACTTACAAATTAAAAGAAACAAAAGCACCAGAAGGTTATGTAATC 

CCTGATAAAGAAATCGAGTTTACAGTATCAC^^ 

ACCAACTGACATCACGGTI^TAGTGCTGATGCAACACCTG^ 

AAAACAACAAACGTCCTTCA 

SSQ ID NO. 8709 
STRAIN JM9130013 

GCAGAAGTGTCACAAGAACGCCCAGCGAAAACAGCAGTA 
AATATCTATAAATTACAAG CTGATAGTTATAAATCGGAAATTACTTCTAA 
TGGTGGTATCGAGAATAAAGACGG CGAAGTAATATCTAACTATGCTAAAC 
TTGGTGACAATGTAAAAGGTTTGCAAGGTCTACAGT^ 
GTCAAGACX3GATATTTCTGTTGATGAATTGAAAAAATTGACAA 
AGCAGCAGATGCAAAAGTTGGAACGATTCTTGAAGAAGGTCT 

AGTIAATGTGAGATACTTGTATGTAGAAGATTTAAAGA 

CATTACCAAAG CTTATG CIXn , ACCGTTTGlXn - TCGAATTACCAGTTGCTA 

GTTGTAACTGATGAACCAAAAACAGATAAAGATGTTAAAAAATTAGGTCA 

GGACGATGCAGGTTATAC^TTGGTGAAGAATTCAAATGGTTCT 

CTACAATCCCTGCCAATTTAGGTGACTATGA 

AAATTTGCAGATGGCTTGACTTATAAATCrrGTTGGAAAAA 

TTCGAAAACACTGAATAGAGATGAGC^CTACACTATIX^TGAACCAACAG 

TTGATAACXyWUVTACATTAAAAATTACGTTTAAACCAGAGAAATTTAAA 

GAAATTGCTGAGCTACTTAAAGGAATGACCCTTGTT^ 

TCTTGATAAAGCTACTGOVAATACAGATGATGC^ 

CAGTTGCATCAACrrATTAATGAAAAAGOiGTTTT 

AATACTTTTGAACTTCAATATGACCATACTCCTGATAAA^ 

AAAACCATCTAATcCTcCAAGAAAACCAGAAGTTCATACTGGTGGGAAAC 

GATITGTAAAGAAAGACTCAACAGAAACACAAACACTAGG 

TTTGATTTGTTGGCTTCTGATGGGACAGCA^ 

TATTAAAGCGAATACTAATAAAAACrATATTGCTGGAGAAGKHXSTTAC^ 
GGCAACCAATCAAATTGAAATCACATACAGACG^ 

GGTTTGGCTTATGCAGTTGATGCGAATG CAGAGGGTACAGCAGTAACTTA 
CAAATTAAAAGAAACAAAAGCAC£AGAAGGTTA^ 
AAATCGAGTTTACAGTATCACAAACATCTTATAATAC^ 
ATCACGGTTGAT AGTGCTGATG CAACACCTGATACAATTAAAAACAACAA 
ACGTCCTTCA 



PRETTY of: /biotmp/msal23961.2{*} April 30, 2003 07; 17 



msal23961 . 2 f 80_2603 
msal2 3 961 .2(8 0_A909 
msal23961 .2 (80_M732 
msal23961 . 2 { 80_090 
rasal23961 .2 f 80_COH1 
msal23961.2{80_M781 
rasal23961.2{80l JM9130013 
tnsal23961 . 2l80__18RS21 
msal23961 . 2 {80h_CJB110 
Consensus 



1 50 
atgaaattat cgaagaagtt attgttttcg gctgctgttt taacaatggt 



msal23961.2f 80J2603 
maal23 96 1 . 2 ( 6 0_A9 0 9 
msal23961.2(80_M732 
msal23961.2{80_090 
msal23 9 6 1 . 2 f 8 0_COH1 
msal23961.2{80_M781 
msal23961.2{80l JM9130013 
msal23961 . 2l>0_18RS21 
. msal23961 . 2 { 80h_CJB110 
Consensus 



51 100 
ggcggggtca actgttgaac cagtagctca gtttgcgact ggaatgagta 



msal23961.2{80_2603 
msal23961.2(80_A909 
msal23961.2{80_M732 
msal23 961.2(8 0_0 90 
msal23961.2(80_COHl 
msal23961 . 2 { 80_M78 1 
msal23961.2{80l JM9130013 
msal23961.2T80_18RS21 



101 

ttgtaagagc 



t GCAGAAGTG 
-GCAGAAGTG 

GCAGAAGTG 

GCAGAAGTG 

GCAGAAGTG 

- -GCAGAAGTG 

GCAGAAGTG 

GCAGAAGTG 



TCACAAGAAC 
TCACAAGAAC 
TCACAAGAAC 
TCACAAGAAC 
TCACAAGAAC 
TCACAAGAAC 
TCACAAGAAC 
TCACAAGAAC 



GCCCAGCGAA 
GCCCAGCGAA 
GCCCAGCGAA 
GCCCAGCGAA 
GCCCAGCGAA 
GCCCAGCGAA 
GCCCAGCGAA 
GCCCAGCGAA 



150 

AACAaCAGTA 
AACAaCAGTA 
AACAaCAGTA 
AACAgCAGTA 
AACAgCAGTA 
AACAgCAGTA 
AACAgCAGTA 
AACAgCAGTA 
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rasal23961 . 2 { 80h_CJB110 } 
Consensus 



-GCAGAAGTG TCACAAGAAC GCCCAGCGAA AACAgCAGTA 



X51 

msal23961.2{80_2603} AATATCTATA 

msal23961.2{80 A909 AATATCTATA 

msal23961.2{80~M732 AATATCTATA 

oiBal23961.2{80_090 AATATCTATA 

msal23961.2(80_COHl AATATCTATA 

msal23 96 1 .2(8 0_M78 1 AATATCTATA 

msa!23961.2{80l JM9130013 \ AATATCTATA 

msal2 3 961.2X80 18RS21 ) AATATCTATA 

msal23 961 . 2 { 80h~C JB110 } AATATCTATA 

Consensus ********** 



AATTACAAGC 
AATTACAAGC 
AATTACAAGC 
AATTACAAGC 
AATTACAAGC 
AATTACAAGC 
AATTACAAGC 
AATTACAAGC 
AATTACAAGC 



TGATAGTTAT 
TGATAGTTAT 
TGATAGTTAT 
TGATAGTTAT 
TGATAGTTAT 
TGATAGTTAT 
TGATAGTTAT 
TGATAGTTAT 
TGATAGTTAT 



AAATcGGAAA 
AAATcGGAAA 
AAATcGGAAA 
AAATcGGAAA 
AAATcGGAAA 
AAATcGGAAA 
AAATcGGAAA 
AAATcGGAAA 
AAATtGGAAA 



200 

TTACTTcTAA 
TTACTTcTAA 
TTACTTcTAA 
TTACTTcTAA 
TTACTTnTAA 
TTACTTcTAA 
TTACTTcTAA 
TTACTTcTAA 
TTACTTcTAA 



201 

msal23961.2{80_2603) TGGTGGTATC 

msal23961.2{80_A909) TGGTGGTATC 

msal23961.2{80_M732 TGGTGGTATC 

ntsal23961.2{80_090) TGGTGGTATC 

meal23 961.2(8 0_COH1 ' TGGTGGTATC 

msal23961.2(80_M781> TGGTGGTATC 

msal23961.2{80l JM9 130013 TGGTGGTATC 

msal23961.2T80_18RS21 TGGTGGTATC 

msal23961.2{80h_CJB110) TGGTGGTATC 

Consensus ********** 



GAGAATAAAG 
GAGAATAAAG 
GAGAATAAAG 
GAGAATAAAG 
GAGAATAAAG 
GAGAATAAAG 
GAGAATAAAG 
GAGAATAAAG 
GAGAATAAAG 



ACGGCGAAGT 
ACGGCGAAGT 
ACGGCGAAGT 
ACGGCGAAGT 
ACGGCGAAGT 
ACGGCGAAGT 
ACGGCGAAGT 
ACGGCGAAGT 
ACGGCGAAGT 



AATATCTAAC 
AATATCTAAC 
AATATCTAAC 
AATATCTAAC 
AATATCTAAC 
AATATCTAAC 
AATATCTAAC 
AATATCTAAC 
AATATCTAAC 



250 

TATGCTAAAC 
TATGCTAAAC 
TATGCTAAAC 
TATGCTAAAC 
TATGCTAAAC 
TATGCTAAAC 
TATGCTAAAC 
TATGCTAAAC 
TATGCTAAAC 



251 

msal23961.2{80_2603} TTGGTGACAA 

msal23961.2{80J\909' TTGGTGACAA 

msal23961.2{80__M732 TTGGTGACAA 

msal23961.2{80_090> TTGGTGACAA 

msa!23961.2{80_COHl> TTGGTGACAA 

msal23961.2{80_M781J TTGGTGACAA 

msal23961.2{801 JM9130013) TTGGTGACAA 

msal23961.2T80_18RS21> TTGGTGACAA 

msal23961.2{80h_CJB110} TTGGTGACAA 

Consensus ********** 



TGTAAAAGGT 
TGTAAAAGGT 
TGTAAAAGGT 
TGTAAAAGGT 
TGTAAAAGGT 
TGTAAAAGGT 
TGTAAAAGGT 
TGTAAAAGGT 
TGTAAAAGGT 



TTGCAAGGTG 
TTGCAAGGTG 
TTGCAAGGTG 
TTGCAAGGTG 
TTGCAAGGTG 
TTGCAAGGTG 
TTGCAAGGTG 
TTGCAAGGTG 
TTGCAAGGTG 



TACAGTTTAA 
TACAGTTTAA 
TACAGTTTAA 
TACAGTTTAA 
TACAGTTTAA 
TACAGTTTAA 
TACAGTTTAA 
TACAGTTTAA 
TACAGTTTAA 



300 

ACGTTATAAA 
ACGTTATAAA 
ACGTTATAAA 
ACGTTATAAA- 
ACGTTATAAA 
ACGTTATAAA 
ACGTTATAAA 
ACGTTATAAA 
ACGTTATAAA 



msal23 961 . 2 { 8 0_2603 
msal23 961 .2(8 0_A909 
rasal23961 . 2 { 80_M732 
msal23961.2{80_090 
msal23 961 . 2 f 8 0_COH1 
msal23961.2{80_M781 
msal23961.2{80l JM9130013 
rasal23961.2T80_18RS21 
msal23961.2{80h_CJB110 
Consensus 



msal23961 .2 (80_2603; 
msal23961.2{80_A909 
msal23961.2{80_M732 
msal23961 . 2 { 80_090 
msal23961 .2 f 80_C0H1 
msal23961 .2 {80_M781 
msal23961.2{801 JM9130013 
msal23961 . 2180_18RS21 
msal23 961 . 2 { 80h2cJB110 
Consensus 



msal23 961 .2(8 0_2603 ] 
msal23961.2{80_A909 
msal23961 . 2 {80_M732 
msal23961.2{80_090 
insal2 3 96 1 . 2 ( 8 0_COH1 
msal23961.2{80_M781 
msal23961.2{801 JM9130013 
msal23961 . 2l80_18RS21 
msal23 961.2(8 0h_CJB110 
Consensus 



msal23961.2(80_2603 
msal23961 .2 (80_A909 
msal23961.2{80_M732 
maal23961.2{80_090 
raBal23 961.2(8 0_COH1 
msal23961.2{80_M781 
msal23961.2{80l_JM9130013 



301 

GTCAAGACGG 
GTCAAGACGG 
GTCAAGACGG 
GTCAAGACGG 
GTCAAGACGG 
GTCAAGACGG 
GTCAAGACGG 
GTCAAGACGG 
GTCAAGACGG 



ATATTTCTGT 
ATATTTCTGT 
ATATTTCTGT 
ATATTTCTGT 
ATATTTCTGT 
ATATTTCTGT 
ATATTTCTGT 
ATATTTCTGT 
ATATTTCTGT 



TGATGAATTG 
TGATGAATTG 
TGATGAATTG 
TGATGAATTG 
TGATGAATTG 
TGATGAATTG 
TGATGAATTG 
TGATGAATTG 
TGATGAATTG 



AAAAAATTGA 
AAAAAATTGA 
AAAAAATTGA 
AAAAAATTGA 
AAAAAATTGA 
AAAAAATTGA 
AAAAAATTGA 
AAAAAATTGA 
AAAAAATTGA 



350 

CAACAGTTGA 
CAACAGTTGA 
CAACAGTTGA 
CAACAGTTGA 
CAACAGTTGA 
CAACAGTTGA 
CAACAGTTGA 
CAACAGTTGA 
CAACAGTTGA 



351 

AGCAGCAGAT 
AGCAGCAGAT 
AGCAGCAGAT 
AGCAGCAGAT 
AGCAGCAGAT 
AGCAGCAGAT 
AGCAGCAGAT 
AGCAGCAGAT 
AGCAGCAGAT 
********** 

401 

CTCAAAAAAC 
CTCAAAAAAC 
CTCAAAAAAC 
CTCAAAAAAC 
CTCAAAAAAC 
CTCAAAAAAC 
CTCAAAAAAC 
CTCAAAAAAC 
CTCAAAAAAC 



GCAAAA GTTG 
GCAAAAGTTG 
GCAAAAGTTG 
GCAAAAGTTG 
GCAAAAGTTG 
GCAAAAGTTG 
GCAAAAGTTG 
GCAAAAGTTG 
GCAAAAGTTG 
********** 



GAACGATTCT 
GAACGATTCT 
GAACGATTCT 
GAACGATTCT 
GAACGATTCT 
GAACGATTCT 
GAACGATTCT 
GAACGATTCT 
GAACGATTCT 
********** 



TGAAGAAGGT 
TGAAGAAGGT 
TGAAGAAGGT 
TGAAGAAGGT 
TGAAGAAGGT 
TGAAGAAGGT 
TGAAGAAGGT 
TGAAGAAGGT 
TGAAGAAGGT 
********** 



TAATGCTCAA 
TAATGCTCAA 
TAATGCTCAA 
TAATGCTCAA 
TAATGCTCAA 
TAATGCTCAA 
TAATGCTCAA 
TAATGCTCAA 
TAATGCTCAA 



GGTTTGGTCG 
G GTTTG GTCG 
GGTTTGGTCG 
GGTTTGGTCG 
GGTTTGGTCG 
GGTTTGGTCG 
GGTTTGGTCG 
GGTTTGGTCG 
GGTTTGGTCG 



TCGATGCTCT 
TOGATGCTCT 
TCGATGCTCT 
TCGATGCTCT 
TCGATGCTCT 
TCGATGCTCT 
TOGATGCTCT 
TCGATGCTCT 
TCGATGCTCT 



400 

GTCAGTCTAC 
GTCAGTCTAC 
GTCAGTCTAC 
GTCAGTCTAC 
GTCAGTCTAC 
GTCAGTCTAC 
GTCAGTCTAC 
GTCAGTCTAC 
GTCAGTCTAC 
********** 

450 

GGATTCAAAA 
GGATTCAAAA 
GGATTCAAAA 
GGATTCAAAA 
GGATTCAAAA 
GGATTCAAAA 
GGATTCAAAA 
GGATTCAAAA 
GGATTCAAAA 



451 

AGTAATGTGA 
AGTAATGTGA 
AGTAATGTGA 
AGTAATGTGA 
AGTAATGTGA 
AGTAATGTGA 
AGTAATGTGA 



GATACTTGTA 
GATACTTGTA 
GATACTTGTA 
GATACTTGTA 
GATACTTGTA 
GATACTTGTA 
GATACTTGTA 



TGTAGAAGAT 
TGTAGAAGAT 
TGTAGAAGAT 
TGTAGAAGAT 
TGTAGAAGAT 
TGTAGAAGAT 
TGTAGAAGAT 



TTAAAGAATT 
TTAAAGAATT 
TTAAAGAATT 
TTAAAGAATT 
TTAAAGAATT 
TTAAAGAATT 
TTAAAGAATT 



500 

CACCTTCAAA 
CACCTTCAAA 
CACCTTCAAA 
CACCTTCAAA 
CACCTTCAAA 
CAC CTTC AAA 
CACCTTCAAA 
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msal23961.2{80_18RS2l} AGTAATGTGA GATACTTGTA TGTAGAAGAT TTAAAGAATT CACCTTCAAA 
msal23961.2{80h_CJB110} AGTAATGTGA GATACTTGTA TGTAGAAGAT TTAAAGAATT CACCTTCAAA 
Consensus ********** ********** ********** ********** ********** 



msal23961.2(80 2603 
msal23961.2<80~A909 
msal23961 . 2 (80_M732 
msal23961.2{80_090 
msal23961 .2(8 0_COH1 
msal23961.2{80_M781 
cnaal23961.2{801 JM9130013 
msal23 961.2X80 18RS21 
msal23961 . 2 { 80h~CJB110 
Consensus 



501 

CATTACCAAA 
CATTACCAAA 
CATTACCAAA 
CATTACCAAA 
CATTACCAAA 
CATTACCAAA 
CATTACCAAA 
CATTACCAAA 
CATTACCAAA 



GCTTATGCTG 
GCTTATGCTG 
GCTTATGCTG 
GCTTATGCTG 
GCTTATGCTG 
GCTTATGCTG 
GCTTATGCTG 
GCTTATGCTG 
GCTTATGCTG 



TACCGTTTGT 
TACCGTTTGT 
TACCGTTTGT 
TACCGTTTGT 
TACCGTTTGT 
TACCGTTTGT 
TACCGTTTGT 
TACCGTTTGT 
TACCGTTTGT 



GTTGGAATTA 
GTTGGAATTA 
GTTGGAATTA 
GTTGGAATTA 
GTTGGAATTA 
GTTGGAATTA 
GTTGGAATTA 
GTTGGAATTA 
GTTGGAATTA 



550 

CCAGTTGCTA 
CCAGTTGCTA 
CCAGTTGCTA 
CCAGTTGCTA 
CCAGTTGCTA 
CCAGTTGCTA" 
CCAGTTGCTA 
CCAGTTGCTA 
CCAGTTGCTA 



msal23961 . 2 f 80_2603 
rasal23961.2f B0_A909 
msal23 961 .2(80 M732 
msal23961.2{80_090 
msal23961.2[80 COH1 
msal23 961 .2(8 0~M781 
tnsal23961.2{801 JM9130013 
msal23961.2T80 18RS21 
msal23961 . 2 { 80h~CJB110 
Consensus 



551 

ACTCTACAGG 
ACTCTACAGG 
ACTCTACAGG 
ACTCTACAGG 
ACTCTACAGG 
ACTCTACAGG 
ACTCTACAGG 
ACTCTACAGG 
ACTCTACAGG 



TACAGGTTTC 
TACAGGTTTC 
TACAGGTTTC 
TACAGGTTTC 
TACAGGTTTC 
TACAGGTTTC 
TACAGGTTTC 
TACAGGTTTC 
TACAGGTTTC 



CTTTCTGAAA 
CTTTCTGAAA 
CTTT CTGAAA 
CTTTCTGAAA 
CTTTCTGAAA 
CTTT CTGAAA 
CTTTCTGAAA 
CTTTCTGAAA 
CTTTCTGAAA 



TTAATATTTA 
TTAATATTTA 
TTAATATTTA 
TTAATATTTA 
TTAATATTTA 
TTAATATTTA 
TTAATATTTA 
TTAATATTTA 
TTAATATTTA 



600 

CCCTAAAAAC 
CCCTAAAAAC 
CCCTAAAAAC 
CCCTAAAAAC 
CCCTAAAAAC 
CCCTAAAAAC 
CCCTAAAAAC 
CCCTAAAAAC 
CCCTAAAAAC 



msal23961.2(80_2603 
msal23961.2f 80_A909 
msal23961.2(80 M732 
msal23961 . 2 {80_090 
insa 12 3 9 61 . 2 ( 8 0_COH1 
rasal23 961 . 2 { 8 0_M7 8 1 
msa!23961.2{801 JM9130013 
msal2 3961. 2^8 0_18RS21 
msal23 961 . 2 { 8 0h_C JB110 
Consensus 



601 

GTTGTAACTG 
GTTGTAACTG 
GTTGTAACTG 
GTTGTAACTG 
GTTGTAACTG 
GTTGTAACTG 
GTTGTAACTG 
GTTGTAACTG 
GTTGTAACTG 
********** 



ATGAACCAAA 
ATGAACCAAA 
ATGAACCAAA 
ATGAACCAAA 
ATGAACCAAA 
ATGAACCAAA 
ATGAACCAAA 
ATGAACCAAA 
ATGAACCAAA 
********** 



AACAGATAAA 
AACAGATAAA 
AACAGATAAA 
AACAGATAAA 
AACAGATAAA 
AACAGATAAA 
AACAGATAAA 
AACAGATAAA 
AACAGATAAA 
********** 



GATGTTAAAa 
GATGTTAAAa 
GATGTTAAAa 
GATGTTAAAa 
GATGTTAAAa 
GATGTTAAAa 
GATGTTAAAa 
GATGTTAAAt 
GATGTTAAAa 
*********_ 



650 

AATTAGGTCA 
AATTAGGTCA 
AATTAGGTCA 
AATTAGGTCA 
AATTAGGTCA 
AATTAGGTCA 
AATTAGGTCA 
AATTAGGTCA 
AATTAGGTCA 
********** 



tnsa!23961.2(80_2603 
msal23961.2(80~A909 
msal23961.2(80 M732 
msal23961.2{80 090 
msal23 961.2(8 0_COH1 
msal23 961.2(8 0_M78 1 
msal23961.2{80l JM9130013 
rasal23961 . 2f80_18RS21 
msal23961 . 2 {80h_CJB110 
Consensus 



651 

GGACGATGCA 
GGACGATGCA 
GGACGATGCA 
GGACGATGCA 
GGACGATGCA 
GGACGATGCA 
GGACGATGCA 
GGACGATGCA 
GGACGATGCA 



GGTTATACGA 
GGTTATACGA 
GGTTATACGA 
GGTTATACGA 
GGTTATACGA 
GGTTATACGA 
GGTTATACGA 
GGTTATACGA 
GGTTATACGA 



TTGGTGAAGA 
TTGGTGAAGA 
TTGGTGAAGA 
TTGGTGAAGA 
TTGGTGAAGA 
TTGGTGAAGA 
TTGGTGAAGA 
TTGGTGAAGA 
TTGGTGAAGA 



ATTCAAATGG 
ATTCAAATGG 
ATTCAAATGG 
ATTCAAATGG 
ATTCAAATGG 
ATTCAAATGG 
ATTCAAATGG 
ATTCAAATGG 
ATTCAAATGG 



700 

TTCTTGAAAT 
TTCTTGAAAT 
TTCTTGAAAT 
TTCTTGAAAT 
TTCTTGAAAT 
TTCTTGAAAT 
TTCTTGAAAT 
TTCTTGAAAT 
TTCTTGAAAT 



msal23961.2(80_2603 
rasal23 961 . 2 f 80 A909 
msal23961 . 2 { 80_M732 
msal23 9 6 1 . 2 { 8 0_0 9 0 
msal 2 3 961.2(8 0_COH1 
msal23 961 . 2 { 80_M78 1 
tnsal23961.2{80l JM9130013 
msa!2 3961. 2^8 0_1 8RS2 1 
msal23961 ,2{80h_CJB110 
Consensus 



701 

CTACAATCCC 
CTACAATCCC 
CTACAATCCC 
CTACAATCCC 
CTACAATCCC 
CTACAATCCC 
CTACAATCCC 
CTACAATCCC 
CTACAATCCC 



TGCCAATTTA 
TGCCAATTTA 
TGCCAATTTA 
TGCCAATTTA 
TGCCAATTTA 
TGCCAATTTA 
TGCCAATTTA 
TGCCAATTTA 
TGCCAATTTA 



GGTGACTATG 
GGTGACTATG 
GGTGACTATG 
GGTGACTATG 
GGTGACTATG 
GGTGACTATG 
GGTGACTATG 
GGTGACTATG 
GGTGACTATG 



AAAAATTTGA 
AAAAATTTGA 
AAAAATTTGA 
AAAAATTTGA 
AAAAATTTGA 
AAAAATTTGA 
AAAAATTTGA 
AAAAATTTGA 
AAAAATTTGA 



750 

AATTACTGAT 
AATTACTGAT 
AATTACTGAT 
AATTACTGAT 
AATTACTGAT 
AATTACTGAT 
AATTACTGAT 
AATTACTGAT 
AATTACTGAT 



msal23961.2(80 2603 
msa 123 96 1 . 2 j 8 0*~A90 9 
maal23961.2(80~M732 
msal23961.2{80 090 
msal23961 . 2 { SOjoOHl 
msal23961.2(80 M781 
msal23961.2{80l JM9130013 
msal23961.2T80 18RS21 
rasal23961 . 2 { 80h~CJB110 
Consensus 



751 

AAATTTGCAG 
AAATTTGCAG 
AAATTTGCAG 
AAATTTGCAG 
AAATTTGCAG 
AAATTTGCAG 
AAATTTGCAG 
AAATTTGCAG 
AAATTTGCAG 



ATGGCTTGAC 
ATGGCTTGAC 
ATGGCTTGAC 
ATGGCTTGAC 
ATGGCTTGAC 
ATGGCTTGAC 
ATGGCTTGAC 
ATGGCTTGAC 
ATGGCTTGAC 



TTATAAATCT 
TTATAAATCT 
TTATAAATCT 
TTATAAATCT 
TTATAAATCT 
TTATAAATCT 
TTATAAATCT 
TTATAAATCT 
TTATAAATCT 



GTTGGAAAAA 
GTTGGAAAAA 
GTTGGAAAAA 
GTTGGAAAAA 
GTTGGAAAAA 
GTTGGAAAAA 
GTTGGAAAAA 
GTTGGAAAAA 
GTTGGAAAAA 



800 

TCAAGATTGG 
TCAAGATTGG 
TCAAGATTGG 
TCAAGATTGG 
TCAAGATTGG 
TCAAGATTGG 
TCAAGATTGG 
TCAAGATTGG 
TCAAGATTGG 



msal23961.2(80_2603 
msal23961 . 2 { 80_A909 
msal23961 . 2 (80J4732 
msal23961.2{80 090. 
msal23961.2(80 OOHX 
msal23961.2{80~M781 



801 

TTCGAAAACA 
TTCGAAAACA 
TTCGAAAACA 
TTCGAAAACA 
TTCGAAAACA 
TTCGAAAACA 



CTGAATAGAG 
CTGAATAGAG 
CTGAATAGAG 
CTGAATAGAG 
CTGAATAGAG 
CTGAATAGAG 



ATGAGCACTA 
ATGAGCACTA 
ATGAGCACTA 
ATGAGCACTA 
ATGAGCACTA 
ATGAGCACTA 



CACTATTGAT 
CACTATTGAT 
CACTATTGAT 
CACTATTGAT 
CACTATTGAT 
CACTATTGAT 



850 

GAACCAACAG 
GAACCAACAG 
GAACCAACAG 
GAACCAACAG 
GAACCAACAG 
GAACCAACAG 
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msal23961.2{801 JM9130013) 
msal23961.2X80 18RS21) 
msal23961 . 2 { 80hTcJB110 } 
Consensus 



TTCGAAAACA CTGAATAGAG ATGAGCACTA CACTATTGAT GAACCAACAG 
TTCGAAAACA CTGAATAGAG ATGAGCACTA CACTATTGAT GAACCAACAG 
TTCGAAAACA CTGAATAGAG ATGAGCACTA CACTATTGAT GAACCAACAG 



msal23961 . 2 {80_2603 
tnsal23961 . 2 { 80_A909 
msal23961 . 2 { 80_M732 
msal23961 . 2 {80_090 
msal23961.2(80_COHl 
msal23961.2{80_M78i 
msal23961.2{801 JM9130013 
msal23961.2*{"80_18RS21 
msal23 9 61 . 2 { 8 0h_C JB110 
Consensus 



851 

TTGATAACCA 
TTGATAACCA 
TTGATAACCA 
TTGATAACCA 
TTGATAACCA 
TTGATAACCA 
TTGATAACCA 
TTGATAACCA 
TTGATAACCA 



AAATACATTA 
AAATACATTA 
AAATACATTA 
AAATACATTA 
AAATACATTA 
AAATACATTA 
AAATACATTA 
AAATACATTA 
AAATACATTA 



AAAATTACGT 
AAAATTACGT 
AAAATTACGT 
AAAATTACGT 
AAAATTACGT 
AAAATTACGT 
AAAATTACGT 
AAAATTACGT 
AAAATTACGT 



TTAAACCAGA 
TTAAACCAGA 
TTAAACCAGA 
TTAAACCAGA 
TTAAACCAGA 
TTAAACCAGA 
TTAAACCAGA 
TTAAACCAGA 
TTAAACCAGA 



900 

GAAATTTAAA 
GAAATTTAAA 
GAAATTTAAA 
GAAATTTAAA 
GAAATTTAAA 
GAAATTTAAA 
GAAATTTAAA 
GAAATTTAAA 
GAAATTTAAA 



msal23961 . 2 (80_2603 
msal23961 . 2 f 80_A909 
msal23 961 . 2 { 80_M732 
msal23961.2{80_090 
msa!2 3 96 1 . 2 { 8 0_COH1 
msal23961 . 2 (80_M781 
msal23961.2{80l JM9130013 
rasal23961 . 2X80_18RS21 
msal23 961 . 2 { 80h_CJB110 
Consensus 



901 

GAAATTGCTG 
GAAATTGCTG 
GAAATTGCTG 
GAAATTGCTG 
GAAATTGCTG 
GAAATTGCTG 
GAAATTGCTG 
GAAATTGCTG 
GAAATTGCTG 



AGCTACTTAA 
AGCTACTTAA 
AGCTACTTAA 
AGCTACTTAA 
AGCTACTTAA 
AGCTACTTAA 
AGCTACTTAA 
AGCTACTTAA 
AGCTACTTAA 



AGGAATGACC 
AGGAATGACC 
AGGAATGACC 
AGGAATGACC 
AGGAATGACC 
AGGAATGACC 
AGGAATGACC 
AGGAATGACC 
AGGAATGACC 



CTTGTTAAAA 
CTTGTTAAAA 
CTTGTTAAAA 
CTTGTTAAAA 
CTTGTTAAAA 
CTTG TTAAAA 
CTTGTTAAAA 
CTTGTTAAAA 
CTTGTTAAAA 



950 

ATCAAGATGC 
ATCAAGATGC 
ATCAAGATGC 
ATCAAGATGC 
ATCAAGATGC 
ATCAAGATGC 
ATCAAGATGC 
ATCAAGATGC 
ATCAAGATGC 



msal23 961 . 2 { 80_2603 
msal23961.2(80 A909 
msal23961. 2(803*732 
msal2 3 96 1 . 2 { 8 0_09 0 
msal23 961 .2(8 0_COH1 
rasal23 961.2 { 80_M78 1 
msal23961.2{80l JM9130013 
msal23961.2Teo 18RS21 
rasal23 961 .2(8 0h_CJBll 0 
Consensus 



951 

TCTTGATAAA 
TCTTGATAAA 
TCTTGATAAA 
TCTTGATAAA 
TCTTGATAAA 
TCTTGATAAA 
TCTTGATAAA 
TCTTGATAAA 
TCTTGATAAA 
********** 



GCTACTGCAA 
GCTACTGCAA 
GCTACTGCAA 
GCTACTGCAA 
GCTACTGCAA 
GCTACTGCAA 
GCTACTGCAA 
GCTACTGCAA 
GCTACTGCAA 
********** 



ATACAGATGA 
ATACAGATGA 
ATACAGATGA 
ATACAGATGA 
ATACAGATGA 
ATACAGATGA 
ATACAGATGA 
ATACAGATGA 
ATACAGATGA 
********** 



TGCGGCATTT 
TGCGGCATTT 
TGCGGCATTT 
TGCGGCATTT 
TGCGGCATTT 
TGCGGCATTT 
TGCGGCATTT 
TGCGGCATTT 
TGCGGCATTT 
********** 



1000 
TTGGAAATTC 
TTGGAAATTC 
TTGGAAATTC 
TTGGAAATTC 
TTGGAAATTC 
TTGGAAATTC 
TTGGAAATTC 
TTGGAAATTC 
TTGGAAATTC 
********** 



msal23961 . 2 ( 80_2603 
msal23961.2{80_A909 
msal23961 . 2 ( 80_M732 
msal23961 . 2{80_090 
msal23961 . 2 f 80_COH1 
msal23961.2{80_M781 
msal23961.2{80l JM9130013 
msal23961.2T80 18RS21 
rasal23961 . 2 { 80iTcJB110 
Consensus 



1001 

CAGTTGCATC 
CAGTTGCATC 
CAGTTGCATC 
CAGTTGCATC 
CAGTTGCATC 
CAGTTGCATC 
CAGTTGCATC 
CAGTTGCATC 
CAGTTGCATC 



AACTATTAAT 
AACTATTAAT 
AACTATTAAT 
AACTATTAAT 
AACTATTAAT 
AACTATTAAT 
AACTATTAAT 
AACTATTAAT 
AACTATTAAT 



GAAAAAGCAG 
GAAAAAGCAG 
GAAAAAGCAG 
GAAAAAGCAG 
GAAAAAGCAG 
GAAAAAGCAG 
GAAAAAGCAG 
GAAAAAGCAG 
GAAAAAGCAG 



TTTTAGGAAA 
TTTTAGGAAA 
TTTTAGGAAA 
TTTTAGGAAA 
TTTTAGGAAA 
TTTTAGGAAA 
TTTTAGGAAA 
TTTTAGGAAA 
TTTTAGGAAA 



1050 
AGCAATTGAA 
AGCAATTGAA 
AGCAATTGAA 
AGCAATTGAA 
AGCAATTGAA 
AGCAATTGAA 
AGCAATTGAA 
AGCAATTGAA 
AGCAATTGAA 



msal23961.2{80_2603 
msal 2 3 9 6 1 . 2 { 8 0_A9 0 9 
msal2 3961.2(8 0__M73 2 
msal23961.2{80_090 
msa!2 3961.2(8 0_COH1 
msal 23 961.2(8 0_M78 1 
msal23961.2{80l JM9130013 
msal2 3 961.2X80 18RS21 
msal23961 . 2 { 80h"CJB110 
Consensus 



1051 

AATACTTTTG 
AATACTTTTG 
AATACTTTTG 
AATACTTTTG 
AATACTTTTG 
AATACTTTTG 
AATACTTTTG 
AATACTTTTG 
AATACTTTTG 



AACTTCAATA 
AACTTCAATA 
AACTTCAATA 
AACTTCAATA 
AACTTCAATA 
AACTTCAATA 
AACTTCAATA 
AACTTCAATA 
AACTTCAATA 



TGACCATACT 
TGACCATACT 
TGACCATACT 
TGACCATACT 
TGACCATACT 
TGACCATACT 
TGACCATACT 
TGACCATACT 
TGACCATACT 



CCTGATAAAG 
CCTGATAAAG 
CCTGATAAAG 
CCTGATAAAG 
CCTGATAAAG 
CCTGATAAAG 
CCTGATAAAG 
CCTGATAAAG 
CCTGATAAAG 



1100 
CTGACAATCC 
CTGACAATCC 
CTGACAATCC 
CTGACAATCC 
CTGACAATCC 
CTGACAATCC 
CTGACAATCC 
CTGACAATCC 
CTGACAATCC 



msal23961.2{80_2603 
msal23961.2{80_A909 
rasal23 9j6 1 . 2 { 8 0_M73 2 
msal23961.2{80_090 
msal23 961 . 2 { 8 0_COH1 
msal23961 . 2 (80_M781 
msal23961.2{801 JM9130013 
msal23961 . 2l80_18RS21 
msal23961 . 2 { 80h_CJB110 
Consensus 



1101 

AAAACCATCT 
AAAACCATCT 
AAAACCATCT 
AAAACCATCT 
AAAACCATCT 
AAAACCATCT 
AAAACCATCT 
AAAACCATCT 
AAAACCATCT 



AATCCrCCAA 
AATCCTCCAA 
AATCCTCCAA 
AATCCTCCAA 
AATCCTCCAA 
AATCCTCCAA 
AATCCTCCAA 
AATCCTCCAA 
AATCCTCCAA 



GAAAACCAGA 
GAAAACCAGA 
GAAAACCAGA 
GAAAACCAGA 
GAAAACCAGA 
GAAAACCAGA 
GAAAACCAGA 
GAAAACCAGA 
GAAAACCAGA 



AGTTCATACT 
AGTTCATACT 
AGTTCATACT 
AGTTCATACT 
AGTTCATACT 
AGTTCATACT 
AGTTCATACT 
AGTTCATACT 
AGTTCATACT 



1150 
GGTGGGAAAC 
GGTGGGAAAC 
GGTGGGAAAC 
GGTGGGAAAC 
GGTGGGAAAC 
GGTGGGAAAC 
GGTGGGAAAC 
GGTGGGAAAC 
GGTGGGAAAC 



msal23961.2(80 2603 
rasal23961.2f80_A909 
msal23961.2{80_M732 
msal23961.2{80_090 
msal23961.2{80_COHl 



1151 

GATTTGTAAA 
GATTTGTAAA 
GATTTGTAAA 
GATTTGTAAA 
GATTTGTAAA 



GAAAGACTCA ACAGAAACAC AAACACTAGG 
GAAAGACTCA ACAGAAACAC AAACACTAGG 
GAAAGACTCA ACAGAAACAC AAACACTAGG 
GAAAGACTCA ACAGAAACAC AAACACTAGG 
GAAAGACTCA ACAGAAACAC AAACACTAGG 



1200 
TGGTGCTGAG 
TGGTGCTGAG 
TGGTGCTGAG 
TGGTGCTGAG 
TGGTGCTGAG 
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maal23961.2{80 M781) 
msal23961.2{801 JM9130013J 
msal23961.2X80_18RS21J 
msal23 961 . 2 { 80h_CJBllO } 
Consensus 



GATTTGTAAA GAAAGACTCA ACAGAAACAC AAACACTAGG TGGTGCTGAG 
GATTTGTAAA GAAAGACTCA ACAGAAACAC AAACACTAGG TGGTGCTGAG 
GATTTGTAAA GAAAGACTCA ACAGAAACAC AAACACTAGG TGGTGCTGAG 
GATTTGTAAA GAAAGACTCA ACAGAAACAC AAACACTAGG TGGTGCTGAG 



maal2396l.2(80_2603 
msal2396l.2(a0_A909 
msal23961.2{80 M732 
msal23961 - 2 {80_090 
maal23 961 . 2 { 8 0_OOH1 
msal2396i.2{80_M781 
msal23961.2{801 JM9130013 
msal2 3 9 6 1 . 2j& 0_1 BRS2 1 
msal23 9 61 . 2 { 8 Oh_CJBl 1 0 
Consensus 



1201 

TTTGATTTGT 
TTTGATTTGT 
TTTGATTTGT 
TTTGATTTGT 
TTTGATTTGT 
TTTGATTTGT 
TTTGATTTGT 
TTTGATTTGT 
TTTGATTTGT 



TGGCTTCTGA 
TGGCTTCTGA 
TGGCTTCTGA 
TGGCTTCTGA 
TGGCTTCTGA 
TGGCTTCTGA 
TGGCTTCTGA 
TGGCTTCTGA 
TGGCTTCTGA 



TGGGACAGCA 
TGGGACAGCA 
TGGGACAGCA 
TGGGACAGCA 
TGGGACAGCA 
TGGGACAGCA 
TGGGACAGCA 
TGGGACAGCA 
TGGGACAGCA 



GTAAAATGGA 
GTAAAATGGA 
GTAAAATGGA 
GTAAAATGGA 
GTAAAATGGA 
GTAAAATGGA 
GTAAAATGGA 
GTAAAATGGA 
GTAAAATGGA 



1250 
CAGATGCTCT 
CAGATGCTCT 
CAGATGCTCT 
CAGATGCTCT 
CAGATGCTCT 
CAGATGCTCT 
CAGATGCTCT 
CAGATGCTCT 
CAGATGCTCT 



msal23961.2(80 2603 
msal23961.2(80 A909 
msal2 3961.2(8 0~M73 2 
msa!23961 . 2 { 80_090 
msal23961.2(80__COHl 
insal23961.2{60 M781 
msal23961.2{801 JM9130013 
msal23961.2T80_18IlS21 
msal23961 . 2 { 80h_CJB110 
Consensus 



1251 

TATTAAAGCG 
TATTAAAGCG 
TATTAAAGCG 
TATTAAAGCG 
TATTAAAGCG 
TATTAAAGCG 
TATTAAAGCG 
TATTAAAGCG 
TATTAAAGCG 



AATACTAATA 
AATACTAATA 
AATACTAATA 
AATACTAATA 
AATACTAATA 
AATACTAATA 
AATACTAATA 
AATACTAATA 
AATACTAATA 



AAAACTATAT 
AAAACTATAT 
AAAACTATAT 
AAAACTATAT 
AAAACTATAT 
AAAACTATAT 
AAAACTATAT 
AAAACTATAT 
AAAACTATAT 



TGCTGGAGAA 
TGCTGGAGAA 
TGCTGGAGAA 
TGCTGGAGAA 
TGCTGGAGAA 
TGCTGGAGAA 
TGCTGGAGAA 
TGCTGGAGAA 
TGCTGGAGAA 



1300 
GCT GTTA CTG 
GCTGTTACTG 
GCTGTTACTG 
GCTGTTACTG 
GCTGTTACTG 
GCTGTTACTG 
GCTGTTACTG 
GCTGTTACTG 
GCTGTTACTG 



msal2396l.2{80 2603 
msal23961 . 2 (80~A909 
msal23961.2{80 M732 
msal23961.2{80_090 
msal23 961.2(8 0_COH1 
msal23961.2{80 M781 
msal2396l.2{80l JM9130013 
nisal23961 . 2TB0_18RS21 
msal239 61 . 2 { 8 0h_CJB110 
Consensus 



1301 

GGCAACCAAT 
GGCAACCAAT 
GGCAACCAAT 
GGCAACCAAT 
GGCAACCAAT 
GGCAACCAAT 
GGCAACCAAT 
GGCAACCAAT 
GGCAACCAAT 



CAAATTGAAA 
CAAATTGAAA 
CAAATTGAAA 
CAAATTGAAA 
CAAATTGAAA 
CAAATTGAAA 
CAAATTGAAA 
CAAATTGAAA 
CAAATTGAAA 



TCACATACAG 
TCACATACAG 
TCACATACAG 
TCACATACAG 
TCACATACAG 
TCACATACAG 
TCACATACAG 
TCACATACAG 
TCACATACAG 



ACGGTACGTT 
ACGGTACGTT 
ACGGTACGTT 
ACGGTACGTT 
ACGGTACGTT 
ACGGTACGTT 
ACGGTACGTT 
ACGGTACGTT 
ACGGTACGTT 



1350 
TGAGATTAAA 
TGAGATTAAA 
TGAGATTAAA 
TGAGATTAAA 
TGAGATTAAA 
TGAGATTAAA 
TGAGATTAAA 
TGAGATTAAA 
TGAGATTAAA 



aisal23961 .2(8 0_2 6 03 
msal23961 . 2 { 8 0_A90 9 
msal23961. 2 {80 M732 
msal23961.2{80_090 
msal23961.2(80 COH1 
msal23961.2{80~M781 
cnsal23961.2{80l JM9130013 
msal23961 .2T80_18RS21 
rasal23961 . 2 {80h_CJB110 
Consensus 



1 351 

GGTTTGGCTT 
GGTTTGGCTT 
GGTTTGGCTT 
GGTTTGGCTT 
GGTTTGGCTT 
GGTTTGGCTT 
GGTTTGGCTT 
GGTTTGGCTT 
GGTTTGGCTT 



ATGCAGTTGA 
ATGCAGTTGA 
ATGCAGTTGA 
ATGCAGTTGA 
ATGCAGTTGA 
ATGCAGTTGA 
ATGCAGTTGA 
ATGCAGTTGA 
ATGCAGTTGA 



TGCGAATGCA 
TGCGAATGCA 
TGCGAATGCA 
TGCGAATGCA 
TGCGAATGCA 
TGCGAATGCA 
TGCGAATGCA 
TGCGAATGCA 
TGCGAATGCA 



GAGGGTACAG 
GAGGGTACAG 
GAGGGTACAG 
GAGGGTACAG 
GAGGGTACAG 
GAGGGTACAG 
GAGGGTACAG 
GAGGGTACAG 
GAGGGTACAG 



1400 
CAGTAACTTA 
CAGTAACTTA 
CAGTAACTTA 
CAGTAACTTA 
CAGTAACTTA 
CAGTAACTTA 
CAGTAACTTA 
CAGTAACTTA 
CAGTAACTTA 



Oisal23961.2f80 2603' 
msal23961 . 2i80"A909l 
msal23961.2{80_M732 1 
msal23961.2{80 090^ 
msa 123 961. 2 (80 OOHl! 
msal23961.2{80~M781 
msal23961.2{80l JM9130013 
msal23 961. 2^80 18RS21 
msal23961 . 2 { 80h~CJB110 ] 
Consensus 



1401 

CAAATTAAAA 
CAAATTAAAA 
CAAATTAAAA 
CAAATTAAAA 
CAAATTAAAA 
CAAATTAAAA 
CAAATTAAAA 
CAAATTAAAA 
CAAATTAAAA 



GAAACAAAAG 
GAAACAAAAG 
GAAACAAAAG 
GAAACAAAAG 
GAAACAAAAG 
GAAACAAAAG 
GAAACAAAAG 
GAAACAAAAG 
GAAACAAAAG 



CACCAGAAGG 
CACCAGAAGG 
CACCAGAAGG 
CACCAGAAGG 
CACCAGAAGG 
CACCAGAAGG 
CACCAGAAGG 
CACCAGAAGG 
CACCAGAAGG 



TTATGTAATC 
TTATGTAATC 
TTATGTAATC 
TTATGTAATC 
TTATGTAATC 
TTATGTAATC 
TTATGTAATC 
TTATGTAATC 
TTATGTAATC 



1450 
CCTGATAAAG 
CCTGATAAAG 
CCTGATAAAG 
CCTGATAAAG 
CCTGATAAAG 
CCTGATAAAG 
CCTGATAAAG 
CCTGATAAAG 
CCTGATAAAG 



tnsal23 961 .2(8 0_2 6 03 
msal23961.2(80_A909 
msal23961 . 2 { 80_M732 
msal23961.2{80 090 
msal23961.2(80 COH1 
msal23961.2{80~M781 
msal23961.2{80l JM9130013 
msal2 3961. 2 T 8 0_1 8RS2 1 
msal23961.2{80h_CJB110 
Consensus 



msal23961.2(80 2603> 
msal23961. 2 {80~A909> 
msal23961.2{80~M732} 
msal23961.2{80 090} 



1451 

AAATCGAGTT 
AAATCGAGTT 
AAATCGAGTT 
AAATCGAGTT 
AAATCGAGTT 
AAATCGAGTT 
AAATCGAGTT 
AAATCGAGTT 
AAATCGAGTT 



TACAGTATCA 
TACAGTATCA 
TACAGTATCA 
TACAGTATCA 
TACAGTATCA 
TACAGTATCA 
TACAGTATCA 
TACAGTATCA 
TACAGTATCA 



CAAACATCTT 
CAAACATCTT 
CAAACATCTT 
CAAACATCTT 
CAAACATCTT 
CAAACATCTT 
CAAACATCTT 
CAAACATCTT 
CAAACATCTT 



ATAATaCAAA 
ATAATaCAAA 
ATAATaCAAA 
ATAATaCAAA 
ATAATaCAAA 
ATAATaCAAA 
ATAATaCAAA 
ATAATaCAAA 
ATAATcCAAA 



1500 
ACCAACTGAC 
ACCAACTGAC 
ACCAACTGAC 
ACCAACTGAC 
ACCAACTGAC 
ACCAACTGAC 
ACCAACTGAC 
ACCAACTGAC 
ACCAACTGAC 



1501 

ATCACGGTTG ATAGTGCTGA TGCAACACCT 
ATCACGGTTG ATAGTGCTGA TGCAACACCT 
ATCACGGTTG ATAGTGCTGA TGCAACACCT 
ATCACGGTTG ATAGTGCTGA TGCAACACCT 



1550 

GATACAATTA AAAACAACAA 
GATACAATTA AAAACAACAA 
GATACAATTA AAAACAACAA 
GATACAATTA AAAACAACAA 
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msal23 961 . 2 { 8 0 jCOHl 
msal23961.2{80 M781 
msal23961.2{80l JM9130013 
msal23961.2T80_18RS21 
msal23961.2{80h_CJB110 
ConsensuB 



msal23961.2{80_2603; 
msal23961.2{80_A909 
msal23961.2{80_M732 
msal23961.2{80 090 
msal23 961 . 2 { 80_COH1 
msal23961 , 2 {80_M781 
tnsal23961.2{80l JM9130013 
tnsal23961.2T80_18RS21 
msa!23961 . 2 {80h_CJB110 
Consensus 



msal23961 . 2 (80_2603 
msal23961.2(80_A909 
msal23961.2{80_M732 
msal23961 . 2 { 80_090 
msal23961.2{80jCOHl 
msal23961.2{80_M781 
msal23961. 2(801 JM9130013 
msal23961.2l80_18RS21 
msal23961.2{80h_CJB110 
Consensus 



ATCACGGTTG ATAGTGCTGA TGCAACACCT GATACAATTA AAAACAACAA 
ATCACGGTTG ATAGTGCTGA TGCAACACCT GATACAATTA AAAACAACAA 
ATCACGGTTG ATAGTGCTGA TGCAACACCT GATACAATTA AAAACAACAA 
ATCACGGTTG ATAGTGCTGA TGCAACACCT GATACAATTA AAAACAACAA 
ATCACGGTTG ATAGTGCTGA TGCAACACCT GATACAATTA AAAACAACAA 



1551 1600 
acgtccttca atccctaata ctggtggtat tggtacggct atctttgtcg 



acgtccttca — 
acgtccttca — 
acgtccttca — 

acgt — 

acgtccttca — 
acgtccttca — 
acgtccttca — 



1601 1650 
ctatcggtgc tgcggtgatg gcttttgctg ttaaggggat gaagcgtcgt 



1651 1662 
msal23961.2{80_2603} acaaaagata ac 
msal23961.2(80_A909 
msal23961 . 2 (80_M732 
msal23961 . 2 { 80_090 
msal23 961.2(8 0_COH1 
msal23961.2(80_M781 
msal23961.2{801 JM9130013 
msal2 3 961 . 2T8 0_18RS2 1 
msal23961 . 2 { 80h_CJB110 

Consensus - 

SEQ ID NO. 8710 
STRAIN 2603 frame: 1 

MKLSKKLLPSAAVLTMVAGSTVBPVAQFATGMSIVRAAEVSQERPAKTTW 
KSBITSNGG I ENKDGEVI SNYAKI/jDNVKGLQGVQFKRYKVKTD I SVDELKKLTTVEAAD 
AKVGTILEEGVSLPQKTNAOGLVVDAUDSKSNVRYLYVEDLI^ 

PVANSTGTGFLSEINT YPKNVVTDEPKTDKDVKKLGQDDAGYTIGEBFKWFLKSTI PAUL 
GDYEKFE ITDKFADGLTYKS VGKI KIGSKTLN3U3EHYTIDEPTVDNQNTLKITFKPEKFK 
EI AELLKGMTLVKNQDALDICATANTDDAAFIiE IPVASTINEKAVLGKAI ENTFEIiQYDHT 
PDKADNPKPSNPPRKPEVHTGGKRFVKKDSTETQTI^^ 

NTNKNY I AGEAVTGQP I KLKSHTDGTFE I KGLAYAVDANAEGTAVTYKLKETKAPEGYVI 
PDKE I EFTVSGTSYNTKPTD I TVDSADATPDT I KNNKRPS I PNTGG I GTAI FVAI GAAVM 
AFAVKGMKRRTKDN 

SEQ ID NO. 8711 
STRAIN 090 ftame 1 

AEVSQERPAKTAVN I YKLQADS YKSE I TSNGG I BNKDGEVI SNYAKLGDNVKGLQGVQFK 
RYKVKTD I SVDELKKLTTVEAADAKVGTI LEEGVSLPQKTNAQGLVVDAIJDS KSNVRYLY 
VEDLKNSPSNITKAYAVPFVLELPVANSTGTGFI,SE INI YPKNVVTDEPKTO 
DDAGYTIGEEFTCWFliKBTIPANIiGDYEKFEITDKFADGIiTYKSVGK^ 



TINEKAVLGKAIENTFELQYDHTPDKADNPKPSNPPRKPEVHTG^ 

GAEFDLLASDGTAVKWTDAL I KANTNKNYI AGEAVTGQP I KLKSHTDGTFE I KGLAYAVD 
ANAEGTAVTYKLKETKAPEGYVI PDKEI EFTVSQTSYNTKPTDI TVDSADATPDT I KNNK 
RPS 

SEQ ID NO. 8712 
STRAIN 18RS21 frame: 1 

ABVS QERPAKTAVN I YKLQAD S YKSE I T SNGG I ENKDGEVT SNYAKLGDNVKGLQGVQFK 
RYKVKTD I S VDELKJKLTTVEAADAKVGTI LEEGVSLPQKTNAQG 
VEDLKNSPSNITKAYAVPFVLEliPVANSTGTGFI^EINIYPKNVVTDEPKTD 
DDAGYTIGEEFKWFXiKSTI PANIGDYEKFEITDKFADGLTYKSVGKI KIGSKTLNRDEHY 
T I DEPTVDNQNTLKI TFKPE KFKE LAELLKGWIT^VKNQDALDKATANTDDAAFLE I PVAS 
T I NEKAVLGKAI BNTFELQYDHTPDKADNPKPSNPPRKPEVHTGGKRFVKKDSTE 
GAFJ?DLLASDGTAVKWTDAL I KANTNKNY lAGEAVTGQP I KLKSHTDGTFE I KGLAYAVD 
ANAEGTAVTYKLKETKAPEGYVI PDKE I EFTVSQTSYNTKPTD I TVDSADATPDT I KNNK 
RPS 

SEQ ID NO. 8713 
STRAIN M732 frame: 1 

AEVS QERPAKTTVN I YKLQADSYKS E I TSNGG I ENKDGEV1 SNYAKLGDNVKGLQGVQFK 
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RYKVKTDI S VDELKKLTTVEAADAKVGT I LEEGVSLPQKTNAQGLVVDALDS KSNVRYLY 
VEDLKNSPSNITKAYAVPFVLELPVANSTGTGFI^BINIYPKNVV^ 
DDAGYT I GEE FKWFLKST I PANLGDYEKFBITDKFADGLTYKSVGKI KIGSKTLNRDEHY 
TIDE PTVDNQNTLK I TFKPE KFKB I AEI^KGMTL VKNQDALDKATANTDDAAFLE I PVAS 
T I NEKAVLG KA I ENT PEliQYDHTPDKADNPKPSNPPRKPBVHTGGKRFVKKDSTETQTI/3 
GAEPDLLASDGTAVKOT^ALIKANTNKNYIAGEAVTGQP I KLKSHTDGTFBI KGLAYAVD 
ANAEGTA VTYKLKET KAPEG YV I PDKEIEFTVSQTSYNTKPTDITVDSADATPDT I KNNK 
RPS 



SEQ ID NO. 8714 
STRAIN M781 frame: 1 

AEVSQERPAKTAVN I YKLQADS YKSE I TSNGG I ENKDGEV I SNYAKLGDNVKGLQGVQFK 
RYKVKTD I S VDELKKLTTVEAADAKVGT I LEEGVSLPQKTNAQGLVVDA 
VEDLKNS PSN ITKAYAVPFVLELPVANSTGTGFLSE INI YPKNVVTDEPKTDKDV^ 
DDAGYT I GEE FKWFLKST I PANLGDYEKFE I TDKFADGLTYKSVG KI KIGSKTLNRDEHY 
T I DE PTVDNQNTLKI TFKPE KFKE IAELLKGMTL VKNQDALD KATANTDD AAFLE I PVAS 
TINEKAVLGKAI ENTFEIiQYDHTPDKADNPKPSNPPRKPEVHTGGKRPVKKDSTETQTLG 
GAEFDLLASDGTAVKWTDAL I KANTNKNY I AGEAVTGQP I KLKSHTDGTFE I KGLAYAVD 
ANAEGTAVTYKL KETKAPEG YVT PDKE I E FTVSQTS YNTKPTD I TVDSADAT PDT I KNNK 
R 



SEQ ZD NO. 8715 
STRAIN COH1 frame: 1 

AEVSQERPAKTAVN I YKLQADS YKS E I TXNGG I ENKDGEV I SNYAKLGDNVKGLQGVQFK 
RYKVKTD I S VDELKKLTTVEAADAKVGT I LEEGVS LPQKTNAOGLWDALDSKSNVRYL Y 
VEDLKNSPSNITKAYAVPFVLELPVANSTGTGFLSEINIYPKNVVTO 
DDAGYT I GEE FKWFLKST I PANLGDYEKFE ITDKFADGLTYKSVGKI KIGSKTLNRDEHY 
TI DB PTVDNQNTLKI TFKPEKFKE IAELLKG>TIL VKNQDALD KATANTDDAAFLE I PVAS 
TINEKAVLGKAI ENTFEI/QYDHTPDKADNPKPSNPPRKPEVHTGGKRFVKKDS 
GAEFDLLASDGTAVKWTDAL I KANTNKNY I AGEAVTGQP I KLKSHTDGTFEI KGLAYAVD 
ANAEGTAVTYKLKETKAPEGYVI PDKEIEFTVSQTSYNTKPTDITVDSADATPDT I KNNK 
RPS 

SEQ ZD NO. 8716 
STRAIN CJB1 10 frame: 1 

AEVSQERPAKTAVN I YKLQADS YKLEI TSNGGIENKDGBVI SNYAKLGDNVKGLQGVQFK 
RYKVKTD I SVDELKKLTTVEAADAKVGTI LEEGVSLPQKTNAQGLVVDALDS KSNVRYLY 
VEDLKNSPSNITKAYAVPFVLELPVANSTGTGFLSEINIYPKNVVTDEPKTD 
DDAGYT I GEE FKWFLKST I PANLGDYEKFE ITDKFADGLTYKSVGKI KIGSKTLNRDEHY 
TI DEPTVDNQNTLKI TFKPEKFKE IAELLKGMTLVKNQDAIJDKATANTDDAAFLE I P VAS 
TINEKAVLGKAI ENTFELQYDHTPDKADNPKPSNPPRKPEVHTGGKRFVKKDSTBTQ^ 
GAEFDLIiASDGTAVKWTDALI KANTNKNY I AGEAVTGQP I KLKSHTDGTFE I KGLAYAVD 
ANAEGTAVTYKLKETKAPEGYVI PDKE I EFTVSQTS YNPKPTD I TVDSADATPDT I KNNK 
RPS 

SEQ ZD NO. 8717 
STRAIN JM9130013 frame: 1 

AEVSQERPAKTAVN I YKLQADS YKS E I TSNGG I ENKDGEVI SNYAKLGDNVKGLQGVQFK 
RYKVKTD I S VDELKKLTTVEAADAKVGT I LEEGVSLPQKTNAQGLVVDALDS KSNVRYLY 
VEDLKNSPSNITKAYAVPFVLELPVANSTGTGFLSEINIYPKNW 

DDAGYT I GEE FKWFLKST I PANLGDYEKFE I TDKFADGLTYKSVGKI KI GSKTLNRDEHY 
T I DB PTVDNQNTLKI TF KPEKFKE IAEIiLKGMTLVKNQDALDKATANTDDAAFLB I PVAS 
TINEKAVLGKAI ENTFELQYDHTPDKADNPKPSNP PRKPEVHTGGKRFVKKDSTETQTLG 
GAE FDLLASDGTAVKWTDAL I KANTNKNY IAGEAVTGQP I KLKSHTDGT FE I KGLAYAVD 
ANAEGTAVTYKLKETKAPEGYVI PDKEIEFTVSQTSYNTKPTDITVDSADATPDTIKNNK 
RPS 

SEQ ZD NO. 8718 
STRAIN A909 frame: 1 

AEVSQERPAKTTVNI YKLQADS YKS E I TSNGG I FJJKDGE VI SNYAKLGDNVKGLQGVQFK 
RYKVKTDI SVDELKKLTTVEAADAKVGT I LEEGVSLPQKTNAQGLVVDALDS KSNVRYLY 
VEDLKNSPSNITKAYAVPFVLELPVANSTGTGFLSEINIYPKNVVTO 
DDAGYTIGEEFKWFLKSTI PANLGDYEKFE ITDKFADGLTYKSVGKI KIGSKTLNRDEHY 
T I DB PTVDNQNTLKI TFKPEKFKE IAELLKGMTLVKNQJDALDKATANTDDAAFLE I PVAS 
TINEKAVLGKAI ENTFELQYDHTPDKADNPIO>SNPPRKPBVHTGGKRFVKKDSTE^ 
GAEFDLLASDGTAVKWTDAL I KANTNKNY IAGEAVTGQP I KLKSHTDGTFE I KGLAYAVD 
ANAEGTAVTYKLKETKAPEGYVI PDKE I EFTVSQTSYNTKPTD I TVD SAD ATPDT I KNN 

PRETTY of t /biotmp/msal24060.2{*} April 30, 2003 07:19 



msal24060 . 2 f 80_2603 
msal24060.2{80_M732 
msal24060.2(80_A909 
msal24060.2{80 090 
msal24060.2(80 M781 
msal24 060 . 2 { 8 0~COH1 
maal24060.2{801 JH9130013 
msal24060 .2T80_18RS21 
msa!24060 . 2 { 80h_CJB110 
Consensus 



1 50 
mklskkllfs aavltmvagB tvepvaqfat gmsivraAEV SQERPAKTtV 

AEV SQERPAKTtV 

AEV SQERPAKTtV 

AEV SQBRPAKTaV 

AEV SQBRPAKTaV 

AEV SQBRPAKTaV 

AEV SQBRPAKTaV 

AEV SQBRPAKTaV 

AEV SQBRPAKTaV 
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msal24060 .2(80_2603 
msal24060 .2(80_M732 
msal24060.2{80 A909 
msal24060.2{eo_090 
msal24 060 . 2 ( 8 0_M78 1 
msal24060.2(80_COHl 
msal24060.2{80l JM9130013 
msal24060 . 2T80_18RS21 
msal24060 . 2 { 80h_CJB110 
Consensus 



SI 

NIYKLQADSY 
NIYKLQADSY 
NIYKLQADSY 
NIYKLQADSY 
NIYKLQADSY 
NIYKLQADSY 
NIYKLQADSY 
NIYKLQADSY 
NIYKLQADSY 



KsEITsNGGI 
KsEITsNGGI 
KsEITsNGGI 
KsEITsNGGI 
KsEITsNGGI 
KsEITxNGGI 
KsEITsNGGI 
KsEITsNGGI 
KlEITsNGGI 



ENKDGEVISN 
ENKDGEVISN 
ENKDGEVISN 
ENKDGEVISN 
ENKDGEVISN 
ENKDGEVISN 
ENKDGEVISN 
ENKDGEVISN 
ENKDGEVISN 



YAKLGDNVKG 
YAKLGDNVKG 
YAKLGDNVKG 
YAKLGDNVKG 
YAKLGDNVKG 
YAKLGDNVKG 
YAKLGDNVKG 
YAKLGDNVKG 
YAKLGDNVKG 



100 

LQGVQFKRYK 
LQGVQPKRYK 
LQGVQFKRYK 
LQGVQFKRYK 
LQGVQFKRYK 
LQGVQFKRYK 
LQGVQFKRYK 
LQGVQFKRYK 
LQGVQFKRYK 



maal24060 .2{80_2603 1 
msal24060.2(80_M732: 
msal24060.2{80_A909 
rasal24060.2{80_090 
msal24060 ,2(80_M781 
msal24060.2(80_COHl 
msal24060.2{801 JM9130013' 
msal24060.2X80_18RS21 
msal24060 . 2 { 8 0h_CJBll 0 ' 
Consensus 



101 

VKTDISVDEL' 
VKTDISVDBL 
VKTDISVDEL 
VKTDISVDEL 
VKTDISVDEL 
VKTDISVDEL 
VKTDISVDEL 
VKTDISVDEL 
VKTDISVDEL 



KKLTTVEAAD 
KKLTTVEAAD 
KKLTTVEAAD 
KKLTTVEAAD 
KKLTTVEAAD 
KKLTTVEAAD 
KKLTTVEAAD 
KKLTTVEAAD 
KKLTTVEAAD 



AKVGTILEEG 
AKVGTILEEG 
AKVGTILEEG 
AKVGTILEEG 
AKVGTILEEG 
AKVGTILEEG 
AKVGTILEEG 
AKVGTILEEG 
AKVGTILEEG 



VSLPQKTNAQ 
VSLPQKTNAQ 
VSLPQKTNAQ 
VSLPQKTNAQ 
VSLPQKTNAQ 
VSLPQKTNAQ 
VSLPQKTNAQ 
VSLPQKTNAQ 
VSLPQKTNAQ 



150 

GLWDALDSK 
GLWDALDSK 
GLWDALDSK 
GLWDALDSK 
GLWDALDSK 
GLWDALDSK 
GLWDALDSK 
GLWDALDSK 
GLWDALDSK 



msal24060.2(80_2603 
msal24060 . 2 <80_M732 
msal24060.2(80_A909 
msal24060 . 2{80_090 
msal24060 .2f 80_M781 
msa 124060 .2{80_COH1 
msal24060.2{80l JM9130013 
msal24060.2T80_18RS21 
msal24060 .2 {80h_CJB110 
Consensus 



151 

SNVRYLYVED 
SNVRYLYVED 
SNVRYLYVED 
SNVRYLYVED 
SNVRYLYVED 
SNVRYLYVED 
SNVRYLYVED 
SNVRYLYVED 
SNVRYLYVED 



LKNSPSNITK 
LKNSPSNITK 
LKNSPSNITK 
LKNSPSNITK 
LKNSPSNITK 
LKNSPSNITK 
LKNSPSNITK 
LKNSPSNITK 
LKNSPSNITK 



AYAVPFVLEL 
AYAVPFVLEL 
AYAVPFVLEL 
AYAVPFVLEL 
AYAVPFVLEL 
AYAVPFVLEL 
AYAVPFVLEL 
AYAVPFVLEL 
AYAVPFVLEL 



PVANSTGTGF 
PVANSTGTGF 
PVANSTGTGF 
PVANSTGTGF 
PVANSTGTGF 
PVANSTGTGF 
PVANSTGTGF 
PVANSTGTGF 
PVANSTGTGF 



200 

LSEINIYPKN 
LSEINIYPKN 
LSEINIYPKN 
LSEINIYPKN 
LSEINIYPKN 
LSEINIYPKN 
LSEINIYPKN 
LSEINIYPKN 
LSEINIYPKN 



msal24 06 0 . 2 ( 8 0_2 6 0 3 
msal24060.2{80_M732 
msal24060 .2 (80_A909 
msal24060.2{80_090 
msal2406 0 . 2 ( 8 0_M78 1 
msal 24 0 60.2(8 0_COH1 
msal24060.2{801 JM9130013 
msa!24060 . 2l80_18RS21 
msal24 060 . 2 { 80h_CJB110 
Consensus 



201 

WTDEPKTDK 
WTDBPKTDK 
WTDEPKTDK 
WTDEPKTDK 
WTDEPKTDK 
WTDEPKTDK 
WTDEPKTDK 
WTDBPKTDK 
WTDEPKTDK 



DVKkLGQDDA 
DVKkLGQDDA 
DVKkLGQDDA 
DVKkLGQDDA 
DVKkLGQDDA 
DVKkLGQDDA 
DVKkLGQDDA 
DVK . LGQDDA 
DVKkLGQDDA 



GYTIGEEFKW 
GYTIGEEFKW 
GYTIGEEFKW 
GYTIGEEFKW 
GYTIGEEFKW 
GYTIGEEFKW 
GYTIGEEFKW 
GYTIGEEFKW 
GYTIGEEFKW 



FLKSTI PANL 
FLKSTIPANL 
FLKSTI PANL* 
FLKSTIPANL 
FLKSTIPANL 
FLKSTIPANL 
FLKSTIPANL 
FLKSTIPANL 
FLKSTIPANL 



250 

GDYEKFEITD 
GDYEKFB ITD 
GDYEKFEITD 
GDYEKFEITD 
GDYEKFEITD 
GDYEKFEITD 
GDYEKFEITD 
GDYEKFEITD 
GDYEKFEITD 



msal24060.2(80_2603 
msal 24 060 .2 j 80_M732 
msal24060.2{80 A909 
msal24060 . 2{ 80_090 
msal24 06 0 .2(8 0_M78 1 
msal 24 06 0.2 (80 COH1 
msal24060.2{801 JM9130013 
msal24060 . 2l80_18RS21 
msal24060 . 2 { 80h_CJB110 
Consensus 



251 

KFADGLTYKS 
KFADGLTYKS 
KFADGLTYKS 
KFADGLTYKS 
KFADGLTYKS 
KFADGLTYKS 
KFADGLTYKS 
KFADGLTYKS 
KFADGLTYKS 



VGKIKIGSKT 
VGKIKIGSKT 
VGKIKIGSKT 
VGKIKIGSKT 
VGKIKIGSKT. 
VGKIKIGSKT 
VGKIKIGSKT 
VGKIKIGSKT 
VGKIKIGSKT 



LNRDEHYTID 
LNRDEHYTID 
LNRDEHYTID 
LNRDEHYTID 
LNRDEHYTID 
LNRDEHYTID 
LNRDEHYTID 
LNRDEHYTID 
LNRDEHYTID 



EPTVDNQNTL 
EPTVDNQNTL 
EPTVDNQNTL 
EPTVDNQNTL 
EPTVDNQNTL 
EPTVDNQNTL 
EPTVDNQNTL 
EPTVDNQNTL 
EPTVDNQNTL 



300 

KIT FKPEKFK 
KITFKPEKFK 
KITFKPEKFK 
KITFKPEKFK 
KITFKPEKFK 
KITFKPEKFK 
KITFKPEKFK 
KITFKPEKFK 
KITFKPEKFK 



msal24060 . 2 f 80_2603 
msal24060.2(80 M732 
msal24060.2(80_A909 
msal24060 . 2 { 80_090 
msal24 06 0 .2(8 0_M7 8 1 
msal24060 . 2 { 80JCOH1 
msal24060. 2(801 JH9130013 
msal24060.2T80 18RS21 
msaI24060 . 2 { 80h~CJB110 
Consensus 



301 

EIAELLKGMT 
EIAELLKGMT 
EIABLLKQ-ST 
BIAELLKGMT 
EIAELLKGMT 
EIAELLKGMT 
EIAELLKGMT 
EIAELLKGMT 
EIAELLKGMT 



LVKNQDALDK 
LVKNQDALDK 
LVKNQDALDK 
LVKNQDALDK 
LVKNQDALDK 
LVKNQDALDK 
LVKNQDALDK 
LVKNQDALDK 
LVKNQDALDK 



ATANTDDAAF 
ATANTDDAAF 
ATANTDDAAF 
ATANTDDAAF 
ATANTDDAAF 
ATANTDDAAF 
ATANTDDAAF 
ATANTDDAAF 
ATANTDDAAF 



LBIPVASTIN 
LBIPVASTIN 
LBIPVASTIN 
LBIPVASTIN 
LBIPVASTIN 
LBIPVASTIN 
LBIPVASTIN 
LBIPVASTIN 
LBIPVASTIN 



350 

EKAVLGKAIE 
EKAVLGKAIE 
EKAVLGKAIE 
EKAVLGKAIE 
EKAVLGKAIE 
EKAVLGKAIE 
EKAVLGKAIE 
EKAVLGKAIE 
EKAVLGKAIE 



msal24060.2{80_2603 
msal24060 . 2 { 80_M732 
msal24060 . 2 {80_A909 
tnsal24060.2{80_090 
maal24060.2(80_M781 
msal24060 .2(8 0_COH1 
msal24060.2{80l JM9130013 
msal24 060 . 2T80_18RS21 
cnsal24060 . 2 { 80h_CJB110 
Consensus 



351 

NTFELQYDHT 
NTFBLQYDHT 
NTFELQYDHT 
NTFELQYDHT 
NTFBLQYDHT 
NTFELQYDHT 
NTFBLQYDHT 
NTFELQYDHT 
NTFELQYDHT 



PDKADNPKPS 
PDKADNPKPS 
PDKADNPKPS 
PDKADNPKPS 
PDKADNPKPS 
PDKADNPKPS 
PDKADNPKPS 
PDKADNPKPS 
PDKADNPKPS 



NPPRKPEVHT 
NPPRKPBVHT 
NPPRKPEVHT 
NPPRKPBVHT 
NPPRKPEVHT 
NPPRKPBVHT 
NPPRKPEVHT 
NPPRKPBVHT 
NPPRKPBVHT 



GGKRFVKKDS 
GGKRFVKKDS 
GGKRFVKKDS 
GGKRFVKKDS 
GGKRFVKKDS 
GGKRFVKKDS 
GGKRFVKKDS 
GGKRFVKKDS 
GGKRFVKKDS 



400 

TETQTLGGAE 
TBTQTLGGAE 
TETQTLGGAE 
TETQTLGGAE 
TETQTLGGAE 
TETQTLGGAE 
TETQTLGGAE 
TBTQTLGGAE 
TETQTLGGAE 
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msal24060.2{80 2603 
msal24060 .2(80_M732 
msaX24060.2{8o3A909 
rasal24O60.2{80_O90 
msal24060.2(80 M781 
rasal24060.2(80~COHl 
raaal24060.2{801 JM9130013 
msal24060 .2l80_18RS21 
msal24060 . 2 { 80h_CJB110 
Consensus 



401 

FDLLASDGTA 
FDLLASDGTA 
FDLLASDGTA 
FDLLASDGTA 
FDLLASDGTA 
FDLLASDGTA 
FDLLASDGTA 
FDLLASDGTA 
FDLLASDGTA 



VKWTDALIKA 
VKWTDALIKA 
VKWTDALIKA 
VKWTDALIKA 
VKWTDALIKA 
VKWTDALIKA 
VKWTDALIKA 
VKWTDALIKA 
VKWTDALIKA 



NTNKNYIAGE 
NTNKNYIAGE 
NTNKNYIAGE 
NTNKNYIAGE 
NTNKNYIAGE 
NTNKNYIAGE 
NTNKNYIAGE 
NTNKNYIAGE 
NTNKNYIAGE 



AVTGQPIKLK 
AVTGQPIKLK 
AVTGQPIKLK 
AVTGQPIKLK 
AVTGQPIKLK 
AVTGQPIKLK 
AVTGQPIKLK 
AVTGQPIKLK 
AVTGQPIKLK 



450 

SHTDGTFBIK 
SHTDGTFEIK 
SHTDGTFBIK 
SHTDGTFEIK 
SHTDGTFEIK 
SHTDGTFBIK 
SHTDGTFBIK 
SHTDGTFEIK 
SHTDGTFBIK 



msal24060.2( B0_2603 
msal24060.2{80_M732 
msal24060.2{80 A909 
tnsal24060 . 2 { 8 0_090 
msal24060 . 2 ( 80_M781 
msal24060 . 2 (8 0_COH1 
msal24060.2{80l JM9130013 
msal24060.2l80 18RS21 
msal24060 . 2 { 80h~CJB110 
Consensus 



msal24060.2{80_2603 
msal24060 . 2 ( 80_M732 
msal24060 . 2 { 80_A909 
msal24060 . 2 { 80_090 
msal24060 . 2 (80_M7B1 
msal24060.2{80_COHl 
msal24060.2{80l JM9130013 
msal 2 4 060. 2*f 8 0_1 8RS2 1 
msal24060 ,2{80h_CJB110 
Consensus 



451 500 
GLAYAVDANA EGTAVTYKLK ETKAPEGYVI PDKEIEFTVS QTSYNtKPTD 
GLAYAVDANA EGTAVTYKLK ETKAPEGYVI PDKEIEFTVS QTSYNtKPTD 
GLAYAVDANA EGTAVTYKLK ETKAPEGYVI PDKEIEFTVS QTSYNtKPTD 
GLAYAVDANA EGTAVTYKLK ETKAPEGYVI PDKEIEFTVS QTSYNtKPTD 
GLAYAVDANA EGTAVTYKLK ETKAPEGYVI PDKEIEFTVS QTSYNtKPTD 
GLAYAVDANA EGTAVTYKLK ETKAPEGYVI PDKEIEFTVS QTSYNtKPTD 
GLAYAVDANA EGTAVTYKLK ETKAPEGYVI PDKEIEFTVS QTSYNtKPTD 
GLAYAVDANA EGTAVTYKLK ETKAPEGYVI PDKEIEFTVS QTSYNtKPTD 
GLAYAVDANA EGTAVTYKLK ETKAPEGYVI PDKEIEFTVS QTSYNpKPTD 

501 55 o 
ITVDSADATP DTIKNNkrps ipntggigta ifvaigaavm afavkgmkrr 

ITVDSADATP DTIKNNkrps 

ITVDSADATP DTIKNN 

ITVDSADATP DTIKNNkrps 

ITVDSADATP DTIKNNkr 

ITVDSADATP DTIKNNkrps 

ITVDSADATP DTIKNNkrps 

ITVDSADATP DTIKNNkrps 

ITVDSADATP DTIKNNkrps 

********** ****** 



msal24060.2{80_2603 
msa!24060 . 2 f 80_M732 
msal24060 .2(8 0_A909 
msal24060.2{80 090 
msal 2 4 060. 2 [8 0_M7 81 
msal24060.2(80 COH1 
msal24060.2{80l JM9130013 
msal24060 . 2X80_18RS21 
msal24060 . 2 { 80h_CJB110 
Consensus 



551 
tkdn 
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SBQ XD NO. 880X 
STRAIN 2603 

JYKXTCTAftGAAGAA ATCAGA 
AAGCXSTAACCTTGAATTTTTAAAAAAAC^ 

AACX5AAAAATTACGCTTAGATAAAAGAAGTAAATTAAATATTTCTTCTC CTGAAGAACCT 
CAAAATACTACTAAAATTAAGAAGCTTCATTTTCOWVGATT^ 

AAGAAACAGAAAAAAGAAAAAATAGTCAACAG CTTAG CCAAAACT AATCGCATTAGAACT 
GCACCTATATTTGTAGTAGCATTCCTAGTCATTITAGTTTrc 

TTTAGTAAGCAAAAAACAATAACAGTTAGTGGAAATCAG CATACACCTGATGATATTTTG 

ATAGAGAAAACGAATATTCAAAAAAACGATTATTT^ 

GCTATTGAACAATOTTTAGCTGCAGAAGATGTATGGGTAAAAAC^ 

CAATTTCXXAATAAGTTTCATATTCAAGTTCAAGAAAATA^ 

ACAAAGCAAGGATATCAACCrGTCTTGGAAACTGGAAAA 

TCAGAGCTACCAAAGCACT TCTT AACAATTAACCTT^ 

TTAATTAAAGATTTAAAGGCTTTAGACCCTGATl^ 

TTAGCTGATTCTAAAAOSAGACCTGA 

ATTAGAATACCATTATCTAAA TTT AAAGAAAG^ 

AACXTTTAAGGAACCTTCTATTGTTGATATGGAAGTGGG 

ATTGAATCAACCCCTGTTAAAGCAGAAGATACAAAAAATAAAT^ 

CAACAAOKSACAACAGATAGCAAQVGA^ 



SEQ ZD NO. 8802 
STRAIN H36B 

CXrrAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAGTT 
G , rCITAACGGAATGGCAAAAGCGTAACCTTGAA'l"ri"l"rAAAAAAACG CAA 
AGAAGATGAAGAAGAACAAAAAXX3TATTAACGAAAAATTACG CTTAGATA 
AAAGAAGTAAATTAAATATTTCnTCTCCTIXlA^ 
AAAATTAAGJVAGCTTCATTTTCCAAAGATT^ 

GAAACAGAAAAAAGAAAAAATAGTCAACAGCTTAG CCAAAACTAATCG CA 

TTAGAACTGCACCTATATTICTAGTAGCATTCCTAGTCA 

GTTrrCCTACTAACTCCTTTTAGTAAGCAAAA^ 

AAATCAGCATACACCTGATGATATTTTGATAGAGAAAACGA^ 

AAAACXSAirAi-i-i^-i-iiiu-i-riAAl'l-rrrAAACZATAAAG CTATTGAACAA 

CGTTTAG CTGCAGAAGATGT ATGGGTAAAAACAG CTCAGATGACTTATCA 

ATTTCCCAATAAGTTTCATATTCAAGTTCAAG^ 

ATGCACATACAAAGCAAGGATATCAACCTGTCTTGGAAACTGGAAA 

GCTGATCCTGTAAATAGTTCAGAGCrACCAAAGCACTO 

CXTITGATAAGGAAGATAGTATTAAGCTATTAATTAAAGATTTAAAGG CTT 

TAGACCXTGATTTAATAAGTGAGATTCAGGTG^ 

AAAACGACACCTGACCTCCTGCTGTTAGATATGCACX^T^ 

TAGAATACCATTATCTAAATTTAAAGAAAGACTTCCTT^ 

TTAAGAAGAACXZTTAAGGAACCTTCTATTGTTGAT^ 

TACACAACAACAAATA(X!ATT{3AATGAACCCCTC 

AAAAAATAAATCAACTGATAAAACACAAACACAAAATGGTCAJ^ 

AAAATAGTCAAGGACAAACAAATAACTCAAATACTAATCAACAAGG^ 

CAGATAGCAACAGAGOVGGCACCTAACCCTQU^AATGTTAAT 

SBQ XD NO. 8803 
STRAIN 18RS21 

CCTAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAGTT 
GTCTTAACXSGAATGGCAAAAGCGTAACCTTCAATTTT^ 
AGAAGATGAAGAAGAACAAAAACGTATTTAACGAAAAATTACG CTTAGATA 

AAAATTAAGAAGCTTCATTTTCCAAAGATT^ 

GAAACAGAAAAAAGAAAAAATAGTCAACAGCTTAGCCAAA 

TTAGAACTGCACCTATATTTGTAGTAGCATTCCTACT 

GTTTTCCTACTAACTCXnTTTAGTAAGCAA 

AAATCAGCA TACACCTGATGATATTTT^ 

AA AACX aTTAlTlVrri'lVlUTAATTTTTAAACATAAA^ 

CGTTTAG CTGCAGAAGATGTATtXXCTAAAAAC^^ 

ATTTCCCAATAAGTTTXTATATTCAAGTTC^^ 

ATGCACATACAAAGCAAGGATATC^CCTOTCTTGGAAAC^ 

GCIGATCCTGTAAATAGTTCAGAGCTACCAAAGCACT 

CCTTGATAAGGAAGATAGTATTAAGCTATTAATTAAAGATT^ 

TAGACCCTGATTTAATAAGTGAGATTCAGGTGATAAGTT^ 

AAAAOGACACCTGACCTCCTGCTGTTAGATATCC^ 

TAGAATACCATTATCTAAATTTAAAGAAAGACTTCC 

TTAAGAAGAACtnTAAGGAACCTTCTATTGTTG^ 

TACACAACAACAAATACCATTGAAT CAACCCCTGTTAAAGCAGAAGATAC 
AAAAAATAAATCAACTGATA7\AACACAAACACAAAAT^ 
AAAATAGTCAAGGACAAACAAATAACTCAAATACrAATCAACAAGGACTUV 
CAGATAGCAACAGAGCAGGCACCTAACCCTCAAAATC 

SEQ ID NO. 8804 
STRAIN M732 

CCTAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAG 
TTGTCTTAACGGAATGGCAAAAGCGTAACCTTO 
AAAGAAGATGAAGAAGAAOUtflAACGTATTAACGAA 
TAAAAGAAGTAAATTAAATATTTCTTCTC<rro 

CTAAAATTAAGAAG CTTCATITI^XlAAAGATTTCAAAACCrAAGATTGAA 
AAGAAACAGAAAAAAGAAAAAATAGTCAACAG CTTAG CCAAAACTAATCG 
CATTAGAACTOCACCIATATTTG^ 
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CCGTTTTCCTACTAACTCCTTTTAGTAAG CAAAAAACAA.TAACAG1TAGT 

GGAAATCAGCATAC^CCTGATGATATTTTGATAGAAAAAACGAATA 

AAAAAACGATTATTTCTTTTCTTTAATTTTTAA^ 

AACGTTTAG CTG CAGAAGATGTATGGGTAAAAACAGCTCAGATGACTTAT 
CAATTTCCEAATAAGTTTCATAIT^ 

ATATGCACATACAAAG CAAGGATATCAGCCTGTCTTGGAAACTG GAAAAA 
AGGCTGATCCTGTAAATAGTTCAGAGCrACCAAAGCACTTC^ 
AACCTTGAT AAGGAAGATAGTATTAAG CTATTAATTAAAGATTTAAAGGC 
TTTAGACCCTGATTTAATAAGTGAGATTCA^ 

attagaataccattatctaaatttaaagaaa 

aattaagaagaaccttaaggaaccttctattgttga™ 

tttacacaacaacaagtactattgaatcaacccctgtga^ 

acaaaaaataaatcaactgataaaacacaaacac^\aaatggtcaggttgc 

ggaaaatagtcaaggacaaacaaataactcaaatactaatcaa(^u^ggac 

aacagatagcaacagagcaggcacccaaccctcatu^atgttaat 

SEQ ID HO. 8805 
STRAIN COH1 

CCTAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAGTT 
GTCXTAAOXIAATGGCAAAAGCGTAACCTTGAA^ 

AGAAGATGAAGAAGAACAAAAACGTATTAACX1AAAAATTACG CTT AGAT A 

AAAGAAGTAAATTAAATATTTCTTCTCCTGAAGAACCT 

AAAATTAAGAAGCTTCATTTTCCAAAGATTTCAAAA 

GAAACAGAAAAAAGAAAAAATAGTCAACAGCTTAGCCAAAACT 

TTAGAACTG CACCTAT ATTTG TAGTAG CATTCCTAGTCATTTTAGTTTCC 

GTTTTCCTACTAACrcCTTTTAGTAAGCAAAAAACAATA^ 

AAATCAGCATACACCTGATGATATTTTGATAGAAAAA^ 

AAAACX^TTATTTCTTTTCTTTAATTT^ 

CGTTTAG CTGCAGAAGATGTATGGGTAAAAACAG CTCAGATGACTTATCA 
ATTTCCCAATAAGTTTCATATTCAAGTTCAAGAA^ 
ATGCACATACAAAGCAAGGATATCAGCCIX3TCITGGAAA 
GCTGATCCTGTAAATAGTTCAGAGCTACCA 

CCTTGATAAGGAAGATAGTATTAAGCTATTAATTAAAGATTTAAAGGC^ 

TAGACCCTGATTTAATAAGTGAGATTCAGGTGATAAGTTTAGC^ 

AAAAO^CACCTGACCrCCTGCTGTTAGA 

TAGAATACCATTATCTAAATTTAAAGAAAGACTTCCTTTTTACA 

ITAAGAAGAACCTTAAGGAACCTTCTATTGTTGATATGGA^ 

TACACAACAACAAGTACTATTGAATCAACCCCTGTGAA^ 

AAAAAATAAATCIAACTGATAAAACACAAACACAAAAT^ 

AAAATAGTCAAGGACAAACAAATAACTCAAATACTAATC^ 

CAGATAGCAAC^GAGCAGGCACCX^CCCTCAAAATG'rrAAT 

SEQ ID NO. 8806 
STRAIN M781 

CCTAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAG 
TTGTCTTAACGGAATGG CAAAAGCGTAACCTTGAATTTTTAAAAAAACGC 
AAAGAAGATGAAGAAGAACAAAAACGTATTAACX3AAAAATTACGCITAGA 
TAAAAGAAGTAAATTAAATAl'iUVl'lXJ'1'CCTGAAGAACCTCAAAATACTA 
CTAAAATTAAGAAGCTTCATTTTCCAAAGA^ 

AAGAAAGAGAAAAAAGAAAAAATAGTCAACAGCTTAG CCAAAACTAATCG 

CATTAGAACTGCACCTATATTTGTAGTAGCATTCC^ 

CCGTTTTCCTACTAACTCCTTTTAGTAA^ 

GGAAATCAGCATACA CCTGATGATATTTTGAT AG 

AAAAAACGATTATTTCTTTTCTTTAATTTTTAAAC^ 

AACGTTTAGCTGCAGAAGATGTATGGGTAAAAACAGCTCAGA 

CAATTTCCXIAATAAGTTTCATATTC^^ 

ATATGCACATACAAAGCAAGGATATCAGCCTCTCT1XX3AAAOT 

AGGCTGATCCTGTAAATAGTTCAGAGCTACC^AAG<^C^ 

AACCTTGATAAGGAAGATAGTATTAAGCTATTAATTAAAGATTTAAAGGC 

TTTAGACCCTGATTTAATAAGTGAGATTCAGGTGATA^ 

CTAAAACGACACCTGACCTCCTGCTGTTAGATATGCATGATGG 

ATTAGAATACCATTATCTAAATTTAAAGAAAGACT 

AATTAAGAAGAACCTTAAGGAACCITCTATTGTT^ 

TTTACACAACAACAAGTACTATTGAATCAACX^^ 

ACAAAAAATAAATCAACTGATAAAACACAAACACAAAATGGTCAGG 

GGAAAATAGTCAAGGACAAAOUUVTAACTCAAAT^ 

AACAGATAGCAACAGAGCAGGCACCCAACX2CTCAAA^ 

SEQ ID NO. 8807 
STRAIN CJB110 

CCTAAGAAGAAATCAGATACCCCAGAAAAAGAAGAAG 

TTGTCTTAACGGAATGG CAAAAGCGTAACCTTGAATTTTTAAAAAAACG C 

AAAGAAi3ATGAAGAAGAACAAAAACGTATTAACGAAAAATTACGCTTAGA 

TAAAAGAAGTAAATTAAATATTTCTTCTCCTGAAGAACCT 

CTAAAATTAAGAAGCTTCATTTTCCAAAG^ 

AAGAAACAGAAAAAAGAAAAAATAGTCAACAGCTT^ 

CATTAGAACTGCACCTATATTrGTAGTAGCATTCCT 

CCGTTTTCCTACTAACTCCTTTEAGT^ 

GQAAATCAGCATACACCTQATGATATTTTQATAGAA 

AAAAAACGATTATTTCTTTTCTTTAATTTTTA 

AACXTTTTAGCrcO^GAAGATGTATGGGTAAAAACAGCT 

CAATTTCC^ATAAGTTTCATATTCAAGTTCAAGA 
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ATATGCACATACAAAGCAAGGATATCAGCCTG 

AGGCTGATCCTGTAAATAGTTCAGAGCTACCAAAGCACTTCTTAACAA^ 
AACCTTGATAAGGAAGATAGTATTAAGCTATTAATTAAAGATTTAAAGGC 
TTTAGACCCTGATTTAATAAGTGAGATTCAGGT^^ 

CTAAAACGACACCTGACCTCCrcCTGTTAGATATGCATGATGGAAATAGT 

ATTAGAATACC7VTTATCTAAATTTAAAGAAAGACTTC 

AATTAAGAAGAACCTTAAGGAACCTTCTATTGTTGATATC 

TTTACACAACAACAAGTACTATTGAATCAACCCC^^ CGGAAGAT 

ACAAAAAATAAATCAACTGATAAAACACAAACACAAAATGOT 

GGAAAATAGTC^GGACAAACAAATAACTaU^TACTAATCAAOUUSGAC 

AACAG ATAG CAACAGAGCAGGCA(XCAACCCrCAAAATGTTAAT 

SEQ ID NO. 8808 
STRAIN 1169NT 

CCTAAGAAGAAATCAGATACGCCAGAAAAAGAAGAAGT 
TGTCTTAACGGAATGGCAAAAGCGTAACGTTGAATTTTTA 
AAGAAGATGAAG AAGAACAAAAACX^ATTAAXTGAAAAATTACX; CTTAGAT 
AAAAGAAGTAAATTAAATATTTCTTCTCCT 
TAAAATTAAGAAGCTTC^TTTTaMAGA 

AGAAACAGAAAAAAG AAAAAATAGTCAACAGCTTAGCCAAAACTAATCG C 

ATTAGAACTGC^CCTATATTTATAGTAGCATTCCT^ 

CGTTTTC CTACTAACTCCTTTTAGTAAG CAAAAAACAATAACAGTT AGTG 

GAAATCAGCATACACCTGATGATATTTTGATA 

AAAAACXSATTATTTCTITrCTTTAATTOT 

AC GTT TAGCTGCAGAAGATGTATGGGTAAAAACAGCT^ 

AATTTCCCAACAAGTTTCATATTCAAGTTCAAGAAAATA^ 

TAtGCACATACAAAGCAAGGATATCAGOCTOTCTTGGA 

GG CTQATCCTGTAAATAGTTCAGAG CrrACCAAAGCACI 'rClT AACAATTA 

ACXTTTGATAAGGAAGATAGTATTAAGCTATTAATTAAA 

TTAGACCCTGATTTAATAAGTGAGATTCAGGT^ 

TAAAACGACACXTIGACOTCCrreCTGTTAGATATO 

TTAGAATACCATTATCTAAATTTAAAGAAAGACTTCCT^ 

ATTAAGAAGAACCTTAAGGAAOnTCTATTGTTGATAT^ 

TTACACAACAACAAGTACTArTGAATCAACCCCTGTGAA 

CAAAAAATAAATCAACTGATAAAACACAAACCCAAAATG 

GAAAATAGTCAAGGAC^AACAAATAACTCAAATACTAATCAACAAGGACA 

ACAACAGATAGCAACGGAGCAGGCACCCAACX?CTCAAAATGT^ 

SEQ ID NO. 8809 
STRAIN JM9130013 

CCTAAGAAJGAAATCAGATACCCCAGAAAAAGAAGAAGTT 

GTCTTAACGGAATGGCAAAAGCGTAACCTTGAATT^ 

AGAAGATGAAGAAGAACAAAAACGTATTAA03AAA 

AAAGAAGTAAATTAAATArriVrrCTCCTGAAGAACCTC 

AAAATTAAGAAGCTTCATTTTCCAAAGATTTCAAGACCT 

GAAACAGAAAAAAGAAAAAATAGTCAACAGCTTAG CCAAAACTAATCGCA 

TTAGA ACTG CACXrTATATTTGTAGTAGCATTCCTAGTCATTTTAGTTrCC 

GTTTTCCTACTAACrCCTTTTAGTAAGCAAAAAACA 

AAATCAGCATACACCTGATGATATTTTGATAGAGAAAACGA^ 

AAAACGATTATTTCTTTTCTTTAATTTT^ 

CGTTTAGCTGCAGAAGATGTATGGGTAAAAACAGCTCA 

ATTTCCCAATAAGTTTCATATTCAAGTTCAAGAAAATAAG ATTATTC CAT 

ATGCACATACAAAGCAAGGATATCAACCTGTCTTGGAA 

GCTGATCCTGTAAATAGTTCAGAGCTACX!AAAGCA 

CCTTGATAAGGAAGATAGTATTAAGCTATTAATTAA 

TAGACCCTGATTTAATAAGTGAGATTCAGGTGATA^ 

AAAACGACACCTGACCTCCTGCTGTTAGATATGC^ 

TAGAATACCATTATCTAAATTTAAAGAAAGACTTCCTTTTTA 

TTAAGAAGAACCTTAAGGAACCrrCTATTGTTGA 

TACACAACIAACAAATACCATTGAATCAACCCCTGTTAAAG CAGAAGATAC 
AAAAAATAAATCAACTGATAAAACACAAACACAAAATGGTCAGGTTC 
AAAATAGTCAAGGACAAACAAATAACTCAAATACTAAT 
CAGATAGCAACAGAG CAGGCACCTAACCCTCIAAAATGTTAAT 

SEQ ID NO. 8810 . 
STRAIN AS 09 

CXTAAGAAGAAATCAGATACO:CAGAAAAAGAAGAAGTTGTC 
TTAACGGAATGGCAAAAGCX?rAACCTTGAATTTTTaaA 
AGATGAAGAAGAa CAAAAACGTATTAACGAAAAATTACGCTTAG ATAAAA 
GAAGTAAATTAAATATTTCTTCTCCTGAAGAACCTCAA 
ATTAAGAAGCITCATTTTCCAAAGATTTCAAG^ 

ACAG AAAAAAQAAAAAATAGTCAACAGCTTAG CCAAAACTAATCG CATTA 

GAACTGC^CCTATATTTGTAGTAGCATTCCTA 

TTCCTACTAACTCCTTTTAtSTAAGCAAAAAACAATAACAGTTAGT^ 

TCAGCATACACCTGATGATATTTTGATAGAGAA 

ACGATTATTTCTTTTCTTTAATTTTTAAACATAA 

TTAGCTG CAGAAGATGTATGGGTAAAAACAGCTCAGATGACTTATCAAT^ 

TCCCAATAAGTTTCATATTCAAGTTCAAGAAAATAA 

CACATACAAAGCAAGGATATCAACCTGTCTTGGAAACT^ 

GATCCTGTAAATAGTTCAGAGCTACCAAAGCACTTCITAA 

TGATAAGGAAGATAGTATTAAGCTATTAATTAAAGATTTA 

ACCCTGATTTAATAAGTGAGATTCAGGTGATAAGTTTAG 

ACGACACCTGACCTCCTGCTGTTAGATATGCACGATGGA 
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AATACCATTATCTAAATTTAAAGAAAGACTTCCTTTTTACAAACAAATTA 

AGAAGAACCTTAAGGAACCTTCTATTGTTGATA^ 

ACAACAACAAATACCATTGAATCAACCCCTGTTAAAGCMA^ 

AAATAAATCAACIGATAAAACACAAnCACAAAATGGTCAGCTTGCGGAAA 

ATAGTCAAG6ACAAACAAATAACTCAAATACTAATCAACAAGGACAAC3V^ 

ATAGCAACAGAGCAGGCACCTAACCCTCAAAATGTTAAT 

SEQ ID MO. 8811 
STRAIN 090 

TAAGAAGAAATC^GATACXXrCAGAAAAAGAAGAAGTTGTCTTAAC^ 

GGCAAAAGCGTAACCTTGAATTTTTAAAAAAACGCAA^ 

GAACAAAAACGTATTAACGAAAAATTACGCTTAGATAAAAGAAGTaaaTT 

AAATATTTCTTCTCCTGAAGAACCTCAAAATACTACTAAAATTAAGAAGC 

TTCATTTTCCAAAGATTTCAAAACCTAAGATTGAAA 

GAAAAAATAGTCAACAG CTTAGCCAAAACTAATCGCA1TAGAACTGCACC 

TATATTTGTAGTAGCATTCCTAGTCATTTTAGTTTCCG^ 

CTCCITTTAQTAAGCAAAAAACAATAACAGTTA^ 

(XTGATGATATTTTGATAGAAAAAACGAATATTCAAAAAAACK3ATTA 

CTTTTCTTTAATTTTTAAACATAAAGCTATTGA 

AAGATGTATGGGTAAAAACAGCTCAGATGACTTATCAATTTCCCAATAAG 
TTTCATATTCAAGTTGIAGAAAATAAGAT^ 

ATAGTTCAGAGCTACCAAAGCACTTCTTAAGAATC 

GATAGTATTAAGCTATTAATTAAAGATTTAAAGGC^ 

AATAAGTGAG ATTCAGGTGATAAGTTTAG CTGATTCTAAAACX5ACACCTG 

ACCTCCTGCTGTTAGAT ATG CATGATGGAAATAGTATTAGAATACCATTA 

TCTAAATTTAAAGAAAGACTTCCTTTTTACAAACAA^ 

TAAGGAACCTTCTATTGTTGATATG<3AAGTGG 

GTACTATTGAATC^CCCCTGTGAAAGCGGAAGATACAAAAAATAAATCA 
ACTGATAAAACACAAACACAAAATGGTCAGGTTGCGGAAAATAGTCAAGG 
ACAAACAAATAACTCAAATACTAATCAACAAGGACAACAGATAGCAACAG 
AGCAGGCACCCAACCCTCAAAATGTTAAT 
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rasa252409 . 2 {85_090 . con_ 
msa252409 . 2 { 85_CJB110 
msa2S24 09.2 ( 85_00H1 ' 
msa252409 . 2 (85J4732 ' 
msa252409.2{85JM78l' 
msa252409 . 2 { 85_18RS21 
tnBa252409.2{85_2603 
msa2 524 09 . 2 { 85_A9 09 
. tnsa252409.2{85JK36B 
msa252409.2{85 JM9130013 
msa2 52 4 0 9 . 2jB 5_1 16 9NT 
Consensus 



— TAAGAAGA 
CCTAAGAAGA 
CCTAAGAAGA 
CCTAAGAAGA 
CCTAAGAAGA 
CCTAAGAAGA 
CCTAAGAAGA 
CCTAAGAAGA 
CCTAAGAAGA 
CCTAAGAAGA 
CCTAAGAAGA 



AATCAGATAC 
AATCAGATAC 
AATCAGATAC 
AATCAGATAC 
AATCAGATAC 
AATCAGATAC 
AATCAGATAC 
AATCAGATAC 
AATCAGATAC 
AATCAGATAC 
AATCAGATAC 



CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 
CCCAGAAAAA 



GAAGAAGTTG 
GAAGAAGTTG 
GAAGAAGTTG 
GAAGAAGTTG 
GAAGAAGTTG 
GAAGAAGTTG 
GAAGAAGTTG 
GAAGAAGTTG 
GAAGAAGTTG 
GAAGAAGTTG 
GAAGAAGTTG 



50 

TCTTAACGGA 
TCTTAAOGGA 
TCTTAACGGA 
TCTTAACGGA 
TCTTAACGGA 
TCTTAACGGA 
TCTTAACGGA 
TCTTAAOGGA 
TCTTAACGGA 
TCTTAACGGA 
TCTTAACGGA 



msa252409 . 2 { 85_090 . con_ 
msa252409.2{85 CJB110 
msa252409.2{85 C0K1 
msa252409 . 2 1 B5~M732 
msa252409.2{85~M781 
rasa252409.2{85_18RS21 
msa252409.2{85_2603 
rasa2 524 0 9 . 2 I 8 5_A9 0 9 
msa252409.2{85 H36B 
msa252409.2{85 JM9130013 
msa2 52409 .2T8S_1169NT 
Consensus 



51 

ATGGCAAAAQ 
ATGGCAAAAG 
ATGGCAAAAG 
ATGGCAAAAG 
ATGGCAAAAG 
ATGGCAAAAG 
ATGGCAAAAG 
ATGGCAAAAG 
ATGGCAAAAG 
ATGGCAAAAG 
ATGGCAAAAG 



CGTAACCTTG 
CGTAAC CTTG 
CGTAACCTTG 
CGTAACCTTG 
CGTAACCTTG 
CGTAACCTTG 
CGTAACCTTG 
CGTAACCTTG 
CGTAACCTTG 
CGTAACCTTG 
CGTAACCTTG 



AATTTTTAAA 
AATTTTTAAA 
AATTTTTAAA 
AATTTTTAAA 
AATTTTTAAA 
AATTTTTAAA 
AATTTTTAAA 
AATTTTTAAA 
AATTTTTAAA 
AATTTTTAAA 
AATTTTTAAA 



AAAACGCAAA 
AAAACGCAAA' 
AAAACGCAAA 
AAAACGCAAA 
AAAACGCAAA 
AAAACGCAAA 
AAAACGCAAA 
AAAACGCAAA 
AAAACGCAAA 
AAAACGCAAA 
AAAACGCAAA 



100 

GAAGATGAAG 
GAAGATGAAG 
GAAGATGAAG 
GAAGATGAAG 
GAAGATGAAG 
GAAGATGAAG 
GAAGATGAAG 
GAAGATGAAG 
GAAGATGAAG 
GAAGATGAAG 
GAAGATGAAG 



msa252409.2{85 090.COn_J 
msa252409 . 2 {85__CJB110 
msa252409.2{85_COHl 
msa252409.2(85_M732 
msa252409.2{85_M781 
msa252409.2{85_18RS21 
rasa252409. 2 (85^2603 
msa2S2409.2{85_A909 
msa2 524 09 . 2 { 8 5_H3 6B 
msa252409.2{85 JW9130013 
msa252409 .2T85_1169NT 
Consensus 



101 

AAGAACAAAA 
AAGAACAAAA 
AAGAACAAAA 
AAGAACAAAA 
AAGAACAAAA 
AAGAACAAAA 
AAGAACAAAA 
AAGAACAAAA 
AAGAACAAAA 



AAGAACAAAA 



ACGTATTAAC 
ACGTATTAAC 
ACGTATTAAC 
ACGTATTAAC 
ACGTATTAAC 
ACGTATTAAC 
ACGTATTAAC 
ACGTATTAAC 
ACGTATTAAC 
ACGTATTAAC 
ACGTATTAAC 



GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 
GAAAAATTAC 



GCTTAGATAA 
GCTTAGATAA 
GCTTAGATAA 
GCTTAGATAA 
GCTTAGATAA 
GCTTAGATAA 
GCTTAGATAA 
GCTTAGATAA 
GCTTAGATAA 
GCTTAGATAA 
GCTTAGATAA 



150 

AAGAAGTAAA 
AAGAAGTAAA 
AAGAAGTAAA 
AAGAAGTAAA 
AAGAAGTAAA 
AAGAAGTAAA 
AAGAAGTAAA 
AAGAAGTAAA 
AAGAAGTAAA 
AAGAAGTAAA 
AAGAAGTAAA 



msa252409.2{85 O90.con_ 
msa2 52 4 0 9 . 2 { 8 5_CJB1 10 
msa2 524 0 9 . 2 { 8 5_COHl 
msa252409 . 2 { 85J4732 



151 200 
TTAAATATTT CTTCTCCTGA AGAACCTCAA AATACTACTA AAATTAAGAA 
TTAAATATTT CITCTCCTGA AGAACCTCAA AATACTACTA AAATTAAGAA 
TTAAATATTT CTTCTCCTGA AGAACCTCAA AATACTACTA AAATTAAGAA 
TTAAATATTT CTTCTCCTGA AGAACCTCAA AATACTACTA AAATTAAGAA 
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msa252409 . 2 { 8S_M781 
msa252409.2{85_18RS21 
msa252409.2(85 2603 
rasa2 524 09 . 2 f 85_A909 
Tnsa252409 . 2 { 85_H3 6B 
rasa252409.2{85 JM9130013 
msa252409.2T85_X169NT 
Consensus 



TTAAATATTT 
TTAAATATTT 
TTAAATATTT 
TTAAATATTT 
TTAAATATTT 
TTAAATATTT 
TTAAATATTT 



CTTC TCCTGA 
CTTCTCCTGA 
CTTCTCCTGA 
CTTCTCCTGA 
CTTCTCCTGA 
CTTCTCCTGA 
CTTCTCCTGA 



AGAACCTCAA 
AGAACCTCAA 
AGAACCTCAA 
AGAACCTCAA 
AGAACCTCAA 
AGAACCTCAA 
AGAACCTCAA 



AATACTACTA 
AATACTACTA 
AATACTACTA 
AATACTACTA 
AATACTACTA 
AATACTACTA 
AATACTACTA 



AAATTAAGAA 
AAATTAAGAA 
AAATTAAGAA 
AAATTAAGAA 
AAATTAAGAA 
AAATTAAGAA 
AAATTAAGAA 



msa252409 . 2 { 85_090 . con_ 
rasa252409.2{85_CJB110 ! 
msa252409.2{85_COHl' 
msa252409 . 2 { 85_M732 
msa2S2409.2{85_M781 
msa2S2409 .2{B5_1SRS21 
msa252409.2(85 2603 
msa2S2409 . 2 { 85_A909 
msa252409 . 2 (B5_H36B 
msa252409.2{85 JM9130013 
tnsa252409 .2l85_1169NT 
Consensus 



201 

GCTTCATTTT 
GCTTCATTTT 
GCTTCATTTT 
GCTTCATTTT 
GCTTCATTTT 
GCTTCATTTT 
GCTTCATTTT 
GCTTCATTTT 
GCTTCATTTT 
GCTTCATTTT 
GCTTCATTTT 



CCAAAGATTT 
CCAAAGATTT 
CCAAAGATTT 
CCAAAGATTT 
CCAAAGATTT 
CCAAAGATTT 
CCAAAGATTT 
CCAAAGATTT 
CCAAAGATTT 
CCAAAGATTT 
CCAAAGATTT 



CAAaACCTAA 
CAAaACCTAA 
CAAaACCTAA 
CAAaACCTAA 
CAAaACCTAA 
CAAgACCTAA 
CAAgACCTAA 
CAAgACCTAA 
CAAgACCTAA 
CAAgACCTAA 
CAAaACCTAA 



GATTGAAAAG 
GATTGAAAAG 
GATTGAAAAG 
GATTGAAAAG 
GATTGAAAAG 
GATTGAAAAG 
GATTGAAAAG 
GATTGAAAAG 
GATTGAAAAG 
GATTGAAAAG 
GATTGAAAAG 



250 

AAACAGAAAA 
AAACAGAAAA 
AAACAGAAAA 
AAACAGAAAA 
AAACAGAAAA 
AAACAGAAAA 
AAACAGAAAA 
AAACAGAAAA 
AAACAGAAAA 
AAACAGAAAA 
AAACAGAAAA 



msa252409 . 2 {85_090 . con_ 
rasa252409 . 2 { 85_CJB110 1 
msa252409.2{85_COHl < 
msa2524 09 . 2 { 85_M73 2 ' 
msa2 52409 . 2 { 85_M781 ' 
msa2 52 4 0 9 . 2 { 8 5_18RS2 1 ' 
msa252409 . 2 { 85_2603 
msa252409.2(85__A909 
msa252409 .2(85 H36B 
msa252409.2{85 JM9130013 
msa252409 . 2X85_1169NT 
Consensus 



251 

AAGAAAAAAT 
AAGAAAAAAT 
AAGAAAAAAT 
AAGAAAAAAT 
AAGAAAAAAT 
AAGAAAAAAT 
AAGAAAAAAT 
AAGAAAAAAT 
AAGAAAAAAT 
AAGAAAAAAT 
AAGAAAAAAT 



AGTCAACAGC 
AGTCAACAGC 
AGTCAACAGC 
AGTCAACAGC 
AGTCAACAGC 
AGTCAACAGC 
AGTCAACAGC 
AGTCAACAGC 
AGTCAACAGC 
AGTCAACAGC 
AGTCAACAGC 



TTAGCCAAAA 
TTAGCCAAAA 
TTAGCCAAAA 
TTAGCCAAAA 
TTAGCCAAAA 
TTAGCCAAAA 
TTAGCCAAAA 
TTAGCCAAAA 
TTAGCCAAAA 
TTAGCCAAAA 
TTAGCCAAAA 



CTAATCGCAT 
CTAATCGCAT 
CTAATCGCAT 
CTAATCGCAT 
CTAATCGCAT 
CTAATCGCAT 
CTAATCGCAT 
CTAATCGCAT 
CTAATCGCAT 
CTAATCGCAT 
CTAATCGCAT 



300 

TAGAACTGCA 
TAGAACTGCA 
TAGAACTGCA 
TAGAACTGCA 
TAGAACTGCA 
TAGAACTGCA 
TAGAACTGCA 
TAGAACTGCA 
TAGAACTGCA 
TAGAACTGCA 
TAGAACTGCA 



msa2 524 0 9 . 2 { 8 5_0 9 0 . con_ 
msa252409 . 2 { 85_jCJB110 ' 
msa252409 . 2 {8 5_COHl 
tnsa252409 . 2 { 85~M732 ' 
rasa252409 . 2 { 85JM781 
msa252409.2{85JL8RS21 
msa252409 . 2{ 85__2603 
msa2524 09 . 2 ( 85_A909 
insa252409 . 2 { 85_H36B 
msa252409.2{85 JM9130013 
msa252409 . 2TB5_1169NT 
Consensus 



301 

CCTATATTTg 
CCTATATTTg 
CCTATATTTg 
CCTATATTTg 
CCTATATTTg 
CCTATATTTg 
CCTATATTTg 
CCTATATTTg 
CCTATATTTg 
CCTATATTTg 
CCTATATTTa 



TAGTAGCATT 
TAGTAGCATT 
TAGTAGCATT 
TAGTAGCATT 
TAGTAGCATT 
TAGTAGCATT 
TAGTAGCATT 
TAGTAGCATT 
TAGTAGCATT 
TAGTAGCATT 
TAGTAGCATT 



CCTAGTCATT 
CCTAGTCATT 
CCTAGTCATT 
CCTAGTCATT 
CCTAGTCATT 
CCTAGTCATT 
CCTAGTCATT 
CCTAGTCATT 
CCTAGTCATT 
CCTAGTCATT 
CCTAGTCATT 



TTAGTTTCCG 
TTAGTTTCCG 
TTAGTTTCCG 
TTAGTTTCCG 
TTAGTTTCCG 
TTAGTTTCCG 
TTAGTTTCCG 
TTAGTTTCCG 
TTAGTTTCCG 
TTAGTTTCCG 
TTAGTTTCCG 



350 

TTTTCCTACT 
TTTTCCTACT 
TTTTCCTACT 
TTTTCCTACT 
TTTTCCTACT 
TTTT CCTACT 
TTTTCCTACT 
TTTTCCTACT 
TTTTCCTACT 
TTTTCCTACT 
TTTTCCTACT 



msa252409 . 2 { 85_090 . con_ 
msa252409 . 2 { B5_CJB110 ' 
msa252409.2(85 COH1 
msa252409 . 2 ( 85_M732 ' 
msa2 5240 9 . 2 { 8 5_M78 1 
msa252409.2{85 18RS21 
msa2 52409 . 2 f 85_2603 
nisa252409 . 2 f85_A909 
msa252409.2{85_H36B 
msa252409.2{85 JM9130013 
msa252409.2T85_1169NT 
Consensus 



351 

AACTC CTTTT 
AACTCCTTTT 
AACTCCTTTT 
AACTCCTTTT 
AACTCCTTTT 
AACTCCTTTT 
AACTC CTTTT 
AACTCCTTTT 
AACTCCTTTT 
AACTCCTTTT 
AACTCCTTTT 



AGTAAGCAAA 
AGTAAGCAAA 
AGTAAGCAAA 
AGTAAGCAAA 
AGTAAGCAAA 
AGTAAGCAAA 
AGTAAGCAAA 
AGTAAGCAAA 
AGTAAGCAAA 
AGTAAGCAAA 
AGTAAGCAAA 



AAACAATAAC 
AAACAATAAC 
AAACAATAAC 
AAACAATAAC 
AAACAATAAC 
AAACAATAAC 
AAACAATAAC 
AAACAATAAC 
AAACAATAAC 
AAACAATAAC 
AAACAATAAC 



AGTTAGTGGA 
AGTTAGTGGA 
AGTTAGTGGA 
AGTTAGTGGA 
AGTTAGTGGA 
AGTTAGTGGA 
AGTTAGTGGA 
AGTTAGTGGA 
AGTTAGTGGA 
AGTTAGTGGA 
AGTTAGTGGA 



400 

AATCAGCATA 
AATCAGCATA 
AATCAGCATA 
AATCAGCATA 
AATCAGCATA 
AATCAGCATA 
AATCAGCATA 
AATCAGCATA 
AATCAGCATA 
AATCAGCATA 
AATCAGCATA 



msa25240 9 . 2 { 8 5_0 9 0 . con_ 
msa252409 . 2 { 8 5_GJB110 
msa252409.2(85 COHl' 
msa252409.2(85lM732 
rasa252409 . 2{85_M781 
msa252409.2{85 18RS21 
msa252409 . 2 (?5_2603 
msa2 524 0 9 . 2 { 8 5_A9 0 9 
rasa252409 . 2 (85_H36B 
msa252409.2{85 JM9130013 
msa252409 . 2l85__l 169NT^ 
Consensus 



401 

CACCTGATGA 
CACCTGATGA 
CACCTGATGA 
CACCTGATGA 
CACCTGATGA 
CACCTGATGA 
CACCTGATGA 
CACCTGATGA 
CACCTGATGA 
CACCTGATGA 
CACCTGATGA 



TATTTTGATA 
TATTTTGATA 
TATTTTGATA 
TATTTTGATA 
TATTTTGATA 
TATTTTGATA 
TATTTTGATA 
TATTTTGATA 
TATTTTGATA 
TATTTTGATA 
TATTTTGATA 



GAaAAAACGA 
GAaAAAACGA 
GAaAAAACGA 
GAaAAAACGA 
GAaAAAACGA 
GAgAAAACGA 
GAgAAAACGA 
GAgAAAACGA 
GAgAAAACGA 
GAgAAAACGA 
GAgAAAACGA 



ATATTCAAAA 
ATATTCAAAA 
ATATTCAAAA 
ATATTCAAAA 
ATATTCAAAA 
ATATTCAAAA 
ATATTCAAAA 
ATATTCAAAA 
ATATTCAAAA 
ATATTCAAAA 
ATATTCAAAA 



450 

AAACGATTAT 
AAACGATTAT 
AAACGATTAT 
AAACGATTAT 
AAACGATTAT 
AAACGATTAT 
AAACGATTAT 
AAACGATTAT 
AAACGATTAT 
AAACGATTAT 
AAACGATTAT 



msa252409.2{85 090. con > 
msa252409 . 2 { B5_CJB110 J 
msa252409 . 2 { 8 5_COHl } 



45 1 ; 500 

TT CTTTT CTT TAATTTTTAA ACATAAAGCT ATTGAACAAC GTTTAGCTGC 
TTCTTTTCTT TAATTTTTAA ACATAAAGCT ATTGAACAAC GTTTAGCTGC 
TTCTTTTCTT TAATTTTTAA ACATAAAGCT ATTGAACAAC GTTTAGCTGC 



1167 



WO 2004/018646 



PCT7US2003/026827 



Table 88: Comparative Sequences relating to SAG0477 



msa2S2409.2{8S_M732 
msa252409.2{85_M781 
mea252409.2{85_18RS21 
tnsa252409 . 2 f 8 5_2603 
ma a2 524 0 9 . 2 j 8 S_A9 0 9 
msa252409.2{85 H36B 
msa252409.2{85 JM9130013 
msa252409 .2T85_1169NT 
Consensus 



TTCTTTTCTT 
TTCTTTTCTT 
TT CTTTT CTT 
TTCTTTTCTT 
TTCTTTTCTT 
TTCTTTTCTT 
TTCTTTTCTT 
TTCTTTTCTT 



TAATTTTTAA 
TAATTTTTAA 
TAATTTTTAA 
TAATTTTTAA 
TAATTTTTAA 
TAATTTTTAA 
TAATTTTTAA 
TAATTTTTAA 



ACATAAAGCT 
ACATAAAGCT 
ACATAAAGCT 
ACATAAAGCT 
ACATAAAGCT 
ACATAAAGCT 
ACATAAAGCT 
ACATAAAGCT 



ATTGAACAAC 
ATTGAACAAC 
ATTGAACAAC 
ATTGAACAAC 
ATTGAACAAC 
ATTGAACAAC 
ATTGAACAAC 
ATTGAACAAC 



GTTTAGCTGC 
GTTTAGCTGC 
GTTTAGCTGC 
GTTTAGCTGC 
GTTTAGCTGC 
GTTTAGCTGC 
GTTTAGCTGC 
GTTTAGCTGC 



msa252409.2{85 090. con 
msa252409.2{85_CJB110 
msa252409 . 2 { 85_C0H1 
msa252409 . 2 f B5_M732 
msa2 524 0 9 . 2 { 8 5_M7 8 1 
cnsa252409 . 2 {85^18RS21 
msa252409.2f 85 2603 
msa252409.2<85~A909 
ms a2 52409 .2(8 S_H3 6B 
msa252409.2{85 JM9130013 
msa252409.2X85_1169NT 
Consensus 



501 

AGAAGATGTA 
AGAAGATGTA 
AGAAGATGTA 
AGAAGATGTA 
AGAAGATGTA 
AGAAGATGTA 
AGAAGATGTA 
AGAAGATGTA 
AGAAGATGTA 
AGAAGATGTA 
AGAAGATGTA 
********** 



TGGGTAAAAA 
TGGGTAAAAA 
TGGGTAAAAA 
TGGGTAAAAA 
TGGGTAAAAA 
TGGGTAAAAA 
TGGGTAAAAA 
TGGGTAAAAA 
TGGGTAAAAA 
TGGGTAAAAA 
TGGGTAAAAA 
********** 



CAGCTCAGAT 
CAGCTCAGAT 
CAGCTCAGAT 
CAGCTCAGAT 
CAGCTCAGAT 
CAGCTCAGAT 
CAGCTCAGAT 
CAGCTCAGAT 
CAGCTCAGAT 
CAGCTCAGAT 
CAGCTCAGAT 
********** 



GA CTTA TCAA 
GACTTATCAA 
GACTTATCAA 
GACTTATCAA 
GACTTATCAA 
GACTTATCAA 
GACTTATCAA 
GACTTATCAA 
GACTTATCAA 
GACTTATCAA 
GACTTATCAA 
********** 



550 

TTTCCCAAtA 
TTTCCCAAtA 
TTTCCCAAtA 
TTTCCCAAtA 
TTTCCCAAtA 
TTTCCCAAtA 
TTTCCCAAtA 
TTTCCCAAtA 
TTTCCCAAtA 
TTTCCCAAtA 
TTTCCCAAcA 
********_* 



msa252409 . 2 { 8 5_090 . con_ 
msa252409 . 2 { 85_CJB110 
msa252409 . 2 ( 85_COHl 
msa2 524 0 9 . 2 { 8 5_M732 
maa252409.2{85_M781 
msa252409 . 2 { 85_18RS21 
msa252409 . 2 ( 85_2603 
msa2 524 0 9 . 2 1 8 5_A9 0 9 
msa2 52 4 0 9 . 2 { 8 5_H3 6B 
msa252409.2{85 JM9130013 
msa252409 .2X85_1169NT 
Consensus 



551 

AGTTTCATAT 
AGTTTCATAT 
AGTTTCATAT 
AGTTTCATAT 
AGTTTCATAT 
AGTTTCATAT 
AGTTTCATAT 
AGTTTCATAT 
AGTTTCATAT 
AGTTTCATAT 
AGTTTCATAT 



TCAAGTTCAA 
TCAAGTTCAA 
TCAAGTTCAA 
TCAAGTTCAA 
TCAAGTTCAA 
TCAAGTTCAA 
TCAAGTTCAA 
TCAAGTTCAA 
TCAAGTTCAA 
TCAAGTTCAA 
TCAAGTTCAA 



GAAAATAAGA 
GAAAATAAGA 
GAAAATAAGA 
GAAAATAAGA 
GAAAATAAGA 
GAAAATAAGA 
GAAAATAAGA 
GAAAATAAGA 
GAAAATAAGA 
GAAAATAAGA 
GAAAATAAGA 



TTATTGCATA 
TTATTGCATA 
TTATTGCATA 
TTATTGCATA 
TTATTGCATA 
TTATTGCATA 
TTATTGCATA 
TTATTGCATA 
TTATTGCATA 
TTATTGCATA 
TTATTGCATA 



600 

TGCACATACA 
TGCACATACA 
TGCACATACA 
TGCACATACA 
TGCACATACA 
TGCACATACA 
TGCACATACA 
TGCACATACA 
TGCACATACA 
TGCACATACA 
TGCACATACA 



msa252409 . 2 { 85_090 . COn_ 
msa2 52409.2(8 5_CJB1 10 
msa252409 . 2 { 85_COHl 
msa2 524 0 9 . 2 { 8 5_M7 32 
rasa252409.2{85_M781 
msa252409 . 2 { 85_18RS21 
rasa252409.2{85_2603 
msa252409 . 2 ( 8S_A909 
msa252409.2{85_H36B 
msa252409.2{85 JM9130013 
msa252409 .2X85_1169NT 
Consensus 



601 

AAGCAAGGAT 
AAGCAAGGAT 
AAGCAAGGAT 
AAGCAAGGAT 
AAGCAAGGAT 
AAGCAAGGAT 
AAGCAAGGAT 
AAGCAAGGAT 
AAGCAAGGAT 
AAGCAAGGAT 
AAGCAAGGAT 



ATCAgCCTGT 
ATCAgCCTGT 
ATCAgCCTGT 
ATCAgCCTGT 
ATCAgCCTGT 
ATCAaCCTGT 
ATCAaCCTGT 
ATCAaCCTGT 
ATCAaCCTGT 
ATCAaCCTGT 
ATCAgCCTGT 



CTTGGAAACT 
CTTG GAAACT 
CTTGGAAACr 
CTTGGAAACT 
CTTGGAAACT 
CTTGGAAACT 
CTTGGAAACT 
CTTGGAAACT 
CTTGGAAACT 
CTTGGAAACT 
CTTGGAAACT 



GGAAAAAAGG 
GGAAAAAAGG 
GGAAAAAAGG 
GGAAAAAAGG 
GGAAAAAAGG 
GGAAAAAAGG 
GGAAAAAAGG 
GGAAAAAAGG 
GGAAAAAAGG 
GGAAAAAAGG 
GGAAAAAAGG 



650 

CTGATCCTGT 
CTGATCCTGT 
CTGATCCTGT 
CTGATCCTGT 
CTGATCCTGT 
CTGATCCTGT 
CTGATCCTGT 
CTGATCCTGT 
CTGATCCTGT 
CTGATCCTGT 
CTGATCCTGT 



msa252409 . 2 { 85_090 . con_ 
msa252409 . 2 { 85 jCJBHO ' 
msa2 524 0 9 . 2 { 8 5_C0H1 ' 
msa252409.2(85_M732 
msa252409.2{85_M781 
msa252409.2{85_18RS21 
rasa2 52409. 2{85_2603 
msa252409.2{8S_A909 
msa2 52409 .2(8 5_H3 6B 
msa252409.2{85 JM9130013 
msa252409.2TB5_1169NT 
Consensus 



651 

AAATAGTTCA 
AAATAGTTCA 
AAATAGTTCA 
AAATAGTTCA 
AAATAGTTCA 
AAATAGTTCA 
AAATAGTTCA 
AAATAGTTCA 
AAATAGTTCA 
AAATAGTTCA 
AAATAGTTCA 



GAGCTACCAA 
GAGCTACCAA 
GAGCTACCAA 
GAGCTACCAA 
GAGCTACCAA 
GAGCTACCAA 
GAGCTACCAA 
GAGCTACCAA 
GAGCTACCAA 
GAGCTACCAA 
GAGCTACCAA 



AGCACTTCTT 
AGCACTTCTT 
AGCACTTCTT 
AGCACTTCTT 
AGCACTTCTT 
AGCACTTCTT 
AGCACTTCTT 
AGCACTTCTT 
AGCACTTCTT 
AGCACTTCTT 
AGCACTTCTT 



AACAATTAAC 
AACAATTAAC 
AACAATTAAC 
AACAATTAAC 
AACAATTAAC 
AACAATTAAC 
AACAATTAAC 
AACAATTAAC 
AACAATTAAC 
AACAATTAAC 
AACAATTAAC 



700 

CTTGATAAGG 
CTTGATAAGG 
CTTGATAAGG 
CTTGATAAGG 
CTTGATAAGG 
CTTGATAAGG 
CTTGATAAGG 
CTTGATAAGG 
CTTGATAAGG 
CTTGATAAGG 
CTTGATAAGG 



msa252409.2{85_090.con_ 
msa252409.2{85_CJB110' 
msa252409.2{85_COHl 
msa252409.2(85 M732 
ms a2 52409. 2 { 85J4781' 
msa252409.2{85_iaRS21 
msa252409 . 2 ( 85_2603 
msa2 524 0 9 . 2 { 8 5_A90 9 
m8a252409.2{8S_H36B 
maa252409.2{85 JM9130013 
msa252409 . 2X85_1169NT! 

Consensus 



701 

AAGATAGTAT 
AAGATAGTAT 
AAGATAGTAT 
AAGATAGTAT 
AAGATAGTAT 
AAGATAGTAT 
AAGATAGTAT 
AAGATAGTAT 
AAGATAGTAT 
AAGATAGTAT 
AAGATAGTAT 



TAAGCTATTA 
TAAGCTATTA 
TAAGCTATTA 
TAAGCTATTA 
TAAGCTATTA 
TAAGCTATTA 
TAAGCTATTA 
TAAGCTATTA 
TAAGCTATTA 
TAAGCTATTA 
TAAGCTATTA 



ATTAAAGATT 
ATTAAAGATT 
ATTAAAGATT 
ATTAAAGATT 
ATTAAAGATT 
ATTAAAGATT 
ATTAAAGATT 
ATTAAAGATT 
ATTAAAGATT 
ATTAAAGATT 
ATTAAAGATT 



TAAAGGCTTT 
TAAAGGCTTT 
TAAAGGCTTT 
TAAAGGCTTT 
TAAAGGCTTT 
TAAAGGCTTT 
TAAAGGCTTT 
TAAAGGCTTT 
TAAAGGCTTT 
TAAAGGCTTT 
TAAAGGCTTT 



750 

AGACCCTGAT 
AGACCCTGAT 
AGACCCTGAT 
AGACCCTGAT 
AGACCCTGAT 
AGACCCTGAT 
AGACCCTGAT 
AGACCCTGAT 
AGACCCTGAT 
AGACCCTGAT 
AGACCCTGAT 



msa252409.2{85 090. con > 
msa252409 . 2 { 8S_CJB110 } 



751 800 
TTAATAAGTG AGATTCAGGT GATAAGTTTA GCTGATTCTA AAACGACACC 
TTAATAAGTG AGATTCAGGT GATAAGTTTA GCTGATTCTA AAACGACACC 



1168 



WO 2004/018646 



PCT7US2003/026827 



Table 88: Comparative Sequences relating to SAG0477 



msa25240 9 . 2 { 8 5_C0H1 
maa252409.2{S5 M732* 
msa252409.2{85~M78l' 
msa252409.2{B5_18RS2l' 
msa252409 . 2 { 85_2603 
msa252409 . 2 { 85_A909 
msa252409 . 2 { 85_H36B 
msa252409.2{85 JM9130013 
ras a2 52 4 09 . 2Ta 5_1 169NT 
Consensus 



TTAATAAGTG 
TTAATAAGTG 
TTAATAAGTQ 
TTAATAAGTG 
TTAATAAGTG 
TTAATAAGTG 
TTAATAAGTG 
TTAATAAGTG 
TTAATAAGTG 



AGATTCAGGT 
AGATTCAGGT 
AGATTCAGGT 
AGATTCAGGT 
AGATTCAGGT 
AGATTCAGGT 
AGATTCAGGT 
AGATTCAGGT 
AGATTCAGGT 



GATAAGTTTA 
GATAAGTTTA 
GATAAGTTTA 
GATAAGTTTA 
GATAAGTTTA 
GATAAGTTTA 
GATAAGTTTA 
GATAA GTTT A 
GATAAGTTTA 



GCTGATTCTA 
GCTGATTCTA 
GCTGATTCTA 
GCTGATTCTA 
GCTGATTCTA 
GCTGATTCTA 
GCTGATTCTA 
GCTGATTCTA 
GCTGATTCTA 



AAACGACACC 
AAACGACACC 
AAACGACACC 
AAACGACACC 
AAACGACACC 
AAACGACACC 
AAACGACACC 
AAACGACACC 
AAACGACACC 



msa252409.2{85_090.con_ 
msa2 52 4 0 9 . 2 { 8 5_CJB1 10 ' 
msa2 52409 . 2 ( 85_C0H1 
msa252409 . 2 { 8 5_M732 
msa252409.2{85_M781 
msa252409.2{85 18RS21 
msa252409 . 2 ( 85_2603 
msa252409 . 2 { 85_A909 
msa252409.2{85_H36B 
msa252409.2{85 JM9130013 
insa252409 .2T85_1169NT 
Consensus 



801 

TGACCTCCTG 
TGACCTCCTG 
TGACCTCCTG 
TGACCTCCTG 
TGACCTCCTG 
TGACCTCCTG 
TGACCTCCTG 
TGACCTCCTG 
TGACCTCCTG 
TGACCTCCTG 
TGACCTCCTG 



CTGTTAGATA 
CTGTTAGATA 
CTGTTAGATA 
CTGTTAGATA 
CTGTTAGATA 
CTGTTAGATA 
CTGTTAGATA 
CTGTTAGATA 
CTGTTAGATA 
CTGTTAGATA 
CTGTTAGATA 



TGCAtGATGG 
TGCAtGATGG 
TGCAtGATGG 
TGCAtGATGG 
TGCAtGATGG 
TGCAcGATGG 
TGCAcGATGG 
TGCAcGATGG 
TGCAcGATGG 
TGCACGATGG 
TGCACGATGG 



AAATAGTATT- 
AAATAGTATT 
AAATAGTATT 
AAATAGTATT 
AAATAGTATT 
AAATAGTATT 
AAATAGTATT 
AAATAGTATT 
AAATAGTATT 
AAATAGTATT 
AAATAGTATT 



850 

AgAATACCAT 
AgAATACCAT 
AgAATACCAT 
AgAATACCAT 
AgAATACCAT 
AgAATACCAT 
AgAATACCAT 
AsAATACCAT 
AgAATACCAT 
AgAATACCAT 
AgAATACCAT 



msa2 52 4 0 9 . 2 { 8 5_0 9 0 . con_ 
msa252409.2{85 CJB110 
ms a2 524 0 9 . 2 f 85_COHl 
msa252409 . 2 ( 85 J4732 
rosa252409 . 2 { 85_M781 
msa252409 . 2 { 85_18RS21 
msa252409 . 2 ( 85_2603 
msa2524 09 . 2 { 85_A909 
tnsa252409.2{85_H36B 
msa252409.2{85 JM9130013 
msa252409 .2T85_1169NT 
Consensus 



851 

TATCTAAATT 
TATCTAAATT 
TATCTAAATT 
TATCTAAATT 
TATCTAAATT 
TATCTAAATT 
TATCTAAATT 
TATCTAAATT 
TATCTAAATT 
TATCTAAATT 
TATCTAAATT 



TAAAGAAAGA 
TAAAGAAAGA 
TAAAGAAAGA 
TAAAGAAAGA 
TAAAGAAAGA 
TAAAGAAAGA 
TAAAGAAAGA 
TAAAGAAAGA 
TAAAGAAAGA 
TAAAGAAAGA 
TAAAGAAAGA 



CTTCCTTTTT 
CTTCCTTTTT 
CTTCCTTTTT 
CTTC CTTTTT 
CTTCCTTTTT 
CTTCCTTTTT 
CTTCCTTTTT 
CTTCCTTTTT 
CTTCCTTTTT 
CTTCCTTTTT 



ACAAACAAAT 
ACAAACAAAT 
ACAAACAAAT 
ACAAACAAAT 
ACAAACAAAT 
ACAAACAAAT 
ACAAACAAAT 
ACAAACAAAT 
ACAAACAAAT 
ACAAACAAAT 
ACAAACAAAT 



900 

TAAGAAGAAC 
TAAGAAGAAC 
TAAGAAGAAC 
TAAGAAGAAC 
TAAGAAGAAC 
TAAGAAGAAC 
TAAGAAGAAC 
TAAGAAGAAC 
TAAGAAGAAC 
TAAGAAGAAC 
TAAGAAGAAC 



msa252409.2{85_090.con_] 
msa2 52 4 09 . 2 { 8 5_CJB1 10 ' 
tnsa252409 . 2 ( B5_COHl 
msa2 52409.2<85 M732 
msa252409 . 2 { 85_M781 
msa252409.2{85_18RS21 
tnsa252409.2{85 2603 
insa252409 . 2 ( 85_A909 
msa2 524 09 . 2 { 8 5_H3 6B 
msa252409.2{85 JM9130013 
msa252409 . 2l85_1169NT 
Consensus 



901 

CTTAAGGAAC 
CTTAAGGAAC 
CTTAAGGAAC 
CTTAAGGAAC 
CTTAAGGAAC 
CTTAAGGAAC 
CTTAAGGAAC 
CTTAAGGAAC 
CTTAAGGAAC 
CTTAAGGAAC 
CTTAAGGAAC 



CTTCTATTGT 
CTTCTATTGT 
CTTCTATTGT. 
CTTCTATTGT 
CTTCTATTGT 
CTTCTATTGT 
CTTCTATTGT 
CTTCTATTGT 
CTTCTATTGT 
CTTCTATTGT 
CTTCTATTGT 



TGATATGGAA 
TGATATGGAA 
TGATATGGAA 
TGATATGGAA 
TGATATGGAA 
TGATATGGAA 
TGATATGGAA 
TGATATGGAA 
TGATATGGAA 
TGATATGGAA 
TGATATGGAA 



GTGGGAGTTT 
GTGGGAGTTT 
GTGGGAGTTT 
GTGGGAGTTT 
GTGGGAGTTT 
GTGGGAGTTT 
GTGGGAGTTT 
GTGGGAGTTT 
GTGGGAGTTT 
GTGGGAGTTT 
GTGGGAGTTT 



950 

ACACAACAAC 
ACACAACAAC 
ACACAACAAC 
ACACAACAAC 
ACACAACAAC 
ACACAACAAC 
ACACAACAAC 
ACACAACAAC 
ACACAACAAC 
ACACAACAAC 
ACACAACAAC 



msa25240 9 . 2 { 85_0 90 . con_ 
msa252409.2{85_CJB110 
msa252409 . 2 { 85_COHl 
msa252409.2(85 M732 
msa252409 . 2 { 85~M78 1 
msa252409 .2 { 85_18RS21 
msa252409.2{85__2603 
msa2S2409 . 2 { 85_A909 
msa252409 . 2 { 85_H36B 
msa252409.2{85 JM9130013 
msa252409.2T85_1169NT 
Consensus 



951 

AAgTACtATT 
AAgTACtATT 
AAgTACtATT 
AAgTACtATT 
AAgTACtATT 
AAaTACcATT 
AAaTACcATT 
AAaTACcATT 
AAaTACcATT 
AAaTACcATT 
AAgTACtATT 



GAATCAACCC 
GAATCAACCC 
GAATCAACCC 
GAATCAACCC 
GAATCAACCC 
GAATCAACCC 
GAATCAACCC 
GAATCAACCC 
GAATCAACCC 
GAATCAACCC 
GAATCAACCC 



CTGTgAAAGC 
CTGTgAAAGC 
CTGTgAAAGC 
♦CTGTgAAAGC 
CTGTgAAAGC 
CTGTtAAAGC 
CTGTtAAAGC 
CTGTtAAAGC 
CTGTtAAAGC 
CTGTtAAAGC 
CTGTgAAAGC 



gGAAGATACA 
gGAAGATACA 
gGAAGATACA 
gGAAGATACA 
gGAAGATACA 
aGAAGATACA 
aGAAGATACA 
aGAAGATACA 
aGAAGATACA 
aGAAGATACA 
gGAAGATACA 



1000 
AAAAATAAAT 
AAAAATAAAT 
AAAAATAAAT 
AAAAATAAAT 
AAAAATAAAT 
AAAAATAAAT 
AAAAATAAAT 
AAAAATAAAT 
AAAAATAAAT 
AAAAATAAAT 
AAAAATAAAT 



msa252409 . 2 { 85_090 . con_ 
msa252409 . 2 { 85__CJB110 
msa252409 . 2 { 85JCOH1 
rasa252409 . 2 { 85_M732 
msa252409 . 2 { 85_M781 
msa252409 . 2 { 85_18RS21 
msa252409 . 2 ( 85_2603 
tnsa2S2409 . 2 f 8S_A909 
msa252409.2{85_H36B 
msa252409.2{85 JM9130013 
msa252409 . 2l85_1169NT 
Consensus 



1001 

CAACTGATAA 
CAACTGATAA 
CAACTGATAA 
CAACTGATAA 
CAACTGATAA 
CAACTGATAA 
CAACTGATAA 
CAACTGATAA 
CAACTGATAA 
CAACTGATAA 
CAACTGATAA 



AACACAAaCa 
AACACAAaCa 
AACACAAaCa 
AACACAAaCa 
AACACAAaCa 
AACACAAaCa 
AACACAAaCa 
AACACAAmCa 
AACACAAaCa 
AACACAAaCa 
AACACAAaCc 



CAAAATGGTC 
CAAAATGGTC 
CAAAATGGTC 
CAAAATGGTC 
CAAAATGGTC 
CAAAATGGTC 
CAAAATGGTC 
CAAAATGGTC 
CAAAATGGTC 
CAAAATGGTC 
CAAAATGGTC 



AGGTTGCGGA 
AGGTTGCGGA 
AGGTTGCGGA 
AGGTTGCGGA 
AGGTTGCGGA 
AGGTTGCGGA 
AGGTTGCGGA 
AGGTTGCGGA 
AGGTTGCGGA 
AGGTTGCGGA 
AGGTTGCGGA 



1050 
AAATAGTCAA 
AAATAGTCAA 
AAATAGTCAA 
AAATAGTCAA 
AAATAGTCAA 
AAATAGTCAA 
AAATAGTCAA 
AAATAGTCAA 
AAATAGTCAA 
AAATAGTCAA 
AAATAGTCAA 



msa252409 . 2 {85 J>90 . con_) 



1051 

GGACAAACAA ATAACTCAAA TACTAATCAA CAAGG . 



1100 

.AC AACAGATAGC 



1169 



WO 2004/018646 



PCT/US2003/026827 



Table 88: Comparative Sequences relating to SAG0477 



rasa252409 . 2 { 85_CJB110 
msa252409.2{85 COH1 
msa252409 . 2 { 85~M732 
ms a 2 5 2 4 0 9 . 2 { 8 5~M7 8 1 

msa252409 . 2 { 85_18RS21 
msa252409.2(85_2603 
msa252409.2(85_A909 
msa252409.2{85_H36B 
msa252409.2{85 JM9130013 

msa2 524 09 . 2X85_1169NT 
Consensus 



GGACAAACAA 
GGACAAACAA 
GGACAAACAA 
GGACAAACAA 
GGACAAACAA 
GGACAAACAA 
GGACAAACAA 
GGACAAACAA 
GGACAAACAA 
GGACAAACAA 



ATAACTCAAA 
ATAACTCAAA 
ATAACTCAAA 
ATAACTCAAA 
ATAACTCAAA 
ATAACTCAAA 
ATAACTCAAA 
ATAACTCAAA 
ATAACTCAAA 
ATAACTCAAA 



TACTAATCAA 
TACTAATCAA 
TACTAATCAA 
TACTAATCAA 
TACTAATCAA 
TACTAATCAA 
TACTAATCAA 
TACTAATCAA 
TACTAATCAA 
TACTAATCAA 



CAAGG. . .AC 
CAAGG . . .AC 
CAAGG.. .AC 
CAAGG.. .AC 
CAAGG.. .AC 
CAAGG.. .AC 
CAAGG... AC 
CAAGG.. .AC 
CAAGG... AC 
CAAGGacaAC 



AACAGATAGC 
AACAGATAGC 
AACAGATAGC 
AACAGATAGC 
AACAGATAGC 
AACAGATAGC 
AACAGATAGC 
AACAGATAGC 
AACAGATAGC 
AACAGATAGC 



_+* ********** 



msa2 52 4 0 9 . 2 { 8 S_0 90 . con_ 
msa252409 . 2 { 8S_CJB110 
msa252409 . 2 ( 85_C0H1 
msa252409.2(85_M732 
msa2S2409.2(85_M781 
msa252409 .2{85_18RS21 
msa252409 . 2 f 85_2603 
msa252409.2{85 A909 
ma a2 52409 . 2 { 8S~H36B 
rasa252409.2{85 JM9130013 
msa252409 ,2T85_1169NT 
Consensus 



1101 

AACaGAGCAG 
AACaGAGCAG 
AACaGAGCAG 
AACaGAGCAG 
AACaGAGCAG 
AACaGAGCAG 
AACaGAGCAG 
AACaGAGCAG 
AACaGAGCAG 
AACaGAGCAG 
AACgGAGCAG 



GCACCcAACC 
GCACCcAACC 
GCACCcAACC 
GCACCcAACC 
GCACCcAACC 
GCACCtAACC 
GCACCtAACG 
GCACCtAACC 
GCACCtAACC 
GCACCtAACC 
GCACCcAACC 



CTCAAAATGT 
CTCAAAATGT 
CTCAAAATGT 
CTCAAAATGT 
CTCAAAATGT 
CTCAAAATGT 
CTCAAAATGT 
CTCAAAATGT 
CTCAAAATGT 
CTCAAAATGT 
CTCAAAATGT 



1134 
TAAT 
TAAT 
TAAT 
TAAT 
TAAT 
TAAT 
TAAT 
TAAT 
TAAT 
TAAT 
TAAT 



SEQ ID HO. 8812 

STRAIN 2603 frame: 1 

PKKKSDTPEKEEWLTEWQKRNLEFLKKRKEDEEEQKRINEKld*L^ 
NTTKI KKLHFPKI SRFKI EKKQKKEKI VNSLAKTNRI RTAPI FWAFLVI LVSVFLLTPF 
SKQKTITVSGNQHTPDD IL I EKTNI QKND YFFSLI FKHKAI EQRliAAEDVWVKTAQMTYQ 
F PNKFH I QVQENKI I AYAHTKQGYQ PVLETGKKADP VNS S ELPKHFLT I NLDKBDS I KLL 
IKDLKALDPDLI SEIQVI SLADSKTTPDLLLLDMHDGNS I RI PLSKFKERLPFYKQI KKN 
LKEPS I VDMBVGVYTTTNT I ESTP VKAEDTKNKSTDKTO/TQNGQVABNS QGQTNNSNTNQ 
QGQQ I ATEQAPNPQNVN 

SEQ ZD NO* 8813 
STRAIN H36B frame: 1 

PKKKSDTPEKEEVVLTEWQKRNLEFXJCKRKED SSPEEPQ 
NTTKI KKLHFPKI SRPK1 EKKQKKEKI VNSLAKTNRI RTAPI FWAFLVI LVSVFLLTPF 
SKQKT ITVSGNQHT PDDILI EKTN I QKND YFFSL I FKHKA I EQRLAAEDVWVKTAQMTYQ 
FPNKFHI QVQENKI I AYAHTKQGYQPVLETGKKADPVNSSELPKHFLTINLDKE^ I KLL 
IKDLKALDPDLI SE I QVI SLADSKTTPDLLLLDMHDGNS I RI PLS KFKERLPFYKQI KKN 
LKEPS I VDMEVGVYTTTNT I ESTPVKAEDTKNKSTDKTQTQNGQVAENSQGQTNNSNTNQ 
QGQQ I ATEQAPNPQNVN 

SEQ ID NO. 8814 

STRAIN 18RS21 frame: 1 

PKKKSDTPEKEEVVLTEWQKRNLEFLKKRKEDEEEQKRINE 

NITKI KKLHFPKI SRPKI EKKQKKEKI VNSLAKTNRI RTAPI FWAFLVI LVSVFLLTPF 
SKQKTITVSGNQHTPDD I LI EKTNI QKND YFFSL I FKHKA I EQRLAAEDVWVKTAQMTYQ 
FPNKFHI QVQENKI IAYAHTKQGYQPVLETGKKAD PVNSSELPKHFLT INLDKEDS I KLL 
I KDLKALDPDLI SEI QVISLADSKTTPDLLLIJDMHDGNS IRI PLS KFKERLPFYKQI KKN 
LKEPS I VDMEVGVYTTTNT I 
QGQQ IATEQAPNPQNVN 

SEQ ZD NO. 8815 

STRAIN M732 frame: 1 

PKKKSDTPEKEEVVLTEWQ KRNIiEFLKKRKEDEEEQKRI NEKLRLD KRS KLN I SSPEEPQ 
NTTKI KKLHFPKI SKPKI EKKQKKEKI VNSLAKTNRI RTAPI FWAFLVI LVSVFLLTPF 
SKQKTITVSGNQHTPDD I LI EKTNI QKNDYFF SL I FKHKA I EQRLAAEDVWVKTAQMTYQ 
FPNKFHI QVQENKI I AYAHTKQGYQPVLETGKKADPVNSSELPKHFLTI NLDKEDS I KLL 
IKDLKALDPDLI SEIQVI SLADSKTTPDLLLLDMHDGNS I RI PLS KFKERLPFYKQI KKN 
LKEPS I VDMEVGVYTTTSTI ESTPVKAEDTKNKSTDKTQTQNGQVAENSQ/5QTNNSNTNQ 
QGQQ I ATEQAPNPQNVN 

SEQ ZD NO. 8816 
STRAIN COH1 frame: 1 

PKKKSDTPEKEBWLTE WQKRNLE FLKKRKEDEEEQKR I NEKLRLDKRS KLN I SSPEEPQ 
NTTKI KKLHFPKI SKPKI EKKQKKEKI VNSLAKTNRI RTAPI FWAFLV 1 LVSVFLLTPF 
SKQKTITVSGNQHTPDD I LI EKTNI QKND YFFSLI FKHKAI EQRLAAEDVWVKTAQMTYQ 
FPNKFHI QVQENKI I AYAHTKQGYQPVLETGKKADPWSSELPKHFLT INLDKEDS I KLL 
IKDLKALDPDLI SE IQVI SIJVDSKTTPDLLLLDMHDGNSI RI PLS KFKERLPFYKQI KKN 
LKEPS rVDMEVGVYTTTSTI F^STPVKAEDTKNKSTDKTQTQNGQVAENSQGQTNNSNTNQ 
QGQQ I ATEQAPNPQNVN 

SEQ ZD NO. 8817 

STRAIN M761 frame: 1 

PKKKSDTPEKEFVVLTEWQKRNLE FLKKRKEDEEEQKR I NEK^ 
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NTTKI KKLHF PKI S KPKI EKKQ KKEKI VNS LAKTNRI RTAP I FWAFLV I LVSVFLLTP F 
SKQKT ITVSGNQHTPDD I LI EKTNI QKND YFFSL I FKHKAI EQRLAAEDVWVKTAQMTYQ 
FPNKFHI QVQENKI IAYAHTKQGYQPVLETGKKADPVNSSELPKHFLTINIJDKEDSIKLL 
IKDLKALDPDLI SB I QVI SLABS KTTPDL LLLDMHDGNS I RI PLSKFKERLPFYKQIKKN 
LKEPS IVDMEVGVYTTTSTIESTPVKAEDTKNKSTDKTQTQNGQVAEN^ 
QGQQ I ATEQ APNPQNVN 

SBQ ID NO. 8818 
STRAIN CJB1 10 frame: 1 

PKKKSDTPEKEEWLTE WQKRNLE FLKKRKEDEEEQKR I NE KLRLD KRS KLN I S S PEEPQ 
NTTKI KKLHFPKI SKPKIEKKQKKEKIVNSLAKT*fRIRTAPI FWAFLV I LVSVFLLTP F 
SKQKT ITVSGNQHTPDD 1 1*1 EKTNI QKND YFFSL I FKHKAI EQRLAAEDVWVKTAQMTYQ 
FPNKFHI QVQENKI IAYAHTKQGYQPVLETGKiCADPVNSSELPKHFLTINLDKEDSIKLL 
I KDLKALDPDL I SE I QV I S LAD S KTTPDLLLLDMHDGNS I R I PLSKFKERLPFYKQI KKN 
LKEPSIVDMEVGVYTTTSTIESTPVKAEDTKNKSTDKTQTQNGQVAENS 
QGQQIATEQAPNPQNVN 

SEQ ID NO. 8819 
STRAIN 1169NT frame: 1 



NTTKI KKLHFPKI SKPKIEKKQKKEKI VNSLAKTNRI RTAP I FI VAFLVI LVSVFLLTP F 
SKQKTITVSGNQHTPDDI L I EKTNI QKND YFFSL I FKHKAI EQRLAAED VWVKTAQMTYQ 
FPNKFHI QVQENKI IAYAHTKQGYQPVLETGKKADPVNSSELPKHFLTINLDKEDSIKLL 
I KDLKALDPDL I SB I QV I SLAD S KTTPDLLLLDMHDGNS IRI PLSKFKERLPFYKQI KKN 
LKEPS I VDMEVGVYTTTSTI ESTPVKAEDTK^IKSTDKTQTQNGQVAENSQGQTNNSNTNQ 
QG QQQ I ATEQAPNPQNVN 

SBQ ID HO. 8820 
STRAIN JM9130013 frame: 1 

PKKKSDTPEKEEVVLTEWQKRNLEFLKKRKEDEEEQKRINEKLRLDKRSKLNI SS PEEPQ 
NTTKI KKLHFPKI SRPKIEKKQKKEKI VNSLAKTNRI RTAP I FWAFLVI LVSVFLLTP F 
SKQKTITVSGNQHTPDDILI BKTNIQKNDYFFSLI FKHKA I EQRLAAED VWVKTAQMTYQ 
FPNKFHI QVQENKI IAYAHTKQGYQPVLETGKKADPVNSSELPKHFLTI NLDKEDSI KLL 
IKDLKALDPDLI SB I QVI SLAD SKTTPDLLLLDMHDGNS I R I PLSKFKERLPFYKQI KKN 
LKBPSIVDMEVGVYTTTNTIESTPVKAEDTKNKSTO 
QGQQIATEQAPNPQNVN 

SBQ ID HO. 8821 
STRAIN A909 frame: 1 

PKKKSDTPEKEEWLTEWQKRNLEFLKKRICEDEEEQKRINBKLRLD^ 

NTTKI KKLHFPKI SRPKIEKKQKKEKI VNSLAKTNRI RTAPI FWAFLVI LVSVFLLTP F 

SKQKT ITVSGNQHTPDD IL I EKTNI QKND YFFSL I FKHKA I EQRLAAED VWVKTAQMTYQ 

FPNKFHI QVQENKI I AYAHTKQGYQPVLETG KKAD PVNSS EL PKHFLT I NLDKED S I KLL 

I KDLKALDPDL I SE I QVI SLAD SKTTPDLLLLDMHDGNS IX I PLSKFKERLPFYKQI KKN 

LKEPS IVDMEVG\TYTTTNTI ESTPVKAEOTKNKSTDK 

QGQQIATEQAPNPQNVN 

SBQ ZD NO. 8822 
STRAIN 090 frame: 2 

KKKSDTPEKEEVVLTEWQKRNLEFLKKRKEDEEEQKRINEKLRLDKRSKLNI SSPEEPQN 
TTKI KKLHFPKI SKPKI EKKQKKEKI VNSLAKTNRI RTAP I FWAFLVI LVSVFLLTPFS 
KQKTI TVSGNQHTPDD ILIEKTN I QKNDYFFSLI FKHKAI EQRLAABDVWVKTAQMTYQP 
PNKFHI QVQENKI IAYAHTKQGYQPVLETGKKADPWSSELPKHFX.TINLDKEDS IKLLI 
KDLKALDPDLISEIQVISLADSKTTPDLLLJjDMHDGNSIRI^ 
102PSIVDMBVGVYTTTSTIESTPVKAEDTKNKSTDKTQTQN 
GQQ I ATEQAPNPQNVN 



PRETTY of i /biotmp/msa252337.2{*} January 31, 2003 03t32 



msa252337.2{85_090 
msa252337.2{85_18RS21 
maa252337 . 2 { 85_2603 
msa252337 . 2 { 85_A909 
msa2S2337.2{85 CJB110 
msa252337 . 2 ( 85_COHl 
rasa2 52337 . 2 { 85_ H36B 
maa252337 . 2 { 85_JM9130013 
mBa252337.2(85 M732 
msa252337.2{85~M781 
msa252337.2{85_1169NT) 
Consensus 



-KKKSDTPEK 
PKKKSDTPEK 
PKKKSDTPEK 
PKKKSDTPEK 
PKKKSDTPEK 
PKKKSDTPEK 
PKKKSDTPEK 
PKKKSDTPEK 
PKKKSDTPEK 
PKKKSDTPEK 
PKKKSDTPEK 



EEWLTEWQK 
EEWLTEWQK 
EEWLTEWQK 
EEWLTEWQK 
EEWLTEWQK 
EEWLTEWQK 
EEWLTEWQK 
EEWLTEWQK 
EEWLTEWQK 
EEWLTEWQK 
EEWLTEWQK 



RNLEFLKKRK 
RNLEFLKKRK 
RNLEFLKKRK 
RNLEFLKKRK 
RNLEFLKKRK 
RNLEFLKKRK 
RNLEFLKKRK 
RNLEFLKKRK 
RNLEFLKKRK 
RNLEFLKKRK 
RNLEFLKKRK 



EDEEEQKRIN 
EDEEEQKRIN 
EDEEEQKRIN 
EDEEEQKRIN 
EDEEEQKRIN 
EDEEEQKRIN 



EDEEEQKRIN 
EDEEEQKRIN 



50 

E KLRLD KRS K 
E KLRLD KRS K 
EKLRLDKRSK 
E KLRLD KRS K 
EKLRLDKRSK 
EKLRLDKRSK 
EKLRLDKRSK 
EKLRLDKRSK 
EKLRLDKRSK 
EKLRLDKRSK 
EKLRLDKRSK 



msa252337.2{85_090 
msa252337;2{85 18RS21 
msa252337 . 2 { 85_2603 
maa252337.2{85_A909 
maa252337 . 2 { 8S_CJB110 



51 100 
LNISS PEEPQ NTTKI KKLHF PKISkPKIEK KQKKEKIVNS LAKTNRI RTA 
LNISSPEBPQ NTTKI KKLHF PKISrPKIEK KQKKEKIVNS LAKTNRI RTA 
LNISS PEEPQ NTTKI KKLHF PKISrPKIEK KQKKEKIVNS LAKTNRI RTA 
LNISSPEBPQ NTTKIKKLHF PKISrPKIEK KQKKEKIVNS LAKTNRI RTA 
LNISSPEBPQ NTTKIKKLHF PKISkPKIBK KQKKEKIVNS LAKTNRI RTA 
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msa252337 . 2 { 85_COHl 
msa252337.2{85_H36B 
msa252337.2{85_JM9130013 
msa252337 . 2 { 85_M732 
tnsa252337 . 2 { 85_M781 
rasa252337.2{85_1169NT 
Consensus 



LNISSPEEPQ 
LNISSPEEPQ 
LNISSPEBPQ 
LNISSPEBPQ 
LNISSPEBPQ 
LNISSPEEPQ 



NTTKIKKLHP 
NTTKIKKLHP 
NTTKIKKLHP 
NTTKIKKLHP 
NTTKIKKLHP 
NTTKIKKLHF 



PKISkPKIEK 
PKISrPKIEK 
PKISrPKIEK 
PKISkPKIEK 
PKISkPKIEK 
PKISkPKIEK 



KQKKBKIVNS 
KQKKBKIVNS 
KQKKBKIVNS 
KQKKEKIVNS 
KQKKBKIVNS 
KQKKBKIVNS 



LAKTNRIRTA 
LAKTNRIRTA 
LAKTNRIRTA 
LAKTNRIRTA 
LAKTNRIRTA 
LAKTNRIRTA 



msa252337.2{85_090; 
msa252337.2{85 18RS21, 
tnsa252337.2(85 2603 
rasa252337 . 2 { 85^X909, 
msa252337 .2{85_CJB110 | 
msa2 52337. 2(8 5_C0H1 1 
msa2 523 3 7 . 2 { 8 5_H3 6B 
msa252337.2{85_JM9130013' 
msa252337.2{85_M732 
msa252337 .2(85""W781 
msa252337 . 2 {B5_1169NT 
Consensus 



101 

PIFvVAFLVT 
PIFWAFLVI 
PIPvVAPLVI 
PIFWAFLVI 
PIPvVAPLVI 
PIFvVAPLVI 
PIPvVAPLVI 
PIFvVAPLVI 
PIFvVAPLVI 
PIFvVAPLVI 
PIFiVAFLVI 



LVSVPLLTPP 
LVSVFLLTPF 
LVSVPLLTPP 
LVSVPLLTPP 
LVSVFLLTPF 
LVSVFLLTPF 
LVSVPLLTPP 
LVSVPLLTPP 
LVSVPLLTPP 
LVSVPLLTPP 
LVSVFLLTPF 



SKQKTITVSG 
SKQKTITVSG 
SKQKTITVSG 
SKQKTITVSG 
SKQKTITVSG 
SKQKTITVSG 
SKQKTITVSG 
SKQKTITVSG 
SKQKTITVSG 
SKQKTITVSG 
SKQKTITVSG 



NQHTPDDILI 
NQHTPDDILI 
NQHTPDDILI 
NQHTPDDILI 
NQHTPDDILI 
NQHTPDDILI 
NQHTPDDILI 
NQHTPDDILI 
NQHTPDDILI 
NQHTPDDILI 
NQHTPDDILI 



150 

EKTNIQKNDY 
EKTNIQKNDY 
EKTNIQKNDY 
EKTNIQKNDY 
EKTNIQKNDY 
EKTNIQKNDY 
EKTNIQKNDY 
EKTNIQKNDY 
EKTNIQKNDY 
EKTNIQKNDY 
EKTNIQKNDY 



<nsa252337.2{85_090; 
msa252337.2{85 18RS21 
msa252337 .2(85_2603 
msa252337.2{85_A909 
msa252337.2{85 CJB110 
msa2 52337 . 2 (85_COHl 
msa252337 .2{85_H36B 
msa252337 . 2 (85_OM9130013 
msa25233772{85J4732 
rasa252337.2{85_M781 
msa252337 . 2 { 85_1169NT 
Consensus 



151 

PFSLIFKHKA 
PFSLIFKHKA 
PFSLIFKHKA 
PFSLIFKHKA 
PFSLIFKHKA 
PFSLIFKHKA 
PFSLIFKHKA 
PFSLIFKHKA 
PFSLIFKHKA 
PFSLIFKHKA 
PFSLIFKHKA 
********** 



IEQRLAAEDV 
IEQRLAAEDV 
IEQRLAAEDV 
IEQRLAAEDV 
IEQRLAAEDV 
IEQRLAAEDV 
IEQRLAAEDV 
IEQRLAAEDV 
IEQRLAAEDV 
IEQRLAAEDV 
IEQRLAAEDV 
********** 



WVKTAQMTYQ 
WVKTAQMTYQ 
WVKTAQMTYQ 
WVKTAQMTYQ 
WVKTAQMTYQ 
WVKTAQMTYQ 
WVKTAQMTYQ 
WVKTAQMTYQ 
WVKTAQMTYQ 
WVKTAQMTYQ 
WVKTAQMTYQ 



FPNKFHIQVQ 
FPNKFHIQVQ 
FPNKFHIQVQ 
FPNKFHIQVQ 
FPNKFHIQVQ 
FPNKFHIQVQ 
FPNKFHIQVQ 
FPNKFHIQVQ 
FPNKFHIQVQ 
FPNKFHIQVQ 
FPNKFHIQVQ 



200 

ENKIIAYAHT 
BNKIIAYAHT 
ENKI IAYAHT 
BNKIIAYAHT 
BNKIIAYAHT 
BNKIIAYAHT 
BNKIIAYAHT 
BNKIIAYAHT 
BNKIIAYAHT 
ENKIIAYAHT 
ENKIIAYAHT 



********** ********** ********** 



msa252337.2{85 090 
msa252337.2{85 18RS21 
rosa252337 .2(85_2603' 
msa252337.2{85_A909 
msa252337 . 2 {85_CJB110 
msa252337 . 2 {85_C0H1 
msa252337.2{85_H36B 
msa252337.2{85 JM9130013 
maa25233772{85 M732 
msa252337 . 2 { 85~M781 
msa252337.2{85_ll69NT; 

Consensus 



201 

KQGYQPVLET 
KQGYQPVLET 
KQGYQPVLET 
KQGYQPVLET 
KQGYQPVLET 
KQGYQPVLET 
KQGYQPVLET 
KQGYQPVLET 
KQGYQPVLET 
KQGYQPVLET 
KQGYQPVLET 



GKKADPVNSS 
GKKADPVNSS 
GKKADPVNSS 
GKKADPVNSS 
GKKADPVNSS 
GKKADPVNSS 
GKKADPVNSS 
GKKADPVNSS 
GKKADPVNSS 
GKKADPVNSS 
GKKADPVNSS 



BLPKHFLTIN 
ELPKHFLTIN 
BLPKHFLTIN 
ELPKHFLTIN 
BLPKHFLTIN 
ELPKHFLTIN 
BLPKHFLTIN 
BLPKHFLTIN 
ELPKHFLTIN 
ELPKHFLTIN 
ELPKHFLTIN 



LDKEDSIKLL 
LDKEDSIKLL 
LDKEDSIKLL 
LDKEDSIKLL 
LDKEDSIKLL 
LDKEDSIKLL 
LDKEDSIKLL 
LDKEDSIKLL 
LDKEDSIKLL 
LDKEDSIKLL 
LDKEDSIKLL 



250 

IKDLKALDPD 
IKDLKALDPD 
IKDLKALDPD 
IKDLKALDPD 
IKDLKALDPD 
IKDLKALDPD 
IKDLKALDPD 
IKDLKALDPD 
IKDLKALDPD 
IKDLKALDPD 
IKDLKALDPD 



msa2 5 2 33 7 . 2 { 8 5__0 90 
msa252337.2{85_18RS21 t 
msa252337 .2(85_2603 ! 
msa252337.2{85 A909 
mBa252337.2{85 CJB110 
msa2 52337. 2(8 5_COH 1 
msa252337.2{85 H36B 
msa252337 .2{85_JM9130013 
msa252337.2{85 M732 
msa252337 .2{85~M781 
msa252337 . 2 { 85_1169NT f 
Consensus 



251 

LISBIQVISL 
LISEIQVISL 
LISBIQVISL 
LISEIQVISL 
LISBIQVISL 
LISEIQVISL 
LISBIQVISL 
LISEIQVISL 
LISEIQVISL 
LISBIQVISL 
LISEIQVISL 



ADSKTTPDLL 
ADSKTTPDLL 
ADSKTTPDLL 
ADSKTTPDLL 
ADSKTTPDLL 
ADSKTTPDLL 
ADSKTTPDLL 
ADS KTTP DLL 
ADSKTTPDLL 
ADSKTTPDLL 
ADSKTTPDLL 



LLDMHDGNSI 
LLDMHDGNSI 
LLDMHDGNSI 
LLDMHDGNSI 
LLDMHDGNSI 
LLDMHDGNSI 
LLDMHDGNSI 
LLDMHDGNSI 
LLDMHDGNSI 
LLDMHDGNSI 
LLDMHDGNSI 



rIPLSKFKER 
rIPLSKFKER 
rIPLSKFKER 
XIPLSKFKER 
rIPLSKFKER 
rIPLSKFKER 
rIPLSKFKER 
rIPLSKFKER 
rIPLSKFKER 
rIPLSKFKER 
rIPLSKFKER 



300 

LPFYKQIKKN 
LPFYKQIKKN 
LPFYKQIKKN 
LPFYKQIKKN 
LPFYKQIKKN 
LPFYKQIKKN 
LPFYKQIKKN 
LPFYKQIKKN 
LPFYKQIKKN 
LPFYKQIKKN 
LPFYKQIKKN 



msa252337.2{85_090 
msa252337.2{85 18RS21 
msa252337 . 2( 85_2603 
msa2S2337.2{85_A909 
msa252337 .2 {85_CJB110 
msa2 52337 . 2 ( 85_COHl 
msa252337 . 2 { 85_H36B 
tnsa252337.2{85_JM9130013 
msa252337.2{85_M732 
msa252337 .2{85_M781 
msa252337.2{85_1169NT| 
Consensus 



301 

LKBPSIVDME 
LKBPSIVDMB 
LKBPSIVDME 
LKBPSIVDME 
LKEPSIVDME 
LKBPSIVDME 
LKBPSIVDME 
LKBPSIVDMB 
LKBPSIVDME 
LKBPSIVDMB 
LKBPSIVDME 



VGVYTTTsTI 
VGV YTTTn TI 
VGV YTTT nTI 
VGVYTTTnTI 
VGVYTTTsTI 
VGVYTTTSTI 
VGVYTTTnTI 
VGVYTTTnTI 
VGVYTTTSTI 
VGVYTTTSTI 
VGVYTTTsTI 



ESTPVKAEDT 
ESTPVKABDT 
ESTPVKAEDT 
ESTPVKAEDT 
ESTPVKAEDT 
ESTPVKAEDT 
ESTPVKABDT 
ESTPVKAEDT 
ESTPVKAEDT 
ESTPVKAEDT 
ESTPVKABDT 



KNKSTDKTQt 
KNKSTDKTQt 
KNKSTDKTQt 
KNKSTDKTQx 
KNKSTDKTQt 
KNKSTDKTQt 
KNKSTDKTQt 
KNKSTDKTQt 
KNKSTDKTQt 
KNKSTDKTQt 
KNKSTDKTQt 



350 

QNGQVAENSQ 
QNGQVAENSQ 
QNGQVAENSQ 
QNGQVAENSQ 
QNGQVAENSQ 
QNGQVAENSQ 
QNGQVAENSQ 
QNGQVAENSQ 
QNGQVAENSQ 
QNGQVAENSQ 
QNGQVAENSQ 



msa252337.2{85_090 
msa252337 . 2 { 85_18RS21 
msa252337 . 2 < 85_2603 
rosa252337.2{85 A909 



351 378 
GQTNNSNTNQ QGQQiateqa pnpqnvn- 
GQTNNSNTNQ QGQQiateqa pnpqnvn- 
GQTNNSNTNQ QGQQiateqa pnpqnvn- 
GQTNNSNTNQ QGQQiateqa pnpqnvn- 
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msa2 52337 .2{85_CJB110 
msa252337 . 2 (8S_COHl 
msa252337 . 2 { 85_H36B 
msa252337.2{85_JM9130013 
msa252337.2(85_M732 
msa252337.2{85_M781 
msa252337.2{85_1169NT 
Consensus 



GQTNNSNTNQ 
GQTNNSNTNQ 
GQTNNSNTNQ 
GQTNNSNTNQ 
GQTNNSNTNQ 
GQTNNSNTNQ 
GQTNNSNTNQ 



QGQQiateqa 
QGQQiateqa 
QGQQiateqa 
QGQQiateqa 
QGQQiateqa 
QGQQiateqa 
QGQQqiateq 



pnpqnvn- 
pnpqnvn- 
pnpqnvn— 
pnpqnvn- 
pnpqnvn- 
pnpqnvn- 
apnpqnvn 
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SKQ ZD NO. 8901 
STRAIN 2603 

ATGAAAAAAGGACAAGTAAATGATACTAAG C^UVTCTTACTCTCTACGTAAA 

TATAAATTTGGTTTAGCATCAGTAATTTTAGGGTCACT 

TTTGCGGATCAAACTACATCXXHTCAAGTT^ 

AATAATTCTTCCAATGAGACAAGTGCGTCAAGTGT^ 

CAAGCGTCTGATAAAGTTCTAAATAgTCAAAATACX^ 

TTAGTAGAGAGAAAGCCAATGGTGGAAAAAACATTAC 

AGCAAAJGAAACXXaAGGTGAAAAATACACCTTCAAAATCAG 

AAGAAAGGTGATAAAGTTTTCTATGACOVAGTATTTAATAAAGATAATC 

TCATATAAGTCTTTTTGTGGCX?rACGTCGATAOGCAGCrAT^ 

GGAGXTTTCAGAGACTAAAGCACCrACT 

AAAATAGCAACG CAAGGAAATTATAC^TTTTCACATAAAGTAGAAGTAAAAAATGAAG CT 

AAGGTAGCGAGTCCAACTGAATTTACATTGGACAAAGG^ 

ATACTAACTATTGAAGGAAATCAGTGGTTATCITO 

TTTGTTTTGCTAGGTAAAGCATCTTCAGT 

CCTCAACCACAAGCCCGTATTACTAAAACTGGTAGACTGACT 

ACAGGTTTTGATATTTTAATTACGAATATTAAAGATGATAACG^ 

GTACCGGTTTGGACTGAACAAGGAGGGCAAGATGATATTAAATGGTAT^ 

ACTGGGGATGGCAACTACAAAGTAGCTOTATCAT^ 

CTTTATAATATTCATTTATACTACCAAGAAGCT^ 

ACTAAAGTGACAGTAGCTGGAACTAATTCTTCTC^^ 

AAGACTGGTGTTTATAATATTATCGGAAGTACIGAAGIAAAAAATGAA^ 

AGTCAGACXTCAATTTACTTTAGAAAAAGGTGACAAAATAAATTA 

GCAGATGGTTACCAGTGGATTTCTTACyiAATCI^ 

GTGAAAAAGCTAACTACAAGTAGTGAAAAAGCGAAAGATGAGG<X3A 

TATCCCAACTTAOrrAAAACAGGTACCTATAC ATTT ACT 

CAACCTAAAGTATCAAGTCCAGTGGAATTTAA^ 

GATCAAGTGTTAGTAGTAGATGGTCATCAGTGGATTTCA^ 

CGTCGCTATATTGAAATT 

SKQ ID NO. 8902 
STRAIN 090 

AAAAAAGGACAAGT AAATGATACTAAG CAATCTTACT 
CTCTAOGTAAATATAAATTTCGTTTAGCATCACT 

ATAATGGTCACAAGTCCTGTTTTTG CX3GATCAAACTACATCXK3TTCAAGT 

TAATAATCAGACAGGCACTAGTGTCGATGCTAATAA 

CAAGTGCGTCAAGTGTGATTACTTCCAATAATGATAGTGTTCAAG 

GATAAAGTTGTAAATAGTCAAAATAOGGCAACAAAGGACATrACTACTCC 

TTTAGTAGAGACAAAGCCAATGGTGGAAAAAACATTACCTGAACAA 

ATTATGTTTATAG CAAAGAAACCGAGGTGAAAAATACACCTT CAAAATCA 

GCCCCAGTAGCTTTCTATGCAAAJSAAAG^ 

AGTATTTAATAAAGATAATGTGAAATGGATTTCATATAAGTCrrin'l^TC 

GCGTACGTCX^TACGCAGC7A1TGAGTCACTAGAT^ 

GAGACTAAAGC^CCTACTCCTGTAACAAATTCAGGAAGCAATAATCAAGA 

GAAAATAGCAACGCAAGGAAATTATACATTTTC^CATAAAGTAGAAGTAA 

AAAATGAAGcTAAGGTAGCGAGTCCAACTCAATTT^ 

GACAGAATTTTTTACX5AOCAAATACTAACTATO 

ATCTTATAAATCATTCAATGGTGTTCGTCGTrr^ tTGCTAGGTAAAG 

CATCITCAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCTCCT 

CAAGCCCGTATTACTAAAACTGGTAGACTGACTATTTCT 

CTGCTGTTAAGGTACCGGTTTGGACTCAACAAGG^ 

AAATGGTATACAGCTGTAACTACTGGGGATGGCAM 

ATCATTTGCTGACCATAAGAATGAGAAGGGTCTTTATAATAT^ 

ACTACCAAGAAGCTAGTGGGACACTTGTAGGTGTAACAGGAACTAAW 

ACAGTAGCrGGAACTAATTCTTCTCAAGAACCTATT^ 

AAAGACTC^TGTTTATAATATTATCGGAAGTACT^ 

CTAAAATATCAAGTCAGACCCAATTTACTTTAGAAAAA^ 

AATTATGATOVAGTATTGACAGCAGATGGTTAC^ 

ATCTTATAGTGGTGTTaSTCGCTATATTCCTGTGAAAAAGCT 

GTAGTGAAAAAGCGAAaGATGAGGOGACTAAACCGACTAGTTATC 

TTACCTAAAACAGGTACCTATACATTTACTAA 

TCAACCTAAAGTATCAAGTCCAGTGGAATTrAATTTTCAAA 

AAATACATTATGATCAAGTGTTAGTAGTAGATGGT 

TACAAGAGTTATTCCGGTATTOTKXKTATATTGAAATT 



SSQ ZD NO. 8903 
STRAIN A909 

AAAAAAGGACAAGTAAATGATACTAAGCAATCTTAC 

TCTCTACGTAAATATAAATTTGGtTTAGCA^ 
CATAATXXJTCACAAGTCCTGtrrTrTO 
TTAATAATCAGACAGGCACTAGTGTGGATGJCTAATAA 
ACAAGTGCXSTCAAGTGTGATTACrrCCAATAATGAT 
TGATAAAGTTGTAAATACTCAAAATACGGCAACA 
CTTTAGTAGAGACAAAGCCAATGGTGGAAAAAACATr^ 
AATTATGTTTATAGCAAAGAAACCGAGGTGAAAAATACACCTTX^ 
AGCCCCAGTAGCTTTCTATGCAAAGAAAQGTGATAAAGTTTT 
AAGTATTTAATAAAGATAATGTGAAATGGATTTCATATAAGTC 
GGCGTACGTCGATACGCAGCTATTGAGTCACTAGATCCATC^ 
1 AGAGACTAAAGCACCTACTCCTGTAACAA ATTCA GGAAGCAATAATCA 
AGAAAATAGCAACGCAAGGAAATTATACATTTTCACIATA 
AAAAATGAAGCTAAGGTAGCGAGTCCAACTCAATTTA 
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AGACAGAATTTTTTACGAC CAAAT ACTAACTATTGAAGGAAATCAGTGGT 

TATCT^ATAAATCATTCAATGGTGTTCGTCGTTTTGTTtTGCT 

GCATCITCAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCrCCT 

ACAAGCCCGTATTACTAAAACTGGTAGACTGACTATTTCTAACGAAACAA 

CTACAGGTTTTGATAl'riU'AATTACGAATATTAAAGATGATAACGGTATC 

GCTGCTGTTAAGGTACCGGTITGGACTGAACAAGGAGGGCAAGATGAT^ 

TAAATGGTATACAG CTGTAACT ACTGGGGATGGCAACTACAAAGTAGCTG 

TATCATTTG CTGACCATAAGAATGAGAAGGGTCTTTATAATATTCATTTA 

TACTACCAAGAAGCTAGTGGGACACTTGTAGGTGTAACAGGAACT 

GACAGTAGCTGGAACTAATTCrTCTCAAGAACCTAT^ 

CAAAGACTGGTGTTTATAATATTATCGGAAGTACTGAAGTAAAAAATGAA 

GCTAAAATATCAAGT CAGACCCAATTT ACTTTAGAAAAAGGTGAGAAAAT 

AAATTATGATCAAGTATTGACAGC^GATGGTTACC^GTGGATTTCTTAC^ 

AATCTTATAGTGGTGTTCGTCGCTATATTCCTGTGAAAAAGCTAACTAC^ 

AGTAGTGAAAAAGCGAAAGATGAGG CGACrAAACCGACTAGTTATCCCAA 

CTTACCTAAAACAGGTACCTATACATTTACTAAAACTGTAGATGTGAAGA 

GTOVACCTAAAGTATCAAGTCCAGTGGAATTTAATTTTCAA 

AAAATAC7VTTATGATCAAGTGTTAGTAGTAGATGGTCATCAJ3 

ATACAAGAfiTTATTCCX3GTATTOGTCX3CrATATTGAAATT 

SEQ ID NO. 8904 
STRAIN H36B 

AAAAAAGGACAAGTAAATGATACTAAGCAATCTTACT 

CTCTACGTAAATATAAATTTGGTTTAGCATCAGTAATTTTAGOT 

ATAATGGTCACAAGTCCTGTTTTTGCGGATCAAACTACATCXSGrTCAAGT 

TAATAATCAGACAGG CACTAGTGTGGATGATAATAATTCTTCCAATGAGA 

CAAGTGCGTCAAGTGTGATTACITCCAATAATC 

GATAAAGTTOTAAATAGrTCAAAATACGGCAACAAAGGA 

TTTAGTAGAGACAAAGC CAATGGTGGAAAAAACAT^ACCTGAACAAGGGA 

ATTATGTTTATAGCAAAGAAACCGAGGTGAAAAATACACKriTCAAAATCA 

GCCCCAGTAGCTTTCrrATGCAAAGAAAGGTGATAAAGlTlUVrATGACCA 

AGTATT^AATAAAGATAATGTGAAATGGATTTCATATAAGTCT^ 

GCGTACGTamTACGCAGCTATTGAGTCACTAGATCCA^ 

GAGACTAAAGCACCTACTCCTGTAACAAATTCAGGAAGCAATAATCAAGA 

GAAAATAGCAACCCAAGGAAATTATACATTTTCACATAAAGTAGAAGTAA 

AAAATGAAGCTAAGGTAGCGAGTCCAACTCAATTTACATTGGACAAAGGA 

GACAGAATTTTTTACGACCAAATACTAACTATTGAAGGAAA^ 

ATCTTATAAATCATTCAATGGTGTTCGTC<3ITTTGTT tTGCTAGGTAAAG 

CATCTTCAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCTCCTCAACCA 

CAAGCCCGTATTACTAAAACTGGTAGACTGACTATTTCTAACGAAACAAC 

TACAGGTITTGATATTITAATTACGAATATTAAAGATGATAACGGTATCG 

CrGCTGTTAAGGTACCGGTTTGGACTGAAC^ 

AAATGGTATACAG CTGTAACTACTGGGGATGGCAACTACAAAGTAGCTGT 

ATCATTTGCTGACCATAAGAATGAGAAGGGTCTTT^ 

ACTACCAAGAAGCTAGTGGGACACTTGTAGGTGTAACRgGAACTAAAGTG 

ACAGTAG CTGGAACTAATTCTTCTCAAGAACCTATTGAAAATGGTTTAGC 

AAAGACTGGTGTTTATAATATTATCGGAAGTACTGAAGTAAAAAATGAAG 

CTAAAATATCAAGTCAGACCCAATTTACTTTAGAAAAAGGTGACAAAATA 

AATTATGATCAAGTATTGACAGaVGATGGTTACCAGTG 

ATCTTATAGTGGTGTTCGTCGCTATATTCCTGTGAAAAAGCTAACTACAA * 

GTAGTGAAAAAGCGAAAGATGAGGCGACTAAACCGACTAGTTATCCK^ 

TTACOTAAAACAGGTACCTATACATTTACTAAAACTGTAGATGTGAAGAG 

TCAACCTAAAGTATCAAGTCCAGTGGAATTTAATTTTCAAAAGGG^ 

AAATACATTATGATCAAGTGTTAGTAGTAGATGGTCATCAGTGGATITCA 

TACAAGAGTTATTCCGGTATTCGTCG CTATATTGAAATT 



SEQ XD NO. 8905 
STRAIN 18RS21 

AAAAAAGGACAAGTAAATGATACTAAG CAATCTTACTC 

TCTACGTAAATATAAATTTGGTTTAGCATCAGTAATTTT^ 

TAATGGTCACAAGTCCTGTTTTTGCGGATCAAACTAC^ 

AATAATCAGACAGGCACTAGTGTGGATGCTAATAATTCTTCCAATGAGAC 

AAGTGCGTCAAGTGTGATTACTTCCAATAATGATAGTGTTC 

ATAAAGTTCTAAATAGTCAAAATACGGCAACAAAGGACATTACTACTCCT 

TTAGTAGAGACAAAGCCAATGGTGGAAAAAACATTACCTGAACAAGGGAA 

TTATGTTTATAGC^AAGAAACC<3AGGTGAAAAATACACCTT^ 

CCCCAGTAGCTTTCTATGCAAAGAAAGGTGATAAA 

GTATTTAATAAAGATAATGTGAAATGGATTTCATATAAGTCrTT^ 

CGTACOTCGATACGCAGCTATTGAGTCACTAGATCCATCAG 

AGACTAAAGCACCTACTCCTGTAACAAATTCAGGAAGCAATAATCAAGAG 

AAAATAGCAACGCAAGGAAATTATACATTTTCACATAAAGTAGAAGTAAA 

AAATGAAGcTAAGCTAGCGAGTCCAACTCAATTTACATTG 

ACAGAATTTTTTACGACCAAATACTAACTATTGAAGGAAATCAGTGG 

ATCTTCAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCTCC^ 

AAGCCCXnATTACTAAAACTGGTAGACTGACTATTTCTAA 

ACAGOTTTTGATAITTTAATTACGAATATTAAAGATGATAACGGT^ 

TGCTGTTAAGGTACXX3GTTTGGACTGAACAAGGAGGG CAAGATGATATTA 

AATGGTATACAGCTGTAACTACTGGGGATGGCAACrACAAAGTAGCTGTA 

TGATTTGCTGACCATAAGAATXIAjGAAGGGTCTTTA 

CTACCAAGAAGCTAGTGGGACACTTGTAGG1XSTAACAGGAACTAA 

CAGTAGCTGGAACTAATTCTTCTCAAGAACCTAITGAAA^ 

AAGACTGGTGTTTATAATATTATCGGAAGTACTGAAGTAAAAAATGAAGC 
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TAAAATATCAAGTCAGACCCAATTTACTTTAGAAAAAGGTC 
ATTATGATCAAGTATTGACAG CAGATGGTT ACCAGTGGATTTCTTACAAA 
TCTTATAGTGGTGTT CGTCG CTATATTCCTGTGAAAAAGCTAACTACAAG 
TAGTGAAAAAGCGAAAGATGAGGCGACTAAACCGACTAG 
TACCTAAAACAGGTACCTATAC^TTTACTAAAACTGTAGATGTGAAAAGT 
CAACCTAAAGTATCAAGTCCAGTGGAATTTAATTTTCAAAAG 
AATACATTATGATCAAGTC3TTAGTAGTAGATGGTCAT 
ACAAGAGTT ATT CCGGT ATTCGTCGCTATATTGAAATT 

SEQ ID NO. 8906 
STRAIN M732 

CAAGTAAATGATaCTAAGCAATCTTACTCTCTACGTAAAT^^ 

TTTAGCATCAGTAATTTTAGGGTCATTCATAATGGTCACAAGTCCTC 

TTGCXSGATCAAAc^ACATCGGTTCAAGTTAATAATC^ 

GTGGATGCTAATAATTCTTCCAATGAGACAAGTG CGTCAAGTGTGATTAC 

TTCCAATAATGATAGTGTTCAAG CGTCTGATAAAGTTGTAAATAGTCAAA 

ATACXX3CAACAAA.GGACATTACTACTCCTT/rAGTAGAGACAA 

GTGGAAAAAACATTACCTGAACAAGGGAATTATGTTTATAGCAAAGAAAC 

CXSAGGTGAAAAATACACCTTCAAAATCA^ 

AGAAAGGTGATAAAGTTTTCTATGACCAAGTATTTAATAA 

AAATGGATTTCATATAAGTCTITTGGTGGCX5TACGTCGAT 

TGAGTCACTAGATCCATCAGGAGGTTCAGAGACTAAAGCACCTAC 

TAACAAATTCAGGAAGCAATAATCAAGAGAAAATAGCAACGCAAGGAAAT 

TATACATTTT CACAT AAAGT AGAAGTAAAAAATGAAG CTAAGGT AGCGAG 

TCCAACTCAATTTACATTGGACAAAGGAGACAGAATTTTT^ 

TACTAACTatTGAAGGAAATC^GTG<nTATCTTATAAATCATTCAATGOT 

GTTCGTCGTTTTG tT 1 t G cTAGGTAAAGCATCTTCAGTAGAAAAAACTGA 

AGATAAAGAAAAAGT^CTCCTCAACX^C^GCCCXn'ATTACTAAAACTG 

GTAGACrTGACTATTTCTAACGAAACAACTACAGGTTTTGATAT^ 

AXX3AATATTAAAGATGATAACGGTATCGCTGC^ 

GACTGAACAAGGAGGGCAAGATGATATTAAATGGTATACAGCTGTAACTA 
CTGGGGATGG CAACTACAAAGTAGCTGTATCATTTGCTGACCATAAGAAT 
GAGAAGGGTCTTTATAATATTCATTTATACT 

ACTTGTAGGTGTAACAGGAACTAAAGTGACAGTAGCrGGAACTAATTCTT 

CTCAAGAACCTATTGAAAATGGTTTACCAAAGACTGGTGTTTATAA 

ATCGGAAGTACTGAAGTAAAA7VATGAAGCTAAAATATCAAOTCAGACCCA 

ATTTACTTTAGAAAAAGGTGACAAAATAAATTATGATCAACT 

CAGATGGTTACCAGTGGATTTCTTACAAATCTTATAGTGGTGTTCGTCGC 

TATATTCCTGTGAAAAAGCTAACTACAAGTAGTGAAAAAGCGAAAGATGA 

GG CX^CTAAACCGACTAGTTATCCCAACITACCTAAAACAGGTACCTATA 

CATTTACTAAAACTGTAGATGTGAAAAGTCAACCTAAAGTATCAAGTCX^ 

GTGGAATTTAATTTTCAAAAGGGTGAAAAA^ 

AGTAGTAGATGGTCATCAGTGGATTTCATACAAGAGTTAT^ 

GTCGCTATATTGAAATT 

SEQ ZD HO. 8907 
STRAIN COH1 

AAAAAAGGACAAGTAAATGATACTAAGCAATCTTACTCTCT 

ACGTAAATATAAAVI'IXJGIUTAGCATCAGTAAITI'IAGGGTCATTGATAA 

TGGTCACAAGTCCTGTTTTTGCGGATCAAACTACATC 

AATCAGACAGGCACTAGTGTGGATG CTAAT AATTCTTCCAATGAGACAAG 

TGOGTCAAGTGTGATTACTTCX2AATAATGATAGTGTTC 

AAL^i-iXi-iAAATAGTCAAAATACGGCAACAAAGGACATTACTACTCLrx-i^A 

GTAGAGACAAAG CCAATGGTGGAAAAAACATTACCTGAACAAGGGAATTA 

TGTTTATAGCAAAGAAACCGAGGTGAAAAATACACCTTCAAAATC^^ 

CAGTAGCTTTCTATGCAAAGAAAGGTGATAAAGTTT^ 

TTTAATAAAGATAATGTTAAATGGATTrcA.TATAAG* 

ACXSTCGATACGCAGCTATTGAGTCACTAGATCCA^ 

CTAAAGCACCTACTCCTGTAACAAATTCRGGAAGCAATAATCAAGAGAAA 

ATAGCAACGCAAGGAAATTATACATTTTCACATAAAGTAGAAGTAaAAAA 

TGA AGcTAA GGTAGCGAGTCCAACTCAATTTACATTCGACAAA^ 

GAATTTTTTACGACCAAATACTAACTATTGAAGGAAATCAGT^ 

TATAAATCATTCAATGGTGTTCGTC G ' ri 'ri ' G'l T tTGCTAGGTAAAGCATC 

TTCAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCTCCTC^ 

CCCGTATTACTAAAACTGGTAGACTGACTATTTCTAACGAA 

GGTTTTGATATTTTAATTACGAATATTAA 

TGTTAAGGTACCGGTTTGGACTGAACAAGGAGGGCAAGATGA 

GGTATACAG CTGTAACTACTGGGGATGGCAACTACAAAGTAG CTGTATCA 

TTTX3CTGACCATAAGAATGAGAAGGGTCTTTATAATATTCA 

CCAAGAAGCTAGTGGGACACTTGTAGGTGTAACAGGAACTAAAGTGACAG 

TAGCTGGAACTAATTCTTCTCAAGAACCTATTGAAA^ 

ACTGGTGTTTATAATATTATCGGAAGTACTGAAGTAAAAAATGAAGCTAA 

AATATCAAGTCAGACCCAATTTACTTTAGAAAAAGGTGACAAAATAAA 

ATGATeAAGTATTGACAGCAGATGGTTACCAJGTGGAT^ 

TATAGTGGTGTTCOTCX5CTATATTCCTGTGAA 

TGAAAAAGCGAAAGATGAGGCGACTAAACXX^CTAGTTATCCCAA 

CTAAAACAGGTACCTATACATTTACTAAAACTC 

CXTrAAAGTATCAAGTCCAGTGGAATTTAATTI^ 

ACA TTA TGATCAA^IXyiuAGTAGTAGATGGTC 

AGAGTT ATTC CGGTATTCGTCG CTATATTGAAATT 

SEQ XD NO. 8908 
STRAIN M781 
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AAAAAAGGACAAGTAAATGATACT AAG CAATCTT 

ACTCTCTACGTAAATATAAATTTGGTTTA^ 

TTCATAATGGTCACAAGTCCTGTTTTTGCGGATCAAAC^ 

AGTTAATAATCAGACAGGCACTAGTGTGGATGCrAAT^ 

AGACAAGTGCGTCAAGTGTGATTACTTCCAATA^ 

TCTGATAAAGTTGTAAATAGTCAAAATACGG CAACAAAGGACATTACTAC 
TCCITTAGTAGAGACAAAGCCAATGGTGGAAAAAA 

GGAATTATGTTTATAGCAAAGAAACCGAGGTGAAAAATACACCTTCAAAA 

TCAGCCCCAGTAGCTTTCTATGCAAAGAAAGGTGA 

CCAAGTATTTAATAAAGATAATGTGAAATGGATTTCATATAAGT^ 

GTGGCGTACGTCmTACGCAGCTATTGAGTCACTAGATCCATCAGGAGGT 

TCAGAGACTAAAGCACCTACTCCTGTAACAAATTCAGGAAG 

AGAGAAAATAGCAACGCAAGGAAATTATACATTTTCACATAAAGTAGAAG 

TAAAAAATGAAGCTAAGGT AG CGAGTCCAACTCAATTTACATTGGACAAA 

GGAGACAGAATTTTTTAC^GACCAAATACTAACT 

GTTATCTTATAAATCATTCAATGGTGTTCX5T<^1 M 1"1U'GTT tTGCTAG GTA 

AAGCATCTTCAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCTCCTCAA 

CCACAAGCCCGTATTACTAAAACrGGTAGACTGACTATTTCTAACGA 

AACTACAGGTTTTGATATTTTAATTACGAATATTAAAGATGATAAC^ 

TCGCTGCritnTAAggTACCGGTTTGGACTGAACAAGG 

ATTAAATGGTATACAGCTGTAACTACTGGGGAT^ 

TGTATCATTTGCTGACX^TAAGAATGAGAAGGGTCTr^ 

TATACTACCAAGAAGCTAGTGGGACACTTGTAGGTGTAACAGGAACT 

GTGACAGTAGCTGGAACTAATTCTTCTCAAGAACCT 

ACCAAAGACTGGTGTTTATAATATTATCGGAAGTAClXjAAGTAAA 

AAGCTAAAATATCAAGTCAGACCCAATTrACTTTAGAAAAAGGTGACAAA 

ATAAATTATGATCAAGTATTGACAGCAGATGGTTACCAGTC 

CAAGTAGTGAAAAAGOGAAAGATGAGGOGACTAAACXZGACT 

AACTTACCTAAAACAGGTACCTATACATTTACTAAAACrGTAG^ 

AAGTCAACCTAAAGTATCAAGTCCAGTGGAATTTAATTTT^ 

AAAAAATACATTATGATCAAGTGTTAGTAGTAGATGGT 

TCATACAAGAG'rrATTCCX^TATTCGTCXKrTATATTGA 

SEQ ZD NO. 8909 
STRAIN CJB 110 

AAAAAAGGACAAGTAAATGATACT AAG CAATCTTACTCTC 

TACGTAAATATAAATTTGGTTTAGCATCAGTAA^ 

ATGGTCACAAGTCCTGTTTTTGCGGATCAAAC^^ 

TAATCAGACAGGCACTAGTGTGGATGC^ 

GTGCGTCAAGTGTGATTACTTCCAATAAT^ 

AAAGTTGl^AATAGTCAAAATAOGGCAACAAAGGACyVTTA 

AGTAGAGACAAAGCCAATGGTGGAAAAAACATTACCT 

ATGTTTATAGCAAAGAAACCGAGGTGAAAAATACACC^ 

CCAGTAGCTTTCTATGCAAAGAAAGGTGATAAAGT^ 

ATTTAATAAAGATAATGTGAAATGGATTTCAT^ 

TACGTCGATACGCAGCTATTGAGTCACTAGATCCATC^ 

ACTAAAGCACCTACTCXnXSTAACAAATTCAG^^ 

AATAG CAACG CAAGGAAATTATACATTTTCACATAAAGTAGAAGT AAAAA 

ATGAAGCTAAGGTAGCGAGTCCAACTCAATTTAC^ 

AGAATTTTTTACGACXllAAATACTAACrATTG^ 

TTATAAATCATTCAATGGTGTTCGTCGTTTTGTTT^ CAT 

CTTCACTAGAAAAAACnXSAAGATAAAGAAAAA 

GCCOTTATTACTAAAACTGGTAGACTGACTATTTCT 

AGGTTTTGATATTTTAATTACGAATAITT^ 

CTGTTAAGGTACCGGTTTGGACTGAACAAGGAGG^ 

TGGT ATACAGCTGTAACTACTGGGGATGG CAACTACAAAGTAGCTGTATC 

ATTTGCTGACCATAAGAATGAGAAGGGTCTTTA 

ACXIAAGAAGCTAGTGGGACACITGTAGGTGTAA 

GTAGCTGGAACETVATTCT^ 

GAC7TGGTGTTTATAATATTATCGGAAGTACTC 

AAATATCAAGTCAGACCCAATTTACr^ 

TATGATCAAGTATTGACAGCftGATGGTT^ 

TTATAGTGGTGTTCXSTCGCrATATTC^ 

GTGAAAAAGCX3AAAGATGAGGCGACTAAACCGACTAGTTATC 

CCTAAAACAGGTACCTATACATTTACT 

ACCTAAAGTATCAAGTCCAGTGGAATTTAATriTCAAAAGG 

TAC^ATTATQATCAAGTGTTAGTAGTAGATGg 

AAGAGTTATTCCGGTATTCGTCGCTATATTGAAATT 

SEQ ZD HO. 8910 
STRAIN 1I69NT 

AAAAAAGGACAAGTA AATGATACTA AGCAATCITACTC 

TCTACXJIAAATATAAATTTGGTTTAGCA^ 

TAATGGTCACAAGTCCTGTTTTTGCGGATCAAACT 

AATAATCAGACAGGCACTAGTGTGGATGCTAATA 

AAGTGCGTCAAGTGTGATTACTTCCAATAATGATAG^ 

ATAAAGTTGTAAATAGTCAAAATACX3GCAACAAA 

TTAQTAQAGACAAAgCCAATOQTGGAAAAAACATTA 

TTATGTTTATAGCAAAGAAACCGAGGTGAAAAATACACCrTCAA 

CCCCAGTAGCTTrCrATOCAAAQAAAQGTGATAA 

GTATTTAATAAAGATAATGTGAAATCGATTTCATA 

CGTACGTCGATACXX!AGCTATTGAGTCACTAGATCC^ 
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AGACTAAAGCACCT ACT CCTCJTAACAAATTCAGGA^CAATAATCAAXSAG 
AAAATAGCAACGCAAGGAAATTATACATTTTG^ 

AAATGAAGCTAAGGT AG CXSAGTCCAACTCAATTTACATTGGACAAAGGAG 

ACAGAATTTTTTACX3ACCAAATACTAACTATTGAA^ 

TCTTATAAATCATTCAATGGTGTTCGTCGTTTTGT^ 

ATCTTCAGTAGAAAAAACTGAAGATAAAGAAAAAGTGTCTCCT 

AAGCCCGTATTACTAARACTGGTAGACTGACTATT^ 

ACAGGTTTTGATATTTTAATTACGAATATTAAAGA 

TGCTGTTAAGGTAC03GTTTGGACTGAACAAGGAGGG 

AATGGTATACAJGCTGTAACTACTGGGGATGGCAACTAC^ 

TCATTTGCTGACXZATAAGAATGAGAAGGGTCTTTA 

CTACCAAGAAGCTAGTGGGACACTTGTAGGTGTAACAGGAACT 

CAGTAGCTGGAaCTAATTCTTCTCAAGAACCTAT^ 

AAGACTGGTGTTTATAATATTATCGGAACTACTGAAGT^ 

TAAAATATCAAGTCAGACCCAATITACTTTAGAAAAAGGTGACAAAATAA 

ATTATGATCAAGTATTXIftCAGCAGATGGTC 

TCTTATAGTGGTGTTCXrcCGCTATATTCCTGra 

TAGTGAAAAAGCGAAAGATGAGGCGACTAAACCGACTAGT^ 

TACCTAAAACAGGTACCTATACATTTACTAAA^ 

CAACCTAAAGTATCAAGTC CAGTGGAATTTAATTTTCAAAAGGGTGAAAA 

AATACATTATGATCTVAGTGTTAGTAGTAGATGGTC^^ 

ACAAGAiCnTATTCCXMTATTCGTCGCTATATTGAAAT^ 

SBQ ZD HO. 8911 
STRAIN JM9 1300 13 

AAAAAAGGACMGTAAATGATACTAAGCAATCTTACr 

CTCTACGTAAATATAAATTTGGTTTAGCATCAGTAATTTTA 

ATAATGGTCACAAGTCCTGTTTTTGCG^ 

TAATAATCAGACAGGCACTAGTGTGGATGCrAATAATTCT^ 

CAAGTGCGTCAAGTGTGATTACTITCCAATAATGATAG^ CGTCT 

GATAAAGTTGTAAATAGTCAAAATACGGCAACAAAGGACATTACT 

TTTAGTAGAGACAAAGCCAATGGTGGAAAAAACATTA 

ATTATCTTTATAGCAAAGA 

GCCCCAGTAGCTTTCTATGCAAAGAAAGGTGATAAAGTTT^ 
AGTATTTAATAAAGATAATGTGAAATGGATTTCAT^^ 
G^XH!AC<?rCGATAQ3CAGCTATTGAGTCACTA6A 
GAGACTAAAGCACCTACrcCTGTAACAAATTCiVG 

GAAAATAGCAACGCAAGGAAATTATACATTTTCACATAAAGTAGAAGTAA 

AAAATG AAGCTAA GGTAGCGAGTCC!AACTCAATTT^ 

GACAGAATTTTTTACGACCAAATACTAACT 

ATCTTATAAATCMTCAATGGTGTTCGTCGTTTTC 

CATCTTCAGTAGAAAAAACTCAAGATAAAG^ 

CAAGC CCGTA TTAC TAAA ACTGGTAGACTGACTATTTATAACGA 

TACAGGTITTGATATTTTAATTACGAATATTAAAGATGATAACG 

CTGCTGTTAAGGTACCGGTTTGGACTGAACAAGGAGGG CAAGATGATATT 

AAATGGTATACAGCTGTAACTACTGGGGATGGCAACTACAAACT 

ATCATTTGCTGACCATAAGAATGAGAAGGGT^ 

ACTACCAAGAAGCTAGTGGGAC^CTTGTAGGTGTA 

ACAGTAGC?K3GAACTAATTCTTCTCaAG 

AAAGACTGGTGTTTATAATATTATCGGAAGTACrGAAGTA 

CTAAAATATCAAGTCAGACCCAATTTACTTTAGAAAAAGGTGA 

AATTATGATCAAGTATTGACAGCAGATGGTTACGAGTGGATT^ 

ATCTTATAGTGGTGTTCGTCGCTATATTCCTGTGAAAAAGCT 

GTAGTGAAAAAG CX3AAAGATGAGGCGACTAAACCGACTAGTTATCCCAAC 

TTACCTAAAACAGGTACCTATACATTTACTAAAACIX^ 

TCAACCTAAAGTATCAAGTCCAGTGGAATrrAATTTTCAAAAGG 

AAATAGlTTATGATCAAGTGTTAGTAGTAGATG^ 

TACAAGAGTTATTCCGGTATTCGTCGCTATATTGAAATT 
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msa255059.2{91 CJB110 
maa2 55059 . 2 { 91_H3 6B 
msa255059.2{9WM9130013 
Consensus 



AAAAAAG 

AAAAAAG 

AAAAAAG 

atgAAAAAAG 

AAAAAAG 

AAAAAAG 

AAAAAAG 

AAAAAAG 

AAAAAAG 

AAAAAAG 



— CAAGTAAA 
GACAAGTAAA 
GACAAGTAAA 
GACAAGTAAA 
GACAAGTAAA 
GACAAGTAAA 
GACAAGTAAA 
GACAAGTAAA 
GACAAGTAAA 
GACAAGTAAA 
GACAAGTAAA 



TGATACTAAG 
TGATACTAAG 
TGATACTAAG 
TGATACTAAG 
TGATACTAAG 
TGATACTAAG 
TGATACTAAG 
TGATACTAAG 
TGATACTAAG 
TGATACTAAG 
TGATACTAAG 



CAATCTTACT 
CAATCTTACT 
CAATCTTACT 
CAATCTTACT 
CAATCTTACT 
CAATCTTACT 
CAATCTTACT 
CAATCTTACT 
CAATCTTACT 
CAATCTTACT 
CAATCTTACT 



50 

CTCTACGTAA 
CTCTACGTAA 
CTCTACGTAA 
CTCTACGTAA 
CTCTACGTAA 
CTCTACGTAA 
CTCTACGTAA 
CTCTACGTAA 
CTCTACGTAA 
CTCTACGTAA 
CTCTACGTAA 



maa255059.2(91_M732 
tnsa255059 . 2 { 91_M781 
tnaa255059 . 2{9l_COHl 

msa25S0S9.2{91 18RS21 
msa255059.2{91_2603 

msa2S5059 . 2 { 91_1169NT 



51 

ATATAAATTT 
ATATAAATTT 
ATATAAATTT 
ATATAAATTT 
ATATAAATTT 
ATATAAATTT 



GGTTTAGCAT 
GGTTTAGCAT 
GGTTTAGCAT 
GGTTTAGCAT 
GGTTTAGCAT 
GGTTTAGCAT 



CAGTAATTTT 
CAGTAATTTT 
CAGTAATTTT 
CAGTAATTTT 
CAGTAATTTT 
CAGTAATTTT 



AGGGTCATTC 
AGGGTCATTC 
AGGGTCATTC 
AGGGTCATTC 
AGGGTCATTC 
AGGGTCATTC 



100 

ATAATGGTCA 
ATAATGGTCA 
ATAATGGTCA 
ATAATGGTCA 
ATAATGGTCA 
ATAATGGTCA 



1178 



WO 2004/018646 



PCT/US2003/026827 



Table 89: Comparative Sequences relating to SAG1350 



msa255059.2{91_090 
msa255059 . 2 { 91_A909 
msa255059 . 2 { 91_CJB110 
msa255059.2{91_H36B 
msa255059 . 2 { 91_JM9130013 
Consensus 



ATATAAATTT GGTTTAGCAT CAGTAATTTT AGGGTCATTC ATAATGGTCA 
ATATAAATTT GGTTTAGCAT CAGTAATTTT AGGGTCATTC ATAATGGTCA 
ATATAAATTT GGTTTAGCAT CAGTAATTTT AGGGTCATTC ATAATGGTCA 
ATATAAATTT GG TTTA GCAT CAGTAA TTTT AGGGTCATTC ATAATGGTCA 
ATATAAATTT GGTTTAGCAT CAGTAATTTT AGGGTCATTC ATAATGGTCA 



msa2 55059 . 2 { 91_M732 
msa255059.2(91_M781 
• msa255059.2{91_COHl 
msa255059.2{91_18RS21 
msa25 5059 . 2 { 91_2603 
msa255059.2{91 1169NT 
msa255059 .2T91JJ90 
msa255059 . 2 { 91_A909 
msa255059 . 2 { 91 jCJBHO 
rasa255059.2{91_H36B 
msa255059 . 2 { 91_JM9130013 
Consensus 



101 

CAAGTCCTGT 
CAAGTCCTGT 
CAAGTCCTGT 
CAAGTCCTGT 
CAAGTCCTGT 
CAAGTCCTGT 
CAAGTCCTGT 
CAAGTCCTGT 
CAAGTCCTGT 
CAAGTCCTGT 
CAAGTCCTGT 



TTTTGCGGAT 
TTTTGCGGAT 
TTTTGCGGAT 
TTTTGCGGAT 
TTTTGCGGAT 
TTTTGCGGAT 
TTTTGCGGAT 
TTTTGCGGAT 
TTTTGCGGAT 
TTTTGCGGAT 
TTTTGCGGAT 



CAAACTACAT 
CAAACTACAT 
CAAACTACAT 
CAAACTACAT 
CAAACTACAT 
CAAACTACAT 
CAAACTACAT 
CAAACTACAT 
CAAACTACAT 
CAAACTACAT 
CAAACTACAT 



CGGTTCAAGT 
CGGTTCAAGT 
CGGTTCAAGT 
CGGTTCAAGT 
CGGTTCAAGT 
CGGTTCAAGT 
CGGTTCAAGT 
CGGTTCAAGT 
CGGTTCAAGT 
CGGTTCAAGT 
CGGTTCAAGT 



150 

TAATAATCAG 
TAATAATCAG 
TAATAATCAG 
TAATAATCAG 
TAATAATCAG 
TAATAATCAG 
TAATAATCAG 
TAATAATCAG 
TAATAATCAG 
TAATAATCAG 
TAATAATCAG 



msa255059.2{91_M732; 
msa255059 * 2 { 91_M781 
msa255059 . 2 { 91_COHl 
msa255059 . 2 { 91_18RS21 
msa255059 . 2 { 91__2603 
msa255059.2{91 1169NT 
msa255059.2T91_090 
ma a2 55059 . 2 { 9X_A909 
msa255059 . 2 {91_CJB110 
msa255059.2{91_H36B 
msa255059.2{91_JM9130013 
Consensus 



151 

ACAGGCACTA 
ACAGGCACTA 
ACAGGCACTA 
ACAGGCACTA 
ACAGGCACTA 
ACAGGCACTA 
ACAGGCACTA 
ACAGGCACTA 
ACAGGCACTA 
ACAGGCACTA 
ACAGGCACTA 



GTGTGGATGc 
GTGTGGATGc 
GTGTGGATGC 
GTGTGGATGC 
GTGTGGATGc 
GTGTGGATGc 
GTGTGGATGc 
GTGTGGATGc 
GTGTGGATGC 
GTGTGGATGa 
GTGTGGATGC 



TAATAATTCT 
TAATAATTCT 
TAATAATTCT 
TAATAATTCT 
TAATAATTCT 
TAATAATTCT 
TAATAATTCT 
TAATAATTCT 
TAATAATTCT 
TAATAATTCT 
TAATAATTCT 



TCCAATGAGA 
TCCAATGAGA 
TCCAATGAGA 
TCCAATGAGA 
TCCAATGAGA 
TCCAATGAGA 
TCCAATGAGA 
TCCAATGAGA 
TCCAATGAGA 
TCCAATGAGA 
TCCAATGAGA 



200 

CAAGTGCGTC 
CAAGTGCGTC 
CAAGTGCGTC 
CAAGTGCGTC 
CAAGTGCGTC 
CAAGTGCGTC 
CAAGTGCGTC 
CAAGTGCGTC 
CAAGTGCGTC 
CAAGTGCGTC 
CAAGTGCGTC 



msa255059 . 2 { 91_M732 
msa255059 . 2 f 91_M781 
msa255059 . 2 { 91_COHl 
msa255059 . 2 { 91_18RS21 
msa255059.2{91_2603 
msa255059.2{91 1169NT 
msa2 55059. 2T9 1_0 9 0 
msa255059 . 2 { 91_A909 
msa255 0 59 . 2 { 91_CJB110 
msa2S5059 . 2 { 91_H36B 
msa255059.2{91_JM9130013 
Consensus 



201 

AAGTGTGATT 
AAGTGTGATT 
AAGTGTGATT 
AAGTGTGATT 
AAGTGTGATT 
AAGTGTGATT 
AAGTGTGATT 
AAGTGTGATT 
AAGTGTGATT 
AAGTGTGATT 
AAGTGTGATT 



ACTTCCAATA 
ACTTCCAATA 
ACTTCCAATA 
ACTTCCAATA 
ACTTCCAATA 
ACTTCCAATA 
ACTTCCAATA 
ACTTCCAATA 
ACTTCCAATA 
ACTTCCAATA 
ACTTCCAATA 



ATGATAGTGT 
ATGATAGTGT 
ATGATAGTGT 
ATGATAGTGT 
ATGATAGTGT 
ATGATAGTGT 
ATGATAGTGT 
ATGATAGTGT 
ATGATAGTGT 
ATGATAGTGT 
ATGATAGTGT 



TCAAGCGTCT 
TCAAGCGTCT 
TCAAGCGTCT 
TCAAGCGTCT 
TCAAGCGTCT 
TCAAGCGTCT 
TCAAGCGTCT 
TCAAGCGTCT 
TCAAGCGTCT 
TCAAGCGTCT 
TCAAGCGTCT 



250 

GATAAAGTTG 
GATAAAGTTG 
GATAAAGTTG 
GATAAAGTTG 
GATAAAGTTG 
GATAAAGTTG 
GATAAAGTTG 
GATAAAGTTG 
GATAAAGTTG 
GATAAAGTTG 
GATAAAGTTG 



msa255059 . 2 { 91_M732 j 
msa255059.2(91_M781 
msa255059.2(91_COHl 
rasa255059 . 2 { 91_18RS21 
msa2550S9.2{91_2603 
msa255059.2{91 1169NT 
msa255059.2l91_090 
msa255059.2{91_A909 
msa255059 . 2 { 91_CJB1 10 
msa255059.2{91 H36B 
msa255059 .2{91_JM9130013 
Consensus 



251 ' 

TAAATAGTCA 
TAAATAGTCA 
TAAATAGTCA 
TAAATAGTCA 
TAAATAGTCA 
TAAATAGTCA 
TAAATAGTCA 
TAAATAGTCA 
TAAATAGTCA 
TAAATAGTCA 
TAAATAGTCA 



AAATACGGCA 
AAATACGGCA 
AAATACGGCA 
AAATACGGCA 
AAATACGGCA 
AAATACGGCA 
AAATACGGCA 
AAATACGGCA 
AAATACGGCA 
AAATACGGCA 
AAATACGGCA 



ACAAAGGACA 
ACAAAGGACA 
ACAAAGGACA 
ACAAAGGACA 
ACAAAGGACA 
ACAAAGGACA 
ACAAAGGACA 
ACAAAGGACA 
ACAAAGGACA 
ACAAAGGACA 
ACAAAGGACA 



TTACTACTCC 
TTACTACTCC 
TTACTACTCC 
TTACTACTCC 
TTACTACTCC 
TTACTACTCC 
TTACTACTCC 
TTACTACTCC 
TTACTACTCC 
TTACTACTCC 
TTACTACTCC 



300 

TTTAGTAGAG 
TTTAGTAGAG 
TTTAGTAGAG 
TTTAGTAGAG 
TTTAGTAGAG 
TTTAGTAGAG 
TTTAGTAGAG 
TTTAGTAGAG 
TTTAGTAGAG 
TTTAGTAGAG 
TTTAGTAGAG 



rasa255059.2(91_M732' 
msa255059 . 2 { 91_M78 1 
tnsa2 55059 . 2 { 91_COHl 
msa255059.2{91 18RS21 
msa2 55059 . 2 { 91_26 03 
msa255059.2{91 1169NT 
msa255059.2T91 090 
msa255059 .2 {91_A909 
msa255059.2{91 CJB110 
msa255059 . 2 { 91_H36B 
msa2 55059 . 2 { 91_JM913 0013 
Consensus 



301 

ACAAAGCCAA 
ACAAAGCCAA 
ACAAAGCCAA 
ACAAAGCCAA 
ACAAAGCCAA 
ACAAAGCCAA 
ACAAAGCCAA 
ACAAAGCCAA 
ACAAAGCCAA 
ACAAAGCCAA 
ACAAAGCCAA 



TGGTGGAAAA 
TGGTGGAAAA 
TGGTGGAAAA 
TGGTGGAAAA 
TGGTGGAAAA 
TGGTGGAAAA 
TGGTGGAAAA 
TGGTGGAAAA 
TGGTGGAAAA 
TGGTGGAAAA 
TGGTGGAAAA 



AACATTACCT 
AACATTACCT 
AACATTACCT 
AACATTACCT 
AACATTACCT 
AACATTACCT 
AACATTACCT 
AACATTACCT 
AACATTACCT 
AACATTACCT 
AACATTACCT 



GAACAAGGGA 
GAACAAGGGA 
GAACAAGGGA 
GAACAAGGGA 
GAACAAGGGA 
GAACAAGGGA 
GAACAAGGGA 
GAACAAGGGA 
GAACAAGGGA 
GAACAAGGGA 
GAACAAGGGA 



350 

ATTATGTTTA 
ATTATGTTTA 
ATTATGTTTA 
ATTATGTTTA 
ATTATGTTTA 
ATTATGTTTA 
ATTATGTTTA 
ATTATGTTTA 
ATTATGTTTA 
ATTATGTTTA 
ATTATGTTTA 



msa255059.2{91_M732 
msa255059.2{91_M781 
msa255059 . 2 { 91_COHl 
msa255059.2{91 18RS21 
msa255059.2{91 2603 



351 

TAGCAAAGAA ACCGAGGTGA AAAATACACC 
TAGCAAAGAA ACCGAGGTGA AAAATACACC 
TAGCAAAGAA ACCGAGGTGA AAAATACACC 
TAGCAAAGAA ACCGAGGTGA AAAATACACC 
TAGCAAAGAA ACCGAGGTGA AAAATACACC 



400 

TTCAAAATCA GCCCCAGTAG 
TTCAAAATCA GCCCCAGTAG 
TTCAAAATCA GCCCCAGTAG 
TTCAAAATCA GCCCCAGTAG 
TTCAAAATCA GCCCCAGTAG 
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WO 2004/018646 
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Table 89: Comparative Sequences relating to SAG1350 



msa255059.2{91 1169NT 
msa255059 . 2l91__090 
maa255059.2{91_A909 
msa2550S9.2{91 CJB110 
msa25S059.2{91 H36B 
msa2S5059 . 2 { 91_JM9130013 
Consensus 



TAGCAAAGAA 
TAGCAAAGAA 
TAGCAAAGAA 
TAGCAAAGAA 
TAGCAAAGAA 
TAGCAAAGAA 



ACCGAGGTGA 
ACCGAGGTGA 
ACCGAGGTGA 
ACCGAGGTGA 
ACCGAGGTGA 
ACCGAGGTGA 



AAAATACACC 
AAAATACACC 
AAAATACACC 
AAAATACACC 
AAAATACACC 
AAAATACACC 



TTCAAAATCA 
TTCAAAATCA 
TTCAAAATCA 
TTCAAAATCA 
TTCAAAATCA 
TTCAAAATCA 



GCCCCAGTAG 
GCCCCAGTAG 
GCCCCAGTAG 
GCCCCAGTAG 
GCCCCAGTAG 
GCCCCAGTAG 



msa255059 . 2 { 91J4732 ' 
msa255059.2{91_M7Bl 
msa2 55059 . 2 { 91_OOH1 ' 
rasa255059 .2{91_18RS21 
msa255059 . 2 { 91_2603 
msa255059.2{91 1169NT 
msa2 5 5 05 9 . 2f9 1_0 90 
msa255059.2{91_A909 
msa255059 . 2 { 91_CJB110 
msa255059 . 2 { 91_H36B 
msa2550 59 . 2 { 91_JM9 13 0013 
Consensus 



401 

CTTTCTATGC 
CTTTCTATGC 
CTTTCTATGC 
CTTTCTATGC 
CTTTCTATGC 
CTTTCTATGC 
CTTTCTATGC 
CTTTCTATGC 
CTTTCTATGC 
CTTTCTATGC 
CTTTCTATGC 



AAAGAAAGGT 
AAAGAAAGGT 
AAAGAAAGGT 
AAAGAAAGGT 
AAAGAAAGGT 
AAAGAAAGGT 
AAAGAAAGGT 
AAAGAAAGGT 
AAAGAAAGGT 
AAAGAAAGGT 
AAAGAAAGGT 



GATAAAGTTT 
GATAAAGTTT 
GATAAAGTTT 
GATAAA GTTT 
GATAAAGTTT 
GATAAAGTTT 
GATAAAGTTT 
GATAAAGTTT 
GATAAAGTTT 
GATAAA GTTT 
GATAAAGTTT 



TCTATGACCA 
TCTATGACCA 
TCTATGACCA 
TCTATGACCA 
TCTATGACCA 
TCTATGACCA 
TCTATGACCA 
TCTATGACCA 
TCTATGACCA 
TCTATGACCA 
TCTATGACCA 



450 

AGTATTTAAT 
AGTATTTAAT 
AGTATTTAAT 
AGTATTTAAT 
AGTATTTAAT 
AGTATTTAAT 
AGTATTTAAT 
AGTATTTAAT 
AGTATTTAAT 
AGTATTTAAT 
AGTATTTAAT 



msa255059 . 2 { 91_M732 
msa255059 . 2 I 91_M781 
msa255059 . 2 { 91_COHl ' 
msa2 55059 . 2 { 91_18RS21 
msa2 55059 . 2 { 9 1_2 603 
msa255059.2{91 1169NT 
msa255059 . 2T91_090 
msa255059.2{91_A909 
msa255059.2{91_CJB110 
msa255059.2{91_H36B 
xnsa255059.2{91_JM9130013 
Consensus 



451 

AAAGATAATG 
AAAGATAATG 
AAAGATAATG 
AAAGATAATG 
AAAGATAATG 
AAAGATAATG 
AAAGATAATG 
AAAGATAATG 
AAAGATAATG 
AAAGATAATG 
AAAGATAATG 
********** 



TgAAATGGAT 
TgAAATGGAT 
TtAAATGGAT 
TgAAATGGAT 
TgAAATGGAT 
TgAAATGGAT 
TgAAATGGAT 
TgAAATGGAT 
TgAAATGGAT 
TgAAATGGAT 
TgAAATGGAT 
*.******** 



TTCATATAAG 
TTCATATAAG 
TTCATATAAG 
TTCATATAAG 
TTCATATAAG 
TTCATATAAG 
TTCATATAAG 
TTCATATAAG 
TTCATATAAG 
TTCATATAAG 
TTCATATAAG- 
********** 



TCTTTTgGTG 
TCTTTTgGTG 
TCTTTTgGTG 
TCTTTTtGTG 
TCTTTTtGTG 
TCTTTTgGTG 
TCTTTTtGTG 
TCTTTTtGTG 
TCTTTTtGTG 
TCTTTTtGTG 
TCTTTTtGTG 
******.*** 



500 

G CGTACGTCG 
GCGTACGTCG 
GCGTACGTCG 
GCGTACGTCG 
GCGTACGTCG 
GCGTACGTCG 
GCGTACGTCG 
GCGTACGTCG 
GCGTACGTCG 
GCGTACGTCG 
GCGTACGTCG 
********** 



msa255059 . 2 { 91_M732 
msa255059.2<91_M781 
msa2 5 50 59 . 2 { 9 1_00H1 ' 
msa255059 . 2 { 91_18RS21 
msa255059 . 2 { 91_2603 
msa255059.2{91 1169NT 
msa255059.2T91_090 
msa255059 . 2 { 91_A909 
msa255059.2{91 CJB110 
msa255059.2{91_H36B 
msa255059 . 2 { 91_JM913 0013 
Consensus 



501 

ATACGCAGCT 
ATACGCAGCT 
ATACGCAGCT 
ATACGCAGCT 
ATACGCAGCT 
ATACGCAGCT 
ATACGCAGCT 
ATACGCAGCT 
ATACGCAGCT 
ATACGCAGCT 
ATACGCAGCT 



ATTGAGTCAC 
ATTGAGTCAC 
ATTGAGTCAC 
ATTGAGTCAC 
ATTGAGTCAC 
ATTGAGTCAC 
ATTGAGTCAC 
ATTGAGTCAC 
ATTGAGTCAC 
ATTGAGTCAC 
ATTGAGTCAC 



TAGATCCATC 
TAGATCCATC 
TAGATCCATC 
TAGATCCATC 
TAGATCCATC 
TAGATCCATC 
TAGATCCATC 
TAGATCCATC 
TAGATCCATC 
TAGATCCATC 
TAGATCCATC 



AGGAGGTTCA 
AGGAGGTTCA 
AGGAGGTTCA 
AGGAGGTTCA 
AGGAGGTTCA 
AGGAGGTTCA 
AGGAGGTTCA 
AGGAGGTTCA 
AGGAGGTTCA 
AGGAGGTTCA 
AGGAGGTTCA 



550 

GAGACTAAAG 
GAGACTAAAG 
GAGACTAAAG 
GAGACTAAAG 
GAGACTAAAG 
GAGACTAAAG 
GAGACTAAAG 
GAGACTAAAG 
GAGACTAAAG 
GAGACTAAAG 
GAGACTAAAG 



tnsa255059 . 2 { 91_M732 
msa255059.2(91 M781 
msa2 55059 . 2 { 91~COHl 
msa255059 . 2 { 91_18RS21 
msa255059.2{91 2603 
msa255059.2{91 116 9 NT 
msa255059.2T9X 090 
msa255059.2{91_A909 
msa255059.2{91_CJB110 
msa255059 . 2 { 91_H36B 
msa255059.2{91_JM9130013 
" Consensus 



551 

CACCTACTCC 
CACCTACTCC 
CACCTACTCC 
CACCTACTCC 
CACCTACTCC 
CACCTACTCC 
CACCTACTCC 
CACCTACTCC 
CACCTACTCC 
CACCTACTCC 
CACCTACTCC 



TGTAACAAAT 
TGTAACAAAT 
TGTAACAAAT 
TGTAACAAAT 
TGTAACAAAT 
TGTAACAAAT 
TGTAACAAAT 
TGTAACAAAT 
TGTAACAAAT 
TGTAACAAAT 
TGTAACAAAT 



TCAGGAAGCA 
TCAGGAAGCA 
TCAGGAAGCA 
TCAGGAAGCA 
TCAGGAAGCA 
TCAGGAAGCA 
TCAGGAAGCA 
TCAGGAAGCA 
TCAGGAAGCA 
TCAGGAAGCA 
TCAGGAAGCA 



ATAATCAAGA 
ATAATCAAGA 
ATAATCAAGA 
ATAATCAAGA 
ATAATCAAGA 
ATAATCAAGA 
ATAATCAAGA 
ATAATCAAGA 
ATAATCAAGA 
ATAATCAAGA 
ATAATCAAGA 



600 

GAAAATAGCA 
GAAAATAGCA 
GAAAATAGCA 
GAAAATAGCA 
GAAAATAGCA 
GAAAATAGCA 
GAAAATAGCA 
GAAAATAGCA 
GAAAATAGCA 
GAAAATAGCA 
GAAAATAGCA 



msa2S5059.2(91 M732 ( 
msa255059.2{91_M781 
msa255059.2{91_COHl' 
rasa255059.2{91_18RS21 
msa255059.2{91_2603 
msa255059.2{91 1169NT 
msa255059 . 2l91_090 
msa255059 . 2 { 91_A909 
msa255059 . 2 { 91_CJB110 
msa255059 . 2 { 91_H36B 
msa255059.2{91_JM9130013 
Consensus 



601 

ACGCAAGGAA 
ACGCAAGGAA 
ACGCAAGGAA 
ACGCAAGGAA 
ACGCAAGGAA 
ACGCAAGGAA 
ACGCAAGGAA 
ACGCAAGGAA 
ACGCAAGGAA 
ACGCAAGGAA 
ACGCAAGGAA 



ATTATACATT 
ATTATACATT 
ATTATACATT 
ATTATACATT 
ATTATACATT 
ATTATACATT 
ATTATACATT 
ATTATACATT 
ATTATACATT 
ATTATACATT 
ATTATACATT 



TTCACATAAA 
TTCACATAAA 
TTCACATAAA 
TTCACATAAA 
TTCACATAAA 
TTCACATAAA 
TTCACATAAA 
TTCACATAAA 
TTCACATAAA 
TTCACATAAA 
TTCACATAAA 



GTAGAAGTAA 
GTAGAAGTAA 
GTAGAAGTAA 
GTAGAAGTAA 
GTAGAAGTAA 
GTAGAAGTAA 
GTAGAAGTAA 
GTAGAAGTAA 
GTAGAAGTAA 
GTAGAAGTAA 
GTAGAAGTAA 



650 

AAAATGAAGC 
AAAATGAAGC 
AAAATGAAGC 
AAAATGAAGC 
AAAATGAAGC 
AAAATGAAGC 
AAAATGAAGC 
AAAATGAAGC 
AAAATGAAGC 
AAAATGAAGC 
AAAATGAAGC 



maa2 55059 . 2 f 91_M7 32 ) 
msa2 550 59 . 2 { 9 1_M7 8 1 > 
msa2S50S9 . 2 { 91_COHl J 
msa255059 . 2 { 91_18RS21 ) 



651 700 
TAAGGTAGCG AGTCCAACTC AATTTACATT GGACAAAGGA GACAGAATTT 
TAAGGTAGCG AGTCCAACTC AATTTACATT GGACAAAGGA GACAGAATTT 
TAAGGTAGCG AGTCCAACTC AATTTACATT GGACAAAGGA GACAGAATTT 
TAAGGTAGCG AGTCCAACTC AATTTACATT GGACAAAGGA GACAGAATTT 



1180 
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PCT/US2003/026827 



Table 89: Comparative Sequences relating to SAG1350 



msa255059 . 2 { 91_2603 } 
msa255059.2{91 1169NT) 
msa255059 . 2T91_090 } 
msa255059.2{91_A909} 
msa255059 .2{ 91_CJB110) 
msa255059.2{91_H36B} 
msa2550S9 . 2 { 91_JM9130013 } 
Consensus 



TAAGGTAGCG 
TAAGGTAGCG 
TAAGGTAGCG 
TAAGGTAGCG 
TAAGGTAGCG 
TAAGGTAGCG 
TAAGGTAGCG 



AGTCCAACTC 
AGTCCAACTC 
AGTCCAACTC 
AGTCCAACTC 
AGTCCAACTC 
AGTCCAACTC 
AGTCCAACTC 



AATTTACATT 
AATTTACATT 
AATTTACATT 
AATTTACATT 
AATTTACATT 
AATTTACATT 
AATTTACATT 



GGACAAAGGA 
GGACAAAGGA 
GGACAAAGGA 
GGACAAAGGA 
GGACAAAGGA 
GGACAAAGGA 
GGACAAAGGA 



GACAGAATTT 
GACAGAATTT 
GACAGAATTT 
GACAGAATTT 
GACAGAATTT 
GACAGAATTT 
GACAGAATTT 



msa255059 . 2 { 91J4732 
msa255059.2{91_M781 
msa255059.2{91_COHl 
msa255059 . 2 { 91_18RS21 
msa255059 . 2 { 91_2603 
msa255059.2{91 1169NT 
msa2 55059 .2j91__090 
msa255059 . 2 { 91_A909 
rasa255059 .2 { 91_CJB110 
rasa255059.2{91_H36B 
tnsa25S059 . 2 { 9WM9130013 
Consensus 



701 

TTTACGACCA 
TTTACGACCA 
TTTACGACCA 
TTTACGACCA 
TTTACGACCA 
TTTACGACCA 
TTTACGACCA 
TTTACGACCA 
TTTACGACCA 
TTTACGACCA 
TTTACGACCA 



AATACTAACT 
AATACTAACT 
AATACTAACT 
AATACTAACT 
AATACTAACT 
AATACTAACT 
AATACTAACT 
AATACTAACT 
AATACTAACT 
AATACTAACT 
AATACTAACT 



ATTGAAGGAA 
ATTGAAGGAA 
ATTGAAGGAA 
ATTGAAGGAA 
ATTGAAGGAA 
ATTGAAGGAA 
ATTGAAGGAA 
ATTGAAGGAA 
ATTGAAGGAA 
ATTGAAGGAA 
ATTGAAGGAA 



ATCAGTGGTT 
ATCAGTGGTT 
ATCAGTGGTT 
ATCAGTGGTT 
ATCAGTGGTT 
ATCAGTGGTT 
ATCAGTGGTT 
ATCAGTGGTT 
ATCAGTGGTT 
ATCAGTGGTT 
ATCAGTGGTT 



750 

ATCTTATAAA 
ATCTTATAAA 
ATCTTATAAA 
ATCTTATAAA 
ATCTTATAAA 
ATCTTATAAA 
ATCTTATAAA 
ATCTTATAAA 
ATCTTATAAA 
ATCTTATAAA 
ATCTTATAAA 



msa2 5 50 59 . 2 { 9 1_M7 32 
tnsa255059 . 2? 91_M781 
msa2 5 5059 . 2 { 91_C0H1 
msa255059 . 2 { 91_18RS21 
msa2 55059 . 2 { 91_26 03 
rasa255059.2{91 1169NT 
msa2 55059 .2l91_090 
tnsa255059 . 2 { 91_A909 
msa255059 . 2 { 91_CJB110 
tlisa255059 . 2 { 91_H36B 
msa255059*2{91_JM9130013 
Consensus 



751 

TCATTCAATG 
TCATTCAATG 
TCATTCAATG 
TCATTCAATG 
TCATTCAATG 
TCATTCAATG 
TCATTCAATG 
TCATTCAATG 
TCATTCAATG 
TCATTCAATG 
TCATTCAATG 



GTGTTCGTCG 
GTGTTCGTCG 
GTGTTCGTCG 
GTGTTCGTCG 
GTGTTCGTCG 
GTGTTCGTCG 
GTGTTCGTCG 
GTGTTCGTCG 
GTGTTCGTCG 
GTGTTCGTCG 



TTTTGTTTTG 
TTTTGTTTTG 
TTTTGTTTTG 
TTTTGTTTTG 
TTTTGTTTTG 
TTTTGTTTTG 
TTTTGTTTTG 
TTTTGTTTTG 
TTTTGTTTTG 
TTTTGTTTTG 
TTTTGTTTTG 



CTAGGTAAAG 
CTAGGTAAAG 
CTAGGTAAAG 
CTAGGTAAAG 
CTAGGTAAAG 
CTAGGTAAAG 
CTAGGTAAAG 
CTAGGTAAAG 
CTAGGTAAAG 
CTAGGTAAAG 
CTAGGTAAAG 



800 

CATCTTCAGT 
CATCTTCAGT 
CATCTTCAGT 
CATCTTCAGT 
CATCTTCAGT 
CATCTTCAGT 
CATCTTCAGT 
CATCTTCAGT 
CATCTTCAGT 
CATCTTCAGT 
CATCTTCAGT 



msa255059 . 2 { 91J4732 ' 
msa255059 . 2 { 91_M781 ' 
msa255059 . 2 { 91_COHl ' 
msa255059 . 2 { 91JLBRS21 
msa255059 . 2 { 91_2603 
msa255059.2{91 1169NT 
msa255059 .2X91_090 
msa255059 . 2 { 91_A909 
rasa255059 .2 { 91_CJB110 
msa2 5 505 9 . 2 { 91_H3 6B 
msa2 55059 . 2 { 91_JM9130013 
Consensus 



801 

AGAAAAAACT 
AGAAAAAACT 
AGAAAAAACT 
AGAAAAAACT 
AGAAAAAACT 
AGAAAAAACT 
AGAAAAAACT 
AGAAAAAACT 
AGAAAAAACT 
AGAAAAAACT 
AGAAAAAACT 



GAAGATAAAG 
GAAGATAAAG 
GAAGATAAAG 
GAAGATAAAG 
GAAGATAAAG 
GAAGATAAAG 
GAAGATAAAG 
GAAGATAAAG 
GAAGATAAAG 
GAAGATAAAG 
GAAGATAAAG 



AAAAAGTGTC 
AAAAAGTGTC 
AAAAAGTGTC 
AAAAAGTGTC 
AAAAAGTGTC 
AAAAAGTGTC 
AAAAAGTGTC 
AAAAAGTGTC 
AAAAAGTGTC 
AAAAAGTGTC 
AAAAAGTGTC 



TCCTCAACCA 
TCCTCAACCA 
TCCTCAACCA 
TCCTCAACCA 
TCCTCAACCA 
TCCTCAACCA 
TCCTCAACCA 
TCCTCAACCA 
TCCTCAACCA 
TCCTCAACCA 
TCCTCAACCA 



850 

CAAGCCCGTA 
CAAGCCCGTA 
CAAGCCCGTA 
CAAGCCCGTA 
CAAGCCCGTA 
CAAGCCCGTA 
CAAGCCCGTA 
CAAGCCCGTA 
CAAGCCCGTA 
CAAGCCCGTA 
CAAGCCCGTA 



msa255059 . 2 { 91_M732 
msa255059 . 2( 91_M781 
msa255059 . 2 { 91_C0H1 
msa255059.2{91 18RS21 
insa255059.2{91 2603 
msa255059.2{91 116 9 NT 
msa255059.2T91_090 
msa2 55059 . 2 { 91_A909 
msa255059 . 2 { 91_CJB110 
rasa255059 . 2 { 91_H36B 
tnsa255059 . 2{91_JM9130013 
Consensus 



851 

TTACTAAAAC 
TTACTAAAAC 
TTACTAAAAC 
TTACTAAAAC 
TTACTAAAAC 
TTACTAAAAC 
TTACTAAAAC 
TTACTAAAAC 
TTACTAAAAC 
TTACTAAAAC 
TTACTAAAAC 



TGGTAGACTG 
TGGTAGACTG 
TGGTAGACTG 
TGGTAGACTG 
TGGTAGACTG 
TGGTAGACTG 
TGGTAGACTG 
TGGTAGACTG 
TGGTAGACTG 
TGGTAGACTG 
TGGTAGACTG 



ACTATTTcTA 
ACTATTTCTA 
ACTATTTcTA 
ACTATTTcTA 
ACTATTTcTA 
ACTATTTcTA 
ACTATTTcTA 
ACTATTTcTA 
ACTATTTcTA 
ACTATTTcTA 
ACTATTTaTA 



ACGAAACAAC 
ACGAAACAAC 
ACGAAACAAC 
ACGAAACAAC 
ACGAAACAAC 
ACGAAACAAC 
ACGAAACAAC 
ACGAAACAAC 
ACGAAACAAC 
ACGAAACAAC 
ACGAAACAAC 



900 

TACAGGTTTT 
TACAGGTTTT 
TACAGGTTTT 
TACAGGTTTT 
TACAGGTTTT 
TACAGGTTTT 
TACAGGTTTT 
TACAGGTTTT 
TACAGGTTTT 
TACAGGTTTT 
TACAGGTTTT 



msa255059 . 2 f 91_M732 ! 
msa255059 . 2 {91_M781 
msa255059 . 2 { 91__C0H1 
msa2 55059 .2 { 91_18RS21 
msa255059 . 2 { 91_2603 
msa255059.2{91 1169NT 
msa255059.2X91_090 
msa255059 . 2 { 91_A909 
msa255059 . 2 { 91_CJB110 
msa2S5059 . 2 { 91JH36B 
msa255059 . 2 { 91_JM9130013 
Consensus 



901 

GATATTTTAA 
GATATTTTAA 
GATATTTTAA 
GATATTTTAA 
GATATTTTAA 
GATATTTTAA 
GATATTTTAA 
GATATTTTAA 
GATATTTTAA 
GATATTTTAA 
GATATTTTAA 



TTACGAATAT 
TTACGAATAT 
TTACGAATAT 
TTACGAATAT 
TTACGAATAT 
TTACGAATAT 
TTACGAATAT 
TTACGAATAT 
TTACGAATAT 
TTACGAATAT 
TTACGAATAT 



TAAAGATGAT 
TAAAGATGAT 
TAAAGATGAT 
TAAAGATGAT 
TAAAGATGAT 
TAAAGATGAT 
TAAAGATGAT 
TAAAGATGAT 
TAAAGATGAT 
TAAAGATGAT 
TAAAGATGAT 



AACGGTATCG 
AACGGTATCG 
AACGGTATCG 
AACGGTATCG 
AACGGTATCG 
AACGGTATCG 
AACGGTATCG 
AACGGTATCG 
AACGGTATCG 
AACGGTATCG 
AACGGTATCG 



950 

CTGCTGTTAA 
CTGCTGTTAA 
CTGCTGTTAA 
CTGCTGTTAA 
CTGCTGTTAA 
CTGCTGTTAA 
CTGCTGTTAA 
CTGCTGTTAA 
CTGCTGTTAA 
CTGCTGTTAA 
CTGCTGTTAA 



msa255059.2f 91 M732 
msa255059 . 2 ( 91_M781 
msa255059.2{91 COH1 



951 1000 
GGTACCGGTT TGOACTGAAC AAGGAGGGCA AGATGATATT AAATGGTATA 
GGTACCGGTT TGOACTGAAC AAGGAGGGCA AGATGATATT AAATGGTATA 
GGTACCGGTT TGOACTGAAC AAGGAGGGCA AGATGATATT AAATGGTATA 



1181 



WO 2004/018646 



PCT/US2003/026827 



Table 89: Comparative Sequences relating to SAG1350 



msa255059 . 2 { 91JL8RS21 ] 
msa255059.2{9X_2603 ( 
msa255059.2{91 1169NT 
maa255059 . 2{91_090 
msa255059 . 2 { 91_A909 
msa255059 . 2 { 91_CJB110 
maa255059.2{91 R36B 
msa25S059.2{91_JM9130013 
Consensus 



GGTACCGGTT 
GGTACCGGTT 
GGTACCGGTT 
GGTACCGGTT 
GGTACCGGTT 
GGTACCGGTT 
GGTACCGGTT 
GGTACCGGTT 



TGGACTGAAC 
TGGACTGAAC 
TGGACTGAAC 
TGGACTGAAC 
TGGACTGAAC 
TGGACTGAAC 
TGGACTGAAC 
TGGACTGAAC 



AAGGAGGGCA 
AAGGAGGGCA 
AAGGAGGGCA 
AAGGAGGGCA 
AAGGAGGGCA 
AAGGAGGGCA 
AAGGAGGGCA 
AAGGAGGGCA 



AGATGATATT 
AGATGATATT 
AGATGATATT 
AGATGATATT 
AGATGATATT 
AGATGATATT 
AGATGATATT 
AGATGATATT 



AAATGGTATA 
AAATGGTATA 
AAATGGTATA 
AAATGGTATA 
AAATGGTATA 
AAATGGTATA 
AAATGGTATA 
AAATGGTATA 



msa255059.2f 91_M732j 
msa255059.2f91_M781 
msa255059.2{91_COHl] 
msa255059 . 2 { 91_18RS21 
msa2 5^059 . 2 { 91_2603 
rasa255059.2{91 1169NT 
rasa255059.2T91_090 
msa255059 . 2 { 91_A909 
rasa255059 . 2 { 91_CJB110 
msa2550S9 . 2 { 91_H36B 
msa255059 . 2 { 91_0M9130013 
Consensus 



1001 

CAGCTGTAAC 
CAGCTGTAAC 
CAGCTGTAAC 
CAGCTGTAAC 
CAGCTGTAAC 
CAGCTGTAAC 
CAGCTGTAAC 
CAGCTGTAAC 
CAGCTGTAAC 
CAGCTGTAAC 
CAGCTGTAAC 



TACTGGGGAT 
TACTGGGGAT 
TACTGGGGAT 
TACTGGGGAT 
TACTGGGGAT 
TACTGGGGAT 
TACTGGGGAT 
TACTGGGGAT 
TACTGGGGAT 
TACTGGGGAT 
TACTGGGGAT 



GGCAACTACA 
GGCAACTACA 
GGCAACTACA 
GGCAACTACA 
GGCAACTACA 
GGCAACTACA 
GGCAACTACA 
GGCAACTACA 
GGCAACTACA 
GGCAACTACA 
GGCAACTACA 



AAGTAGCTGT 
AAGTAGCTGT 
AAGTAGCTGT 
AAGTAGCTGT 
AAGTAGCTGT 
AAGTAGCTGT 
AAGTAGCTGT 
AAGTAGCTGT 
AAGTAGCTGT 
AAGTAGCTGT 
AAGTAGCTGT 



1050 
ATCATTTGCT 
ATCATTTGCT 
ATCATTTGCT 
ATCATTTGCT 
ATCATTTGCT 
ATCATTTGCT 
ATCATTTGCT 
ATCATTTGCT 
ATCATTTGCT 
ATCATTTGCT 
ATCATTTGCT 



msa255059.2(91 M732 
msa255059.2(9l"M78l' 
msa2 55059 . 2 { 91_COHl 
rasa2550S9 . 2 { 91_18RS21 
msa255059 . 2 { 91_2603 
msa255059.2{91 1169NT 
msa255059 . 2l91_090 
msa255059.2{91_A909 
msa2550S9 . 2 { 91_CJB110 
mfla255059 . 2 { 91 JK36B 
msa255059 . 2 { 91 _JM9130013 
Consensus 



1051 

GACCATAAGA 
GACCATAAGA 
GACCATAAGA 
GACCATAAGA 
GACCATAAGA 
GACCATAAGA 
GACCATAAGA 
GACCATAAGA 
GACCATAAGA 
GACCATAAGA 
GACCATAAGA 



ATGAGAAGGG 
ATGAGAAGGG 
ATGAGAAGGG 
ATGAGAAGGG 
ATGAGAAGGG 
ATGAGAAGGG 
ATGAGAAGGG 
ATGAGAAGGG 
ATGAGAAGGG 
ATGAGAAGGG 
ATGAGAAGGG 



TCTTTATAAT 
TCTTTATAAT 
TCTTTATAAT 
TCTTTATAAT 
TCTTTATAAT 
TCTTTATAAT 
TCTTTATAAT 
TCTTTATAAT 
TCTTTATAAT 
TCTTTATAAT 
TCTTTATAAT 



ATTCATTTAT 
ATTCATTTAT 
ATTCATTTAT 
ATTCATTTAT 
ATTCATTTAT 
ATTCATTTAT 
ATTCATTTAT 
ATTCATTTAT 
ATTCATTTAT 
ATTCATTTAT 
ATTCATTTAT 



1100 
ACTACCAAGA 
ACTACCAAGA 
ACTACCAAGA 
ACTACCAAGA 
ACTACCAAGA 
ACTACCAAGA 
ACTACCAAGA 
ACTACCAAGA 
ACTACCAAGA 
ACTACCAAGA 
ACTACCAAGA 



msa255059.2{91_M732 
rasa255059 . 2 ( 91J4781 
msa255059 . 2 { 91_COHl 
rasa255059 . 2 { 91_18RS21 
msa255059 . 2 { 91__2603 
msa255059.2{91 1169NT 
msa255059.2T91_090 
msa255059 . 2 { 91_A909 
msa255059 . 2 { 91_CJB110 
msa255059 . 2 { 91_H36B 
msa255059 . 2 { 91_JM9130013 
Consensus 



1101 . 

AGCTAGTGGG 
AGCTAGTGGG 
AGCTAGTGGG 
AGCTAGTGGG 
AGCTAGTGGG 
AGCTAGTGGG 
AGCTAGTGGG 
AGCTAGTGGG 
AGCTAGTGGG 
AGCTAGTGGG 
AGCTAGTGGG 



ACACTTGTAG 
ACACTTGTAG 
ACACTTGTAG 
ACACTTGTAG 
ACACrTGTAG 
ACACTTGTAG 
ACACTTGTAG 
ACACTTGTAG 
ACACTTGTAG 
ACACTTGTAG 
ACACTTGTAG 



GTGTAACAGG 
GTGTAACAGG 
GTGTAACAGG 
GTGTAACAGG 
GTGTAACAGG 
GTGTAACAGG 
GTGTAACAGG 
GTGTAACAGG 
GTGTAACAGG 
GTGTAACAGG 
GTGTAACAGG 



AACTAAAGTG 
AACTAAAGTG 
AACTAAAGTG 
AACTAAAGTG 
AACTAAAGTG 
AACTAAAGTG 
AACTAAAGTG 
AACTAAAGTG 
AACTAAAGTG 
AACTAAAGTG 
AACTAAAGTG 



1150 
ACAGTAGCTG 
ACAGTAGCTG 
ACAGTAGCTG 
ACAGTAGCTG 
ACAGTAGCTG 
ACAGTAGCTG 
ACAGTAGCTG 
ACAGTAGCTG 
ACAGTAGCTG 
ACAGTAGCTG 
ACAGTAGCTG 



rasa255059.2(91_M732; 
msa255059 . 2 f 91_M781 
msa255059 . 2{ 91_COHl ( 
msa255059 . 2 { 91_18RS21 
tnsa255059.2{91_2603 
msa255059.2{91 1169NT 
msa255059 ,2l91_090 
msa255059.2(91 A909 
msa255059.2{91_CJB110 
msa255059 . 2 { 91_H36B 
insa255059 . 2 { 91_JM9130013 
Consensus 



1151 

GAACTAATTC 
GAACTAATTC 
GAACTAATTC 
GAACTAATTC 
GAACTAATTC 
GAACTAATTC 
GAACTAATTC 
GAACTAATTC 
GAACTAATTC 
GAACTAATTC 
GAACTAATTC 



TTCTCAAGAA 
TTCTCAAGAA 
TTCTCAAGAA 
TTCTCAAGAA 
TTCTCAAGAA 
TTCTCAAGAA 
TTCTCAAGAA 
TTCTCAAGAA 
TTCTCAAGAA 
TTCTCAAGAA 
TTCTCAAGAA 



CCTATTGAAA 
CCTATTGAAA 
CCTATTGAAA 
CCTATTGAAA 
CCTATTGAAA 
CCTATTGAAA 
CCTATTGAAA 
CCTATTGAAA 
CCTATTGAAA 
CCTATTGAAA 
CCTATTGAAA 



ATGGTTTAcC 
ATGGTTTAcC 
ATGGTTTAcC 
ATGGTTTAgC 
ATGGTTTAgC 
ATG GTTTA gC 
ATGGTTTAgC 
ATGGTTTAgC 
ATGGTTTAgC 
ATGGTTTAgC 
ATGGTTTAgC 



1200 
AAAGACTGGT 
AAAGACTGGT 
AAAGACTGGT 
AAAGACTGGT 
AAAGACTGGT 
AAAGACTGGT 
AAAGACTGGT 
AAAGACTGGT 
AAAGACTGGT 
AAAGACTGGT 
AAAGACTGGT 



msa255059.2{91_M732; 
ma a25S 0 59 . 2 { 9 1_M7 8 1 ( 
msa255059 . 2 { 91_C0H1 
rasa255059 . 2 { 91_18RS21 
maa255059 . 2 { 91_2603 
msa255059.2{91 1169NT 
msa255059.2T91_090 
ma a2 5 S 0 5 9 . 2 { 9 1_A9 0 9 
msa255059 . 2 { 91 JCJB110 
rasa255059.2{91_H36B 
rasa255059 . 2 { 91_JM9130013 
Consensus 



1201 

GTTTATAATA 
GTTTATAATA 
GTTTATAATA 
GTTTATAATA 
GTTTATAATA 
GTTTATAATA 
GTTTATAATA 
GTTTATAATA 
GTTTATAATA 
GTTTATAATA 
GTTTATAATA 



TTATCGGAAG 
TTATCGGAAG 
TTATCGGAAG 
TTATCGGAAG 
TTATCGGAAG 
TTATCGGAAG 
TTATCGGAAG 
TTATCGGAAG 
TTATCGGAAG 
TTATCGGAAG 
TTATCGGAAG 



TACTGAAGTA 
TACTGAAGTA 
TACTGAAGTA 
TACTGAAGTA 
TACTGAAGTA 
TACTGAAGTA 
TACTGAAGTA 
TACTGAAGTA 
TACTGAAGTA 
TACTGAAGTA 
TACTGAAGTA 



AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 
AAAAATGAAG 



1250 
CTAAAATATC 
CTAAAATATC 
CTAAAATATC 
CTAAAATATC 
CTAAAATATC 
CTAAAATATC 
CTAAAATATC 
CTAAAATATC 
CTAAAATATC 
CTAAAATATC 
CTAAAATATC 



msa2 55059 . 2 { 91_M732 J 
ra8a255059.2{91_M78l} 



1251 1300 
AAGTCAGACC CAATTTACTT TAGAAAAAGG TGACAAAATA AATTATGATC 
AAGTCAGACC CAATTTACTT TAGAAAAAGG TGACAAAATA AATTATGATC 



1182 



WO 2004/018646 



PCTYUS2003/026827 



Table 89: Comparative Sequences relating to SAG1350 



msa255059.2{91 OOHlj 
raBa255059 . 2 { 91_18RS21 
msa255059 . 2 { 91_2603 
msa255059.2{91 1169NT 
msa255059.2l91_090 
msa255059 . 2 { 91_A909 
maa255059.2{91_CJB110 
msa2S5059.2{91_H36B 
msa255059.2{91_JM9130O13 
Consensus 



AAGTCAGACC 
AAGTCAGACC 
AAGTCAGACC 
AAGTCAGACC 
AAGTCAGACC 
AAGTCAGACC 
AAGTCAGACC 
AAGTCAGACC 
AAGTCAGACC 



CAATTTACTT 
CAATTTACTT 
CAATTTACTT 
CAATTTACTT 
CAATTTACTT 
CAATTTACTT 
CAATTTACTT 
CAATTTACTT 
CAATTTACTT 



********** ********** 



TAGAAAAAGG 
TAGAAAAAGG 
TAGAAAAAGG 
TAGAAAAAGG 
TAGAAAAAGG 
TAGAAAAAGG 
TAGAAAAAGG 
TAGAAAAAGG 
TAGAAAAAGG 
********** 



TGACAAAATA 
TGACAAAATA 
TGACAAAATA 
TGACAAAATA 
TGACAAAATA 
TGACAAAATA 
TGACAAAATA 
TGACAAAATA 
TGACAAAATA 



AATTATGATC 
AATTATGATC 
AATTATGATC 
AATTATGATC 
AATTATGATC 
AATTATGATC 
AATTATGATC 
AATTATGATC 
AATTATGATC 



********** ********** 



msa255059.2{91_M732 
msa255059 . 2 { 91J4781 
msa255059 . 2 { 91_COHl 
msa255059.2{91_18RS21 
msa255059 . 2 { 91_2603 
msa255059.2{91 1169NT 
rasa255059 . 2l91_090 
msa25S059 . 2 {91_A909 
msa255059 . 2 { 91_CJBX10 
tnsa255059 . 2 { 91_H36B 
msa2S5059.2{91_JM9130013 
Consensus 



1301 

AAGTATTGAC 
AAGTATTGAC 
AAGTATTGAC 
AAGTATTGAC 
AAGTATTGAC 
AAGTATTGAC 
AAGTATTGAC 
AAGTATTGAC 
AAGTATTGAC 
AAGTATTGAC 
AAGTATTGAC 



AGCAGATGGT 
AGCAGATGGT 
AGCAGATGGT 
AGCAGATGGT 
AGCAGATGGT 
AGCAGATGGT 
AGCAGATGGT 
AGCAGATGGT 
AGCAGATGGT 
AGCAGATGGT 
AGCAGATGGT 



TACCAGTGGA 
TACCAGTGGA 
TACCAGTGGA 
TACCAGTGGA 
TACCAGTGGA 
TACCAGTGGA 
TACCAGTGGA 
TACCAGTGGA 
TACCAGTGGA 
TACCAGTGGA 
TACCAGTGGA 



TTTCTTACAA 
TTTCTTACAA 
TTTCTTACAA 
TTTCTTACAA 
TTTCTTACAA 
TTTCTTACAA 
TTTCTTACAA 
TTTCTTACAA 
TTTCTTACAA 
TTTCTTACAA 
TTTCTTACAA 



13S0 
ATCTTATAGT 
ATCTTATAGT 
ATCTTATAGT 
ATCTTATAGT 
ATCTTATAGT 
ATCTTATAGT 
ATCTTATAGT 
ATCTTATAGT 
ATCTTATAGT 
ATCTTATAGT 
ATCTTATAGT 



msa255059.2(91_M732 
msa255059 . 2 { 91_M781 
msa255059.2{91_COHl 
msa255059 . 2 { 91_18RS21 
msa2 55059 . 2 { 91_2603 
msa255059.2{91 1169NT 
msa255059 . 2l91_090 
msa2 55059 . 2 { 91_A909 
msa25S059 . 2 { 91_CJB110 
msa2 55059 . 2 { 91_H36B 
rasa255059.2{91jJM9130013 
Consensus 



1351 

GGTGTTCGTC 
GGTGTTCGTC 
GGTGTTCGTC 
GGTGTTCGTC 
GGTGTTCGTC 
GGTGTTCGTC 
GGTGTTCGTC 
GGTGTTCGTC 
GGTGTTCGTC 
GGTGTTCGTC 
GGTGTTCGTC 



GCTATATTCC 
GCTATATTCC 
GCTATATTCC 
GCTATATTCC 
GCTATATTCC 
GCTATATTCC 
GCTATATTCC 
GCTATATTCC 
GCTATATTCC 
GCTATATTCC 
GCTATATTCC 



TGTGAAAAAG 
TGTGAAAAAG 
TGTGAAAAAG 
TGTGAAAAAG 
TGTGAAAAAG 
TGTGAAAAAG 
TGTGAAAAAG 
TGTGAAAAAG 
TGTGAAAAAG 
TGTGAAAAAG 
TGTGAAAAAG 



CTAACTACAA 
CTAACTACAA 
CTAACTACAA 
CTAACTACAA 
CTAACTACAA 
CTAACTACAA 
CTAACTACAA 
CTAACTACAA 
CTAACTACAA 
CTAACTACAA 
CTAACTACAA 



1400 
GTAGTGAAAA 
GTAGTGAAAA 
GTAGTGAAAA 
GTAGTGAAAA 
GTAGTGAAAA 
GTAGTGAAAA 
GTAGTGAAAA 
GTAGTGAAAA 
GTAGTGAAAA 
GTAGTGAAAA 
GTAGTGAAAA 



msa255059 . 2 f 91J4732 \ 
msa2 55059 . 2 { 91_M781 
ms a2 550 5 9 . 2 { 9 l_COHl 1 
msa255059 . 2 { 91_18RS21 
ttisa2550S9 . 2 { 91_2603 
msa255059.2{91 1169NT 
msa255059 .2T91_090 
msa2 55059 . 2 { 91_A909 
msa255059.2{91_CJB110 
msa2 55059 . 2 { 91_H36B 
msa255059 . 2 { 91_JM9130013 
Consensus 



msa255059 . 2 { 91_M732 ] 
msa255059.2(91_M78l' 
msa2 55059 . 2 { 91_C0H1 
tnsa255059.2{91 18RS21 
msa255059 . 2 { 91_2603 
rasa2S5059.2{91 1169NT 
msa255059 . 2X91_090 
iRSa255059.2{91 A9X)9 
rasa255059 . 2 { 91_CJB110 
msa255059 . 2 { 91_H36B 
msa255059.2{91_JM9130013 
Consensus 



1401 

AGCGAAAGAT 
AGCGAAAGAT 
AGCGAAAGAT 
AGCGAAAGAT 
AGCGAAAGAT 
AGCGAAAGAT 
AGCGAAAGAT 
AGCGAAAGAT 
AGCGAAAGAT 
AGCGAAAGAT 
AGCGAAAGAT 



GAGGCGACTA 
GAGGCGACTA 
GAGGCGACTA 
GAGGCGACTA 
GAGGCGACTA 
GAGGCGACTA 
GAGGCGACTA 
GAGGCGACTA 
GAGGCGACTA 
GAGGCGACTA 
GAGGCGACTA 



AACCGACTAG 
AACCGACTAG 
AACCGACTAG 
AACCGACTAG 
AACCGACTAG 
AACCGACTAG 
AACCGACTAG 
AACCGACTAG 
AACCGACTAG 
AACCGACTAG 
AACCGACTAG 



TTATCCCAAC 
TTATCCCAAC 
TTATCCCAAC 
TTATCCCAAC 
TTATCCCAAC 
TTATCCCAAC 
TTATCCCAAC 
TTATCCCAAC 
TTATCCCAAC 
TTATCCCAAC 
TTATCCCAAC 



1450 
TTACCTAAAA 
TTACCTAAAA 
TTACCTAAAA 
TTACCTAAAA 
TTACCTAAAA 
TTACCTAAAA 
TTACCTAAAA 
TTACCTAAAA 
TTACCTAAAA 
TTACCTAAAA 
TTACCTAAAA 



1451 

CAGGTACCTA 
CAGGTACCTA 
CAGGTACCTA 
CAGGTACCTA 
CAGGTACCTA 
CAGGTACCTA 
CAGGTACCTA 
CAGGTACCTA 
CAGGTACCTA 
CAGGTACCTA 
CAGGTACCTA 



TACATTTACT 
TACATTTACT 
TACATTTACT 
TACATTTACT 
TACATTTACT 
TACATTTACT 
TACATTTACT 
TACATTTACT 
TACATTTACT 
TACATTTACT 
TACATTTACT 



AAAACTGTAG 
AAAACTGTAG 
AAAACTGTAG 
AAAACTGTAG 
AAAACTGTAG 
AAAACTGTAG 
AAAACTGTAG 
AAAACTGTAG 
AAAACTGTAG 
AAAACTGTAG 
AAAACTGTAG 



ATGTGAAaAG 
ATGTGAAaAG 
ATGTGAAaAG 
ATGTGAAaAG 
ATGTGAAaAG- 
ATGTGAAaAG 
ATGTGAAgAG 
ATGTGAAAAG 
ATGTGAAgAG 
ATGTGAAgAG 
ATGTGAAgAG 



1500 
TCAACCTAAA 
TCAACCTAAA 
TCAACCTAAA 
TCAACCTAAA 
TCAACCTAAA 
TCAACCTAAA 
TCAACCTAAA 
TCAACCTAAA 
TCAACCTAAA 
TCAACCTAAA 
TCAACCTAAA 



msa255059 , 2 f 91_M732 
msa255059.2(91 M781 
msa2 550 59 . 2 { 91_COHl 
msa255059 . 2 { 91_18RS21 
msa255059 . 2 {91_2603 
msa255059.2{91 1169NT 
msa255059 . 2l91_090 
msa2 55059 . 2 { 91_A909 
rasa25S059.2{91_CJB110 
msa255059 . 2 { 91_H36B 
msa25S059 . 2 { 91_JM913 0013 
Consensus 



1501 

GTATCAAGTC 
GTATCAAGTC 
GTATCAAGTC 
GTATCAAGTC 
GTATCAAGTC 
GTATCAAGTC 
GTATCAAGTC 
GTATCAAGTC 
GTATCAAGTC 
GTATCAAGTC 
GTATCAAGTC 



CAGTGGAATT 
CAGTGGAATT 
CAGTGGAATT 
CAGTGGAATT 
CAGTGGAATT 
CAGTGGAATT 
CAGTGGAATT 
CAGTGGAATT 
CAGTGGAATT 
CAGTGGAATT 
CAGTGGAATT 



TAATTTTCAA 
TAATTTTCAA 
TAATTTTCAA 
TAATTTTCAA 
TAATTTTCAA 
TAATTTTCAA 
TAATTTTCAA 
TAATTTTCAA 
TAATTTTCAA 
TAATTTTCAA 
TAATTTTCAA 



AAGGGTGAAA 
AAGGGTGAAA 
AAGGGTGAAA 
AAGGGTGAAA 
AAGGGTGAAA 
AAGGGTGAAA 
AAGGGTGAAA 
AAGGGTGAAA 
AAGGGTGAAA 
AAGGGTGAAA 
AAGGGTGAAA 



1550 
AAATACATTA 
AAATACATTA 
AAATACATTA 
AAATACATTA 
AAATACATTA 
AAATACATTA 
AAATACATTA 
AAATACATTA 
AAATACATTA 
AAATACATTA 
AAATACATTA 



msa2S5059 . 2 { 91 J1732 } 



1551 1600 
TGATCAAGTG TTAGTAGTAG ATGGTCATCA GTGGATTTCA TACAAGAGTT 
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msa255059.2(91_M781 
msa255059 - 2 { 91_COHl 
msa255059.2{91_18RS21 
msa255059.2{91_2603 
msa255059.2{91 1169NT 
msa255059 . 2X91_090 
msa255059 . 2 {91_A909 
msa2S5059 . 2 { 91_CJB110 
msa255059.2{91 H36B 
msa255059 . 2 { 91_0M9130013 
Consensus 



TGATCAAGTG 
TGATCAAGTG 
TGATCAAGTG 
TGATCAAGTG 
TGATCAAGTG 
TGATCAAGTG 
TGATCAAGTG 
TGATCAAGTG 
TGATCAAGTG 
TGATCAAGTG 
********** 



TTAGTAGTAG 
TTAGTAGTAG 
TTAGTAGTAG 
TTAGTAGTAG 
TTAGTAGTAG 
TTAGTAGTAG 
TTAGTAGTAG 
TTAGTAGTAG 
TTAGTAGTAG 
TTAGTAGTAG 
********** 



ATGGTCATCA 
ATGGTCATCA 
ATGGTCATCA 
ATGGTCATCA 
ATGGTCATCA 
ATGGTCATCA 
ATGGTCATCA 
ATGGTCATCA 
ATGGTCATCA 
ATGGTCATCA 
********** 



GTGGATTTCA 
GTGGATTTCA 
GTGGATTTCA 
GTGGATTTCA 
GTGG ATTT CA 
GTGGATTTCA 
GTGGATTTCA 
GTGGATTTCA 
GTGGATTTCA 
GTGGATTTCA 
********** 



TACAAGAGTT 
TACAAGAGTT 
TACAAGAGTT 
TACAAGAGTT 
TACAAGAGTT 
TACAAGAGTT 
TACAAGAGTT 
TACAAGAGTT 
TACAAGAGTT 
TACAAGAGTT 
********** 



msa255059 . 2 f 91_M732 
msa255059.2(91_M781 1 
maa255059 . 2 { 91_COHX ' 
msa255059 - 2 { 91_18RS21 
msa25S059 . 2 { 91__2603 
msa25S059.2{91 1169NT 
msa255059.2T91_090 
tnsa2S5059 . 2 { 91_A909 
msa255059.2{91_CJB110 
msa255059 . 2 { 91_H36B 
msa255059.2{91_OM9130013 
Consensus 



1601 

ATTCCGGTAT 
ATTCCGGTAT 
ATTCCGGTAT 
ATTCCGGTAT 
ATTCCGGTAT 
ATTCCGGTAT 
ATTCCGGTAT 
ATTCCGGTAT 
ATTCCGGTAT 
ATTCCGGTAT 
ATTCCGGTAT 



TCGTCGCTAT 
TCGTCGCTAT 
TCGTCGCTAT 
TCGTCGCTAT 
TCGTCGCTAT 
TCGTCGCTAT 
TCGTCGCTAT 
TCGTCGCTAT 
TCGTCGCTAT 
TCGTCGCTAT 
TCGTCGCTAT 



1629 
ATTGAAATT 
ATTGAAATT 
ATTGAAATT 
ATTGAAATT 
ATTGAAATT 
ATTGAAATT 
ATTGAAATT 
ATTGAAATT 
ATTGAAATT 
ATTGAAATT 
ATTGAAATT 



SEQ ID NO. 8912 

STRAIN 2603 frame: 1 

MKKGQVNDT KQS YS LRKYKFGLAS VI IX3SP IMVTSPVFADQTTSVOVNNQTGTSVDANKS 
SNETSASSVITSNNDSVQASDKVVNSQNTATKDITTPLVETKPMVEKTLPE 
TBVKNTPSKSAPVAPYAKKGDKVFYDQVFNKDNVK^ SYXSFCGVRRYAAIESLDPSGGS 
ETKAPTPVTNSGSNNQBKI ATOGNYTPSHKVBVKNBAKVASPTQPTIJDKGDRI FYDQI LT 
I EGNQWLSYKSFNGVRRFVLLGKAS SVEKTEDKEKVS PQPQARI TKTGRLT I SNETTTGF 
DI LI TNI KDDNG IAAVKVPVWTEQGGQDD I KWYTAVTTGDGNYKVAVSFADHKNEKGLYN 
I HLYYQEASGTLVGVTGTKVTVAGTNS SQE P I ENGLAKTGVYN I IGSTEVKNEAKISSQT 
QFTLEKGDKINYDQVLTADGYQWISY^ 

LPKTGTYTFTKTVDVKSQPKVSSPVEFNPQKGBKIHYIXJVLVV^ 
IBI 

SEQ ZD NO. 8913 
STRAIN 090 frame: 1 
KKGQVNDTKQSYSLRKYKFGLASVILGS 

NETSAS S VI TSNNDS VQAS DKVVNS QNTATKD I TTPLVETK^MVEKTLPEQGNYVYS KET 
EVKNTPSKSAPVAFYAKKGDK^PYDQVFNKDNVKWI S YKSFCGVRRYAAI ESLDPSGGSE 
TKAPTPVTHSGSNNQEKIATQGNYTFSHKVEVKNEAKVAS PTQFTLDKGD R I FYDQI LT I 
EGNQWLS YKS FNGVRRFVLLGKAS SVEKTEDKEKVS PQPQARI T KTGRLT I SNETTTGFD 
I LITNI KDDNG IAAVKVPVWTEQGGQDD I KWYTAVTTGDGNYKVAVS FADHKNBKGLYNI 
HLYYQEASGTLVGVTGTKVTVAGTNSSQEP IENGIAKTGVYNI I GSTEVKNEAKI SSQTQ 
FTLEKGDKINYDQVLTADGYQWISYKSYSGVRRYIPVKKLTTSSEKAKDE^ 
PIOGTYTFTKTVDVKSQPKVSS PVEFNFQKGEKZ HYDQVLVVDGHQW I SYKSYSG I RRY I 
EI 

SEQ XD NO. 8914 

STRAIN A909 frame: 1 

KKGQVNDTKQSYSLRKYKFGLASVI LGS FI WITTS PVPADQTTSVQVNNQTGTSVDANNS S 
NETS AS S VI TSNND S VQASDKWNSQNTATKD ITTPLVETKPMVEKTLPEQGNYVYS KET 
EVKOTPSKSAPVAFYAiOCGDKVFYDQVFNKDNVKMISYKS 

TKAPTPVTNSGSNNQEKIATQGNYTFSHKVEVKNEAKVAS PTQFTLDKGDRI FYDQI LTI 
EGNQWLS YKS FNGVRRFVLLGKASSVEKTEDKE 

I LITN I KDDNG IAAVKVPVWTEQGGQDD I KWYTAVTTGDGNYKVAVS FADHKNE KGLYNI 
HLYYQEASGTLVGVTGTKVTVAGTNS S QE P I ENGLAKTGVYN 1 1 GSTEVKNEAKI SSQTQ 
FTLEKGD KI NYD QVLTADG YQW I SYKS YSGVRRY I PVKKLTTSSEKAKDEATKPTSYPNL 
PKTGTYTFTKTVDVKSQPKVSSPVEFNI^KGEKIHYDQVLVVDGHQWIS 
EI 

SEQ ZD NO. 8915 
. STRAIN H36B frame: 1 

KKGQVNDTKQSYSLRKYKFGIASVILGSFIMV^ 

NETSAS SVITSNNDSVQAS DKWNS QNTATKD I TTPLVETKPMVEKTLPEQGNYVYSKET 
BWNTPSKSAPVAFYAKKJGDKVFYT^VFWraNVKWI SYKS FOG VRRYAAI ESLDPSGGSE 
TKAPTPVTNSGSNNQBKXATQGNYTFSHKVEVKNEAKVASPT^ 
EGNQWLS YKS FNGVRRFVLLGKAS SVEKTEDKBKV^ 

I LITNI KDDNG IAAVKVPVWTEQGGQDDI KWYTAVTTGDGNYKVAVS FADHKNEKGLYN I 
HLYYQEASGTLVGVTGTKVTVAGTNSSQEPIENGLAKTGV^ I GSTEVKNEAKI SSQTQ 
FTLEKGDKI NYDQVLTADGYQW I SYKSYSGVRRY I PVKKLTTS S E KAKDEATKPTSYPNL 
PKTGTYTFTKTVDVKSQPKVS S PVE FNFQKGEKI HYDQVL WDGHQW I SYKSYSG I RRY I 
EI 

SEQ ZD NO. 8916 
STRAIN 18RS21 frame: 1 

KKGQVNDTKQSYSLRKYKFGLASVI LGS F I MVTS PVYADOTTSVQVNNGTGTSVDANNSS 
NETSAS SVI TSNNDS VQAS DKVVNSQNTATKD I TTPLVETKPMVEKTLPEQGNYVYSKET 
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jBVKNTPSKSAPVAPYAKKOTKVFTfDQVFNKDNVKWI SYKSFCGVRRYAAI ESLDPSGGSE 
TKAPTPVTNSGSNNQEKXATQGNYTFSHKVEVKNEAKVASOT FYDQILTI 
ECWQWLSYKSFNGVRilFVLIXSKASSVEKTEDKEKVSPQPQARITK^ 
IlilTNI KDDNGI AAVKVPVWTEQGGQDDI KWYTAVTTGDGNYKVAVS FADHKNEKGLYN I 
HIiYYQEASGTLVGVTGTKVTVAGTNSSQEPI ENGLAKTGVYNI I GSTBVKNEAKI SSQTQ 
FTLEKGDKI NYDQVLTADGYQW I SYKSYSGVRRY I PVKKLTTSSEKAKDEATKPTSYPNL 
PKIGTYTFTKrVDVKSQPKVSSPVEFNFQKGEKI HYDQVLWDGHQWI S Y KS YSG I RRY I 
BZ 

SEQ ID NO. 8917 
STRAIN M732 frame: 1 

QVNDTKQSYStiRKYKFGLASVI LGS F I MVT S P VF ADQTTS VQ VNNQTGT S VDANNS SNET 
SASSVITSNNDSVQASDKVVNSQOTATKDITTPL^ 

NTPSKSAPVAFTAKKGDKVFYDQVFNKDNVKWI S YKSFGG VRRYAAI ESLDPSGGSETKA 
PTPVTNSGSNNQEKI ATQGNYTFSHKVEVKNEAKVAS PTQFTLD KGDRI FYDQI LT I EGN 
QWLSYKS FNGVRRFVLLGKAS SVEKTEDKEKVS PQPQARI TKTGRLT I SNETTTG FDILI 
TNI KDDNGI AAVKVPVWTEQGGQDD I KWYTAVTTGDGNYKVAVS FADHKNEKGL YN I HL Y 
YQEASGTLVGVTGTKVTVAGTNS SQEPI ENGliPKTGVYNI IGSTEVKNEAKI SSQTQFTL 
EKGDKI NYDQVLTADGYQWI SYKSYSGVRRYI PVKKLTTSSEKAKDEATKPTSYPNLPKT 
GTYTFTKTVDVKSQPKVSSPVEFNFQKGEKIHY^3VIiVVIX3HQWI SYKSYSG I RRYI EI 

SEQ ID HO. 8918 
STRAIN COH! frame: 1 

KKGQVNDTKQSYSLRKYKFGLASVI LGS F I MVTS PWADQTT SVQVNNQTGTS VDANNS S 
NETSASSVI TSNNDSVQASDKWN S QNTATKD ITTPLVETKPMVE KTLPEQGNYVYS KET 
EVKNTPSKSAPVAFYAKRGDKVFYDQVFNKDNVKW^ S YKSFGGVRRYAAI ESLDPSGGSE 
TKAPTPVTNSGSNNQBKIATQGNYTFSHXtnSVKNEM FYDQILTI 
EGNQWLSYKSFNGVRRFVLLGKASS VEKTEDKEKVSPQPQARITKTGRLT I SNETTTGFD 
I LITN I KDDNG I AAVKVPVWTEQGGQDD I KWYTAVTTGDGNYKVAVSFADHKNEKGLYNI 
HLYYQEASGTLVGVTGTKVTVAGTNS SQEPI ENGLPKTGVYN 1 1 GSTEVKNBAKI S SQTQ 
FTLEKGDKINYDQ^TADGYQWISYKSYSGVRRYIPVKKLTTSSEKAKDEATKP^ 
PKTGTYTFTKTVDVKSQPKVSSPVEFNFQKGEKIHYDQVLVVTC 
EI 

SEQ ZD NO* 8919 
STRAIN M781 frame: 1 

KKGQVNDTKQSYSLRKYKFGLASV I LGSFI MVTS P VFADQTT SVQ VNNQTGTSVDANNS S 

NETSASSVITSNNDSVQASDKVVNSQNTATKDITTPLVETKPMVEKTLP 

EVKNTPSKSAPVAFYAKKGDKVFYDQVFNKDNVKWISYKSFG^ 

TKAPTPVTNSGSNNQEKIATQGNYTFSHKVEVKNEAKVASPTQFTI^ FYDQI LTI 

EGNQWLS YKSFNGVRRFVLLGKAS S VE KTEDKEKVS PQPQAR ITKTGRLT I SNETTTGFD 
I L ITN I KDDNG I AAVKVPVWTEQGGQDD I KWYTAVTTGDGNYKVAVS FADHKNEKGL YN I 
HLYYQEASGTLVGVTGTKVTVAGTN S SQE P I ENGLPKTGVYN 1 1 GSTBVKNEAKI SSQTQ 
FTLEKGDKINYDQVLTADGYQW I SYKSYSGVRRY I PVKKLTTS SEKAKDEATKPTS YPNL 
PKTGTYTFTKTVDVKSQPKVSSPVEFNFQKGEKIHYT^VL 
EI 

SEQ ZD NO. 8920 
STRAIN CJB1 10 frame: 1 

KKGQVNDTKQSYSLRKYKFGLASVI LGSFIMVTSPVFADQTTSVQVNNQTGTSVDANNSS 
NETSASSVITSNNDSVO^DKVVNSQNTATKDITTPL 

EVKNTPSKSAPVAFYAKKGDKVFYDQVFNKDNVKWI SYKSFCGVRRYAAI ESLDPSGGSE 
TKAPTPVTNSGSNNQEKIATQGNYTFSHKVEVKNEAKVASP FYDQILTI 
EGNQWL»SYKSFNGVRRFVLIjGKASSVEKTEDKEKVSPQPQA 

ILITNI KDDNG I AAVKVPVWTEQGGQDD I KWYTAVTTGDGNYKVAVS FADHKNEKGL YN I 
HLYYQEASGTLVGVTGTKVTVAGTNS SQE P I ENGLAKTGVYNI IGSTEVKNEAKI SSQTQ 
FTLEKGDKINYDQVLTADGYQW I SYKSYSGVRRYI PVKKLTTSSEKAKDEATKPTSYPNL 
PKTGTYTFTKTVDVKSQPKVSSFVEFNFQKGEKIHYDQ 
EI 



SEQ ZD NO. 8921 
STRAIN 11 69NT frame: 1 

KKGQVNDTKQSYSLRKYKFGLASVI LGS FI MVTS PVFADQTTSVQVNNQTGTSVDANNS S 
NETSASSVITSNNDSVQASDKVVNSO^JTATKDITTPLVETKPMVEKT^ 
EVKNTPSKSAPVAFYAKKGDKVFYDQVFNKDNVKW I S YKS FGGVRRYAAI ESLDPSGGSE 
TKAPTPVTNSGSNNQBKIATQGNYTFSHKVBVK^ FYDQILTI 
EGNQWLSYKSFNGVRRFVLLGKASSVEKTEDKEKVSPQPQARITKTGR^ I SNETTTGFD 
I L ITN I KDDNG IAAVKVFVWTEQGGQDD I KWYTAVTTGDGNYKVAVS FADHKNEKGLYN I 
HLYYQEASGTLVGVTGTKVTVAGTNSSQEP I ENGLAKTGVYNI IGSTEVKNEAKI SSQTQ 
FTLEKGD KI NYDQVLTADGYQW I SYKSYSGVRRYI PVKKLTTS SEKAKDEATKPTSYPNL 
PKTGTYTFTKTVDVKSQPKVSS PVEFNFQKGEKI HYDQVLWDGHQW I SYKSYSG I RRY I 
EI 

SEQ ID NO. 8922 
STRAIN JM9 1300 13 frame: I 

KKGQVNDTKQSYSLRKYKFGLASVI I/3SF IMVTSPVFADQTTSVQVNNQ/TGT SVDANNSS 
NETSASSVITSNNDSVO^ISDKVVNSQNTATKDITTPL 

EVKNTPS KSAPVAFYAKKGDKVFYDQVFNKDNVKWI SYKS FCGVRRYAA I ES LD PSGG SE 
TKAPTPVTNSGSNNQEKIATQGNYTFSHKVEVKNEAKVAS FYDQILTI 
EGNQWLSYKS FNGVRRFVLLGKAS SVEKTEDKEKVS PQPQARI TKTGRLT I YNETTTGFD 
I LI TN I KDDNGIAAVKVPVWTEQGGQDD I KWYTAVTTGDGNYKVAVS FADHKNEKGLYN I 
HLYYQEASGTLVGVTGTKVTVAGTNSSQEP IBNGLAKTGVYN I IGSTEVKNEAKI SSQTQ 
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FTLEKGDKINYDQVLTADGYQWI SYKS YSGVRRYI PVKKLTTSSEKAKDEATKPTSYPNL 
PKTGTYTFT KTVDVKS QPKVSS PVE FNFQKGE KI HYDQVL WDGHQW I SYKS YSG I RRY I 
EI 

PRETTY of: /biotmp/msa255178 . 2 { *} February 11, 2003 08:51 



msa255178 . 2 { 91_090 
msa255178.2{91_18RS2l' 
msa2S5178.2{91_2603' 
msa255178.2{91 A909* 
msa2S5178.2{91 CJBIIO 
msa2 5517 8 . 2 { 91_H3 6B 
msa255178 . 2 { 91_JM9130013 
msa255178 . 2 { 91_COHl 
msa255178 .2{91_M781 
msa255178 . 2 { 91_M732 
msa255178 . 2 { 91_1169NT 
Consensus 



-kkgQVNDTK 
-kkgQVNDTK 
mkkgQVNDTK 
-kkgQVNDTK 
-kkgQVNDTK 
-kkgQVNDTK 
-kkgQVNDTK 
-kkgQVNDTK 
-kkgQVNDTK 

QVNDTK 

-kkgQVNDTK 



* « 



QSYSLRKYKP 
QSYSLRKYKF 
QSYSLRKYKP 
QSYSLRKYKF 
QSYSLRKYKF 
QSYSLRKYKF 
QSYSLRKYKF 
QSYSLRKYKF 
QSYSLRKYKF 
QSYSLRKYKF 
QSYSLRKYKF 



GLASVILGSF 
GLASVILGSF 
GLASVILGSF 
GLASVILGSF 
GLASVILGSF 
GLASVILGSF 
GLASVILGSF 
GLASVILGSF 
GLASVILGSF 
GLASVILGSF 
GLASVILGSF 



IMVTSPVFAD 
IMVTSPVFAD 
IMVTSPVFAD 
IMVTSPVFAD 
IMVTSPVFAD 
IMVTSPVFAD 
IMVTSPVFAD 
IMVTSPVFAD 
IMVTSPVFAD 
IMVTSPVFAD 
IMVTSPVFAD 



50 

QTTSVQVNNQ 
QTTSVQVNNQ 
QTTSVQVNNQ 
QTTSVQVNNQ 
QTTSVQVNNQ 
QTTSVQVNNQ 
QTTSVQVNNQ 
QTTSVQVNNQ 
QTTSVQVNNQ 
QTTSVQVNNQ 
QTTSVQVNNQ 



. msa255178 - 2 { 91_090 
msa255178 . 2 { 91_18RS21 
msa2 55178 .2{91_2603 
msa255178.2(91 A909 
msa255178.2{91_CJB110 
msa255178.2{91_H36B 
msa255178.2{91_JM9130013 
msa2 55178 . 2 { 91JCOH1 
msa255178 . 2 { 91_M781 
msa255178 . 2 { 91_M732 
msa255178 . 2 { 91JL169NT 
Consensus 



51 

TGTSVDaNNS 
TGTSVDaNNS 
TGTSVDaNNS 
TGTSVDaNNS 
TGTSVDaNNS 
TGTSVDdNNS 
TGTSVDaNNS 
TGTSVDaNNS 
TGTSVDaNNS 
TGTSVDaNNS 
TGTSVDaNNS 



SNETSASSVI 
SNETSASSVI 
SNETSASSVI 
SNETSASSVI 
SNETSASSVI 
SNETSASSVI 
SNETSASSVI 
SNETSASSVI 
SNETSASSVI 
SNETSASSVI 
SNETSASSVI 



TSNNDSVQAS 
TSNNDSVQAS 
TSNNDSVQAS 
TSNNDSVQAS 
TSNNDSVQAS 
TSNNDSVQAS 
TSNNDSVQAS 
TSNNDSVQAS 
TSNNDSVQAS 
TSNNDSVQAS 
TSNNDSVQAS 



DKWNSQNTA 
DKWNSQNTA 
DKWNSQNTA 
DKWNSQNTA 
DKWNSQNTA 
DKWNSQNTA 
DKWNSQNTA 
DKWNSQNTA 
DKWNSQNTA 
DKWNSQNTA 
DKWNSQNTA 



100 

TKDITTPLVE 
TKDITTPLVE 
TKDITTPLVE 
TKDITTPLVE 
TKDITTPLVE 
TKDITTPLVE 
TKDITTPLVE 
TKDITTPLVE 
TKDITTPLVE 
TKDITTPLVE 
TKDITTPLVE 



msa255178.2{91_090 1 
msa255178 . 2 { 91_18RS21 ' 
msa255178 . 2 { 91_2603 ' 
msa255178 . 2 { 91_A909' 
msa2 55178 . 2 { 91_CJB110 ' 
msa255178 . 2{ 91_H36B 
msa255178 . 2 { 91_JM9130013 
rasa255178 .2{91_COHl 
msa255178 .2<91_M781 
msa255178.2{91 M732 
msa255178 . 2 { 91_1169NT 
Consensus 



101 

TKPMVEKTLP 
TKPMVEKTLP 
TKPMVEKTLP 
TKPMVEKTLP 
TKPMVEKTLP 
TKPMVEKTLP 
TKPMVEKTLP 
TKPMVEKTLP 
TKPMVEKTLP 
TKPMVEKTLP 
TKPMVEKTLP 



EQGNYVYSKE 
EQGNYVYSKE 
EQGNYVYSKE 
EQGNYVYSKE 
EQGNYVYSKE 
EQGNYVYSKE 
EQGNYVYSKE 
EQGNYVYSKE 
EQGNYVYSKE 
EQGNYVYSKE 
EQGNYVYSKE 



TEVKNTPSKS 
TEVKNTPSKS 
TEVKNTPSKS 
TEVKNTPSKS 
TEVKNTPSKS 
TEVKNTPSKS 
TEVKNTPSKS 
TEVKNTPSKS 
TEVKNTPSKS 
TEVKNTPSKS 
TEVKNTPSKS 



APVAFYAKKG 
APVAFYAKKG 
APVAFYAKKG 
APVAFYAKKG 
APVAFYAKKG 
APVAFYAKKG 
APVAFYAKKG 
APVAFYAKKG 
APVAFYAKKG 
APVAFYAKKG 
APVAFYAKKG 



150 

DKVFYDQVFN 
DKVFYDQVFN 
DKVFYDQVFN 
DKVFYDQVFN 
DKVFYDQVFN 
DKVFYDQVFN 
DKVFYDQVFN 
DKVFYDQVFN 
DKVFYDQVFN 
DKVFYDQVFN 
DKVFYDQVFN 



msa25S178 . 2 { 91_090 
msa255178.2{91 18RS21 
msa255178.2(?l_2603 
msa255178 . 2 { 91_A909 
msa255178.2{91 CJBIIO' 
msa255178 . 2 {91_H36b' 
msa255178.2{91 JM9130013' 
msa25517 872 [ 91_COHl 
msa2 55178 . 2 { 91J4781 
msa25S178 . 2 { 91_M732 
rasa255178 .2{91_1169NT 
Consensus 



151 

KDNVKWISYK 
KDNVKWISYK 
KDNVKWISYK 
KDNVKWISYK 
KDNVKWISYK 
KDNVKWISYK 
KDNVKWISYK 
KDNVKWISYK 
KDNVKWISYK 
KDNVKWISYK 
KDNVKWISYK 



SFcGVRRYAA 
SFcGVRRYAA 
SFcGVRRYAA 
SFcGVRRYAA 
SFcGVRRYAA 
SFcGVRRYAA. 
SFcGVRRYAA 
SFgGVRRYAA 
SFgGVRRYAA 
SFgGVRRYAA 
SFgGVRRYAA 



IESLDPSGGS 
IESLDPSGGS 
IESLDPSGGS 
IESLDPSGGS 



IESLDPSGGS 
IESLDPSGGS 
IESLDPSGGS 
IESLDPSGGS 
IESLDPSGGS 



ETKAPTPVTN 
ETKAPTPVTN 
ETKAPTPVTN 
ETKAPTPVTN 
ETKAPTPVTN 
ETKAPTPVTN 
ETKAPTPVTN 
ETKAPTPVTN 
ETKAPTPVTN 
ETKAPTPVTN 
ETKAPTPVTN 



200 

SGSNNQEKIA 
SGSNNQEKIA 
SGSNNQEKIA 



SGSNNQEKIA 
SGSNNQEKIA 
SGSNNQEKIA 
SGSNNQEKIA 
SGSNNQEKIA 



msa2 55178 . 2 { 91J390 
msa2S5178 . 2 { 91_18RS21 
msa2 5 5 17 8 . 2 { 91_2 6 03 ' 
msa255178.2{91 A909 
msa255178.2{91 CJBIIO 
msa255178 .2{?1_H36B 
msa255178 . 2 { 91_JM9130013 
msa255178.2{91 COH1 
msa255178.2{9l""M781 
msa255178 - 2 { 91~M732 
msa2 5S178 . 2 { 91__1169NT 
Consensus 



201 

TQGNYTFSHK 
TQGNYTFSHK 
TQGNYTFSHK 
TQGNYTFSHK 
TQGNYTFSHK 
TQGNYTFSHK 
TQGNYTFSHK 
TQGNYTFSHK 
TQGNYTFSHK 
TQGNYTFSHK 
TQGNYTFSHK 



VEVKNEAKVA 
VEVKNEAKVA 
VEVKNEAKVA 
VEVKNEAKVA 
VEVKNEAKVA 
VEVKNEAKVA 
VEVKNEAKVA 
VEVKNEAKVA 
VEVKNEAKVA 
VEVKNEAKVA 
VEVKNEAKVA 



SPTQFTLDKG 
SPTQFTLDKG 
SPTQFTLDKG 
SPTQFTLDKG 
SPTQFTLDKG 
SPTQFTLDKG 
SPTQFTLDKG 
SPTQFTLDKG 
SPTQFTLDKG 
SPTQFTLDKG 
SPTQFTLDKG 



DRIFYDQILT 
DRIFYDQILT 
DRIFYDQILT 
DRIFYDQILT 
DRIFYDQILT 
DRIFYDQILT 
DRIFYDQILT 
DRIFYDQILT 
DRIFYDQILT 
DRIFYDQILT 
DRIFYDQILT 



250 

IEGNQWLSYK 
IEGNQWLSYK 
IEGNQWLSYK 
IEGNQWLSYK 
IEGNQWLSYK 
IEGNQWLSYK 
IEGNQWLSYK 
IEGNQWLSYK 
IEGNQWLSYK 
IEGNQWLSYK 
IEGNQWLSYK 



msa2S5178.2{91_090 
msa255178.2{91 18RS21 
msa25S178 . 2 f 91_2603 
tnsa255178 . 2 { 91_A909 
msa255178 . 2 { 91JCJB110 



251 300 
SFNGVRRFVL LGKASSVEKT EDKBKVSPQP QARITKTGRL TIsNETTTGF 
SFNGVRRFVL LGKASSVEKT EDKBKVSPQP QARITKTGRL TIsNETTTGF 
SFNGVRRFVL LGKASSVEKT EDKBKVSPQP QARITKTGRL TIsNETTTGF 
SFNGVRRFVL LGKASSVEKT EDKBKVSPQP QARITKTGRL TIsNETTTGF 
SFNGVRRFVL LGKASSVEKT EDKBKVSPQP QARITKTGRL TIsNETTTGF 
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WO 2004/018646 



PCT/US2003/026827 



Table 89: Comparative Sequences relating to SAG1350 



msa255178 . 2 { 91_H36B| 
msa255178.2{91_JM9130013 
maa2 55178 .2{91_COHl 
msa25517B.2(91_M781 
msa255178 . 2 { 91_M732 
msa255178 .2 (91_1169NT 
Consensus 



SFNGVRRFVL LGKASSVEKT EDKEKVSPQP QARITKTGRL TIsNETTTGP 
SFNGVRRFVL LGKASSVEKT EDKEKVSPQP QARITKTGRL TlyNBTTTGF 
SFNGVRRFVL LGKASSVEKT EDKEKVSPQP QARITKTGRL TIsNETTTGF 
SFNGVRRFVL LGKASSVEKT EDKEKVSPQP QARITKTGRL TIsNETTTGF 
SFNGVRRFVL LGKASSVEKT EDKEKVSPQP QARITKTGRL TIsNETTTGF 
SFNGVRRFVL LGKASSVEKT EDKEKVSPQP QARITKTGRL TIsNETTTGF 



msa255178.2{91 090; 
msa255178 ,2{91_1BRS21 
msa255178 .2(91 2603* 
msa255178 . 2 { 91 J1909 
msa255178.2{91 CJB110 
msa255178.2{91 H3 6B 
msa255178.2{91_JM9130013 
msa2 55178 .2{91_C0H1 
msa255178.2{91_M7Bl 
msa255178.2{91_M732 
msa255178 . 2 { 91_1169NT ) 
Consensus 



301 

DILITNIKDD 
DILI TNI KDD 
DILITNIKDD 
DILITNIKDD 
DILITNIKDD 
DILITNIKDD 
DILITNIKDD 
DILITNIKDD 
DILITNIKDD 
DILITNIKDD 
DILITNIKDD 



NGIAAVKVPV 
NGIAAVKVPV 
NGIAAVKVPV 
NGIAAVKVPV 
NGIAAVKVPV 
NGIAAVKVPV 
NGIAAVKVPV 
NGIAAVKVPV 
NGIAAVKVPV 
NGIAAVKVPV 
NGIAAVKVPV 



WTEQGGQDDI 
WTEQGGQDDI 
WTEQGGQDDI 
WTBQGGQDDI 
WTEQGGQDDI 
WTEQGGQDDI 
WTEQGGQDDI 
WTEQGGQDDI 
WTEQGGQDDI 
WTEQGGQDDI 
WTEQGGQDDI 



KWYTAVTTGD 
KWYTAVTTGD 
KWYTAVTTGD 
KWYTAVTTGD 
KWYTAVTTGD 
KWYTAVTTGD 
KWYTAVTTGD 
KWYTAVTTGD 
KWYTAVTTGD 
KWYTAVTTGD 
KWYTAVTTGD 



350 

GNYKVAVSFA 
GNYKVAVSFA 
GNYKVAVSFA 
GNYKVAVSFA 
GNYKVAVSFA 
GNYKVAVSFA 
GNYKVAVSFA 
GNYKVAVSFA 
GNYKVAVSFA 
GNYKVAVSFA 
GNYKVAVSFA 



msa25S178.2{91 090 ] 
msa2 55178 . 2 { 91_18RS21 
msa255178 . 2 { 91_2603 ( 
TRsa255178.2(91 A909 
msa255178 . 2 { 91_CJB110 
msa255178 . 2 { 91_H36B 
msa255178 . 2 {91_JM9130013 
msa255178 . 2 { 91_COHl 
TOsa255178.2(91_M781 
msa25S178.2{91_M732 
msa255178 . 2 { 91_1169NT 
Consensus 



msa255178.2{91 090 
msa255 178 . 2 { 91_18RS21 
rasa255178.2{91 2603 
insa255178.2{91~A909 
msa255178 . 2 { 91_CJB110 
msa255178 . 2{ 91_H36B 
msa25S178 ,2{91_JM9130013 
msa255178.2(91_COHl 
msa255178 . 2( 91_M781 
msa255178.2{91_M732 
msa255178 . 2 { 91_1169NT 
Consensus 



351 

DHKNEKGLYN 
DHKNEKGLYN 
DHKNEKGLYN 
DHKNEKGLYN 
DHKNEKGLYN 
DHKNEKGLYN 
DHKNEKGLYN 
DHKNEKGLYN 
DHKNEKGLYN 



DHKNEKGLYN 



IHLYYQEASG 
IHLYYQBASQ 
IHLYYQEASG 
IHLYYQEASG 
IHLYYQEASG 
IHLYYQEASG 
IHLYYQEASG 
IHLYYQEASG 
IHLYYQEASG 
IHLYYQEASG 
IHLYYQEASG 



TLVGVTGTKV 
TLVGVTGTKV 
TLVGVTGTKV 
TLVGVTGTKV 
TLVGVTGTKV 
TLVGVTGTKV 
TLVGVTGTKV 
TLVGVTGTKV 
TLVGVTGTKV 
TLVGVTGTKV 
TLVGVTGTKV 



TVAGTNSSQE 
TVAGTNSSQE 
TVAGTNSSQE 
TVAGTNSSQE 
TVAGTNSSQE 
TVAGTNSSQE 
TVAGTNSSQE 
TVAGTNSSQE 
TVAGTNSSQE 
TVAGTNSSQE 
TVAGTNSSQE 



400 

PIENGLaKTG 
PIENGLaKTG 
PIENGLaKTG 
PIENGLaKTG 
PIENGLaKTG 
PIENGLaKTG 
PIENGLaKTG 
P I ENGLpKTG 
PIENGLpKTG 
PI ENGLpKTG 
PIENGLaKTG 



401 

VYNIIGSTEV 
VYNIIGSTEV 
VYNIIGSTEV 
VYNIIGSTEV 
VYNIIGSTEV 
VYNIIGSTEV 
VYNIIGSTEV 
VYNIIGSTEV 
VYNIIGSTEV 
VYNIIGSTEV 
VYNIIGSTEV 



KNEAKISSQT 
KNEAKISSQT 
KNEAKISSQT 
KNEAKISSQT 
KNEAKISSQT 
KNEAKISSQT 
KNEAKISSQT 
KNEAKISSQT 
KNEAKISSQT 
KNEAKISSQT 
KNEAKISSQT 



QFTLEKGDKI 
QFTLBKGDKI 
QFTLEKGDKI 
QFTLEKGDKI 
QFTLEKGDKI 
QFTLEKGDKI 
QFTLEKGDKI 
QFTLEKGDKI 
QFTLEKGDKI 
QFTLEKGDKI 
QFTLEKGDKI 



NYDQVLTADG 
NYDQVLTADG 
NYDQVLTADG 
NYDQVLTADG 
NYDQVLTADG 
NYDQVLTADG 
NYDQVLTADG 
NYDQVLTADG 
NYDQVLTADG 
NYDQVLTADG 
NYDQVLTADG 



450 

YQWISYKSYS 
YQWISYKSYS 
YQWISYKSYS 
YQWISYKSYS 
YQWISYKSYS 
YQWISYKSYS 
YQWISYKSYS 
YQWISYKSYS 
YQWISYKSYS 
YQWISYKSYS 
YQWISYKSYS 



1 msa255178.2{91_090| 
msa255178 .2{91_1BRS21 
msa255178 . 2 { 91_2603 
ms a2 5517 8 . 2 { 91_A9 09 
nisa255178 . 2 { 91JCJB110 ( 
msa2 55178 . 2{91_H36B 
msa255178 . 2 { 91_JM9130013 ' 
msa2 5 5178 . 2 { 91_OOHl 
msa255178.2(91_M781 
msa255178.2{91 M732 
msa255178 .2{91_1169NT 
Consensus 



451 

GVRRYIPVKK 
GVRRYIPVKK 
GVRRYIPVKK 
GVRRYIPVKK 
GVRRYIPVKK 
GVRRYIPVKK 
GVRRYIPVKK 
GVRRYIPVKK 
GVRRYIPVKK 
GVRRYIPVKK 
GVRRYIPVKK 



LTTSSEKAKD 
LTTSSEKAKD 
LTTSSEKAKD 
LTTSSEKAKD 
LTTSSEKAKD 
LTTSSEKAKD 
LTTSSEKAKD 
LTTSSEKAKD 
LTTSSEKAKD 
LTTSSEKAKD 
LTTSSEKAKD 



EATKPTSYPN 
EATKPTSYPN 
EATKPTSYPN 
EATKPTSYPN 
EATKPTSYPN 
EATKPTSYPN 
EATKPTSYPN 
EATKPTSYPN 
EATKPTSYPN 
EATKPTSYPN 
EATKPTSYPN 



LPKTGTYTFT 
LPKTGTYTFT 
LPKTGTYTFT 
LPKTGTYTFT 
LPKTGTYTFT 
LPKTGTYTFT 
LPKTGTYTFT 
LPKTGTYTFT 
LPKTGTYTFT 
LPKTGTYTFT 
LPKTGTYTFT 



500 

KTVDVKSQPK 
KTVDVKSQPK 
KTVDVKSQPK 
KTVDVKSQPK 
KTVDVKSQPK 
KTVDVKSQPK 
KTVDVKSQPK 
KTVDVKSQPK 
KTVDVKSQPK 
KTVDVKSQPK 
KTVDVKSQPK 



rasa255178. 2 { 91_090 ' 
msa255178»2{91 18RS21 
msa255178 . 2 { 91_2603 
maa255178 .2{91_A909 
msa255178.2{91 CJB110 
msa255178.2{91 H36B 
msa255178 ,2{91_JM9130013 
msa255178.2{91 COH1 
0183255178.2(91^781 
msa255178 . 2 { 91~M732 
maa255178 .2(91_1169NT 
Consensus 



501 

VSSPVEFNFQ 
VSSPVEFNFQ 
VSSPVEFNFQ 
VSSPVEFNFQ 
VSSPVEFNFQ 
VSSPVEFNFQ 
VSSPVEFNFQ 
VSSPVEFNFQ 
VSSPVEFNFQ 
VSSPVEFNFQ 
VSSPVEFNFQ 



KGEKIHYDQV 
KGEKIHYDQV 
KGEKIHYDQV 
KGEKIHYDQV 
KGEKIHYDQV 
KGEKIHYDQV 
KGEKIHYDQV 
KGEKIHYDQV 
KGEKIHYDQV 
KGEKIHYDQV 
KGEKIHYDQV 



LWDGHQWIS 
LWDGHQWIS 
LWDGHQWIS 
LWDGHQWIS 
LWDGHQWIS 
LWDGHQWIS 
LWDGHQWIS 
LWDGHQWIS 
LWDGHQWIS 
LWDGHQWIS 
LWDGHQWIS 



543 

YKSYSGIRRY IBI 
YKSYSGIRRY IBI 
YKSYSGIRRY IEI 
YKSYSGIRRY IEI 
YKSYSGIRRY IEI 
YKSYSGIRRY IEI 
YKSYSGIRRY IEI 
YKSYSGIRRY IEI 
YKSYSGIRRY IEI 
YKSYSGIRRY IBI 
YKSYSGIRRY IEI 
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